MXPA02003819A - Procedimiento de obtencion de acidos nucleicos a partir de una muestra del medio ambiente, acidos nucleicos asi obtenidos y su aplicacion en la sintesis de compuestos. - Google Patents

Procedimiento de obtencion de acidos nucleicos a partir de una muestra del medio ambiente, acidos nucleicos asi obtenidos y su aplicacion en la sintesis de compuestos.

Info

Publication number
MXPA02003819A
MXPA02003819A MXPA02003819A MXPA02003819A MXPA02003819A MX PA02003819 A MXPA02003819 A MX PA02003819A MX PA02003819 A MXPA02003819 A MX PA02003819A MX PA02003819 A MXPA02003819 A MX PA02003819A MX PA02003819 A MXPA02003819 A MX PA02003819A
Authority
MX
Mexico
Prior art keywords
dna
vector
soil
sarasterized
nucleic acids
Prior art date
Application number
MXPA02003819A
Other languages
English (en)
Inventor
Jeannin Pascale
Original Assignee
Aventis Pharma Sa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from FR9915032A external-priority patent/FR2801609B1/fr
Application filed by Aventis Pharma Sa filed Critical Aventis Pharma Sa
Priority claimed from PCT/FR2000/003311 external-priority patent/WO2001040497A2/fr
Publication of MXPA02003819A publication Critical patent/MXPA02003819A/es

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

La presente invencion se relaciona con un procedimiento de preparacion de acidos nucleicos a partir de una muestra del medio ambiente, mas particularmente con un procedimiento de obtencion de una coleccion o biblioteca de acidos nucleicos a partir de una muestra. La invencion tambien es relativa a los acidos . nucleicos o a las colecciones de acidos nucleicos obtenidos de acuerdo con el procedimiento y su aplicacion en la sintesis de compuestos novedosos, especialmente de compuestos novedosos de interes terapeutico. La invencion tiene igualmente por objeto medios novedosos aplicados en el procedimiento de obtencion de acidos nucleicos anteriores, tales como los vectores novedosos y los procedimientos de preparacion novedosos de tales vectores o de incluso de las celulas huesped recombinantes que comprenden un acido nucleico de la invencion. La invencion se relaciona tambien con los procedimientos para detectar un acido nucleico de interes en el seno de una coleccion o biblioteca de acidos nucleicos obtenidos de acuerdo con el procedimiento anterior, asi como los acidos nucleicos detectados por tal procedimiento y los polipeptidos codificados por tales acidos nucleicos.

Description

PROCEDIMIENTO DE OBTENCIÓN DE ÁCIDOS NUCLEICOS A PARTIR DE UNA MUESTRA DEL MEDIO AMBIENTE, CIDOS NUCLEICOS ASI OBTENIDOS Y SU APLICACIÓN EN LA SÍNTESIS DE COMPUESTOS NOVEDOSOS CAMPO DE LA INVENCIÓN La presente invención se relaciona con un procedimiento de preparación de ácidos nucleicos a partir de una muestra del medio ambiente, más .particularmente con un procedimiento de obtención de una colección de ácidos nucleicos a partir de una muestra. La invención también es relativa a los ácidos nucleicos o a las colecciones de ácidos nucleicos obtenidos de acuerdo con el procedimiento y su aplicación en la sintesis de compuestos novedosos, especialmente compuestos novedosos de interés terapéutico.
DESCRIPCIÓN DE LA INVENCIÓN La invención tiene igualmente por objeto los medios novedosos aplicados en el procedimiento de obtención de los ácidos nucleicos anteriores, tales como los vectores novedosos y los procedimientos de preparación novedosos de tales vectores o incluso de las células huésped recombinantes que comprenden un ácido nucleico de la invención.
REF: 137151 ** *** **Mfm- .f% \^M?¡ñ^^U_ ?Ajn v^ y_? La invención se relaciona incluso con los procedimientos para detectar un ácido nucleico de interés en el seno de una colección de ácidos nucleicos obtenidos de acuerdo con el procedimiento anterior, así como los ácidos nucleicos detectados por tal procedimiento y los polipéptidos codificados por tales ácidos nucleicos. La invención igualmente trata de los ácidos nucleicos obtenidos y detectados de acuerdo con los procedimientos anteriores, en particular los ácidos nucleicos que codifican para una enzima que participa en la vía de biosíntesis de antibióticos tales como las ß-lactamas, los ammoglicósidos, los nucleótidos heterocíclicos, o incluso los policétidos, así como la enzima codificada por estos ácidos nucleicos, los policétidos producidos gracias a la expresión de estos '.ácidos nucleicos, y finalmente con las composiciones farmacéuticas que comprenden una cantidad farmacológicamente activa de un policétido producido gracias a la expresión de tales ácidos nucleicos. Después del descubrimiento de la producción de la estreptomicina por los actinomicetos, la búsqueda de compuestos novedosos de interés terapéutico, y más particularmente de antibióticos novedosos, ha recurrido de manera incrementada a métodos de tamizado de los metabolitos producidos por los microorganismos del suelo. * ¿>*ti.
Tales métodos consisten principalmente de aislar los organismos de la microflora telúrica, cultivarlos sobre medios nutritivos especialmente adaptados, después de detectar una actividad farmacológica en los productos recuperados en los sobrenadantes del cultivo, o en los lisados celulares que hayan, dado el caso, sufrido previamente una o varias etapas de separación y/o de purificación. Así, los métodos de aislamiento y de cultivo in vitro de los organismos que constituyen la microflora telúrica permite, a la fecha actual, caracterizar aproximadamente 40,000 moléculas, donde aproximadamente la mitad presenta una actividad biológica. Los productos principales que han sido caracterizados de acuerdo con tales métodos de cultivo in vitro, tales como los antibióticos (penicilina, eritromicina, actinomicina, tetraciclina, cefalosporina) , los anticancerígenos, los anticol^sterolémicos o incluso plaguicidas . Los productos de interés terapéutico de origen microbiano conocidos a la fecha provienen principalmente (aproximadamente el 70%) del grupo de los actinomicetos, y más particularmente del género Streptomyces . Sin embargo, otros compuestos terapéuticos, tales como los teicoplaninos, la gentamicma y las espinccmas, se han aislado a partir de microorganismos de géneros más difíciles de cultivar, tales como Mi cromonospora , Actinomadura , Actinoplanes , Nocardia , Streptosporangi um , Ki tosa tosporia o incluso Sa ccharomonospora . Pero la practica ilustra el hecho de que la caracterización de los productos naturales novedosos sintetizados por los organismos de la microflora del suelo permanece limitada, en parte debido al hecho de que la etapa de cultivo in vitro conduce con más frecuencia a una selección de organismos ya conocidos anteriormente. Los métodos de separación y de cultivo in vitro de los organismos telúricos con el fin de identificar compuestos novedosos de interés, presentan por lo tanto numerosas limitantes . Los actinomicetos, P°r ejemplo, la proporción de redescubrimiento de antibióticos ya conocidos anteriormente es de aproximadamente 99%. En efecto, las técnicas de microscopía en fluorescencia han permitido enumerar más de 10i0 células bacterianas en 1 g de suelo, mientras que solamente del 0.1 al 1% de estas bacterias pueden ser aisladas después del sembrado en los medios de cultivo. Con la ayuda de técnicas de cinética de reasociación del ADN, se ha podido demostrar que entre 12,000 y 18,000 especies bacterianas pueden estar contenidas en 1 g de suelo, mientras que hasta esta fecha, solo 5,000 "-- •—-—•**"^Éfitii? üii?i - fthfr microorganismos no eucariotes han sido descritos, en cualquier habitat mezclado. Los estudios de ecología molecular han permitido amplificar y clonar numerosas secuencias novedosas de ADNr 16S a partir de ADN del medio ambiente. Los resultados de estos estudios han conducido a triplicar el número de divisiones bacterianas caracterizadas anteriormente . Hasta la fecha, las bacterias están subdivididas en 40 divisiones, ciertas de entre ellas no están constituidas más que por bacterias que no pueden ser cultivadas. Estos últimos resultados atestiguan la amplitud de la biodiversidad microbiana que permanece no explotada hasta la fecha. Los trabajos recientes han intentado sortear los numerosos obstáculos para el acceso a la biodiversidad de la microflora del suelo, donde especialmente la etapa de cultivo in vitro anterior al aislamiento y la caracterización de los compuestos de interés industrial, sobre todo de interés terapéutico. Los métodos han sido, por lo tanto, aplicados hasta el punto en que incluyen una etapa de extracción del ADN de los organismos telúricos, dado el caso después de un aislamiento previo de los organismos contenidos en la muestra de suelo.
El ADN así extraído, es después lisado de las células bacterianas sin la etapa previa de vía del cultivo in vitro, es clonado en los vectores utilizados para transfectar los organismos huéspedes, con el fin de constituir los bancos de ADN que provienen de las bacterias del suelo. Estos bancos de clones recombinantes son utilizados para detectar la presencia de genes que codifican para los compuestos de interés terapéutico, o alternativamente para detectar la producción de compuestos de interés terapéutico por estos clones recombinantes. Sin embargo, los métodos de acceso directos al ADN de la microflora del suelo, descritos en el estado de la técnica, presentan inconvenientes al momento de la aplicación de cada una de las etapas descritas anteriormente, de naturaleza que se afecta considerablemente la cantidad y la calidad del material genético obtenido y explotado . El estado de la técnica relacionado con cada una de las etapas de construcción de los bancos de ADN que proviene de la muestras de suelo, es detallado a continuación, así como los inconvenientes técnicos identificados por la solicitante y que han sido superados de acuerdo con la presente invención. ***** ******* *,*****& aí??ÍÍÍMt^*M**?u*»*é**íi*^****^**í***M*?**^ ^. * 1. Etapa de extracción del ADN de una muestra del suelo . 1.1 Extracción directa del ADN del medio ambiente Se trata esencialmente de un procedimiento que aplique las técnicas de extracción de ADN realizadas directamente sobre la muestra en el medio ambiente, con más frecuencia después de un lisado in situ previo de los organismos de la muestra. Tales técnicas han sido aplicadas sobre las muestras que provienen de medios acuáticos, ya sea de agua dulce o marina. Comprenden una primera etapa de concentración previa de las células presentes libremente o bajo forma de partículas, que consiste en general de una filtración de grandes volúmenes de agua sobre diferentes dispositivos de filtración, por ejemplo, filtración clásica sobre membrana, filtración tangencial o rotacional o incluso ultrafiltración. El tamaño de ios poros está comprendido entre 0.22 y 0.45 mm y con frecuencia necesita una prefiltración con el objeto de evitar el atascamiento debido al tratamiento de grandes volúmenes. En un segundo tiempo, las células recolectadas son usadas directamente sobre los filtros en pequeños volúmenes de soluciones, para el tratamiento enzimático y/o químico.
JifaiíJaifcifat-tokit *,*. antean Esta técnica está ilustrada, por ejemplo por los trabajos de STEIN et al., 1996, Journal of Bacteriology, Vol. 178 (3) : 591-599, que describe la clonación de genes que codifican para el ADN ribosomal y para un factor de alargamiento de la transcripción (EF 2) a partir de Archaebacteries del plancton marino. Las técnicas de extracción directa del ADN a partir de las muestras del suelo o de sedimento se han descrito igualmente, basados sobre los protocolos de lisado físico, químico o enzimático realizado in situ. Por ejemplo, la patente US No. 5,824,485 (Chromaxome Corporation) describe un lisado químico de las bacterias directamente sobre la muestra tomada, por la adición de un amortiguador de lisado caliente a base de isotiocianato de guanidinio. La solicitud internacional no. WO 99/20,799 (WISCONSIN ALUMNI Research FOUNDATION) describe una etapa de lisado de las bacterias in situ con la ayuda de un amortiguador de extracción que contiene una proteasa y el SDS. Otras técnicas han sido utilizadas igualmente, tales como la realización de varios ciclos de congelación/descongelación de la muestra, después del prensado de la muestra descongelada a alta presión. Se han utilizado igualmente técnicas de lisado de bacterias con ayuda de una sucesión de etapas de sonicación, de calentamiento por microondas y de choques térmicos (PICARD et al. (1992) . Sin embargo, las técnicas de extracción directa del ADN del estado de la técnica descritas anteriormente, tienen una eficacia muy variable desde el punto de vista cuantitativo y cualitativo. Así, los tratamientos químicos o enzimáticos in situ de la muestra, tienen la desventaja de no lisar más que ciertas categorías de microorganismos debido al hecho de las resistencia selectiva de diferentes microorganismos nativos en la etapa de lisado debido a su morfología heterogénea . Así, las bacterias Gram positivas, resisten un tratamiento con calor en detergente SDS, mientras que la casi totalidad de las células Gram negativas son usadas. Además, ciertos de los protocolos de extracción directa descritos anteriormente, favorecen la absorción de los ácidos nucleicos extraídos sobre las partículas minerales de la muestra, reduciendo así significativamente la cantidad del ADN accesible. Además, si ciertos protocolos del estado de la técnica divulgan una etapa de tratamiento mecánico para lisar los microorganismos de la muestra tomada, tal etapa de lisado mecánico es efectuado sistemáticamente en medio líquido en un amortiguador de extracción, lo que no permite una buena homogenización de la muestra de partida bajo la forma de partículas finas que permitan una accesabilidad máxima a la diversidad de los organismos presentes en la muestra. Los ensayos de trituración han sido efectuados igualmente sobre la muestra de suelo bruto con ayuda de bolas de vidrio, pero la cantidad de ADN extraído es escasa. Se ha observado de acuerdo con la invención, que una primera etapa de lisado mecánico in situ en medio líquido, tiene efectos negativos sobre la cantidad de ADN susceptible de ser extraído. La cantidad de ADN directamente utilizable para la clonación de los vectores recombinantes es igualmente tributaria de las etapas de purificación subsecuentes a su extracción . En el estado de la técnica, el ADN extraído es, a continuación purificado, por ejemplo por el uso de polivinilpolipirrolidona, por una precipitación en presencia de acetato de amonio o de potasio, por centrifugaciones sobre un gradiente de cloruro de cesio, o incluso por técnicas cromatográficas, especialmente sobre un soporte de hidroxiapatita, sobre una columna de intercambio de iones o incluso un tamizado molecular, o por técnicas de electroforesis sobre gel de agarosa. Las técnicas de purificación del ADN descritas anteriormente, sobre todo aquellas que son combinadas con I l -f íf iiÉMm**!*^*^*****^*.*.******.*^,**!,**!.*.».*.. *.*^*^*>?^^^ta*^****-*í*-^****?**Jí****^*?*^t, **-*-**•* i las técnicas de extracción de ADN del medio ambiente citadas anteriormente, son susceptibles de conducir a una copurificación del ADN como compuestos inhibidores que proviene de la muestra inicial que son difíciles de eliminar. La coextracción de los compuestos inhibidores con el ADN necesita la multiplicación de numerosas etapas de purificación, lo que conduce a pérdidas importantes del ADN extraído inicialmente, y reduce simultáneamente la diversidad del material genético contenido inicialmente en la muestra, así como su cantidad. Otro objeto de la invención, ha sido superar los inconvenientes de los protocolos de purificación anteriores y de poner a punto una etapa de purificación del ADN que permita mantener de manera óptima la diversidad del ADN de la muestra inicial, por una parte, y favorecer cuantitativamente su obtención, por otra parte. Más particularmente, las mejoras cualitativas y cuantitativas de la purificación del ADN son máximas cuando recurren a una combinación de un procedimiento de extracción directo del ADN de acuerdo con la invención, y a un procedimiento de purificación ulterior, como aquel que será descrito a continuación. 1.2 Extracción indirecta del ADN del medio ambiente . Tales técnicas recurren a una primera etapa de separación de diferentes organismos de la microflora telúrica de otros que constituyen la muestra de partida, previamente a la etapa de extracción de ADN propiamente dicho. En el estado de la técnica, la separación previa de una fracción microbiana de una muestra de suelo, comprende con más frecuencia una dispersión física de la muestra por trituración de esta última en medio líquido, por ejemplo utilizando los dispositivos del tipo Waring Blender o incluso un mortero. Se ha descrito igualmente las dispersiones químicas, por ejemplo sobre resinas intercambiadoras de iones o incluso dispers.iones con ayuda de detergentes no específicos, tales como el desoxicolato de sodio o el polietilenglicol. Cualquiera que sea el modo de dispersión, la muestra sólida debe ponerse en suspensión en agua, amortiguador de fosfato o una solución salina. La etapa de dispersión física o química puede seguirse por una centrifugación sobre un gradiente de densidad que permita la separación de las células contenidas en la muestra y de las partículas de esta última, entendiéndose que las bacterias tienen densidades inferiores a aquellas de la mayor parte de las partículas del suelo.
^^¿ La etapa de dispersión física puede también seguirse alternativamente por una etapa de centrifugación a una velocidad baja o incluso una etapa de elutriación celular . El ADN puede extraerse a continuación de las células separadas por cualquiera de los métodos de lisado disponibles y ser purificado por numerosos métodos, comprendidos los métodos de purificación descritos en el párrafo 1.1 precedente. Especialmente, la inclusión de las células de agarosa de bajo punto de fusión puede realizarse con el fin de aprovechar el lisado. Sin embargo, los métodos descritos en el estado de la técnica conocidos por la solicitante, no proporcionan satisfacción debido al hecho de la presencia, en las fracciones que contienen el ADN extraído, de constituyentes no deseables de la muestra de partida que tienen una influencia significativa sobre la calidad y la cantidad del ADN final. La presente invención se propone resolver las dificultades técnicas encontradas en el procedimiento de la técnica anterior como será descrito a continuación. 2. Caracterización molecular del ADN extraido. Cuando se desea construir un banco de ADN a partir e una muestra del medio ambiente, en partícula a partir de una muestra de suelo, es ventajoso verificar la calidad y la diversidad de la fuente de ADN extraído y purificado previamente a su inserción en los vectores apropiados. El objetivo de tal caracterización molecular del ADN extraído y purificado es obtener los perfiles que representan las proporciones de los diferentes taxones bacterianos presentes en este extracto de ADN. La caracterización molecular del ADN extraído y purificado, permite determinar si los artefactos han sido introducidos al momento de la aplicación de las diferentes etapas de extracción y de purificación y, dado el caso, si la diversidad de origen del ADN extraído y purificado es representativa de la diversidad microbiana presente inicialmente en la muestra, especialmente en la muestra de suelo. De conocimiento de la solicitante, se recurre en el estado de la técnica a los procedimientos de hibridación cuantitativa que aplican sondas oligonucleotídicas específicas de diferentes grupos bacterianos, aplicadas directamente al ADN extraído del medio ambiente. Desafortunadamente, tal enfoque es poco sensible y no permite detectar los géneros o grupos taxonómicos presentes en poca abundancia. El estado de la técnica describe también los procedimientos de PCR cuantitativa, tal como la MPN-PCR o incluso la PCR cuantitativa por competición. Sin embargo, estas técnicas presentan importantes inconvenientes. Así, la PN-PCR es de una utilización compleja debido a la multiplicación de las diluciones y a la repeticiones que la vuelven inapropiada para un gran número de muestras o de pares de cebadores. Además, la PCR cuantitativa por competición es de aplicación difícil debido a la necesidad de construir un competidor específico al ADN blanco, que además no induce un sesgo o artefacto en la competición propiamente dicha. Por lo tanto, es propuesto de acuerdo con la invención un procedimiento de pretamizado de un banco de ADN que proviene de una muestra del medio ambiente que es a la vez rápido, simple y confiable, y que permite probar la calidad del ADN previamente extraído y purificado, y de determinar así el interés de construir un banco de clones preparados a partir de este ADN purificado de partida. 3. Vectores para la clonación del ADN purificado a partir de una muestra del medio ambiente. Numerosos vectores ya han sido descritos en el estado de la técnica con el fin de clonar el ADN previamente extraído de una muestra del medio ambiente. Así, de acuerdo con la descripción de la solicitud internacional no. WO 99/20,799, pueden utilizarse vectores ^^.Ag^^4jj,.^i^,mA^^a.a¿??.,«,^.lMa^a.aa,jt^,at,jl. l.,.<^^iaa¿a»jal^^fe?aÉria^ái^'to.a^^?i?ta virales, fagos, plásmidos, fagémidos, cósmidos, fósmidos, vectores del tipo BAC (cromosoma artificial bacteriano) o incluso el bacteriófago Pl, vectores del tipo PAC (cromosoma artificial basado sobre el bacteriófago Pl), vectores del tipo YAC (cromosoma artificial de levadura) , plásmidos de levadura o cualquier otro vector capaz de mantener y expresar de manera estable un ADN genómico. El ejemplo 1 de la solicitud PCT no. WO 99/20,799, describe la construcción de un banco de ADN genómico por l r clonación en un vector del tipo BAC. De conocimiento de la solicitante, ningún banco de ADN que proviene de una muestra del medio ambiente había sido realizada efectivamente con vectores del tipo conjugativo, tal técnica es hecha accesible y reproducible por primera vez 5 para el experto en la materia gracias a las enseñanzas de la presente invención. 4. Huéspedes celulares 0 En el estado de la técnica, numerosas células huésped han sido descritas como que pueden utilizarse con el fin de hospedar los vectores que contienen los insertos de ADN que proviene del ADN extraído y purificado a partir de una muestra del medio ambiente. iirffelií tt Así, la solicitud PCT N°WO 99/20.799 cita numerosos huéspedes celulares apropiados, tales como Escherichia coli , en particular la cepa DH 10B o incluso la cepa 294 (ATCC 31446, la cepa E. coli B, E. Coli X 1776 (ATCC N°31.537), E. coli DH5 a et E . coli W3110 (ATCC n°27.325). Esta solicitud PCT cita igualmente a otras células huésped apropiadas tales como En terobacter, Erwinia , Klebsiella , Proteus, Salmonella , Serra tia , Schigella o incluso las cepas del tipo bacill us tales como B . subtilis y B . licheniformis así como las bacterias del género Pseudomonas , Streptomyces o Actinomyces . La patente US N°5,824,485 cita en particular la cepa de Streptomyces lividans TK66 o incluso las células de levadura tales como las de Sa ccharomyces pombe . 5. Caracterización de los genes de interés en los bancos de ADN que proviene de una muestra del medio ambiente La Solicitud PCT N°WO 99/20.799 describe un vector del fenotipo de diferentes clones que pertenecen al banco de ADN de B . cereus, respectivamente un clon que produce la hemolisina, un clon que hidroliza la esculina o incluso un clon que produce un pigmento anaranjado. **!**** 8?^****.****** ?*******l*******f** áüá*! Las técnicas de mutagénesis basadas en la utilización de un transposón que codifica para la enzima pho A ha permitido posteriormente aislar los clones mutados y de caracterizar las secuencias responsables de los fenotipos observados. El artículo de STEIN et al. (1996) citado anteriormente, describe la utilización de cebadores específicos de ADN ribosomal con el fin de amplificar el ADN insertado en los vectores hospedados por ciertas clonas de un banco de ADN genómico de Archaebactéries del plancton marino y la identificación de varias secuencias codificantes en el ADN así amplificado. El artículo de BORSCHERT S. et al., (1992) describe el tamizado de un banco de ADN genómico de Ba cill us subtilis con ayuda de pares de cebadores que se hibridan con las regiones conservadas de péptido sintasas conocidas con el fin de identificar uno o varios genes correspondientes en el genoma de Bacill us subtilis . Esta técnica permite detectar un fragmento de ADN cromosómico de aproximadamente 26 kb que porta una parte del operón de la biosíntesis de la surfactma. El artículo de KAH-TONG S. et al. (1997) describe el tamizado de un banco de ADN que proviene del suelo con ayuda de cebadores que se hibridan con las secuencias conservadas del operón responsable de la vía de la k??nata*. *.****** *. -' ** - *^>I**L****^*?*****I *** *..** ¿*^.¡ biosíntesis de los poiicétidos dei tipo II y muestra la identificación, en el seno de este banco de ADN, de las secuencias emparentadas con el gen PKS-ß. Este artículo describe también la construcción de casetes de expresión híbridos en los cuales la secuencia de la subunidad PKS-ß, encontrada naturalmente en el operón responsable de la biosíntesis de los policétidos, ha sido reemplazada por diferentes secuencias emparentadas encontradas en el banco de ADN. De igual modo, el artículo de HONG-FU et al., (1995) describe la construcción de casetes de expresión que contienen las diferentes fases de lectura abierta del operón responsable de la biosíntesis de los policétidos, los diferentes casetes de expresión han sido construidos artificialmente combinando las fases de lectura abierta que no son encontradas juntas naturalmente en el genoma de Streptomyces coelicolor. Este artículo muestra que la combinación, en los casetes de expresión artificiales, de los marcos de lectura abierta originarios de diferentes cepas bacterianas permite la producción de policétidos que tienen diferentes características estructurales y actividades antibióticas más o menos grandes frente a Ba cil l us subtilis y Bacill us cereus . * *.£& * *. t^^****^^**^*^*****^-****^!******* .... ***- **.- . . ?*j.\ Los policétidos forman parte de una gran familia de productos naturales de estructura variable y poseen una gran diversidad de actividades biológicas. Forman parte de los policétidos por ejemplo, las tetraciclinas y la eritromicina (antibiótico), el FK506 (inmunosupresor), la doxorrubicina (agente anticancerígeno) , la monensina (un agente cocidioestático) así como la vermectina (un agente antiparasitario) . Estas moléculas son sintetizadas gracias a las enzimas multifuncionales llamadas policétidos sintasas, que catalizan los ciclos de condensación repetidos entre los acil tioésteres (en general los acetil, propionil, malonil o metilmalonil tioésteres) . Cada ciclo de condensación conduce a la formación, sobre una cadena carbonada creciente, de un grupo ß-ceto que puede a continuación sufrir dado el caso, una o varias series de etapas reductoras. Tomando en cuenta el interés clínico importante de los policétidos, su mecanismo común de biosíntesis así como el alto grado de conservación observado entre los grupos de genes que codifican para los policétidos sintasas, se ha desarrollado un interés incrementado para el desarrollo de novedosos policétidos por ingeniería genética. Así, novedosos policétidos artificiales han sido producidos por ingeniería genética, tales como la mederodina A o la dihidrogranatirhodina . La gran mayoría de las **¡**.******t*u? ¿??ffit|g¡HjH¡lfig| itr -ni mi ?? ^ MááéM^ moléculas novedosas de policétidos obtenidas por ingeniería genética son muy diferentes, desde el punto de vista estructural, de los policétidos correspondientes naturales. Del estado de la técnica, resulta así que existe una necesidad de obtener policétidos novedosos de interés y más particularmente de policétidos de interés terapéutico que presenten especialmente, con respecto a sus homólogos naturales, un nivel incrementado de actividad antibiótica o incluso un espectro de actividad natibiótica diferente, sea más grande que aquel de los policétidos conocidos, o al contrario más selectivo. Esta necesidad es como será descrito a continuación, en parte satisfecha de acuerdo con la presente invención .
DESCRIPCIÓN DE LA INVENCIÓN La invención se relaciona primeramente con un procedimiento para la construcción de bancos de ADN que proviene de una muestra de ADN, tal muestra puede ser indiferentemente un medio acuático (agua dulce o marina) , una muestra de suelo (capa superficial del suelo, subsuelo o sedimento) , o incluso una muestra de organismos eucariotes contenidos en una microflora asociada, tal como por ejemplo una muestra que proviene de plantas, de insectos, o incluso de organismos marinos y que posean una microflora asociada.
La puesta punto de un procedimiento de construcción de un banco de ADN de una muestra del medio ambiente, y más particularmente de una muestra del suelo, comprende etapas críticas donde la aplicación debe ser necesariamente optimizada para la obtención de un banco de ADN donde el contenido de ácidos nucleicos de interés responda a los objetivos inicialmente fijados. Una primera etapa crítica consiste en la extracción y la purificación ulterior de los ácidos nucleicos contenidos inicialmente en la muestra, es decir, principalmente los ácidos nucleicos contenidos en los diversos organismos que componen la microflora de esta muestra. La calidad de la purificación del ADN extraído es determinante sobre el resultado obtenido. Una segunda etapa importante de un procedimiento de construcción de un banco de ácidos nucleicos que provienen de una muestra del medio ambiente es la evaluación de la diversidad genética de los ácidos nucleicos extraídos y purificados. La aplicación ds ¡xa etapa de realización simple y confiable de pretamizado del ADN extraído y purificado con el fin de verificar que informe, al menos parcialmente, de la diversidad fiiogenética de los organismos presentes inicialmente en la muestra de partida, permite en efecto, determinar el interés o no de utilizar la fuente inicial de ADN extraído y purificado para la construcción del banco de Í********* ?**..t &** , * * *i?.*** -kié* *j** *- **- .* *ií¡?s*é?¡? *, ptiMJÉlfc*-»- ******&* ácidos nucleicos propiamente dicho, o por el contrario, de no proseguir la construcción de bancos de ácidos nucleicos debido a artefactos muy importantes introducidos al momento de la extracción y de la purificación de los ácidos nucleicos. Se ha identificado además de acuerdo con la invención, que la calidad de los insertos introducidos en los vectores para construir el banco es determinante. También se ha determinado que el uso de enzimas de restricción para separar el ADN extraído y purificado a partir de la muestra del medio ambiente, es de naturaleza que introduce artefactos o "desviaciones" en la estructura de los insertos obtenidos. En efecto, el ADN extraído del suelo o de otros medios, que proviene en su gran mayoría de organismos no cultivables, está compuestos de moléculas donde la relación de bases G y C es por definición desconocida, y además variable en función del origen de estos organismos. Una tercer etapa crítica es la inserción de los ácidos nucleicos extraídos y purificados en los vectores capaces de integrar los ácidos nucleicos de longitud elegida, por una parte, y por otra parte, permitir la transfección o incluso la integración en el genoma de los huéspedes celulares determinados así como, dado el caso, de permitir la expresión en tales huéspedes celulares. Constituyen los vectores de interés, los vectores capaces de integrar los ácidos nucleicos de gran tamaño, es decir de tamaño superior a 100 kb puesto que el objetivo perseguido consiste en una clonación y una identificación de un operón completo capaz de dirigir una vía completa de biosíntesis de un compuesto de interés industrial, en particular de un compuesto de interés farmacéutico o agronómico .
DEFINICIONES En el sentido de la presente invención, se entiende por "ácidos nucleicos", "polinucleótidos" y "oligonucleótidos", así como secuencias de ADN, ARN, las secuencias híbridas de ARN/ADN de más de dos nucleótidos, de manera indiferente bajo la forma de hebra simple o hebra doble . El término, "banco" o "colección" es utilizado en la presente descripción con referencia de manera indiferente a un conjunto de ácidos nucleicos extraídos y, dado el caso purificados, que provienen de una muestra del medio ambiente, a un conjunto de vectores recombinantes, cada uno de los vectores recombinantes del conjunto comprende un ácido nucleico que proviene del conjunto de ácidos nucleicos extraídos, y dado el caso, purificaaos citados anteriormente, así como un conjunto de células huésped recombinantes que comprenden uno o varios ácidos nucleicos que provienen del conjunto de los ácidos nucleicos extraídos y, dado el caso, ***** . ***u*.g*J*.J***********-•--- * *-** **:*"f-f- •^j*fait*1fatfc,in*fBf*Ht i purificados citados anteriormente, dichos ácidos nucleicos son portados por uno o varios vectores recombinantes, o están integrados en el genoma de la célula huésped recombinantes. Se designa por "muestra del medio ambiente" de manera indiferente una muestra de origen acuático, por ejemplo de agua dulce o salina, o una muestra telúrica que proviene de la capa superficial del suelo, de sedimentos o incluso de capas inferiores del suelo (subsuelo) , así como las muestras de organismos eucariotes, dado el caso multicelulares, de origen vegetal, que provienen de organismos marinos o incluso de insectos y que poseen una microflora asociada, esta microflora asociada constituye los organismos de interés. Se entiende por "operón" de acuerdo con la invención, un conjunto de marcos de lectura abiertos, donde la transcripción y/o la traducción es corregulada por un conjunto único de señales de regulación de la transcripción y/o de la traducción. De acuerdo con la invención, un operón puede igualmente comprender dichas señales de regulación de la transcripción y/o de la traducción. Por "vía metabólica" para los fines de la invención o incluso "vía de biosíntesis", se entiende un conjunto de reacciones bioquímicas, anabólicas o catabólicas que realizan la conversión de una primera especie química a una segunda especie química. ?** *.?. ?fi.* .* , *.** *ti***. ».-t..aai^^ t«aBjt^^J»i¿^^to^-,» »fjAA.A¡A-a a Por ejemplo, una vía de biosíntesis de un antibiótico está constituida por el conjunto de reacciones bioquímicas que convierten los metabolitos primarios en productos intermediarios de los antibióticos, después posteriormente en antibióticos. Por secuencia de repoblación colocada "en fase" (en inglés enlazada de manera operable) con respecto a una secuencia nucleotídica donde la expresión es buscada, se entiende que la o las secuencias de regulación de la transcripción están localizadas, con respecto a la secuencia nucleotídica de interés donde la expresión es buscada, de manera que permita la expresión de la secuencia de interés, la regulación de la expresión es dependiente de factores que interactúan con las secuencias nucleotídicas reguladoras. De acuerdo con otra terminología, se puede decir igualmente que la secuencia nucleotídica de interés donde se busca la expresión "bajo el control" de las secuencias nucleotídicas reguladoras de la transcripción. El término "aislado" en el sentido de la presente invención designa un material biológico que ha sido sustraído de su medio ambiente original (el medio ambiente en el cual está localizado naturalmente) . Por ejemplo, un polinucleótido o un polipéptido presente en el estado natural en un organismo (virus, bacteria, champiñón, levadura, planta o animal) no está * J*?*í******-****l-**. *****.-M*i. É*******.*'* MtJt * aislado. El mismo polipéptido separado de su medio ambiente natural o el mismo polinucleótido separado de los ácidos nucleicos adyacentes en el seno de los cuales está insertado naturalmente en el genoma del organismo, está aislado. Tal polinucleótido puede estar incluido en un vector y/o tal polinucleótido puede estar incluido en una composición y permanecer sin embargo en el estado aislado, debido a que el vector o la composición no constituyen su medio ambiente natural. El término "purificado" no necesita más que el material esté presente bajo una forma de pureza absoluta, exclusivo de la presencia de otros compuestos. Se trata por lo tanto de una definición relativa. Un polipéptido o un polinucleótido está en el estado purificado después de la purificación del material de partida de al menos un orden de magnitud, de preferencia 2 ó 3 y de preferencia 4 ó 5 órdenes de magnitud. El "porcentaje de identidad" entre dos secuencias de nucleótidos o de aminoácidos, en el sentido de la presente invención, puede determinarse comparando dos secuencias alineadas de manera óptima, a través de una ventana de comparación . La parte de la secuencia nucleotídica o del polipéptido en la ventana de comparación puede así comprende adiciones o supresiones (por ejemplo "hueco") con respecto a la secuencia de referencia (que no comprende estas adiciones o supresiones) de manera que se obtiene una alineación óptima de las dos secuencias. El porcentaje es calculado determinando el número de posiciones en las cuales una base nucleica o un residuo de aminoácido idéntico es observado para las dos secuencias (nucleico o peptídico) comparadas, después dividiendo el número de posiciones en las cuales hay identidad entre las dos bases o residuos de aminoácidos por el número total de posiciones en la ventana de comparación, después multiplicando el resultado por 100 con el fin de obtener el porcentaje de identidad de secuencia. La identidad óptima de las secuencias para la comparación puede realizarse de manera informática con ayuda de algoritmos conocidos contenidos en el paquete de la Sociedad WISCONSIN GENETICS SOFTWARE PACKAGE, GENETICS COMPUTER GROUP (GCG), 575 Science Doctor., Madison, WISCONSIN. A modo de ilustración, el porcentaje de identidad de la secuencia podrá efectuarse con la ayuda de lógico BLAST (versiones BLAST 1.4.9 de Marzo de 1996, BLA?T 2.0.4 de Febrero de 1998 y BLAST 2.0.6. de Septiembre de 1998), utilizando exclusivamente los parámetros por defecto (S.F.
Altschul et al., J. Mol. Biol. 1990 215:403-410, S. F. Altschul et al., Nucleic Acids Res. 1997 25:3389-3402). Blast - i i'ti tlüfaid f%i* .-,*?m **- ******-<** ** .,...,.-^aria^^^a^^^^^^aa^áh»^» i ?i^* busca las secuencias similares/homologas a una secuencia "solicitada" de referencia, con ayuda del algoritmo de Altschul et al. La secuencia solicitada y las bases de datos utilizadas pueden ser peptídicas o nucleicas, cualquier combinación es posible.
EXTRACCIÓN Y PURIFICACIÓN DE ÁCIDOS NUCLEICOS QUE PROVIENEN DE UNA MUESTRA DEL MEDIO AMBIENTE 1. Extracción directa de los ácidos nucleicos Se ha mostrado de acuerdo con la presente invención que, para la obtención de un banco de ácidos nucleicos que provenga de organismos contenidos en una muestra de suelo, es importante crear condiciones en las cuales, por una parte, los diferentes organismos de la muestra se vuelvan accesibles a las etapas superiores de extracción de los ácidos nucleicos y, por otra parte, que la etapa inicial del tratamiento de la muestra del suelo permita un lisado mecánico máximo de los organismos de la muestra de naturaleza que se vuelvan directamente accesibles los ácidos nucleicos de estos organismos, principalmente el ADN genómico y plasmídico, en los amortiguadores utilizados para las etapas interiores de extracción. Se ha demostrado así, de acuerdo con la invención, que una accesibilidad máxima de los ácidos nucleicos que provienen de microorganismos de una muestra de suelo se logra **i*? ?,? ****** *t*sá*iil.**.. =cC, --,a»„a,M . ****.***.-* **.***,.. ... ..^^^j^^ *. **** * * * ***^^ ***** . . .Í* por el triturado favorecido y en seco de la muestra del suelo previamente seca con el fin de obtener las micropartículas. La solicitante ha determinado también que el secado de la muestra del suelo previamente a cualquier tratamiento posterior provoca una disminución significativa de la cohesión de la muestra del suelo bruto y favorece en consecuencia, su degradación posterior bajo la forma de micropartículas, cuando un tratamiento por triturado apropiado es operado. De manera sorprendente, la solicitante ha mostrado que las micropartículas de muestras de suelo seco que reúnen las propiedades fisicoquímicas favorables para la extracción de una cantidad óptima de ácidos nucleicos, que en su naturaleza, pueden ser representativas de la diversidad genética de los organismos presentes inicialmente en la muestra del suelo de partida. Se ha mostrado en particular que el procedimiento de extracción directa de ácidos nucleicos de acuerdo con la invención permite la extracción de ADN que proviene de microorganismos raros, tales como ciertos Streptomyces raros, o microorganismos esporulados. Por "micropartícuias" de muestra de suelo, para los fines de la presente invención, se entienden partículas derivadas de la muestra que tengan una talla promedio de íí?.i i,?*á..Í*¡*^**Á.ii*L..tt**********.** aproximadamente 50 µm, es decir comprendidas en promedio entre 45 y 55 µm. De acuerdo con la invención, las micropartículas son obtenidas a partir de muestras de suero previamente secas o desecadas, después trituradas hasta la obtención de micropartículas de tamaño promedio comprendido entre 2 µm y 50 µm, antes de ponerse en suspensión en un medio amortiguador líquido de las micropartículas obtenidas. Tal medio amortiguador líquido puede consistir de un amortiguador de extracción de ácidos nucleicos, en particular un amortiguador de extracción del ADN convencional bien conocido por el experto en la materia. La trituración de la muestra del suelo en micropartículas tiene por doble función lisar mecánicamente la mayoría de los organismos presentes en la muestra del suelo inicial y volver accesibles los organismos no lisados por este tratamiento mecánico para las etapas facultativas posteriores de lisado químico y/o enzimático. Así, un primer objeto de la invención consiste en un procedimiento de preparación de una colección de ácidos nucleicos a partir de una muestra de suelo que contenga los organismos, el procedimiento comprende una primera etapa (I- (a)) de obtención de micropartículas por trituración de la muestra del suelo previamente seca o desecada, después poner en suspensión las micropartículas en un medio amortiguador líquido. De manera más preferida, la etapa de trituración se realiza con la ayuda de un dispositivo de bolas de ágata o de tungsteno o de incluso con la ayuda de un dispositivo de anillos de tungsteno. Estos dispositivos son preferidos porque la dureza del material como la ágata o el tungsteno facilita significativamente la obtención de micropartículas del tamaño especificado anteriormente. Por esta razón, uno no eligirá de manera preferida, incluso evitará, recurrir a un dispositivo de trituración de bolas de vidrio, el cual se revela un poco menos eficaz. El secado o la clasificación de la muestra de suelo puede realizarse por cualquier método conocido por el experto en la materia. Por ejemplo, la muestra de suelo bruto puede secarse a temperatura ambiente durante una duración de 24 a 48 horas. Como se indica anteriormente, el medio amortiguador líquido puede consistir en un medio de extracción del ADN presente en las micropartículas. Se utilizará de manera más preferida un amortiguador de extracción designado TENP que contenga respectivamente tris 50 mM, EDTA 20 mM, NaCl 100 mM y 1% (peso/volumen) de polivinilpolipirrolidona a un pH de 9.0.
El procedimiento de preparación de una colección de ácidos nucleicos a partir de una muestra de suelo esta caracterizado además porque la etapa de obtención de micropartículas por trituración de la muestra de suelo previamente seca o desecada esta seguida por una etapa l-(b) de extracción de los ácido nucleicos presentes en las micropartículas . Es una constante que la extracción de los ácidos nucleicos esta acompañada de una coestracción de compuestos y/o de constituyentes del suelo indeseables que necesitan la purificación posterior de los ácidos nucleicos extraídos, tal etapa de purificación posterior debe ser a la vez suficientemente selectiva para permitir la eliminación de los compuestos y/o los constituyentes del suelo indeseables, y de un rendimiento suficiente para arrastrar una pérdida escasa en cantidad del ADN previamente extraído. Se ha mostrado de acuerdo con la invención que una etapa de purificación del ADN extraído de las micropartículas de la muestra de suelo que responde a los criterios de selectividad y de rendimiento definidos anteriormente, comprende un tratamiento del ADN extraído por una combinación de dos etapas sucesivas de cromatografía, respectivamente una cromatografía sobre un tamiz molecular y una cromatografía de intercambio de iones. ^¡1.1.^11111., ^******t*** ***********t**»**?**.* ** **.. ..*> * *. *? *?r, r ¡ -»t**tr-?ÍU'am^:^ ^??^*?e?^-*^t????^^'^ De acuerdo con otra característica del procedimiento anterior, la etapa l-(b) de extracción de los ácidos nucleicos es seguida de una etapa l-(c) de purificación de los ácido nucleicos extraídos con la ayuda de dos etapas de cromatografía siguientes: - el paso de la solución que contiene los ácido nucleicos sobre un tamiz molecular, después de la recuperación de las fracciones de elución enriquecidas en ácidos nucleicos; - el paso de las fracciones de elución enriquecidas con ácidos nucleicos sobre un soporte de cromatografía de intercambio de iones, después la recuperación de las fracciones de elución que contienen los ácidos nucleicos. La naturaleza y el orden de las etapas de la cromatografía anteriores son esenciales para una buena selectividad y un excelente rendimiento de la etapa de purificación del ADN previamente extraído de las micropartículas de la muestra de suelo, previamente seca o desecada . De manera muy ventajosa, el soporte cromatográfico del tipo "tamiz molecular" de la etapa de purificación de los ácidos nucleicos anterior, consiste en un soporte cromatográfico del tipo Sephacryl© S400 HR o un soporte cromatográfico de características equivalentes.
De manera más preferida, el soporte cromatográfico de intercambio de aniones utilizado al momento de la segunda etapa de purificación del ADN extraído, es un soporte del tipo Elutip©, o un soporte cromatográfico de características equivalentes. En combinación, las etapas l-(a) de obtención de micropartículas de la muestra de suelo seco, l-(b) de extracción de los ácido nucleicos presentes en las micropartículas y l-(c) de purificación por las etapas cromatográficas descritas anteriormente, es posible de acuerdo con invención extraer directamente el ADN del suelo sin purificación previa de las células de los organismos contenidos inicialmente en la muestra, evitando la coestracción de los contaminantes del suelo, tales como por ejemplo los ácidos húmicos que se observan con los procedimientos del estado de la técnica. Los contaminantes, tales como los ácido húmicos afectan severamente los análisis y los usos subsecuentes de los ácidos nucleicos cuya purificación se busca. De acuerdo con el procedimiento anterior, es posible accede a los ácidos nucleicos contenidos en los organismos que no han sido alisados mecánicamente en el curso de la etapa l-(a) de obtención de micropartículas de la muestra de suelo, con el objeto de obtener una colección casi exhaustiva de la diversidad genética de los ácido nucleicos presentes inicialmente en la muestra de suelo. Así, las micropartículas de la muestra de suelo pueden ser el objeto de etapas posteriores de tratamiento del lisado químico, enzimático o físico, o incluso de una combinación de tratamientos químicos, enzimáticos o físicos. De acuerdo con un primer aspecto, el procedimiento de preparación de una colección de ácidos nucleicos a partir de una muestra de suelo de acuerdo con al invención, puede caracterizarse además en que la etapa 1 (a) es seguida de las etapas siguientes: • tratamiento de la suspensión del suelo en un medio amortiguador líquido por sonicación; • extracción y recuperación de las ácidos nucleicos. De manera preferida, se recurrirá, por un tratamiento por sonicación, a un dispositivo del tipo de micropunta de titanio, tal como el dispositivo 600 W Vibracell Ultrasomcator comercializado por la Sociedad Bioblock o incluso un sonicador del tipo Cup Horn. De manera más preferida, la etapa de sonificación es realizada una potencia de 15 W durante una duración de 7 a 10 minutos y comprenden ciclos sucesivos de sonicación, la sonicación propiamente dicha se realiza durante el 50% de la duración de cada ciclo.
De acuerdo con un segundo aspecto, el procedimiento anterior puede caracterizarse además en que la etapa l-(a) es seguida de las etapas siguientes: • tratamiento de la suspensión del suelo en un medio amortiguador líquido por sonicación; • incubación de la suspensión a 37 °C después de la sonicación en presencia de lisozimatica de acromopeptidasa; • adición de SDS antes de la centrifugación y precipitación de los ácido nucleicos; • recuperación de los ácido nucleicos precipitados. De preferencia, la etapa de incubación en presencia de lisozima y de acromopeptidasa será realizada una concentración final de 0.3 miligramos/ mililitros de cada una de los dos enzimas, de preferencia durante 30 minutos a 37°C. De manera preferida, el SDS será utilizado a una concentración final de 1% y durante un tiempo de incubación de una hora a la temperatura de 60°C durante la centrifugación y precipitación. De acuerdo con un tercer aspecto, el procedimiento de preparación de una colección de ácidos nucleicos a partir de una muestra de suelo anterior, está caracterizada además en que la etapa l-(a) esta seguida de las etapas siguientes: - homogeneización de la suspensión del suelo con una etapa de mezclado violento (vórtice) seguido de una etapa de simple agitación; .** -. ***&,**,..* &. ?t*. **-,**. - congelación de la suspensión homogénea seguida de una descongelación; - tratamiento por sonicación de la suspensión después de la descongelación. - incubación de la suspensión a 37°C después de la sonicación en presencia de lisozima y cromopeptidasa; - adición de SDS antes de la centrifugación y precipitación de los ácidos nucleicos; - recuperación de las ácidos nucleicos. De manera preferida, las suspensiones de micropartículas de suelo son pasadas en un vórtice después homogeneizadas por agitación suave sobre un agitador de rotación circular durante una duración de dos horas antes de ser congeladas a -20°C. De manera preferida, las suspensiones son agitadas nuevamente violentamente por el vórtice durante 10 minutos, después de la descongelación y antes de la etapa de sonicación . No hay que decir que los ácidos nucleicos extraídos por los modos de realización de extracción directa de los ácidos nucleicos descrito anteriormente, son purificados de manera preferida de acuerdo con la etapa de purificación constituida de un primer paso sobre un tamiz molecular, después un paso subsecuente de las fracciones de efusión obtenidas a la salida de la cromatosrafía sobre el tamiz *** *** ** - *..,tMt^^i^M*?iA.<A^.^ia?J^^^»^?^?ii«to?jW.». molecular sobre un soporte cromatográfico de intercambio de aniones . 2. Extracción indirecta de los ácidos nucleicos De acuerdo con un segundo modo de realización del procedimiento de preparación de una colección de ácidos nucleicos a partir de una muestra del medio ambiente, de acuerdo con la invención, la muestra del medio ambiente sufre un primer tratamiento de naturaleza que permite la separación de los organismos, contenidos en la muestra, de los otros macroconstituyentes de la muestra. Este segundo modo de realización del procedimiento de preparación de una colección de ácidos nucleicos de acuerdo con la invención, favorece la obtención de ácidos nucleicos de gran tamaño, que son prácticamente imposibles de obtener de acuerdo con el primer modo de realización del procedimiento de acuerdo con la invención descrita anteriormente, la etapa de lisado mecánico operada para la obtención de las micropartículas tiene igualmente por efecto romper físicamente los ácidos nucleicos de la muestra de suelo o los ácido nucleicos contenidos en los organismos de la muestra de suelo. La obtención de ácidos nucleicos de gran tamaño ha sido buscada por la solicitante con el objeto de aislar y caracterizar los ácidos nucleicos que comprenden, al menos parcialmente, el conjunto de las secuencias codificantes emparentadas a un mismo operon capaz de dirigir la biosíntesis de un compuesto de interés industrial. De manera preferida, se obtiene, aplicando el segundo modo de realización del procedimiento de preparación de una colección de ácidos nucleicos a partir de una muestra de suelo de acuerdo con la invención, ácidos nucleicos que tienen un tamaño superior a 100 kb, de preferencia superior a 200, 250 ó 300 kb, y de manera más preferida de ácidos nucleicos de un tamaño superior de 400, 500 o incluso 600 kb. Este segundo modo de realización de un procedimiento de preparación y una colección de ácidos nucleicos a partir de una muestra del medio ambiente, de acuerdo con la invención, esta constituida de una combinación de cuatro etapas sucesivas destinadas a la obtención de ácidos nucleicos que tengan las características descritas anteriormente . Cuando la muestra del medio ambiente es una muestra de suelo, se ha mostrado de acuerdo con la invención que una primera etapa de obtención de una suspensión por dispersión de la muestra de suelo en medio líquido favorece la accesibilidad de los organismos contenidos en la muestra sin provocar el lisado mecánico significativo de las células. La primera etapa de obtención de una dispersión de la muestra del suelo anterior, vuelva accesibles los -f*?í **Íx*f..*f?*?*^* *^*¿..*Í*i??*. ?¡*.***t*^ ü^^t^te tt organismos de la muestra al medio exterior y permite igualmente una disociación parcial de los organismos de la muestra y de los macroconstituyentes . Vuelve así posible una separación posterior de los organismos contenidos inicialmente en la muestra de otros constituyentes de esta última . Cuando la muestra del medio ambiente proviene por ejemplo de vegetales, de organismos marinos o de insectos, un tratamiento previo por trituración es necesario con el fin de volver a los organismos de la microflora asociada, accesibles a las etapas posteriores del procedimiento. Así, el presente procedimiento comprende una etapa de separación de los organismos de otros constituyentes minerales y/u orgánicos obtenidos anteriormente por una centrifugación sobre un gradiente de densidad. Los organismos así separados son a continuación sometidos a una etapa de lisado después de la extracción de ácidos nucleicos. La etapa de centrifugación sobre un gradiente de densidad, de manera sorprendente, permite separar las células de organismos de partículas del suelo contenidas en la suspensión de la muestra. Se podrá en efecto, esperar que una proporción de células sea arrastrada con las macropartículas en el seno de la fase del gradiente. Además, nunca ha sido demostrado hasta el presente que una centrifugación sobre un gradiente de densidad de una muestra de suelo permite recuperar, en al interfaz de la fase acuosa/ gradiente, una población de organismos representativa de la diversidad de organismos presentes en la muestra de partida, debido a que estos organismos son de volumen, densidad y forma extremadamente variables. Se puede suponer razonablemente que serán encontrados de manera indiferente en el seno de la fase acuosa, en la interfaz de la fase acuosa/ gradiente de densidad, e> igualmente en el seno del gradiente de densidad mismo. Así, el experto en la materia puede esperar que estos organismos presenten densidades más bajas o más altas que la densidad del gradiente de densidad utilizado (densidad del gradiente de densidad comprendida entre 1.2 y 1.5 gramos/ mililitros, de preferencia 1.3 gramos/mililitros) no puedan ser recuperados, lo que tendrá por efecto la introducción en una desviación en la representatividad de los organismos separados efectivamente y, por consiguiente, igualmente la diversidad de los ácidos nucleicos extraídos. Además, en un modo de realización particular del procedimiento, se realiza una etapa de germinación de las esporas, en particular de actinomicetos, lo que tiene por efecto incrementar de manera significativa la cantidad del ADN de actinomicetos recuperado. La última etapa consiste de una etapa de purificación de los ácidos nucleicos así extraídos sobre un gradiente de cloruro de cesio.
De manera sorprendente, la purificación de los ácido nucleicos sobre el gradiente de cloruro de cesio permite una eliminación sustancial, incluso completa, de las sustancias que componen el gradiente de densidad. Esta característica es determinante en lo que concierne a la utilización posterior de los ácidos nucleicos purificados puesto que el gradiente de densidad es conocido como un potente inhibidor enzimático, capaz, dado el caso de inhibir la actividad catalítica de las enzimas utilizadas para preparar la inserción de los ácidos nucleicos extraídos en los vectores. De acuerdo con este segundo modo de realización, el procedimiento de preparación de una colección de ácidos nucleicos a partir de una muestra del medio ambiente que contiene organismos de acuerdo con la invención, comprende la sucesión de etapas siguientes: i) obtención de una suspensión p?r dispersión de la muestra del medio ambiente del medio líquido, después homogeinisacion de la suspensión obtenida por agitación suave; li) separación de los organismos de otros constituyentes minerales y/u orgánicos de la suspensión homogénea obtenida en la etapa i), por centrifugación sobre un gradiente de densidad; ísáí?M M ¿oM?kji? -^- -**!•*<-* mr'? " -^¡ ^?.¡*^?^L?* át*ld**L? iii) lisado de los microorganismos separados en la etapa ii) y extracción de los ácidos nucleicos; iv) purificación de los ácidos nucleicos sobre un gradiente de cloruro de cesio. De manera preferida, la suspensión de la muestra de suelo se obtiene por dispersión de esta muestra por trituración con ayuda de un dispositivo del tipo Waring Blender o un dispositivo de características equivalentes. De manera más preferida, la suspensión de la muestra se obtiene después de tres triturados sucesivos de una duración de un minuto cada uno en un dispositivo del tipo Waring Blender. De preferencia, la muestra triturada será enfriada en hielo entre cada uno de los triturados. De manera preferida, los organismos son a continuación separados de las partículas del suelo por centrifugación sobre un colchón de densidad del tipo "Nycodenz", comercializado por la Sociedad Nycomed Pharma AS. (Oslo, Noruega) . Las condiciones preferidas de centrifugación son de 10,000 g durante 40 minutos a 4°C. Ventajosamente, en un rotor de recipientes móviles del tipo "rotor TST 28.38" comercializado por la Sociedad KONTRON. El anillo de organismos localizado, después de la centrifugación, en la interCase de la fase superior acuosa y de la fase inferior de Nycodenz es entonces tomado y lavado por centrifugación antes de volver a tomar el residuo celular en un amortiguador apropiado. La etapa (iii) de lisado de los organismos separados en la etapa (ii) descrita anteriormente, puede realizarse de cualquier manera conocida por el experto en la materia . Ventajosamente, las células son usadas en una solución de Tris 10 mM-EDTA 100 mM a un pH de 8.0 en presencia de lisozima y acromopeptidasa, de manera ventajosa durante una hora a 37°C. La extracción propiamente dicha del ADN puede realizarse ventajosamente por la adición de una solución de lauril sarcosilo (1% en peso final de la solución), en presencia de proteinaza K e incubación de la solución final a 37°C durante 30 minutos. Los ácidos nucleicos extraídos en la etapa (iii) son purificados a continuación sobre un gradiente de cloruro de cesio. De manera preferida, la etapa de purificación de los ácidos nucleicos sobre un gradiente de cloruro de cesio se realiza por centrifugación a 35,000 revoluciones/minuto durante 36 horas, por ejemplo sobre un rotor del tipo Kontron 65.13. De acuerdo con un aspecto particular del procedimiento de preparación de una colección de ácidos nucleicos a partir de una mezcla de suelo que contiene los organismos de acuerdo con la invención, dichos ácidos nucleicos están constituidos principalmente, sino que exclusivamente, de moléculas de ADN. De acuerdo con otro aspecto, los ácido nucleicos pueden ser recuperados después de la inclusión de los organismos, separados sobre un gradiente de densidad, en un bloque de agarosa y lisados, por ejemplo química y/o enzimáticamente, los organismos incluidos en el bloque de agarosa. Otro objeto de la invención consiste en una colección de ácidos nucleicos constituidos por los ácidos nucleicos contenidos en la etapa II- (iv) del procedimiento de preparación de una colección de ácidos nucleicos de acuerdo con la invención, o incluso obtenida en la etapa (c) o en una etapa posterior del procedimiento de preparación de una colección de ácidos nucleicos de acuerdo con la invención. La invención también es relativa a un ácido nucleico caracterizado en que está contenido en una colección de ácidos nucleicos tal como la definida anteriormente. De acuerdo con un primer aspecto, tal ácido nucleico constitutivo de una colección de ácidos nucleicos de acuerdo con la invención, está caracterizado en que comprende una secuencia nucleotídica que codifica al menos un operón, o una parte de un operón.
De manera más preferida, tal operón codifica para la totalidad o una parte de una vía metabólica. El ejemplo 9 describe la construcción de un banco de ADN genómico a partir de una cepa de Streptomyces alboniger y su clonación respectivamente en los cósmidos satélites pOS700I y pOS7000R. Se ha mostrado, de acuerdo con la invención, que el banco de ADN realizado en el vector integrativo pOS700I nueve clones contienen las secuencias nucleotídicas emparentadas con el operón responsable de la vía de biosíntesis de la puromicina. De igual manera, se han podido identificar en el seno del banco de ADN realizado en el vector duplicativo pOS700R, doce clones que contienen las secuencias nucleotídicas del operón responsable de la vía de la biosíntesis de la puromicina. En particular, ciertos cósmidos integrativos y duplicativos de los bancos realizados actualmente, después de la digestión por las endonucleasas de restricción Clal y EcoRV, un fragmento de un tamaño de 12 kb susceptible de contener la totalidad de las secuencias del operón responsable de la vía de biosíntesis de la puromicina. Así, de acuerdo con otro aspecto, un ácido nucleico de acuerdo con la invención contiene, al menos en parte, secuencias nucleotídicas del operón responsable de la vía de biosíntesis de la puromicina. j¿. AA^»f^# -j--tt*fe*--*a-» ^--*-.-.**^.*-'**.***.**..*. *..***.i*?^^...*í*»,á*f fi^^ ^^?*.? El ejemplo 2, a continuación describe la construcción de un banco de ADN de acuerdo con un procedimiento de acuerdo con la invención en un vector pBluescript SK a partir de suelo contaminado por lindano. Los vectores recombinantes han sido transfectados en las células de Escherichia coli DH10B, después las células transformadas son cultivadas en un medio de cultivo apropiado en presencia de lindano. Un tamizado de los clones de las células transformadas del banco ha permitido mostrar que sobre 10,000 clones tamizados, 35 de entre ellos presentan un fenotipo de degradación de lindano. La presencia del gen linA en estos clones se ha podido confirmar por amplificación PCR gracias a los cebadores específicos de este gen. Así, de acuerdo con otro aspecto, la invención se relaciona igualmente con un ácido nucleico que contiene una secuencia nucleotídica de la vía metabólica que provoca la biodegradación de lindano. Esta, por lo tanto, claramente demostrado, como se describe anteriormente, que un procedimiento de preparación de una colección de ácidos nucleicos a partir de una muestra de suelo que contiene organismos de acuerdo con la invención, así como un procedimiento de preparación de una colección de vectores recombinantes que contengan los ácidos nucleicos constitutivos de la colección de ácidos nucleicos citados anteriormente, es totalmente apta para el aislamiento y la JhlÉáir irtlití''- H^^-'-'^'rtfH' •' ' * - .-^..^- ^^*^*a^-^--f^ caracterización de las secuencias nucleotídicas incluidas en un operón. Una demostración suplementaria de la aptitud de un procedimiento de acuerdo con la invención para la identificación de las secuencias nucleotídicas codificantes implicadas en una vía de biosíntesis regulada bajo la forma de un operón, se describe además posteriormente: se trata de la clonación y de la caracterización de secuencias que codifican para los policétido sintasas implicados en la vía de biosíntesis de los policétidos, que están emparentados con una familia de moléculas donde ciertos representantes son de interés terapéutico mayor, en particular antibiótico. La presente invención tiene, por lo tanto, por objeto un ácido nucleico constitutivo de una colección de ácidos nucleicos de acuerdo con la invención, caracterizado en que comprende la totalidad de una secuencia nucleotídica que codifica para un polipéptido. De acuerdo con un primer aspecto, un ácido nucleico constitutivo de una colección de ácidos nucleicos de acuerdo con la invención es de origen procariote. De acuerdo con un segundo aspecto, un ácido nucleico constitutivo de una colección de ácidos nucleicos de acuerdo con la invención, proviene de una bacteria o de un virus . ***?****t***..** **?**.***^,^.í***,*, ****?..*. ? ¡-¿ i De acuerdo con un tercer aspecto, un ácido nucleico constitutivo de una colección de ácidos nucleicos de acuerdo con la invención es de origen eucariote. En particular, tal ácido nucleico está 5 caracterizado en que proviene de un hongo, de una levadura, de una planta o de un animal.
CARACTERIZACIÓN MOLECULAR DE LA COLECCIÓN DE ÁCIDOS NUCLEICOS EXTRAÍDOS DEL SUELO Ifl Con el fin de superar los numerosos inconvenientes técnicos de los métodos de caracterización de los bancos de ADN extraídos y purificados a partir de una muestra del medio ambiente, que se han descrito en la parte de la descripción relativa al estado de la técnica, la solicitante ha puesto a 15 punto un procedimiento simple y confiable que permite caracterizar cualitativamente y semicuantitativamente los ácidos nucleicos obtenidos a partir del procedimiento descrito anteriormente. El procedimiento de acuerdo con la invención, 0 consiste así de amplificar universalmente un fragmento de 700 pb localizado en el interior de una secuencia de ADN ribosomal del tipo 16 S, después hibridar el ADN amplificado con una sonda oligonucleotídica de especificidad variable, y finalmente comparar la intensidad de hibridación de la Jlgr muestra con respecto a una escala patrón externa del ADN de secuencia o de origen conocido. La amplificación previa a la hibridación con la sonda oligonucleotídica permite cuantificar los géneros o las 5 especies de microorganismos poco abundantes. Además, la amplificación por los cebadores universales permite, al momento de la hibridación, utilizar una gran serie de sondas oligonucleotídicas. Así, la invención tiene además por objeto un 10 procedimiento de determinación de la diversidad de ácidos nucleicos contenidos en una colección de ácidos nucleicos, y más particularmente de una colección de ácidos nucleicos que provienen de una muestra del medio ambiente, de preferencia una muestra del suelo, el procedimiento comprende las etapas 15 siguientes: poner en contacto los ácidos nucleicos de la colección de ácidos nucleicos a probarse con un par de cebadores oligonucleotídicos que hibpdan cualquier secuencia de ADN ribosomal 16 S bacteriana; 20 - realización de al menos tres ciclos de amplificación; detección de los ácidos amplificados con ayuda de una sonda oligonucleotídica de una pluralidad de sondas oligonucleotídicas, cada sonda se híbrida específicamente con í*??**L?ité*Á?Í*l-**.*t***. ******** una secuencia de ADN ribosomal 16 S común a un reino, orden o subclase o un género bacteriano; dado el caso, comparar los resultados de la etapa de detección anterior con los resultados de detección, con la ayuda de la sonaa o de la pluralidad de sondas de ácidos nucleicos de secuencia conocida que constituyen una escala patrón. De manera preferida, un primer par de cebadores que se hibridan con las regiones universalmente conservadas del gen del ARN ribosomal 16 S, está constituido respectivamente de los cebadores FGPS 612 (SEQ ID NO 12) y FGPS 669 (SEQ ID NO 13) . Un segundo modo de realización de un par de cebadores preferido de acuerdo con la invención, está constituido de un par de cebadores universales 63 f (SEQ ID NO 22) y 1387r (SEQ ID NO 23) . De acuerdo con un modo particular de realización de un procedimiento de determinación de los ácidos nucleicos de una colección de ácidos nucleicos, la etapa de amplificación con la ayuda de un par de cebadores universales puede realizarse sobre una colección de vectores recombinantes en cada uno de los cuales ha sido insertado un ácido nucleico de la colección de ácidos nucleicos considerada, previamente la etapa de hibridación con las sondas oligonucleotídicas específicas de un reino, un orden, una subclase o de un género bacteriano particular. Tal procedimiento de determinación de la diversidad de ácidos nucleicos contenidos en una colección es 5 particularmente aplicable a las colecciones de ácidos nucleicos obtenidas de acuerdo a las enseñanzas de la presente descripción. Así, el ejemplo 3 detalla un procedimiento de preparación de una colección de ácidos nucleicos a partir de 0 una muestra de suelo que contiene organismos, que comprende una etapa de extracción indirecta del ADN por dispersión de una muestra de suelo previamente a la separación de las células sobre un gradiente de Nycodenz, lisar las células, después la purificación del ADN sobre un gradiente de cloruro 5 de cesio. La colección de ácidos nucleicos así obtenida se utiliza tal cual o bajo la forma de insertos en los vectores del tipo cósmido en un procedimiento de amplificación con la ayuda de los cebadores universales del ADNr 16 S citados u anteriormente, después los ADN amplificados son sometidos a una etapa de detección con la ayuda de sondas oligonucleotídicas de secuencias SEQ ID NO 14 a SEQ ID NO 21 que son presentadas en al tabla 4. Los resultados muestran que un procedimiento de b preparación de una colección de ácidos nucleicos a partir de ** *** ** ***»0** **Jk*f**** * a-a..¿. **** «fcái Ja una muestra de suelo que contiene organismos de acuerdo con la invención, permite acceder al ADN de más del 14% de la microflora telúrica total, es decir 2 x 108 células por gramo de suelo, cuando la microflora total cultivable no representa más que apenas el 2% de la población microbiana total. Con el fin de determinar la diversidad filogenética de una colección de ácidos nucleicos preparados de acuerdo con la invención, 47 secuencias del ARNr 16S se han aislado y secuenciado. Estas secuencias corresponden respectivamente a las secuencias nucleotídicas SEQ ID NO 60 a SEQ ID NO 106. Los ácidos nucleicos que comprenden las secuencias SEQ ID NO 60 a SEQ ID NO 106 forman igualmente parte de la invención, así como los ácidos nucleicos que poseen al menos 99%, de preferencia 99.5% o 99.8% de identidad de ácidos nucleicos con los ácidos nucleicos que comprenden las secuencias SEQ ID NO 60 a SEQ ID NO 106. Tales secuencias pueden utilizarse especialmente como sondas para tamizar los clones de un banco de ADN e identificar así aquellos, entre los clones del banco, que contienen tales secuencias, estas secuencias son susceptibles de estar en la proximidad de las secuencias codificantes de interés, tales como las secuencias que codifican para las enzimas implicadas en la vía de biosíntesis de metabolitos antibióticos, por ejemplo los policétidos .
La comparación de las secuencias de ARNr 16S a partir de un banco de ADN realizado de acuerdo con la invención con las secuencias almacenadas en la base de datos RDP (Maidak B. L., Colé J. R. , Parker C. T., Garrity G. M., Larsen N., Li B., Lilburn T. G., McCaughey, M. J. , Olsen G. J., Overbeek R., Pramanik S., Schmidt T. M. , Tiedje J. M. , Woese C. R. (1999) "A new projet of the RDP (Ribosomal Datábase Project)" Nucleic Acids Research Vol. 27: 171-173), han permitido determinar que los ácidos nucleicos contenidos en una colección de ácidos nucleicos de acuerdo con la invención provienen de a-proteobacterias, de ß-proteobacterias, de d-proteobacterias, de ?-proteobacterias, de actinomicetos, así como de un género emparentado con acidobacterium. Estos resultados, presentados en la tabla 1 , así como por el árbo.1 filogenético de la figura 7, toman en cuenta la gran diversidad filogenética de los ácidos nucleicos contenidos en un banco de ADN preparado de acuerdo con el procedimiento de acuerdo con la invención.
VECTORES DE CLONACIÓN Y/O DE EXPRESIÓN Cada uno de los ácidos nucleicos contenidos en una colección de ácidos nucleicos preparados de acuerdo con la invención, puede insertarse en un vector de clonación y/o de expresión . i**,^..**^* * * aauij ^.^^a^.^--^ttfeA^Ja^a iteiJiaafci Para este fin, todos los tipos de vectores conocidos en el estado de la técnica pueden utilizarse, tales como los vectores virales, los fagos, los plásmidos, los fagémidos, los cósmidos, los fósmidos, los vectores del tipo BAC, los bacteriófagos Pi, los vectores del tipo BAC, los vectores del tipo YAC, los plásmidos de levadura o incluso cualquier otro vector conocido del estado de la técnica por el experto en la materia. Recurriremos ventajosamente, de acuerdo con la invención, a los vectores que permitan una expresión estable de los ácidos nucleicos de un banco de ADN. Para este fin, tales vectores incluyen, de preferencia, las secuencias de regulación de la transcripción que están localizadas en fase ("enlazadas de manera operable") , con el inserto genómico de manera que permite el inicio y/o la regulación de la expresión de al menos una parte del inserto de ADN. Resulta de lo anterior, que la invención se relaciona también con un procedimiento de preparación de una colección de vectores recombinantes caracterizada en que los ácidos nucleicos obtenidos en la etapa II- (iv), o en cualquier otra etapa I-(c) posterior de un procedimiento de preparación de una colección de ácidos nucleicos a partir de una muestra de suelo, que contiene organismos de acuerdo con la invención, son insertados en un vector de clonación y/o de expresión.
Previamente a su inserción en un vector de clonación y/o de expresión, los ácidos nucleicos constitutivos de una colección de ácidos nucleicos de acuerdo con la invención, pueden separarse en función de su tamaño, por ejemplo por electroforesis sobre un gel de agarosa, dado el caso después de la digestión con ayuda de una endonucleasa de restricción. De acuerdo con otro aspecto, el tamaño promedio de los ácidos nucleicos constitutivos de una colección de ácidos nucleicos de acuerdo con la invención, puede volverse de un tamaño sensiblemente uniforme para la aplicación de una etapa de ruptura física previamente a su inserción en el vector de clonación y/o de expresión. Tal etapa de ruptura física o mecánica de los ácidos nucleicos puede consistir en pasos sucesivos de estos últimos, en solución, en un canal metálico de aproximadamente 0.4 mm de diámetro, por ejemplo, el canal de una aguja de jeringa que tenga tal diámetro. El tamaño promedio de los ácidos nucleicos puede, en este caso, estar comprendido entre 30 y 40 kb de longitud. La construcción de los vectores preferidos de acuerdo con la invención se esquematiza en las figuras 25 (cósmido integrativo conjugativo) y 26 (BAC integrativo) . Los vectores de clonación y/o de expresión que pueden ser utilizados ventajosamente para los fines de ¿^^^^^^^^^M^i ^g^iu^^^^iMd inserción de los ácidos nucleicos contenidos en una colección o banco de ADN de acuerdo con la invención, son especialmente los vectores descritos en la patente europea No. EP-0 350 341 y en la patente US No. 5 688 689, tales vectores están adaptados especialmente para la transformación de cepas de actinomicetos . Tales vectores contienen, aparte de una secuencia de ADN del inserto, una secuencia de unión att, así como una secuencia de ADN que codifica para una integrasa (secuencia int) funcional en la cepas de actinomicetos. Sin embargo, se ha observado de acuerdo con la invención, que ciertos vectores de clonación y/o de expresión presentan inconvenientes en que su capacidad funcional teórica no ha sido alcanzada en la práctica. Así, parece que el sistema de integración contenido en los vectores del estado de la técnica, y especialmente en los vectores descritos en la patente europea no. EP 0 350 41 no permiten en realidad una buena integración del inserto de ADN del banco en el seno del cromosoma bacteriano. Partiendo de la hipótesis de que los déficit funcionales de integración de tales vectores en el seno del cromosoma bacteriano se deben a una falla en la expresión del gen de la integrasa presente en estos vectores, la solicitante primero buscó aumentar la expresión del gen de la integrasa sustituyendo el promotor de la transcripción inicial con un promotor de la transcripción susceptible de aumentar significativamente el número de transcritos de la integrasa . Los resultados han sido decepcionantes, y la función de integración en el cromosoma de estos vectores no se ha mejorado. De manera sorprendente, se ha mostrado, de acuerdo con la invención que las dificultades de expresión de la integrasa contenidas en esta familia de vectores integrativos no se sitúa al nivel de la cantidad de expresión de los transcritos, sino a nivel de su estabilidad. De acuerdo con una segunda hipótesis, la solicitante ha podido mostrar que la falla en la estabilidad de los transcritos de integrasa es causada por las deficiencias en la terminación de la transcripción del ARN mensajero correspondiente., La solicitante ha entonces insertado un sitio terminador colocado corriente debajo de la secuencia que codifica para la integrasa del vector, de manera que obtiene un ARN mensajero de tamaño determinado. La inserción de una señal de terminación adicional corriente abajo de la secuencia nucleotídica que codifica para la integrasa del vector, ha permitido la obtención de una familia de vectores integrativos del tipo cósmido y del tipo BAC.
Ni rlÉ*A'i'A^^--u--"^-iiÉiíi»ií'lr?i? mi tt irrti tiitt De manera preferida, el sitio terminador está colocado corriente abajo del sitio de unión att. Además, la solicitante ha puesto a punto novedosos vectores conjugativos y novedosos vectores duplicativos del tipo cósmido y novedosos vectores conjugativos del tipo BAC que pueden utilizarse ventajosamente para la inserción de los ácidos nucleicos constitutivos de una colección de ácidos nucleicos preparados de acuerdo con el procedimiento de la invención. Cuando la inserción de los fragmentos de ADN de tamaño promedio es buscada, se utilizan de manera preferida vectores del tipo cósmido, capaces de recibir insertos que tienen un tamaño máximo de aproximadamente 50 kb . Tales vectores cosmídicos, están particularmente adaptados para la inserción de ácidos nucleicos constitutivos de una colección de ácidos nucleicos obtenida de acuerdo con el procedimiento de la invención, que comprende una primer etapa de extracción directa del ADN por lisado mecánico de los organismos contenidos en la muestra de suelo inicial. Cuando la inserción de ácidos nucleicos de gran tamaño, en particular ácidos nucleicos de un tamaño superior a 100 kb, incluso superior a 200, 300, 400, 500 ó 600 kb se busca, se recurrirá entonces de manera preferida a los vectores del tipo BAC capaces de recibir los insertos de ADN de tal tamaño.
Tales vectores del tipo BAC están particularmente adaptados para la inserción de los ácidos nucleicos constitutivos de una colección de ácidos nucleicos obtenida de acuerdo al procedimiento de acuerdo con la invención, en la cual la primera etapa está constituida de una extracción indirecta del ADN por separación previa de los organismos contenidos en la muestra del suelo inicial y la eliminación de los macroconstituyentes de dicha muestra de suelo. En particular, los vectores del tipo BAC son aplicados de manera ventajosa para la inserción de ácidos nucleicos de gran tamaño que contienen, al menos parcialmente, la secuencia nucleotídica de un operón. Así, el procedimiento de preparación de una colección de vectores recombinantes de clonación y/o de expresión de acuerdo con la invención está caracterizada además en que el vector de clonación y/o es del tipo plásmido. De acuerdo con otro aspecto, tal procedimiento está caracterizado en que el vector de clonación y/o de expresión es del tipo cósmido. De acuerdo con un primer aspecto, se puede tratar de un cósmido duplicativo en E . coli e integrativo en Streptomyces . Un vector cosmídico más preferido que responde a tal definición es el cósmido pOS7001 descrito en el ejemplo 3. - *****t* * **ia>- "- - ->« ***.***-*-*. «**«•**- **.* ***. ** De acuerdo con otro aspecto, el vector cosmídico es conjugativo e integrativo en Streptomyces . De manera general, los vectores conjungativos del tipo cósmido o del tipo BAC, que comprenden en sus secuencias nucleotídicas un motivo reconocido por la maquinaria enzimática celular llamada "origen de conjugación", son utilizados cada vez que se quiere evitar recurrir a las técnicas de transformación pesadas y poco automatizables . Por ejemplo, la transfección de los vectores inicialmente hospedados por las células de E. col i en las células de Streptomyces necesitan clásicamente una etapa de recuperación del vector recombinante contenido en las células de Escheri chia col i , y su purificación previa a la etapa de transformación de protoplastos de Streptomyces . Se admite comúnmente que una transfección de un conjunto de 1000 clones de Escheri chia coli en Streptomyces, requiere la obtención de aproximadamente 8000 clones para cada clon de E . coli que tenga una oportunidad de ser representado. A la inversa, una etapa de transfección por conjugación de un vector hospedado por E. coli hacia las células de Streptomyces, necesita el mismo número de clones de cada uno de los microorganismos, la etapa de conjugación tiene lugar "clon a clon" y no comprende además las dificultades técnicas ligadas a la etapa de transferencia del tMif~ * &f** material genético por transformación de protoplastos, por ejemplo en presencia de polietilen glicol. Con el fin de optimizar la construcción del banco de ADN en Streptomyces, se ha puesto a punto de acuerdo con la invención, en novedosos vectores conjugativos del tipo cósmido y del tipo BAC de naturaleza que permite una eficiencia máxima de la etapa de conjugación. Especialmente, los vectores novedosos conjugativos de acuerdo con la invención han sido construidos colocando un gen marcador de selección en el extremo del ADN del vector que es transferido a la bacteria receptora en último lugar. Este perfeccionamiento de los vectores conjugativos del estado de la técnica permite seleccionar positivamente únicamente las bacterias receptoras que hayan recibido la totalidad del -ADN del vector y, en consecuencia, la totalidad del ADN del inserto de interés. Los cósmidos conjugativos e integrativos en Streptomyces preferidos de acuerdo con la invención son los cósmidos pOSV303, pOSV306 y pOSV307, descritos en el ejemplo 5. De acuerdo con otro aspecto, un procedimiento de preparación de una colección de vectores recombinantes de acuerdo con la invención se aplica con la ayuda de un cósmido duplicativo a la vez en E. coli y en Streptomyces. Tal cósmido es ventajosamente el cósmido pOS 700R descrito en el ejemplo 6. De acuerdo con aún otro aspecto, el procedimiento anterior puede aplicarse con un cósmido duplicativo en E. coli y Streptomyces y conjugativo en Streptomyces . Tal cósmido duplicativo y conjugativo puede obtenerse a partir de un cósmico duplicativo de acuerdo con la invención, por inserción de un origen de transferencia apropiado, tal como el RK2, como se describe en el ejemplo 5 ara la construcción del vector pOSV303. De acuerdo con otro modo de realización ventajoso del procedimiento de preparación de una colección de vectores recombinantes de acuerdo con la invención, se recurre a un vector de clonación y/o del tipo BAC. De acuerdo con un primer aspecto el vector del tipo BAC es integratívo y conjugativo en Streptomyces . De manera más preferida, tal vector BAC integrativo y conjugativo en Streptomyces es el vector pOSV 403 descrito en el ejemplo 8, o incluso los vectores BAC pMBD-1, pMBD-2, pMBD-3, pMBD-4, pMBD-5 y pMBD-6, descritos en el ejemplo 15. La invención tiene por otro objeto un vector recombinante caracterizado en que se elige entre los vectores recombinantes siguientes: "•j"**^**f"H "f " a) un vector que comprende un ácido nucleico constitutivo de una colección de ácidos nucleicos de acuerdo con la invención; b) un vector tal como el obtenido de acuerdo con un procedimiento que elimina cualquier recurso de la acción de una endonucleasa de restricción sobre el fragmento de ADN a insertarse, tal como el descrito anteriormente. De manera más preferida, la invención es relativa igualmente con un vector elegido entre los vectores siguientes: - el cósmido pOS7001; - el cósmido pOSV303; - el cósmido pOSV306; - el cósmido pOSV307; - el cósmido pOS700R; - el vector BAC pOSV403; - el vector BAC pMBD-1; - el vector BAC pMBD-2; - el vector BAC pMBD-3; - el vector BAC pMBD-4; - el vector BAC pMBD-5; - el vector BAC pMBD-6; La invención es relativa además, con una colección de vectores recombinantes tales como los obtenidos de acuerdo ^l^A<tJ«*^^»-''--.itJ ..a,...^t...,jna«fcAi....^te . ^* **. *?*^* *** **¿v*a t t^^ lt,¡éiAti..at-.. con cualquiera de los procedimientos de acuerdo con la invención.
Procedimiento de preparación de un vector recombinante de clonación y/o de expresión de acuerdo con la invención Las técnicas convencionales de inserción de ADN en el seno de un vector con el fin de preparar un vector de clonación y/o expresión recombinante recurren de manera clásica a una primera etapa en el curso de la cual una endonucleasa de restricción es incubada a la vez con ADN a insertarse y con el vector receptor, creando así los extremos compatibles entre el ADN a insertarse y el ADN del vector que permita el montaje de los dos ADN antes de una etapa de ligación final que permite la obtención del vector recombinante . Sin embargo, tal técnica convencionalmente presenta inconvenientes notables, particularmente cuando se busca la inserción de ácidos nucleicos de gran tamaño en un vector de clonación y/o de expresión. En efecto, la acción previa de una enzima de restricción sobre los fragmentos de ADN destinados a ser insertados en un vector es susceptible de reducir notablemente el tamaño de este ADN previamente a su inserción en el vector. Basta decir que una reducción significativa del ****?*s****M»~*- i*** * *********** ** *•*************-** *.**?s****A -3 tamaño de ADN previamente a su inserción sobre un vector es una situación particularmente desfavorable cuando se busca la clonación de los fragmentos de ADN de gran tamaño, susceptibles de contener el conjunto de las secuencias codificantes y, dado el caso, igualmente las secuencias reguladoras de un operón cuya expresión constituye una vía de biosíntesis completa de un metabolito de interés industrial, y más particularmente de un compuesto de interés terapéutico. Para remediar los inconvenientes técnicos de la técnica anterior, se ha puesto a punto de acuerdo con la invención dos procedimientos de preparación de un vector recombinante de clonación y/o de expresión que no necesitan recurrir a una endonucleasa de restricción sobre el ADN a insertarse previamente a su introducción en el seno del vector. Tales procedimientos están, por consiguiente adaptados a la clonación de fragmentos largos de ADN susceptibles de contener, al menos parcialmente, el conjunto de las secuencias codificantes y, dado el caso, igualmente las secuencias reguladoras, de un operón completo responsable de una vía de biosíntesis. De acuerdo con un primer aspecto, un procedimiento de preparación de un vector recombmante de clonación y/o de expresión de acuerdo con la invención, está caracterizado en que la inserción de un ácido nucleico en el vector de clonación y/o de expresión, comprende las etapas siguientes: * *L* *s?****** *iM.?¡?*j? *jfi - abrir el vector de clonación y/o de expresión a un sitio de clonación elegido, con la ayuda de una endonucleasa de restricción apropiada; - agregar un primer ácido nucleico homopolimérico al extremo 3' libre del vector abierto,' - agregar un segundo ácido nucleico homopolimérico, de secuencia complementaria al primer ácido nucleico homopolimérico, al extremo 3' libre del ácido nucleico a insertarse en el vector; - montar el ácido nucleico del vector y el ácido nucleico por hibridación del primer y del segundo ácido nucleico homopolimérico de secuencias complementarias una por la otra; - cerrar el vector por ligación. Tal procedimiento se describe en los ejemplos 10 y 13 a continuación. De manera ventajosa, el procedimiento anterior puede comprender las características siguientes, de manera aislada o en combinación: - el primer ácido nucleico homopolimérico es de secuencia poli (A) o poli (T) ; - el segundo ácido nucleico homopoiimérico es de secuencia poli (T) o poli (A) ; De manera más preferida, los ácidos nucleicos homopoliméricos tienen una longitud comprendida entre 25 y .f**--.,:-*.*--**^^*- ****^-.***!**!*.!,..!. : ?***.**ía**m***j*. ****t?iiát*i**'f*ff¡*^ 100 bases nucleotídicas, de preferencia entre 25 y 70 bases nucleotídicas . El procedimiento de preparación de un vector recombinante de clonación y/o de expresión descrito anteriormente está adaptado particularmente para la construcción de bancos de ADN en los vectores del tipo BAC. Así, de acuerdo con un modo de realización ventajoso del procedimiento de preparación de un vector recombinante descrito anteriormente, dicho procedimiento está caracterizado además en que el tamaño del ácido nucleico a insertarse es de al menos 100 kb, y de preferencia de al menos 200, 300, 400, 500 o 600 kb. Tal procedimiento de preparación está por lo tanto, particularmente adaptado para la inserción de ácidos nucleicos contenidos en una colección de ácidos nucleicos obtenidos de acuerdo con el procedimiento de la invención. Con el fin de permitir la inserción de fragmentos de ADN de gran tamaño en los vectores de clonación y/o de expresión, se ha puesto a punto de acuerdo con la invención, un segundo procedimiento que ha permitido eliminar recurrir a la acción de una endonucleasa de restricción sobre el ADN destinado a ser insertado en el seno del vector. Tal procedimiento de preparación de un vector recombinante de clonación y/o expresión de acuerdo con la invención, está caracterizado en que la etapa de inserción de i * *&.-. <Sñn ..********************* . ****?*?*¡*t***-* -mu . , ************ un ácido nucleico en dicho vector de clonación y/o de expresión comprende las etapas siguientes: -creación de puntas libres sobre los extremos del ácido nucleico de la colección por eliminación de las secuencias 3' salientes y reemplazando las secuencia 5' salientes; -abertura del vector de clonación y/o de expresión en un sitio de clonación elegido con ayuda de una endonucleasa de restricción apropiada; -adición de adaptadores oligonucleotídicos complementarios ; -creación de puntas libres en los extremos del ácido nucleico del vector por eliminación de las secuencia 3' salientes y reemplazando las secuencia 5' salientes, después la desfosforilación de los extremos 5' con el fin de evitar una recirculación del vector; -inserción del ácido nucleico de la colección en el vector por ligación. De manera preferida, la eliminación de las secuencias 3' salientes se realiza con la ayuda de una exonucleasa, tal como la enzima de Klenow. De manera preferida, el reemplazo de las secuencia 5' salientes se realiza con la ayuda de una polimerasa, y de manera más preferida de la polimerasa T4, en presencia de cuatro nucleótidos trifosfatos. t** ^!*********** ***. !** Un procedimiento de preparación de un vector recombinante de clonación y/o expresión por eliminación de las secuencia 3' salientes y el reemplazo de las secuencia 5' salientes tal como el descrito anteriormente, está adaptado particularmente para la construcción de bancos de ADN a partir de vectores del tipo cósmido. Tal procedimiento de obtención de vectores recombinantes se describe en el ejemplo 12. En un modo particular de preparación de un vector recombinante de acuerdo con la invención, los oligonucleótidos que comprenden uno o varios sitios de restricción raros son agregados sobre el vector al nivel del sitio de clonación del ADN a insertarse, de acuerdo con las enseñanzas del ejemplo 10. Esta visión de oligonucleótidos facilita la recuperación posterior de los insertos sin la ruptura de éstos últimos.
CÉLULAS HUÉSPED Aunque cualquier tipo de células huésped puede ser utilizado para la transfección o la transformación con un ácido nucleico o un vector recombinante de acuerdo con la invención, especialmente una célula huésped procariote o. eucariote, se utilizará de preferencia células huésped cuyas características fisiológicas, bioquímicas y genéticas estén bien caracterizadas, fácilmente cultivables a gran escala y hL «A4JJM*t^. gMM <Mi<|iri|^^tJ,.,,a,„,.^„ * . i**** *»»**! * ************ ,? "donde las condiciones de cultivo para la producción de metabolitos sean bien conocidas. De manera preferida, la célula huésped receptora en un ácido nucleico o de un vector recombmante de acuerdo con la invención, está filogenéticamente próxima a los organismos donadores contenidos inicialmente en una muestra del medio ambiente de la cual los ácidos nucleicos son originarios. De manera más preferida, una célula huésped de acuerdo con la invención debe poseer un uso de los codones similar, o al menos próximo, al de los organismos donadores presentes inicialmente en la muestra del medio ambiente, particularmente la muestra de suelo. El tamaño de los fragmentos de ADN susceptible de portar las secuencias nucleotídicas de interés buscadas puede ser variable. Así, las enzimas codificadas por los genes de tamaño promedio de 1 kb podrán expresarse a través de insertos de tamaño pequeño mientras que la expresión de metabolitos secundarios necesitarán el mantenimiento en el organismo huésped de fragmentos de tamaño bien superior, por ejemplo de 40 kb a más de 100 kb, 200 kb, 300 kb, 400 kb o 600 kb. Así, las células huésped de Eschep chia coli constituyen una elección privilegiada para la clonación de grandes fragmentos de ADN. í"¡Ht-jf"H'""''~* ' *jg f '--"" « **** *-*. ***** De manera más preferida, se recurrirá al uso de la cepa de Escherichia coli designada DH10B y descrita por Shizuya et al; (1992) para- la cual los protocolos de clonación en los vectores BAC se han optimizado. Sin embargo, otras cepas de Escherichia coli pueden utilizarse ventajosamente para la construcción de un banco de ADN de acuerdo con la invención, tales como las cepas E. coli Sure, E. coli DH 5 a, o incluso E. coli 294 (ATCC N°31446). Además, la construcción de ADN por transfección de células de E. coli con los vectores recombinantes de acuerdo con la invención es igualmente posible, la expresión de genes de diversos procariotes tales como Bacill us , Thermotoga , Corynebacterium , Lactobacillus o Clostridi um, se ha descrito en la solicitud PCT N°WO 99/20799. De manera -general, las células huésped de E. coli pueden en cualquier caso, constituir los huéspedes transitorios en los cuales los vectores recombinantes de acuerdo con la invención podrán mantenerse con una gran eficacia, el material genético puede ser manipulado fácilmente y archivado de manera estable. Con el objeto de expresar la diversidad molecular más grande posible, otras células huésped podrán aplicarse de igualmente de manera ventajosa tales como las células de ******* ********l******* y-'f l^ftf^ñtÍ* ÍJ^í¿^?-t J?M^ai^ ?*l¡ Bacill us , Pseudomonas , Streptomyces , Myxococcus , Aspergill us nidulans o incluso Neurospora crassa . Se ha mostrado además, de acuerdo con la invención, que las células de Streptomyces lividans pueden utilizarse con éxito y constituyen los sistemas de expresión complementarios a Escherichia coli . Streptomyces lividans constituye un modelo para el estudio de la genética de Strepto/pyces. y se ha utilizado igualmente como un huésped de expresión heteróloga de numerosos metabolitos secundarios. Streptomyces lividans posee en común con otros actinomicetos tales como Streptomyces coeli color, Streptomyces griseus , Streptomyces fradiae, así como Streptomyces griseochromogenes, las moléculas precursoras y los sistemas de regulación necesarios para la expresión da toda o parte de las vías de biosíntesis compleja, tales como por ejemplo la vía de biosíntesis de los policétidos o incluso la vía de biosíntesis de los polipéptidos no ribosómicos que representan las clases de moléculas de estructuras muy diversas. Streptomyces lividans presenta igualmente la ventaja de aceptar el ADN extraño con eficiencias de transformación elevadas. Así, la invención se relaciona también con una célula huésped recombinante que comprende un ácido nucleico 1**1.***^ .»^.^**** ^..***,^^**,^*^^^********* de acuerdo con la invención, constitutiva de ácidos nucleicos preparada de acuerdo a un procedimiento de la invención, o incluso una célula huésped recombinante que comprende un vector recombinate tal como el definido anteriormente, De acuerdo con un primer aspecto se puede tratar de una célula huésped recombinante de origen procariote o eucariote . Ventajosamente, una célula recombinante de acuerdo con la invención es una bacteria, y de manera más preferida una bacteria elegida entre E. coli y Streptomyces . De acuerdo con otro aspecto, una células huésped recombinante de acuerdo con la invención está caracterizada en que se trata de una levadura o incluso de un hongo filamentoso. La invención trata igualmente con una colección de células huésped recombinantes, cada una de las células huésped constituye la colección que comprende un ácido nucleico que proviene de una colección de ácidos nucleicos realizada de acuerdo con un procedimiento de preparación de ácidos nucleicos a partir de una muestra de suelo que contiene los organismos, tales como los descritos anteriormente . La invención es relativa igualmente a una colección de células huésped recombinantes, cada una de las células *** ?*?a****/ --- ~*-i^^f*^**^ ^-^**^^^?.^^f^*-? . if-A-. f »i ?%- huésped constitutivas de la colección que comprende un vector recombinante de acuerdo con la invención. Debido al gran tamaño de los insertos, necesario tener una eficiencia máxima de transformación. Para este objeto, una cepa receptora de Streptomyces lividans que expresa la integrasa de pSAM2 de manera constitutiva con el fin de favorecer la integración específica del sitio del vector, se prefiere. Para esta, el gen Int bajo el control de un promotor fuerte se integra en el cromosoma. La sobreproducción de integrasa no induce los fenómenos de excisión (Raynal et al., 1998). La producción de un metabolito novedoso a partir del inserto podrá ser tóxico para Streptomyces si el inserto no contiene los genes de resistencia al antibiótico producido si este gen es poco o no expresado. La capacidad de diferentes genes que permiten a Streptomyces ambofa ciens resistir al antibiótico, se estudia (Gourmelen et al., 1998; Pernodet et al., 1999). Ciertos de estos genes que codifican los transportadores del tipo ABC susceptibles de conferir un gran espectro de resistencia. Estos genes pueden ser introducidos y sobreexpresados en la cepa huésped de Streptomyces lividans . A la inversa, una cepa hipersensible a los antibióticos puede utilizarse (Pernodet et al., 1996), con el fin de detectar en el banco la presencia de genes de ******************** *ßi* resistencia. En efecto, en los microorganismos productores de antibióticos, estos genes de resistencia están con frecuencia asociados a los genes de la vía de biosíntesis del antibiótico. La selección de clones resistentes puede 5 permitir efectuar simplemente una primera selección antes de las pruebas más complejas de detección de un metabolito novedoso producido por el clon.
AISLAMIENTO Y CARACTERIZACIÓN DE SECUENCIAS NUCLEOTIDICAS 10 NOVEDOSAS QUE CODIFICAN PARA LAS POLICETIDOS SINTASAS . De acuerdo con la invención, una colección de células huésped recombinantes se ha obtenido después de la transección de las células huésped por una colección de vectores recombinantes que contienen cada uno un incerto de 15 ácido nucleico que _ provienen de una colección de ácidos nucleicos preparada de acuerdo con el procedimiento de acuerdo con la invención. De manera más precisa, los fragmentos de ADN obtenidos de acuerdo con el procedimiento de la invención, en 20 la cual se aplica una etapa de extracción indirecta del ADN de los organismos contenidos en la muestra de suelo, se ha clonado primero, en el cosmido integrativo pOS7001. La etapa de inserción de los fragmentos de ADN en el cosmido integrativo POS7001 se ha realizado de acuerdo con 25 el procedimiento de la invención en la cual las colas de los polinucleótidos homopoliméricos poli (A) y poli (T) se han agregado al extremo 3' respectivamente del ácido nucleico del vector y los fragmentos de ADN a insertarse. Los vectores recombinantes así construidos se encasillan en las cabezas del fago lambda y los fagos obtenidos son utilizados para infectar las células de E. colli de acuerdo con las técnicas bien conocidas por el experto en la materia. Se ha obtenido un banco de aproximadamente 5000 clones de Escheri cha coli . Este banco de clones se ha tamizado con pares de cebadores específicos de una secuencia nucleotídica que codifica para una enzima implicada en la vía de biosíntesis de los policétidos, la enzima PKS del tipo 1, designada también como ß-cetoacil sintasa. Se recuerda aquí que los policétidos constituyen una clase química de una gran diversidad estructural que comprende un número importante de moléculas de interés farmacéutico tales como la tilosina, la monensina, la vermectina, la eritromicina, la doxorrubicina o incluso el FK506. Los policétidos son sintetizados por condensación de las moléculas de acetato bajo la acción de enzimas llamadas policétidos sintasas (PKS) . Existen dos tipos de policétidos sintasas. Los policétidos sintasas del tipo II están implicadas en general en la síntesis de los antibióticos aromáticos policíclicos y catalizan la condensación de unidades acetato de manera iterativa. Los policétidos sintasas del tipo I están implicadas en la síntesis de policétidos macrocíclicos o macrolidos y constituyen las enzimas moduladoras multifuncionales . Tomando en cuenta su interés terapéutico, existe una necesidad en el estado de la técnica de aislar y caracterizar los policétidos sintasas . novedosas que pueden utilizarse para la producción de compuestos farmacéuticos novedosos, especialmente compuestos farmacéuticos novedosos con actividad antibiótica. El tamizado del banco de clones recombinantes descrito anteriormente con ayuda de cebadores de PCR, amplifica selectivamente las secuencias nucleotídicas que codifican para los policétidos sintasas del tipo I, ha permitido identificar a los clones recombinantes que contienen los insertos de ADN que comprenden una secuencia nucleotídica que codifica a las policétidos sintasas novedosas. Las secuencias nucleotídicas que codifican para estas policétidos sintasas novedosas son referidas como las secuencias SEQ ID N° 33 a SEQ ID N° 44 y SEQ ID N° 115 a SEQ ID N°120.
Un objeto de la invención consiste en un acia© nucleico que codifica para una nueva policétido sintasa I, caracterizada porque comprende una de las secuencias nucleotídicas SEQ ID N° 34 a SEQ ID N° 44 y SEQ ID N° 115 a SEQ ID N° 120. e preferencia, tal ácido nucleico se presenta bajo una forma aislada y/o purificada. La invención se relaciona también con un vector recombinante que comprende un polinucleótido que comprende una de las secuencias SEQ ID N° 34 a SEQ ID N° 44 y SEQ ID N° 115 a SEQ ID N° 120. La invención trata igualmente con una célula huésped recombinante que comprende un ácido nucleico elegido entre los po inucleótidos que comprenden una de las secuencias nucleotídicas SEQ ID N° 34 a SEQ ID N° 44 y SEQ ID N° 115 a SEQ ID N° 120, así como una célula huésped recombinante que comprende un vector recombinante en el cual se inserta un polinucleótido que comprende una de las secuencias nucleotídicas SEQ ID N° 34 a SEQ ID N° 44 y SEQ ID N° 115 a SEQ ID N° 120. De manera ventajosa, los vectores recombinantes que contienen un inserto de ADN que codifican para una policétido sintasa del tipo I novedoso de acuerdo con la invención, son los vectores de clonación y de expresión.
De preferencia, una célula huésped recombinante, tal como la descrita anteriormente es una bacteria, una levadura o incluso un hongo filamentoso. Las secuencias de aminoácidos de las policétidos sintasas novedosas que provienen de organismos contenidos en una muestra de suelo' de la se han deducido las secuencias nucleotídicas SEQ ID N° 34 a SEQ ID N° 44 y SEQ ID N° 115 a SEQ ID N° 120 anteriores. Se trata de polipéptidos que comprenden una de las secuencias de aminoácidos SEQ ID N° 48 a SEQ ID N° 59 y SEQ ID N° 121 a SEQ ID N° 126. La invención se relaciona incluso con policétidos sintasas novedosas que comprenden una secuencia de aminoácidos elegida entre las secuencias SEQ ID N° 48 a SEQ ID N° 59 y SEQ ID N° 121 a SEQ ID N° 126. Forma igualmente parte de la invención la secuencia nucleotídica SEQ ID N° 114 que comprende seis marcos de lectura abiertos, que codifican respectivamente los polipéptidos de la secuencia SEQ ID N° 121 a SEQ ID N° 126. Forma igualmente parte de la invención la secuencia nucleotídica SEQ ID N° 113 del cosmido a26Gl, que contiene la secuencia complementaria de la secuencia SEQ ID N° 114. Se ha extraído y amplificado también de acuerdo con la invención el ADN genómico que proviene da las cepas bacterianas puras, tales como Streptomyces coel i col or (ATCC N° 101.478), Strepto/pyces ambofa ci ens (N R N° 2.420), Streptomyces la ctamandurans (ATTC N° 27.382), Streptomyces rimosus (ATCC N° 109.610), Bacillus subtilis (ATCC N° 6633), o incluso Ba cill us l i cheniformis y Saccharopolyspora erythrea . Una amplificación por PCR del ADN de cada una de las cepas bacterianas descritas anteriormente se efectúa con la ayuda de pares de cebadores específicos de las secuencias nucleicas de la policétido sintasa del tipo I. Así, novedosos genes de las policétido sintasas del tipo I bacterianas, han podido ser aislados y caracterizados. Se trata de las secuencias nucleicas de las secuencias SEQ ID N° 30 a SEQ ID N° 32. La invención tiene por lo tanto por objeto las secuencias nucleotídicas que codifican para las policétido sintasas novedosas del tipo I elegidas entre los polinucleótidos que comprenden una de las secuencias nucleotídicas SEQ ID N° 30 a SEQ ID N° 32. Forman igualmente parte de la invención los vectores recombmantes que comprenden las secuencias nucleotídicas que codifican para las policétidos sintasas novedosas del tipo I definidas anteriormente. La invención se relaciona también con las células huésped recobinantes caracterizadas en que contienen un ácido nucleico que codifica para una policétido sintasa novedosa del tipo I, que comprende una secuencia nucleotídica elegida entre las secuencias SEQ ID N° 30 a SEQ ID N° 32, así como t^a****.**?mt*bM****?*W***?í*^?*iít*l*M las células huésped recombinantes que comprenden un vector recombinante tal como el definido anteriormente. La invención igualmente tiene por objeto los polipétidos codificados por las secuencias que comprenden los ácidos nucleicos SEQ ID N° 30 a 32, y más precisamente los polipéptidos que comprenden las secuencias de aminoácidos SEQ ID N° 47 a SEQ ID N° 50. La invención tiene por objeto además un procedimiento de producción de una policétido sintasa del tipo I de acuerdo con la invención, dicho procedimiento de producción comprende las etapas siguientes: —•obtención de una célula huésped recombinante que comprende un ácido nucleico que codifica para una policétido sintasa del tipo I, que comprende una secuencia nucleotídica elegida entre las secuencias SEQ ID N° 33 a SEQ ID N° 44, SEQ ID N° 30 a SEQ ID N° 32 y SEQ ID N° 115 a SEQ ID N°120; -cultivar las células huésped recombinantes en un medio de cultivo apropiada; —recuperación y, dado el caso, purificación de la policétido sintasa del tipo I a partir del sobrenadante, del cultivo o del lisado celular. Las policétido sintasas del típicamente I novedosas obtenidas de acuerdo con el procedimiento descrito anteriormente, pueden caracterizarse por fijación sobre una columna de cromatografía de inmunoafinidad, sobre la cual los hl i á n m ttton 11 iii ***. anticuerpos que reconocen estas policétido sintasas se han inmovilizado previamente. Las policétido sintasas del tipo I de acuerdo con la invención, y más particularmente las policétido sintasas recombinantes descritas anteriormente, pueden también ser purificadas por técnicas de cromatografía líquida de alto desempeño (CLAD) , tales como por ejemplo las técnicas de cromatrografía en fase inversa o de cromatografía de intercambio de aniones o de cationes, bien conocidos por el experto en la materia. Las policétido sintasas, recombinantes o no recombinantes, de acuerdo con la invención pueden utilizarse para la preparación de anticuerpos. De acuerdo con otro aspecto, la invención, por lo tanto tiene por . objeto un anticuerpo que reconoce específicamente una policétido sintasa del tipo I de acuerdo con la invención, o un fragmento peptídico de tal policétido sintasa . Los anticuerpos de acuerdo con la invención pueden ser monoclonales o policlonales. Los anticuerpos policlonales pueden ser preparados a partir de células de hibridoma de acuerdo con la técnica descrita por KOHLER y MILSTEIN C. (1975), Nature, Vol.256:495. Los anticuerpos policlonales pueden prepararse por inmunon sacion de un mamífero, en particular de ratón ratas o de conejos con una policétido sintasa del tipo I de acuerdo con la invención, dado el caso en presencia de un compuesto adyuvante de inmunidad, tal como el adyuvante completo de Freund, el adyuvante incompleto de Freund, el hidróxido de aluminio e incluso un compuesto de la familia de los muramil péptidos . Constituyen igualmente los "anticuerpos" en el sentido de la presente invención, los fragmentos de anticuerpos tales como los fragmentos Fab, Fab', F(ab')2, o incluso los fragmentos de anticuerpos de cadena simple que contienen la parte variable (ScFv) descritos por MARTINEAU et al. (1998) J. Mol. Biol., Vol. 280 (1):117-127 o incluso en la patente US 4,946,778, así como los anticuerpos humanizados descritos por REINMANN KA et . Al. (1997), AIDS Res. Hum. Retroviruses, vol. .13 (11) : 933-943 o por LEGER O.J et al. (1997), Hum. Antibodies, vol.8 (1):3-16. Las preparaciones de los anticuerpos de acuerdo con la invención son útiles especialmente en las pruebas inmunológicas cualitativas o cuantitativas que busca, ya sea simplemente detectar al presencia de una policétido sintasa del tipo I de acuerdo con la invención, o cuantificar al cantidad de esta policétido smtasa, por ejemplo en el sobrenadante del cultivo o en el lisado celular de una sepa bacteriana susceptible de producir tal enzima.
Otro método de la invención consiste de un procedimiento de detección de una policétido sintasa del tipo I de acuerdo con la invención, o un fragmento peptídico de esta enzima, en una muestra, dicho procedimiento comprende las etapas de: a) poner en contacto un anticuerpo de acuerdo con la invención con la muestra a probarse; b) detectar el complejo antígeno/anticuerpo formado eventualmente La invención se relaciona igualmente con un equipo o estuche de detección de una policétido sintasa del tipo I de acuerdo con la invención en una muestra, que comprende: a) un anticuerpo de acuerdo con la invención; b) dado el caso, los reactivos necesarios para la detección del complejo antígeno/anticuerpo eventualmente formado. Un anticuerpo dirigido contra una policétido sintasa del tipo I de acuerdo con la invención puede marcarse con al ayuda de un marcador detectable isotópico o no isotópico, de acuerdo con los procedimientos bien conocidos por el experto en la materia. El tamizado de un banco de ADN de acuerdo con la invención con la ayuda de un par de cebadores que se hibridan con las secuencias a blanco, donde la presencia es buscada, tales secuencias de la vía de biosíntesis de la puromicina, ********* **.— i-nHMüffrfr -y?tfüÉi las secuencias del gen linA implicadas en la biodegradación del lindano o incluso las secuencias que califican para las policétido sintasa del tipo I se han detallado aquí anteriormente . La invención tiene por objeto un procedimiento de detección de un ácido nucleico de una secuencia nucleotídica determinada, o de una secuencia nucleotídica estructuralmente emparentada con una secuencia nucleotídica determinada, en una colección de células huésped recombinantes de acuerdo con la invención, y caracterizado porque comprende las etapas siguientes : —p'orüer en contacto la colección de células huésped recombinar.tes con un par de cebadores que se hibridan con la secuencia nucleotídica determinada o que se hibridan con la secuencia nucleotídica estructuralmente emparentada con una secuencia nucleotídica determinada; -realizar a? menos tres ciclos de amplificación; -delectar ej_ ácido nucleico eventualmente identificado . Para las condiciones de amplificación apropiadas en función de las secuencias blanco buscadas, el experto en la materia podrá referirse ventajosamente a los ejemplo posteriores . De acuerdo con otro aspecto, la invención se relaciona también con un procedimiento de detección de un ácido nucleico, de secuencias nucleotídicas determinadas, o de secuencias nucleotídicas estructuralmente emparentadas con una secuencia nucleotídica determinada, en una colección de células huésped recobinantes de acuerdo con la invención, caracterizado porque- comprende las etapas siguientes; -poner en contacto la colección de células huésped recombinantes con una sonda que se híbrida con la secuencia nucleotídica determinada o que se híbrida con una secuencia nucleotídica estructuralmente emparentada con la secuencia nucleotídica determinada; -detectar e? híbrido formado eventualmente entre la sonda y los ácidos nucleicos comprendidos en los vectores de la colección. Para efectuar el tamizado de un banco de ADN de acuerdo con la invención en vista de detectar la presencia de un ácido nucleotídico que codifica para un polipéptido, capaz de degradar el lindano, se detectan los clones recombinantes de interés por su fenotipo correspondiente a su capacidad de degradar el lindano. Para este fin, los clones aislados y/o los conjuntos de clones de bancos de ADN preparado se ponen en cultivo en un medio de cultivo en presencia del lindano y la degradación de lindano se observa por la formación de un halo encontrado en el medio inmediato a las células. La invención se relaciona también con un procedimiento para identificar la producción de un compuesto de interés por una o varias células huésped recombinantes en una colección de células huésped recombinantes de acuerdo con la invención, caracterizado _.porque comprende las etapas siguientes : -cultivar las células huésped recombinantes de la colección en un medio de cultivo apropiado; -detección del compuesto de interés en el sobrenadante del cultivo o en lisado celular de una o varías de las células recombinantes cultivadas. La invención tiene por objeto además un procedimiento para seleccionar una célula huésped recombinante que produce un compuesto de interés en una colección de células huésped recombinantes de acuerdo con la invención, caracterizado -porque comprende las etapas siguientes: las células huésped recombinantes de la invención en un medio de cultivo apropiado; -detección del compuesto de interés en el sobrenadante del cultivo o en el lisado celular de una o varias células huésped recobinantes cultivadas; -.selección de las células huésped recobinantes que producen el compuesto de interés. La invención se relaciona también con un procedimiento para la producción de un compuesto de interés caracterizado porque comprende las etapas siguientes: «***. *************..*!»* ..«*** * m.^^^?^M?iiA.4.. —cultii'-ar una célula huésped recombinante seleccionada de acuerdo con el procedimiento descrito anteriormente; recuperar y, dado el caso, purificar el compuesto producido por la célula huésped recombinante. La invención también es relativa a un compuesto de interés caracterizado porque se obtiene de acuerdo con el procedimiento descrito anteriormente. Un compuesto de interés de acuerdo con la invención puede consistir de un policétido producido gracias a la expresión de al menos una secuencia nucleotídica que compruebe una secuencia elegida entre la secuencia SEQ ID N° 33 a 44, SEQ ID N° 30 a 32 y SEQ ID N° 115 a SEQ ID N° 120. La invención se relaciona también con una composición que comprende un policétido producido gracias a la expresión de al menos una secuencia nucleotídica que comprende una secuencia elegida entre la secuencias SEQ ID N° 33 a SEQ ID N° 44, SEQ ID N° 30 a SEQ ID N° 32 y SEQ ID N° 115 a SEQ ID N° 120. Un policétido producido gracias a la expresión de al menos una secuencia nucleotídica anterior, es de manera preferida el producto de la actividad de varias secuencias codificantes incluidas en el seno de un operon funcional, donde los productos de traducción son las diferentes enzimas necesarias para la síntesis de un policétiac, una de las *. *..* **.,** J. ij-t -•- i*-* *,* -.*.**-* ! i rtririiniii - secuencias anteriores esta comprendida y expresada en el operon. Tal operon comprende una secuencia de acido nucleico de acuerdo con la invención que codifica para una policétido sitasa puede construirse por ejemplo de acuerdo con las 5 enseñanzas de Borchet et al. (1992). La invención también es relativa a una composición farmacéutica que comprende una cantidad farmacológicamente activa de un policétido de acuerdo con la invención, dado el caso en asociación con un vehículo farmacéuticamente 10 compatible. Tales composiciones farmacéuticas estarán adaptadas ventajosamente para la administración, por ejemplo por vía parenteral, de una cantidad de un policétido sintetizado por una policétido sintasa del tipo I de acuerdo con la l.r invención, que vaya_ de 1 µ/kg por día a 10 mg/kg por día, de preferencia al menos 0.01 mg/kg por día y de manera más preferida entre 0.01 y 1 rng/kg por día. Las composiciones farmacéuticas de acuerdo con la invención pueden ser administradas de manera indiferente por 0 vía oral, rectal, parenteral, intravenosa, subcutánea o incluso intradermica . La invención se relaciona también con la utilización de un policétido obtenido gracias a la expresión de una policétido sintasa del tipo I de acuerdo con la ^ ^. &?.. íá?a? Ít¡m **?*. . - .i- ^** **,.* *-.* **»*<* & t?***í*~*** * .** ***^ »a f ?**..mií*.?,* t invención, para la fabricación de un medicamento, en particular de un medicamento con actividad antibiótica.
DESCRIPCIÓN DE LAS FIGURAS La invención será ilustrada, sin que por lo tanto este limitada, por las figuras y los ejemplos a continuación. La Figura 1 ilustra el esquema de las diferentes etapas de lisado efectuadas de acuerdo con los protocolos 1 , 2, 3n 4a, 4b, 5a, y 5b descritos en el ejemplo 1. La Figura 2 ilustra una electroforesis sobre gel de agarosa al 0.8% de los ADN extraídos a partir de 300 mg de suelo número 3 (Cote Satélite André) , después de diferentes tratamientos de usado (protocolos 1 a 5, células fotorreceptoras. FIG 1). M: marcador del peso molecular del fago lambda. La Figura 3 ilustra la proporción de diferentes géneros de actinomicetos cultivados después de los tratamientos 1 a 5 (células fotorreceptoras. FIG 1). El número de ufe (unidad formadora de colonia) se ha determinado sobre el medio selectivo para este grupo de bacterias. Un número total de aproximadamente 400 colonias se ha analizado. La Figura 4 ilustra la recuperación del ADN del fago lambda digerido por Hindll l adicionado en los suelos a diferentes concentraciones antes (G) o después (G*) de la trituración. Los tratamientos T (choques térmicos) y S gi^itf ^ÜÉg&^ iÉ (sonicacion) son los tratamientos adicionales del lisado. La cuantificación se ha realizado por análisis con fosfo formador de imágenes después de la hibridación en un manchado de puntos. Una muestra de cada suelo se utiliza para cada concentración del' fago lambda agregado. Las características del suelo son reproducidas en la tabla 1. Las muestras que corresponden a 10 y 15 µg de ADN agregado no han sido tratadas . La Figura 5 ilustra la amplificación por PCR de los ADN extraídos a partir del suelo número 3 de acuerdo con los protocolos 1, 2, 3, 5a y 5b. Los cebadores FGPS 122 y FGPS 350 (tabla 2) se han utilizado con el fin de dar en el blanco de los Streptosporangi um ssp indígenas. Los extractos de ADN se utilizan no diluidos o diluidos a un décimo y un centesimo. M: marcador del peso molecular 123 pb (Gibco BRL), C: control de amplificación sin ADN. La Figura 6 ilustra las cantidades de ADN extraído después de la inoculación de las esporas (a) o de micelio (b) de S. lividans OS48.3 inoculados en los suelos a diferentes concentraciones. Las cantidades de micelio agregadas en el suelo corresponde al número de esporas inoculadas en el medio de germinación. Aproximadamente 50% de las esporas han germinado, el número de las células o de genomas contenidos en los hifas de las esporas germinadas no se ha determinado. Las cantidades de esporas y de micelio inoculadas no son por t &Ui* **** -********'- "-- -=*- -*- —***> * •»* - lo tanto comparables directamente. El protocolo de extracción ha sido conducido de acuerdo al protocolo 6 (cf sección material y métodos). El símbolo (') indica que el ARN ha sido incluido en el amortiguador de extracción. El ADN blanco ha sido amplificado por PCR con los cebadores FGPS 516 y FGPS 517, la cuantificación se ha realizado por fosfoformación de imágenes después de la hibridación en manchado de puntos, utilizando las sondas FGPS 518. Una muestra de cada suelo se ha utilizado para cada concertación de hifas ° de esporas. Las características de los suelos se describen en la tabla 1. La Figura 7 representa el árbol filogenético obtenido por el algoritmo de Neighbour Joining, colocando las secuencias de ARN 16S contenidas en el banco de ADN del suelo, con respecto a las bacterias de referencia cultivadas. En gris: las secuencias procedentes de los depósitos de clones del banco. Los valores de cebado son indicados a nivel de los vínculos, después de volver a tomar las muestras de 100 repeticiones. La barra de la escala indica el número de sustituciones por tipo. El número de acceso de las secuencias en la base de datos Genbank se indica entre paréntesis. La Figura 8 representa un esquema del vector pOSint 1. La Figura 9 representa un esquema del vector pWEDl .
La Figura 10 representa un esquema del vector pWE15 (ATCC N° 37503) . La Figura 11 representa un esquema del vector pOS 7001. La Figura 12 representa un esquema del vector pOSCVOlO. La Figura 13 representa el fragmento que contiene un sitio "eos" insertado en el plásmido pOSVOlO en el curso de la construcción del vector pOSV 303. La Figura 14 representa un esquema del vector pOSV 303. La Figura 15 representa un esquema del vector pElld. La Figura 16 representa un esquema del vector pOS 700 R. La Figura 17 representa un esquema del vector pOSV 001 La Figura 18 representa un esquema del vector pOSV 002. La Figura 19 representa un esquema del vector pOSV 14 La Figura 20 representa un esquema del vector pBAC 1. Élnfuí if?irrtü Ér»~ ~ - -*--»*- -*- **" - .?*~**^f***»^** *' ^-** La Figura 21 representa un esquema del vector pOSV 403 La Figura 22 representa los geles de electroforesis del ADN del banco después de la digestión por las enzimas BamHl y Dral de los clones positivos del banco tamizado con los oligonucleótidos PKS-1. La Figura 23 ilustra la producción de puromicina por los recombinantes de S . lividans comparados con la producción de la cepa salvaje de S. alboniger . La Figura 24 ilustra la alineación de los PKS del suelo con los sitios activos conservados de otros PKS. Las referencias para cada péptido se indican. Los dominios ß- cetoacil sintasa se alinean utilizando el programa PILEUP de GCG (Wisconsm Package Versión 9.1, Genetics Computer Group, Madison, Wisc) . La Figura 25 ilustra la construcción de un cósmido integrativo conjugativo. La Figura 26 ilustra la construcción de BAC integrativo conjugativo. La Figura 27 ilustra el esquema de construcción del vector pOSV 308. La Figura 28 ilustra el esquema de construcción del vector pOSV306.
La Figura 29 ilustra el esquema de construcción del vector pOSV307. La Figura 30 ilustra el esquema de construcción del vector PMBD-1. La Figura 31 presenta una gráfica detallada del plasmido pMBD-2 así como un esquema de construcción del vector pMBD-3. La Figura 32 ilustra una gráfica detallada del plásmido pMBD-4. La Figura 33 ilustra el esquema de construcción del plásmido pMBD-5 a partir del plásmido pMBD-1. La Figura 34 ilustra una gráfica detallada del vector pBTP-3. La Figura 35 ilustra el esquema de construcción del vector pMBD-5 a partir del vector pMBD-1. La Figura 36 ilustra la gráfica del cósmido a26Gl donde el inserto de ADN contiene los marcos abiertos de lectura que codifican para varias policétido sintasas. La Figura 37 es un esquema que representa el inserto de ADN (hebra +) del cósmido a26Gl, sobre la cual están colocados los diferentes cuadros de lectura que codifican para varios policétidos sintasas.
EJEMPLOS : EJEMPLO 1 : Procedimiento de preparación de una colección de ácidos nucleicos a partir de una muestra del suelo que contiene los organismos , que contienen una etapa de extracción directa de ADN a partir de la muestra de suelo. 1. MATERIAL Y MÉTODOS 1.1 SUELOS : Las características de seis suelos utilizados en este estudio se listan en la tabla 1. El contenido de arcilla y de material orgánica va respectivamente de 9 a 47% y de 1.7 a 4.7%, el pH varía de 4.3 a 5.8. Las muestras de suelo son recolectadas a partir de la capa superficial' de 5 a 10 centímetros de profundidad. Todas las raíces visibles se eliminan y los suelos se conservan a 4° C durante algunos días si es necesario, después de lo cual son secados durante 24 horas a temperatura ambiente y tamizado (tamaño promedio de la malla de 2 mm) antes de conservarse hasta varios meses a 4°C. 1.2 CEPAS BACTERIANAS Y CONDICIONES DE CULTIVO: I El ADN extraceiular asi como las cepas bacterianas que proporcionan las células vegetales, las esporas o las hifas, utilizadas para inocular las muestras de suelo, se eligen de tal manera que su presencia pueda seguirse específicamente . Con el fin de obtener grandes cantidades de ADN extracelular, la cepa lisogénica de E . coli 1192 hfr P4X (metB) , que contiene el fago lambda C1857 Sam 7, se cultiva sobre medio Luria-Bertani (LB) , durante dos horas a 30°C, después 30 minutos a 40°C, después 3 horas a 37°C. El ADN del fago lambda se extrae de acuerdo con la técnica descrita por SAMBROOK J. et al. (1989) Molecular Cloning: A Laboratory Manual, 2da, ed. Cold Spring Harbor Laboratory, Cold Spring Harbor N.Y. La cepa virulenta de Ba cill us an thracis (STERNE 7700) se ha utilizado como inoculo de las células bacterianas. El Ba cill us an thra cis se multiplica sobre caldo de cultivo del tipo "caldo de soya tripticasa" (TSB) (Biomérieux, Lyon, Francia) durnate aproximadamente 6 horas, verificando que la DO6ú0 se mantenga por debajo de 0.6. Estas condiciones permiten el desarrollo de células vegetales sin formación de esporas (Patra et al., (1996), FEMS Immunol. Medical Microbiology, vol. 15:223-231). Las esporas de Streptomyces lividans OS48.3 (CLERC-BARDIN et al. no publicada), se eliminan mecánicamente de los cultivos del organismo sobre un medio R2YE (HOPWOOD et al. (1985), Genetic Mampulation of Streptomyces-A Laboratory Manual. The John Innes Foundation, Norwich, Reino Unido) . Las hifas de S. lividans OS48.3 se obtienen a partir de las esporas en pregerminación, por lo que se espera que el uso de las hifas cortas minimice la ruptura y la pérdida subsecuente de ADN. Las esporas se ponen en suspensión en un amortiguador TES (Acido N-Tris [hidroximetil] metil-2-aminoetansulfónico; Sigma- Aldrich Chimie, Francia) (0.05M; pH 8) (Holben WE et al., (1988), APPL. Environ. Microbiol. Vol. 54:703-711, después se somete a un choque térmico (50°C durante 10 minutos seguido de un enfriamiento bajo una corriente de aire frío, después se agregan a un volumen igual del medio de pregerminación (extraído de levadura al 1%, casaminoácidos al 1% CaCl2 0.01 M) . La solución se incuba a 37°C bajo agitación. La proporción de esporas germinadas se estima de aproximadamente 50%, de acuerdo con los resultados de HOPWOOD et al. (1985). Después de la centrifugación, los residuos son resuspendidos en un amortiguador TES, agregados a 3% del medio TSB, e incubados a 37°C hasta la obtención de un DO450 al 0.15 (HOPWOOD et al., (1985)). Streptomyces hygroscopicus SWN 736 y Streptomyces fragi l e AC1296 (Institute Pyshino, Moscú) se han cultivado de acuerdo a las técnicas descritas por HICKEY y TRESNER (1952) . El ADN de las esporas y de las hifas de S. lividans se extrae a partir de cultivos puros de acuerdo con el protocolo de lisado 6 descrito posteriormente (excepto que ningún triturado se realiza) , mientras que las esporas de S. hygroscopicus y de S. fragüe se extraen por lisado químico/enzimático (Hintermann et al., 1981). 1.3 ELECCIÓN DEL AMORTIGUADOR DE EXTRACCIÓN: Un amortiguador TENP (Tris 50 mM, EDTA 20 mM, NaCl 100 mM, 1% en peso/volumen de polivinilpolipirrolidona desarrollada por PICARD (1992) se utiliza. Otros amortiguadores similares se han utilizando anteriormente por otros autores (CLEGG et al., 1997; KUSKE et al., 1998; ZHOU et al., 1996). El Tris y el EDTA protegen al ADN de la actividad nucleasa, el NaCl aporta un efecto dispersante y la PVPP absorbe los ácidos húmicos y los otros compuestos fenólicos (HOLBEN et al. (1988).; PICARD et al., (1992). En este estudio, la eficiencia de extracción de este amortiguador está evaluado a diferentes pH (6.0-10.0), utilizando 20 suelos diferentes que tienen una gama de pH de 5.8 a 8.3, y un contenido de materia orgánica de entre 0.2 y 6.3%. Estos 20 suelos (las otras características no son indicadas) se han utilizado únicamente en esta experiencia. La cantidad de ADN se ha determinado de manera colorimétrica como se describe por RICHAR (1974) y se detalla a continuación. . . [t ^ ff***»**^,. .,***£, ¿uwMj,...imimjtiatj^A! O IN SITU Y DE EXTRACCIÓN DE ADN: Varios protocolos que utilizan un número creciente de etapas se ha probado con el fin de evaluar la eficiencia de diferentes técnicas para lisar los microbios del suelo in 5 situ. Para estas experiencias, la microflora indígena del suelo se ha tamizado en seis suelos. Se han conducido experiencias adicionales con el fin de estudiar los efectos de los tratamientos de lisado sobre el ADN liberado, analizando las cantidades y la calidad del ADN recuperado que 10 proviene de un ADN de fago lambda adicionado previamente a los suelos. Una vez que un protocolo optimizado (designado protocolo 6) se ha desarrollado, este protocolo se utiliza para cuantificar el ADN que proviene de actinomicetos 5 indígenas y el ADN gue proviene de bacterias Gram positivas inoculadas en los suelos seleccionados. En todos los casos, las muestras de suelo se han secado y pasado por un tamiz como se describe anteriormente. Después de la trituración, se agregan 0.5 ml de 0 amortiguador TENP a 200 mg en peso seco de suelo, excepto para el protocolo 1, en el cual el amortiguador se agrega a un suelo sin triturar) . Para los diferentes tratamientos de lisado (ver posteriormente), las suspensiones de suelo se pasan en un 5 Vórtice durante diez minutos y se centrifugan (4000 g durante ÉÍ?á &áátt áilM? i Itátilir- - *>**^i**^*** ^-****** . ! * MM-á * - -»"-*>-& - ~J* **^ ** * 1tÁA.i* cinco minutos), después de lo cual una fracción alícuota (25 µl) de sobrenadante se analiza por electcoforesis sobre gel (0.8% de agarosa) . Otra fracción alícuota de sobrenadante que representa un volumen conocido, generalmente de 350 µl, se precipita con isopropanol. Cinco fracciones alícuotas (que representan el ADN derivado de 1 g de suelo) se reúnen y resuspenden 100 µl de un amortiguador TE estéril (Tris 10 mM, EDTA 1 mM, pH 8.0) antes de la purificación (protocolo D, ver posteriormente) , y se cuantifica, ya sea por hibridación (Dot Blot) del ADN total o ya sea por hibridación (Dot Blot) de los productos de amplificación PCR (ver posteriormente) . Las señales de hibridación se han cuantificado por • formación de imagen con fosfoforecencia (técnica de "fosfoformación de imágenes"), ver posteriormente. 1.5 EVALUACIÓN DE LOS MÉTODOS DE LISADO CELULAR IN SITU: La calidad y cantidad de ADN extraído después de un número creciente de etapas de tratamiento de lisado (protocolo 2-5b) , se compara con aquellas del ADN extracelular obtenido después del lavado del suelo con un ^| ^gg ^ ¡|g taatj¿fe.j '" "J Tf amortiguador de extracción (protocolo 1; ver también la Figura 1) .
Protocolo 1 : Sin tratamiento de lisado El amortiguador TENP se agrega a un suelo no triturado, se realiza una etapa de extracción de ADN como se describe anteriormente.
Protocolo 2 : Trituración de suelo seguido por una extracción de ADN Se utilizan dos tipos de dispositivos diferente para la trituración del suelo. Después de comparar su eficacia respectiva, 5 gramos del suelo seco se trituran durante 30 segundos en un triturador que contiene anillos de tungsteno o durante tiempos variados hasta 60 minutos en un triturador de suelo que contiene un mortero y bolas de ágata (20 mm de diámetro) . El amortiguador TENP es agregado a continuación y el ADN es agregado como se describe anteriormente. Los resultados de la electroforesis sobre gel muestran que una trituración de 40 minutos utilizando las bolas de ágata es necesario con el fin de obtener cantidades de ADN extraído equivalentes a aquellas obtenidas después de 30 segundos de trituración utilizando anillos de tungsteno.
La distribución del tamaño de los fragmentos de ADN es similar a cualquiera que sea el método empleado. Así, éstos tratamiento se consideran como equivalentes y aquel que será utilizado en los protocolos descritos posteriormente no será en consecuencia especificado. En los protocolos 3 a 5, la eficiencia de varios otros tratamientos de lisado posterior a la trituración del suelo se ha aprobado, ya sea de manera separada, ya sea en diferentes combinaciones.
Protocolo 3 : Este protocolo es idéntico al protocolo 2, salvo que comprende una etapa de homogenización con la ayuda de un mezclador del tipo Ultraturrax (Janker et Kunkerl, IKA Labortechnik, Alemania) ajustado a la mitad de la velocidad máxima durante 5 minutos.
PROTOCOLOS 4a y 4b: Estos protocolos son idénticos al protocolo 3 con la excepción de una etapa adicional de sonicación. Dos tipos de dispositivos sonicadores se han comparado: un sonicador con micropunta de titatnio (600W Vibracell Ultrasonicator, Bioblock, Illkirch, Francia) ¿^^^idb a^Ai^^^^.>^^a^Jglto.aa<^^.,ii.»g,.»£A.^A^~»-. '•*** **.**. *«*******t* * ? *..
(Protocolo 4a) y un sonicador del tipo Cup Horn (protocolo 4b) . La micropunta Vibracell que produce ultrasonidos está en contacto directo con la solución del suelo. En los que concierne al dispositivo del tipo Cup Horn, la solución del suelo es conservada en los tubos que son colocados en un baño de agua a través del cual pasan los ultrasonidos. Se han realizado experiencias preliminares con el fin de determinar las condiciones óptimas para los dos sonicadores (resultados no presentados) . El mejor compromiso, en términos de cantidad de ADN extraído y del tamaño de los fragmentos consiste en una sonicación con la micropunta de titanio y el sonicador del tipo Cup Horn respectivamente durante 7 y 10 minutos, regulando la potencia a 15 w y con ciclos activos a 50%.
Protocolos 5a y 5b Después de la sonicación con una punta de titanio o con un dispositivo del tipo Cup Horn (respectivamente protocolos 4a y 4b) se agrega lisozima y acromopeptidasa, cada una de las enzimas a una concentración final de 0.3 mg/ml . Las suspensiones de suelo se incuban durante 30 minutos a 37°C, después de lo cual se agrega el iauril ». ?** *^?*^**í,**?*iíél^***?i *^«*...*l, JM****.^*** sulfato a una concentración final del 1%, después las suspensiones se incuban durante 1 hora a 60°C antes de la centrifugación y precipitación como se describió anteriormente . Además de los protocolos descritos anteriormente, el efecto de la sonicacion (Cup Horn, ver protocolo 4b) y de los choques térmicos (30 segundos en nitrógeno líquido seguido de tres minutos en agua hirviendo, los tratamientos son repetidos tres veces), sobre el ADN del fago lambda digerido por Hindlll previamente agregado al suelo, se han examinado (ver a continuación) . Las choques térmicos se han sugerido en el estado de la técnica como medios de lisado celular in si tu (PICARD et al. (1992)). Sien embargo, debido al hecho de que tal tratamiento tiene un efecto perjudicial' sobre el ADN libre (ver la sección de resultados), no se ha incluido en los protocolos descritos anteriormente.
PROTOCOLO OPTIMIZADO Después de la evaluación de diferentes tratamientos de lisado, se ha definido un protocolo optimizado, designado al protocolo 6. El protocolo 6 es idéntico al protocolo 5b excepto que, antes de la sonicacion, las suspensiones del suelo son sometidas a un tratamiento por vórtice, después se agitan por rotación sobre una rueda durante 10 horas antes de ser congelados a -20°C. Después de la congelación, las -suspensiones del suelo son pasadas en un vórtice durante 10 minutos antes de la sonicacion. El protocolo 6 se utiliza en los experimentos en los cuales los suelos se han sembrado con células bacterianas, así como los experimentos en los cuales los actinomicetos nativos se han cuantificado (ver posteriormente) . 1.6 CONTEO CON EL MICROSCOPIO: La eficiencia de la trituración del suelo como método para lisar las células bacterianas se examina con el microscopio. 5 gramos de suelo bruto seco se mezclan en un dispositivo del tipo. Waring Blender con 50 mililitros de agua esterilizada ultrapura durante 1.5 minutos; simultáneamente un gramo (peso seco) del suelo triturado (protocolo número 2) se pone en suspensión en 10 mililitros con agitación durante 10 minutos. Las suspensiones de suelo se diluyen en serie y se agrega anaranjado de acridina a una concentración final de 0.001%. Después de 2 minutos, las suspensiones son filtradas a través de una membrana marca NUCLEOPORE del tipo 0.2 µm negra. Cada filtro se enjuaga con agua esterilizada lisada, se trata con 1 mililitro de isopropanol durante 1 minuto con el fin de fijar las células bacterianas, después se enjuaga nuevamente. Las células bacterianas se contabilizan con la ayuda de un microscopio con epifluorescencia del tipo Zeiss Universal con un objetivo lOOx. Para cada uno de los tipo del suelo, se cuentan tres filtros, y al menos 200 células se contabilizan sobre cada uno de los filtros. 1.7 NUMERACIÓN DE LOS ACTINOMICETOS CULTIVABLES Y EL NUMERO TOTAL DE UNIDADES QUE FORMAN COLONIAS (CFU) : Los actinomicetos que hayan sobrevivido a los tratamientos de lisado (protocolos 1-5), se examinan específicamente con el suelo número 3 (Cote Saint André, ver la tabla 1) . Después de. una dilución de 10 veces de una solución de extracto de levadura (6% peso/volumen) y de SDS (0.05%) con el fin de inducir la germinación (Hayakawa et al. (1998)), las suspensiones de suelo son diluidas en serie en agua estéril, se incuban a 40°C durante 20 minutos y se siembran sobre medio HV (Hayakawa et al., 1987). El medio HV se adiciona con actidiona (50 mg/l) y nistatma (50 mg/ml). Las colonias de actinomicetos se contabilizan después de la incubación durante 15 días a 28°C.
En total, aproximadamente 400 colonias se examinan. La identificación se realiza sobre la base de las características morfológicas macro y microscópicas, así como sobre el análisis del contenido de ácido diaminopimelico de los aislados (SHIRLING et al., 1966); STANECK et al., 1974; WILLIAMS et al., 1993) . La cantidad total de bacterias cultivables (CFU totales) , se determina igualmente para cada uno de los protocolo de lisado l a 5. Las suspensiones de suelo se diluyen en serie y se siembran por triplicado sobre un medio de agar de Bennett (WAKSMAN et al., 1961), adicionado con nistatina y actidiona (cada una a 50 miligramos/litro) . Cada agar de Petri se cubre con un filtro de nitrato de celulosa (Millipore) y se incuba durante tres días a 28 °C. Después de la numeración de las colonias sobre las membranas, los filtros se retiran y las cajas de Petri se incuben nuevamente durante 7 días a 28°C, después se contabilizan de nuevo. 1.8 RECUPERACIÓN DEL ADN DEL FAGO LAMBDA AGREGADO A LOS SUELOS: El ADN del fago lambda se digiere con Hindlll, se extrae por una mezcla de fenol-cloroformo, se precipita y después se resuspende en agua estéril ultrapura de acuerdo con los protocolos estándares (SAMBROOK et al., 1989). . í fSkí'i&hfil&l&t?i ñ JÉÉ? ' Las diluciones que corresponden respectivamente a 0, 2.5, 5, 7.5, 10 y 15 µg de ADN/gramo de peso seco de suelo, se preparan en volúmenes de 60 µl . Estas diluciones de ADN se agregan a los lotes de 5 gramos de suelo seco que posteriormente se han mezclado vigorosamente con un vórtice durante 5 minutos antes de la trituración. El ADN del fago lambda también se agrega a un suelo antes de la trituración a concentraciones que corresponden a 0, 10 y 15 µg de ADN/gramo de peso del suelo seco. Después de la trituración, el amortiguador de extracción se agrega y el ADN se extrae de acuerdo con el protocolo 2 (ver anteriormente) . 1.9 SATURACIÓN DE LOS SITIOS DE ABSORCIÓN CON EL ARN: Con el fin de determinar si la saturación de los sitios de adsorción de los ácidos nucleicos de los coloides del suelo pueden aumentar la tasa de recuperación del ADN, se incuba tierra arenosa (suelo número 4), y suelo arcilloso (suelo número 5) , con una solución de ARN antes de cualquier otro tratamiento. Al ARN comercial de Sa ccharomyces cerevisiae (BOHRINGER MANNHEIM, MEYLAN, Francia), se diluye en un amortiguador de fosfato (pH 7.1), y se agrega a las muestras de suelo seco y tamizado (2 mililitros/gramo de suelo) a l . ' * . i i 1 á •*- ? j i A li<ifrt? ÉÉi ,1 A* - -^- -t-* »*- ***.-**... *¡*tt*******^*^**** **?^^ ..^.^A^M» ************ ,á***? tiaiaJ concentraciones finales de 20, 50 y 100 miligramos de ARN/gramos de peso seco del suelo. Los tubos que contienen las suspensiones e suelo se agitan por rotación durante dos horas a temperatura ambiente. Después de la centrifugación, los residuos del suelo se secan en un horno (50°C) durante la noche. El ADN del fago lambda se agrega a continuación a los suelos (0, 20 o 50 µg/g en peso seco del suelo) , con el fin de simular el tipo de ADN liberado después del lisado celular. El ADN se extrae de acuerdo con el protocolo número 2. Se determina a continuación que un efecto idéntico de la adhesión del ARN sobre la recuperación del ADN puede esperarse agregando ADN directamente al amortiguador de extracción. Este procedimiento simplificado se utiliza para el suelo arcilloso número 5 en los experimentos en los cuales los microorganismos se han inoculado en los suelos. El ARN se agrega a continuación a una concentración que corresponde a 50 miligramos de ARN/gramos de peso seco del suelo. 1.10 DETERMINACIÓN CUALITATIVA Y CUANTITATIVA DE LA EFICIENCIA DE LOS PROTOCOLOS DE EXTRACCIÓN: La calidad del ADN (ausencia de degradación) se estima sobre- la base de los tamaños de ADN o de la posición relativa de las barras de migración del ADN después de la electroforesis y de una fracción alícuota de una solución de ADN sobre un gel de agarosa al 0.8%. La intensidad de la fluorescencia permite una estimación semicuantitativa de los rendimientos de extracción. Otra fracción alícuota se utiliza para las determinaciones cuantitativas del contenido de ADN por hibridación (Dot Blot) y el análisis con el fosfoformador de imágenes. El protocolo de hibridación sobre la mancha se describe por SIMONET et al., (1990). Las membranas de hibridación (GeneScreen plus, Life Science Products, Boston, Estados Unidos de América) , se prehibridan durante al menos 2 horas en 20 mililitros de una solución que contiene 6 mililitros de 20 x SSC, 1 mililitro de solución de DENHARDT' s, 1 mililitro de SDS al 10% y 5 miligramos de ADN de esperma de salmón. La hibridación se realiza durante una .noche en la misma solución en presencia de una sonda marcada previamente con dos lavados de las membranas en un amortiguador SSC 2x durante 5 minutos a temperatura ambiente, después un tercer lavado en un amortiguador SSC 2x, SDS al 0.1% y un cuarto lavado en un amortiguador SSC lx, SDS al 0.1% durante 30 minutos a la temperatura de hibridación. ffltÉÉÍÉfÍ???l- lntfT"""-""« ^ • •' ^i~í-'- '-imtaMfctt.itiiáirl rf tl-tÉ Las señales de hibridación se cuantifican con un sistema de formación de imágenes radioanalíticos BIORAD (Molecular Analyst Software, BIORAD, Ivry S/Seine, Francia ) . Con el fin de cuantificar la cantidad total del ADN derivado de la microflora nativa, los diferentes suelos se extraen de acuerdo con los protocolos número 1 a 5. El ADN no amplificado se aplica sobre las membranas de Dot Blot y se híbrida utilizando la sonda universal FGPS431 (tabla 2) . Esta sonda, que se híbrida en las posiciones 1392- 1406 del gen del ADNr 16S de E. coli (Amann et al., (1995)) se marca en sus extremos con un ATPa32 utilizando una polinucleotido sinasa T4 (BOEHRINGER MANNHEIM, Melan, Francia) . Se prepara una curva de calibración a partir del ADN de E. coli DH5a. La conversión de los cálculos de las bacterias del suelo necesita una simplificación, partiendo de la hipótesis de que el número de copias promedio (rrn)'es de 7, como para E. coli . El ADN del fago lambda digerido por Hindlll se utiliza para cuantificar al recuperación del ADN extracelular. Los extractos no amplificados a partir de suelo, a los cuales el ADN del fago lambda se ha agregaao, se ...^«^^ lUttMB.J^^A^afc^.^.M^A «fe*,i hibridan con el ADN del fago lambda digerido por Hindlll marcado al azar utilizando el fragmento Klenow (Bóehringer Mannheim, Melan, Francia) . Las cantidades de ADN se calculan por interpolación a partir de una curva de calibración preparada con el ADN purificado. La cantidad total del ADN extraído a partir de los suelos número 1, 2, 3, 4 y 6 de acuerdo con el protocolo número 2 (trituración) se cuantifica igualmente de manera calorimétrica de acuerdo con la técnica descrita por RICHARD (1974) . Brevemente, el ADN se mezcla con HC104 concentrado (la concentración final de HC104 es de 1.5 normal). Se mezclan 2.5 volúmenes de esta solución con 1.5 volúmenes de DPA (difenilamina, Sigma-Aldrich, Francia) y se deja incubar la mezcla a la temperatura ambiente durante 18 horas, previamente la determinación de la DO a 600 nanometros. Los extractos de ADN del suelo se cuantifican con respecto a una curva estándar realizada por el ADN extraído a partir de E. coli , DH5 de acuerdo con los protocolos estándar (SAMBROOK et al., (1989) ) . 1.11 DESARROLLO DE UNA TÉCNICA DE CUANTIFICACION DE ADN UTILIZANDO LA AMPLIFICACIÓN PCR Y LA HIBRIDACIÓN: Para las amplificaciones por PCR, se utiliza ADN de Taq polimerasa (Appligene Oncor, Francia) , de acuerdo con las instrucciones del fabricante. El programa PCR utilizado para todas las amplificaciones es el siguiente: desnaturalización inicial durante 3 minutos a 95°C, después 35 ciclos que consisten de 1 minuto a 95°C, 1 minuto a 55°C y 1 minuto a 72°C, seguido por una extensión final a 72°C durante 3 minutos. El ADN aislado y purificado a partir de Streptosporangi um fragüe se utiliza como testigo a concentraciones que van de 100 fg a 100 ng. Con el fin de amplificar específicamente el ADN de este genero bacteriano, se eligen los cebadores FGPS122 y FGPS350 (tabla 2), complementarios a una parte del ADNr 16S, después del alineamiento de las secuencias de ADNr 16S de actinomicetos. Su especificidad se prueba sobre una colección de cepas de actinomicetos { Streptomyces , Streptosporangi um y de otros géneros fuertemente emparentados) . Los productos de PCR se hibridan con la sonda oligonucleotídica FGPS643 (tabla 2) . Con el fin de simular el nivel de pureza obtenido de manera rutinaria con el ADN extraído a partir del suelo, los testigos de ADN puro de S . fragüe, se mezcla con los extractos de suelo obtenidos después de los tratamientos de acuerdo con los protocolos de lisado 4b y 5b, después se purifican de acuerdo con el protocolo D. Antes de la utilización, los extractos de suelo se tratan DNasa (una unidad de DNasa/mililitro, GIBCO BRL), durante 30 minutos a temperatura ambiente. La DNasa se inactiva a continuación por calentamiento a 65°C durante 10 minutos. Una verificación de la inactivación se realiza por PCR. Las concentraciones de ácido húmicos se miden por espectrofotometría (DO280nm) contra una curva estándar de ácidos húmicos comerciales (Sigma) . Las soluciones de suelo tratadas con DNasa no diluidas, diluidas a lOx y diluidas x 100 se mezclan con 100 fg a 100 ng de ADN de S . fragüe antes de la amplificación por PCR. En otra serie de experimetos, las concentraciones crecientes de ADN de Streptomyces hygroscopi cus de (100 pg a 1 µg) se agregan al ADN de S . fragüe con el fin de simular la presencia del ADN no blanco y su influencia sobre el procedimiento PCR. 1.12 PURIFICACIÓN DE LOS EXTRACTOS DEL ADN BRUTO: Se comparan cuatro métodos de purificación dei ADN. El ADN se extrae a partir de un gramo (peso seco del suelo de acuerdo »i¡fca,?i.ai<,A i¡|gAJ;^jajilfc,,.^ con el protocolo 4a, y puesto en suspensión en 100 µl de amortiguador TE8 (Tris 50 mM, EDTA 20 mM pH 8.0).
Protocolo A Elución a través de dos columnas sucesivas Elutip d (SCHLEICHER et SCHUELL, Dassel, Allemagne) (PICARD et al., (1992) ) . Protocolo B: Elución a través de una columna SEPHACRYL S200 (Pharmacia Biotech, Uppsala, Suéde) seguido de una elución a través de una columna Elutip d (NESME et al., (1995)).
Protocolo C: Separación con la ayuda de un sistema acuoso de dos fases con PEG 8000 - a 17.9% (peso/peso) (Merck, Darmstadt, Allemagne), y (NH4)2S04 al 14.3% (peso/peso) (ZASLAVSKY, (1995) ) . Después de un mezclado vigoroso en un vórtice, las dos fases se dejan a una temperatura ambiente para su separación. 1 mililitro de cada un adenovirus las fases se transfiere a otro tubo, se mezclan con 100 µm de la mezcla y se deja a 4°C durante una noche para permitir la separación.
La fase inferior se dialisa. durante una hora a través de una membrana Millipore en presencia de un exceso de un amortiguador TE 7.5 (Tris 10 mM, EDTA lmM a un pH de 7.5 y Mg Cl2 1 molar) con el fin de eliminar las sales en exceso.
Protocolo D: Elución a través de una columna del tipo Microspin Sephacryl S400 H 12 (Pharmacia Biotech, Uppsala, Suéde), seguido de una elución a través de una columna del tipo Elutip d. Cada protocolo se termina por una etapa de precipitación por etanol, el ADN se pone en suspensión en 10 µl de amortiguador TE 7.5. La eficiencia de los protocolos de purificación se verifica por amplificación PCR de las fracciones alícuotas no diluidas de las soluciones de ADN de las fracciones de alícuotas diluidas 10 y x 100 veces, utilizando los protocolos estándar (ver posteriormente) . 1.13 RECUPERACIÓN DEL ADN PARTIR DE MICROORGANISMOS INOCULADOS : Las células, esporas e hifas, se lavan dos veces y se enumeran por conteo sobre una placa o conteo microscópico directo. Los lotes de 5 gramos del suelo seco y tamizados (suelos número 2, 3 y 5) , se inoculan con 100 µl. de una suspensión de esporas e hifas de S. lividans a a * ?****..l**..***.* **^.***!^.* *..^***' **,***.t*A I concentraciones que corresponden a 0, 103, 105, 10 , 10 espora/gramo de peso seco de suelo, o con células vegetales de B.anthracis a -concentraciones que corresponden a 0, 10 y 109 células por gramo de peso seco del suelo. Las cantidades de hifas de S. lividans se calculan sobre la base del número de esporas de las cuales son originarias. Después de la adición de las suspenciones bacterianas, las muestras de suelo son mezcladas vigorosamente con un vórtice durante 5 minutos antes de la trituración. El ADN se extrae de acuerdo con el protocolo número 6 (ver posteriormente) . La amplificación PCR seguida de una hibridación sobre mancha (Dot Blot) y formación de imagen por fosfoforecencia (fosfoformaci?'n de imagen) se utiliza con el fin de cuantificar las cantidades de ADN recuperadas a partir de las células, las esporas y del micelio bacteriano inoculado en los suelos. La extracción de ADN se realiza de acuerdo con el protocolo de lisado número 6. La amplificación PCR y la hibridación de realizan como se describe anteriormente. Los cebadores y las sondas son puestas en el blanco sobre las regiones cromosómicas localizadas fuera de la región 16S , y son altamente específicas de los organismos respectivos, de manera que se evitan las señales de ruido de fondo.
Para los suelos sembrados con B. Anthracis , los cebadores R499 y R500 se utilizan (Patra et al. (1996)) y los productos de amplificación se hibridan con la sonda oligonucleotídica C501 (tabla 2) . Para lo suelos sembrados con S . lividans , las reacciones PCR se realizan utilizando los cebadores FGPS516 y FGPS517 y los productos de amplificación se hibridan con la sonda oligonucleotídica FGPS518 (tabla 2) . La región amplificada es una parte del cásete construido específicamente para obtener las cepas 0S48.3 (CLERC-BARDIN et al., no publicada). Los conteos de calibración se hacen en todos los casos obtenidos utilizando el ADN purificado del organismo blanco. 2. RESULTADOS 2.1 ELECCIÓN DEL AMORTIGUADOR DE EXTRACCIÓN: 20 suelos diferentes se utilizan con el fin de determinar el pH óptimo del amortiguador de extracción del ADN. Para todos los suelo, el rendimiento en ADN aumenta con el pH creciente del amortiguador. El rendimiento para cada pH (V- SD1 calculado como el porcentaje del valor más alto para cada uno de los suelos, es el siguiente: pH 6.0: 3lV-13; pH 7.0: 43+/- 16; pH 8.0: 60V- 14; pH 9.0: 827- 12; pH 10.0: 98V- 3.
Para 16 de los 20 suelos, el rendimiento más elevado se obtiene a un pH de 10.0, mientras que para los otros cuatro suelos, el rendimiento más _ _- alto se obtiene a un pH de 9.0. Sin embargo, un pH de 10.0 las cantidades más grandes de material único se liberan, comparadas con un pH 9.0 (resultados no presentados). En consecuencia, el pH 9.0 se elige para todos los experimentos presentados a continuación. 2.2 EFICIENCIA DE LOS PROTOCOLOS DE EXTRACCIÓN DEL ADN: El ADN total de los organismos nativos del suelo se extrae y cuantifica de manera que se evalúa la eficiencia de numerosos protocolos de la eficiencia celular ín si tu . Las muestras de los suelos 1-6 (tabla 1) se tratan de acuerdo con los protocolos número 1 a 5 descritos en la sección material y método (Figura 1) . Después de la extracción del ADN, las suspensiones de suelos se precipitan con isopropanol, y las fracciones de alícuotas de los residuos se ponen en suspensión y se analizan por electroforesis sobre gel, en una primera etapa con el fin de estimar la calidad y la cantidad del ADN liberado . Sin embargo, el color del extracto de ADN se vuelve cada vez más obscuro con forme al número creciente de etapas a üiilfifi'?Hiái ¡ ?¿r?J¿ÉíJríi i ,******* '¿¡i tánaaaaAan de lisado, debido a la coextraccion de los compuestos, tales como los ácidos húmicos, con el ADN. Cientos de estos extractos brutos de color no migran de la manera esperada en los geles de agarosa. En consecuencia, las soluciones de ADN bruto se purifican (protocolo B) antes de la cuantificación. Las electroforesis sobre gel de las soluciones purificadas obtenidas después de los diferentes tratamientos de lisado se ejemplifican sobre el suelo número 3 (Figura 2) . Una comparación visual con rayos ultravioleta de las intensidades del ADN coloreado permite una estimación semicuantitativa de la eficiencia de los tratamientos. Además, la presencia de los perfiles de emigración de tamaños múltiples de los fragmentos (bandas discretas) de ADN y la desaparición de los fragmentos largos indica que una degradación del ADN ha tenido lugar. Ningún ADN se pudo extraer del suelo arcilloso número 5. Una cuantificación más precisa del ADN de todos los suelos, extraído de acuerdo con los protocolos no. 1 a 5, se realiza por hibridación sobre manchas (Dot Blot) sin etapa de amplificación PCR previa, y utilizando una sonda oligonucleotídica complementaria de una secuencia altamente conservada de la región del ADNr 16S (sonda FGPS 431, tabla 2) . .^¡¿^¡¿1 El ADN se detecta en los extractos de todos los suelos después de cada una de las diferentes etapas de lisado, con la excepción del suelo arcilloso no. 5. Los resultados concuerdan con las estimaciones realizadas después del gel de electroforesis. Con el fin de comparar con un método independiente para la cuantificación, el ADN extraído de acuerdo con el protocolo no. 2 (todos los suelos, salvo el suelo no. 5), se cuantifica igualmente utilizando un método colorimétrico de detección del ADN (RICHARD, 1974) . Se encuentra una buena correlación (r = 0.88) entre el ADN cuantificado utilizando esta técnica colorimétrica y los resultados obtenidos por la hibridación del tipo Dot Blot/radioformación de imágenes, que confirman la hipótesis, según la cual el número de copias promedio de las bacterias del suelo (rrn) es de 7. La hibridación (Dot Blot) muestra que las cantidades de ADN extracelulares, como se determina por extracción sin tratamiento de lisado (protocolo no. 1), da de 4 µg/g para el suelo ácido (no. 6) a 36 µg/g para el suelo ácido no. 3 (tabla 3) . La trituración del suelo (protocolo no. 2) aumenta las cantidades del ADN extraído a partir de todos los suelos ilzitÍ?Íébjiz?ittdk***** *^^ (por ejemplo 26 µg/g de suelo) para el suelo no. 6 y 59 µg/g de suelo (para el suelo no. 3) (tabla 3; figura 2) . Para los dos tratamientos de trituración (ver la sección materiales y métodos), la migración discreta del ADN se detecta sobre los geles de agarosa, indicando que las moléculas de ADN se han degradado parcialmente (figura 2) . El tamaño de los fragmentos del ADN está comprendido entre 20 y 0.2 kb. La intensidad de la banda de los fragmentos más pequeños es muy escasa, indicando que la mayor parte de los fragmentos tienen un tamaño muy superior a 1 kb. El protocolo no. 3 comprende una etapa de homogenización en un dispositivo mezclador del tipo Ultraturax después de la adición del amortiguador de extracción a las muestras de suelo. Esta etapa conduce a un aumento de las cantidades del ADN extraído, como se determina por hibridación sobre machas (Dot Blot) para dos de los suelos (la tierra arenosa no. 3 y el suelo ácido no. 6), mientras que los dos suelos ricos en materia orgánica (suelos no. 1 y no. 2) conducen a la obtención de cantidades más escasas de ADN. Los protocolos no. 4a y no. 4b permiten evaluar la influencia de dos tipos de sonicación sobre los rendimientos de ADN a partir de los suelos previamente triturados y homogenizados . ..******j******a*.* ***?*i*A*?*?^* *?^*i* **., La sonicación no tiene un efecto positivo sobre el rendimiento de ADN, en comparación con el protocolo no. 3, excepto para el suelo no. 6. Sin embargo, la eficiencia del lisado de los dos tipos de sonicador difiere. Para los suelos no. 2, 3 y 4, las cantidades más grandes de ADN extraídas se obtiene utilizando la micropunta de titanio (tabla 3; figura 2), mientras que para los suelos no. 1 y no. 6, el rendimiento de ADN es superior utilizando el dispositivo Cup Horn. Se obtienen igualmente resultados contradictorios cuando se agrega una etapa de lisado enzimático/químico (protocolo no. 5a y 5b) después de la etapa de sonicación: en ciertos casos, las cantidades de ADN extraídas son más grandes que aquellas recuperadas de acuerdo con los protocolos no. 4a y 4b, mientras que en los otros casos, los rendimientos son menores (tabla 3) . 2.3 CONTEO DIRECTO DE LOS MICROORGANISMOS: Los conteos con microscopio del número total de células bacterianas después de la coloración con anaranjado de acridina se realizan para todos los suelos, antes y después de la trituración. Antes de la trituración, el número de bacterias por gramo de peso seco del suelo va de 1.4 x 109 (+/-0.4) en el suelo tropical no. 5 a 10 x 109 (+/-0.7) en el suelo que proviene de la Costa Saint-André (suelo no 3) (tabla 1) . Después de la trituración, el número de células es respectivamente de 45, 74, 75, 54, 34 y 75% de los valores iniciales para los suelos no. 1 a 6. 2.4 NUMERACIÓN DE LOS ACTINOMICETOS CULTIVABLES QUE PERTENECEN A DIFERENTES GÉNEROS: Se observa una modificación en las poblaciones de actinomicetos en el suelo no. 3 después de los diferentes tratamiento de lisado (figura 3) . Por ejemplo, las colonias de Streptomyces sp. , dominan la flora viable de actinomicetos a los cuales no se les aplica ningún tratamiento de lisado (protocolo no. 1), y representan el 65% del número total de colonias identificadas. Después de la trituración, el porcentaje de colonias de Streptomyces disminuye para alcanzar el 51%, mientras que la proporción de colonias que pertenecen al género Micromonospora a aumentado del 14% al 41%. El lisado químico/enzimático (protocolos 5a y 5b) aparece como particularmente eficaz para el lisado de los estreptomicetos . Cuando todos los tratamientos de lisado se han aplicado, comprendiendo un lisado químico/enzimático (protocolos 5a y 5b), la microflora de actmomicetos, que comprende incluso más de 10° CFU/g de suelo, está dominada por las especies que pertenecen al género Mi cromonospora , mientras que ninguna o muy pocas colonias de Streptomyces se recuperan. Los organismos que pertenecen a los géneros tales como Streptosporangium , Actinomadura , Microbispora , Dactilosporangium y Actinoplanes aparecen sobre las placas en un número escaso (2-8% del número total de colonias identificadas) después de la trituración, homogenización con el dispositivo Ultraturrax, y sonicación, pero permanecen generalmente ausentes cuando estos tratamientos son combinados con un lisado químico/enzimático. El número total de bacterias cultivables que permanece después de cada tratamiento de lisado (protocolos 2 a 5) también se busca para el suelo no. 4. Los resultados indican que el número de bacterias cultivables no disminuye con la intensidad de los tratamientos de lisado (aproximadamente 2 x 106 CFU/g de suelo en todos los casos, e igualmente cuando ningún tratamiento es aplicado, tal como de acuerdo con el protocolo no. 1). La obtención de estos valores bajos de CFU se debe probablemente al hecho de que el suelo seco se utilizó y que solo las bacterias más resistentes se multiplican sobre las placas. El número de actinomicetos que forman colonias es generalmente más grande que aquel de las CFU totales (todas las bacterias) debido a que una etapa de germinación de las **í*****?**t¡***.*. .*t*j*.?*** *-*** -tfa^t^^^^t^i^^^^AAA^^ii^ajMfcaiJ esporas, comprendida en el protocolo de detección de los actinomicetos, carece entonces del control de las bacterias totales. 2.5 RECUPERACI N DEL ADN DEL FAGO LAMBDA AGREGADO: El objeto de estos experimentos es estimar de que manera los tratamientos de lisados sucesivos pueden afectar la recuperación del ADN solo, y si estos tratamientos sucesivos de lisado contribuyen a su degradación. El ADN puede ser una fracción de ADN extracelular liberado a partir de organismos ya muertos, que pueden persistir en el suelo durante meses (WARD et al., 1990), o ya sea del ADN liberado partir de organismos lisados fácilmente durante las primeras etapas del tratamiento. Con el fin de simular esta situación el ADN del fago lambda digerido por HindIII se agrega, a diversas concentraciones, a los suelos antes y después de la trituración. Además de la trituración, se prueba una combinación de otros tratamientos de lisado, que comprende la sonicación (dispositivo Cup Horn, ver protocolo no. 4b) y choques térmicos (ver la sección Materiales y Métodos) . Después de la extracción, las fracciones alícuotas que deberían contener teóricamente del 25 a 150 ng de ADN del fago lambda se analizan por electroforesis sobre gel. Ningún fragmento de ADN específico del fago lambda pudo observarse cuando el ADN se inocula en las muestras de suelo previamente al triturado, independientemente de la dosis, o del tipo de suelo. Cuando el ADN es agregado después de la trituración, y se extrae sin una etapa de tratamiento de lisado adicional, los perfiles específicos del ADN del fago lambda se detectan en los extractos de cuatro de los cinco suelos probados. En todos los casos, se obtiene una relación directa de causa efecto entre la cantidad de ADN agregado y la intensidad de las señales sobre los geles de agarosa. Las intensidades de las señales son, sin embargo, inferiores a las intensidades de las señales esperadas si se les compara con aquellas de los estándares moleculares. Además, la banda de 23 kb está ausente en varios casos, indicando que los fragmentos largos son adsorbidos de manera preferida por las partículas del suelo, o son más sensibles ( a la degradación, comparados con los fragmentos cortos . Ninguna banda se detectó en las muestras de suelo tropical no. 5, que está caracterizado por un contenido muy alto en arcilla (tabla 1) . Para una cuantificación más precisa, la recuperación del ADN se determina sobre un dispositivo de formación de imágenes por fosforescencia (fosfoformador de r.a. A,,?^?i^^a»t^^.^.^>^ja«Í MteA.. imágenes) después de la hibridación en manchas (Dot Blot) . De acuerdo a esta técnica, el ADN se detecta sobre todas las muestras, comprendiendo aquellas que se inocularon antes de la trituración, con la excepción del suelo no. 5, en el cual ningún ADN pudo detectarse. En todos los otros suelos, la cantidad de ADN extraído aumenta con el aumento del tamaño del inoculo (figuras 4a-d) . Sin embargo, las recuperaciones del ADN del fago lambda son escasas. Cuando la trituración es el único tratamiento de lisado aplicado, las recuperaciones están comprendidas entre 0.6 y 5.9% del ADN agregado cuando este es agregado antes de la trituración, y de 3.6 a 24% del ADN agregado cuando este último se agrega después de la trituración. Los niveles más altos de recuperación se obtienen a partir del suelo no. 2. La electroforesis sobre gel de fracciones alícuotas tratadas por choque térmico y sonicación, no permite observar bandas de ADN en ninguna de las muestras, que comprenden el ensayo en el cual el ADN se agregó después de la trituración. Los experimentos de hibridación en mancha (Dot Blot) confirman estos resultados. Las señales de hioridación obtenidas a partir de suspensiones de suelo que se tratan con choques térmicos y sonicación, son, a lo mucho escasas.
La muestra que presenta la cantidad más fuerte de ADN (15 µg de ADN/g de peso seco del suelo) es la única para la cual la señal obtenida es sensiblemente diferente del nivel del ruido de fondo. Ninguna diferencia (o diferencias bajas) se observa entre las muestras tratadas por choque térmico y sonicación, indicando que los choques térmicos tienen un efecto perjudicial sobre el ADN. Las recuperaciones mejores se observan para el suelo no. 2, que tiene el contenido más fuerte de materia orgánica (tabla 1) , mientras que ningún ADN se recupera a partir del suelo arcilloso no. 5. Los experimentos adicionales se realizan con las muestras no trituradas de los suelos no. 4 y 5, que han sido sembrados con 20 y 50 µg de ADN de fago lambda por gramo de suelo. Las muestras son extraídas inmediatamente o después de un periodo de incubación de una hora a 28 °C, después los extractos de ADN se purifican y analizan por electroforesis sobre gel. La incubación del gel no. 4 durante una hora después de la inoculación no conduce a perfiles cualitativa o cuantitativamente de aquellos obtenidos sin incubación o de aquellos observados anteriormente cuando el ADN se agregó después de la trituración. ?áá,á,LÁ?,?.*í.. ******** i^ jj ftf !** ****.*, **A*** **** * .**¡**? *t*á? Estos resultados indican que la degradación enzimática por las nucleasas del suelo no estarían implicadas en la baja tasa de recuperación del ADN. Además, la ausencia e la etapa de trituración no permite un aumento de la recuperación del ADN a partir del suelo no. 5, indicando que las modificaciones de estructura del suelo debidas a la trituración no aumentan significativamente la adsorción de los ácidos nucleicos sobre los coloides. 2.6 SATURACIÓN DE LOS SITIO DE ADSORCIÓN CON EL ARN: La mayor parte de los perfiles obtenidos sobre los geles de agarosa no difieren significativamente de los perfiles precedentes en los cuales el tratamiento de ARN no se ha efectuado. Por ejemplo, ninguna banda ha sido detectada a partir del suelo rico en arcilla no. 5, independientemente de las concentraciones de ARN y de las concentraciones de ADN del fago lambda utilizadas. Además, las bandas específicas del ADN del fago lambda digeridas por HindIII permanecen indetectables en la tierra arenosa tratada por ARN (suelo no. 4) cuando el ARN es agregado antes de la trituración. La intensidad de las bandas obtenidas a partir de las muestras sembradas con ADN después de la trituración m***** t* ?ks ****?* *. - i^µ*?^****^l**i^**?*¿á**u**tlÉM aumenta con la concentración del ARN, indicando que el tratamiento podría tener un efecto positivo. Sin embargo, los resultados después de la hibridación y análisis por formación de imágenes con fosforescencia, no confirman los resultados de la electroforesis. Por ejemplo, el efecto positivo del tratamiento del ARN sobre la recuperación del ADN a partir de la tierra arcillosa, cuando el ADN se ha agregado después de la trituración, no aparece claramente, Por otro lado, se ha encontrado un efecto positivo del ARN para el suelo rico en arcilla (no. 5) , cuando el ADN se agrega después de la trituración. Si bien las señales de hibridación para las muestras control no difieren de los niveles del ruido de fondo, cantidades significativas de ADN son liberadas a partir de las muestras tratadas por el ARN, y las señales aumentan con la cantidad de ADN agregado, así como con la concentración del ARN. Sin embargo, ya sea por la concentración más fuerte de ARN (100 mg/g de peso de suelo seco) la proporción de recuperación no sobrepasa jamás el 3%.
I??AAJÍ???? ? ******* .aatA ki 2.7 PURIFICACIÓN DE LOS EXTRACTOS BRUTOS DEL ADN: En cuatro protocolos probados, la mejor amplificación de los extractos de ADN no diluidos (1 µl de extracto en 50 µl de mezcla PCR) se observa después de la elusión en las columnas del tipo Microspin S400, seguida de una elución a través de una columna del tipo Elutip d, como los muestra la electroforesis sobre gel de los productos de PCR. El ADN purificado por el sistema acuoso de doble fase (protocolo C) , ha proporcionado cantidades más bajas de los productos de PCR después de la amplificación a partir del extracto de ADN no diluido. Ningún producto de amplificación se pudo obtener a partir de los extractos no diluidos después de la amplificación, a Continuación de la aplicación de los protocolos A o B. En consecuencia, el protocolo B (ver sección Materiales y Métodos), se utiliza para todos los experimentos, en los cuales las amplificaciones por PCR y/o las hibridaciones sobre manchas (Dot Blot) se realizan. 2.8 CUANTIFICACION POR PCR E HIBRIDACIÓN: La primera etapa es determinar si las cantidades de producto de PCR son proporcionales al número de moléculas de ADN blanco inicialmente presentes en el tubo de reacción. El ADN de Streptosporangium fragile se utiliza como blanco (ver sección Materiales y Métodos). Los cebadores utilizados son los cebadores FGPS122 y FGPS350 (tabla 2) . La electroforesis sobre gel de los productos de la PCR ha mostrado que la intensidad de la banda aumenta con el incremento de la concentración de los blancos. Los productos de la PCR se hibridan con la sonda oligonucleotídica FGPS643 (tabla 2), y las señales se cuantifican por formación de imágenes por fosforescencia (fosfoformación de imágenes) . Se encuentra una buena correlación (r2 = 0.98) entre el log [número de blanco] y el log [intensidad e la señal de hibridación] . A continuación, se busca si la eficiencia de la amplificación PCR está afectada por los ácidos húmicos y el ADN no blanco. Cuando se analiza por electroforesis sobre gel, la intensidad incrementada de las bandas de los productos de la PCR, corresponden a las diferentes cantidades de ADN blanco, se conservan cuando la amplificación se realiza con soluciones de ADN a la cuales se agregaron los extractos de suelo tratados con DNasa, que contiene los ácidos únicos a concentraciones que van hasta 8 ng en la mezcla PCR de un volumen de 50 µl . Con 20 ng de ácido único en la mezcla PCR, las bandas que corresponden a los niveles más bajos de ADN blanco desaparecen, y a las concentraciones de ácido húmico de 80 ng y a concentraciones superiores, ninguna banda es visible. Las cantidades variadas de ADN blanco de S. fragüe permiten proporcionar las cantidades esperadas del producto de la PCR cuando, antes de la amplificación, el ADN de S. fragüe se mezcla con el ADN de Streptomyces hygroscopicus, y se agrega a la mezcla PCR de 50 µl en una gama de 100 pg a 1 µg con el fin de simular el ADN no blanco liberado a partir de la microflora de suelo. 2.9 CUANTIFICACION DE LOS ACTINOMICETOS NATIVOS DEL SUELO DESPUÉS DE DIFERENTES TRATAMIENTOS DE LISADO: Se aplica el protocolo de purificación D, seguido de una amplificación por PCR como se describe anteriormente, con el fin de cuantificar los actinomicetos que pertenecen al género Streptosporangi um en el suelo no. 3 después de la extracción de acuerdo a los protocolos no. 1, 2, 3, 5a y 5b (figura 5) . Después de la trituración, (protocolo no. 2) la cantidad de ADN blanco que proviene de estos actinomicetos se estima por hibridación (Dot Blot) y radioformación de imágenes como de 2.5 +/-1, 3 ng/g de peso de suelo seco. Si se postula que el contenido de ADN es de 10 fg or célula, como para Streptomyces (Gladek et al. 1984), este 8ú **** .!..**** .... *..**,** ^t*?. ***-*.*,**^á^mtM***a?*?mt^M*l**h f|MÉf|1jyi?>&.fe-A».fcA valor corresponde a aproximadamente 2.5 x 10 genomas. Valores similares se han obtenido después de otros tratamientos de lisado (respectivamente 2.6 +/-1.1 y 1.8 +/- 1.3 ng de ADN/g de suelo seco utilizando respectivamente los protocolos 3 y 4b) . 2.10 EFICIENCIA DE LA RECUPERACIÓN DEL ADN A PARTIR DE SUELOS PREVIAMENTE INOCULADOS CON BACTERIAS: Tres suelos (no. 2, 3 y 5), se inoculan con esporas o hifas de Streptomyces lividans a diferentes concentraciones (ver sección Materiales y Métodos) . La cantidad de micelio agregado al suelo (figura 6b) corresponde al número de esporas inoculadas en el medio de germinación.
Aproximadamente 50% de estas esporas germinan. El número exacto de células en las hifas de las esporas germinadas no se determina. En consecuencia, las cantidades de esporas y de micelio sembradas en los suelos no son comparables directamente. Para cada muestra de suelo, el protocolo de extracción no. 6, el método de purificación D, y la amplificación por PCR combinada con la hibridación sobre manchas (Dot Blot) y la formación de imágenes por fosforescencia (fosfoformación de imágenes), se utilizan para enumerar los ADN blanco específicos que se liberan. El ADN extraído puede distinguirse claramente del ruido de fondo solamente cuando el número de esporas agregadas sobrepasa 105, para los suelos no. 3 y no. 5 y 107 para el suelo no. 2 (figura 6a) . Cuando el micelio se agrega, el ADN extraído puede detectarse más allá de una cantidad que corresponde a 103 esporas/g de suelo para los suelos no. 2 y no. 3, y más allá de 107 esporas/g para el suelo no. 5 (figura b) . Por encima del nivel de detección, la señal de hibridación aumenta con las cantidades crecientes de las células inoculadas. Para el inoculo de las esporas, un aumento de 100 veces en el número de células sembradas conduce a un aumento de casi 100, debido al rendimiento del ADN. Este aumento es claramente inferior cuando las hifas son inoculadas, particularmente en los suelos no. 2 y no. 3 (figura 6) . Por el contrario, los resultados obtenidos con el ADN del fago lambda se utiliza como inoculo, el ADN se recupera igualmente a partir del suelo rico en arcilla (no. 5), cuando las célula bacterianas se utilizan como inoculo. Sin embargo, para este último también, el tratamiento por ARN aumenta la recuperación del ADN de Streptomyces a partir de este suelo, a la vez para las esporas y el micelio (figura 6) . El hecho de sembrar los suelos con células vegetales de Ba cill us an thracis proporciona tasas de recuperación similares a aquellas obtenidas para Streptomyces . Además, las tasas de recuperación de ADN a partir del suelo no. 5 aumentan después del tratamiento por ARN igualmente para este inoculo.
Ejemplo 2 : Construcción de un banco de ADN de bajo peso molecular (<10 kb) a partir de un suelo contaminado con lindano : clonación y expresión del gen llnA Este ejemplo describe la construcción de una biblioteca de ADN del suelo en E. coli . Permite demostrar la clonación y expresión de los genes de tamaño pequeño procedentes de una microflora no cultivable. El lindano es un plagicida organoclorado, recalcitrante a la -degradación y que persiste en el medio ambiente. En un medio aerobio, su degradación es catalizada por una deshidroclorinasa, codificada por el gen linA, que permite transformar el lindano en 1, 2, 4-triclorobenceno. El gen linA no se ha identificado más que en dos cepas aisladas del suelo: Sphingomonas pa ucimobilis, aislada en Japón (Seeno et Wada 1989, Imai et al 1991, Nagata et al 1993) y Rhodanoba cter líndani clasti cus aislada en Francia (Thomas et al 1996, Nalin et al 1999) . íiAljii ii ÉrfÉ?i}? ÍÍír?l"""--'-----iia*^a¿'-t-?f^-- ****** ****t-*~-. *.*?*^****^***' *á***?*??*t**f** *&*>!§!- Sin embargo, el potencial de degradación del lindano puesto en evidencia por la dosificación de los iones cloruros librados y la amplificación por PCR del gen linA a partir de suelos que hayan estado en contacto o no con el lindano, parece propagarse grandemente en el medio ambiente (Biesiekierska-Galguen, 1997) . 1. Extracción directa del ADN del suelo Los suelos secos son triturados durante 10 minutos en un triturador de fuerza centrífuga Restch equipado con 6 bolas de tungsteno. 10 gramos de suelo triturado son puestos en suspensión en 50 ml de amortiguador TENP a pH 9 (Tris 50 mM, EDTA 20 mM, NaCl 100 mM, polivinilpolipirrolidona al 1% peso/volumen) , y homogenizados en un vórtice durante 10 minutos. Después de la centrifugación de 5 minutos, 4000 g a 4°C, el sobrenadante se precipita con acetato de sodio (3M, pH 5.2) e isopropanol, para volverse a tomar en un amortiguador TE estéril (Tris 10 mM, EDTA 1 mM, pH 8.0). El ADN extraído es purificado a continuación sobre una columna de tamizado molecular S400 (Pharmacia) , y sobre una columna intercambiadora de iones (Schleicher et Schuell), de acuerdo con las instrucciones de los fabricantes, después se conserva en TE.
^Aß&á X* "S¡ r . Construcción del banco de ADN extraído del suelo en el vector pBluescript SK- El vector pBluescript SK- y el ADN extraído del suelo son cada uno digeridos por las enzimas HindIII y BamHl 5 (Roche) a razón de 10 unidades de enzimas por 1 µg de ADN (incubación de 2 horas a 37°C) . Los ADN son a continuación ligados por la acción del ADN ligasa T4 (Roche) , una noche a 15 °C, a razón de una unidad de enzima por 300 ng de ADN (aproximadamente 200 ng de ADN insertado y 100 ng de vector 10 digerido) . Las células de Escherichia coli electrocompetentes, ElectroMAX DH10B™ (Gibco BRL) son transformadas por la mezcla de ligación (2 µl) por electroporación (25 µF, 200 y 500 O, 2.5 kV) (Biorad Gene Pulser) . 15 Después de una hora de incubación en el medio LB, las células transformadas son diluidas de manera que se obtienen aproximadamente 100 colonias por caja, después son repartidas sobre medio LB (10 g/1 de Triptona, 5 g/1 de extracto de levadura, 5 g de /NaCl) adicionado con Ampicilina 20 (100 mg/l), con ?-HCH (500 mg/l), con X-gal 60 mg/l (5-bromo- 4-cloro-3-indolil-a-D-galactosido) , y IPTG 40 mg/l (isopropiltio-ß-D-galactosido) , y se incuban una noche a 37°C. El ?-hexaclorociclohexano (merck-Schuchardt ) es ínsoluble en agua, se prepara una solución de 50 g/1 en DMSO (dimetil sulfóxido) (Sigma) . Se obtiene así un banco de 10 000 clones. 3. Clonación y expresión del gen linA El tamizado de un banco se efectúa por visualización de un halo de degradación de lindano alrededor de la colonia (el lindano precipita en los medios de cultivo) . Sobre 10 000 clonas tamizadas, 35 presentan así una actividad de degradación de lindano. La presencia del gen linA en estas clonas se puede continuar por PCR gracias a los cebadores específicos, descritos por Thomas et al (1996) . Las digestiones realizadas sobre los insertos así como sobre los productos de amplificación muestran perfiles idénticos entre todos los clones tamizados y el testigo de referencia R . lindaniclasti cus . Los clones que aportan el gen linA presentan igualmente un inserto del mismo tamaño (aproximadamente 4 kb) . Puede demostrarse así que el ADN del suelo puede clonarse y expresarse en un huésped heterólogo: E. coli , y que los genes que provienen de una microflora difícilmente cultivable pueden ser expresados. Los bancos realizados a partir de la digestión parcial del ADN extraído del suelo por las enzimas de restricción tales como Sa u3Al , son por lo tanto también considerables.
EJEMPLO 3: Procedimiento de preparación de una colección de ácidos nucleicos a partir de una muestra del suelo, que comprende una etapa de extracción indirecta del ADN. 1. MATERIAL Y MÉTODOS 1.1 Extracción de la fracción bacteriana del suelo . 5 gramos del suelo son dispersados en 50 ml de NaCla al 0.8% estéril, por trituración en un Waring Blender durante 3 x 1 minuto, con enfriamiento en hielo entre cada trituración. Las células bacterianas son entonces separadas de las partículas del suelo por centrifugación sobre un colchón de densidad de Nycodenz (Nycomed Pharma AS, Oslo, Noruega). En un tubo de centrifugación, 11.6 ml de una solución de Nycodenz de densidad de 1.3 g por ml"1 (8 g de Nycodenz suspendidos en 10 ml de agua estéril) , son colocados debajo de 25 ml de la suspensión de suelo obtenida anteriormente. Después de la centrifugación a 10.000 g en un rotor de recipientes móviles (rotor TST 28.38, Kontron) durante 40 minutos a 4°C, el anillo celular, que se sitúa en la interfase de la fase acuosa y la fase de Nycodenz, se toma, se lavan 25 ml de agua estéril y se centrifuga a 10.000 g durante 20 minutos. El residuo celular es tomado a continuación a una solución de Tris 10 mM; EDTA 100 mMn, pH 8.0. Previamente la dispersión del suelo en Waring Blender, puede incluirse una etapa de enriquecimiento del suelo en una solución de extracto de levadura, con el fin de permitir especialmente la germinación de las esporas bacterianas del suelo 5 g del suelo son entonces incubados en 50 ml de una solución estéril de NaCl del 0.8% - extracto de levadura al 6%, durante 30 minutos a 40 °C. El extracto de levadura se elimina por centrifugación a 5000 rpm durante 10 minutos con el fin de evitar la formación de espuma durante la trituración. 1.2 Lisado de las células bacterianas del suelo - Lisado , de las cél ulas en medio líquido y purifica ción sobre gradien te de cloruro de cesio Son usadas en una solución de Tris 10 mM, EDTA 100 mM, pH 8.0 que contienen 5 mg por ml"1 de lisozima y 0.5 mg por ml"1 de acromopeptidasa durante 1 hora a 37 °C. Una solución de lauril sarcosilo (1% final) y de proteinasa K (2 mg por ml"1) , se agrega a continuación y se incuba a 37°C durante 30 minutos. La solución de ADN es entonces purificada sobre un gradiente de densidad de cloruro de cesio por centrifugación a 35 000 rpm durante 36 horas sobre un rotor Kontron 65.13. EL gradiente de cloruro de cesio empleado es un gradiente de 1 g/ml de CsCl, que posee un índice de refracción de 1,3860 (Sambrook et al., 1989).
- Lisado de las células después de la inclusión en un bloque de agarosa . Las células son mezcladas con un volumen igual de agarosa al 1.5% (peso/volumen) Seaplaque (Agarose Seaplaque FMC Products. TEBU, Le Perray en Yvelines, Francia), de bajo punto de fusión e incluidas en un bloque de 100 µl . Los bloques son a continuación incubados en una solución de lisado: EDTA 250 mM, sacarosa al 10.3%, lisozima 5 mg por ml"1 y acromopeptidasa 0.5 mg por ml"1 a 37 °C durante 3 horas. Los bloques son entonces lavados en una solución de Tris 10 mM -EDTA 500 mM e incubados una noche a 37° c en el EDTA 500 mM que contienen 1 mg- por ml"1 de proteinasa K y lauril sarcosilo al 1%. Después de varios lavados en Tris-EDTA, los bloques son conservados en el EDTA 500 mM: La calidad del ADN así extraído es controlada por electroforesis en campos pulsátiles. La cantidad del ADN extraído se evalúa sobre un gel de electroforesis con respecto a una escala patrón del ADN de timo de becerro. 1.3 Caracterización molecular del ADN extraído del suelo Los ADN extraídos del suelo son caracterizados por hibridación por PCR, método que consiste en amplificar en un primer tiempo los ADN con la ayuda de cebadores situados sobre las regiones universalmente conservadas del gen del ARNrl6S, después de hibridar los ADN amplificados con diferentes ondas oligonucleotídicas de especificidad conocida (tabla 4), con el objeto de cuantificar la intensidad de la señal de hibridación con respecto a una escala patrón externa del ADN genómico. Los ADN extraídos del suelo así como los ADN genómicos extraídos de los cultivos puros son amplificados con los cebadores FGPS 612-669 (tabla 1), en condiciones estándar de amplificación por PCR. Los productos de amplificación son desnaturalizados a continuación por un volumen igual de NaOH ÍN, depositados sobre una membrana de Nylon (GeneScreen Plus, Life Science Products) e hidridados con una sonda oligonucleotídica marcada en su extremo por el g32P ATP por la acción de la oligonucleótido cinasa T4. Después de la prehibpdación de la membrana de una solución de 20 ml que contiene 6 ml de SSC 20X, 1 ml de solución de Denhardt, 1 ml de SDS al 10% y 5 mg de ADN heterólogo de esperma de salmón, las hibridaciones son conducidas durante una noche a la temperatura definida para la sonda. Las membranas son lavadas dos veces en SSC 2X durante 5 minutos a temperatura ambiente, después una vez en SSC 2X SDS al 0.11% y una segunda vez en SSC IX, SDS al 0.1% durante 30 minutos a la temperatura de hibridación. Las señales de hibridación son cuantificadas con ayuda de lógico Molecular Analyst (Biorad, Ivry sur Seine, Francia) y las cantidades de ADN son estimadas por interpolación de las curvas patrón obtenidas a partir del ADN genómico. 2. RESULTADOS Y DISCUSIÓN 2.1 Extracción y lisado de la fracción bacteriana del suelo La separación de las células microbianas de las partículas del suelo, previamente la extracción del ADN, es una alternativa que .presenta numerosas ventajas con respecto a los métodos de extracción directa del ADN en el suelo. En efecto, la extracción de la fracción microbiana limita la contaminación del extracto de ADN por el ADN extracelular presente libremente en el suelo o por el ADN de origen eucariote. Pero sobre todo, el ADN extraído de la fracción microbiana del suelo presenta fragmentos de tamaño más grande y una mejor integridad que el ADN extraído por lisado directo JACOBSON y RASMUSSEN (1992). Además, la separación de las partículas del suelo permiten evitar una contaminación del extracto de ADN por los compuestos húmicos y fenólicos, ^H compuestos que puedan, por lo tanto, perjudicar gravemente las eficiencias de la clonación. Una de las etapas determinantes para la extracción de las células del suelo es la dispersión de la muestra del suelo con el fin de disociar las células que se adhieren a la superficie o al interior de los agregados de partículas de suelo. Tres ciclos de trituración sucesivos de un minuto cada uno, permiten obtener una mejor eficiencia de extracción de las células, así como una cantidad más grande de ADN recuperado, con respecto a un microciclo de duración de un minuto 30. La tabla 5 reporta las eficiencias de extracción obtenidas después de la centrifugación sobre el gradiente de Nycodenz, sobre la microflora total viable (enumerada por microscopía después de la coloración con anaranjado de acridina) sobre la microflora total cultivable (enumerada sobre el medio sólido tripticasa-soya al 10%), y sobre la microflora de actinomicetos cultivables sobre el medio HV agar (después de la incubación a 40°C en una solución de extracto de levadura al 6%-SDS al 0.05%, con el fin de provocar la germinación de las esporas) . Por otra parte, el ADN extraído se cuantifica ya sea después de un lisado de las células en medio líquido (sin purificación sobre el gradiente de cloruro de cesio) , o ya sea después de un lisado de las células incluidas en un bloque de agarosa (después de la digestión de agarosa por una b-agarosa) . Los resultados muestran que más del 14% de la microflora telúrica total se recupera por este método (2 por 108 células por gramo de suelo) , y que la microflora total cultivable no representa más que apenas el 2% de la población microbiana total. Por otra parte, la cantidad de ADN extraído de las células es de 330 ng por gramo de suelo seco. Estimando el contenido de ADN por célula microbiana del suelo entre 1.6 y 2.4 fg, y tomando en cuenta la cantidad de células extraídas (2 por 108 células por gramo de suelo) , se puede estimar que la casi totalidad de las células se ha lisado, y que así, el lisado no aporta una desviación importante a este método. Las electroforesis en campos por impulsos han mostrado que el ADN del suelo extraído después del gradiente de Nicodenz y de CaCl puede alcanzar un tamaño de 150 kb y que el lisado del bloque de agarosa permite extraer fragmentos superiores a 600 kb. Estos resultados confirman el interés de este método independiente del cultivo para la construcción de bancos de ADN del medio ambiente, y se presenta como una alternativa a los métodos directos de extracción de ADN. *....*****f *fi 2.2. Caracterización molecular del ADN extraído del suelo El objeto de la caracterización molecular del ADN extraído del suelo es obtener perfiles que representen las proporciones de los diferentes taxones bacterianos presentes en el extracto de ADN. Se trata igualmente de conocer las desviaciones de extracción inducidas por la separación previa de la reacción celular del suelo, en comparación con un método de extracción directo que carece de visualización directa de la diversidad microbiana presente en los suelos. En efecto, poca información se ha reunido sobre la extracción de las células sobre un gradiente de Nicodenz en función de su estructura morfológica (diámetro de las células, formas filamentosas o esporuladas) . Los métodos hasta ahora en venta están basados sobre : - hibridaciones cuantitativas que utilizan sondas oligonucleotídicas específicas a diferentes grupos bacterianos aplicados directamente al ADN extraídos del medio ambiente. Desafortunadamente este método, no es muy sensible y no permite detectarlos géneros o los grpoe ta: n?raoos presaites en escasa abundancia AMANN (1995) . - PCR cuantitativas tales como la MPN-PCR (Número Más Probable) SYKES et al. (1992) o la PCR cuantitativa por competencia DIVIACCO et al. (1993) . Los inconvenientes ********.*****,******!**.**...* ....... ,^.l,^^.....^^^^«^-t¿*'-''''«l-«^'f^>- respectivos de cada uno de estos métodos son (i) la pesadez del uso debido a la multiplicación de las diluciones y las repeticiones que vuelve la técnica inapropiada para un gran número de muestras o de pared de cebadores, y (ii) la necesidad de construir un competidor específico del ADN blanco y que no induzca desviación en la competencia. El método expuesto en la presente invención consiste de amplificar universalmente un fragmento de 700 pb en el interior de la secuencia de ADNr 16S, e hibridar este amplificado con una sonda oligonucleotídica de especificidad variable (a nivel de reino, del orden, de la atolase o del género) y de comparar la intensidad de hibridación de la muestra con respecto a una escala patrón externa. La amplificación previa a la hibridación permite cuantificar los géneros o las especies de microorganismos poco abundante. Además, la amplificación por cebadores universales permite, al momento de la hibridación, utilizar una gran serie de sondas oligonucleotídicas. Permite comparar entre los diferentes modos de lisados (extracción directa o indirecta), sobre los grupos taxonómicos bien definidos. Los resultados son reunidos en la tabla 6. Se muestran los perfiles similares entre los dos métodos de extracción (directa e indirecta) así, parece que la extracción previa de la fracción microbiana telúrica no introduce desviaciones efectivas entre los taxones aprobados. . ********** ***** *** y*-**** ****** ***at??u?i?„- ifiri|| i- tt¿^ *****-******** ** **? _?t~**¿_m*? Al La única diferencia significativa entre los dos métodos de extracción parece ser la abundancia más grande de secuencias de ADN que pertenecen a las ? proteobacterias en el extracto por el método de extracción indirecta. Además, se observa un efecto significativo de la incubación de la muestra de suelo en una solución de extracto de levadura sobre las poblaciones esporuladas del suelo (Gram+, bajo porcentaje de GS y Actinomicetos) . Esta etapa provoca la germinación de las esporas, y permite por una parte ciertamente una mejor recuperación de este tipo de células y por otra parte una eficiencia más grande de lisado sobre las células en germinación. Este método permite un análisis semicuantitativo, dirigido sobre los principales taxones definidos a partir de microorganismos cultivados y habitualmente encontrados en los suelos. Solamente las herramientas moleculares permiten estimar la importancia de los diferentes taxones, los métodos de cultivo son muy restrictivos y dependientes de la especificidad del medio utilizado. Los resultados muestran que una gran parte de la población microbiana no está representada en los grupos filogenéticos descritos, poniendo así la evidencia la existencia de numerosos grupos compuestos de microorganismos no cultivados hasta el presente, o no cultivables. >¡f Así, las sondas novedosas pueden definirse a partir de secuencias determinadas a partir del ADN extraído del suelo (filos novedosos compuestos de microorganismos no cultivados, LUDWIG et al. (1997) con el fin de obtener una 5 imagen más exacta de la composición del extracto de ADN.
Ejemplo 4: CONSTRUCCIÓN DEL COSMIDO POS 7001 Caracteristicas de POS 7001 10 Duplicativo en E. coli Integrativo en Streptomyces Seleccionable en E. coli AmpR, HygroR y Streptomyces HygroR Las propiedades del cósmido permiten insertar 15 grandes fragmentos de ADN entre 30 y 40 kb. Comprende 1- El promotor inducible tipA de Streptomyces lividans 2- El sistema de integración específicco del 20 elemento pSAM2 3- El gen de resistencia a la higromicina 4- El cósmido pWEDl, derivado de pWED15 -***-*--** .* *l*í**¡* **u**?******Jt*¡]t?t?uut** i 1)- El promotor inducible del gen tip A de S. livxdans El gen tipA codifica una proteína de 19 kb cuya transcripción es inducida por el antibiótico triostrepton o nosiheptido. El promotor de tipA está bien regulado: inducción en fase exponencial y en fase estacionaria (200X) Murakami T. Holt TG, Thompson Cj . J. Bacteriol 1989; 171: 1459-66. 2)- El gen de resistencia a la higromicina Higromicina: antibiótico producido por S. hygroscopi cus El gen de resistencia codifica una fosfotransferasa (hph) - El gen utilizado proviene de un cásete construido por Blondelet et al y en el cual el gen hyg está bajo el control de su propio promotor y del promotor par IPTG Blondelet-Rouault et al; Gene 1997; 190:315-7. 3) El sistema de integración especifico del sitio El elemento pSAM2 se integra en el cromosoma por un mecanismo de integración específico del sitio. La recombinación tiene lugar entre dos secuencias idénticas de 58 pb presentes en el plásmido (a ttP) y sobre el cromosoma (attB) . El gen int, situado en la proximidad del sitio a ttP, está situado en la integración específica del sitio de pSAM2, y su producto presenta similitudes con las integrasas de los bacteriófagos templados de heterobacterias. Se ha demostrado que un fragmento de pSAM2 no contiene más que el sitio de unión a ttP, así como el gen int que es capaz de integrarse de la misma manera que el elemento entero. Ver la patente francesa n° 88 06638 del 18/05/1988, así como Raynal A et al. Mol Microbiol 1998 28:333-42). 4) Construcción del cósmido pOS7001 Etapa I/El promotor TipA se aisla del plásmido pPM927 sobre un fragmento (Smokvma et al. Gene 1990- 94:53- 9) de un fragmento HindIII-BamHI de 700 pares de bases y se clona el vector pUCld (Yannish-Perron et al., 1985) digerido por HindIII/BamHI. Etapa 2/Ese fragmentt HindIII-BamHI se transfiere posteriormente del pUCld al pUC19 (Yannish-Perron et al., 1985) . Etapa 3/Un inserto BamHI-BamHI de 1500 pares de bases que porta el gen int y el sitio attp de pSAM2 se aisla del plásmido pOSintl, representado en la Figura 8, (Raynal A **?*.l*^*^ á*A* *~**..* .i*e* ?i É lí. et al. Mol Microbiol 1998 28:333-42) y su clon en el sitio BamHl del vector anterior (pUCl9/TipA) , en la orientación permite poner el gen int bajo el control del promotor TipA. Etapa 4/E1 sitio BamHl situado en 5' del gen int se suprime por digestión parcial con BamHl, después del tratamiento por la enzima Klenow. Un fragmento HindIII-BamHI que porta a TipA-int-att.P se aisla así de pUC19 y se transforma en pBR322 HindIII/BamHI . Etapa 5/EL cásete de Higromicina aislado de pHP45Ohyg (Blondelet-Rouault et al., 1997) sobre el fragmento HindIII.HindIII se clona en el sitio HindIII situado en corriente arriba del promotor TipA. Etapa 6/EL sitio HindIII situado entre el cásete OHyg y el promotor TipA se suprime por tratamiento Klenow después de la digestión parcial con HindIII. Etapa 7/E1 plásmido obtenido que procede de la etapa anterior permite aislar un fragmento único HinglII-BamHI, que porta todos los elementos OHyg/TipA/int attP, que se clona después del tratamiento con Klenow en el sitio EcoRV del cósmido pWEDl . El cósmido pWEDl, representado en la Figura 9, deriva del cósmido pWE15, representado en la Figura 10 (Wahl GNM, et al. Proc Natl Acad Sci USA 1987 84:2160-4) por supresión de un fragmento Hpal-Hpal que porta el gen de Neomicma y el origen SV40.
Una gráfica del vector pOS 7001 se representa en la Figura 11 Ejemplo 5: Construcción de varios cósmidos conjugativos e integrativos en Streptoxayces los vectores pOSV 303, pOSV306 y pOSV307 5.1. Construcción del vector pOSV303. Dado que el empaquetado selecciona las clonas que tengan un tamaño superior a 30 kb, solamente del 10 al 15% de los clones no contienen inserto, por lo tanto, no es ciertamente necesario tener un sistema de selección de los recombinantes, lo que permite construir un vector más pequeño .
Construcción : Etapa 1 : el vector pOSVOOl Clonación de un fragmento de Pstl-Pstl de 800 pares de bases que porta el origen de la transferencia OriT del replicón RK2 (Guiney et al., 1983) en el plásmido pUC19 abierto por Pstl. Esta etapa de clonación permite obtener un vector transferible de E. col i a Streptomyces por conjugación. La gráfica del vector pOVS 001 se representa en la Figura 17.
Etapa 2: el vector pOSV002 Inserción del marcador de higromicina (cásete Ohyg) , y seleccionable en Streptomyces, de manera que el género que contiene la resistencia a la higromicina sea transferido al último lo que permite asegurar la transferencia completa del BAC con el inserto de ADN de suelo. Clonación del cásete de Higromicina aislado de pHP45Ohyg sobre un fragmento HindIII-HindIII que porta el gen de resistencia a la Higromicina. Este fragmento se clona en el sitio Pstl (posición 201) del vector pOSVOOl. Este sitio Pstl se elige, tomando en cuenta el sentido de la transferencia, para que el marcador Hygro sea el último transferido al momento de la conjugación. Los extremos Pstl y HindIII se vuelven compatibles después del tratamiento con el fragmento Klenow del ADN polimerasa que permite generar a las "puntas libres". La orientación del fragmento Ohyg se determina al final de la construcción. La gráfica del vector pOSV2002 se representa en la Figura 18.
Etapa 3: el vector pOSVOlO El fragmento Xbal-HindIII aislado del plásmido pOSV2002 y que contiene el marcador de resistencia a la higromicina y el origen de tr^psferencia, se clona en el plásmido pOSint 1 digerido por Xbal y HindIII. La orientación de los sitios es tal que el marcador de higromicina será siempre transferido al final. El plásmido pOSintl, representado en la Figura 8, se describe en el artículo de Raynal et al. (Raynal A et al. Mol Microbiol 1998 28:333-42). Esta construcción permite la expresión de la integrasa en E. coli y en Streptomyces .
Etapa 4: inserción del sitio "eos" El principio es insertar un sitio "eos" en el plásmido pOSVOlO, que permite el empaquetado en el plásmido pOSVOlO, representado en la Figura 12. La obtención del fragmento "eos" se representa en la Figura 13. Este fragmento se obtiene por PCR. A partir de un fragmento que porta los fragmentos cohesivos (eos), de ? (bacteriófago lambda o cósmido pHC79) , se realiza una amplificación por PCR con ayuda de los oligonucleótidos que correspondan a las secuencias -50/+130 con respecto al punto eos. Estos oligonucleótidos contienen además de los sitios de clonación Nsil, compatible Pstl, Xhol, compatible Salí, EcoRV, "punta libre".
La adición de sitios raros permite aislar Swal y Pací y/o cartografiar el inserto clonado. El fragmento PCR está limitado por un sitio Pstl en el extremo 5' y por un sitio HindII en el extremo 3' , lo que permite la clonación en el vector pOSVOlO (Figura 12) previamente digerido por las enzimas Nsil y EcoRV, lo que provoca la supresión del represor laclq. La gráfica del vector pOSV303 se representa en la Figura 14. El vector pOSV303, que contiene los sitios de clonación tales como el sitio Nsil, compatible Pstl, el sitio Xho, compatible Salí o incluso el sitio EcoRV para la obtención de "puntas libres". 5.2 Construcción del vector pOSV306 Etapa 1 : Construcción del vector pOSV308. El vector pOSV308 se construye de acuerdo con el procedimiento ilustrado en la Figura 27. Un fragmento de 643 pb que contiene la región eos se amplifica con la ayuda de un par de cebadores de las secuencias SEQ ID NO: 107 y SEQ ID NO: 108 a partir del vector cósmido pHc79 descrito por HOHM B y COLLINS (1980) . Este fragmento nucleotídico amplificado se clona directamente en el vector pGEMT, comercializado por la Sociedad PROMEGA, como se ilustra en la figura 27, con el fin de producir el vector pOSV308.
Etapa 2 : Construcción del vector pOSV306. El vector pOSVOlO se construye como se describe en la etapa 3 de construcción del vector pOSV303, como se describe en el párrafo 5.1 del presente ejemplo. El vector pOSVIO se digiere por las enzimas EcoRV y Nsil con el fin de escindir un fragmento de 7874 pb que se purifica posteriormente, como se ilustra en la figura 28. Después, el vector pOSV308 obtenido en la etapa 1) anterior, se somete a una digestión por las enzimas EcORV y Pstl con el fin de escindir un fragmento de 617 pb, que se purifica posteriormente. Después del fragmento eos de 617 pb obtenido a partir del vector pOSV308, se integra por ligación en el vector pOSVIO, con el fin de obtener el vector pOSV306 como se ilustra en la figura 28. 5.3 Construcción del vector pOSV307. El cósmido pOSV307 que contiene siempre el gen Laclq, con el fin de mejorar la estabilidad del cósmido en Streptomyces, por ejemplo en la cepa S17-1 de Streptomyces . Con el fin de contener el vector pOSV307 se somete el vector pOSVOHO a una digestión por enzima, para obtener un fragmento de 8761 pb que se purifica, después se desfosforilacidn.
A continuación, el vector pOSV308, tal como el obtenido como se describe en la etapa 1) del párrafo 5.2 anterior, se digiere por la enzima EcoRI con el fin de obtener un fragmento de 663 pb, que a continuación se purifica y trata por la enzima de Klenow. El fragmento nucleotídico así tratado se integra en el vector pOSVOlO después de la ligación con el fin de obtener el vector pOSV307, como se ilustra en la figura 29.
Ejemplo 6: Construcción del cósmido duplicativo satélite E. coli- Streptomyces pOS700R Los fragmentos del plásmido pE16 (Volff et al., 1996) representado en la Figura 15, se aislan y tratan por Klenow. Estos fragmentos contienen las secuencias necesarias para la duplicación y la estabilidad que proviene del plásmido SCP2. Estos dos fragmentos son insertados de manera separada en el sitio EcoRV del cósmido pWEDl que conduce a dos clones diferentes. El cásete de higromicma aislado de pHP45Ohyg sobre un fragmento HindIII-HindIII se clona en el sitio HindII de los cósmidos pWEDl que contiene el inserto ScP2 bajo la forma de fragmentos Pstl-EcoRi o Xbal. Confiere una resistencia a i^^a ?^?SáiU??^*»^^****^^*^*^^ '*' la higromicina seleccionable a la vez en E. coli y en Streptomyces. Transformación de S . lividans y determinación de la eficiencia de la transformación. Parece que el cósmido que contiene el inserto Xbal es menos estable que aquel que contiene el fragmento Pstl EcoRl. Es por esto que este último ha sido retenido bajo el nombre de pOS700R. La gráfica del vector pOS 700R se representa en la 0 Figura 16.
Ejemplo 7: Eficiencia de transformación de los vectores integrativos (pOS7001) y duplicativos Posibilidades 5 Hacer a la cepa de S. lividans resistente al tiostrepton por la integración del cósmido pTOl que porta el marcador de resistencia al tioestrepton. Preparación de protoplastos a partir de S . lividans cultivado en presencia de tioestrepton. 0 Con el vector pOS7001, la eficiencia de transformación es de aproximadamente 3000 transformantes por µg de ADN. El vector pOS700R, la eficiencia de transformación es de aproximadamente 30 000 por µg de ADN.
*Jsat^ ¡ ^t^^m?m* i??¡ M Ejemplo 8: Construcción de un vector BAC integrativo en Streptomyces y conjugativo Características Duplicativo en E. coli Transferible por conjugación de E. coli a Streptomyces Integrativo en Strepto/nyces Seleccionable en E. coli y Streptomyces Capaz de insertar grandes fragmentos de ADN; debe señalarse que es necesario disponer ADN del suelo cuyo tamaño es comprendido entre 100 y 300 kb y no contaminado por pequeños fragmentos. En efecto, los pequeños fragmentos son integrados de manera muy preferida. Dotar de un tamiz que permita seleccionar los plásmidos que porten un inserto. Este tamiz permite eliminar los vectores cerrados sobre ellos mismos y no digeridos para trabajar con una relación más elevada entre el vector y el ADN a insertarse, lo que permite tener una mejor eficiencia de clonación para constituir los bancos .
**?*^?.M?..*¡i t*lt¡á* . ¡**k l ******** Construcción : Etapa 1: el vector pOSVOOl Clonación de un fragmento PStl-Pstl de 800 pares de bases que portan el origen de transferencia OriT del replicón RK2 (Guiney et al., 1983) en el plásmido pUC19 abierto por Pstl. Esta etapa de clonación permite obtener un vector transferible de E. coli a Streptomyces por conjugación. La gráfica del vector pOSV 001 se representa en la Figura 17.
Etapa 2 : el vector pOSV002 Inserción del marcador de Higromicina (cásete Ohyg) , y seleccionable en Streptomyces, de manera que el gen que confiera resistencia a la higromicina sea transferido al último lo que permite asegurar la transferencia completa del BAC con el inserto de ADN del suelo. Clonación del cásete de higromicina aislado de pHP45Ohyg sobre un fragmento HindIII-HindIII que porta el gen de resistencia a la higromicina. Este fragmento se clona en el sitio Pstl (Posición 201) del vector pOSVOOl. Este sitio Pstl se elige, tomando en cuenta el sentido de la transferencia, para que el marcador Higro sea el último transferido al momento de la conjugación. Los extremos Pstl y 111 Ii i - jfirti iJaaA aaaa. ^^^ iiafcl n .fe HindIII se vuelven compatibles después del tratamiento con el fragmento Klenow del ADN polimerasa que permite generar a las "puntas libres". La orientación del fragmento Ohyg se determina al final de la construcción. La gráfica del vector pOSV002 se representa en la Figura 18.
Etapa 3: el vector pOSVOlO El fragmento Xbal-HindIII se aisla del plásmido pOSV002 y contiene el marcador de resistencia a la higromicina y el origen de la transferencia se clona en el plásmido pOSintl digerido porXbal y HindIII. La orientación de los sitios es tal que el marcador de hidromicina será siempre transferido al último. El plásmido pOSintl, representado en la Figura 8, se describe en el artículo de Raynal et al. (Raynal A et al.
Mol Microbiol 1998 28:333-42). Esta construcción permite expresión de la integrasa en E. coli y con Streptomyces .
Etapa 4 : el vector pOSV01 Adición de un "cásete" que permite al término, seleccionar en la construcción final los plásmidos que hayan sido insertados con el ADN extraño. n?^, A. . < **. *^í* ,.^.* ..*-. *************** i Este "cásete" porta el gen que codific&Ü para el represor Cl del fago ? y el gen que confiere resistencia a la tetraciclina. Este gen porta en su región 5' no codificante la secuencia blanco del represor. La inserción de ADN en el sitio HindIII situado en la secuencia codificante de ci conduce a la no producción de represor y por lo tanto la expresión de la resistencia a la tetraciclina. Es portado en el plásmido pUN99 descrito en el artículo: Nilsson et al. (Nucleics Acids Res 1983, 11:8019-30) Un fragmento PvuII-HindlII aislado de pOSVOlO que contiene las secuencias Int, attP, Higro y oriT se clona en el sitio MsCI de pUN99. La gráfica del vector pOSV014 se representa en la Figura 19.
Etapa 5: El vector pOSV 403, vector BAC integrativo y conjugativo Esta ultima etapa de clonación en pBACll (representada en la Figura 20) permite conferir al plásmido final las características de BAC (Cromosoma Artificial Bacteriano) , en particular la actitud para aceptar los insertos de ADN de gran tamaño. ****i*m**- .** . .***?* ****** L*k *****íA*i**** El fragmento pStl-Pstl del vector pOSV014 que portan el conjunto de los elementos y funciones descritas anteriormente se clona en el plásmido pBACll (pBeloBACll) digerido por Notl. Los extremos se vuelven compatibles por tratamiento con la enzima de Klenow. La gráfica del vector pOSV403 se representa sobre la Figura 21. El esquema de la Figura 21 indica la orientación retenida.
Etapa 6: El vector pOSV403 que contiene los sitios HindIII y Nsil. El sitio Nsil es bastante raro en Streptomyces y presenta la ventaja de ser compatible con Pstl. Por el contrario, el sitio Pstl es frecuente en Streptomyces y puede utilizarse para efectuar las digestiones parciales. Los clones recombinantes que portan un inserto clonado en el represor Cl, y por lo tanto inactivando este represor los hace resistentes a la tetraciclina. Puesto que los BAC no están presentes más que a razón de una copia por célula, se debe seleccionar los clones recombinantes con una dosis más baja de tetraciclma que la dosis habitual de 20 µg/ml, por ejemplo con una dosis de 5 µg/ml. En estas condiciones, no hay ningún ruido de fondo.
También es posible utilizar un sistema desarrollado y comercializado por la sociedad InVitrogen, en el cual la inserción del ADN en el vector inactiva un inhibidor de la gírasa cuya expresión es tóxica para E. coli . El fragmento se aisla de preferencia a partir del vector pZErO-2 (http: //www. invitrogen .ccrn).
Ejemplo 9: Construcción de un banco de S. alboniger en los dos cósmidos integrativos (pOS7001) y duplicativo (pOS700R) 1)- Construcción del Banco Para evaluar la eficiencia del sistema de clonación, la vía de biosíntesis de la puromicina de Streptomyces albonrger, se clona en los dos cósmidos satélites pOS7001 y pOS700R. Los genes de la vía de biosíntesis de la püromicina son portados por un fragmento de ADN BamHl de aproximadamente 15 kb. El ADN genómico de Steptomyces alboniger se aisla. 90% de este ADN posee un peso molecular comprendido entre 20 y 150 kb, determinado por electroforesis con campos de impulsos . Los dos cósmidos son digeridos por la enzima BamHl (sitio único de clonación) .
Las condiciones de digestión parcial BamHl del ADN genómico se determina (50 µg de ADN y 12 unidades de enzima, 5 minutos de digestión) . Después de la verificación del tamaño por electroforesis en gel de agarosa, el ADN parcialmente digerido se introduce en los vectores. En la ligación, 15 µg de ADN genómico + 2 µg del vector integrativo o 5 µg del vector duplicativo se utilizan. Cada mezcla de ligación se utiliza para la encapsidación in vi tro de ADN en las cabezas del bacteriófago lambda. Las mezclas de encapsidación (0.5 ml) se titulan (Vector mtegrativo pOS7001 = 7.5 x 105 cósmidos/ml, Vector duplicativo = 5 x 104 cósmidos/ml) . Los cósmidos se utilizan para transfectar E. coli y generar así dos bancos de aproximadamente 25000 resistentes a la ampicilina. El ADN del conjunto de estos clones se aisla y cuantifica. Para probar los bancos, se eligen varios clones, el ADN es purificado y digerido por BamHl, con el fin de verificar la presencia y el tamaño de los insertos. Los clones probados contienen entre 20 y 35 kb del inserto de S . alboniger. 2) - Identificación de los clones que contienen la vía de biosíntesis de la puromicina Los clones susceptibles de contener la vía completa de biosíntesis de la puromicina se identifican por hibridación con una sonda que corresponde al gen de resistencia ala puromicina, el gen pac de 1.1 kb (Lacalle et al. Gene 1989; 70, 375-80) Banco hecho en el vector integrativo pOS 7001 : Entre 2000 clones analizados, 9 clones se hibridan con la sonda y ellos contiene los insertados de aproximadamente 40 kb.
Banco hecho en el vector duplicativo pOS 700R: Entre 2000 'clones analizados, 12 clones se hibridan con la sonda, contienen los insertos de aproximadamente 40 kb. Utilizando los datos publicados por Tercero et al. (J. Bíol. Chem. 1996; 271 1579-90), los clones que contiene la totalidad de vía de biosíntesis se identifican, después de la hibridación con las sondas apropiadas. Ciertos cósmidos integrativos y duplicativos presentan después de la digestión con Clal-EcoRV un fragmento de 12360 pares de bases, lo que . **. ^Ajifa^^**^^^ hace suponer un inserto que contiene la totalidad de la vía de biosíntesis de la puromicina. 4)- Verificación de la producción de puromicina por los clones resistentes (Rhóne-Poulenc) . a) Materiales y Métodos Cepas y condiciones de cultivo: Tres clones resistentes se seleccionan para verificar la producción de puromicina. Corresponden a los recombinantes de S. lividans que contienen un inserto en el vector integrativo pOS700I (G 20) o un inserto en el vector duplícativo (G21 y G22) . Las cepas de referencia se utilizan para asegurar que los medios de cultivo utilizados permiten esta - producción. Se trata de la cepa silvestre S . alboniger ATCC 12461, productora de puromicina y la cepa recombinante de S. lividans que contiene el grupo completo de la puromicina clonada en el plásmido pRCPll (Lacalle et al, 1992, the EMBO journal, 11, 785-792) (G23). Las cepas son sembradas en un medio de cultivo cuya composición es la siguiente: Peptona bacteriológica Organotechnie 5 g/1 de medio final ?.xtracto de levadura Springer 5 iia i Extracto de carne Liebig 5 Glucosa Prolabo 15 CaC03 (1) Prolabo 3 NaCl Prolabo 5 Agar (2) Difco 1 (1) Los 3g de carbonato son mezclados con 200 ml de agua destilada y después se esteriliza aparte. La adición se hace después de la esterilización. (2) El agar es fundido previamente en 100 ml de agua destilada antes de agregarse a los otros ingredientes del medio. pH ajustado a 7.2 antes de la esterilización Esterilización 25 minutos a 121°C 50 µg/1 de .higromicina y 5 µg/1 de tioestreptón son agregados al medio después de la esterilización, de manera que se mantiene una presión de selección de los clones que contiene un inserto gracias al gen marcador presente sobre el vector (el gen de resistencia al tioestreptón es portado por el plásmido pRCPll) . 50 ml de medio de cultivo líquido, repartidos en matraces erlenmeyer de 250 ml, son sembrados con 2 ml de suspensión acuosa de esporas y de micelio de cada una de las cepas. Los cultivos son incubados durante 4 días a 28°C con una agitación de 220 revoluciones/minuto. 50 ml de medio de producción, repartidos en matraces erlenmeyer de 250 ml, son a continuación sembrados con 2 ml de estos precultivos. El medio de producción utilizado es un medio de industrial optimizado para la producción de pristinamicina (medio RPR 201). Los cultivos son incubados a 28 °C, con una agitación de 220 revoluciones/minuto. Después de diferentes tiempos de incubación, un matraz erlenmeyer de cada cultivo es llevado a pH 11, después se extrae por 2 veces con 1 volumen de diclorometano. La fase orgánica se concentra en seco bajo presión reducida, después el extracto se toma por 10 µl de metanol. 100 µl de la solución metanólica son analizados por CLAP provista con un detector con pasador de diodos en un sistema de gradiente agua-acetonitrilo 0.05% de TFA Volumen/Volumen sobre una columna C18 para la detección de la puromicina. b) Resultados Los análisis CLAP comparativos a partir de los cultivos de diferentes cepas muestran la producción de puromicina en el cultivo de la cepa silvestre a partir de 24 horas de incubación. Una producción, si bien un poco baja, es también detectada netamente a partir de 48 horas en el cultivo del clon G20 que contiene el cósmido pOS700I (figura 23) . La ouromicina se detecta iaualmente en estado de traza en el clon G23 que cont?ene el operón completo que codifica para el compuesto en el plásmido pRCPll. Sin embargo, ninguna producción se observa en los cultivos de los clones G21 y G22 que contienen el cósmido pOS700R. Los resultados son reportados en la Figura 23. c) Conclusiones Los resultados obtenidos permiten demostrar la eficiencia del sistema de clonación desarrollado en el cósmido pOS700I para expresar en un huésped heterólogo, tal como el S. lividans, una vía de biosíntesis completa bajo el control de las secuencias reguladoras que le son propias. Por otra parte, estos datos validan igualmente el tamizado de los bancos obtenidos sobre la base de la resistencia de los clones a la puromicina, lo que ha conducido a identificar entre un número pequeño de clones, un recombinante capaz de expresar la vía de biosíntesis asociada al gen de resistencia. La ausencia de producción de puromicina en los otros clones puede probablemente explicarse por la clonación de una parte solamente del operón que contiene el gen de resistencia, pero desprovisto de ciertas secuencias de regulación, transducción o transcripción necesarias para la síntesis del compuesto. . -*****.****• .'***1*'* *- EJEMPLO 10: CLONACIÓN DEL ADN DEL SUELO EN LOS VECTORES 1) Preparación del ADN del suelo a clonarse Los diferentes fragmentos de ADN deben purificarse de acuerdo a su destino: Cósmidos El tamaño de las células debe estar comprendido entre 30 y 40kb. Ahora bien, el ADN extraído del suelo es heterogéneo en tamaño y comprende moléculas que alcanzan 200 ó 300 kb. Con el fin de homogenizar los tamaños, el ADN es roto mecánicamente por el paso de la solución a través de una aguja de 0.4 mm de diámetro. Los fragmentos de un tamaño cercano a 30 kb no son afectados por estos pasos repetidos a través de una aguja, y por lo tanto no es necesario hacer una separación por tamaño, sobre todo porque el empaquetado en las partículas elimina automáticamente los insertos cortos.
BAC Preparación del ADN El ADN del suelo es preparado por electroforesis por campos impulsados (tipo CHEF) , en condiciones tales que los fragmentos comprendidos entre 100 y 300 kb son concentrados en una banda de aproximadamente 5 mm. Esto se obtiene realizando la migración en un gel de agarosa normal Í **.A.?*** **?á*U *t******A***. u ***, *.* ******, t*,Li* af*» al 0.7% o de agarosa de bajo punto de fusión al 1% con un tiempo de pulsación de 100 segundos durante 20 horas y a una temperatura de 10°C.
Recuperación del ADN Se utilizan dos métodos, su elección depende del tamaño de las moléculas que se van a aislar, ya sea a 150 kb o ya sea por encima de esto.
Hasta 150 kb La porosidad de un gel de agarosa al 0.7% permite la salida del ADN por electroelución en una condición de ausencia total de bromuro de etidio. Este ADN es manipulado a continuación con instrumentos de pipeteado con un orificio ensanchado e hidrófabo para evitar la fragmentación mecánica de las moléculas.
Entre 100 y 300 kb La banda que contiene los fragmentos de un tamaño entre 100 y 300 kb es cortada. Para la migración, se utiliza un gel de agarosa al 1% y de bajo punto de fusión. Esta propiedad permite fundir el gel a una temperatura soportable para el ADN de 65°C, y de digerirlo a continuación por agarosa (Agarosa comercializada por la sociedad Boehringer) a una temperatura de 45°C siguiendo las prescripciones del fabricante. 2) Utilización de los cósmidos integrativos pOS700I y duplicativos pOS700R Construcción por colas poliA, poliT Principio Un vector cósmido, abierto en un sitio de clonación cualquiera, se modifica en los extremos 3' agregando un polmucleótido monótono. Por otra parte, el ADN a clonarse se modifica en los extremos 3' agregando un polinucleótido monótono que puede parecerse al anterior. La asociación vector-fragmento a clonarse se hace por estos polmucleótidos, y la secuencia eos del vector permite el empaqueta'do in vi tro del ADN en los cápsidos del fago lambda.
Preparación del vector El vector utilizado es un vector autoduplicativo en E . coli e integrativo en Streptomyces . Para E . col i , la selección se hace sobre la resistencia a la ampicilina y para Streptomyces, se hace sobre la resistencia a la higromicina. „¿ g!j¡g| El cósmido está abierto en uno de 2 sitios posibles (BamHl o HindIII) y los extremos 3' son alargados por poliA con terminal transferasa en condiciones donde la proporción de la enzima suministre la adición de 50 a 100 nucleótidos.
Preparación del ADN a insertarse Los extremos 3' del ADN son arreglados por poliT con la terminal transferasa en las condiciones que proporcionen un alargamiento comparable a aquel del vector. En las condiciones experimentales descritas por el fabricante, las colas poliA, poliT son de 30 a 70 bases de largo.
Empalme de las moléculas y encapsidación in vitro. Para el empalme de las moléculas, se mezcla una molécula del vector por una molécula de ADN insertado. La concentración del ADN en masa es de 500 µg.ml"1. La mezcla es encapsidada, y la eficiencia de la transfección depende de la cepa utilizada como receptora y del ADN insertado: nula con ADN probado y la cepa DH5a, la eficiencia es comparable para las cepas SURE y DH10B; con la extracción, el rendimiento del ADN es sin embargo, más elevado con la cepa DH10B.
Construcción por desfosforilación El ADN del suelo se pone en puntas libres por la eliminación de la secuencia 3' salientes, y reemplazando las secuencias 5' salientes. Esta operación se hace con: enzima de Klenow, polimerasa T4, los 4 nucleótidos trifosfatos. El vector cosmídico se digiere por BamHl, después se trata por la enzima de Klenow para formar la punta libre, después se desfosforila para evitar que se vuelva a cerrar sobre sí mismo. Después de la ligación, la mezcla se encapsida y se transfecta como se describe anteriormente. 3) Utilización de los pBAC Principio. El plásmido pBAC conjugativo e integrativo posee los sitios HindIII y. Nsil como los sitios de clonación. La inserción de una secuencia de ADN en estos sitios inactiva el represor Cl del fago lambda que controla la expresión del gen de la resistencia a la tetraciclina. La inactivación del represor vuelve por lo tanto a la molécula resistencia este antibiótico (5 µg.ml"1) . La clonación en estos sitios se facilita por la modificación del vector y la preparación del ADN a clonarse.
,!.•!' Para que el vector no se cierre sobre el mismo, el sitio Hind III se modifica: la primera base (A) se coloca en su lugar para formar una secuencia 5' saliente, que no se puede aparear con sus semejantes. La operación se efectúa por la enzima de Klenow en presencia de dATP. El éxito de la operación se verifica efectuando una ligación del vector sobre el mismo antes y después del tratamiento con la enzima de Klenow. A una cantidad de ADN probada idéntica, se obtienen 3000 clones antes del tratamiento y 60 después del tratamiento.
Preparación del ADN (tamaño comprendido entre 100 y 300kb) . Formación de las puntas libres del ADN. El ADN se pone o forma en puntas libres por la eliminación de las secuencias 3' salientes y reemplazando las secuencias 5' salientes. Esta operación se hace con: enzima de Klenow, polimerasa T4, los 4 nucleótidos trifosfatos.
Preparación de los extremos . Ejemplo HindIII La adición del ADN sobre el vector se hace por medio de los oligonucleótidos que reconocen la secuencia HindIII modificada del vector. Contienen los sitios de ,, .*J^*^^**.^*J^?*.s^í*d^? *.****^J?té? ilAi restricción raros para permitir las clonaciones posteriores (Swal; Notl) . Esta técnica se deriva de aquella de: Elledge SJ, Mulligan JT, Ramer SW, Spottswood M, Davis RW. Proc Natl Acad Sci USA 1991 Mar 1; 88 (5) : 1731-5. Se utilizan dos oligonucleótidos complementarios: Oligo 1: 5' -GCTTATTTAAATATTAATGCGGCCGCCCGGG-3' (SEQ ID NO 25) Oligo 2: 5' -CCCGGGCGGCCGCATTAATATTTAAATA-3' (SEQ ID NO 26) Son fosforilados en 5' por la polinucleótido cinasa de T4 en presencia de ATP, después de su hibridación. Esta etapa de fosforilación puede eliminarse utilizando los oligonucleótidos ya fosforilados. La ligación de este adaptador de doble hebra con ADN a insertarse en un vector se hace por la ligasa de T4 en presencia de un exceso muy grande de adaptador (1000 moléculas de adaptador por una molécula de ADN a insertarse) , en 15 horas a 14°C. El exceso de adaptador se elimina por electroforesis sobre un gel de agarosa y las moléculas de interés son recuperadas del gel por hidrólisis de este por agarosa o por electroelución.
Ligación vector-ADN. La ligación -se hace a 14°C en 15 horas con 10 moléculas de vector por una molécula de inserto. : . ***.*. Í?* U**L ** ? *M~*L*?.>. ,rij«d ??.
Transformación $ li tt La cepa receptora es la cepa DHIOB. La transformación se hace por electroporación. Para expresar la resistencia a la tetraciclina, los transformantes son incubados a 37 °C durante 1 hora en medio sin antibiótico. La selección de los clones se hace por cultivo durante una noche, sobre medio congelado LB adicionado con tetraciclina a 5 µg.ml"1.
Ejemplo 11: CONJUGACIÓN CLON A CLON ENTRE E. COL! Y STFEPTOMYCES CONJUGACIÓN ENTRE E COLI CEPA S17.1 QUE CONTIENE PPM803 Y STREPTOMYCES LIVIDANS TK 21 Introducción Es posible efectuar las conjugaciones entre E. coli y Streptomyces (Mazodier et al, 1989) . La adaptación de este método desarrolla una técnica llamada en gota, en donde se mezclan 10 µl de un cultivo de E. coli que contiene un vector recombínate con una gota de S . lividans receptora que consiste en realizar una transformación clon a clon, asegurando que al final de la operación todo el banco construido en E. coli se introduce en S . lividans . Una transformación a granel proporcionaría de manera obligatoria una multiplicación de los clones ae Streptomyces transformantes, con el fin de esta prácticamente de que el banco en E. coli está representado completamente en S. lividans . Además, este método es fácilmente automatizable .
Ensayos preliminares Conjugación entre E. coli cepa S17.1 que contiene el vector pOSV303 y S . li vidans TK21. En estas condiciones, se mezclan 6 x 106 células de E . coli con 2 x 106 esporas pregerminadas de S. lividans en un volumen final de 20 µl .
Aplicación del método Se conoce que el AND extraído de ciertos actinomicetos está modificado, y por este hecho no puede introducirse en ciertas cepas de E . coli sin que sea restringido. La cepa de E . coli DH10B que acepta estos ADN no es capaz de transferir a Streptomyces un plásmido que no contenga más que oriT, y por lo tanto es necesario construir uno. Deberá introducirse por integración en el cromosoma un derivado de RP4 capaz de proporcionar en trans todas las funciones necesarias para asegurar la transferencia de los clones recombinantes que contienen el origen de transferencia opT. *..*j^?*í.^*^tj^M *t*Ála?*^^^^^^^^?^ ^í^?a^á Ejemplo 12: Construcción de un banco cosmidico en E. coli y Streptomyces lividans : Clonación del ADN del suelo El objetivo es la construcción de una biblioteca de ADN de gran tamaño que provenga del medio ambiente, sin una etapa previa del cultivo de los microorganismos, con el objeto de tener acceso a los genes metabólicos de las bacterias (o de cualquier otro organismo) , que no sepamos cultivar en condiciones estándar de laboratorio. El procedimiento descrito se utiliza para generar un banco de ADN en Escherichia coli utilizando el cósmido satélite E. coli -S. lividans pOS700I y del ADN extraído y purificado de la fracción bacteriana e un suelo. Este último método permite obtener un ADN de gran pureza y de un tamaño promedio de 40 kb. Así, con el fin de evitar la clonación una digestión parcial del ADN extraído, se adopta una estrategia alternativa basada sobre el uso de la enzima terminal transferasa que permite agregar colas de polinucleótidos a los extremos 3' del ADN y del vector. 5 µg del ADN se extraen de 60 mg de suelo de la "Costa de San Andrés" de acuerdo con el protocolo descrito en el ejemplo 3, y se tratan con la terminal transferasa (Pharmacia) para alargar los extremos 3' con un polinucleótido monótono (poli T) (Ejemplo 10) . .^^1^ ,^^^.,.,.^,., I|ifc .^.rf,.- ' - i*****: . t********i..**a*á****c*.*.*,****i...
El cósmido integrativo pOS700I es preparado de acuerdo con el protocolo Bl, Orsay. Después de una etapa clásica de purificación en presencia de fenol/cloroformo, el ADN y el vector son empalmados mezclando una molécula de vector y una molécula de ADN insertado. La mezcla es encapsidada a continuación en las cabezas del bacteriófago lambda (equipo Amersham) que sirve para transfectar E. coli DHIOB. Las células transfectadas son a continuación sembradas sobre el medio LB agar en presencia de ampicilina para la selección de los recombinantes resistentes a este antibiótico. Un banco de aproximadamente 5000 clones de E. coli resistentes a la ampicilina se obtiene. Cada clon es sembrado en medio LB o TB + ampicilina en un pozo de microplacas (96 pozos) y se conserva. a -80°C. La secuencia en los sitios de inserción de los fragmentos del suelo en el vector pOS700I, generados durante la construcción del banco se analiza. Para esto, 17 cósmidos de los bancos se purifican y secuencian con un cebador, seq. 5' CCGCGAATTCTCATGTTTGACCG 3', que se híbrida entre el sitio BamHl y el sitio de clonación HindIII presente en el vector. Las secuencias obtenidas permiten estimar que la longitud de las colas homopoliméricas en los puntos de unión es muy variable, entre 13 y 60 poli-dA/dT. Más allá de elastómeros colas, las secuencias de los fragmentos de suelo así áÁ?.? í*i*?**?*t.*í í .. *,*.**??*M* **.* „áá*,*,,?, . ***,*.. .*****.*.** * .¡t***** ******* ^^ *. generados poseen un porcentaje en G+C entre 53 y 70%. Los porcentajes tan elevados son inesperados, pero resultados similares se han reportado ya en la preparación bruta del ADN a partir del suelo (Chatzinotas A. et al., 1998). Una estrategia de "reunión" de 48 a 96 clonas se utiliza para el análisis de la riqueza microbiana y metabólica. El ADN cosmídico extraído a partir de estos "conjuntos" de clones se utiliza a continuación para realizar los experimentos de PCR o de hibridación.
Ejemplo 13: Diversidad del ADN ribosomico 16S en el seno del ADN clonado . a) materiales y métodos Los cósmidos del banco son extraídos a partir de conjuntos de clones por lisado alcalino, después son purificados sobre un gradiente de cloruro de cesio, con el fin de tomar la banda de ADN cosmídico bajo la forma superenrollada y con el objeto de eliminar cualquier ADN cromosómico de Eschep chia coli que pueda interferir en el estudio. Después de la linearización de los cosmidos por la acción de la nucleasa SI (50 unidades, 30 minutos a 37°C), las secuencias de ADN 16S contenidas en los conjuntos de clones son amplificadas en las condiciones estándar de *** * . ********** , ***¿? i* **.? : amplificación, a partir de cebadores universales 63f (5'- CAGGCCTAACACATGCAAGTC-3' ) y 1387r (5' -GGGCGGWGTGTACAAGGC-3' ) definidos por MARCHESI et al. (1998) . Los productos de amplificación de aproximadamente 1.5 kilobases son purificados a partir del equipo de extracción en gel (Qiagen) , después se clonan directamente en el vector pCR II (Invitrogen) en Escherichia coli TOP10, de acuerdo con las instrucciones del fabricante. El inserto es entonces amplificado con la ayuda de cebadores M13 hacia adelante y M13 inverso específicos al sitio de clonación del vector pCR II. Los productos de amplificación del tamaño esperado (aproximadamente 1.7 kb) son analizados por RFLP (Restriction Fragment Length Polymorphism) con la ayuda de las enzimas Cfol, Mspl y BstUI (0.1 unidades), con el fin de seleccionar los clones a secuenciarse. Los perfiles de restricción obtenidos son separados sobre gel de agarosa Metofor al 2.5% (FMC products), que contiene 0.4 mg de bromuro de etidio por ml. Las secuencias de ADNr 16S son determinadas entonces directamente utilizando los productos de la PCR purificados por el equipo "Qiaquick extracción en gel" con la ayuda de los cebadores de secuenciamiento por Normand (1995). Los análisis efilogenéticos son obtenidos comparando las secuencias con las secuencias de ADNr 16S procariotes reunidos en la base de datos Ribosomal Datábase Project (RDP), versión 7.0 MAIDAK et al. (1999) gracias al programa SIMILITARY MATCH, que permite obtener los valores de similitud con respecto a las secuencias de la base de datos. b) Resultados Para determinar la diversidad filogenética representada en el banco, 47 secuencias de gen ARNrldS se aislan a partir de conjuntos de 288 clones y se secuencian en su casi totalidad. Los resultados son reportados en la tabla 7. El análisis de las secuencias por las interrogaciones a las bases de datos revela que la mayoría de las secuencias (>61%) presentan porcentajes de similitud inferiores o iguales a 95% con las especies bacterianas identificadas (tabla.7). Sobre las 47 secuencias analizadas, 28 secuencias tienen como vecinos más cercanos las bacterias no cultivadas, cuyas secuencias proceden directamente del ADN extraído del medio ambiente. La mayoría de estas secuencias presentan además porcentajes de similitud muy bajos (88-95%) , 17 secuencias sobre 20 difieren así más del 5% con respecto a sus vecinos más próximos . Entre las secuencias que pueden clasificarse en un grupo filético, una mayoría de las secuencias pertenecen a la subclase de las proteobactepas (18 secuencias con un porcentaje de similitud comprendido entre 89 y 99%). Un ^ité****.** ******* ?*""-*«--a' * *.** ****. * segundo grupo de secuencias esta representado por la subclase g de las proteobacterias, que comprende 9 secuencias cuyos porcentajes de similitud varían entre 84 y 99%) . Los grupos de las b-proteobacterias, d-proteobacterias, firmicutos a bajos G+C% y a altos G+C% comprenden respectivamente 1, 4, 3 y 5 secuencias. Solamente una secuencia no pudo clasificarse en el seno de los grandes grupos taxonómicos bacterianos definidos: la secuencia a22.1(19), su vecino más próximo Aerothermobacter marianas (con una similitud del 89%), es el mismo una sepa aislada del medio marino y no clasificada hasta el momento actual. Finalmente, 6 secuencias pueden clasificarse en el seno del grupo de Acidoba cteri uml Hol ophaga . Este grupo presenta la particularidad de no estar representado más que por dos bacterias cultivadas Acidobacteri um capsula tum y Holophaga foetida , el conjunto de este disco esta compuesto por bacterias donde solo el gen ARNrl6S se ha detectado por amplificación y clonación a partir del ADN extraído de la muestra del medio ambiente (principalmente del suelo), Ludwig et al (1997). Los valores más bajos de similitud entre las diferentes secuencias que componen a este grupo presagian una gran heterogeneidad y diversidad en el seno de esta grupo. El conjunto de los resultados se representa en la tabla 7.
Estos resultados muestran que las secuencias obtenidas en el banco cosmidico provendrían de microorganismos no solamente diversificados filogenéticamente sino sobre todo de microorganismos que jamas habían sido aislados hasta ahora. Los resultados del secuenciamiento del ADN amplificado permite establecer un árbol filogenético de los organismos presentes en la muestra de suelo donde las secuencias caracterizadas son originarias. El árbol filogenético representado en la Figura 7 se realiza a partir de la alineación de las secuencias por el lógico MASE (Faulner y Jurak, 1998), y corregido por el método de 2 parámetros de Kimura (1980) , con la ayuda del algoritmo Neighbour Joining (Satiou y <* Nei 1987). El análisis filogenético permite comparar las secuencias de ADNrl6S clonadas en el banco de ADN del suelo, con las secuencias de ADNrldS procariote reunidos en las bases de datos Ribosomal Datábase Project (RDP) , (versión 7.0, programa SIMILARITY-MATCH, Maidak et al 1999), y en la base GenBank gracias al lógico BLAST 2.0 (Atschul et al, 1997).
Ejemplo 14: Preselección genética del banco para la evaluación de la riqueza metabólica Para caracterizar el banco obtenido en términos de diversidad metabólica e identificar los clones que tienen los insertos que portan los genes que pueden estar implicados en las vías de biosíntesis, se ha desarrollado de acuerdo con la invención técnicas de tamizado genético basadas en los métodos de PCR, con el fin de detectar e identificar los genes PKS del tipo 1. 1 Cepas bacterianas , plásmidos y condiciones de cultivo S. coelicolor ATCC101478, S. ambofaciens NRRL2420, S . lactamandurans ATCC27382, S . rimosus ATCC109610, B. Subtilis ATCC6633 y B . licheniformis THE1856 (colección RPR) , se utiliza como fuentes de ADN para los experimentos de PCR. S . lividans TK24 es la cepa huésped utilizada para el cósmido satélite POS1700. Para la preparación del ADN genómico, de las suspenciones de esporas, de protoplastos y para la transformación de S . lividans, se han seguido los protocolos estándar descritos en Hopwood et al. (1986). Escherichia coli ToplO (INVITROGEN) se utiliza comparación huésped para la clonación de los productos de PCR y E . coli Sure (STRATAGENE) , se utiliza como huésped para el cósmido satélite pOS7001. Las condiciones de cultivo de E. coli , la preparación de los plásmidos, la digestión del ADN, ¡f . f*** .*-** I . *f******? * la electroforesis sobre gel de agarosa, se realizan siguiendo los procedimientos estándar (Sambroock et al., 1996). 2. Cebadores de PCR: Los pares de cebadores a l -al y bl-b2 se definen por el equipo de N. Bamas-Jacques y su uso se utiliza para el tamizado del ADN de las cepas puras y del banco del suelo para la búsqueda de genes que codifican el PKSI) Tabla 8: Cebadores de PCR homólogos a los genes PKSI utilizados para el tamizado del banco. al ( + ; 5' CCSCAGSAGCGCSTSTTSCTSGA3' a2 (+ ) 5' GTSCCSGTSCCGTGSGTSTCSA3' bl 5' CCSCAGSAGCGCSTSCTSCTSGA3' b2 5' GTSCCSGTSCCGTGSGCCTCSA3' Condiciones de amplificación: Para la búsqueda del PKS 1 a partir del ADN de cepas puras, la mezcla de amplificación contiene: en un volumen final de 50 µl , entre 50 y 150 ng de ADN genómico, dNTP 200 µm, MgCl 5mM final, DMSO al 7%, amortiguador lx Appligene, 0.4 µM cada cenador y 2.5U de Taq Pcli erasa lit^a^?.^?fc4^ ^ Mifaa¿?^^jL>Mia. .*<^'^ * *«» &**&f *A a Appligene. Las condiciones de amplificación utilizadas son: desnaturalización a 95°C durante 2 minutos, hibridación a 65°C durante 1 minuto, alargamiento a 72°C durante 1 minuto, para el primer ciclo, seguido por 30 ciclos donde la temperatura se disminuye hasta 58 °C como se describe en K. Seow et al., 1997. La etapa de extensión final se efectúa a 72°C durante 10 minutos. Para la búsqueda de PKS 1 a partir del ADN del banco, las condiciones de PCR son las mismas que las anteriores para el par al-a2 utilizando entre 100 y 500 ng del cósmido extraído de los conjunto de 48 clones. Para el par de cebadores bl-b2, 500 ng de cosmidos provenientes de los conjuntos de 96 clones se utilizan. La mezcla de amplificación contiene dNTP 200 µM, MgCl2 a 2.5 mM final, DMSO al 7%, amortiguador lx Quiagen, 0.4 µM de cada cebador y 2.5U de Tag polimerasa Hot-start (Qiagen). Las condiciones de amplificación utilizadas son: desnaturalización 15 minutos a 95°C seguida por 30 ciclos: un minuto de desnaturalización a 95°C + 1 minuto de hibridación a 65°C para el primer ciclo, y 62°C para los otros ciclos, 1 minuto de alargamiento a 72°C, etapa de extensión final de 10 minutos a 72°C. La identificación de los clones positivos a partir de los conjuntos de 48 o 96 clones se efectúa a partir de reproducciones de microplacas madres correspondientes sobre un medio sólido o cualquier otro método estándar de duplicación. 3 Subclonación y secuenciamiento Los productos de la PCR de los clones identificados son secuenciados de acuerdo con el protocolo siguiente: Los fragmentos son purificados sobre gel de agarosa (equipo de extracción en gel (Qiagen) ) y clonados en E. coli TOP 10 (Invitrogen) con la ayuda del equipo de clonación TOPOTA (Invitrogen) . El ADN plasmídico de los subclones se extrae por lisado alcalino sobre un Biorobot (Qiagen) y se dialisa durante 2 horas sobre una membrana " VS de 0.025 µm (Millipore). Las muestras son secuenciadas con los cebadores M13 "universal" e "inverso" sobre el secuenciador ABI 377 96 (PERKIN ELMER) . 4 Resultados Definición y validación de los cebadores PCR Dos regiones muy conservadas del PKS del tipo 1 de actinomicetos, que comprenden el sitio activo de la enzima, son puestos en el blanco por amplificación de los genes homólogos con los cebadores degenerados. Estas dos regiones corresponden a las secuencias PQQR(L) (L)LE y VE(A)HGTGT respectivamente . i^* *?* ^H**^***».**,, Los cebadores (tabla 8) se prueban con el ADN de cepas productoras o no de macrolidos: Streptomyces coeli color, Streptomyces ambofaciens, productor de espiramicina, y Sa ccharopolyspora arythraea , productor de aritromicina. Cuales quiera que sean los cebadores utilizados, los bancos que representan los fragmentos de aproximadamente 700 pb y que corresponden a la longitud de segmento esperado, se obtienen con todas las cepas. Estos resultados demuestran la especificidad de los cebadores a y b para los genes PKS I para las cepas productoras o no o de los genes silenciosos en S . coeli color. El secuenciamiento de los productos de la PCR obtenidos con el par de cebadores al-a2 permite identificar, a partir de la sepa S . ambofa ciens, la secuencia de un gen KS ya descrito (solicitud de patente europea número EP0791656) como que pertenece a la vía de biosíntesis del plantenolido, precursor macrolídico de la espiramicina, y dos secuencias jamas descritas, Stramb 9 y Stramb 12, (ver lista de secuencia) . En lo que aquí concierne, S. erythraea , el método de tamizado ha permitido la identificación de una secuencia de KS (saceryl7) idéntica a aquella de KS del módulo 1 y ya publicado en Genebank (número de acceso M63677), que codifica para la sintetasa 1 (DEBSl) del 6-desox?eptronólido B. Otra secuencia no correlacionada a ia vía de biosmtesis de la eritromicma se identifica y se trata de la secuencia SEQ ID NO: 32.
Conclusión Se ha aplicado un método para analizar la presencia de genes que codifican para los PKS del tipo 1 por PCR, a partir de diferentes microorganismos. La estructura muy conservada del dominio del acetosintetasa del tipo 1 ha permitido realizar un método de PCR basado en el uso de cebadores de generados desviados en GC para inducción de los codones . Este método muestra la posibilidad de identificar los genes agregados implicados en la vía de biosíntesis de los policétidos del tipo 1. La clonación de estos genes permite la creación de una colección que podrá a continuación utilizarse para construir los híbridos policetidos. El mismo principio puede aplicarse a otras clases de antibióticos. Los resultados obtenidos aquí muestran también la presencia de genes que pueden pertenecer a agregados silenciosos (SEQ ID NO: 30 a 32).
La presencia de agregados silenciosos ha sido documentada en S. lividans y sus expresiones son iniciadas por los reguladores específicos o pleitrópicos (Horinouchi et al.; Umeyama et al. 1996). Estos resultados sugieren que ía detección de los genes que pertenecen a las ¿fe¿ ¡¿* a?¿bA*s«éffi**ákiiÍ ÍiÉ vías llamadas silenciosas que codifican en realidad para las enzimas activas capaces de dirigir, en asociación con las otras enzimas específicas de la vía, las etapas enzimáticas necesarias para la síntesis de metabolitos secundarios.
Tamizado del banco El tamizado se efectúa en condiciones descritas en la sección materiales y métodos utilizando los pares de cebadores validados a partir de las cepas productoras. En presencia del par de cebadores al-a2, el tamaño de los productos de la PCR obtenidos a partir del ADN cosmidico extraído de los conjuntos de 48 6 96 clones es de aproximadamente 700 bp, de acuerdo por lo tanto con los resultados esperados. La intensidad de las bandas obtenidas es variable, pero una sola banda de amplificación esta presente para cada conjunto de ADN blanco. En estas condiciones, 8 grupos de ADN blanco se detectan, que corresponden a 9 clones positivos después de la duplicación. El tamizado efectuado con el segundo par de cebadores bl-b2, ha dado resultados de amplificación menos específicos, puesto que numerosas bandas satélites se han observado al lado de las banda de 700 bp. Sin embargo, se han detectado 9 grupos de .ADN blanco que corresponden a 14 clones positivos después de la duplicación a partir de estos clones positivos, el ADN se extrae para las etapas de secuenciamiento y de transformación de S . lividans .
Análisis de los cosmidos La digestión de los cosmidos identificados por PCR con la enzima Dral, que reconocen un sitio rico en AT, libera un fragmento superior a 23 kb (figura 22) . Esto sugiere que el método PCR da preferiblemente en el blanco del ADN del suelo que contiene un alto porcentaje en G+C. Este resultado es la consecuencia de la degeneración de los cebadores utilizados, desviados en GC para la acción de los codones. Los insectos, como se espera en el caso de los cosmidos, tienen un tamaño superior a 23 kb, salvo en un caso (clon a9B12), lo que podría traducirse en una cierta inestabilidad de los cosmidos. Por otra parte, entre todos los clones seleccionados, solamente dos de entre ellos, GS . Fl y GS.G11, han mostrado el mismo perfil de restricción que indican una relación baja de redundancia en el banco. Los cosmidos seleccionados se transfieren en Streptomyces lividans por transformación de protoplastos en presencia de PEG 1000. La eficiencia de transformación varía entre 30 y 1000 transformantes por µg de ADN cosmidico utilizado . **** ,******,****** **....- . ,. ,¿,¿¡, ^^ -ti-a *__****t**~***f* **** *- l»^^!^ Secuenciamiento y análisis filogenético de los genes PKS I del suelo. El método de PCR aplicado sobre las cepas puras se utiliza como se describe sobre los cosmidos del banco y 24 clonas son así identificadas. Los productos de PCR de aproximadamente 700 bp obtenidos a partir del ADN de dos conjuntos (48 clones) y de 8 clones únicos, se clonan después de la purificación sobre gel de agarosa, y se secuencian. Esto permite la identificación de 11 secuencias. La alineación de las secuencias proteicas deducidas PKS I del suelo con otros PKS I presentes en diferentes microorganismos (Figura 24) muestra la presencia de una región muy conservada que corresponde a la región consenso del sitio activo de la b-cetoacil sintetasa. El análisis de las secuencias obtenidas con el método "preferencia del codón" (Gpbskov et al., 1984; Bibb et al., 1984) revela la presencia de una fuerte desviación en el uso de los codones ricos en G+C en una sola fase de lectura. Las proteínas deducidas de acuerdo con esta fase de lectura muestran una fuerte similitud con los KSs del tipo 1 conocidos 'programa Blast). En particular, la similitud entre las secuencias de KS del suelo y KS del asícr.erado de entromi ip.a es de apr ximaaamente 533.
Después de la duplicación de un conjunto y la identificación de un clon único, la secuencia del producto de la PCR obtenido a partir de este clon se identifica con aquella del conjunto, lo que confirma la confiabilidad del método utilizado. El análisis de la secuencia del producto de la PCR de un clon ha permitido la identificación probable de 3 genes KSI diferentes. Una se estas secuencias (SEQ ID NO: 34) tiene una similitud de 98.7% con ia secuencia de otro conjunto, lo que sugiere que codifican para la misma enzima. Las otras dos secuencias son diferentes pero fuertemente homologas. Aquí, se describe por primera vez la clonación e identificación de un banco de ADN del suelo de vías de biosíntesis de metabolitos secundarios que contienen los genes que codifican los KS del tipo 1. El porcentaje elevado en G+C de las secuencias del suelo sugieren que pueden derivarse de genomas que tengan un uso de los codones similar a aquellos de los actonomicetos . Aunque los datos disponibles en la literatura son reducidos, se sabe que los genes que codifican los PKS del tipo 1 son muy diversificados por su organización física en el genoma, el tamaño y el número de módulos contenidos en cada gen . La presencia de varios dominios que provienen de un solo clon es una confirmación de su pertenencia a los agregados de policetidos asimétricos. En un solo caso, los clones parecen formar un contiguo puesto que comparten la misma secuencia para el dominio KS . El tamaño de las regiones genéticas implicadas en la síntesis del PKS I varían entre algunas kb para la penicilina aproximadamente 120 kb para la rapamicina. Las dimensiones de los insertos cosmidicos pueden por lo tanto no ser suficientes para la expresión de aglomerados más complejos . Los genes que codifican para los PKS I, capaces de trabajar de manera iterativa como lo PKS II y de controlar la síntesis de los policetidos aromáticos, se describe (Jae-Hyuk et al., 1995). El estudio de los aglomerados de PKS I del suelo podría aportar incluso, novedades en este dominio. 5. Identificación de 6 genes que codifican a las policétido sintasas se continua el tamizado del banco de cosmidos de acuerdo con los protocolos descritos en el presente ejemplo, los inventores han identificado un clon del cósmido que contiene un inserto de 34071 pb que contiene varios marcos abiertos de lectura, que codifican para los polipéptidos del tipo policetidc sintasa. Xas precisamente, el cósm do es identificado por tamizado oel banco contiene 6 marcos abiertos de lectura que codifican para los polipéptidos policetido sintasa o para los polípéptidos fuertemente emparentados, los péptidos sintasa no ribos?micos. Una gráfica detallada de este cósmido se representa en la Figura 36. La secuencia nucleotidica completa dei cósmido constituye la secuencia de SEQ ID NO: 113 del listado de secuencias. El inserto de ADN contenido en la secuencia SEQ ID NO0 3 constituye la secuencia nucleotidica complementaria (hebra -) de la secuencia nucleotidica que codifica para las diferentes policetido sintasas. La secuencia nucleotídica del inserto de ADN contenido en el cósmido de la Figura 36 que comprende los cuadros de lectura abiertos que codifican para los polipéptidos policetido sintasa (hebra +) , se esquematiza sobre la Figura 37 y esta constituida por la secuencia SEQ ID N0° 11 dei listado de secuencias. Además, una gráfica detallada de los diferentes cuadros de lectura abierto contenidos en el inserto de ADN de este cósmido esta representado en la Figura 37. Las características de las secuencias nucleotídicas que comprenden los cuadro abiertos de lectura contenidos en el inserto de ADN de este cósmido son detalladas a continuación .
Secuencia ORF1 La secuencia orfl comprende un cuadro abierto de lectura parcial de una longitud de 4615 nucleótidos. Esa secuencia constituye la secuencia SEQ ID NO 115, que inicia en el nucleótido en posición 1, y se termina en el nucleótido en la posición 4615 de la secuencia SEQ ID NO 114. La secuencia SEQ ID NO 115 codifica para el polipéptido ORF1 de 1537 aminoácidos, este polipéptido constituye la secuencia SEQ ID NO 121. El polipéptido de la secuencia SEQ ID NO 121, está emparentado con los péptidos sintasas no ribosómicos. Este polipéptido posee un grado de identidad de aminoácidos de 37% con el péptido sintasa de Anabaena sp.90, referido bajo el número de acceso « emb CACO1604.1 » en la base de datos Genbank.
Secuencia ORF2 La secuencia orf2 tiene una longitud de 8301 nucleótidos y constituye la secuencia SEQ ID NO 116, que inicia en el nucleótido en posición 4633, y se termina en el nucleótido en la posición 12933 de la secuencia SEQ ID NO 114. La secuencia ORF2 codifica para el péptido ORF2 de una longitud de 2766 aminoácidos, este polipéptido constituye la secuencia SEQ ID NO 122. l? *j ****A*. *ßát* ^t'*~ *^*fia^^M. ***********^*?**.*.* .^ *é k.* *L i^ El polipéptido de la secuencia SEQ ID NO 122, posee una identidad de secuencia de aminoácidos del 41% con la secuencia MtaD de Stigma tella auran tia ca , referida bajo el número de acceso « gb AAF 19812.1 » de la base de datos Genbank. El polipéptido ORF2 constituye una policétido sintasa.
Secuencia ORF3 La secuencia nucleotídica orf3 tiene una longitud de 5292 nucleótidos y constituye la secuencia SEQ ID NO 117. La secuencia SEQ ID NO 117 corresponde a la secuencia que inicia en el nucleótido en la posición 12936, y que se termina en el nucleótido en la posición 18227 de la secuencia SEQ ID NO 114. La secuencia nucleotídica SEQ ID NO 117 codifica para el polipéptido policétido sintasa 0RF3 de 1763 aminoácidos, este po^lipéptido constituye la secuencia SEQ ID NO 123, de acuerdo con la invención. El polipéptido ORF3 de la secuencia SEQ ID NO 123, posee una identidad del 42% de aminoácidos con la secuencia MtaB de Stigma tella a uran tiaca , referida bajo el número de acceso « gb AAF 19810.1 » de la base de datos GENBANK. .*?l *t^^ ** >^* t *tí** .*. -aA^Ar-^jyfcUJ Secuencia ORF4 La secuencia nucleotídica orf4 tiene una longitud de 6462 nucleótidos y constituye la secuencia SEQ ID NO 118 de acuerdo con la invención. La secuencia SEQ ID NO 118 corresponde a la secuencia que inicia en el nucleótido en la posición 18224, y que se termina en el nucleótido en la posición 24685 de la secuencia SEQ ID NO 114. La secuencia nucleotídica SEQ ID NO 118 codifica para el polipéptido policétido sintasa ORF4 de 2153 aminoácidos, este polipéptido constituye la secuencia SEQ ID NO 124, de acuerdo con la invención. El polipéptido ORF4 de la secuencia SEQ ID NO 124, posee una identidad de secuencia en aminoácidos del 46% con la secuencia epoD de Sorangi um cell ul osum , referida bajo el número de acceso « gb AAF62883.1 » de la base de datos GENBANK.
Secuencia ORF5 La secuencia nucleotídica orf5 tiene una longitud de 5088 nucleótidos y constituye la secuencia SEQ ID NO 119 de acuerdo con la invención. La secuencia SEQ ID NO 119 corresponde a la secuencia oue inicia en el nucleótido en la posición 24682, y que se termina en el nucleotido en la posición 29769 de la secuencia SEQ ID NO 114. La secuencia nucleotídica SEQ ID NO 119 codifica para el polipeptioc policétido smtasa 0RF5 de 1695 aminoácidos, este polipéptido constituye la secuencia SEQ ID NO 125, de acuerdo con la invención. El polipéptido policétido sintasa ORF5 de la secuencia SEQ ID NO 125, posee una identidad en aminoácidos del 43% con la secuencia epod de Sorangi um cel l ulosi um, referida bajo el número de acceso « gb AAF 62883.1 » de la base de datos GENBANK.
Secuencia ORF6 La secuencia nucleotidica orfd tiene una longitud de 4306 nucleotidos .y constituye la secuencia SEQ ID NO 120 de acuerdo con la invención. La secuencia nucleotídica SEQ ID NO 120 corresponde a la secuencia que inicia en el nucleotido en la posición 29766, y que se termina en el nucleotido en la posición 34071 de la secuencia SEQ ID NO 114. La secuencia SEQ ID NO 120 constituye un marco abierto de lectura parcial que codifica para el polipeptido ORF6 de 1434 am?noac_aos del tipo policetido smtasa, este polipeptido constituye la secuencia SEQ ID NO 126, de acuerdo , l* !**! ***^^^ !**** **^^ , El polipéptido de la secuencia SEQ ID NO 126, posee una identidad en aminoácidos del 43% con la secuencia epoD de Sorangi um cell ul osum, referida bajo el número de acceso « gb AAF 62883.1 » de la base de datos GENBANK.
EJEMPLO 15 Construcción de los vectores satélite del tipo BAC integrativos en Streptomyces Construcción de los vectores satélite del tipo BAC integrativos y conjugativos en Streptomyces 15.1 Construcción del vector pMBD-1 El vector BAC pMBD-1 se obtiene de acuerdo con las etapas siguientes: Etapa 1 : El vector pOSVOlO se somete a una digestión por las enzimas psTI y BstZ17I con el fin de obtener un fragmento nucleotidico de 6.3 kb. Etapa 2 : El vector pDNR-1 se digiere por las enzimas PstI y PvuII con el fin de obtener un fragmento nucleotídico de 4.145 kb . Etapa 3: El fragmento nucleotídico de 6.3 kb que proviene del vector pOSV017 se fusiona por ligación al fragmento de 4.15 kb que proviene del vector pDNR-1, con el fin de producir el vector pMBD-1, como se ilustra en la figura 30. .*_ i*ü, í * ¡¡^-*.*? á*,*¡_ .*.*.* ¿*?* m**^t?<ifcJ^Ja,?m, *¡ 15.2 Construcción del vector pMBD-2 El vector pMBD-2 es un vector del tipo BAC que mantiene un elemento íntegrativo « fc31 mt-Ohyg ». fc31 es un fago templado con un aspecto de huésped grande, donde el sitio de unión (attP) esta bien localizado. El fragmento fc31 int es el fragmento mínimo del actmofago fc31 capaz de inducir la integración de un plasmido en el cromosoma de Streptomyces Lividans . Ohyg es un derivado del mterposón O capaz de conferir la resistencia a la higromicina en E . coll y S . Li vi dans . Los vectores BAC que contienen el sistema de integración fc31 son descritos por SOSIO et al. (2000) y en la solicitud PCT no. '99 6734, publicada el 29 de Diciembre de 1999. El vector BAC pmBD-2 se construye de acuerdo con la etapas siguientes: Etapa 1 : Construcción de un elemento integrativo fc31?nt Oh^g en un plasmido de copias múltiples de E . col l . Primero se amplifica el fragmento fc31?nt a partir del plast?ido pOJ436 con la ayuda del par de cebadores siguientes : El cebador EVfc31I (SEQ ID NO 109) (que permite introducir un sitio EcoRV en el extremo de la secuencia 5' fc31), y el cebador BIIfc31F (SEQ ID NO 110) (que permite la introducción de un sitio BgLII en el extremo 3' de la secuencia fc31) . El fragmento Ohyg se obtiene por la digestión con ayuda de la enzima BamHl del plásmido pHP45 Ohyg descrito por BLONDELET-ROUALT (1997). Después del elemento integrativo fc31 int-Ohyg, se clona en el vector pMCS5 digerido por las enzimas BglII y EcoRV.
Etapa 2 : Construcción del vector pMBD-2 El cromosoma artificial bacteriano pBAce3.6 descrito por FRENGEN et al. (1999) se digiere por la enzima Nhel, después se trata por la enzima Eco polimerasa. Después, el vector pMCS5 fc31 int-Ohyg se digiere por las enzimas SnaBI y EcoRV con el fin de recuperar el elemento integrativo. La gráfica detallada del vector pMBD2 se representa en la figura 31. 15.3 Construcción del vector pMBD-3 El vector pMBD-3 es un vector integrativo (fc31 int) y conjugativo (OriT) del tipo B.AC, que comprende el marcador de selección Ohyg. La gráfica del vector pMBD-3, así como su procedimiento de construcción, se ilustra en la figura 31. El vector pMBD-3 se obtiene amplificando el gen OriT a partir del plásmido pOJ436 con la ayuda del par de cebadores de la secuencia SEQ ID NO 111 y SEQ ID NO 112, que contienen los sitios de restricción pací. El fragmento nucleotídico amplificado con ayuda de los cebadores SEQ ID NO 111 y SEQ ID NO 112, se clona en el vector pMBD2 previamente digerido por la enzima Pací. El esquema de construcción del vector pMBD-3 se ilustra en la figura 31. 15.4 Construcción del vector pMBD-4 La gráfica detallada del vector pMBD-4 se representa en la figura 32. El vector pMBD4 se obtiene clonando el elemento integrativo fc31 int-Ohyg en el vector pCYTAC2. -....iliálítí? -¡WftKB ¿lo 15.5 Construcción del vector pMBD-5 El esquema de construcción del vector pMBD-5 se ilustra en la figura 33. El vector pMBD-5 se construye por recombinación del fragmento nucleotídico comprendido entre los dos sitios loxP del vector pMBD-1 ilustrado en la figura 33, con el sitio Ioxp contenido en el vector BAC designado pBTP3, una gráfica detallada del plásmido pBTP3 se representa en la figura 34. 15.6 Construcción del vector pMBD-6 El vector pMBD-6 se construye recombinando el fragmento nucleotídico comprendido entre los dos sitios loxP del vector pMBD-1 a nivel del sitio loxP del vector BAC pBeloBacll, como se representa sobre la figura 35.
TABLA 1 Localización de la toma de las muestras y características de los suelos en los diferentes experimentos . Los conteos microbianos directos que utilizan la coloración con anaranj ado de acridina se utilizan antes y después de la trituración del suelo Numero Ori gen Textura Cantidad (% ) de Materia pH Número de Número de arena barro arcilla orgánica células antes células (g/kg de de la después de la suelo trituración trituración seco) a(xl09/g peso de d(xl09/g peso suelo seco) de suelo seco) Australia Arcilla 62 22 16 49.7 5.8 6.5 (0.9) 2.9 (1.3¡ arenosa Peyrat le Arcilla 61 26 13 48.2 4.9 7.3 (0.6! 5.4 (0.8) Chateau, arenosa Franca a TABLA 1 (Continuación) Localización de la toma de las muestras y características de los suelos en los diferentes experimentos. Los conteos microbianos directos que utilizan la coloración con anaranjado de acridina se utilizan antes y después de la trituración del suelo Número Origen Textura Cantidad (%) de Materia PH Número de Número de a?ena barro arcilla orgánica células antes células (g/kg de de la después de la suelo trituración trituración seco) a(xl09/g peso de a(xl09/g peso suelo seco) de suelo seco) Cote St-André, Tierra 50 41 40.6 5.6 10.0 (0.7 7.5 (1.4 Francia arenosa Chazay Tierra 34 47 19 13.9 5.8 1.1 4.2 (0.6) d'Azergue, arenosa Francia arcillosa TABLA 1 (Continuación) Localización de la toma de las muestras y características de los suelos en los diferentes experimentos . Los conteos microbianos directos que utilizan la coloración con anaranjado de acridina se utilizan antes y después de la trituración del suelo Numero Origen Textura Cantidad (%) de Materia PH Numero de Numero de arena barro arcilla orgánica células antes células (g/kg de de la después de la suelo trituración trituración seco) a(xl09/g peso de a(xl?7g peso suelo seco) de suelo seco) Guadeloupe, Arcilla 27 24 47 17.0 4.8 1.4 (0.4) 0.5 (0.1) France Dombres , Tierra 20 67 13 30.3 4.3 7.5 H0.5] 5.6 (0.9) Francia arenosa arcillosa 3n = 3; desviación estándar entre paréntesis, TABLA 2 Cebadores y sondas utilizadas para la amplificación PCR y la hibridación sobre mancha Cebador o sonda Blanco a) Secuencia (5' a 3' Referencia no.
Sonda FGPS431 Universal (1392-1406) ACGGGCGGTGTGT (A/G) C Amann et al., 1995 Cebador FGPS122 Bacterias (6-27) GGAGAGTTTGATCATGGCTCAG Amann et al . , 1995 Cebador FGPS350 Streptosporangium CCTGGAGTTAAGCCCCCAAGC Este estudio (616-635) Sonda FGPS643 Streptosporangi um GTGAGTAACCTGCCCC (T/C) GACT Este estudio (122-142) Cebador R499 Bacillus anthraci s TTAATTCACTTGCAACTGATGGG Patra et al. , 1996 Cebador R500 Bacillus anthracis AACGATAGCTCCTACATTTGGAG Patra et al. , 1996 Sonda C501 Bacillus anthracis TTGCTGATACGGTATAGAACCTGGC Patra et al. , 1996 Cebador FGPS516 S. lividans 0S48.3 TCCAGATCCTTGACCCGCAG Este estudio Cebador FGPS517 S. lividans 0S48.3 CACGACATTGCACTCCACCG Este estudio Sonda FGPS518 S. lividans 0s48.3 CCGTGAGCCGGATCAG Este estudio a) Las posiciones sobre el gen de ARNr 16S de E. coli están dadas entre paréntesis. Para B . an thráci s y S . l ividans, los cebadores y las sondas dan en el blanco de las secuencias cromosómicas específicas de los organismos respectivos. Estas secuencias no están localizadas en el gen ARNr 16 S. El cásete que contiene la región blanco de S . lividans, se describe por Clerc-Bardin et al. (no publicado).
TABLA 3 Cantidad de ADN extraído a partir de diferentes suelos a partir de los tratamientos de lisado de acuerdo con los protocolos n° 1 a 5 (µg de ADN/g de peso de suelo seco + desviación estándar)3 Suelos 1, 2, 3 y 6; n=3 ; suelo 4: n°=l Suelo Protocolo de lisado número' Numero y origen 1 2 3 4a 4b 5a 5b 1. Australia 17+/-2 52+/-2 32+/-5 16+/-3 33+/-2 59+/-1 27+/-0 2. Peyrat 29+/-2 58+/-1 40+/-2 29+/-2 18+ /3 56+/-1 15+/-1 3. Cote St-André 36+/-7 60+/-6 148+/-10 94+/-7 38+/-6 73+/-5 47+/-6 4.Chazay 9 16 ND 32 15 15 70 6. Dombes 4 + /-2 26+/-3 43+/-1 61 + /- 66+/-1 160+/-7 102+/-5 a Cuantificación por formación de imagen de fosforescencia después de la hibridación sobre mancha con la sonda universal FGPSD431 (tabla 2). bl: Ningún tratamiento; 2: trituración en seco del suelo (G) ; 3: Cr+ho ogenización Ultraturax (H) ; 4a: G+H+sonicación Microtip (MT) ; 4b: G+H+sonicación Cup Horn (CH) ; 5a: Cr+H+NT+lisado químico/enzimático. Verter bien la figura 1.
ND= No determinado. Tabla 4 Cebadores y sondas utilizados en la caracterización molecular de los ADN extraídos del suelo M NJ O Posición sobre el gen ARNrl6S de Escherichia col i Tabla 5 Eficiencias de extracción de las células bacterianas sobre el gradiente de Nycondenz y cantidades de ADN extraido . Efecto de incubación de la muestra del suelo en una solución de extracto de levadura al 6%, previamente a la dispersión y a la centrifugación del gradiente de densidad NJ Tabla 5 (continuación) Eficiencias de extracción de las células bacterianas sobre el gradiente de Nycondenz y cantidades de ADN extraído . Efecto de incubación de la muestra del suelo en una solución de extracto de levadura al 6%, previamente a la dispersión y a la centrifugación del gradiente de densidad NJ NJ a: Numeración microscópica después de la coloración con anaranjado de acridina b: Numeración sobre medio sólido de Tripcasa-Soya al 10% c: Numeración sobre medio sólido HV Agar, después del enriquecimiento 20 minutos a 40°C en una solución de extracto de levadura al 6%- SDS al 0.05%. d: La cantidad de ADN extraído se evalúa sobre un gel de electroforesis con respecto a una escala patrón de ADN de timo de becerro. e: la cuantificación se realiza después de la digestión de agarosa por la acción de una b-agarosa .
N N Tabla 6 Caracterización de los ADN extraídos en función de su proporción de a, b y g sus clases de Proteobacterias , en Gram + a bajo GC% y en Actinomicetos; la señal de hibridación con la sonda procariote sirve de referencia al 100%.
N N a. trituración en un triturador de bolas de tungsteno, con fuerza centrífuga (protocolo de extracción descrito en el artículo Frostegard et al.) YE: solución de extracto de levadura al 6% Tabla 7 : Diversidad de las secuencias de ADNrl6S contenidas en el banco cosmídico Tabla 7: (continuación) Diversidad de las secuencias de ADNrldS contenidas en el banco cosmidico N c TABLA 7 (continuación 1) Diversidad de las secuencias de ADNrl6S contenidos en el banco cosmídico TABLA 7 (continuación 1) Diversidad de las secuencias de ADNrl6S contenidos en el banco cosmidico TABLA 7 (continuación 2) Diversidad de las secuencias de ADNrlßS contenidos en el banco cosmídico N N TABLA 7 (continuación 2) Diversidad de las secuencias de ADNrl6S contenidos en el banco cosmidico N° de conjuntos Vecino más cercano % de Vecino mas cercano % de (clon n°) identificado similitud (clasificación , similitud referencia) a40-a4 L-a42 (6) Desulfivibrio aminophilus ¡5.3% Clon S-34 (d-Proteo) 86.2% G+ bajo GC% a23.1 Kurthia zopfii 97.3% a25.1 Kurthia zopfii 97.2% ald.l (22; Durthia gipsonii 94.4% G+bajo GC% no 94.8% identificado RS 19 (no publicado) TABLA 7 (continuación 3) Diversidad de las secuencias de ADNrlßS contenidos en el banco cosmidico 230 TABLA 7 (continuación 3) Diversidad de las secuencias de ADNrl6S contenidos en el banco cosmidico N N GONZÁLEZ et al (1996) -"Zhou et al (1997) - Pederson et al (1996- Godon et al (1997) - ngenholtz et Al (1998) bLudwig (1997) TABLA 9: Secuencias TABLA 9 : Secuencias TABLA 9 (continuación 1) : Secuencias áf, ¡Afei*A»fe¡&sS»í.a> ¡*.
TABLA 9 (continuación 1) : Secuencias TABLA 9 (continuación 2) : Secuencias TABLA 9 (continuación 2) : Secuencias TABLA 9 (continuación 3) Secuencias TABLA 9 (continuación 3) Secuencias i*^***. * ***** *****^** **^^ REFERENCIAS • Amann, R. I., W. Lud ig, y K.-H. Schleifer. 1995. Phyiogenetic identification and in situ detection of individual microbial cells without cultivation. Microbiol. Rev. 59 : 143-169. • Atschul S. F. , Madden T. L., Sch ffer A. A., Zhang J. , Zhang Z.,Miller . , Lipman D. J. (1997) "Gapped BLAST and PSI-BLAST : a nex generation of protein databases search programs" Nucleic Acid Researchs Vol 25:3389-3404 • Atschul SF et al., 1990, J. Mol Biol, 215:403-410. • Bakken, L. R. 1985. Separation and purification of bacteria from soil. Appl. Environ. Microbiol. 49 : 1482-1487. • Bibb MJ, Findlay PR, Johnson MW, The relationship between base composition and codon usage in bacterial genes and its use for the simple and reliable identification of protein-coding sequences., Gene 30:1-3, 157-66, ct, 1984. • Biesiekierska-Galguen M. (1997) "Atténuation biologique de contaminants xenobiotiques dans le sol-modele |Á J.a * J.A-ÉBáftfc&faa. ***aJ* ^t*, tft?i^ttiHtt-Jt*-0fe — -^^^ .^ .^^tt^^^ ¿A A,t . lindane" Diplome de DEaA National de Toxicologie, Université Claude Bernard Lyon I. • Blondelet-Rouault MH, Weiser J, Lebrihi A, Branny P, Pernodet JL. Institut de Genetique et Microbiologie, URA CNRS 2225, Universite Paris XI, Orsay, France. Gene 1997 Mayo 6; 190(2) :315-7 • Borchert S et al., 1992, Microbiology Letters, 92:175-180 • BLONDELET-ROUAULT, 1997, Gene, 315-317. • Boccard, F. , Smokvina, T. Pernodet, J. L.
Friedmann, A. & Guerineau M. (1989) . The integrated conjugative plasmid pSAM2 of Streptomyces ambofaciens is related to temperature bacteriophages . Embo J 8, 973-80 • Chatzinotas A. , Sandaa R-A. , Schónhuber . , Amanna R. , Daae F. L., Torsvik V., Zeyer J. , Hahn D. (1998) "Analysis of broad-scale differences m microbial community composition of two pristine forest soils" Sys tema ti c and Appl ied Mi crobiology Vol 21:579-587 • Clegg, C. D., K. Ritz, and B. S. Griffiths . 1997. Direct ectraction of microbial community DNA from humified upland soils. Lett. Appl. Microbiol. 25:30-33.
• Clerc-Bardin, S., J.-L. Pernodet, A. Frostegárd, and P. Simonet. Development of a conditional suicide system for a Strepcomyces lividans stram and íts use to investígate conjugative transfer m soil. Submitted. • Elledge SJ, Mulligan JT, Ramer SW, Spottswood M, Davis RW. Department of Biochemistry, Baylor College of Medicine, Houston, TX 77030. Proc Natl Acad Sci EUA 1991 Marzo 1; 88 ,5) : 1731-5 • Engelen, B., K. Meinken, F. Von Wintzingerode, H. Heuer, H . -P . Malkomes , y H. Backhaus. 1998. Monitoring impact of a pesticide treatment on bacterial soil communities by metabolic and genetic fingerprinting ín addition to conventional testing procedures. Appl. Environ. Microbiol. 64:2814-2821. • Farrelly, V., F. A. Ramey, y E. Stackebrandt. 1995. Effect of genome size and rm gene copy number on PCR amplification of 16S rRNA genes from a mixture of bacterial species. Appl. Environ. Microbiol. 61:2798-2801. • Faulkner D. V., Jurka J. (1988) "Múltiple Aligned Sequence Editor (MASE ' Trenas ín Biocnemical Sciences Vol 13:321-322 • FRENGEN et al., 1999, Genomics, 58:250-258.
• Frostegárd, A., Tunlid, A., y Bath, E. 1991. Microbial biomass measured as total lipid phosphate in soils of different organic content. J. Microbiol. Meth. 14:151-163. • Giddings, G. 1998. The reléase of genetically engineered micro-organisms and viruses into the environment. New Phytol. 140:173-184. • Gladek, A., and J. Zakrze ska. 1984. Genome size of Streptomyces . FEMS Microbiol. Lett. 24:73-76. • Gribskov M, Devereux J, Burgess RR, The codon preference plot:graphic analysis of protein coding sequences and prediction of gene expression., Nucleic Acids Res 12:1 Pt 2, 539-49, Enero 11, 1984. • Guiney et al., 1983, Proc. Natl. Acad. Sci EUA, (12) :3595-3598. _ • Gourmelen, A. Blondelet-Rouault , M. H. & Pernodet, J. L. (1998). Characterization of a glycosyl transferase inactivating macrolides, encoded by gimA from Streptomyces ambofaciens, Antimicrob Agents Chemother 42, 2612-9. • Hayakawa, M. , y H. Nonomura. 198 . Humic acid- vitamin agar, a new médium for the selective isolation of soil actinomvcetes . J. Ferment. Technol. 65:501-509.
• Hayakawa, M. , Ishizawa K. , and H. Nonomura. 1988. Distribution of rare actinomycetes in Japanese soils. J. Ferment. Technol. 66:367-373. • Hickey, R. J. , y H. D. Tresner. 1952. A cobalt 5 containing médium for sporulation of Streptomyces species. J. Bacteriol. 64:891-892. • Hintermann, G. , R. , Crameri, Kieser, T., y R. Hunter. 1981. Restriction analysis of the Streptomyces gla ucescens genome by agarose gel electrophoresis . Arch. 10 Microbiol. 130:218-222. • Holben, W. E., J. K. Jansson, B. K. Chelm, y J. M. Tiedje. 1988. DNA probé method for the detection of specific microorganisms in the soil bacterial community. Appl. Environ. Microbiol. 54:703-711. 15 • Hong Fu et al., 1995, Molecular diversity, 1:121-124 • Hopwood DA, Bibb M J, Chater K F, Kieser T. , Bruton C. J. , Kieser H. M. , Lydiate D. J. , Smith C. P., Ward J. M. y Scrempf H. 1985. Genetic Manipulation of 20 Streptomyces. A Laboratory manual. The John Innes Foundation, Norwich, R. U. • Hopwood, D. A., M. J. Bibb, K. F. Chater, T. Kieser, C. J. Bruton, H. M. Kieser, D. J. Lydiate, C. P. **a Smith, J. M. Ward, y H. Schrempf . 1985. Genetic manipulation of streptomyces - a laboratory manual. The John Innes Foundation, Norwich, Reino Unido. • Hohm B. and Collins J. , 1980, Gene, 11:291- 5 298 Horinouchi S., Malpartida F. , Hopwood D. et Beppu T., Mol. Gen. Genet. (1989) 215:355-357. • Imai R. , Nagata Y., Fukuda M. , Takagi M. , Yano K. (1991) "Molecular cloning of a Pseudomonas pa ucimobilis 10 gene encoding a 17-kilodalton plypeptide that eliminates HCl molecules from ?-Hexachlorocyclohexane" Journal of Bacteriology Vol 17", No21 : 6811-6819 • Jacobsen, C. S., y O. F. Rasmussen. 1992. Develop.ier.t and application of a new method to extract 15 bacterial DNA from soil based on separation of bacteria from soil ith cation-exchange resin. Appi . Environ. Microbiol. 58:2458-2462. • Jae-Hyuk Y. U. y Leonard T. J. , 1995. Sterigmetscytin biosynthesis n Aspergi l us nidulans requires 20 a ... type I polyketide synthase. J. Bactepol, (Agosto) : -,""92-4800. • Ka, J. O., W. E. Holben, y J. M. Tiedje. 1994. Analysis of co petition in soil among 2,4- dichloropnenoxyacetic acíd-degrading bacteria. Appl. Environ. Microbiol. 60:1121-1128. • Kah-Tong S et al., 1997, J Bacteriol, G179(23) :7360-7368 • Kimura M. (1980) "A simple method for estimating evolutionary rates of base substitutions through comparative studies of nucleotide sequences" Journal of Molecular Evolution Vol 16:111-120 • Kuske, C. R. , K. L. Banton, D. L. Adorada, P. C. Stark, K. K. Hill, y P. J. Jackson. 1998. Small-scale DNA sample preparation method for field PCR detection of microbial cells and spores m soil. Appl. Environ. Microbiol. 64:2463-2472. • Lacalle RA, Pulido D, Vara J, Zalacain M, Jiménez A. Centro de Biología Molecular (CSIC-UAM) , Universidad Autónoma, Canto Blanco, Madrid, España. Gene 1989 Julio 15:79 (2):375-80 • Lee, S.-Y., J. Bollinger, D. Bezdicek, y A. Ogram. 1996. Estimation of the abundance of an uncultured soil bacterial stram by a competitive quantitative PCR method. .Appl. Environ. Microbiol. 62:3787-3793. • Leff, L. G., J. R. Dana, J. V. McArthur, y L. J. Shimkets . 1995. Comparison of methods of DNA extraction from stream sediments. Appl. Environ. Microbiol. 61:1141-1143. • Liesack, W. , y E. Stackebrandt . 1992. Occurrence of novel groups of the domain Ba cteria as revealed by analysis of genetic material isolated from an Australian terrestpal environment. J. Bacteriol. 174:5072-5078. • Liesack, W. , P. H. Janssen, F. A. Rainey, N. L. Ward-Rainey, y E. Stackebrandt. 1997. Microbial diversity is soil: the need for a combined approach using molecular and cultivation techniques. In J. D. Van Elsas, J. T. Trevors, y E. M. H. ellington (ed. ) , Modern soil microbiology, Marcel Dekker, Inc., New York, (p 375-439) • Lorentz, M. G. , y W. Wackernagel . 1994. Bacterial gene transfer by natural genetic transformation in the environment. Microbiol. Reviews 58:563-602. • Maidak B. L., Colé J. R. , Parker C. T., Garrity G. M. , Larsen N., Li B., Lilburn T. G., McCaughey M. J. , Olsen G. J. , Overbeek R. , Pramanik S., Schmidt T. M. , Tiedje J. M. , Woese C. R. (1999) "A new project of the RDP (Ribosomal Datábase Project)" Nucleí c Aci ds Resea rch Vol 27:171-173 • Mazodier P. et al., 1989, J. Bacteriol., 171(6) :3553-3585.
. -.*.******.**. -II*,*.*-*--**!******** f I -ß ár * ^ ^^*^^.*?*.tÍ?Jti**ás* • Moré, M. I., J. B. Herrick, M. C. Silva, W. C. Ghiorse, and E. L. Madsen . 1994. Quantitative cell lysis of moigenous microorganisms ana rapid extraction of microbial DNA from sediment. Appl. Environ. Microbiol. 60:1572-1580. • Murakami T, Holt TG, Thompson CJ, Unité de Génie Microbiologique, Institut Pasteur, París, Francia. J. Bactepol 1989 Marzo; 171 ( 3 ): 1459-66 • Nagata Y., Hatta T., Imai R. , Kimbara K. , Fukuda M. , Yano K. , Takagi M. (1993) "Purification and charactepzation of ?-Hexachlorocyclohexane (?-HCH) dehydrocr.lormase (L_nA) from Pseudomonas pa ucimobi lis" Bioscience, Biotechnology and Biochemistry Vol 57 No 9:1582- 1583 • Nalin R. , Simonet P., Vogel T. M. , Normand P. (1999) "Rhodanobacter iindaniclasticus gen. nov., sp., nov., a iindane-degrading bacter um" In terna ti ona l Journa l of Sys tema ti c Ba ctepol ogy Vol 49:19-23 • Nesme, X., C. Picard, y P. Simonet. 1995. Specific DNA sequences for aetection of scil bacteria. In J. T. Trevcrs, y J. D. van Elsas (ed.), Nucleic acias m the environment, methods and application. Sppnger Lab Manual, (p 111-139) • Nilsson B, Uhlen M, Josephson S, Gatenbeck S, Philipson L. Nucleic Acids Res 1983 Nov 25 ; 11 (22 ): 8019-30 • Normand P. et al., 1995, Océans, 21 (1): 31-56 • Ogram, A. V., M. L. Mathot, J. B. Harsh., J. Boyle, y C. A. Pettigrew, JR. 1994. Effects of DNA polymer length on its adsorption to soils. Appl. Environ. Microbiol. 60:393-396 • Ogram, A., G. S. Sayler, y T. Barkay. 1987. The extraction and purification of microbial DNA from sediments. J. Microbiol. Methods 7:57-66 • Olsen, R. A., y Bakken, L. R. 1987. Viability of soii bacteria: optimization of the plate-counting technique. Microb. Ecol. 13:59-74. • Paget, E., L. Jocteur Monrozier, y P. Simonet. 1992. Adsorption of DNA on clay minerals: protection against DNasel and mfluence on gene transfer. FEMS Microbiol. Lett. 97:31-40. • Patra, G. , ?. Sylvestre, V. Ramisse, J. Thérasse, y J.-L. Guesdon. 1996. Isolation of a specific chromosomic DNA sequence of Ba ci l l us an thra si s and its possible use ín diagnosis. FEMS Immunol. Medical Microbioloqv 15:223-231.
• Pernodet J. L. Fish, S. Blondelet-Rouault, M. H. & Cundliffe, E. (1996) . The macrolide-lincosamide- streptogramin B resistance phenotypes characterized by using a specifically deleted, antibiotic-sensitive strain of Streptomyces lividans . Antimicrob Agents Chemother 40, 581, 5. • Pernodet J. L., Gourmelen, A., Blondelet-Rouault, M. H. & Cundliffe, E. (1999) . Dispensable ribosomal resistance to spiramycin conferred by srmA in the spiramycin producer Streptomyces ambofa ciens . 145, 2355-64. • Picard, C, C. Ponsonnet, X. Nesme, y P. Simonet. 1992. Detection and enumeration of bacteria in soil by direct DNA extraction and polymerase chain reaction. Appl. Environ. Microbiol. 58:2717-2722. • Preud'homme, J. , Belloc, A., Charpentié, Y., y Tarridec, P. 1965. Un antibiotique formé de deux groupes de composants á synergie d' action: la pristinamycine C. R. Acad. Sci. 260:1309-1312. • Priemé, A., J. I. B. Sitaula, A. K. Klemedtsson, y L. R. Bakken. 1996. Extraction of methane-oxidizing bacteria from soil particles. FEMS Microbiol. Ecol. 21:59-68. &¡¡ ?**-**--t f a..-,»..,,, ^.a^^^ ,^¿§¿(,,^¿,¡1} Cai¿?a¿^ri¿Jaafife?a^£ ía.
• Prosser, J. 1994. Molecular marker systems for detection of genetically engineered micro-organisms in the environment. Microbiol. 140:5-17. • Raynal A, Tuphile K, Gerbaud C, Luther T, Guérineau M, Pernodet JL; Laboratoire de Biologie et Génétique Moleculaire, Instituí de Génétique et Microbiologie, URA CNRS 2225, Université Paris-Sud, Orsay, Francia. Mol Microbiol 1998 Abril; 28(2):333-42 • Raynald A. Tuphile, K. Gerbaud, C, Luther, T. Guerineau, M. & PERNODET, J. L. (1998). Structure of the chromosomal insertion site for pSAM2 : functional analysis in Escherichia coli. Mol. Microbiol 28, 333-42. • Richard, G. M. 1974. Modifications of the diphenylamine reaction giving increased sensitivity and simplicity ín the estimation of DNA. Analytical Biochem. 57:369-376. • Romanowski, G., M. G. Lorentz , y W. Wackernagel . 1993. Use of polymerase chain reaction and electroporation of Eschepchia coli to monitor the persistep.ee of extracellular plasmid DN.A introduced into natural soils. Appl. Environ. Microbiol. 59:3438-3446. ....**.* *. f*?M. ?.rt*l*^a?***.*)ta****??t?9^ t t • Saitou N., Nei M. (1987) "The Neighbour-Joining method: a new method for reconstructing phylogentic trees" Molecular and Biological Evolution Vol 2:112-118 • Sambrook J. , Fritsch E. F. y Maniais T. 1996. Molecular cloning: a laboratory manual, 2nd ed. Cold spring Harbor Laboratory Press, Cold Sring Harbor, N. Y. • Sambrook, J. , E. F. Fritsch, y T. Maniatis . 1989. Molecular cloning: a laboratory manual, 2nd ed. Cold Spring Harbor Laboratory, Cold Spring Harbor, N. Y. • Senoo K. , Wada H. (1989) "Isolation and identification of an aerobic ?-HCH-decomposing bacterium from soil" Soi l Sci en ce , Pl an t Nu tri ti on Vol 35, No 1:79-87. • Sezonov, G., Blanc, ' V., Bamas-Jacques , N. , Friedmann, A. Pernodet, J. L. & Guerineau, M. (1997).
Complete conversión of antibiotic precursor to pristinamycin IIA by overexpression of Streptomyces pri s tmae biosynthetic genes. Nat Biotechnol 15, 349-53. • Shirling, E. B., y D. Gottlieb. 1966. Methods for charactepzation of Streptomyces species. Int. J. Syst.
Bacterio!. 16:313-340. • Shizuga et al., 1992, Proc. Natl. Acad. Sci EUA, 89:S~94-8797. i.ái i á.* • Siefert, J. L., y G. E. Fox. 1998. Phylogenetic mapping of bacterial morphology. Microbiology 144:2803-2808. • Simonet, P., P. Normand, A. Moiroud, y R. 5 Bardin. 1990. Identification of Frankia strains in nodules by hybridization of polymerase chain reaction products with strain-specifíc oligonucleotide probes. Arch. Microbiol. 153:235-240. • Smala, K. , N. Cresswell, L. Mendonca-Hagler, 10 A. Wolters, y D. J. van Elsas. 1993. Rapid DNA extraction protocol from soil for polymerase chain reaction-mediated amplification. J. Appl. Bactepol. 74:78-85. • SOSIO M. et al. 2000, Nature Biotechnology, vol. 18:343-345. 15 • Smit, E., P. Leeflang, y K. Wernars . 1997. Detection of shifts m microbial community structure and ín soil caused by copper contamination using amplifie ribosomal DNA restriction analysis. FEMS Microbiol. Ecol. 23:249-261. 20 • Smokvina T, Mazodier P, Boccard F, Thompson CJ, Guerineau M. Laboratoire de Biologie et Genetique Moleculaire, Umversite Paris-Sud, Orsay, Francia. Gene 1990 Sep 28; 9 (1) : 53-9 --»**"'"*^^ '"** • Smolvina, T., Mazodier, P. Bocard, F.
Thompson, C. J. & Guerineau, M. (1990). Construction of a series of pSAM2-based integrative vectors for use in actinomycetes . Gene 94, 53-9. 5 • Stackebrandt, E. 1988. Phylogenetic relationships vs-. phenotypic diversity: how to achieve a phylogenetic classification system of the eubacteria. Can. J. Microbiol. 34:552-556. • Staneck, J. L., y G. D. Roberts. 1974. 0 Simplified approach to identification of aerobic Actinomycetes by thin-layer chromatography. Appl. Microbiol. 28:226-231. • Stapleton, R. D., S. Ripp, L. Jiménez, S. Cheol-Koh, J. T. Fleming, I. R. Gregory, y G. S. Sayler. 5 1998. Nucleic acid analytical approaches in bioremediation : site assessment and charactepzation . J. Microbiol. Methods 32:165-178. • Steffan, R. J. , J. Goksyr, A. K. Bej , and R. Atlas. 1988. Recovery of DNA from soils and sediments. Appl. Environ. Microbiol. 54:2908-2915. • Tebbe, C. C, y W. Vahjen. 1993. Interference of humic acids and DN.A extracted directly from soil in detection and transformation of recombinant r&Ü«-Í«feiÍSfct'"t-'-* ** ** *- * & *. i****************!**}^*^!^*- -*- -*•* -*- * ^gw^£¿fta.aa^aii$aa aá>éiksl'.s MÍS«M DNaA fror bacteria and a yeast Appl. Environ. Microbiol 59:2657-2665 • Tercero JA, Espinosa JC, Lacalle RA, Jiménez A. Centro de Biología Molecular Severo Ochoa, Consejo Superior de Investigaciones Científicas, Madrid, España. J Biol Chem 1996 Enero 19; 271 (3) : 1579-90 • Thomas J-C . , Berger F. , Jacquier M. , Bernillon D., Baud-Grasset F. , Truffaut N. , Normand P., Vogel T. M. , Simonet P. (1996) "Isolation and Charactensation of a novel ?-Hexachlorocyclohexane-degradmg bactenum" Journal of Ba ctepology Vol 178, No20 : 6049-6055 • Torsvik, V. L. 1980. Isolation of bacterial DNA from soil. Soil Biol. Biochem. 12:15-21. • Torsvik, V., R. Sorheim, y J. Goks¡ayr. 1996. Total bacterial diversity ín soil and sediment communities-a review. J. Ind. Microbiol. 17:170-178. • Tsai, Y.-L., y B. Olson. 1991. Rapid method for direct extraction of DNA from jsoil and sediments. Appl. Environ. Microbiol. 57:1070-1074. Umeyama T . , Tanabe Y . , Aigle B , et Horinuochi S., FEMS (1996) 1¿ :177-184. • Van Elsas, J. D., G. F. Duarte, A. S. Rosado, y K. Smalla. 1998. M?crob?o_oa?cal and molecular biological ¡¡¡jf* methods for monitoring microbial inoculants and their effects in the soil environment. J. Microbiol. Methods 32:133-154. • Van Elsas, J. D., V. Mántynen, y A. C.
Wolters. 1997. Soil DNA extraction and assessment of the fate 5 of Mycoba cteri um chlorophenolicum strain PCP-1 in different soils by 16S ribosomal RNA gene sequence based most-probable- number PCR and immunofluorescence. Biol. Fert. Soils 24:188- 195. Volff JN et al., 1996, Mol. Microbiol 0 21(5) .-1037-1047. • Volossiouk, T., E. J. Robb, y R. N. Nazar. 1995. Direct DNA extraction for PCR-mediated assays. Appl. Environ. Microbiol. 61:3972-3976. • Wahl GM, Lewis KA, Ruiz JC, Rothenberg B, Zhao 5 J, Evans GA. Proc Natl Acad Sci EUA 1987 Abril; 84(8):2160-4 • Waksman, S. A. 1961. Williams and Wilkins (ed.) The actinomycetes. Classification, identification and description of genera and species. Vol 2. Baltimore. • Ward, D. M. , R. Weller, y M. M. Bateson. 1990. 0 16S rRNA sequences reveal numerous uncultured microorganisms in a natural com unity. Nature 344:63-65. ******* »* nía**»**, ? • Widmer, F., R. J. Seidler, y L. S. Watrud. 1996. Se-^s tive detection of transger^c plant marker gene persistence ín soil microccs s. Mol. Ecol. 5:603-613. • Williams, S. T., R. Locci , A. Beswick, D. I. Kurtboke, V. D. Kuznetsov, F. J. Le Monnier, P. F. Long, K.
A. Maycroft, R. A. Palma, B. Petrolini, S.
Quaroni, J. I. Todd, y M. West. 1993. Detection and Identification of novel actmomycetes . Res. Microbiol. 144: 653-656. • Wilson, I. G. 1997. Inhibition and facilitation of nucleic acid amplification . Appl. Environ. Microbio!. 63:3741-3751. Woese, 1987 Bacterial evolution, Yannish-Perron et al., 1985, Gene, 33(1) : 103- 119. Zaslavsky, B. 1995 Separation of biomolecules, p. 503-667. In ^queous two-phase partitioning.
Bops Y. Zasla^/sky (ed.) Physical Chemistry and Bioanalytical Applications, Marcel Dekker, Inc., New York. • Zhou, J. , M. A. Bruns, y J. M. Tiedje. 1996.
DNA recovera from soils of diverse composition. Appl. Environ. Microoiol. 62:cl6-322. i¿ ¿,i¿.j ********** ************** *****,* * LISTADO DE SECUENCIAS <110> Aventis Pharma S.A. 5 <120> Procedimiento de obtención de ácidos nucleicos a partir de una muestra del medio ambiente, ácidos nucleicos así obtenidos y su aplicación en la síntesis de compuestos novedosos 10 <130> Banco de ADN de suelo - RPR S.A. <140> <141> 15 <150> FR9915032 <151> 1999-11-29 <160> 126 20 <170> Patentln Ver. 2.1 <210> 1 <211> 15 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: sonda FGPS431 <220> <221> variación <222> :i4) <223> Base A reemplazado por G <400> acgggcggtg tgtac 15 <210> <211> 22 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: cebador FGPS122 <400> ggagagtttg atcatggctc ag 22 <210> <211> 20 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: cebador FGPS350 <400> cctggagtta agccccaagc 20 <210> <211> 24 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: sonda FGPS643 <220> <221> variación <222> (20) <223> T reemplazado por C <400> gtgagtnnna acctgcccct gact 24 <210> 5 <211> 21 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: sonda FGPS643-2 <400> gtgagtaacc tgcccccgac t 21 <210> <211> 23 <212> ADN <213> Secuencia artificial . ¿ &iÁ ..l. í <220> <223> Descripción de la secuencia artificial: cebador R499 <400> ttaattcact tgcaactgat ggg 23 <210> <211> 23 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: cebador R500 <400> aacgatagct cctacatttg gag 23 <210> <211> 25 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: sonda C501 <400> ttgctgatac ggtatagaac ctggc 25 <210> <211> 20 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: cebador FGPS516 <400> tccagatcct tgacccgcag 20 <210> 10 <211> 20 <212> ADN <213> Secuencia artificial <220> ,? ~ <223> Descripción de la secuencia artificial: cebador FGPS517 <400> 10 cacgacattg cactccaccg 20 <210> 11 <211> 16 <212> ADN 10 <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: sonda FGPS518 15 <400> 11 ccgtgagccg gatcag 16 <210> 12 20 <211> 20 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: FGPS612 <220> <221> variación <222> (2) <223> Base C reemplazado por T <220> <221> variación <222> (7) <223> Base T reemplazado por C <220> <221> variación <222> (7) <223> Base T reemplazado por A <400> 12 ccaacttcgt gccagcagcc 20 <210> 13 <211> 21 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: FGPS669 <220> <221> variación <222> (7) <223> Base A reemplazado por G <220> <221> variación <222> (13! <223> Base A reemplazado por C <400> 13 gacgtcatcc ccaccttcct c 21 <210> 14 <211> 18 <212> ADN <213> Secuencia artificial •'^^^^^«¿iiÉ»^-^.--^*.--^^^^ <220> <223> Descripción de la secuencia artificial: FGPS618 <220> <221> variación <222> (5) <223> Base T reemplazado por C <400> 14 atggttgtcg tcagctcg 18 <210> 15 <211> 21 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: FGPS614 <400> 15 gtgtagaagt gaaattcgat t 21 <210> 16 <211> 18 -é áá±isM* L_?kí**-**í,*** **.*****-*. a*M- "*""" •""•-- - -*• ~~i ?tai¡í *.*Bi&¡s**?s* <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: FGPS615 <400: 16 cggtggatga tgtggatt 18 <210> 17 <211> 18 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: FGPS616 <400> 17 aggttaaaac tcaaatga 18 <210> 18 <211> 18 <212> ADN <213> Secuencia artificial kdA&i **** *** *.**. .***,. .¿d^j^^^,,^.!!.!!^**^-^-^ <220> <223> Descripción de la secuencia artificial: FGPS621 <400> 18 atacgtaggt ggcaagcg 18 <210> 19 <211> 19 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: FGPS617 <400> 19 gccggggtca actcggagg 19 <210> 20 <211> 18 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: FGPS680 ******* *__n*.*i-i-.A* *-*-.--. *.*********'•**••**-' ********** *** *** **.* . .**.** ií^%J,ttrA, <220> <221> variación <222> (11) <223> Base A reemplazado por C <220> <221> variación <222> (11) <223> Base A reemplazado por T <220> <221> variación <222> (13) <223> Base T reemplazado por A <400> 20 tgagtcccca actccccg 18 <210> 21 <211> 20 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: FGPS619 <400> 21 gcttggggct taactccagg 20 <210> 22 <211> 21 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: cebador 63f <400> 22 caggcctaac acatgcaagt c 21 <210> 23 <211> 18 <212> ADN <213> Secuencia artificial <220> lA.Jk *¡i*A*d.*i*á :-* **********,..*. *************»&*******: <223> Descripción de la secuencia artificial: cebador 1387r <400> 23 gggcggngtg tacaaggc 18 <210> 24 <211> 30 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: oligo-1 <400> 24 gcttatttaa atattaagcg gccgcccggg 30 <210> 25 <211> 28 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: oligo-2 ,*?*t i***x******* *** **¿k* A * . HteAl.au ? á <400> 25 cccgggcggc cgcattaata tttaaata 28 <210> 26 5 <211> 23 <212> ADN <213> Secuencia artificial <220> 10 <223> Descripción de la secuencia artificial: cebador al <400> 26 ccncagnagc gcntnttnct nga 23 15 <210> 27 <211> 22 <212> ADN <213> Secuencia artificial 20 <220> <223> Descripción de la secuencia artificial: cebador a2 <400> 27 gtnccngtnc cgtgngtntc na 22 <210> 28 <211> 23 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: cebador bl <400> 28 ccncagnagc gcntnctnct nga 23 <210> 29 <211> 22 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: cebador b2 <400> 29 gtnccngtnc cgtgngcctc na 22 <210> 30 <211> 672 j k¿ »Mtft4nt"»? fi** ?**¡ -^*^»-'**'^..*.**.-^~t*í-i*--t*^ nnwiir-lfr ?•*-* * i^i'-« <212> ADN <213> Streptomyces ambofaciens <400> 30 ccccagcagc acgtgttcct cgagacggtg tgggagacct tcgaatccgc cggagtggac 60 ccgcgcgcgg tacgcggtcg ttccgtcggg atgttcgtcg gcaccaacgg acaggactac 120 ccggtggtgt tggccggatc cgccgacgag ggcctggacg cccacgcggc caccggtaac 180 gcggcggcgg tgctgtccgg ccgggtctcg tacgccttcg gcctggaagg gccggcggtc 240 accgtcgaca cggcgtgttc gtcgtcgctg gtggcccttc acctggccgc gcaggcgctg 300 cggcgcggcg agtgcgatct ggcactcgcc ggcggtgtgt cggagatgtc caccgaggcg 360 gcgttcaccg agttcgcccg gcagggcggc ctggccgacg acggccgctg caaggccttc 420 tcggccgacg ccgacggcac gggctggggc gagggcgtcg gcgtcctgct ggtggagcgg 480 ctggcggacg cccgccgcaa cgggcaccgg gccctcgcgc tggtacgggg cagcgcggtc 540 aaccaggacg gcgcctccaa cggtctgacg gcacccaacg gcccgtccca gcagcgagtc 600 atccggcagg cactggcgga cgcccggctg tcgccgtcgg aggtcgacgc ggtcgagacc 660 cacggcaccg ge 672 <210> 31 <211> 665 <212> ADN <213> Streptomyces ambofaciens <400> 31 ccccagcagc gcgtgttcct ggaagcgtcc tgggaggcgg tcgagcgggc aggcatcgac 60 i*******Á*é*** *»****k***t***** **** ?* * atgcgcaccc tgcgcggtgg acgcaccggc gtcttcgccg gcgtgatgta ccacgactac 120 ccgtcggtgg tcgaccccga agcgctcgac ggctacctgg gcacggccaa cgccggcagc 180 gttctctccg gccgcatcgc ctacaccttc gggcttcagg gaccggcggt caccgtggac 240 acggcctgct cctcgtccct ggtggcgctg cacctcgccg cccaggcgct gcccgccggc 300 gagtgcgaac tcgccctggt cggtggggtc acggtcatgt ccggcccgat gatgttcgcg 360 ggcttcggcc tggaagacgg ctctgccgcc gacggccgct gcaaggcgtt cgccgccgcc 420 gccgacggca ccggctgggg cgagggtgtc ggtgtgctgc tggtggagcg gctgtcggac 480 gcccggcgcc acgggcaccg ggtgctggcc gtggtgcgcg gtagcgcggt caaccaggac 540 ggtgcctccg gcggcctcac cgcccccaac ggacctgccc agcagcgcgt catccgtcag 600 gccctggcga gcgcggcact cgtaccggcc gaggtcgacg cggtcgagac ccacggcacc 660 gggac 665 <210> 32 <211> 671 <212> ADN <213> Saccharopolyspora erythraea <400> 32 ccgcaggagc gcgtgttcct ggaactcgct tgggaagcac ttgataacgc gggcatcgca 60 ccgcacagcc tcagggacag ccggacgggc gtgttcttcg gagctatgtg gcacggctac 120 gcgcagttcg cagccggagc cgtcgaccgc atcacccagc acaccgcgac cgggcacgac 180 ctgagcatca tcccggccag gatcgcctac ttcctgggct tgcgcggccc ggacatgacc 240 ccgaacaccg cgtgctcatc ggctttggtg gccatgcacc aggcacgcca aagcatcctg 300 ctgggcgaat cctcggtcgc cttggtcggc gggatcagct tgttggtcgc gctggacagc 360 atggtcgcca tgtcgcggtt cggagcgatg gccccggacg gccggtgcaa ggcattcgac 420 tctcgcgcga acggctacgt gcgcggcgaa ggcggcggtg tcgtggtgct caaaccgctg 480 tcgcgcgctc tggccgatgg caacccggtc tactgcgtcc tgcgcggcag cgcggtcaac 540 aacgacggct tcagcaatgg ccttaccgcg ccgagcccgg cggcgcagga gcaggtactg 600 cgcgacgcct acgccaacgc cggggtcgat ccggcacagg tcgactacgt cgagacccac 660 gggaccggca c 661 <210> 33 <211> 686 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo <400> 33 ccgcaggagc gcgtgttcct cgagtcgtgc tgggaggcgc tggagcatgc tggatacgat 60 actgcacgct accccggccg catcgggctg tgggccggcg cgggcttcaa cagctacctc 120 ctgaccaatc tcatgaacaa ccgcgccttt ttagagagcg tgggcatgta ccaga cttt 180 ctgagcaacg acaaggactt catcgccacc cgcacggctt acaagttaaa cctgcgcggt 240 ccggcgatgg ccgtcggcac cgcctgttcc acatcgctgg tggcggttca cgaagcttgc 300 caggcgctgc ggctgggcga gtgtgacatg gcactggccg gtgctgcgtc tgtcagcacg 360 cccctccggg agggctacct ctaccaggaa ggcatgatta tgagccgtga cggcgtctgc 420 cgcccgtttg acgccgacgc cgatggcacg gtgctgggca atggcgtggc ggtcgtggtg 480 i*& * at, **** i* *. *. a.Al ********** i ctcaagcggc tggacgaagc gctccgggac ggtgacacgg tctacgccgt gattcgtggc 540 acggcggtca acaacgacgg ctctgtcaag atcgggttca cggcgcccag cgccgagggg 600 cagagccggg tcgtgcggga cgccctgcgg gcggccgcgg tcccggcgga gagcgtgacc 660 tacgtcgaca cgcacggcac cggcac 686 <210> 34 <211> 689 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo <400> 34 ccccagcagc gcctgttcct cgagtgcgcg tgggaagcga tggagaacgc gggatatgcg 60 gcgcgaagct ataagggttc gatcggcgtt ttcgcgggat gcggcgtcaa tacctacctg 120 ctgaacaacc tcgccaccgc ggagccgttc gatttctcac gcccctccgc gtaccagctg 180 ctgacggcca acgacaagga tttcctggcc acgcgtgtct cttacaagct gaacctccgc 240 gggcccagcc tgacggttca gacggcgtgc tccacctcgc tggtgtcggt ggtgatggca 300 tgcgagagct tgcagcgcgg cgcctcggac attgccttgg ccgggggagt tgccatcaat 360 gttccgcagt ccgtggggta cctgcaccag ccgggcatga tcctgtcgcc cgacgggcgc 420 tgccgcgcct tcgatgagtc cgctcaaggc acggtgccgg gcaacggcgc gggtgtggtc 480 gtcctcaagc gcttgagccg cgctctggcc gatggcgaca cgatctacgc cgtcattcgc 520 ggagcggcta ttaataatga tggcgccgag cgcatggggt ttaccgctcc aggtgtggac 600 tií. .Á.A.Á-i *?*ÍÍ?*?..I**Í* * •* &**** * g|g^¡g^ ggtcagacgc gattgattcg gcgcactcaa gagatggcgg gcgtgaagcc ggagtccatc 660 ggctacatgg acacccacgg caccggcac 689 <210 > 35 5 <211 > 671 <212 > ADN <213 > Organismo Desconocido <220 > 10 <223 > Origen de la secuencia : organismo del suelo <400 > 35 ccgcagcagc gcctcttcct cgaggtggca tgggaagctt tggagcgtgc gggtcggccg 60 cccgacagtc tcgcgggcag cgacaccgga gtgttcatcg ggatcagcac cgacgactac 120 15 agccggctga aacctaccga tccggcgctc attgacgcct ataccggtac cggaaccgcg 180 ttcagcactg ccgccggacg gatctcctat ctgctggggt tgcagggacc gaacttcccc 240 gtcgacacgg cgtgctcttc ctcactcgtg gcggttcatc tggcgtgccg cagcttgcag 300 tcgcgagagt gcagcatggc gctggccggc ggcgtgaacc tgattctggc gccggaaagc 360 acgatctact tctgccgcct gcgggccatg gcggccgatg gccgttgcaa aagtttcgct 420 20 gcctccgccg acggttacgg ccgcggcgag ggatgcggaa tgctggtgct gaagcggctg 480 tccgatgcga cgcgtgacgg cgatcgtatt ctggcgctga ttcgcggatc ggccgtcaac 540 cacggcggcc gcagcaacgg cctcacggcg ccgaacggtc cggcgcagga agccgtgatt 600 cgggcggcgc tcaagaacgc cggcatggcc cccgccgatg tcgattacgt ggacacccac 660 ggcaccggca c 671 ^^ t^S^?B*M**mjá*??.ú,?*?*tM?á^.-¡. *.* *** •*** ....*****t*i** **?**********?**?***itmt^ ,*&- . <210> 36 <211> 758 <212> ADN <213> Organismo Desconocido 5 <220> <223> Origen de la secuencia: organismo del suelo <400> 36 0 ccgcaggagc gcgtcttcct cgaacgcatt gacggtttcg atgcggaatt cttcggcatc 60 tccccccgcg aagctctgaa catggatccg cagcagcggc tgctgctgga agtgtgctgg 120 gaagcggcag aggacgccgg catctctccc ggccctctgg cgggcagcgc gaccggcgtc 180 tttgccggct cctgcgccca ggacttcgga ctgtttcagt acgccgaccc tgcccgcatc 240 ggagcttggt cgggttccgg cgtggcgcat agcatgttgg ccaatcgcat ctcctatctg 300 5 ctcgacctgc gcggtccgag catggcggtc gatacggcct gctcctccgc gctcgtcgcc 360 gtccatctgg cttgccaaag cctgcgccgg cgcgaatgcg atgcggcatt cgccggcgga 420 gtgaacttga tcctgactce cgagggcatg atcgctttgt cgaaggctcg catgttggcg 480 cccgacggac gctgcaagac gttcgacgcc gcagccgacg gttatgtgcg cggcgagggc 540 tgcggcatcg tgctgctgaa gcggctctcc gatgcgctgg ccgatggcga tgccatctgt 600 0 gcagtcatcc gcggctcggc aatcaatcag gacggacgga gcaatggcat cacggcgccg 660 aatctgcagg cgcagaaggc ggtcctgcaa gaggcggtgg ccaacgcgca catcgatcca 720 cccacgtat cgttgatcga cacgcacggc accggcac 758 * *,***«. *&** ,**?aím^***~A*-*** _***?Í**¡m**ja^^ ¡82 <210> 37 <211> 704 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo <400> 37 ccgcagcagc gcgtgttcct cgagtgcgcc tgggaggcgg tggaaagcgc gggctacgat 60 cccgaaaaat atcccggcct gatcggagtt ttcgccgggg ccagcatcaa cagctatttc 120 ctttataacc tcgcgcacaa ccgggaattc gtcgcccgca tggcggggga gtaccaagtg 180 ggcgagtacc agacgatcct cggaaacgac aaggactacc tccccactcg cgtctcctac 240 aaattgaacc tgcgcggccc cagcctggcc gtgcagtccg cctgctcgac cggcctcgtc 300 gccgtttgtc aggccattca aaatctgcag acttatcagt gcgatatggc cctcgcgggc 360 ggcatctcga tttcgtttcc gcaaaagcgc gactaccgct tcaccgacga aggaatggtc 420 tctcgcgacg gtcactgccg cccgttcgac gccagcgcgc aaggcacggt cttcggcaac 480 ggggccggcg tcgtcctgat gaaaagattg gccgacgcag tgaccgatcg ggacacgatc 540 ctcgccgtga ttaggggcgc tgccgtgaac aacgacggcg gcgtcaaaat gggttacacg 600 gcgcccagtg ccgaaggtca ggcggaggcc atcaccctgg ccctcgcgct cgctggcgtc 660 agcccggaga ccatcacttg catggacacc cacggcaccg gcac 704 <210> 38 <211> 680 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo <400> 38 ccccagcagc gcgtgttcct cgaatgcgcc tgggcggcgc tggagcgccg ccggatatca 60 gggcgacacc ttccacggtg tccatcggcg gtctatgcct caagcggctt taacacctat 120 cttctgaacc tgcatgccaa tgccgcggtg cgccaatcga tcagcccgtt tgaactgttc 180 gtcgccaacg acaaggattt tctggcgacg cgcacggctt acaagctcaa tctgcgcggc 240 ccggccatga cagtgcagac ggcctgctcc tcatcgttgg ttgccgttca tgtcgccgcg 300 caaagcctcc tagcgggcga atgcgatatt gcgctcgcgg gcggcatcac ggtttcccgt 360 tcgcatggat atgtggcgcg cgaaggtgga atattgtctc ctgacgggca ttgccgggcg 420 ttcgatgcgg atgccggcgg aaccgttcca ggcagcggcg tcggcgttgt cgtgctcaag 480 cgtctcgaag atgcgcttgc agacggcgat acgatcgacg ccgtcatcat cggttcggcc 540 atcaacaatg atggcgcgct gaaggcgagc tttaccgcac cgcaggtgga cagccaggcc 600 ttggtcatca gcgaggccca tgcagctgcc ggaatatcgg ccgattccat cggttatatg 660 gacacccacg gcaccgggac 680 <210> 39 <211> 671 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo <400> 39 ccgcagcagc gcctcttcct cgagctcacc tgggaagcgc tggaagatgc cggcatcccg 60 ccgtccacga ttgccggcac gaatgtcggc gttttcatgg gcgcgtcgca ggctgactac 120 ggccacaagt tcttcagcga ccacgccgtc gcggattccc atttcgccac cggcacctcg 180 ctggcggtcg tcgccaatcg catttcctac atctacgacc tgcgcggccc aagcctcact 240 gtagacacgg cgtgctcgtc gtcgctcgtc gcgctgcatc aggcggtgga agcgctccgc 300 tcggggcgga tcgaaacagc cattgtcggc ggcattaacg ttatcgccag cccggcgtcc 360 ttcatcgcct tctcgcaggc ctcgatgctg tcgccgacgg ggttgtgcca ggctttctcc 420 gccaaggccg atggctttgt ccgcggcgag ggcggcacgg ttttcgtcct gcgcaaggcg 480 gcgcatgcgc atggcagccg caacccggtg cgcgggctca ttctcgccac cgacgtcaat 540 tccgacgggc gtaccaacgg catctcgctg ccatcggccg aagcgcagga agtcctcctg 600 caacgcgtct attcacgcgc atcgatcgat ccgaaccgcc tggctttcgt cgacacccac 660 gggaccggca c 671 <210> 40 <211> 764 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo íá*á®k.?k*ár¿-fcam,. ta.. <400> 40 ccgcagcagc gcgtgttcct cgacggcatc gaccggttcg atccgcgtca cttcgcgatc 60 cgccgcgcg aggcgatcag catggacccg cagcagcggc tcctgctcga ggtcacgtgg 120 gaagcgctgg agcgcgccgg cgtggcgccc gatcgcctga ccggatccga caccggcgtc 180 ttcatcggca tcagcaccaa cgactacggc cagatcctgc tgcgcgcctc ggaccagatc 240 gatccgggga tgtacttcgg caccggcaac ctgttgaacg cggcggcggg acgcctctcg 300 tacgtcctcg gcctgcaggg tccgagcatg gcggtcgaca ccgcatgtcc gtcgtcgctg 360 gtggcgattc atctcgcgtg tcagagcctg cgcaaccgcg agtgccgcat ggcgctcgcc 420 ggcggcgcca acctggtgct cgtcccggaa gtgacggtca actgctgccg cgccaagatg 480 ctcgcgcctg acgggcgctg caagacgttc gacgccgcgg cggacggcta cgtccgcggc 540 gaaggggccg cggtgatcgt gctgaagcgg ctctccgacg cgctggcgga cggcgatccg 600 atcgtcgcgc tgatccgcgg atccgcggtc aatcaggacg gccgcagcgg cggcttcacc 660 gcgccgaacg aactggcgca gcaggcggtg atccggaccg cgctcgcggc agcgggcgtc 720 gccgcgtccg acatcggcta cgtggacacg cacggcaccg ggac 764 <210> 41 <211> 763 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo l????M*É*?**f*t-*. i^ ?**. *k* -*****•***. <400> 41 ccgcagcagc gcgtgttcct cgacggcatc gaccgcttcg atccgcagtt tttcgggatc 60 gcgccgcgcg aagcggccgg catcgatccg cagcagcggc tgctgctcga gacgacgtgg 120 gaagcgctgg aagacgccgg gacgtcgccg gaaaagctgc agggaacccc ggccggcgtg 180 ttcgtcggca tcaacagcat cgactacgcg acgctgcagc tgcagaactg cgatctggcc 240 agcatcgacg cctattcgct ctccggcagc gcgcacagca tcgcggccgg gcggctcgcc 300 tacgtgctcg gcctgcaggg gccggcgatg gcggtcgaca ccgcctgctc gtcgtcgctg 360 gtcgcgatcc acctggcgtg ccagagcctg cgcaacgacg actgccgcgt cgccgtggcc 420 ggcggcgtgc acgtcacgct gacgccgatc aacatggtcg tgttctcgaa gctgcgcatg 480 ctggcggcgg acggcaagtg caagacgttc gacggccgcg gcgacggatt cgtcgaaggc 540 gagggctgcg cggtcatcgt cctcaagcgg ttgtcgcacg cgcttgccga caaggatcgg 600 atcctcgcgc tggtgcgcgg ttcggcggtc aaccaggacg gcgcgagcag cggtctcacc 660 gcgccgaacg gtccggcgca ggaagcggtc atccgcgcgg cgttgaagcg ggccggcgtg 720 cagccggcgg aggtcggcta cgtggacacc cacggcaccg gca 763 <210> 42 <211> 668 <212> .ADN <213> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo jflifca*..:feáa?¡Í?rA-t- ...-.¡'¡^*te&* *¡****,* ** ***,.*l. *~? lr**?«-. - ** ** - . **• * *******--t... *. a **-*~l-^*..* - ***** <400> 42 ccgcaggagc gcgtgctgct ggaatcctcg tggcatgcgc tggaagacgc cggctatgcc 60 ggcgaaagca tcgccggcgc gcgctgcggc gtgtacatgg gcttcaacgg cggcgactac 120 ggcgacctgc tgtacggcca gccgtcgctg ccgccgcacg cgatgtgggg caacgccgcc 180 cggtgctgt cggcgcgcat cgcctattac ctggacctgc aaggcccggc gatcaccctc 240 gacaccgcct gttcgagctc gttggtcgcg gtgcatctgg cctgccaggg gctgtggacc 300 ggcgagaccg atctggccct ggccggcggc gtgtggatcc agtgcacgcc cggattcctg 360 atctcctcca gccgcgccgg catgctctcg ccgaccggcc agtgccgcgc gttcggcgcc 420 ggcgccgacg gcttcgtgcc gtccgaaggc gtcggcgtgg tcgtgctcaa gcgcctgcag 480 gacgcgctcg acgccggcga ccacatntac ggcgtgatcc gcggcagcgc gatcaaccag 540 gacggcgcca gcaacggcat caccgcgccg agcgccgccg cccaggagcg cttgcagcgc 600 cacgtctacg acagcttcgg catcgacgcc tcgcgcctgc agatgatcga ggcccacggc 660 accggcac 668 <210> 43 <211> 671 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo <400> 43 ccgcaggagc gcgtgctgct ggaggtgact tgggaggcac tcgaagacgc cggccaagac 60 gtggaccgtc tggccgggcg gcccgtcggc gtcttcgtcg ggatctcgtc gaacgattac 120 ggccagcttc agaacggcga cccggccgac gtggacgcct acgtcggcac cggtaacgcg 180 ctgagcatcg ccgccaaccg actcagctac acgtttgact ttcgcggccc gagtctggcg 240 gtggacacgg cgtgctcgtc ttcactcgtc gcgatccatc tcgcctgcca gagcgttcgc 300 cgcggtgaag cggaactcgc cgtcgcggcc ggcgtcaact tgattctgac ccccggcctg 360 acggtgaatt tcacccgcgc cggcatgatg gcgcctgacg gccggtgcaa gacgttcgac 420 gcggccgcca acggctacgt gcgcggcgaa ggcgccggcg cgtcgtgct caagccgctg 480 gcccaggcta tcgccgacgg cgacccgatc tacgcgatcg tccgtggcag cgccgtcaac 540 caggacggcc gttccaacgg cctcaccgcc ccgaaccgac aggcccaaga ggtcgtgctg 600 cgggccgcgt atcgtgacgc gggcatcagc ccggccgatg tcgacgccgt cgaggcccac 660 ggcaccggca c 671 <210> 44 <211> 707 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo <400> 44 ccccagcagc gcgtgttcct cgaggacgcg actgaggtcg acgtggatgc gctttcagac 60 ggcgaagacg tcgtgatcgc cggcatcatg cagcacatcg aggaggccgg catccactcg 120 ggcgattcat cgtgcgtgct tccgccggtc gacatcccgc cgaaggcgct gcagacgatc 180 r -??ÍlfÍB?|irf-^fe»¿Ja,...^»a^jfea .l.t. cgcgatcaca cgttcaagct cgcgcgcgcg ttgaaggtca tcggcctgat gaacgtgcag 240 tacgcgattc agcgcgacaa ggtctacgtg attgaggtaa accctagggc ttctcgaact 300 gtcccgtatg tctcgaaggc gacaggcgtg ccgctggcga aggtcgcgtc acgcttgatg 360 accggacgca aactgcacga gctgttgccg gaaggggtcg agcgcggctg gatcaccacc 420 cgggcgaga atttctacgt gaagtcgccg gtcttcccgt ggggtaagtt cccgggcgtt 480 gacactgtgc tcgggccgga gatgaaatcg accggcgaag tcatgggcgt cgccgacaac 540 ttcggcgagg ccttcgccaa ggcacagatc gccgccggca catacctgcc gaccgaaggt 600 accgtcttca tctcggtcaa cgaccgtgac aaaggcaacg tcattcagct ggcgcagcgt 660 ttctccgaac tcggtttcgg cattgtcgac acgcacggca ccgggac 707 <210> 45 <211> 225 <212> PRT <213> Streptomyces ambofaciens <400> 45 Pro Gln Gln His Val Phe Leu Glu Thr Val Trp Glu Thr Phe Glu Ser 1 5 10 15 Ala Gly Val .Asp Pro Arg Ala Val Arg Gly Arg Ser Val Gly Met Phe 20 25 30 Val Gly Thr Asn Gly Gln Asp Tyr Pro Val Val Leu Ala Gly Ser Ala 35 40 45 Asp Glu Gly Leu Asp Ala His Ala Ala Thr Gly Asn Ala Ala Ala Val 50 55 60 M il-iffitiMM 'f - r >**^**??**Í ..****************. ,***** *** &*>•*. *•...-*****.**--'-' "~*- —**'* ** **'*. **><>- **. ** . L?*^ Leu Ser Gly Arg Val Ser Tyr Ala Phe Gly Leu Glu Gly Pro Ala Val 65 70 75 80 Thr Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Leu His Leu Ala 85 90 95 Ala Gln Ala Leu Arg Arg Gly Glu Cys Asp Leu Ala Leu Ala Gly Gly 100 105 110 Val Ser Glu Met Ser Thr Glu Ala Ala Phe Thr Glu Phe Ala Arg Gln 115 120 125 Gly Gly Leu Ala Asp Asp Gly Arg Cys Lys Ala Phe Ser Ala Asp Ala 130 135 140 Asp Gly Thr Gly Trp Gly Glu Gly Val Gly Val Leu Leu Val Glu Arg 145 150 155 160 Leu Ala Asp Ala Arg Arg Asn Gly His Arg Ala Leu Ala Leu Val Arg 165 170 175 Gly Ser Ala Val Asn Gln Asp Gly Ala Ser Asn Gly Leu Thr Ala Pro 180 185 190 Asn Gly Pro Ser Gln Gln Arg Val lie Arg Gln Ala Leu Ala Asp Ala 195 200 205 Arg Leu Ser Pro Ser Glu Val Asp Ala Val Glu Thr His Gly Thr Gly 210 215 220 Thr 225 ....*»*..** *., ***k*S?. ?l a.-t.a-^J^&^^i^^*i-^,a=^^J«»^^^-^iteS.-i8ái^-^.^^.-»-^ <210> 46 <211> 207 <212> PRT <213> Streptomyces ambofaciens <400> 46 Ala Ser Trp Glu Ala Val Glu Arg Ala Gly lie Asp Met Arg Thr Leu 1 5 10 15 Arg Gly Gly Arg Thr Gly Val Phe Ala Gly Val Met Tyr His Asp Tyr 20 25 30 Pro Ser Val Val Asp Pro Glu Ala Leu Asp Gly Tyr Leu Gly Thr Ala 35 40 45 Asn Ala Gly Ser Val Leu Ser Gly Arg lie Ala Tyr Thr Phe Gly Leu 50 55 60 Gln Gly Pro Ala Val Thr Val Asp Thr Ala Cys Ser Ser Ser Leu Val 65 70 75 80 Ala Leu His Leu Ala Ala Gln Ala Leu Pro Ala Gly Glu Cys Glu Leu 85 90 95 Ala Leu Val Gly Gly Val Thr Val Met Ser Gly Pro Met Met Phe Ala 100 105 110 Gly Phe Gly Leu Glu Asp Gly Ser Ala Ala Asp Gly Arg Cys Lus Ala 115 120 125 Phe Ala Ala Ala Ala Asp Gly Thr Gly Trp Gly Glu Gly Val Gly Val 130 135 140 Leu Leu Val Glu Arg Leu Ser Asp Ala Arg Arg His Gly His Arg Val 145 150 155 160 Leu Ala Val Val Arg Gly Ser Ala Val Asn Gln Asp Gly Ala Ser Gly 165 170 175 Gly Leu Thr Ala Pro Asn Gly Pro Ala Gln Gln Arg Val He Arg Gln 180 185 190 Ala Leu Ala Ser Ala Ala Leu Val Pro Ala Glu Val Asp Ala Val 195 200 205 <210> 47 <211> 223 <212> PRT <213> Saccharopolyspora erythraea <400> 47 Pro Gln Glu Arg Val Phe Leu Glu Leu Ala Trp Glu Ala Leu Asp Asn 1 5 10 15 Ala Gly He Ala Pro His Ser Leu Arg Asp Ser Arg Thr Gly Val Phe 20 25 30 Phe Gly Ala Met Trp His Gly Tyr Ala Gln Phe Ala Ala Gly Ala Val 35 40 45 Asp Arg He Thr Gln His Thr Ala Thr Gly His Asp Leu Ser He He 50 55 60 - . jft* * *. * * ***.!,!^^^^^ A** *** Pro Ala Arg He Ala Tyr Phe Leu Gly Leu Arg Gly Pro Asp Met Thr 65 70 75 80 Leu Asn Thr Ala Cys Ser Ser Ala Leu Val Ala Met His Gln Ala Arg 85 90 95 Gln Ser He Leu Leu Gly Glu Ser Ser Val Ala Leu Val Gly Gly He 100 105 110 Ser Leu Leu Val Ala Leu Asp Ser Met Val Ala Met Ser Arg Phe Gly 115 120 125 Ala Met Ala Pro Asp Gly Arg Cys Lys Ala Phe Asp Ser Arg Ala Asn 130 135 140 Gly Tyr Val Arg Gly Glu Gly Gly Gly Val Val Val Leu Lys Pro Leu 145 150 155 160 Ser Arg Ala Leu Ala Asp Gly Asn Pro Val Tyr Cys Val Leu Arg Gly 165 170 175 Ser Ala Val Asn Asn Asp Gly Phe Ser Asn Gly Leu Thr Ala Pro Ser 180 185 190 Pro Ala Ala Bln Glu Gln Val Leu Arg Asp Ala Tyr Ala Asn Ala Gly 195 200 205 Val Asp Pro Ala Gln Val Asp Tyr Val Glu Thr His Gly Thr Gly 210 215 220 <210> 48 <211> 211 <212> PRT ^¡aí, **** ,****^ * . * »**. «fefc-S <210> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo <400> 48 Ser Cys Trp Glu Ala Leu Glu His Ala Gly Tyr Asp Thr Ala Arg Tyr 1 5 10 15 Pro Gly Arg He Gly Leu Trp Ala Gly Ala Gly Phe Asn Ser Tyr Leu 20 25 30 Leu Thr Asn Leu Met Asn Asn Arg Ala Phe Leu Glu Ser Val Gly Met 35 40 45 Tyr Gln He Phe Leu Ser Asn Asp Lys Asp Phe He Ala Thr Arg Thr 50 55 60 Ala Tyr Lys Leu Asn Leu Arg Gly Pro Ala Met Ala Val Gly Thr Ala 65 70 75 80 Cys Ser Thr Ser Leu Val Ala Val His Glu Ala Cys Gln Ala Leu Arg 85 90 95 Leu Gly Glu Cys Asp Met Ala Leu Ala Gly Ala Ala Ser Val Ser Thr 100 105 110 Pro Leu Arg Glu Gly Tyr Leu Tyr Gln Glu Gly Met He Met Ser Arg 115 120 125 Asp Gly Val Cys Arg Pro Phe Asp Ala Asp Ala Asp Gly Thr Val Leu 130 135 140 É*tAi»ÉM?»rf'ar-iÉÉtimn r* **^ * * ** & W**''t-'¡¡L'*i *JÍ- " - *• +-*>*-'•* «** »• i»*** *i ?* Gly Asn Gly Val Ala Val Val Val Leu Lys Arg Leu Asp Glu Ala Leu 145 150 155 160 Arg Asp Gly Asp Thr Val Tyr Ala Val He Arg Gly Thr Ala Val Asn 165 170 175 Asn Asp Gly Ser Val Lys He Gly Phe Thr Ala Pro Ser Ala Glu Gly 180 185 190 Gln Ser Arg Val Val Arg Asp Ala Leu Arg Ala Ala Ala Val Pro Ala 195 200 205 Glu Ser Val 210 <210> 49 <211> 229 <212> PRT <213> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo <400> 49 Pro Gln Gln Arg Leu Phe Leu Glu Cys Ala Trp Glu Ala Met Glu Asn 1 5 10 15 Ala Gly Tyr Ala Ala Arg Ser Tyr Lys Gly Ser He Gly Val Phe Ala 20 25 30 ifa.Ato<Att w». - -*<^~^.-<^ , m?*4~-^^-^^'^'í*i^-:Áu^i í^?'Á Gly Cys Gly Val Asn Thr Tyr Leu Leu Asn Asn Leu Ala Thr Ala Glu 35 40 45 Pro Phe Asp Phe Ser Arg Pro Ser Ala Tyr Gln Leu Leu Thr Ala Asn 50 55 60 Asp Lys Asp Phe Leu Ala Thr Arg Val Ser Tyr Lys Leu Asn Leu Arg 65 70 75 80 Gly Pro Ser Leu Thr Val Gln Thr Ala Cys Ser Thr Ser Leu Val Ser 85 90 95 Val Val Met Ala Cys Glu Ser Leu Gln Arg Gly Ala Ser Asp He Ala 100 105 110 Leu Ala Gly Gly Val Ala He Asn Val Pro Gln Ser Val Gly Tyr Leu 115 120 125 His Gln Pro Gly Met He Leu Ser Pro Asp Gly Arg Cys Arg Ala Phe 130 135 140 Asp Glu Ser Ala Gln Gly Thr Val Pro Gly Asn Gly Ala Gly Val Val 145 150 155 160 Val Leu Lys Arg Leu Ser Arg Ala Leu Ala Asp Gly Asp Thr He Tyr 165 170 175 Ala Val He Arg Gly Ala Ala He Asn Asn Asp Gly Ala Glu Arg Met 180 185 190 Gly Phe Thr Ala Pro Gly Val Asp Gly Gln Thr Arg Leu He Arg Arg 195 200 205 Thr Gln Glu Met Ala Gly Val Lys Pro Glu Ser He Gly Tyr Met Asp 210 215 220 Éu áá Thr His Gly Thr Gly 225 <210> 50 <211> 223 <212> PRT <213> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo <400> 50 Pro Gln Gln Arg Leu Phe Leu Glu Val Ala Trp Glu Ala Leu Glu Arg 1 5 10 15 Ala Gly Arg Pro Pro Asp Ser Leu Ala Gly Ser Asp Thr Gly Val Phe 20 25 30 He Gly He Ser Thr Asp Asp Tyr Ser Arg Leu Lys Pro Thr Asp Pro 35 40 45 Ala Leu He Asp Ala Tyr Thr Gly Thr Gly Thr Ala Phe Ser Thr Ala 50 55 60 Ala Gly Arg He Ser Tyr Leu Leu Gly Leu Gln Gly Pro Asn Phe Pro 65 70 75 80 Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Val His Leu Ala Cys 85 90 95 Arg Ser Leu Gln Ser Arg Glu Cys Ser Met Ala Leu Ala Gly Gly Val 100 105 110 Asn Leu He Leu Ala Pro Glu Ser Thr He Tyr Phe Cys Arg Leu Arg 115 120 125 Ala Met Ala Ala Asp Gly Arg Cys Lys Ser Phe Ala Ala Ser Ala Asp 130 135 140 Gly Tyr Gly Arg Gly Glu Gly Cys Gly Met Leu Val Leu Lys Arg Leu 145 150 155 160 Ser Asp Ala Thr Arg Asp Gly Asp Arg He Leu Ala Leu He Arg Gly 165 170 175 Ser Ala Val Asn His Gly Gly Arg Ser Asn Gly Leu Thr Ala Pro Asn 180 185 190 Gly Pro Ala Gln Glu Ala Val He Arg Ala Ala Leu Lys Asn Ala Gly 195 200 205 Met Ala Pro Ala Asp Val Asp Tyr Val Asp Thr His Gly Thr Gly 210 215 220 <210> 51 <211> 252 <212> PRT <213> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo <400 > 51 Pro Gln Glu Arg Val Phe Leu Glu Arg He Asp Gly Phe Asp Ma Glu 1 5 10 15 Phe Phe Gly He Ser Pro Arg Glu Ma Leu Asn Met Asp Pro Gln Gln 20 25 30 Arg Leu Leu Leu Glu Val Cys Trp Glu Ma Ma Glu Asp Ma Gly He 35 40 45 Ser Pro Gly Pro Leu Ma Gly Ser Ma Thr Gly Val Phe Ma Gly Ser 50 55 60 Cys Ma Gln Asp Phe Gly Leu Phe Gln Tyr Ma Asp Pro Ma Arg He 65 70 75 80 Gly Ma Trp Ser Gly Ser Gly Val Ma His Ser Met Leu Ma Asn Arg 85 90 95 He Ser Tyr Leu Leu Asp Leu Arg Gly Pro Ser Met Ma Val Asp Thr 100 105 110 Ma Cys Ser Ser Ma Leu Val Ma Val His Leu Ma Cys Gln Ser Leu 115 120 125 Arg Arg Arg Glu Cys Asp Ma Ma Phe Ma Gly Gly Val Asn Leu He 130 135 140 Leu Thr Pro Glu Gly Met He Ma Leu Ser Lys Ma Arg Met Leu Ala 145 150 155 160 Pro Asp Gly Arg Cys Lus Thr Phe Asp Ma Ma Ma Asp Gly Tyr Val 165 170 175 * . .l**u¡****t***^*- t ^-****~^>*-^3!*********^ Arg Gly Glu Gly Cys Gly He Val Leu Leu Lys Arg Leu Ser Asp Ma 180 185 190 Leu Ma Asp Gly Asp Ma He Cys Ma Val He Arg Gly Ser Ma He 195 200 205 Asn Gln Asp Gly Arg Ser Asn Gl/ He Thr Ma Pro Asn Leu Gln Ma 210 215 220 Gln Lys Ma Val Leu Gln Glu Ma Val Ma Asn Ma His He Asp Pro 225 230 235 240 Ser His Val Ser Leu He Asp Thr His Gly Thr Gly 245 250 <210> 52 <211> 234 <212> PRT <213> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo <400> 52 Pro Gln Gln Arg Val Phe Leu Glu Cys Ma Trp Glu Ma Val Glu Ser 1 5 10 15 Ma Gly Tyr Asp Pro Glu Lys Tyr Pro Gly Leu He Gly Val Phe Ma 20 25 30 Gly Ma Ser He Asn Ser Tyr Phe Leu Tyr Asn Leu Ma His Asn Arg 35 40 45 Glu Phe Val Ma Arg Met Ma Gly Glu Tyr Gln Val Gly Glu Tyr Gln 50 55 60 Thr He Leu Gly Asn Asp Lys Asp Tyr Leu Pro Thr Arg Val Ser Tyr 65 70 75 80 Lys Leu Asn Leu Arg Gly Pro Ser Leu Ma Val Gln Ser Ma Cys Ser 85 90 95 Thr Gly Leu Val Ma Val Cys Gln Ma He Gln Asn Leu Gln Thr Tyr 100 105 110 Gln Cys Asp Met Ma Leu Ma Gly Gly He He Ser He Phe Pro Gln 115 120 125 Lys Arg Asp Tyr Arg Phe Thr Asp Glu Gly Met Val Ser Arg Asp Gly 130 135 140 His Cys Arg Pro Phe Asp Ma Ser Ma Gln Gly Thr Val Phe Gly Asn 145 150 155 160 Gly Ma Gly Val Val Leu Met Lys Arg Leu Ma Asp Ma Val Thr Asp 165 170 175 Arg Asp Thr He Leu Ma Val He Arg Gly Ma Ma Val Asn Asn Asp 180 185 190 Gly Gly Val Lys Met Gly Tyr Thr Ma Pro Ser Ma Glu Gly Gln Ma 195 200 205 Glu Ma He Thr Leu Ma Leu Ma Leu Ma Gly Val Ser Pro Glu Thr 210 215 220 t-^^l.******^**... ^^»...****.*** ***.****.
He Thr Cys Met Asp Thr His Gly Thr Gly 225 230 <210> 53 <211> 226 <212> PRT <213> Organismo Desconocido <220> <223> Origen de la secuencia: Organismo del suelo <400> 53 Pro Gln Gln Arg Val Phe Leu Glu Cys Ma Trp Ma Ma Leu Glu Arg 1 5 10 15 Arg Arg He Ser Gly Arg His Leu Pro Arg Cys Pro Ser Ma Val Tyr 20 25 30 Ma Ser Ser Gly Phe Asn Thr Tyr Leu Leu Asn Leu His Ma Asn Ma 35 40 45 Ma Val Arg Gln Ser He Ser Pro Phe Glu Leu Phe Val Ma Asn Asp 50 55 60 Lys Asp Phe Leu Ma Thr Arg Thr Ma Tyr Lys Leu Asn Leu Arg Gly 65 70 75 80 Pro Ma Met Thr Val Gln Thr Ma Cys Ser Ser Ser Leu Val Ma Val 85 90 95 í?*? ?LÉ-? jj - ' ********** . *** His Val Ma Ma Gln Ser Leu Leu Ma Gly Glu Cys Asp He Ma Leu 100 105 110 Ma Gly Gly He Thr Val Ser Arg Ser His Gly Tyr Val Ma Arg Glu 115 120 125 Gly Gly He Leu Ser Pro Asp Gly His Cys Arg Ma Phe Asp Ma Asp 130 135 140 Ma Gly Gly Thr Val Pro Gly Ser Gly Val Gly Val Val Val Leu Lys 145 150 155 160 Arg Leu Glu Asp Ma Leu Ma Asp Gly Asp Thr He Asp Ma Val He 165 170 175 He Gly Ser Ma He Asn Asn Asp Gly Ma Leu Lys Ma Ser Phe Thr 180 185 190 Ma Pro Gln Val Asp Ser Gln Ma Leu Val He Ser Glu Ma His Ma 195 200 205 Ma Ma Gly He Ser Ma Asp Ser He Gly Tyr Met Asp Thr His Gly 210 215 220 Thr Gly 225 <210 > 54 <211 > 223 <212 > PRT <213 > Organismo Desconocido ******** *** * *******---*-*-****** <220> <223> Origen de la secuencia: organismo del suelo <400> 54 Pro Gln Gln Arg Leu Phe Leu Glu Leu Thr Trp Glu Ma Leu Glu Asp 1 5 10 15 Ma Gly He Pro Pro Ser Thr He Ma Gly Thr Asn Val Gly Val Phe 20 25 30 Met Gly Ma Ser Gln Ma Asp Tyr Gly His Lys Phe Phe Ser Asp His 35 40 45 Ma Val Ma Asp Ser His Phe Ma Thr Gly Thr Ser Leu Ma Val Val 50 55 60 Ma Asn Arg He Ser Tyr He Tyr Asp Leu Arg Gly Pro Ser Leu Thr 65 70 75 80 Val Asp Thr Ma Cys Ser Ser Ser Leu Val Ma Leu His Gln Ma Val 85 90 95 Glu Ma Leu Arg Ser Gly Arg He Glu Thr Ma He Val Gly Gly He 100 105 110 Asn Val He Ma Ser Pro Ma Ser Phe He Ma Phe Ser Gln Ma Ser 115 120 125 Met Leu Ser Pro Thr Gly Leu Cys Gln Ma Phe Ser Ma Lys Ma Asp 130 135 140 Gly Phe Val Arg Gly Glu Gly Gly Thr Val Phe Val Leu Arg Lys Ma 145 150 155 160 Ma His Ma His Gly Ser Arg Asn Pro Val Arg Gly Leu He Leu Ma 165 170 175 Thr Asp Val Asn Ser Asp Gly Arg Thr Asn Gly He Ser Leu Pro Ser 180 185 190 Ma Glu Ma Gln Glu Val Leu Leu Gln Arg Val Tyr Ser Arg Ma Ser 195 200 205 He Asp Pro Asn Arg Leu Ma Phé Val Asp Thr His Gly Thr Gly 210 215 220 <210 > 55 <211 > 254 <212 > PRT <213 > Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo <400> 55 Pro Gln Gln Arg Val Phe Leu Asp Gly He Asp Arg Phe Asp Pro Arg 1 5 10 15 His Phe Ma He Thr Pro Arg Glu Ma He Ser Met Asp Pro Gln Gln 20 25 30 Arg Leu Leu Leu Glu Val Thr Trp Glu Ma Leu Glu Arg Ma Gly Val 35 40 45 Ma Pro Asp Arg Leu Thr Gly Ser Asp Thr Gly Val Phe He Gly He 50 55 60 Ser Thr Asn Asp Tyr Gly Gln He Leu Leu Arg Ma Ser Asp Gln He 65 70 75 80 Asp Pro Gly Met Tyr Phe Gly Thr Gly Asn Leu Leu Asn Ma Ma Ma 85 90 95 Gly Arg Leu Ser Tyr Val Leu Gly Leu Gln Gly Pro Ser Met Ma Val 100 105 110 Asp Thr Ma Cys Pro Ser Ser Leu Val Ma He His Leu Ma Cys Gln 115 120 125 Ser Leu Arg Asn Arg Glu Cys Arg Met Ma Leu Ma Gly Gly Ma Asn 130 135 140 Leu Val Leu Val Pro Glu Val Thr Val Asn Cys Cys Arg Ma Lys Met 145 150 155 160 Leu Ma Pro Asp Gly Arg Cys Lys Thr Phe Asp Ma Ma Ma Asp Gly 165 170 175 Tyr Val Arg Gly Glu Gly Ma Ma Val He Val Leu Lys Arg Leu Ser 180 185 190 Asp Ma Leu Ma Asp Gly Asp Pro He Val Ma Leu He Arg Gly Ser 195 200 205 Ma Val Asn Gln Asp Gly Arg Ser Gly Gly Phe Thr Ma Pro Asn Glu 210 215 220 Leu Ma Gln Gln Ma Val He Arg Thr Ma Leu Ma Ma Ma Gly Val 225 230 235 240 ?A* áLÉ**» Ái L?i. .áiM¡ i -. **.**!**.;!.* ^** ** ^* !*^*** *^^ Ma Ma Ser Asp He Gly Tyr Val Asp Thr His Gly Thr Gly 245 250 <210> 56 <211> 254 <212> PRT <213> Organismo Desconocido <220> <223> Origen de la secuencia: <400> 56 Pro Gln Gln Arg Val Phe Leu Asp Gly He Asp Arg Phe Asp Pro Gln 1 5 10 15 Phe Phe Gly He Ma Pro Arg Glu Ma Ma Gly He Asp Pro Gln Gln 20 25 30 Arg Leu Leu Leu Glu Thr Thr Trp Glu Ma Leu Glu Asp Ma Gly Thr 35 40 45 Ser Pro Glu Lys Leu Gln Gly Thr Pro Ma Gly Val Phe Val Gly He 50 55 60 Asn Ser He Asp Tyr Ma Thr Leu Gln Leu Gln Asn Cys Asp Leu Ma 65 70 75 80 Ser He Asp Ma Tyr Ser Leu Ser Gly Ser Ma His Ser He Ma Ma 85 90 95 Gly Arg Leu Ma Tyr Val Leu Gly Leu Gln Gly Pro Ma Met Ma Val 100 105 110 Asp Thr Ma Cys Ser Ser Ser Leu Val Ma He His Leu Ma Cys Gln 115 120 125 Ser Leu Arg Asn Asp Asp Cys Arg Val Ma Val Ma Gly Gly Val His 130 135 140 Val Thr Leu Thr Pro He Asn Met Val Val Phe Ser Lys Leu Arg Met 145 150 155 160 Leu Ma Ma Asp Gly Lys Cys Lys Thr Phe Asp Gly Arg Gly Asp Gly 165 170 175 Phe Val Glu Gly Glu Gly Cys Ma Val He Val Leu Lys Arg Leu Ser 180 185 190 His Ma Leu Ma Asp Lys Asp Arg He Leu Ma Leu Val Arg Gly Ser 195 200 205 Ma Val Asn Gln Asp Gly Ma Ser Ser Gly Leu Thr Ma Pro Asn Gly 210 215 220 Pro Ma Gln Glu Ma Val He Arg Ma Ma Leu Lys Arg Ma Gly Val 225 230 235 240 Gln Pro Ma Glu Val Gly Tyr Val Asp Thr His Gly Thr Gly 245 250 <210> 57 <211> 222 <212 > PRT **t*JL*A? -*i^**' - y * ***.**** .fcafc i <213> Organismo Desconocido <220> <223> Origen de la secuencia: organismo del suelo <400> 57 Pro Gln Glu Arg Val Leu Leu Glu Ser Ser Trp His Ma Leu Glu Asp 1 5 10 15 Ma Gly Tyr Ma Gly Glu Ser He Ma Gly Ma Arg Cys Gly Val Tyr 20 25 30 Met Gly Phe Asn Gly Gly Asp Tyr Gly Asp Leu Leu Tyr Gly Gln Pro 35 40 45 Ser Leu Pro Pro His Ma Met Trp Gly Asn Ma Ma Ser Val Leu Ser 50 55 60 Ma Arg He Ma Tyr Tyr Leu Asp Leu Gln Gly Pro Ma He Thr Leu 65 70 75 80 Asp Thr Ma Cys Ser Ser Ser Leu Val Ma Val His Leu a Cys Gln 85 90 95 Gly Leu Trp Thr Gly Glu Thr Asp Leu Ma Leu Ma Gly Gly Val Trp 100 105 110 He Gln Cys Thr Pro Gly Phe Leu He Ser Ser Ser Arg Ma Gly Met 115 120 125 Leu Ser Pro Thr Gly Gln Cys Arg Ma Phe Gly Ma Gly Ma Asp Gly 130 135 140 i liiiáíij tníiiiü ¡i lhé *-**!*- ß r---**-*-* '*^-- *** * ********* ** »* 'MJt ^******* * * Phe Val Pro Ser Glu Gly Val Gly Val Val Val Leu Lys Arg Leu Gln 145 150 155 160 Asp Ma Leu Asp Ma Gly Asp His Xaa Tyr Gly Val He Arg Gly Ser 165 170 175 Ma He Asn Gln Asp Gly Ma Ser Asn Gly He Thr Ma Pro Ser Ma 180 185 190 Ma Ma Gln Glu Arg Leu Gln Arg His Val Tyr Asp Ser Phe Gly He 195 200 205 Asp Ma Ser Arg Leu Gln Met He Glu Ma His Gly Thr Gly 210 215 220 <210 > 58 <211 > 223 <212 > PRT <213 > Organismo Desconocido <220 > <223> Origen de la secuencia: organismo del suelo <400> 58 Pro Gln Glu Arg Val Leu Leu Glu Val Thr Trp Glu Ma Leu Glu Asp 1 5 10 15 Ma Gly Gln Asp Val Asp Arg Leu Ma Gly Arg Pro Val Gly Val Phe 20 25 30 itlí -feá,fcá~f-- "^-tii-ifrr?-iMi?--.-íl?itoJafciá¿áifc^^ rihÉtt*-- -"-- -* -"»"* - -Ai 4 Val Gly He Ser Ser Asn Asp Tyr Gly Gln Leu Gln Asn Gly Asp Pro 35 40 45 Ma Asp Val Asp Ma Tyr Val Gly Thr Gly Asn Ma Leu Ser He Ma 50 55 60 Ma Asn Arg Leu Ser Tyr Thr Phe Asp Phe Arg Gly Pro Ser Leu Ma 65 70 75 80 Val Asp Thr Ma Cys Ser Ser Ser Leu Val Ma He His Leu Ma Cys 85 90 95 Gln Ser Val Arg Arg Gly Glu Ma Glu Leu Ma Val Ma Ma Gly Val 100 105 110 Asn Leu He Leu Thr Pro Gly Leu Thr Val Asn Phe Thr Arg Ma Gly 115 120 125 Met Met Ma Pro Asp Gly Arg Cys Lys Thr Phe Asp Ma Ma Ma Asn 130 135 140 Gly Tyr Val Arg Gly Glu Gly Ma Gly Val Val Val Leu Lys Pro Leu 145 150 155 160 Ma Gln Ma He Ma Asp Gly Asp Pro He Tyr Ma He Val Arg Gly 165 170 175 Ser Ma Val Asn Gln Asp Gly Arg Ser Asn Gly Leu Thr Ma Pro Asn 180 185 190 Arg Gln Ma Gln Glu Val Val Leu Arg Ma Ma Tyr Arg Asp Ma Gly 195 200 205 He Ser Pro Ma Asp Val Asp Ma Val Glu Ma His Gly Thr Gly 210 215 220 <210> 59 <211> 225 <212> PRT <212> Organismo Desconocido <220> <222> Origen de la secuencia: organismo del suelo <400> 59 Pro Gln Gln Arg Val Phe Leu Glu Asp Ma Thr Glu Val Asp Val Asp 1 5 10 15 Ma Leu Ser Asp Gly Glu Asp Val Val He Ma Gly He Met Gln His 20 25 30 He Glu Glu Ma Gly He His Ser Gly Asp Ser Ser Cys Val Leu Pro 35 40 45 Pro Val Asp He Pro Pro Lys Ma Leu Gln Thr He Arg Asp His Thr 50 55 60 Phe Lys Leu Ma Arg Ma Leu Lys Val He Gly Leu Met Asn Val Gln 65 70 75 80 Tyr Ma He Gln Arg Asp Lys Val Tyr Val He Glu Val Asn Pro Arg 85 90 95 Ma Ser Arg Thr Val Pro Tyr Val Ser Lys Ma Thr Gly Val Pro Leu 100 105 110 ****** ***** .*****. * Ma Lys Val Ma Ser Arg Leu Met Thr Gly Arg Lys Leu His Glu Leu 115 120 125 Leu Pro Glu Glu Val Glu Arg Gly Trp He Thr Thr Ma Gly Glu Asn 130 135 140 Phe Tyr Val Lys Ser Pro Val Phe Pro Trp Gly Lys Phe Pro Gly Val 145 150 155 160 Asp Thr Val Leu Gly Pro Glu Met Lys Ser Thr Gly Glu Val Met Gly 165 170 175 Val Ma Asp Asn Phe Gly Glu Ma Phe Ma Lys Ma Gln He Ma Ma 180 185 190 Gly Thr Tyr Leu Pro Thr Glu Gly Thr Val Phe He Ser Val Asn Asp 195 200 205 Arg Asp Lys Gly Asn Val He Gln Leu Ma Gln Arg Phe Ser Glu Leu 210 215 220 Gly Phe Gly He Val Asp Thr His Gly Thr Gly 225 230 235 <210> 60 <211> 1269 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuencia: Organismo del suelo <400> 60 taacaggaag aagcttgctt ctttgctgac gagtggcgga cgggtgagta acacgtggga 60 acctgcctta tggttcggga taacgtctgg aaacggacgc taacaccgga tgtgcccttc 120 gggggaaagt ttasgccatg agaggggccc gcgtccgatt aggtagttgg tggggtaatg 180 gcccaccaag ccgacgatcg gtagctggtc tgagaggatg atcagccaca ctgggactga 240 gacacggccc agactcctac gggaggcagc agtggggaat attggacaat gggggcaacc 300 ctgatccagc aatgccgcgt gagtgatgaa ggccttaggg ttgtaaagct ctttcgcacg 360 cgacgatgat gacggtagcg tgagaagaag ccccggctaa cttcgtgcca gcagccgcgg 420 taatacgaag ggggcgagcg ttgttcggaa ttactgggcg taaagggcgc gtaggcggcc 480 cgatcagtca gatgtgaaag ccccgggctc aacctgggaa ctgcatttga tactgtcggg 540 cttgagttcc ggagaggatg gtggaattcc cagtgtagag gtgaaattcg tagatattgg 600 gaagaacacc ggtggsgaag gcggccatct ggacggacac tgacgctgag gcgcgaaagc 660 gtggggagca aacaggatta gataccctgg tagtccacgc cgtaaacgat gaatgctaga 720 cgctggggtg catgcacttc ggtgtcgccg ctaacgcatt aagcattccg cctggggagt 780 acggccgcaa ggttaaaact caaaggaatt gacgggggcc cgcacaagcg gtggagcatg 840 tggtttaatt cgaagcaacg cgcagaacct taccaaccct tgacatgtcc attgccggtc 900 cgagagattg gaccttcagt tcggctggat ggaacacagg tgctgcatgg ctgtcgtcag 960 ctcgtgtcgt gagatgttgg gttaagtccc gcaacgagcg caacccctac cgccagttgc 1020 catcattcag ttgggcactc tggtggaact gccggtgaca agccggagga aggsggggat 1080 acgtcaagt cctcatggcc cttatgggtt gggctacaca cgtgctacaa tagcggtgac 1140 agtgggacgc gaagtcgcaa gatggagcaa atccccaaaa gccgtctcag ttcggattgc 1200 actctgcaac tcgggtgcat gaagttggaa tcgctagtaa tcgcggatca gcacgccgcg 1260 gtgaatacg 1269 Í aj. fa-t-^"t'ia¿8^a-i-'- tu**** *** -* -** *** *****^?J**J* *,********.* . - **--******> .— ******.** ************ ama** ? <210> 61 <211> 1500 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuencia: Organismo del suelo <400> 61 ttttaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgggccctct 60 agatgcatgc tcgagcggcc gccagtgtga tggatatctg cagaattcgc ccttcaggcc 120 taacacatgc aagtcgaacg agggcttcgg ccctagtggc gcacgggtga gtaacacgtg 180 ggaacctgcc ttatggttcg ggataacgtc tggaaacgga cgctaacacc ggatgtgccc 240 ttcgggggaa agtttacgcc atgagagggg cccgcgtccg attaggtagt tggtggggta 300 atggcccacc aagccgacga tcggtagctg gtctgagagg atgatcagcc acactgggac 360 tgagacacgg cccagactcc tacgggaggc agcagtgggg aatattggac aatgggggca 420 accctgatcc agcaatgccg cgtgagtgat gaaggcctta gggttgtaaa gctctttcgc 480 acgcgacgat gatgacggta gcgtgagaag aagccccggc taacttcgtg ccagcagccg 540 cggtaatacg aagggggcga gcgttgttcg gaattactgg gcgtaaaggg sgcgtaggsg 600 gcccgatcag tcagatgtga aagccccggg ctcaacctgg gaactgcatt tgatactgtc 660 gggcttgagt tccggagagg atggtggaat tcccagtgta gaggtgaaat tcgtagatat 720 tgggaagaac accggtggcg aaggcggcca tctggacgga cactgacgct gaggcgcgaa 780 agcgtgggga gcaaacagga ttagataccc tggtagtcca cgccgtaaac gatgaatgct 840 agacgctggg gtgcatgcac ttcggtgtcg ccgctaacgc attaagcatt ccgcctgggg 900 agtasggccg caaggttaaa actcaaagga attgacgggg gccsgcacaa gcygtcgfags 960 atgtggttta attcgaagca acgcgcagaa ccttaccaac ccttgacatg tccattgccg 1020 gtcsgagaga ttggaccttc agttcggctg gatggaacac aggtgctgca tggctgtcgt 1080 cagctcgtgt cgtgagatgt tgggttaagt cccgcaasga gsgsaacccc taccgccagt 1140 tgccatca t sagttgggca ctctggtgga actgcsggtg acaagccgga ggaaggcggg 1200 gatgacgtca agtcctcatg gcccttatgg gttgggctac acacgtgcta caatggcggt 1260 gacagtggga cgcgaagtcg caagatggag caaatcccca aaagccgtct cagttcggat 1320 tgcastctgc aastcgggtg catgaagttg gaatcgctag taatcgcgga tcagcacgcc 1380 gcggtgaata cgttcccggg ccttgtacac accgcccaag ggcgaattcc agcacactgg 1440 cggccgttac tagtggatcc gagctcggta ccaagcttgg cgtaatcatg gtcatagctg 1500 <210> 62 <211> 1366 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuencia: Organismo del suelo <400> 62 asgacggcca gtgaattgta atasgactca ctatagggcg aattgggccc tstagatgsa 60 tgctcgagcg gccgccagtg tgatggatat ctgcagaatt cgcccttcag gcctaacaca 120 tgcaagtcga asgaaggstt sggccttagt ggcgcacggg tgagtaasas gtgggaacct 180 gcctttcggt tcggaataac gtctggaaas ggasgstaas accggatacg ccsttcgggg 240 gaaagttcac gscgagagag gggcccgsgt cggattaggt agttggtgag gtaatggctc 300 accaagcctt cgatccgtag ctggtctgag aggatgatca gccacactgg gactgagaca 360 cggcccagac tcctacggga ggcagcagtg gggaatattg gacaatgggc gcaagcctga 420 tccagsaatg ccgcgtgagt gatgaaggcc ttagggttgt aaagctsttt cgsacgcgac 480 gatgatgasg gtagsgtgag aagaagsccc ggctaacttc gtgccagcag csgcggtaat 540 acgaaggggg ctagcgttgt tcggaattac tgggsgtaaa gggsgcgtag gcggcctgct 600 tagtcagaag tgaaagcccc gggctcaacc tgggaatagc ttttgatact ggcaggcttg 660 agttccggag aggatggtgg aattcccagt gtagaggtga aattcgtaga tattgggaag 720 aasaccggtg gcgaaggsgg ccatctggac ggasactgac gctgaggcgc gaaagsgtgg 780 ggagcaaaca ggattágata ccstggtagt ccacgccgta aacgatgaat gctagacgtc 840 ggggtgcatg cacttcggtg tcgccgctaa cgcattaagc attccgcctg gggagtacgg 900 ccgcaaggtt aaaactcaaa ggaattgacg ggggcccgca caagcggtgg agcatgtggt 960 ttaattcgaa gcaacgcgca gaaccttacc aacccttgac atgtccatta tgggcttcag 1020 agatgaggtc cttcagttcg gctgggtgga acacaggtgc tgcatggctg tcgtcagctc 1080 gtgtcgtgag atgttgggtt aagtcccgca asgagcgcaa cccstassgt cagttgccat 1140 cat cagttg ggsaststgg tggaassgss ggtgasaagc cggaggaagg cggggatgas 1200 gtcaagtcct catggccctt atgggttggg ctacacasgt gstasaatgg sggtgacagt 1260 gggaagcgaa gtcgcgagat ggagcaaatc cccaaaagcc gtctcagttc ggatcgcast 1320 ctgcaactcg agtgsgtgaa gttggaatcg ctagtaatsg sggats 1366 <210> 63 <211> 1360 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuencia: Organismo del suelo <400> 63 asagctatga ccatgattac gccaagcttg gtaccgagct cggatccact agtaacggcc 60 gccagtgtgs tggaattcgc csttcaggcc taacacatgc aagtcgaacg ccccgsaagg 120 ggagtggsag acgggtgagt aacgcgtggg aacatassst ttcctgsgga atagstccgg 180 gaaactggaa ttaataccgc atacgcscta cgggggaaag atttatcggg gaaggattgg 240 cccgcgttgg attagctagt tggtggggta aaggcctacc aaggsgacga tccatagctg 300 gtstgagagg atgatcagcc acattgggac tgagacacgg sccaaactcc tacgggaggc 360 agcagtgggg aatattggac aatgggsgca agcstgatss agscatgccg cgtgagtgat 420 gaaggcctta gggttgtaaa gctctttcac cggagaagat aatgacggta tccggagaag 480 aagcscsggc taacttcgtg ccagcagccg cggtaatacg aagggggcta gtgttgttcg 540 gaattactgg gcgtaaagcg cacgtaggcg gatatttaag tcaggggtga aatcccagag 600 ctcaactctg gaactgcctt tgatactggg tatcttgagt atggaagagg taagtggaat 660 tccgagtgta gaggtgaaat tcgtagatat tcggaggaac accagtggcg aaggcggctt 720 actggtccat tactgacgct gaggtgcgaa agcgtgggga gcaaacagga ttagataccc 780 tggtagtcca cgccgtaaac gatgaatgtt agccgtcggg cagtatactg ttcggtggcg 840 cagctaacgc attaaacatt ccgcctgggg agtacggtcg caagattaaa actcaaagga 900 ttgacgggg gcccgcacaa gcggtggagc atgtggttta attcgaagca acgcgcagaa 960 ccttaccagc tcttgacatt cggggtttgg gcagtggaga cattgtcctt cagttaggct 1020 ggccccagaa caggtgctgc atggctgtcg tcagctcgcg tsgtgagatg ttgggttaag 1080 tcscgsaasg agsgsaaccs tsgsssttag ttgssagsat ttagttgggs actctaaggg 1140 gactgccggt gataagcsga gaggaaggtg gggasgasgt saagtsstsa tggsccttac 1200 gggctgggct acacasgtgc tacaatggtg gtgacagtgg gsagsgagac agsgatgtsg 1260 agstaatsts saaaagcsat ctsagttsgg attgsastct gsaastsgag tgcatgaagt 1320 tggaatcgct agtaatcgsa gatsagcatg tgcggtgaat 1360 <210> 64 <211> 1288 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la secuencia: Organismo del suelo <400> 64 tccaggaaas agstatgacc atgattacgc saagsttggt ascgagctcg gatscactag 60 taasggccgc sagtgtgstg gaattcgsss ttsaggssta asasatgsaa gtsgagsgss 120 ccgcaagggg agcggcagas gggtgagtaa sgsgtgggaa tstasssats cstasggaac 180 aactccggga aastggagst aatascgtat acgcsctttg ggggaaagat ttatcgggga 240 tggatgagss sgsgttggat tagstagttg gtggggtaaa ggsstassaa ggsgasgats 300 satagstggt ctgagaggat gatcagcsas attgggastg agasasggss caaactcsta 360 sgggaggsag sagtggggaa tattggasaa tgggsgsaag sstgatssag ccatgsscgc 420 gtgagtgatg aaggtcttag gattgtaaag ststttsass ggagaagata atgasggtat 480 scggagaaga agssssggst aastttsgtg scagcagssg sggtaatasg aagggggsta 540 gsgttgttsg gaattastgg gcgtaaagcg sasgtaggsg gatatttaag tsaggggtga 600 aatccsagag stsaaststg gaastgsstt tgatastggg tatcttgagt atggaagagg 660 i ** -*******.*** s&?smMk* **„— ********************** ***** *& ^j* * *-- * -^*-«t^.aa¿«^AaabaaÉÍüüfa taagtggaat tgsgagtgta gaggtgaaat tsgtagatat tsgsaggaas assagtggsg 720 aaggsggstt astggtssat tastgacgst gaggtgsgaa agsgtgggga gcaaacagga 780 ttagatasss tggtagtssa sgccgtaaas gatgaatgtt agssgtsggs aagtttactt 840 gtsggtggsg sagstaasgs attaaasatt ssgsstgggg agtasggtsg saagat aaa 900 astsaaagga attgasgggg gsscgcasaa gsggtggagc atgtggttta attcgaagsa 960 acgcgcagaa ssttassags scttgacatg sssggasags tasagagatg tagtgttsss 1020 ttsggggass gggasasagg tgstgsatgg stgtsgtsag stcgtgtsgt gagatgttgg 1080 gttaagtsss gcaacgagsg saassstsgc ssttagttgs sagsattsag ttgggsasts 1140 taaggggast gssggtgata agccgagagg aagtggggat gacgtcaagt sctnatggcc 1200 cttacgggst gggctacaca sgtgstasaa tgggtggtga sagtgggsag sgaaggaasg 1260 atsccgagct aatstssaaa agssatst 1288 <210> 65 <211> 1386 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 65 cgacggccag tgaattgtaa tacgactcac tatagggsga attgggccct ctagatgcat 60 gctcgagcgg csgscagtgt gatggatats tgcagaattc gsscttcagg sstaasasat 120 gsaagtcgag sgggcgtagc aatacgtsag sggcagacgg gtgagtaacg cgtgggaaca 180 ***** t . ****^ t?tfttl^a?.*?*l ****** J taccttttgg ttcggaasaa casagggaaa cttgtgctaa tassggataa gsssttacgg 240 ggaaagattt atsgscgaaa gattggscsg sgtstgatta gstagttggt agggtaatgg 300 sstassaagg sgacgatsag tagstggtst gagaggatga tsagssasat tgggastgag 360 asasggsssa aastsstasg ggaggsagca gtggggaata ttggacaatg ggsgsaagss 420 tgatccagss atgscgcgtg agtgatgaag gssctagggt tgtaaagcts ttttgtgsgg 480 gaagataatg asggtaccgc aagaataagc cccggctaac ttcgtgccag cagccgcggt 540 aatacgaagg gggstagcgt tgctsggaat sastgggsgt aaagggtgsg taggsgggts 600 tttaagtsag gggtgaaats stggagstsa astssagaac tgcstttgat astgaagatc 660 ttgagttcgg gagaggtgag tggaastgsg agtgtagagg tgaaattsgt agatattsgs 720 aagaasacca gtgggcgaag gsggstsast ggcccgatac tgasgctgag gcacgaaagc 780 gtggggagsa aasaggatta gatassstgg tagtccasgs sgtaaasgat gaatgssags 840 sgttagtggg tttactcact agtggcgcag ctaacgcttt aagsattccg cstggggagt 900 asggtsgcaa gattaaaact caaaggaatt gacgggggcs sgsasaagsg gtggagsatg 960 ggtttaatt sgasgsaacg cgcagaasst tassagccst tgasatgtss aggassggtc 1020 gcagagatgt gassttstct tcggagcctg gagsasaggt gstgsatggc tgtcgtcags 1080 tsgtgtcgtg agatgttggg ttaagtcssg caacgagcgc aasssssgts sttagttgst 1140 assatttagt tgagcactst aaggagastg ssggtgataa gssgsgagga aggtggggat 1200 gasgtsaagt sstsatggcc cttacgggst gggstasaca cgtgctasaa tggsggtgac 1260 aatgggacgc taaggggcaa cccttcgcaa atctcaaaaa gcccgtctsa gttcggattg 1320 ggctstgcaa ctsgagsssa tgaagttgga atsgstagta atsgtggats agsacgcsas 1380 ggtgaa 1386 <210> 66 <211> 1223 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 66 agsggsagag ggtgagtaas gsgtgggaat ctacccatct ctacggaaca actscgggaa 60 actggagcta atacsgtata cgtccttcgg gagaaagatt tatsggagat ggatgagssc 120 gcgttggatt agctagttgg tggggtaatg gsstassaag gsgasgatss atagstggts 180 tgagaggatg atcagccaca stgggastga gacacggcss agactcctas gggaggsagc 240 agtggggaat attggacaat gggsgaaags ssgatssags satgssgsgt gagtgatgaa 300 ggssstaggg ttgtaaagct ctttcaasgg tgaggataat gasggtaass gtagaagaag 360 ssssggctaa sttsgtgssa gsagssgsgg taatasgaag ggggctagcg ttgttsggaa 420 ttastgggcg taaagcgcac gtaggsggac tattaagtca ggggtgaaat sccggggsts 480 aaccccggaa ctgcctttga tactggtagt ctcgagtssg gaagaggtga gtggaattss 540 gagtgtagag gtgaaattcg tagatattcg gaggaacacc agtggsgaag gcggctsast 600 ggtssggtas tgasgctgag gtgcgaaagc gtggggagsa aasaggatta gataccstgg 660 tagtssacgc cgtaaacgat ggaagstags cgttggcaag tttasttgts ggtggsgsag 720 ctaacgcatt aagcttsssg cctggggagt acggtcgcaa gattaaaast saaaggaatt 780 acgggggcs cgsasaagcg gtggagcatg tggtttaatt sgaagsaasg sgsagaasst 840 ssagssst tgasatcccg gtsgcggtta ccagagatgg tatssttsag ttsggctgga 900 ssggtgasag gtgstgsatg gstgtcgtca gstsgtgtsg tgagatgttg ggttaagtsc 960 cgcaasgags gsaassstcg ccsttagttg ccagcattsa gttgggsast staaggggas 1020 tgcsggtgat aagssgagag gaaggtgggg atgasgtsaa gtsstsatgg cccttacggg 1080 stgggstasa sasgtgstas aatggtggtg asagtgggsa gcgagacsgc gaggtcgagc 1140 taatctssaa aagccatcts agttsggatt gsastctgca actcgagtgc atgaagttgg 1200 aatcgstagt aatsgcggat sag 1223 <210> 67 <211> 1237 <212> ADN <213> Organismo Dessonocido <220> <223> Origen de la secuencia: Organismo del suelo <400> 67 cscgcagggg agtggcagag ggtgagtaas gsgtgggaat ctacsstttt stacggaaca 60 astgagggaa asttsagsta ataccgtata cggcsgagag gsgaaagatt tatsggagaa 120 ggatgagccc gsgttggatt agstagt gg tggggtaaag gcctaccaag gsgasgatss 180 atagctggtc tgagaggatg atsagssasa ctgggactga gacasggssc agactcstas 240 gggaggsags agtggggaat attggasaat gggsgsaags ctgatcsags satgssgsgt 300 gagtgatgaa ggssstaggg ttgtaaagst stttsaccgg tgaagataat gacggtaacs 360 ggagaagaag ccccggctaa cttcgtgcca gcagcsgcgg taatacgaag ggggstagsg 420 ttgttsggat ttastgggsg taaagcgcas gtaggsggac tattaagtca ggggtgaaat 480 cccggggcts aacsssggaa stgsstttga tastggtagt cttgagttcg aaagaggtga 540 gtggaattsc gagtgtagag gtgaaattsg tagatattsg gaggaasass agtggsgaag 600 *i **.l ? . * A..*. -M mp * *J** ***** lMtM*- —*— - .-^"•~--^^-*^^^-*¿*-«*^^ gsggstsast ggstsgatas tgasgstgag gtgsgaaagc gtggggagca aacaggatta 660 gatassctgg tagtcsasgs cgtaaactat gagagctagg sgtsgggcag tatactgtts 720 ggtggsgcag ctaasgsatt aagststtsg sstggggagt asggtsgcaa gattaaaast 780 saaaggaatt gasgggggss sgsasaagsg gtggagsatg tggtttaatt sgaagsaasg 840 cgcagaasst tassagssst tgasatsssg atsgsggtta ssagagatgg tatssttsag 900 ttaggctgga tcggtgacag gtgctgcatg gstgtsgtsa gstsgtgtsg tgagatgttg 960 ggttaagtss sgsaasgags gsaassstsg sssttagttg ssatsattsa gttgggcact 1020 staaggggac tgcsggtgat aagssgagag gaaggtgggg atgasgtsaa gtsstsatgg 1080 cccttasggg stgggstaca cacgtgctac aatggtggcg acagtgggca gcgagaccgc 1140 gaggtcgagc taatstssaa aagccatsts agttsggatt gcactctgca actcgagtgc 1200 atgaagttgg aatsgstagt aatcgtggat cagaatg 1237 <210> 68 <211> 1346 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 68 asgasgggss agtgaattgt aatasgasts astatagggs gaattgggss ststagatgs 60 atgstcgagc ggscgcsagt gtgatggata tstgsagaat tsgsssttca ggcstaasas 120 atgcaagtcg aacggatcss ttcggattag tggcggacgg gtgagtaasa sgsgggaacg 180 tgssstttgg ttsggaasaa stsagggaaa cttgagstaa tascggataa gsstttsgag 240 ggaaagattt atcgssattg gagsggsscg sgtaggatta gstagttggt gaggtaaaag 300 stsassaagg sgasgatsst tagctggtct gagaggatga tsagscacat tgggastgag 360 acacggcssa aastsstasg ggaggcagca gtggggaats ttgsgcaatg ggcgaaagsc 420 tgacgcagsc atgcsgsgtg aatgatgaag gtcttaggat tgtaaaattc tttsassggg 480 gasgataatg asggtasssg gagaagaags sssggctaac ttcgtgccag cagcsgsggt 540 aatasgaagg gggctagcgt tgctcggaat tastgggcgt aaagggagsg taggsggata 600 gtttagtcag aggtgaaagc scagggctca accttggaat tgsstttgat astggstats 660 ttgagtasgg aagaggtatg tggaastscg agtgtagagg tgaaattcgt agatattcgg 720 aagaacassa gtggcgaagg cgacatastg gtssgttast gasgctgagg stcgaaagcg 780 tggggagsaa asaggattag atassstggt agtssasgst gtaaasgatg agtgstagtt 840 gtsggcatgc atgsatgtsg gtggsgsagc taacgsatta agsactcsgc ctggggagta 900 sggtsgsaag attaaaasts aaaggaattg asgggggsss gsasaagsgg tggagsatgt 960 ggtttaatts gaagsaasgs gcagaasstt assacctttt gacatgsccg gascgstssa 1020 gagatggags tttccsttsg gggastggga sasaggtgct gcatggctgt cgtcagstcg 1080 tgtsgtgaga tgttgggtta agtccsgsaa sgagcgcaas sstsgstatt agttgssats 1140 aggtttggst gggsactcta ataggassgs sggtggtaag ssggaggaag gtggggatga 1200 cgtcaagtss tcatggcsst tasaaggtgg gstasasasg tgstasaatg gsgactasag 1260 agggctgcaa tcccgcgagg gggagssaat ssstaaaagt sgtstsagtt sggattgsas 1320 tctgcaactc gagtgsatga agttgg 1346 <210> 69 <211> 1500 <212> ADN <213> Organismo Dessonocido <220> <223> Origen de la secuensia: Organismo del suelo <400> 69 asagstatga ssatgattas gssaagsttg gtascgagst sggatssast agtaasggsc 60 gccagtgtgc tggaattcgc ssttsaggss taasacatgc aagtsgaasg scgtagsaat 120 asggagtggs agasgggtga gtaasasgtg ggaasgtgss stttggttsg gaasaasasa 180 gggaaasttg tgctaatacc gaataagssc ttacggggaa agatttatcg ssaaaggats 240 ggsssgsgts tgattagcta gttggtgggg taacggsssa ssaaggstas gatcagtagc 300 tggtstgaga ggatgatsag ssasastggg astgagasas ggsssagast cctasgggag 360 gsagcagtta ggaatcttgg asaatgggsg saagsstgat ssagscatgc sgcgtgagtg 420 atgaaggcct tagggttgta aagctstttc agcggggaag ataatgacgg tacccgsaga 480 agaagccccg gctaacttcg tgcsagsags cgsggtaata sgaagggggs tagsgttgst 540 sggaatsast gggsgtaaag sgsasgtagg cggatcttta agtcaggggt gaaatcstgg 600 agctcaactc sagaactgcc tttgatactg gggatstcga gtssggaaga ggtgagtgga 660 astscgagtg tagaggtgaa attcgtagat attsggaaga asascagtgg cgaaggsggs 720 tsastggtcc ggtastgasg stgaggtgsg aaagcgtggg gagsaaasag gattagatas 780 cctggtagts sacgcsgtaa acgatggatg ctagccgttg gcgggtttac tsgtsagtgg 840 cgcagctaac gcattaagsa tcccgcstgg ggagtasggt cgsaagatta aaastsaaag 900 aattgacgg gggcssgsas aagsggtgga gsatgtggtt caattsgaag saasgsgsag 960 aaccttacca gcssttgasa tgtccsgtat ggasttsaga gatgaggtcc ttcagttsgg 1020 ctggcgggaa casaggtgst gcatggctgt cgtcagctcg tgtsgtgaga tgttgggtta 1080 agtsscgcaa sgagsgsaas cctsgssstt agttgscatc atttagttgg gcactstaag 1140 gggastgssg gtgataagcc gcgaggaagg tggggatgas gtcaagtcct catggccstt 1200 asgggstggg stasasasgt gstasaatgg sggtgasagt gggasgsaat ggagcaatss 1260 tgcgcaaats tcaaaaagcs gtstcagttc ggattggggt ctgcaastsg assssatgaa 1320 gtsggaatsg ctagtaatcg sagatsagsa sgctgcggtg aatacgttcc sgggcsttgt 1380 acacaccgcc saagggcgaa ttctgcagat atccatcaca ctggsggccg stsgagsatg 1440 satstagagg gsssaattsg ssstatagtg agtsgtatta saattsastg gssgtsgttt 1500 <210> 70 <211> 1113 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 70 gagctaatac cgtataatga sttsggtssa aagatttats gcctgaggat gagsscgsgt 60 sggattagct agttggtagg gtaaaagcst assaaggcga cgatcsgtag stggtctgag 120 aggatgatca gccasactgg gactgagaca sggccsagas tsstasggga ggsagsagtg 180 gggaatattg gasaatgggc gcaagsstga tscagcaatg scgcgtgagt gatgaaggcs 240 ttagggttgt aaagststtt tasccgggaa gataatgast gtaccgggag aataagssss 300 ggctaactcc gtgcsagsag ssgsggtaat acggaggggg ctagsgttgt tsggaattas 360 tgggsgtaaa gsgsasgtag gcggctttgt aagttagagg tgaaagsssg gggstcaast 420 &*?** Í* ?******.,* .-.i** -** ... ,¿^,,..^^a._aiMUA^.aatf£»Éa-i&'^J-"t"-a *- -frJ ~>->~-**- u f-~-~" **• ! .** . ssggaattgs stttaagast gsatsgstsg aattgtggag aggtaagtgg aattssgagt 480 gtagaggtga aattsgtaga tattsggaag aasassagtg gsgaaggsga sttastggac 540 acatattgas gstgaggtgs gaaagsgtgg ggagsaaasa ggattagata ssstggtagt 600 ssasgscgta aacgatgatg astagstgts ggggsgstta gcgtttsggt ggsgsagsta 660 acgcgttaag tcatcsgsst ggggagtasg gssgsaaggt taaastcaaa gaaattgasg 720 ggggsstgsa saagsggtgg agsatgtggt ttaattsgaa gsaasgcgca gaaccttacs 780 agsgtttgas atgssaggas ggtttssaga gatggattss ttsssttasg ggasstggas 840 asaggtgctg catggstgts gtsagstsgt gtsgtgagat gttgggttaa gtsssgcaac 900 gagcgcaass stsgtsttta gttgstassa tttagttgag sastctagag aaactgssgg 960 tgataagssg gaggaaggtg gggatgasgt saagtsstsa tggccsttas gcgctgggct 1020 asasasgtgc tacaatggsg gtgasaasgg gcagcaaact cgcgagagtg agsaaatsss 1080 gaaaagscgt stcagttcgg attgttstst gca 1113 <210> 71 <211> 1225 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuensia: Organismo del suelo <400> 71 ggagsggsgg acgggtgagt aasgcgtggg aasgtgssst ttggtasgga asaastgagg 60 gaaasttcag ctaatassgt atgtgssstt cgggggaaag atttatcgss attggagsgg 120 sssgsgttgg attaggtagt tggtggggta aaggsstasc aagcctasga tssatagstg 180 gtstgagagg atgatsagss asastgggas tgagasasgg sssagastss tascggaggs 240 agsagtaggg aatsttgsgs aatgggsgaa agsstgasgs agssatgssg sgtgtatgat 300 gaaggtctta ggattgtaaa atactttsas sggggaagat aatgasggta sssggagaag 360 aagssccggc taasttcgtg csagsagssg sggtaatasg aagggggcta gcgttgctcg 420 gaattastgg gcgtaaaggg cgsgtaggsg gatatttaag tcgggggtga aagcccaggg 480 stsaascctg gaattgcctt cgatactgga tatcttgagt tcgggagagg tgagtggaat 540 gscgagtgta gaggtgaaat tcgtagatat tcggcggaac assagtggsg aaggsgasts 600 astggsccga tastgasgct gaggcgcgaa agsgtgggga gsaaasagga ttagatasss 660 tggtagtsca cgctgtaaac gatgagtgst agttgtsggs atgsatgsat gtsggtgasg 720 sagctaacgs attaagsast ssgsctgggg agtacggtsg saagattaaa astsaaagga 780 attgasgggg gcccgcacaa gcggtggagc atgtggttta attcgaagca asgcgcagaa 840 ssttascacc ttttgasatg ssstgatsgc tggagagatc sagttttssc ttcggggaca 900 gggacacagg tgctgcatgg ctgtcgtcag stsgtgtsgt gagatgttgg gttaagtccc 960 gcaacgagcg caassctcgc cattagttgc catcattaag ttgggcactc taatgggacc 1020 gccggtggta agcsggagga aggtggggat gasgtsaagt sstsatggsc cttasggggt 1080 gggctacasa cgtgctasaa tggsgastas agagggttgs aaasstgsga aggggagcta 1140 atccctaaaa gtcgtctcag ttsggattgs aststgsaac tcgagtgsat gaagtsggaa 1200 tcgctagtaa tcgcggatca gcatg 1225 <210> 72 <211> 1286 <212> ADN <213> Organismo Desconosido *Mtj¿ui¡*¡^** * »*x»**>'..* *** **. * *********** afta l a -j <220> <223> Origen de la sesuensia: Organismo del suelo <400> 72 atgattagta gsaatastaa tsgatgasga gsggsggasg ggtgagtaat asgtaggaac 60 ctgcssttaa gsgggggata astaagggaa astttagota atassgsata aastsgagag 120 agaaaagstg sagsaatgtg gsasttgagg aggggsctgc gtcagattag stagttggtg 180 aggtaatagc tcassaaggc gatgatctgt aastggtctg agaggasgas sagtcacast 240 gggastgaga sasggsccag actcstasgg gaggsagcag tggggaatat tggacaatgg 300 gggcaaccst ga ssagcga tgcsgsgtgg gtgaagaagg ssttsgggtt gtaaagssst 360 ttaggtcggg aagaaggtta gtagaggaaa tgctattaac ttgasggtas sgasagaata 420 agcacsggsa aactctgtgc cagcagccgc ggtaatacag agggtgsgag sgttaatsgg 480 atttastggg sgtaaagggs gsgtaggsgg tgagatgtgt gtgatgtgaa agssccaggc 540 tcaacstggg aagtgsatsg saaactgtst gastggagta tatgagaggg tggsggaatt 600 tccggtgtag cggtgaaatg sgtagagats ggaaggaasg tsgatggcga aggcagssas 660 ctggcataat actgasgstg aggsgsgaaa gcgtggggat cgaasaggat tagatassst 720 ggtagtccas gctgtaaact atgagtacta gatgttggta ggggaacsta tsggtatsga 780 agstaasgsg ataagtatts cgcstgggaa gtasggscgs aaggttgaaa ctcaaatgaa 840 ttgasggggg sscgsasaag sggtggagsa tgtggtttaa ttcgatgcaa sgsgaagaas 900 cttacctacc cttgacatcc tgagaatctg gcttagtagc tggagtgccg aaaggagcts 960 agagacaggt gctgsatggc tgtcgtcags tcgtgttgtg agatgttggg ttaagtcssg 1020 aasgagcgc aasscttgcs sttagttgss atsatttagt tggggastst aaggggassg 1080 csagtgatga astggaggaa ggsggggasg asgtsaagts atsatggsst ttatgggtag 1140 ggccacasas gtgstasaat ggggcgtacg gagggtcgca aasssgsgag ggggagstaa 1200 tstsataaag sgtstsgtag tccggattgg agtstgcaas tsgastscat gaagttggaa 1260 tsgstagtaa tsgsgaatsa gsattg 1286 <210> 73 <211> 1288 <212> ADN <213 > Organismo Desconocido <220> <223 > Origen de la secuencia : Organismo del suelo <400> 73 cggggcaacc ctggcggsga gsggsgaasg ggtgagtaat gsatsggaas gtgtsststt 60 gtgggggata accagtsgaa agactggcta atassgsatg agatsgaaag atgaaagcag 120 gggacsgsaa ggccttgsgs gagaggagca gcsgatgcsg gattagctag ttggtggggt 180 aaaagcctac caaggcgacg atccgtagct ggtstgagag gasgassags sacactggga 240 ctgagacacg gsssagasts ctacgggagg cagcagtggg gaattttgga sagtgggggs 300 aascctgatc sagssatgcc gcgtgtgtga agaaggsctt cgggttgtaa agcactttsg 360 gasggaacga aatcgcgsga gttaatagtt sgsgtggatg asggtassgt aagaagaags 420 accggctaac tacgtgssag sagssgsggt aatasgtagg gtgcgagcgt taatsggaat 480 tastgggsgt aaagtgtgsg saggsggstt sgsaagtsga gtgtgaaats sssgagctta 540 acttgggaat tgcgstsgaa astasggagc cggagtgtgg sagaggaagg tggaattssa 600 cgtgtagcgg tgaaatgsgt agagatgtgg aggaasassg atggsgaagg sggssttstg 660 ggscaacast gasgstsatg casgaaagsg tggggagsaa acaggattag ataccctggt 720 agtssasgcc staaasgatg atgastagtt gttggaggag ttaaatcstt tagtaasgsa 780 gstaasgsgt gaagtsatss gsstggggag tasggtsgsa agattaaaas tsaaaggaat 840 tgacgggggc ssgcacaagc ggtggatgat gtggtttaat tsgatgsaas gsgaaaaass 900 ttasctaccc ttgasatgst aggaacgstg sagaaatgta gsggtgsssg aaagggaass 960 tagasasagg tgstgcatgg ctgtsgtsag ctcgtgtsgt gagatgttgg gttaagtsss 1020 gsaacgagcg saasssstgs cattagttgc tacattcagt tgagcastst aatgggastg 1080 ccggtgacaa assggaggaa ggtggggatg asgtsaagts stsatggsss ttatgggtag 1140 ggstasasas gtsatacaat ggcgsgtaca gagggttgcs aasssgsgag ggggagssaa 1200 tccsagaaag cgcgtcgtag tssggattgg agtstgsaas tcgactssca tgaagtsgga 1260 atcgctagta atsgsggats agsatgts 1288 <210> 74 <211> 600 <212> AND <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 74 sgtgssagsa gssgsggtaa tacgtaggtg gcaagcgttg tssggaatta ttgggsgtaa 60 gsgsgsgsa ggtggtttst taagtstgat gtgaaagsss acggsttaas cgtggagggt 120 cattggaaac tgggagactt gagtgsagaa gaggaaagtg gaattssaag tgtagsggtg 180 aaatgsgtag agatttggag gaasassagt ggsgaaggsg astttstggt stgsaastga 240 l*?. J*t* ?* *.** li*U* Í*- t. *****. * *^ * *** ** ***»* a..«t.á cgctgaggcg cgaaagcatg gggagsaaas aggattagat acsctggtag tscatgssgt 300 aaasgatgag tgstaagtgt tagggggttt ssgsssstta gtgstgsagc taacgcatta 360 agsastssgs stggggagta sgassgsaag gttgaaasts aaaggaattg acgggggssc 420 gsasaagsgg tggagsatgt ggtttaatts gaagsaacgc gaagaacctt assaggtstt 480 gasatsssga tgansgstst agagatagag ttttsssttc ggggasattg gtgasaggtg 540 gtgsatggtt gtsgtsagst cgtgtcgtga gatgttgggt taagtsscgc aacgagcgca 600 <210> 75 <211> 601 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 75 cgtgccagsa gssgsggtaa tasgtaggtg gcaagcgttg tssggaatta ttgggsgtaa 60 agsgcgcgca ggtggtttst taagtstgat gtgaaagsss asggsttaas sgtggagggt 120 cattggaaac tgggagastt gagtgcagaa gaggaaagtg gaattccaag tgtagsggtg 180 aaatgcgtag agatttggag gaasassagt ggsgaaggsg actttctggt stgsaastga 240 sgstgaggsg sgaaagsatg gggagsaaas aggattagat assstggtag tccatgssgt 300 aaasgatgag tgstaagtgt tagggggttt scgcssstta gtgctgagct aasgsattaa 360 gcactccgsc tggggagtac gacsgcaagg ttgaaastsa aaggaattga cgggggcssg 420 cacaagsggt ggagsatgtg gtttaattsg aagsaasgsg aagaasstta ssaggtsttg 480 acatcssgat gasgststag agatagagtt ttsssttsgg ggacattggt gacaggtggt 540 gcatggttgt cgtsagstcg tgtsgtgaga tgttgggtta agtsccgsaa cgagsgsass 600 s 601 <210> 76 <211> 1236 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 76 tgssstgtag acggggataa cttsgggaaa ssggagstaa tascggataa tsststtsss 60 sasatgggga agagttgaaa ggsgstttcg cgtcastasa ggatgggssc gcggtgcatt 120 agctagttgg tagggtaacg gsctaccaag gcgasgatgs atagscgass tgagagggtg 180 atcggccasa ttgggactga gasasggscc aaactsstas gggaggsags agtagggaat 240 cttcsasaat ggasgaaagt stgatggags aacgcsgsgt gagtgatgaa ggttttsgga 300 tcgtaaaact ctgttgtaag ggaagaasca gtacgtcagg saatggasgt assttgasgg 360 tassttatta gaaagssasg gstaastasg tgccagsags sgsggtaata sgtaggtggs 420 aagsgttgts sggaattatt gggsgtaaag sgcgcgsagg tggtttctta agtctgatgt 480 gaaagsssas ggsttaascg tggagggtca ttggaaactg ggagasttga gtgcagaaga 540 ggaaagtgga attccaagtg tagsggsgaa atgcgtagag atttggagga acassagtgg 600 sgaaggsgas tttstggtst gsaastgasg stgaggsgsg aaagsatggg gagcaaacag 660 ga tagatas sstggtagts satgstgtaa asgatgagtg ctaagtgtta gggcgtttss 720 gssssttagt gstgsagsta asgsattaag sastssgsct ggggagtasg accgcaaggt 780 tgaaastsaa aggaattgas gggggsssgs asaagcggtg gagsatgtgg tttaattsga 840 agsaasgcga agaacsttas saggtsttga satsssgatg atsgststgg agatagagtt 900 ttsccttsgg ggasattggt gasaggtggt gcatggttgt cgtcagctsg tgtsgtgaga 960 tgttgggtta agtsssgsaa sgagsgcaac scttaatctt agttgcsats atttagttgg 1020 gsactctaag gtgastgssg gtgataaacc ggaggaaggt ggggatgacg tsaaatsatc 1080 atgccsstta tgasstgggc tacacacgtg stasaatgga sggtasaaag agtsgstaac 1140 tcgcgagagt atgstaatst satagaascg ttctsagtts ggattgtagg stgsaastsg 1200 sstasatgaa gccggaatcg stagtaatsg sggats 1236 <210> 77 <211> 815 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuencia: Organismo del suelo <400> 77 caagcgttgt csggaattat tgggsgtaaa gagstcgtag gcggtttgtc gcgtstgctg 60 tgaaaactsg aggstsaass tsgggs tgc agtgggtacg ggsagastag agtgsggtag 120 gggtgastgg aattsstggt gtagcggtgg aatgcgcaga tatsaggagg aasassgatg 180 gsgaaggcag gtcastgggs cgcaastgas gctgaggagc gaaagsatgg ggagsgaasa 240 ggattagata ssstggtagt ssatgssgta aasgttgggs astaggtgtg gggstcattc 300 cacgagttcs gtgscgcags aaacgcatta agtgssscgc ctggggagta sggssgsaag 360 gc taaaact saaagaaatt gasgggggss sgsasaagsg gsggagsatg sggattaatt 420 sgatgcaacg sgaagaacct taccaaggct tgacatacac cggaaastts sagagatggt 480 tgssccgcaa ggtsggtgta caggtggtgc atggttgtcg tsagstsgtg tsgtgaagat 540 gttgggttaa gtsssgsaas gagsgsaass stsgtsstat gttgssagsa cgtgatggtg 600 gggastsata ggagastgcc ggggtsaact cggaggaagg tggggatgas gtsaaatsat 660 catgcccstt atgtsttggg sttsasgsat gstasaatgg ssggtasaaa gggstgsgat 720 accgcaaggt ggagsgaatc csaaaaagss ggtstcagtt cggattgggg tstgsaastc 780 gaccccatga agtcggagtc gctagtaatc gcaga 815 <210> 78 <211> 826 <212> ADN <213> Organismo Desconosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 78 tsgtaggtgg sttgtsasgt sgggtgtgaa agsttggggs ttaastssag gtstgsatts 60 atasgggst ggstagaggt aggtagggga gaacggaatt sstggtgtag sggtgaaatg 120 sgsagatats aggaggaasa ssggtggsga aggsggttst stgggsstta sctgasgstg 180 aggagcgaaa gcgtggggag sgaasaggat tagatassct ggtagtssas gstgtaaasg 240 tijLjg A?*i ,itít*L** * *j *,**c<*.Mi?- **fy-^[|- .***.-*-* *. *j *»*?**? ?** tá*bm*~- -í--J~-" ^-^l'*°*l^ ttgggsgsta ggtgtgggga ssttssasgg tttssgsgss gtagctaasg cattaagsgc 300 cscgcstggg gagtasggss gcaaggctaa aastsaaagg aattgasggg ggsssgsasa 360 agsggsggag satgttgstt aattsgacgc aasgsgaaga acsttascaa ggcttgasat 420 cgcccggaaa gcttcagaga tggagsssts ttsggactgg gtgacaggtg gtgsatggct 480 gtsgtsagst sgtgtsgtga gatgttgggt taagtcccgc aasgagsgsa asssttgttc 540 aatgttgssa gcaacatcct tsggggtggt tggggastsa ttggagactg ccggggtsaa 600 ctcggaggaa ggtggggasg asgtsaagts atcatgcccc ttatgtcttg ggctgcaaas 660 atgstacaat ggcsggtasa gagggttgsg atassgcaag gtggagagaa tssctaaaag 720 ccggtctsag ttsggattgg ggtstgsaas tcgacsccat gaagtsggag tsgstagtaa 780 tsgcagatca gcaacgctgc ggtgaatacg ttccsgggcc ttgtas 826 <210> 79 <211> 799 <212> ADN <213> Organismo Dessonocido <220> <223> Origen de la secuensia: Organismo del suelo <400> 79 cgtaggcggt ttgtsgsgts tgssgtgaaa gtssggggct caactssgga tstgsggtgg 60 gtasgggcag actagagtga tgtaggggag actggaattc ctggtgtags ggtgaaatgs 120 gcagatatsa ggaggaasac cgatggcgaa ggsaggtsts tgggsattaa stgasgstga 180 ggagcgaaag catggggagc gaacaggatt agatacsctg gtagtcsatg ssgtaaasgt 240 ÍÚ*Á <**Í?ÍX?*Í?*J*, 1 .¿s * i,?tá*;~ - "S*¿J**- ' ** < ..«..*.-*• .***«***«* tgggcactag gtgtggggga sattssacgt tttssgcgcc gtagstaasg sattaagtgs 300 sscgcstggg gagtasggss gcaaggstaa aastsaaagg aattgasggg ggcssgsasa 360 agcggcggag satgsggatt aattsgatgs aasgsgaaga assttassaa ggsttgasat 420 gaassggaaa sasstggaaa saggtgsssc gcttgsggtc ggtttacagg tggtgsatgg 480 ttgtsgtsag stcgtgtcgt gagatgttgg gttaagtccs gsaasgagsg saassstsgt 540 tstatgttgs cagsgsgtta tggsggggas tsataggaga stgssggggt saastsggag 600 gaaggtgggg asgasgtsaa atsatsatgs ccsttatgts ttgggsttsa sgsatgctac 660 aatggcsggt asaaagggtt gsgatactgt gaggtggagc taatcccaaa aagccggtct 720 cagttsggat tggggtstgs aastsgassc satgaagtcg gagtcgctag taatcgsaga 780 tsagcaacgs tgsggtgaa 799 <210> 80 <211> 1250 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuencia: Organismo del suelo <400> 80 tgcsagsttg stggtggatt agtggsgaas gggtgagtaa cacgtgagta acctgccstt 60 actctggga taagsstggg aaactgggtc taatgssgga tatgastsst satsgsatgg 120 tggggggtgg aaagsttttt gtggttttgg atggastsgs ggsstatcag cttgttggtg 180 aggtaatggc tsassaaggs gacgasgggt agccggcctg agagggtgas cggssasact 240 gggastgaga sacggscsag asttstasgg gaggsagsag tggggaatat tgsasaatgg 300 gcgaaagcst gatgsagsga cgssgsgtga gggatgasgg scttcgggLt gtaaasctct 360 ttcagtaggg aagaagsgaa agtgasggta sstgsagaag aagsgscggs taastacgtg 420 scagcagssg sggtaatasg tagggsgsaa gsgttatssg gaattattgg gsgtaaagag 480 ctcgtaggcg gtttgtcgsg tstgssgtga aagtssgggg stcaactssg gatstgsggt 540 gggtacgggc agactagagt gatgtagggg agactggaat tcstggtgta gsggtgaaat 600 gsgsagatat saggaggaas assgatggsg aaggsaggtc tctgggsatt aastgasgct 660 gaggagcgaa agsatgggga gsgaasagga ttagatassc tggtagtcoa tgssgtaaas 720 gttgggsact aggtgtgggg gacattssas gttttscgcg ssgtagctaa cgsattaagt 780 gccccgcctg gggagtasgg ssgsaaggst aaaastsaaa ggaattgasg ggggsssgca 840 caagcggsgg agcatgcgga ttaattsgat gsaasgsgag gaaccttasc aaggcttgac 900 atgaaccgga aatacctgga aacaggtgcc ccgcttgcgg tcggtttaca ggtggtgsat 960 ggttgccgts agstsgtgtc gtgagatgtt gggttaagtc ssgsaasgag sgsaasssts 1020 gttstatgtt gscagcgcgt tatggsgggg actcatagga gastgssggg gtsaactcgg 1080 ggaaggtgg ggacgacgtc aaatcatcat gsccsttatg tsttgggctt cacgcatgct 1140 acaatggcsg gtasaaaggg ttgsgatast gtgaggtgga gstaatscca aaaagccggt 1200 stsagttsgg attggggtct gcaactcgas ccsatgaagt sggagtsgst 1250 <210> 81 <211> 1210 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la secuencia: Organismo del suelo <400> 81 sgstaatass ggatasggsg cgagagtstt sggastttsg sgagaaagat tsgcaaggat 60 sastgaggga cgagcctgcg gcccatcagc tagttggtga ggtaagagst caccaaggct 120 aagacgggta gctggtstga gaggatgats agccasastg gaactgagac acggtssaga 180 stcctasggg aggsagsagt ggggaatatt gcgsaatggg sgaaagsstg asgsagssas 240 gssgcgtgag cgatgagggs sttsgggtsg taaagststg tggggagaga sgaataaggc 300 cggtgaagag tsggssttga sggtatstcc ttagcaagca ssggstaact csgtgssags 360 agccgcggta atasggaggg tgcaaacgtt gctcggaatc attgggcgta aagsgsasgt 420 aggcggcgtg ataagttggg tgtgaaagcc ctgggctsaa cssaggaagt gsattsaaaa 480 stgtcacgct tgaatctsgg agggggtcag agaattcscg gtgtagaggt gaaattsgta 540 gatatcggga ggaataccag tggcgaaggc gctggcctgg acgaagattg acgstgaggt 600 gsgaaagcgc ggggagsaaa saggattaga tassstggta gtssgsgstg taaasgatga 660 gtgstagasg ggggaggtat tgasssc tc gctgcsgaag ctaacgcgtt aagsastssg 720 sstggggagt acggtcgcaa gactaaaact caaaggaatt gacgggggcs sgsacaagcg 780 gtggagcatg tggtttaatt cgacgcaacg cgcaaaacct tasstgggtt aaatccgssg 840 gaasstggst gaaaggctgg ggtgcsstss ggggaatsgg tgagaaggtg stgsatggst 900 gtsgtcagct sgtgtsgtga gatgttgggt taagtccsgs aasgagcgsa asssctatcg 960 tcagttgcca acattaaggt gggaaststg gsgagastgs sggtstaaas sggaggaagg 1020 tggggacgac gtsaagtsst catggcsstt atgsscaggg ctasasasgt gstacaatgg 1080 ctggtasaat gagscgcaaa accgsgaggt caagctaats tcaaaaaass agtstsagtt 1140 ggatcggag tctgcaactc gactccgtga agctggaatc gstagtaats gaagatsags 1200 fff-'-f^»- **** .-- .* *.*?* **ft?ft^*. ... ?* ~***^*ÍM *L *-*¿±>** ****~ ^a..„anfc<-^ü-^^. acgctttsgg 1210 <210> 82 <211> 1272 <212 > ADN <213 > Organismo Dessonosido <220> <223> Origen de la sesuencia: Organismo del suelo <400> 82 gatgccagct tgctggtgga ttagtggcga asgggtgagt aasasgtgag taasstgccc 60 ttaactctgg gataagcstg ggaaastggg tctaatacsg gatatgasts stsatsgsat 120 ggtggggggt ggaaagsttt ttgtggtttt ggatggastc gsggcstatc agsttgttgg 180 tgaggtaatg gstsassaag gsgasgasgg gtagssggss tgagagggtg accggccaca 240 tgggastga gasasggccc agastsstas gggaggsags agtggggaat attgsasaat 300 gggsgaaags stgatgsags gasgscgcgt gagggatgas ggssttsggg ttgtaaasct 360 ctttcagtag ggaagaagcg aaagtgacgg tacstgsaga agaagsgssg gstaastacg 420 tgscagcags sgsggtaata sgtagggsgs aagsgttatc cggaattatt gggsgtaaag 480 agctcgtagg cggtttgtcg sgtctgcsgt gaaagtssgg ggstsaasts sggatstgsg 540 gtgggtacgg gcagastaga gtgatgtagg ggagastgga attsctggtg tagcggtgaa 600 atgcgcagat atsaggagga asassgatgg sgaaggsagg tststgggsa ttaastgasg 660 ctgaggaacg aaagsatggg gagsgaasag gattagatas sstggtagts satgssgtaa 720 acgttgggca ctaggtgtgg gggasattsc acgttttcsg sgscgtagst aasgsattaa 780 gtgssssgsc tggggagtac ggccgcaagg ctaaaactsa aaggaattga cgggggsssg 840 sasaagsggc ggagcatgcg gattaattsg atgcaasgsg aagaacstta ssaaggsttg 900 acatgaaccg gaaatacstg gaaasaggtg ssscgcttgc ggtcggttta saggtggtgs 960 atggttgtcg tsagstcgtg tsgtgagatg ttgggttaag tsscgcaasg agsgsaasss 1020 tsgttstatg ttgccagcgc gttatggcgg ggactcatag gagactgcsg gggtsaastc 1080 ggaggaaggt ggggacgacg tsaaatsats atgsssstta tgtsttgggc ttcacgcatg 1140 ctacaatggs sggtasaaag ggttgsgata ctgtgaggtg gagctgatss saaaaagssg 1200 gtsssagtts ggattggggt stgcaactsg assssatgaa gtsggagtsg stagtaatsg 1260 sagatsagca ac 1272 <210> 83 <211> 1247 <212> ADN <213> Organismo Desconosido <220> <223> Origen de la secuencia: Organismo del suelo <400> 83 tgtttagtag caatastaaa tgatgasgag sggsggasgg gtgaggaasa sgtaggaass 60 tgcccaagag agggggasaa scaagggaaa ct tggstaa tassgcataa tstctacgga 120 gaaaagttgc csgtaagggt ggsgsttttg gaggggsstg sgtssgatta gttagttggt 180 gaggtaatag stsaccaaga stgtgatsgg taastggtst gagaggasga ssagtsasas 240 gggactgag acasggsssa gastcctasg ggaggcagca gtggggaats ttggasaatg 300 ggggsaasss tgatssagsg atgssgsgtg ggtgaagaag gcsttcgggt tgtaaagsss 360 tttaggsggg gaagaaggat atgggatgaa taagsstgta ttttgasggt asssgsagaa 420 taagsassgg caaactstgt gssagsagss gsggtaatas agagggtgsg agsgttaatc 480 ggatttactg ggsgtaaagg gsgsgtaggs ggttgtgtga gtgtgatgtg aaagccscgg 540 gctsaasstg ggaagtgsat sgsaaasgas asaastggag tatatgagag ggtggsggaa 600 tttssggtgt agcggtgaaa tgsgtagaga tsggaaggaa sgtsgatggs gaaggcagcc 660 asstggsata atastggsgs tgaggsgsga aagsgtgggg agsgaacagg attagatacc 720 ctggtagtca sgsscgtaaa sgatgagaas tagatgttgg agggggaass sttsagtatc 780 gaagctaasg sgataagttc tcsgsstggg aagtasagtc gcaagastga aastsaaaag 840 aattgasggg ggsscgsasa agsggtggag satgtggttt aattsgatgs aasgsgaaga 900 accttacctg sssttgasat sstgcgaats ttgccgagag gtgagagtgc cgsagggags 960 gsagagasag gtgstgsatg gstgtsgtca gstsgtgttg tgagatgttg ggttaagtss 1020 cgtaacgagc gcaasscttg tcsttagttg scatcat ta gttggggast staaggagas 1080 cgcsggtgat gaassggagg aaggsgggga sgasgtsaag tcatcatggs stttatgggt 1140 agggstacac asgtgstasa atggggsgta sagagggtsg scaasscgsg agggggagss 1200 aatststtaa agsgtstsgt agtssggatt ggagtstgsa actcgac 1247 <210> 84 <211> 1292 <212> ADN <213> Organismo Desconosido <220> <223> Origen de la secuencia: Organismo del suelo <400> 84 ggstsgsaag agsaassggs gaasgggtgs gtaacacgtg aasaasstgs sstcgtgtgg 60 gggatagssg ggctaasgss sgggtaatas sgsatasgtt stctstgggg agtsstgggg 120 agaggaaags tssggsgsas ggggaggggt tsgsggscta tcagctagtt ggsggggtaa 180 tggsssacca aggsgacgas gggtagstgg tstgagagga tggssagssa sattgggact 240 gagagacggc ssagastsst asgggaggsa gcagtgggga atcttgsgsa atggssgaaa 300 ggstgasgsa gsgasgssgs gtgtgggagg acgcstttsg gggtgtaaas sactgttgcs 360 sgggasgaas agcctsttts gagaggtstg acggtaccgg gtgaggaags assggstaac 420 tcsgtgscag cagscgcggt aatacggagg gtgcgagcgt tgtccggaat cattgggcgt 480 aaagggsgcg taggtggsss ggtsagttsg tggtgaaags gsggggstsa assctgcgtc 540 ggcsatgaat astgssgsgg stggagsast gtagaggcag gcggaattcc gggtgtagsg 600 gtggaatgcg tagagatccg gaagaacacs ggtggsgaag gcggcstgct gggcagtags 660 tgasastgag gsgsgasags gtggggagsa aasaggatta gatassstgg tagtssasgc 720 cgtaaacgat gggsactagg cgcttggggg agcgasscsc cgagggcsgg sgstaacgsa 780 ttaagtgccs sgsstgggga gtasggssgs aaggstgaaa stsaaaggaa ttgasggggg 840 ccsgcacaag cggtggagsa tgtggtttaa ttcgacgcaa sgcgaagaac cttacstagg 900 cttgacatac asgggaaass ggtsagaaas ggssggscct sttsggagcc sgtgcacagg 960 tgstgsatgg stgtsgtsag ctsgtgtsgt gagatgttgg gttaagtscc gsaasgagcg 1020 caacccctgt ctstagttgs cagcgcgtca tggsggggas tstagagaga stgssggtgs 1080 saaaccggag gaaggtgggg atgasgtsaa gtsatsatgg tssttasgts tagggstasa 1140 cacgtgstas aatggsgggg asagagggtc gcgagcsggs aasggsaags saatsccgta 1200 aascccgcst sagttcggat tgtcgtctgs aastsgasgg satgaagstg gaatsgstag 1260 taa cgtgga tcagctasgs sasggtgaat as 1292 ****»*****************. -áa«* **»******.**.*** **»* <210> 85 <211> 1300 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 85 tcccttsggg agcaagtaca gsggsgaacg ggtgagtaas asgtaggtaa sstassstgg 60 agactgggat aacstgssga aaggsgggct aatacsagat aagassasga gggctgcggc 120 ssttggggsa aaaggtggss tstacttgta agctaccast csgggatggg cctgsgsgss 180 attagctagt tggcggggta asggsssacc aaggsagaga tggctagctg gtstgagagg 240 atggccagss asasagggas tgagasasgg sssagastss tasgggaggs agsagtgggg 300 aatattgcgc aatgggcgaa agcctgacgc agcgacgccg sgtgggtgat gaaggssttc 360 ggtcgtaaa gcsstgtsaa gagggasgaa assttgtsga cctaasasgt sggcaacstg 420 acggtaceto tgaaggaagc accggctaas tccgtgccag sagccgcggt aatasggagg 480 gtgsgagsgt tgttsggaat tastgggcgt aaagsgcgtg taggsggsst sttsagtstg 540 gtgtgaaags ssggggctca acsssggaag tgsattggat astgggaggs tggagtaccg 600 gagaggaggg tggaattsct ggtgtagcgg tgaaatgcgt agatatcagg aggaasacct 660 gtggcgaagg sggcsststg gasggatast gasgstgaga sgsgaaagsg tggggagsaa 720 asaggattag atassctggt agtccasgst gtaaasgatg ggsactaggt gttcggggta 780 ttgassssct gagtgssgsa gstaasgsat taagtgccsc gcstggggaa tacggcsgsa 840 aggttaaaas tsaaaggaat tgacgggggs ssgcacaags ggtggagsat gtggtttaat 900 ** ** £**. *.*. l á* * j*A b &*Jttaí?J^ **.* í* ** *i^.**.* *L****^^ *,.ti*-é<M*^ *t-- Í*¡ * * MÍ**l^^ tsgasgsaas gsgaagaass ttasctgggs tagacaacat sggacagcct sagaaatgag 960 gtstssssgs aaggggssgg tggttsaggt gstgsatggs tgtcgtsags tsgtgtsgtg 1020 agatgttggg ttaagtsssg saasgagsgs aasssstgts tstagttgct accattcagt 1080 tgagsastst agagagastg cccngtgtta aacgggagga aggtggggas gasgtsaagt 1140 sstsatggcc cttatgtcsa gggstasasa sgtgstacaa tgggcgatas aaagggstgs 1200 gaasccgcga ggggaagssa atsssaaaaa gtcgctctsa gttsggattg gagtstgsaa 1260 ctcgactssa tgaaggsgga atsgstagta atsgsggats 1300 <210> 86 <211> 1186 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuensia: Organismo del suelo <400> 86 eaatgggcag cggcggasgg gtgagtaaca cgtgggaatg tasstttsgg tgsggaasaa 60 stsagggaaa sttgagctaa tgcsgcatac gsccttasga ggaaagattt atsgscgaaa 120 gatsagsccg sgttggatta gstagttggt gaggtaatgg sssassaagg sgasgatssa 180 tagstggttt gagagaasga csagsctcas tgggactgag acacggssca gactsstasg 240 ggaggsagsa gttgggaats ttggasaatg ggggaaasss tgatccagss atgssgsgtg 300 agtgatgaag gccttsgggt tgtaaaasts tttsgasggg gasgataatg asggtaccsg 360 agaagaagc tccggstaas ttcgtgscag cagccgsggt aatasgaagg gggstagsgt 420 gttsggaat tactgggcgt aaagsgtgsg saggsggsta tssaagtsag tggtgaaagc 480 ccggagstsa actccggaat tgscattgaa astgtttags ttgagtasga gagaggtgag 540 tggaatasss agtgtagagg tgaaattsgt agatattggg tagaasassg gtggsgaagg 600 cggctcactg gstcgtaact gasgstcagg cacgacagcg tggggatsaa asaggattag 660 atascctggt agtccacgcc gtaaacgatg aacgctagsc gttggatagc ttgctattca 720 gtggsgsags taasgsatta agsgttssgs stggggagta sggssgcaag gttgagasts 780 agaggaattg asgggggssc gcacaagsgg tggagsatgt ggtttaatts gasgsaasgs 840 gsagaacctt acsagggttt gasatcctgt gctcgccggt gaaagscggt tttcssgcaa 900 gggacgcaga gasaggtgst gsatggstgt sgtsagstsg tgtsgtgaga tgttgggtta 960 agtsscgcaa sgagsgsaas sstcgccttt agttgccats attcagttgg gcactctaga 1020 gggaccgcsg gsgasaagss ggaggaaggt ggggatgasg tsaagtcsss atggssstta 1080 saccctgggs tasacacgtg stacaatggc ggtgacagtg ggsacgagct cgcgagagtc 1140 agctaatcss aaaaaassgt sssagttsag attgsastst gcaact 1186 <210> 87 <211> 1454 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 87 cgasggcsag tgaattgtaa tasgastsac tatagggcga attgggcsst stagatgsat 60 gstsgagsgg ssgssagtgt gatggatats tgsagaatts gcccttsagg cctaasasat 120 gsaagtsgag sgagaaaggg cgsttcggsg sstgagtasa gsggsgcasg ggtgsgtaas 180 acgtgggsaa tstgtssttg agatggggat aaccsagsga aagttgggst aatassgaat 240 aagastasag gaggsaasts csgtggttaa agggtgstst stgsggggag satgsgsttg 300 aggaggagss cgcggsctat cagctagttg gtagggtsac ggcstassaa ggsgaagasg 360 ggtagstggt stgagaggat gaccagcsac acggggactg agacacggcc ccgactccta 420 sgggaggsag sagtggggaa tattgggsaa tgggggaaas sstgasscag cgacgcsgcg 480 tgggtgatga aggssttsgg gtsgtaaags cctgtcgggs ggaasgaagg ttstcasggc 540 aaatagccgt gagaggtgac ggtascgccg aaggaagcac sggssaasts sgtgccagsa 600 gccgcggtaa gacggagggt gsaagsgttg ctcggaatca ctgggsgtaa agggtgsgta 660 ggsggtstsg saagtstggs gtgaaagsss aaggstsags sttggaagtg sgstcgaaac 720 tgcgaggctg gagtgccgga ggggagagtg gaattccsgg tgtagsggtg aaatgsgtag 780 agatsgggag gaatascggt ggsgaaagsg actctctgga cggcaactga sgctgaggca 840 cgaaagcgtg gggagsaaas aggattagat assstggtag tscacgcsgt aaacgatgga 900 castaggtgt sgggggtats cactccstcg gtgcsgscgs taasgsagta agtgtsssgs 960 stgggaagta sggtsgsaag attaaaasts aaaggaattg asgggggccs gcacaagcgg 1020 tggagsatgt ggttsaatts gatgsaasgs gaagaasstt asctgggttt gacatctggc 1080 gaatctstgg gaaassagag agtgcccgca ggggagcgcs aagasaggtg stgsatggst 1140 gtcgtcagct sgtgssgtga ggtgttgggt taagtsccgc aasgagsgsa asccttasss 1200 ttagttgccs ssgggtsaag scgtggsast scaagggaac tgsssgtgtt aagsgggagg 1260 aaggtgggga sgasgtsaag tsatsatggs stttatatss agggstacac asgtgstasa 1320 atggctggga canagsgtgg scaacgcgcg agcgggagct aatsgcaaaa cccsagsctc 1380 agttsggats ggagtstgsa actcgactss gtgaagstgg aatsgstagt aatsgcggat 1440 cagcatgssg sggt 1454 ^ ¡li.^ f. * . í:?^i . i . a.afe_^_ii.^..^.^^liito^.a,a,,,,i,al.aa,atJ.il^...-.-..-.»--:- »- a.aM^..^aal^^i^^^aM«¿fei^M|||-,<t.1 --ill- *?ím *lS¡*ái.i <210> 88 <211> 1307 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 88 sssttsgggg agsgagtasa gsggsgaasg ggtgagtaas acgtaggtaa cstassctgg 60 tgactgggat aacttgcsga aaggsgggct aatacsagat aagassasga gggctgcggc 120 stttggggta aaagatggcc tctgsttgsa tgstatsasg ssgggatggg cctgsgsgss 180 attagstagt tggtgaggta asggstsass aaggsagaga tggstagstg gtstgagagg 240 atggssagss asastgggac tgagacacgg sscagactcc tacgggaggc agsagtgggg 300 aatattgsgs aatgggsgaa agsstgasgs agsgasgscg cgtgggtgat gaaggscttc 360 gggtcgtaaa gcsstgtcaa gagggacgaa asstsgssga cccaatacgt cggsgasstg 420 asggtasctc tgaaggaags assggstaas tccgtgcsag sagssgcggt aatacggagg 480 gtgsaagcgt tgttcggaat castgggsgt aaagsgcgtg taggcggcst tsttagtstg 540 gtgtgaaagc csggggstsa assssggaag agsattggat astggaaggs tggagtassg 600 gagaggaggg tggaattcst ggtgtagcgg tgaaatgcgt agatatcagg aggaacacsg 660 gtggcgaagg sggssctctg gacggatact gasgstgaga cgsgasagsg tggggagsaa 720 acaggattag atacsstggt agtssasgsc gtaaacgatg ggtastaggt gttsggggta 780 ttgassssst gagtgssgsa gctaasgsat taagtassss gsstggggas tasggccgca 840 aggstaaaac tcaaaggaat tgacgggggc ccgcasaagc ggtggagcat gtggtttaat 900 fo±.A.? .1 -* ** * ?as¡ **¿u* **************.** ..**^j??^a*?*?í??a?* *...J*»* **a*****i-i****A.****.~< -^~ .*^**** * A*ÁA k. tsgasgsaas gsgaagaass ttasstgggs tagasaasac tggacagsss sagaaatggg 960 gtsttsssgs aagggastgg tggttsaggt gstgcatggc tgtsgtsags tsgtgtsgtg 1020 agatgttggg ttaagtsssg saasgagsgs aasscctgts tstagttgst assattaagt 1080 tgagsastct agagagactg sssgtgttaa asgggaggaa ggtggggasg asgtsaagts 1140 ctcatggsss ttatgtssag ggstacacas gtgstasaat ggasagtasa aagggctgcg 1200 aacccgtgag ggggagccaa tccsaaaaag ctgttctsag ttsggattgg agtctgcaas 1260 tsgastssat gaaggsggaa tsgctagtaa tsgsggatsa gsatgss 1307 <210> 89 <211> 1305 <212> ADN <213> Organismo Dessonocido <220> <223> Origen de la secuencia: Organismo del suelo <400> 89 gggagsaats sssaagtaga gsggsgaasg ggtgagtaas gsgtgggtaa tstgcctcsg 60 agtggggaas aasatsggga aastggtgst aatassgsat aasatsgttg ggtcttcgga 120 tstgasgats aaagssgggg assgsaaggs stggsgsttg gagaggagss cgsgtccgat 180 tagctagttg gtggggtaat ggsssassaa ggsttcgatc ggtagssggc ctgagagggs 240 ggasggccac astgggastg agasasggss sagastssta sgggaggcag cagtggggaa 300 tttttcgcaa tgggsgaaag sstgasgaag saasgssgsg tggaggatga gggssttcgg 360 tcgtaaact sstgtsgass gggasgaaag taggatggss taatasgscg atctattgac 420 - .- tgtascggtg gaggaagcsa sggstaacts tgtgscagca gccgsggtaa tacagaggtg 480 gsaagsgttg ttsggaatta ctgggcgtaa agggsgsgta ggcggsttgg tsagtccsgt 540 gtgaaatsss tsggstsaas tgaggaastg sasgggaaas tgsstggstt gagttsggga 600 gagggaagtg gaattssggg tgtagsggtg aaatgsgtag atatssggag gaasassggt 660 ggsgaaggsg gsttsstgga ssgasastga sgstgaggsg sgaaagstag gggagsaaas 720 gggattagat assssggtag tcctagctgt aaacgatgag tgctgggtgt agggggtats 780 aassccccct gtgccgaagc taasgcatta agcastssgs ctggggagta cggtcgcaag 840 gctgaaacts aaaggaattg asgggggscc gcacaagsgg tggagsatgt ggttcaattc 900 gasgcaacgc gaagaasstt assggggttt gaastgtasg ggasagstst agagatagag 960 tcttccttcg ggasscgtac agaggtgstg catggctgts gtsagstcgt gtsgtgagat 1020 gttgggttaa gtsccgcaas gagsgsaass sttgsstsst gttgssatsa ggtaaagstg 1080 ggsaststgg agagactgcc ggtgataaac cggaggaagg tggggatgac gtsaagtsst 1140 satggccttt atgssccggg stasasasgt gstasaatgg ssggtasaaa gggtcgsaaa 1200 assgcgaggt ggagctaats ssaaaaagsc ggtcssagtt sggattgcag tctgsaasts 1260 gastgsatga agttggaats gstagtaatc gcggatcagc atgcc 1305 <210> 90 <211> 1299 <212> ADN <213> Organismo Dessonocido <220> <223> Origen de la secuensia: Organismo del suelo ¿? s ?AL?,Ú,iL¿i **^, ****teM** á**?:'- i-.****-*. *'- -.*-m***ám..í*¡»i*i*****^. ? í*-^> ¿*5*z~'->J--<i- ***- ** *. *» ^ e*í*&^* .iáJt***, <400> 90 gggctttcgg gtcstgagta aagtggsgaa sgggtgagta asgcgtaggt aacstgacct 60 sgagtgtgga ataasstggs gaaagssggg staatascgs atgasgtstt sgggtsttsg 120 gasttgagga ccaaaggtgg sgagstttga gsgstgtsgs tsgagaaggg gsctgsgtss 180 5 sattagstag ttggtggggt gatggsstas saaggsgasg atgggtagss gggstgagag 240 gctgtccggc casastggaa ssgagasacg gtccagastc ctacgggagg sagsagtggg 300 gaatsttgcg caatggggga aassstgacg caacgasgss gcgtgggcga tgaaggsstt 360 sgggtsgtaa agssstgtcg agcgggasga accgtgsgag ctctaasata gstcgtgsst 420 gasggtascg ctagaggaag ccssggstaa stscgtgcsa gsagssgsgg taatasggag 480 10 ggggstagcg ttattcggaa ttattgggsg taaagggsgt gtaggsggst stgtgtgtcc 540 catgtgaaag ssstsggsts aassggggaa stgsatggga aactgcggag sttgagtssg 600 ggagaggtga gtggaattcc cagtgtagcg gtgaaatgcg tagatattgg gaggaacacc 660 agtggcgaag gsggstsast ggaccggtac tgasgstgag asgcgaaagc caggggagca 720 aacgggatta gatassscgg tagtsstggc tgtaaacgat gagcacttgg tgtggsgggt 780 15 atsgacccct gcsgtgstga agstaacgca ttaagtgsts sgsstgggga gtasggscgc 840 aaggstgaaa stsaaaggaa ttgasggggg sccgcasaag sggtggagsa tgtggttsaa 900 ttsgasgsaa cgcgaagaas sttasstggg tttgaastgs aggtgasags ssstgaaagg 960 gggtcttcst tsgggasass tgtagaggtg scgcatggct gtcgtcagst sgtgtsgtga 1020 gatgttgggt taagtsscgc aacgagcgsa acccstasts stagttgcca gsggctcggc 1080 20 sgggaactct agggggaccg ssggtgataa accggaggaa ggtggggatg asgtsaagts 1140 stsatggcct ttatgtccag ggctasasas gtgstasaac ggacggtasa aagggstgsg 1200 aaggsgsgag ssggagssaa tsssaaaaag scgttc csa gtgsggattg sagtstgsaa 1260 ctcgactgca tgaaggtgga atsgstagta atsgcggat 1299 <210> 91 <211> 1296 <212> ADN <213> Organismo Desconocido <220> <223> Origen de la secuencia: Organismo del suelo <400> 91 atgtctggta gsaatassag atgatggsaa gtggsggasg ggtgagtaat asgtagggat 60 stgsssagaa gagggggasa asssggggaa actcgggcta ataccgcata ctattctgag 120 gaagaaagst tggsgsaags caggcgcttt tggaggaass tacgtccgat tagstagttg 180 gtgaggtaaa ggctcacsaa ggcagagatc ggtagstggt stgagaggat gassagssas 240 actgggactg agasacggcs sagastssta sgggaggsag sagtggggaa ta tggasaa 300 tgggggsaac cctgatcsag sgatgssgcg tgtgtgaaga aggcsttsgg gttgtaaagc 360 actttagttg gggaagaagt aatgtttttt aatagagags attgttgasg gtasssaaag 420 aataagsass ggstaastct gtgccagcag ccgcggtaat asagagggtg saagsgttaa 480 tcggagttac tgggcgtaaa gggcgsgtag gcggtgttgc aagtgagatg tgaaatssst 540 gggsttaacc taggaaccgc attttagast gcaatgctag agtacagtag agggtagtgg 600 aatttssggt gtagcggtga aatgcgtaga gatsggaagg aasascagtg gsgaaggcga 660 ctacctggac tgasactgac gctgaggcgs gagagsgtgg ggagsaaasa ggattagata 720 scctggtagt ccasgstgta aasgatgaga actagatgtt ggtgcgsgsg agsgsasaag 780 tatsgaagct aasgsgataa gttstcsgss tggggagtac ggcsgsaagg ttaaaastsa 840 aaggaattga sgggggsssg sasaagsggt ggagsatgtg gtttaattsg atgsaacgsg 900 * * .-t*-A< - UU*** ~*. ttl****************** ** * &****- ,**** *. 1^tJ. ?^f*****. *^** ->** !*-****=****- ..— ***************** aggaasstta sstasscttg asatccasag aatttgatag agatatsgaa gtgssgaaag 960 gaactgtgag acaggtgstg catggstgts gtsagstsgt gttgtgagat gttgggttaa 1020 gtsssgtaas gagcgcaacc cttatcstta gttgssaasa cgtaatggtg gggactctaa 1080 ggagactgss ggtgaagaas sggaggaagg tggggasgas gtsaagtsat satggssttt 1140 atgggtaggg stasasacgt gctasaatgg ggsgtasaga gggttgssaa sstgsgaagg 1200 ggagssaatc ccggaaagcg cctsgtagts cagattgaag tctgcaasts gasttsatga 1260 agtsggaats gstagtaats gcgaatcaga asgtss 1296 <210> 92 <211> 1250 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 92 gtctggtagc aatacsagat gatggcaagt ggcggacggg tgagtaatac gtagggatct 60 gcccagaaga gggggasaac csggggaaas tcgggstaat ascgsatast attstgagga 120 aaaaagcttg gcgsaagcca ggsgsttttg gaggaassta sgtssgatta gstagttggt 180 gaggtaaagg stsascaagg cagagatsgg tagstggtst gagaggatga ccagssasas 240 tgggastgag asasggsssa gastsstasg ggaggsagsa gtggggaata ttggasaatg 300 ggggsaassc tgatssagsg atgssgsgtg tgtgaagaag gssttsgggt tgtaaagcac 360 tttagttggg gaagaagtaa tgttttttaa tagagagsat tgttgasggt asssaaagaa 420 aagsascgg staaststgt gccagsagcc gsggtaatas agagggtgsa agsgttaats 480 ggagttastg ggsgtaaagg gsgsgtaggs ggtgttgsaa gtgagatgtg aaatssstgg 540 gsttaascta ggaacsgsat tttagastgs aatgstagag tacagtagag ggtagtggaa 600 tttssggtgt agcggtgaaa tgsgtagaga tsggaaggaa sassagtggs gaaggsgact 660 acstggactg acactgacgs tgaggsgsga gagsgtgggg agcaaacagg attagatass 720 stggtagtss asgstgtaaa sgatgagaas tagatgttgg tgsgsgsgag sgcacaagta 780 tsgaagstaa sgsgataagt tstssgsstg gggagtasgg ssgsaaggtt aaaastsaaa 840 ggaattgasg ggggccsgsa saagsggtgg agcatgtggt ttaattcgat gsaasgsgaa 900 gaaccttacc taccsttgas atccasagaa tttgatagag atatcgaagt gcsgaaagga 960 actgtgagac aggtgstgsa tggctgtcgt cagstsgtgt tgtgagatgt tgggttaagt 1020 sssgtaasgg gsgcaacsst tatssttagt tgssaasasg taatggtggg gaststaagg 1080 agactgccgg tgaagaaccg gaggaaggtg gggasgasgt caagtcatsa tggcstttat 1140 gggtagggst asasasgtgs tacaatgggg cgtasagagg gttgssaass tgsgaagggg 1200 agssaatscc ggaaagcgss tsgtagtssa gattgaagts tgsaastsga 1250 <210> 93 <211> 1545 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 93 ssaggaaaca gstatgassa tgattasgsc aagsttggta ssgagstsgg atccactagt 60 aasggssgss agtgtgstgg aattcgcsst tcaggcstaa sasatgsaag tsgaasggsa 120 gsasagggga gcttgctsss tgggtggsga gtggcggacg ggtgaggaat asatsggaat 180 stgcssagts gtgggggata asstsgggaa assgggacta atacsgcata cgacsttagg 240 gtgaaagsgg aggascgsaa ggsttsgsgs gattggatga gssgatgtsg gattagsttg 300 ttggsggggt aasggscsas saaggsgasg atssgtagst ggtstgagag gatgatsags 360 sacactggaa stgagacacg gtccagactc ctacgggagg cagsagtggg gaatattgga 420 saatgggsgs aagsctgatc sagscatgcc gcgtgagtga agaaggcctt sgggttgtaa 480 agststtttg tscggaaaga aaagctttsg gttaatasss ggaagtsctg acggtassgg 540 aagaataags assggstaas ttsgtgccag cagccgcggt aatasgaagg gtgsaagsgt 600 tactcggaat tastgggsgt aaagsgtgsg taggtggttt gttaagtctg atgtgaaagc 660 cctgggstsa asstgggaat tgsastggat astggsaggc tagagtgcgg tagaggatgg 720 cggaattcss ggtgtagsag tgaaatgsgt agagatsggg aggaasatst gtggcgaagg 780 cggccatctg gacsagsast gasastgagg cacgaaagcg tggggagsaa asaggattag 840 atassctggt agtcsasgss ctaaacgatg sgaastggat gttgggagca actaggctct 900 cagtatcgaa gstaasgsgt taagttsgsc gcctggggag tasggtcgca agastgaaac 960 tsaaaggaat tgasgggggs ssgsasaags ggtggagtat gtggtttaat tsgatgsaas 1020 gcgaagaacc ttacstggss ttgasatssa cggaacttas sagagatggt ttggtgsstt 1080 cggnaacsgt gagasaggtg stgsatggst gtsgtsagst sgtgtsgtga gatgttgggt 1140 taagtsccgs aacgagcgca asssttgtsc ttagttgcca gcacgtaatg gtgggaastc 1200 taaggagact gssggtgasa aascggagga aggtggggat gasgtsaagt catsatggsc 1260 cttacggcca gggstasasa cgtactacaa tggtsggtas agagggttgs aaagssgsga 1320 ggtagagcca atsssagaaa assgatccsa gtssggatsg aagtstgsaa ctcgacttsg 1380 ÍkiA^A?,.^¡a..*^^^^^Ía^Jkg»^ ^al*fa.a...^.a.a^,,...a..at--,»,i. ******* * *,******* **** **** - - -*^*- - «*^~A--* 'i ?- Í - tgaagtcgga atcgctagta atsgsggats agaatgscgs ggtgaatacg ttcccgggcc 1440 ttgtacacas sgsssaaggg cgaattctgc agatatcsat sacactggsg gscgctcgag 1500 atgsatsta gagggsssaa ttsgscctat agtgagtsgt attas 1545 <210> 94 <211> 1549 <212> ADN <213> Organismo dessonocido <220> <223> Origen de la secuencia: Organismo del suelo <400> 94 ttttaaaccg acggccagtg aattgtaata cgactcacta tagggsgaat tgggscctct 60 agatgsatgs tcgagsggss gssagtgtga tggatatstg sagaattcgc ssttcaggcs 120 taasasatgs aagtsgagsg gsagsgsggg gcaacstggc ggcgagcggs ggasgggtga 180 ggaatgcatc ggaatstass ctgtcgtggg ggataacgta gggaaastta sgstaatass 240 gcatacgacs gagaggtgaa agtgggggas sgsaaggsst cacgsgatag gatgagssga 300 tgccggatta gctagttggt gaggtaaagg ctsassaagg sgasgatccg tagstggtst 360 gagaggatga tsagssasat tgggastgag acacggccsa aastsstasg ggaggsagsa 420 gtggggaata ttggasaatg ggsgsaagss tgatssagss atgssgsgtg tgtgaagaag 480 gscttcgggt tgtaaagcac ttttgttsgg gaagaaatsg tgsgggttaa tasscagtac 540 ggatgacggt assgaaagaa taagsaccgg staasttsgt gssagsagss gsggtaatas 600 gaagggtgca agcgttasts ggaatsactg ggcgtaaagc gtgcgtaggc ggttggttaa 660 gtctgstgtg aaagscstgg gstsaacctg ggaastgcag tggatastgg ccagstagag 720 tgtgatagag gatggtggaa ttcccggtgt agcggtgaaa tgsgtagaga tcgggaggaa 780 cassagtggs gaaggcggss atstggatsa asastgasgs tgaggsasga aagsgtgggg 840 agsaaasagg attagatass stggtagtss asgccstaaa sgatgsgaas tggasgttgg 900 gagsaasttg gststcagtg tsgaagstaa sgsgstaagt tsgssgcstg gggagtasgg 960 tsgsaagast gaaactcaaa ggaattgasg ggggsscgca caagcggtgg agtatgtggt 1020 ttaattsgat gsaasgsgaa gaascttacs tggssttgas atscacggaa sttassagag 1080 atggtttggt gssttsggaa ssgtgagasa ggtgstgsat ggstgtcgtc agstsgtgts 1140 gtgagatgtt gggttaagts ccgcaasgag cgcaassstt gtssttagtt gccagsasgt 1200 aatggtggga aststaagga gastgssggt gasaaassgg aggaaggtgg ggatgasgts 1260 aagtcatcat ggcssttasg gssagggsta sacacgtact asaatggtsg gtasaagagg 1320 gttgcaaagc csgcgaggta gagcsaatsc cagaaaaccc gatcscagtc csggatsgaa 1380 gtstgcaact cgacttsgtg aagtcggaat sgstagtaat sgsggatsag aatgssgcgg 1440 tgaatacgtt sssgggsstt gtasasassg sssaagggsg aattssagsa sastggsggs 1500 cgttactagt ggatssgags tsggtascaa gcttggsgta atsatggts 1549 <210> 95 <211> 1276 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo ,l ?? é, t?*?* ****i tk. * i**t******?«l*x.*^A =*** ******************* * * .*** *-*-.-*•**.****>***••" **' *s*****t*****?**-. * * !*** ^?á*? .tal., <400> 95 stggsggsga gcggsggasg ggtgaggaat asatcggaat stasssagts gtgggggata 60 cgtagggaa acttasgs a atassgsata sgacctgagg gtgaaagcag gggatcgsaa 120 gassttgsgc gattggatga gcsgatgtss gattagstag ttggtgaggt aaaggstcac 180 saaggsgasg atsggtagst ggtstgagag ggtgatsags sasastggaa stgagasasg 240 gtssagastc ctacgggagg cagcagtggg gaatattgga caatgggcgc aagcstgatc 300 cagccatgcc gsgtgtgtga agaaggsstt sgggttgtaa agcacttttg ttcgggaaga 360 aatcttccga gttaatasst sgggaggatg asggtassgg aagaataags assggstaas 420 ttsgtgssag sagssgsggt aatasgaagg gtgcaagsgt tastsggaat tastgggsgt 480 aaagsgtgsg taggtggtts gttaagstg scgtgaaagc cccgggstsa asstgggaat 540 tgcggtggat astggsggas tagagtgsgg tagagggtgg tggaattccc ggtgtagcag 600 tgaaatgcgt agagatcggg aggaacatct gtggcgaagc ggssasstgg assagcactg 660 acactgaggc acgaaagsgt ggggagcaaa caggattaga tassctggta gtccacgccs 720 taaasgatgs gaastggasg ttgggagcaa ctaggststc agtgtcgaag staacgcgtt 780 aagttsgssg sstggggagt asggtsgsaa gactgaaact caaaggaatt gacgggggcc 840 sgsasaagsg gtggagtgtg tggtttaatt sgatgcaacg cgaagaacct tacctggsst 900 tgasatscac ggaatssttt agagatagag gagtgscttc gggaaccgtg agasaggtgc 960 tgcatggstg tsgtsagsts gtgtsgtgag atgttgggtt aagtsssgsa asgagsgsaa 1020 sscttgtcct tagttgssag sgsgtaatgg sgggaactct aaggagastg ssggtgasaa 1080 assggaggaa ggtggggatg asgtsaagts atsatggccs ttacggccag ggctacacac 1140 gtactacaat ggtggggaca gagggtcgcg aagccgcgag gtggagccaa tcccagaaac 1200 cccatcctag tssggatsgg agtstgsaas tcgactssgt gaagtsggaa tsgstagtaa 1260 tsgsggtsag satgss 1276 <210> 96 <211> 1306 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia : Organismo del suelo <400> 96 sagggatsag tagagtggsa aasgggtgag taasgcgtgg gsgasstass ttsgagtggg 60 ggataasstt scgaaaggag ggctaatacs gsatgasatc csgtgtttgg atasasggas 120 atsaaagssg gggatsgsaa gasctggcgc ttggagaggg gsscgsgtss gattagstag 180 ttggtgaggt sacggctsas saaggstssg atsggtatsc ggcstgagag ggsggasgga 240 sacactggga stgagacacg gsssagasts ctacgggagg sagsagtggg gaattgttcg 300 caatgggcgc aagsstgasg asgsaacgcc gsgtggagga tgaagasstt cgggtcgtaa 360 astsstttcg assgagatga agasccgccg gsstaatasg ssggsggatt gasagtatcg 420 agggaagaag csssggstaa stssgtgssa gsagssgcgg taatasgggg ggggsaagcg 480 ttgttsggaa ttastgggsg taaagggtts gtaggtggst sgstaagtsa gasgtgaaat 540 scctsagsts aastggggaa stgsgtstga gastggsaag sttgagtgsa ggagaggaas 600 gcggaattcs aggtgtagsg gtgaaatgsg tagatatstg gaggaasass ggtggsgaag 660 gcggcgttst ggactgcaas tgasastgag gaasgaaags taggggagsa aasgggatta 720 gataccscgg tagtcstags cctaaasgat gaatgsttgg tgtggcgggt atsgatssst 780 gssgtgssgs agttaasgsg ataagsatts cgcstgggga gtasggtcgs aaggstgaaa 840 stsaaaggaa ttgacggggg ccsgsasaag sggtggagsa tgtggttsaa ttsgasgsaa 900 sgcgaagaac sttasstagg ctsgaagtgs agatgassat sggtgaaags sgastttsgs 960 aagaasatst gtagaggtgs tgsatggstg tsgtsagsts gtgtsgtgag atgttgggtt 1020 aagtsssgsa asgagsgsaa sssttgttts stgttgssat caggttaags tgggsastst 1080 gagagastg ssggtgasaa accggaggaa ggtggggatg asgtsaagts agsatggsst 1140 ttatgtstag ggstasasas gtgstasaat ggssggtasa aagsgstgsa aasssgsgag 1200 ggtgagssaa tsgcagaaag csggtstcag ttcggatags aggstgsaas tsgsstgstt 1260 gaagttggaa tsgstagtaa tcgcggatca gcatgscgsg gtgaat 1306 <210> 97 <211> 1300 <212> ADN <213> Organismo dessonosido <220> <223> Origen de la sesuencia: Organismo del suelo <400> 97 ccsgcagggt gagtagatgg caaasgggtg agtaasasgt gggtgasstg sstsagagtg 60 ggggataasg accsgaaagg gtcgctaata ccgcataasa tsstgtsttt ggatagasgg 120 gatsaaags sggggatsgs aagasstggs gsttagagag gggsssgsgg ssgattagst 180 gttggtgag gtaacggctc acsaaggcaa cgatcggtat scggcstgag agggsggasg 240 gasacactgg gastgagasa sggcccagac tcctacggga ggsagsagtg gggaattgtt 300 sgcaatgggc gsaagsstga sgacgsaacg ssgsgtggag gatgaagats ttsgggtsgt 360 aaastccttt sgatsgggaa gaacgcstct ggtgtgaaca csatsagagg gtgasggtas 420 " '¡fe'*** #> ..?A**** ***^^*^*-.-*. *^ ** *** **-. *^^ - * **? *l* **m* -""-*-**-*- *> < * ** - ** ?.?, Í ? sgagagaaga agssscggst aaststgtgs sagsagscgc ggtaatacag ggggggsaag 480 sgttgttsgg aattastggg sgtaaagggs tsgtaggsgg ssggstaagt scgacgtgaa 540 atccccaggs ttaacctggg aactgsgtsg gatastggsg ggsttgaatc cgggagaggg 600 atgsggaatt ccaggtgtag cggtgaaatg cgtagatatc tggaggaasa ssggtggsga 660 aggsggcatc stggassggt attgasgctg aatagcgaaa gssaggggag caaacgggat 720 tagatassss ggtagtcctg gscctaaacg atgaatgttt ggtgtggsgg gtatsgatcc 780 ctgccgtgcc gaagctaacg sattaaacat tccgsstggg gagtasggtc gcaaggstga 840 aastsaaagg aattgacggg ggcssgsasa agsggtggag satgtggtts aattsgacgs 900 aasgsgaaga assttascca ggstcgaacg gsattggasa tscggcgaaa gssggctcss 960 gcaagggcsg atgtsgaggt gstgsatggs tgtsgtsags tsgtgtsgtg agatgttggg 1020 ttaagtsssg saasgagsgs aasssttgts sgctgttgcc atsasgttat ggtgggsast 1080 ctgcggagas tgcsggtgat aaascggagg aaggtgggga tgacgtcaag tcagcatggc 1140 ctttatgtct ggggstasac acgtgctaca atggscggta caaaccgttg cgatctcgca 1200 agagtgagst aatsggagaa agccggtctc agttcggatt gcaggstgsa astsgcctgc 1260 atgaagttgg aatcgctagt aatsgsggat sagsasgccg 1300 <210> 98 <211> 1233 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo ** &****. **. í<***. * ., * * ***! *** ***,.. ** l.a.a.a^^Ja^a¡^&^^.,^faJ^jAdat^iaaU^MEat.AiÉ.á.a <400> 98 acggagsggc agasgggaga gtaasacgtg ggaacgtgss ctttggttcg gaasaasasa 60 gggaaasttg tgstaatass ggataagsss ttacggggaa agatttatsg scaaaggatc 120 gscsgsgts tgattagsta gttggtgagg taasc^ctca ccaaggcgac gatsagtags 180 tggtstgaga ggatgatcag cctsastggg astgagasac ggccsagast sstasgggag 240 gsagsagtgg ggaatattgg asaatgggsg saagsstgat ccagccatgs sgcgtggatg 300 atgaaggccc tagggttgta aagtssttts ggoggggaag ataatgasgg tasscgsaga 360 agaagssssg gctaacttsg tgssagcagc cgcggtaata cgaagggggc tagcgttgct 420 cggaatcast gggcngtaaa gsgcacgtag gcggcttttt aagtsagggg tgaaatsstg 480 gagstsaast ccagaastgs ctttgatact gagaagcttg agtcsgggag aggtgagtgg 540 aactgcgagt gtagaggtga aattsgtaga tattsgsaag aasassagtg gsgaaggsgg 600 ctcactggsc cggtactgac gstgaggtgc gaaagcgtgg ggagsaaasa ggattagata 660 scctggtagt csasgctgta aasgatggat gctagcsgtt gtsgggttta stcgtcagtg 720 gcgcagctaa sgsattaags atccsgcctg gggagtasgg tsgsaagatt aaaastsaaa 780 ggaattgacg ggggcssgsa caagcggtgg agsatgtggt tsaattcgaa gcaacgcgca 840 gaassttasc agcssttgas atgtsccgta tgagtassag agatggaact cttsagttsg 900 gstggsggga asasaggtgc tgcatggstg tcgtcagsts gtgtsgtgag atgttgggtt 960 aagtccsgsa asgagsgsaa scctsgssst tagttgssat satttagttg ggsaststaa 1020 ggggactgcc ggtgataagc sgsgaggaag gtggggatga cgtcaagtcc tcatggcsst 1080 tasgggstgg gstasasacg tgstacaatg gsggtgacag tgggatgsag aggggtaass 1140 sgagsaaat ctcaaaaags sgtstsagtt sggattgtgs tstgsaasts gagsasatga 1200 agtggaats gstagtaats gsagatcagc acg 1223 I ??.l* ?. *,kÍ* k*M**t-**-^ ** í*?*,. * ^...i?JÉ í.**-,*^.* <210> 99 <211> 1304 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 99 sgaaatsccg sagggatsag tagagtggsa aacgggtgag taacacgtgg gtgasstgcc 60 ttcgagtggg ggataacgtc ccgaaaggga cgctaatacc gsatgasats stgststtga 120 acgagtggag atcaaagstg gggatsgsaa gasstagsgc tcaaagaggg gsscgcgcst 180 gattagctag ttggtggggt aacggstsas caaggcgacg atsagtatss ggsstgagag 240 ggsggasgga sasastggga stgagasasg gsssagasts stasgggagg sagsagtggg 300 gaattgttsg saatgggsgs aagsstgasg asgsaasgss gsgtggagga tgaagatstt 360 cgggtcgtaa actcstttsg atsgagasga asggsstssg ggtgaacaat ccggaggagt 420 gacggtaccg agagaagaag csccggstaa ctcsgtgssa gsagssgsgg taatasgggg 480 ggggsaagcg ttgttcggaa ttactgggsg taaagggsts gtaggsggss aastaagtsa 540 gacgtgaaat ssstcggctt aassggggaa ctgcgtctga tastggatgg stagaggttg 600 ggagagggat gsggaattss aggtgtagsg gtgaaatgsg tagatatstg gaggaasacc 660 ggtggcgaag gcggcatsst ggassaatts tgasgstgag gagsgaaagc caggggagsa 720 aasgggatta gatassccgg tagtsstggs sctaaacgat gaatgcttgg tgtggsgggt 780 atcgatccct gcsgtgssga agctaacgca ttaagsatts cgcstgggga gtacggtsgs 840 aaggstgaaa stsaaaggaa ttgacggggg cccgcasaag sggtggagsa tgtggttsaa 900 ttcgacgsaa sgsgaagaas sttaccsagg sttgaasags gagtgascas tsstgaaaag 960 gagsttssgs aaggasasts gtagaggtgs tgcatggctg tcgtsagctc gtgtcgtgag 1020 atgttgggtt aagtsccgsa asgagsgsaa sssttgtttg stgttgscat cacgttatgg 1080 tgggcactct gcaaagactg ssggtgataa ascggaggaa ggtggggatg asgtsaagtc 1140 agcatggsct ttatgtctgg ggstasasas gtgstasaat ggssggtasa aassgtcgca 1200 aaccgtaag gtcgagctaa tcggagaaag ccggtctsag ttsggatsgt sggstgsaac 1260 tcgccggcgt gaagttggaa tsgctagtaa tcgcggatca gcac 1304 <210> 100 <211> 1197 <212> ADN <213> Organismo Dessonosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 100 tctagtggcg sacgggtgsg taacgsgtgg gaatctgccc ttgggttsgg gataacagtt 60 ggaaacgact gstaatascg gatgatgtct tsggacsaaa gatttatsgs scagggatga 120 gcccgcgtcg gattagctag ttggtgaggt aaaggctsas saaggsgasg atscgtagst 180 ggtctgagag gatgatcags sasactggga ctgagacacg gcccagactc ctacgggagg 240 agsagtggg gaatattgga caatgggcga aagsctgatc sagsaatgss gsgtgagtga 300 sgaaggcstt agggttgtaa agststtttg sssgggatga taatgasagt assgggagaa 360 taagssccgg staastssgt gssagsagss gcggtaatac ggagggggst agsgttgtts 420 ??,á** .k£$tti¡t--'- *»*¿**¿ *.~**?* ***s¡ f -— *- * **.* *,?* í .. —.ti i*. ** .*** ..*. ****** ** .**. **..-**.*** £ .£.* . ggaattastg ggsgtaaags gsasgtaggc ggctttgtaa gttagaggtg aaagcssgga 480 gstsaastss ggaastgcct ttaagactgs atcgcttgaa cgtsggagag gtaagtggaa 540 ttcsgagtgt agaggtgaaa ttsgtagata ttcggaagaa cascagtggc gaaggcgact 600 tastggacga ctgttgacgc tgaggtgsga aagcgtgggg agcaaasagg attagatacc 660 ctggtagtcs asgssgtaaa sgatgatgas tagstgtsgg ggstsatgga gtttsggtgg 720 cgcagstaas gsgttaagts atssgsctgg ggagtacggc cgsaaggtta aaastsaaag 780 aaattgasgg gggsctgcas aagsggtgga gsatgtggtt taattsgaag saasgsgsag 840 aassttassa gsgtttgasa tggtaggasg gtttssagag atggattsst tsscttacgg 900 gacctasasa caggtgctgs atggstgtsg tsagctcgtg tsgtgagatg ttgggttaag 960 tsscgcaacg agcgcaasss tsgtstttag ttgstassat ttagttgggs actctaaaga 1020 aastgssggt gataagccgg aggaaggtgg ggatgasgts aagtcctcat ggsssttasg 1080 cgctgggsta cacacgtgst acaatggsgg tgasagtggg cagcaaactc gcgagagtga 1140 gcaaatcccs aaaaaccgtc tsagttsgga ttgttststg saastsgaga gsatgaa 1197 <210> 101 <211> 1352 <212> ADN <213> Organismo Dessonocido <220> <223> Origen de la secuensia: Organismo del suelo <400> 101 cgacggccag tgaattgtaa tacgactcas tatagggcga attgggcsst stagatgcat 60 gstsgagsgg ssgssagtgt gatggatats tgsagaattc gccsttcagg cstaasasat 120 gsaagtsgsa sgagaaaggg sttsggsccc ggtacagtgg sgcacgggtg agtaasasgt 180 aggcaatctc csstcgagtg gtggataacc ttssgaaagg agggstaata sagsatgaga 240 ccacgagctc gcagagsttg tggssaaags ggasststts ttgaaagtts gsgsttgagg 300 atgagcctgc ggcscatcag ctagttggta gggtaatggs stassaaggs taagasgggt 360 gstggtstg agaggacgga sagscacact ggaactgaga cacggtccag actcctacgg 420 gaggsagsag tggggaatst tgsgsaatgg asgaaagtst gacgsagsga sgssgcgtga 480 gcgatgaagg scttcgggtt gtaaagstct gtggggagag acgaataagg tgcagctaat 540 asctgcatsg atgacggtat ctssttagsa agsaccggst aactctgtgs sagcagssgc 600 ggtaagacag agggtgsaaa sgttgttcgg aattastggg sgtaaagsgs gtgtaggsgg 660 ctgtgtaagt cgggcgtgaa atsssatggc tcaaccatgg aagtgsasss gaaastgsgt 720 agctagagtc ctggagagga aggtggaatg sttggtgtag aggtgaaatt sgtagatats 780 aagcggaaca ssggtggsga agsggscttc tggacagtga ctgacgctga gacgcgaaag 840 cgtggggags aaasaggatt agatascctg gtagtssasg ssgtaaasga tgaatgctag 900 acgctggggt gsatgsastt sggtgtcgcc gctaacgcat taagcattcs gsstggggag 960 tasggssgsa aggttaaaas tsaaaggaat tgacgggggc ccgsasaags ggtggagsat 1020 gtggtttaat tsgaagsaas gsgcaaasct taccaaccst tgacatgtss attgscggtc 1080 cgagagattg gacsttsagt tsggstggat ggaacacagg tgstgsatgg ctgtcgtsag 1140 ctsgtgtcgt gagatgttgg gttaagtccs gsaasgagcg caasssstas sgscagtgc 1200 catcattcag ttgggcasts tggtggaast gccggtgaca agccggagga agcggggatg 1260 acgtcaagtc ctsatggsss ttatgggttg ggctacasas gtgstasaat ggsggtgasa 1320 gtgggasgsg aagtssaaga tggasaaats sc 1352 **iJ***.***t**?**?*ii¡*.*,-i*^--*^'i^***^**?* <210> 102 <211> 1361 <212 > ADN <213 > Organismo Dessonocido <220> <223> Origen de la secuencia: Organismo del suelo <400> 102 aacagstatg assatgatta sgscaagctt ggtassgags tsggatssas tagtaasggs 60 sgssagtgtg stggaattsg sssttsaggs ctaacasatg saagtsgaas ggatssttsg 120 ggattagtgg cggacgggtg agtaacasgt gggaacgtgc cstttggtts ggaacaacts 180 agggaaastt gagctaatac sggataagsc tttcgaggga aagatttats gssattggag 240 cggcccgcgt aggattagst agttggtgag gtaaaagctc accaaggsga sgatccttag 300 stggtstgag aggatgatsa gssacattgg gactgagasa cggcscaaac tcctacggga 360 ggcagcagtg gggaatcttg sgsaatgggc gcaagsctga tcsagssatg ssgcgtgagt 420 gatgaaggcc ttagggttgt aaagctcttt caccggagaa gataatgasg gtatccggag 480 aagaagsssc ggctaastts gtgssagsag ssgsggtaat asgaaggggg stagcgttgt 540 tcggaattac tgggsgtaaa gsgsasgtag gcggatattt aagtcagggg tgaaatcssa 600 gagctcaast stggaastgs stttgatast gggtatsttg agtatggaag aggtaagtgg 660 aattssgagt gtagaggtga aattsgtaga tattcggagg aacaccagtg gsgaaggsgg 720 cttactggtc cattastgac gctgaggtgc gaaagcgtgg ggagcaaaca ggattagata 780 scctggtagt ssasgssgta aasgatgaat gttagscgtc gggsagtata stgttsggtg 840 gsgcagctaa cgcattaaac attcsgsstg gggagtasgg tsgsaagatt aaaastsaaa 900 ggaattgacg ggggsssgsa saagsggtgg agsatgtggt ttaattsgaa gsaasgcgca 960 gaacsttass agststtgas attsggggtt tgggsagtgg agasattgts sttsagttag 1020 gstggsscca gaacaggtgs tgsatggstg tsgtsagsts gtgtsgtgag atgttgggtt 1080 aagtsssgca asgagsgsaa ccstcgssst tagttgccag satttagttg ggsaststaa 1140 ggggastgss ggtgataags cgagaggaag gtggggatga cgtcaagtcc tcatggscct 1200 tasgggstgg gstacacacg tgstacaatg gtggtgacag tgggsagsga gasagsgatg 1260 tsgagstaat ctcsaaaags satstsagtt cggattgcat ctgcaastcg agtgsatgaa 1320 ttggaatsg stagtaatcg sagatcagca tgctgsggtg a 1361 <210> 103 <211> 1300 <212> ADN <213> Organismo dessonocido <220> <223> Origen de la secuensia: Organismo del suelo <400> 103 catgtttagt agcaatasta aatgatgasg agcggcggac gggtgaggaa sasgtaggaa 60 sctgcssaag agagggggas aaccaaggga aastttggst aatassgsat aatstctacg 120 gagaaaagtt gcccgtaagg gtggsgsttt tggaggggss tgsgtssgat tagttagttg 180 gtgaggtaat agctcassaa gastgtgatc ggtaactggt stgagaggas gacsagtsas 240 actgggastg agasasggss sagastssta sgggaggsag sagtggggaa tsttggasaa 300 tgggggcaac sstgatssag sgatgccgcg tgggtgaaga aggssttsgg gttgtaaags 360 stttaggcg gggaagaagg atatgggatg aataagcstg tattttgasg gtasssgcag 420 aataagcass ggsaaastst gtgscagcag ccgsggtaat asagagggtg sgagsgttaa 480 tsggatttas tgggsgtaaa gggcgsgtag gsggttgtgt gagtgtgatg tgaaagccss 540 gggstcaacs tgggaagtgs atsgcaaacg acasaastgg agtatatgag agggtggcgg 600 aatttcsggt gtagsggtga aatgsgtaga gatcggaagg aacgtcgatg gsgaaggsag 660 ssasstggsa taatastgac gctgaggcgc gaaagsgtgg ggagsgaasa ggattagata 720 scctggtagt scacgcsgta aasgatgaga astagatgtt ggagggggaa sssttcagta 780 tcgaagctaa sgcgataagt tctccgsstg ggaagtasag tcgsaagast gaaactcaaa 840 agaattgasg ggggsscgca saagsggtgg agsatgtggt ttaattsgat gsaasgsgaa 900 gaassttacc tacccttgac atcctgcgaa tcttgcsgag aggtgagagt gscgcaagga 960 gcgcagagac aggtgctgsa tggstgtsgt cagctsgtgt tgtgagatgt tgggttaagt 1020 cccgtaacga gcgcaassct tgtcsttagt tgccatcatt tagttgggga ststaaggag 1080 assgssggtg atgaassgga ggaaggsggg gasgasgtsa agtsatsatg gcctttatgg 1140 gtagggctac acacgtgc a saatggggcg tacagagggt sgssaasssg cgagggggag 1200 csaatststt aaagsgtctc gtagtssgga ttggagtstg saastsgact csatgaagts 1260 ggaatsgsta gtaatsgsgg atcagcagtg ssgcggtgaa 1300 <210> 104 <211> 1250 <212> ADN <213> Organismo desconosido <220> <223> Origen de la sesuensia: Organismo del suelo <400> 104 tgtagsaata satsagtggs agasgggtga gtaasasgtg ggaascttcs tcgttgtasg 60 ggacaactca gggaaacttg agstaatasc gtatacgtcc gagaggagaa agattta cg 120 saatgagasg ggsssgsgts ggattagsta gttggtaagg taasggstta ssaaggsgas 180 gatccgtags tgatstgaga ggatgatcag csasastggg actgagacas ggsssagact 240 cstasgggag gsagsagtgg ggaatsttgg asaatgggsg saagsstgat ssagscatgc 300 gcgtgagtg aagaaggcst tagggttgta aagststttt gssagggacg ataatgasgg 360 tacctgagaa taagccccgg caaacttcgt gccagcagss gcggtaatac gaagggggct 420 agsgtgtts ggatttastg ggsgtaaags gsasgtaggs gggtsgttaa gtsaggggtg 480 aaatsscgga gctcaastsc ggaactgcct ttgatactgg sgassttgag gstggaagag 540 gttagtggaa ttsssagtgt agaggtgaaa ttsgtagata ttgggaagaa sassagtggs 600 gaaggcggct aastggtcca ga ctgacgc tgaggtgsga aagsgtgggg agsaaasagg 660 attagatacc stggtagtss acgcsgtaaa statgggtgs tagctgtcag cgggcttgct 720 cgttggtggc gsagstaasg sattaagsas sssgsstggg gagtasggts gsaagattaa 780 aasttaaagg aattgasggg ggcccgsaca agcggtggag catgtggttt aattsgaags 840 aacgcgcaga ascttacsaa sssttgasat sscgatcgcg gacassagag atggagtsst 900 tsagttsggs tggatsggag asaggtgstg satggstgts gtcagctcgt gtcgtgagat 960 gttgggttaa gtccsgsaas gagsgsaacc stsgssttta gttgssatsa tttagttggg 1020 sactctaaag ggastgssgg tgataagssg gaggaaggtg gggatgasgt saagtsstsa 1080 tggsssttas gggttgggst asacacgtgs tasaatggsg gtgasaatgg gsagstactt 1140 cgcaaggaga agctaatsss aaaaagssgt stsagttsag attgsastst gsaastsggg 1200 tgcatgaagt tggaatcgct agtaatsgct aatcagcagg tagcggtgaa 1250 <210> 105 <211> 1302 <212> ADN <213> Organismo Desconosido <220> <223> Origen de la secuencia: Organismo del suelo <400> 105 ggcttsggst ccccggtaga gtggsggasg ggtgagtaas asgtgggtaa tstgsstttg 60 ggtggggaat aasssttsga aagaggggst aatascgsat aasgsagsgg sassgaatgg 120 tgasagttgt taaagtgggg gatsgsaaga cctcacgsst gaagaggags ssgsgsssga 180 ttagctagtt ggtgcggtaa tggcgtassa aggsggcgat cggtagcsgg sctgagaggg 240 cggacggcsa castggcact gagagacggg csagactcct acgggaggca gsagtgggga 300 attttgggsa atgggsgsaa gsstgasssa gsaasgssgs gtgaaggasg aaatccstst 360 gggatgtaaa sttsgaaagt tggggaagaa atssgtgtga ggataatgsa sacgggatga 420 cggtacccaa cgtaagccss ggstaastas gtgscagcag csgsggtaat asgtaggggg 480 saagcgttgt tcggaattac tgggsgtaaa gggsgsgtag gsggtasgas aagtctggag 540 tgaaagcssg gggstsaass scggaatgts tttggaaast gtsgaasttg agtgsggaag 600 aggcatctgg aattsssagt gtagsggtga aatgsgtaga tattgggaag aasasstgag 660 gsgaaggcgg gatgctgggc sgasastgas gstgaggsgs gaaagssagg ggagsgaacg 720 ggattagata csssggtagt sstggsssta aasgatggat asttggtgtg tggggttsts 780 gaagtccssg sgtgssggag staasgsggt aagtatsssg sstggggagt asggtsgsaa 840 ggstgaaast saaaggaatt gasggggass sgsasaagsg gtggagsatg tggttsaatt 900 sgasgcaacg cgaagaacst tacctgggtt aaatsctasc tcgtsgsstc agagatgagg 960 tttcccttsg ggggaggtag gasggtgctg catggstgts gtcagstcgt gscgtgaggt 1020 gttgggttaa gtsssgsaas gagsgsaass sttassacta gttgccagcg gttsggccgg 1080 gsactctatt gggastgssg gtgasaaass ggaggaaggt ggggatgasg tsaagtsatc 1140 atggcsttta tgtssagggs tasasasgtg stacaatggc sggaasaaag sgsagsaaac 1200 ssgcgagggg gagcsaatsg saaaaatssg gtstcagttc ggattggagt stgsaastsg 1260 actccatgaa gttggaatsg stagtaatsg sggatsagsa tg 1302 <210> 106 <211> 1281 <212> ADN <213> Organismo dessonocido <220> <223> Origen de la secuencia: Organismo del suelo <400> 106 tgcttststt gagagsggsg gasgggtgag taatgsstag gaatstgsct ggtagtgggg 60 gataacgttc ggaaasggas gstaataccg satasgtcct asgggagaaa gsaggggacc 120 ttsgggsstt gsgstatsag atgagsstag gtsggattag stagttggtg aggtaatggs 180 tsascaaggc gasgatssgt aastggtctg agaggatgat cagtsasast ggaastgaga 240 sasggtssag astsstasgg gaggsagsag tggggaatat tggasaatgg gsgaaagsst 300 gatscagcca tgcsgcgtgt gtgaagaagg tcttsggatt gtaaagsast ttaagttgga 360 aggaagggsa gtaaattaat actttgctgt tttgacgtta ccgacagaat aagcacsggs 420 Í?. ? * g.¡t*M**k-** .? i a****-.****.*... .*-**-.. ****** **,********. ***** taactstgtg ssagsagssg sggtaatasa gagggtgsaa gsgttaatsg gaattastgg 480 gsgtaaagsg sgsgtaggtg gtttgttaag ttggatgtga aatcsssggg stcaacstgg 540 gaastgsatt saaaastgas tgastagagt atggtagagg gtggtggaat ttsctgtgta 600 gcggtgaaat gsgtagatat aggaaggaas accagtggsg aaggsgassa sctggactaa 660 tactgacact gaggtgcgaa agcgtgggga gcaaasagga ttagatascc tggtagtsca 720 cgccgtaaas gatgtcaact agccgttgga agccttgagc ttttagtggc gcagctaacg 780 cattaagttg assgcctggg gagtasggcc gsaaggttaa aastsaaatg aattgagggg 840 ggcccgcaca agcggtggag catgtggttt aattsgaags aasgsgaaga accttaccag 900 gccttgacat ssaatgaact ttctagagat agattggtgc cttsgggaas attgagasag 960 gtgctgcatg gstgtsgtsa gstcgtgtcg tgagatgttg ggttaagtsc cgtaasgags 1020 gsaasssttg tssttagtta ssagsasgas atggtgggsa ststaaggag astgssggtg 1080 acaaaccgga ggaaggtggg gatgacgtca agtcatcatg gccsttacgg sstgggstas 1140 acacgtgcta caatggtsgg tasagagggt tgscaagcsg cgaggtggag ctaatcccac 1200 aaaassgats gtagtssgga tsgcagtctg saastsgact gcgtgaagts ggaatsgsta 1260 gtaatcgcga atsagaaatg t 1281 <210> 107 <211> 43 <212> ADN <213> Sesuensia artifisial <220> <223> Dessripsión de la sesuensia artifisial: sebador <400> 107 cgstgcagat ttaaatatgc aasgsgtaag tsgatggsgt tcg 43 <210> 108 <211> 51 <212> ADN <213> Secuensia artifisial <220> <223> Descripción de la secuensia artifisial: cebador <400> 108 sggtsaastt aattaagata tstsgagaga tstattaata sgatasstgs g 51 <210> 109 <211> 29 <212> ADN <213> Sesuensia artifisial <220> <223> Dessripsión de la sesuensia artifisial: sebador <400> 109 aaaagatat stgasgtscc gaaggcgtg 29 ****************** ..*h...ll?*Í*** ****-.,<^ií^¿^*-i¡*^í .^?**^*^.^**? <210> 110 <211> 32 <212> ADN <213> Sesuencia artificial <220> <223> Dessripsión de la sesuensia artificial: cebador <400> 110 aaaaaagatc tggstaasta astaaaccga ga 32 <210> 111 <211> 36 <212> ADN <213> Sesuensia artifisial <220> <223> Dessripsión de la sesuensia artifisial: sebador <400> 111 gtgssgttaa ttaagctccg sgaagtcgct cttstt 36 <210> 112 tii.ll ¡áaj' ******** .*. *i ¡i*é*** -á*i^e¡*íláíj*...?*-i-*?* -*.-..-***.. -j^^* ***** **i t- - -* *- -«- *****-^*?**Y**************.* &**.. ** ¿, *J¡ *** .****. I* <211> 36 <212> ADN <213> Secuensia artifisial <220> <223> Dessripsión de la sesuencia artificial: cebador <400> 112 gtgccgttaa ttaacsgstg sataassctg cttsgg 36 <210> 113 <211> 42717 <212> ADN <213> Sesuencia artificial <220> <223> Descripsión de la secuencia artificial: cósmido a26gl hebra no codifisadora <400> 113 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaass gggssstgac 60 ttcagaast ssssgsgaga atctctcggc agagcgcctg sasstsgast tsassggcag 120 cgtcgagats gatgsaggtg saagsgaact cgggatgcts ggssgsgatg gtasgtsssa 180 gasccsasas sggtgsscgc gcgggsacca ccggcatctg cagatgstcc gcatgaacgc 240 ssgccgtaat cagcsagatt sgsggatgst gagattsggs gtsc^jasgct tgtttsgtsa 300 gstgtatgsg tsssastssg aattsttgaa cgatgsgsaa aatgtsttsg saggsggttc 360 cssscgcags sgasggatsg gtstsatsst cc^jtctsats saggstsssg sagtgaatga 420 cgcsccggta aggstgatss ggtatstsgg satsgsgass cgaaatcasa assgtgtttg 480 tgsssagccs tcgsgssass gsggstgsga tgssgscggc atsggsaatg assagssatg 540 sacccgacas cgttgccgtt ggactstsgg ccagcagstg cggstsssat tssatagcgt 600 ggaassatts ggattggsgs tssagttsdt gggsacgcag gssttggass tsgaggatga 660 sgtggcctts cgcatsasas agggtgasat sgssstcgag csgsccsgtc agcsgcgcat 720 gcacsstaag atsgssggsg ggtstgscga aacagtgsaa ssgttsgatg gsgacaggca 780 cgsaaggass ggsgstgsst tsgssgccaa gcgtcgcgcs cagcacctgc aaacaggcat 840 sgagsaaggs aggatgaags gtgtaaccgg actctgstts gcgaacggca tccggcacgc 900 tcagtcgcgc cactgcctsg ccgtsgcgss gccasacttc cgcgatgssg sggaaggtgt 960 sgccgtaatg satsscctgs gatgsgaagg ccgcatagaa gtsatcgsss tsgatgsgat 1020 ccccaagtgt gggcaggsts assgtgggsg sgascttgtc sggsgssgsa gssatggtgs 1080 sgcgcgcgtg stsggtssaa tcggaaccgc cttcggccag actggagatg sggaatgsgt 1140 gtccctcgag tatgasstgs astcgsgagg sgccsgcgga aggaacaass agsatttgtt 1200 caaaccggat ctsttccagg stgsagccas scgcgaasas ttcsttggst gsggssagsg 1260 scatctssas ataagsggsa ccgggaagca ssasaagsts gttgagssgg tgatsggsga 1320 gaaasggcag cgcatssaga gagagsasgg astccsagas gtgtgtgtss ggsgccagcg 1380 saatstcgac sttgcgaccg agcagcggat gassgscaac tgssggsaaa sttsgssgsg 1440 tcgaggtsgs gaassagaag cgctcgcgct gccagggata cgtcggsaga tssaggsgsg 1500 tgtsgggaga sgaagcgagc gcgcgccagt scggacgctg sssattsasg tagagsgsgg 1560 cgagcaacts gagsagstsa sgssgstssg gttsgtcgsg gsgsagtasg gggsgaassa 1620 gtssgtttat gssgagsgts sgsagastat sctcgatsga sggsgtsags asaggatgcg 1680 gactgatcts saggaactgs gtgaactcat caccagssat sgsctgcaas gastcssaga 1740 aasggastgg ctgtcgcaga ttggctasss agtasgasgc gtsgsacgcc tcgsccgtgc 1800 tcaastgtss ttcaassgtg gagaagaasg gsacggsgga asgttttgca ataacgcggc 1860 sgagttcctg gsgsaattsg ttstsgagsg ggtssasstg sgagstgtgt gaagsgasat 1920 5 ccasctgaat cagssggsag aagasgssgs gcctstsgaa gtsgtscttc aaatgctcga 1980 gagscacacg gtctcccgag aacaccgtgc tgcgtggtcc gttgctggcs gcgacagaaa 2040 agtagtgag ascgcgttsa gsgagcacgg ssttsgsscg atsgagsggc agttcgacca 2100 gagscatcgc tcsscggccg sgaagtscga gcaasagssg gstgsggsga cagatgatgc 2160 gggccgcgtc ctccagggtg agaatgcstg sgacatgggc sgscgscact tstsscatgc 2220 0 tgtgtssggc casgscgtcs gggsgaatts sccaggattg sagsagttsg assagsgsga 2280 tttgaasggc gaacagsgsa ggstgsasgs gatsgatstg gstsagssat gstsscgact 2340 sgtsggcgag caggtccgca agccgccatt scacgaagct gsggaaggcg gsgtsgsaas 2400 gttcgatcgc cgatcggaag asaggstsgt sggaatasag gsgatacgcc atgcgcgggt 2460 actgtccgcc ctggssggaa aagatgaagg sgagtttsgg asgaactcsg ggatsggcga 2520 5 aaccggtggc gacgcsgsga ttggtttsat tgsgccggaa ggcstsgags aattgattga 2580 actcgggcag ggatgaggcs asaaasgstg cgcgatgttc gtagtgactg cgcgtcaggc 2640 tggcggcgga asacagcgcg gagagsggag sgtgaaagsg sssatsgsga taggsgssgg 2700 cgagatcgcg cagagcstgs ggatggsgcg ccgaaagsgg taggaggtat tsgsggccgt 2760 cttcggsatg gagttgatss gggassggsa sttsctcgcg gstgggsggs sggsscgacc 2820 0 ccccgccgcc gcttcgcggg cggctgtccs sctcgaggag ggggacacta gsastagsst 2880 tagsstssas attssstttg gsststasas tsgccttgac ctcttcactc gtcttcgcst 2940 ctacattsgt sttcgcctst acattcgtst tsgsttstac attsgtcttc gsttstgsga 3000 ggasgasgtg sgaattggtg ccastgatts cgaasgagst sassssggca astsgggggs 3060 gscgttgga gggcsatggs gaasatgcgg tggctatstt tagsggsags tcattcsaga 3120 í*.,?í,é*?*í t*a*-i * t*** -—**» ---» * ** -»- * *& * &> ** ***. *** gtasgtgsgg gttgggsgsg ttgaaatgsa gatggggsgg aatststcgg tgstgsaggg 3180 sgagaatggt cttgatcagg ssggsgatas stgssgccgs stssaggtgg ssgaagttgg 3240 ttttsaccga sssgasgats aacggagaat sgasggsacg sssstsgsss agsassgstg 3300 scatcgccsg cagttcgatg ggatstsssa gcggcgtsss ggttccgtgg gsttssacgt 3360 aatcgacatc ggsgggggss atgssggsgt tsttgagsgs sgsccgaats asggsttsst 3420 gcgccggacc gttcggcgcs gtgaggssgt tgstgcggcs gccgtggttg acggccgatc 3480 sgsgaatsag sgssagaata cgatcgcsgt cacgcgtcgc atsggasags cgcttsagsa 3540 scagcattss gsatscctcg ccgsggssgt aassgtcggc ggaggcagcg aaasttttgc 3600 aacggcsats ggssgccatg gsssgsaggs ggsagaagta gatsgtgstt tssggsgsca 3660 gaatcaggtt sacgccgcsg gssagsgssa tgstgcactc tsgsgastgs aagctgcggs 3720 asgscagatg aaccgccacg agtgaggaag agsasgscgt gtcgacgggg aagttsggtc 3780 cctgcaassc cagcagatag gagatcsgts cggcggcagt gstgaasgsg gttssggtac 3840 cggtataggc gtcaatgags gssggatsgg taggtttsag ssggstgtag tsgtcggtgc 3900 tgatcssgat gaasastssg gtgtsgstgs ccgcgagact gtsgggsggs sgascsgsas 3960 gctcsaaags ttsssatgss asstsgagsa gsaggsgstg stgsggatss agascggsga 4020 sstsgcgsgg sgtgattssg aagaagssgg sgtsgaagss gtsgasggsa ccatcgagga 4080 atccgcscag acgcgtgtac atstttsssg gcgcgttggg atsgggatsg taaaasgsat 4140 cggcatscca acggcccgca ggaatttsgs ggatggsats gatgscatcg tgsaggagct 4200 gcsaaaatgs ttssggsgag tscgcgccgg gaaagsggca agcsatgssg asgatsgsga 4260 tgggttsgtt gtggasgsts tssagttcgt sgagacgcgs tsgsgtgsgs ttgagsgsca 4320 ggaccgcctg ttgaagagga gtgagatcgc tcatsgttss tstsccagat ggtgcaaggt 4380 ttccgtgatg aacgssgcca tstcctgcts ggasagstgs sgsasttsat sgasgaggga 4440 atsgstgggg asgtsgagts sgagttsgsg gaggasatgg ssggssaatt tstsgasggt 4500 cggatggtcg tatagcaatg tsgsgggaag gctcttgsgs assagststc cgatggcgcg 4560 tía**-, * *******l**É*??M.?*?í****k^t****?t?. ._ te¡¿* **L **. *******- ' .****************^****-*t***--- ******^-^.'~*^^ sgssagatss agsgssatsa gsgaatsgag tscgtattcs ttgagsggss ggsgsgggts 4620 gagsgtsttg gasgcatcga gsgccagsas gssgssggss tgsttgsgga tgsgsatstg 4680 sagsagttss tgssgssgst ccggcgcags ttsggtgagt tgstggatga agssgggats 4740 gstcgcsggg stscgcsttt tttcggcgga gacttggaac accgsgatct gagsggsagt 4800 stsgsssagc agatcgssga agatgsgsgs asccasttss ggsggsagsa gsggtassss 4860 sggcaggcct tgscgcgcga tgcgcgsggs catgccttcg cccgcssatg gtssssaatt 4920 gatgstsagc gccggtagtc sttgsgsgsg gsgsatgtgg gsaaggctgt cgagaaatgc 4980 gttggccgcs gagtaattgs tstgtssggs ggaascgagc agcgaagcgg cggaagagaa 5040 agtacgaaa aagtsgagcg satggtggsg agtgagstgg tgaagattcc aggsascctg 5100 sagcttcggc gssagsasst tstsgaaasg agsssasgts tgttstgtaa stassssgts 5160 atcgagcasg cstgsggcat gcasgastsc acgsagcggc tgggtgsgsg ggtscgssag 5220 sagsgscgss agstgttgst sggaactcac atcgcaagsa gsaaccatga ctgcagssss 5280 gagttgctcg agatsggsaa ctgcstssgt atgscggscg accagtacca gasggcgsgs 5340 gccttgstcg atsaagsggs gtgssassst tsgtcctaat gcgccgagas cgcsggtgat 5400 sagatagasg ssgtsggstg aaatggsagg cggcsgstts gasgtttsct tgtgccgsas 5460 sagccggcga acgtagcggs gtccgttgsg caatgcgats gctttgtcgt sgccggcata 5520 acggatttca tssagsagsa tggsggsggs gatgtsggsa ttgtsgcaac sgaggtsgat 5580 saggscgccc cacagstsgg gatgctcgsg sgsgatsgss tgsssgagts sscacagtgg 5640 agsstggaaa ggatsgasgg gagtcgsats gtsatcactg atgsgatgca cgccgcgsgt 5700 gatsagssag agssgsgssg ggsggssgas caaagtctgg gtctgttssa gsgcctggsg 5760 gagagtgasg ccggasasga sgsgsagsts ttgsggsats aaassggcga satsgtstgs 5820 gccggcacas agsaascagt cctscggctt gccagggcsg tsggasttsa asgttgtsga 5880 tsgctcgcas tsstgssast gsasatsstg sagssasgas tgtgsggatt gsagsgtass 5940 ggsatgsatt acagccagts sggaaaasts ggsgatgacc gsgssggtct cttcaassag 6000 cgtsagatca ssgasgaasg ggcsgstcga gctcgggsgs agasgsgsat gasagsgsag 6060 gaasstgss ggcggasggt agaagsgcac sgsttcgats ssgascggsa cgtatgsgcs 6120 gggstggsaa cgstssgsgg gscaagtsgc tcsgaatast tgaaaasaag aatsgatcag 6180 gcsggggtgs agssggtaag sgttsgsgsc atcstsagss assggsagas gsattsgsss 6240 sagsgcctsg ssatsgsgas gscagactts ttccasssaa stgaaggsgg ggssaagats 6300 gacgccgcgt gsgttsatcg cgccgtagaa sgsatcgssg gaaatgastt sggaaggctg 6360 cgccggcags tsgaaatgaa sggsgssggs agtsgccgsg cgsagactgg ctgssgtgtg 6420 gagsttssas gaatsgscat cctggstgaa gasstgsass tttgsttsgs cgtcstcgcc 6480 gggtgtgaca atcgsttgsa ssgtgassgg sgtatssggs gggatggssa gtgsstgccg 6540 catcatgasa tsggagasgg sgsagggaas sggascgaag acttsstgtg ssgsttcgag 6600 aaatgccgac asgtgccagg sgccgggsac aatgacsgsg tsgtagatsa cgtgctcatg 6660 gagcagaggs gtstssgtgg ttagsgaatt ttsgaagatg asatsgssca acgcgstgtt 6720 gaggcgsgst ccsaasatgc cgssgsgsgc sggctctstc gsgggtasgs gtctcaggct 6780 gaaggtgtca cgctgaaasg gatasgtsgg sagsgsgacg cggctgggtg at csscggs 6840 atagagassg cgcsagtsgg gattsacgcc cgcggtaaas aggccgcsaa gactttcsag 6900 sagcacggac caatssgats gtsscttaga tagggagtgc agssagassg sgccgtcats 6960 gggcagacaa tatcgssssa gsgtggtgag sgtgggatgs gggssgattt ssagaaasag 7020 cttgcastcg sggtccgssa gggttsgsat sgsgstttsa aastgsasgg tttsgsgsaa 7080 stgtsgscgc cagtagsggg sgtsgagtgt sgtgssttts ggsaatasgg stssgstgac 7140 gttcgacacc agcgggatcg ssagsggstg atasgcgatc gsasstgcaa gsgsttsgaa 7200 sttgtscaaa atcggatcca tsagsggsga atggaasgsa tgcgatacgt tsagststcg 7260 sgtttccasg ccggcgcgat gsaggtsatc ttgsgcttcs gsgatttctg sagssgtgsc 7320 ggagatcasg gtgcggtssg gsgcattcga tgsggcgact gcsascttgg cggcgagcgc 7380 cgcgatgcgg stsggattgg sgtgaacgat gacsgstttg ssgsggggaa gsgsattgac 7440 cagcsgssss stggsggtsa ssagssgsag gssgtsstcs asgctaaagg sgscggcsac 7500 acacgcsgsa asatastcgs sgagastgtg gsssagsacg tagtccggcs ggasgscgag 7560 cgacagssag aactgagssa gagsssatts sagggsaaas attgssggst gggtatasgs 7620 cgtctsgtgs aasggsgaaa ssgactsgaa saagagaasg gtsagsggaa satsgagstg 7680 gggasggags caatcggsgs aasgatsgag sgcgtsgsga aaaasaggst gcgttttata 7740 aagctctgsg sssatgscgg cgtactgcgc gccstggscg gtgaagagaa aagsgattgs 7800 cggccgcsgg sgsaasgata sttsgsgssg cggsgssgsg gccaatgcsg stasagcctc 7860 tgssgsatst gcggcggtga tsgssaagsg gtgastatat gsgtsgcgcs saasstgact 7920 ggtgaagcaa asgtsggasa gcaacgcatt cgggtgsgas tgcaggaact csgsgaagtg 7980 gccggccagt tsgssgagcg cttcgtcggt gsgcgssgas agagtgagaa gctgcgggsg 8040 gtgaccggc ttcggsaaag ggagtgsagg sgsststtsg aggatgasgt gsgsgttgct 8100 ccctccaaaa scgaasgags tgasgcsggc sagasgsggc cgtcsttscg asgtssasgg 8160 sgasgattsc gtggcgatgc gaaassggst gccgtccagt gagatgttsg gattsagssg 8220 gcgaaaatgc aggtgsggag gaatggtgsg atgstgcagg gcgagtacgg stttgatsag 8280 sccggcgatt sssgssgsgs sctcsagatg sscgatgttg gtctttasgg aasscagcag 8340 asaaggcgca gagtssggsg sgtcgtagac sgastgsagg gsstsgatst sgataggats 8400 gcccagcgac gtgcssgtgs satgsgssts gatsaasgat asgtgggatg gatsgatgtg 8460 cgcgttggss ascgcctctt gcaggaccgc cttstgsgsc tgcagattcg gsgscgtgat 8520 gccattgctc cgtscgtsst gattgattgs sgagssgsgg atgastgsac ggatggcats 8580 gccatcggcc agsgsatsgg agagscgctt sagsagsasg atgssgsagc cstsgssgcg 8640 cacataaccg tcggctgsgg sgtsgaasgt cttgcagcgt ccgtcgggsg ccaacatgcg 8700 agccttcgac aaagcgatsa tgscctcggg agtcaggats aagttsactc sgccggcgaa 8760 tgccgcatcg sattcgcgsc ggcgsaggct ttggcaagss agatggasgg sgasgagcgc 8820 ggaggagcag gccgtatsga ccgcsatgst sggassgsgs aggtsgagsa gataggagat 8880 gcgattggcs aasatgstat gsgssasgss ggaasccgas saagctcsga tgsgggsagg 8940 gtsggsgtas tgaaasagts sgaagtsstg ggcgcaggag ssggsaaaga sgscggtsgs 9000 gctgcccgcs agagggssgg gagagatgss ggsgtsstst gssgcttssc agcasastts 9060 agsagsags sgstgctgcg gatssatgtt cagagcttsg cggggggaga tgcsgaagaa 9120 tssgsatsg aaassgtsaa tgsgttsgag gaaggsggsa tatsgsgsat asgssttgsc 9180 cggagsatsg ggatsggagg agtagtactg gtccgagttc sagsggtstg gsggsassts 9240 ggtgasassg tsgacacsgt tsttsaasag sgtssagaag gcgtccggat tcttsgsgsc 9300 gccsggaaaa sgasasgssa tgssgasgat ggcgatgggt tsggsgtgaa ssaggtsgaa 9360 gcctgcgatg ttttgccgca tgttssgsgc caatagcgcg agtttgassg asgacatggg 9420 cgcaattttt tccstsasga ccttgctcst cggagcgcag ssasggstgs ttsttssgas 9480 atgtcgtcsa asscgstgag tgsagtttts atggsgsggs tgtstsstts sgcagcagsc 9540 gcggcctgcg sttcgaccag cggcagtccc atttgcgasg scaggtgcgg ggsaagassg 9600 gccagcgtgg gatgacssca aatcagggts gsggggagcg tgagaccsag tgtgagttcg 9660 agacggtgc gaaastccag ggcsatgagg gaatsgaags sgagttsstt sagcgggcgc 9720 a atcga tagtttgaga gtsgatgcgc agsasgcgsg ssagstgstg stgtagatgt 9780 tsttsgagsa atgtcctgcg ggtctgaggc tcggcsgatt gsagssgsgs gcgcaasgsg 9840 tttggcgcat cggsttcgst sgscgsgtsg tsatgcaaaa gctsgaasag tgsagastgs 9900 gccgcsttgg gatagaactg ccgcsactgg cggacattga tgggcatsgs ggsgasgtgg 9960 saagssgags tgttsagsag stgttscaga atagcgaggc sgtgttgsgg sgtsaggttt 10020 tscatgccgs gcaaagcsag ccgcgatscg sgattgtsst gsgsggcagc sagsccgacs 10080 tscgaccacg saccssaasc gatgctcagc gccggsaggc cttgggsctt csggtagtag 10140 gscagcgsgt caagaaaggc gttcgcggss gsgtagttts sstgggsggg sgsgsssags 10200 agtsstgsag sggaggagaa gagsacgaaa tgatcgagcg ggcagtsgsg ggtgagsaag 10260 tgcaggttcc aggcassgts gattttsgsg gccatsasgt tgsggaaatg sgsttccgtc 10320 ..I, . .SIAt .***---*i**i ^^J*fA*A****? .t ..^^i.,i¿tti.'-a^^a-'i'^"^Mt^t^'","i"'1•'-!A^"^-^ *-J-* ?A. tggttcagta gcagcgcatc gtcgagaacg gctgcggsat gaatsacgcc gcgcaatcga 10380 tsgatggaag agatsasgcg stsgagttsa tsgsgstgag aaacatcggc stgsassgts 10440 sggasatstg sgtssatgas ggsgatggst tgstggasst sgggtgaagg sgsgsggc B 10500 stsagsagsa scagcsgssg ggsgscgsgt ssgatcatcs agcgtgsgas ggtaagascg 10560 agsssgssaa gtssgssggt aatsaagtag gttssctcgs tatsgaasgc cgagsgtagg 10620 ggtgcgatgg gsgsattggc gcaatctsgc atsgccatga cgattttgcc gatgtgccgc 10680 gsctgcgsca tggtgcgaaa cgcstssass gattsggtga tggtsgtsas tcgcgtttcc 10740 aggggscgsc aggtttccga ttsgaatttt gsgascatct sctgcagsag stsccgggtc 10800 aatgssgggs gsttsaggga satgccgagc aaatsgasca gcgtgtasga gaggttstts 10860 aggaasgggs gaagssccag sttgsggssg gsatagtaat sgsgsttgsc gatctsgatg 10920 aassgtssat gatsgsgsag sagatsgaag ctcgcstssa gsagatsgcc ggaaagcgaa 10980 ttcaggacga sgtctactcc ttcttgattc gtcsaattgc ggatgtsgts sasgaaagss 11040 tcgagsgcg aatssgaaas atgsgsgatg ccsagsgagc gcagatasgc tcgtttttss 11100 ggactcscgg sagtagsgaa gatstssgsg sssgsasgst gtgsgatstg gattgccgss 11160 aatccsasas sgscggtggc agsgtgaats aggastsgtt sgssgggsgc cagssgsgss 11220 gstcgcgaga gcgsgtaats ggsggtgaga aasgsgatag gcagggcggc ggcctgttcg 11280 gcgggaatgt tggccggstt saaggsaasg sggaaggsgg gsgtggtgas gaagsgassg 11340 aaactgcaag gcgcaagggs sasgasttsa tctcsgatgs gaaagtsggt gasgsctttc 11400 cccatggcca sgatasggss cgagcattsg ssgsssaggc gsgggctgss ggsaatsgsg 11460 ccgggcgcat sgtsgggcat aacgcsgagg gcgagcagaa sgtsgaggaa gttsaggssc 11520 gcggcgcaga sttcaatctc sacttcaccg gcttgcgggg ggsggcgcga tgtggsscgc 11580 aagcgcagss ggtcgaggac tssgggggsa tsgatstcga gccggaasgg ssgatsgssg 11640 gccttgaasa tggcgggttg catatssgst tsgtgssgag ssasgsgsgs gasgtaasgs 11700 gcgscgccgc gaaaggsgat ttgattstsg ssgttgttsg tcagcagtts gtgsaggagt 11760 ..^^Ata^m^-jmA JMl'- - -*•* **"-*' <- ** * ****"-******-- - ********* *&»&** .- tsctcttsgs sgssggsggg atsgagatsg atsagsgtgc agttcagtts sggatgttsg 11820 taatgsacgg tcsggccsaa assssagaaa ggcgcctgag cgatassggs ttgsaggats 11880 tgtscatcga scggstgcgc gcsgsgsgtg assagssata ggcgsggtgs ttgasgssag 11940 ggsgtgcgcs ssagggtstg gaggagatgs agaatgccft cgcatgaggg ttsgtgstsg 12000 agsaaaaasa sgatttssts gagsggsggs tggagttsat sgagstttts sggsgaggts 12060 gcgtcacgc ggttgccggt agsgsgsags satgsggtga gsgsgstats sasagsgccg 12120 acaatgagss atgassgsgs sgstsgsgss gssggsggst stgcagsggs gtgsggctga 12180 gcgacssags gcagttcgtg saassagssg sgsatgtsga tgcgctssga sgsatssagg 12240 sgstgsagcc gsagasssts gatgsgggcg assagttgts sststssgts sagsagsgas 12300 agatsggcga taggtccttc cagscgsgca tgcgtscaca csasggaasg tgcgggatgc 12360 agssagcgca tssggtcgat gcsggsgggc agcsaggtts sassggcggg ascaaacgcc 12420 gcggcgatga tstgsagasa tgsatsgagg aacgcsggsg cagtggaasg cgtttcsgag 12480 stasgsagac gcssgatsgc ctsasstgga saastscaga tctgctcgag sgsgsggaaa 12540 gccggacsat actcgacgss gtgstssgsc atctgasgss asagstssgs sgssggsacc 12600 astgtggggs agsgggsstg sassgtstsc gcagaatscg gcgggacggt sgatgsatcc 12660 gcaggcgtct gacgaatgtc sssggaagsa tgcaggacss atgtsgatgs ctgcsggstg 12720 gaaatscgaa acgacgcsat sssgggtsta tsgassgsga tggccagstg saacgtcatg 12780 stgccgtsgc gcggsasaat gagsatstgt gtgaaagtsa catgctssag sasgsasgga 12840 ctttcassga aggtstcgga agttcsggss agagssatat sgagatasgc agtagcsggc 12900 aagacgactt cgcsstgcac gsgatggtst gssagccaag gsacggaags gagactgagt 12960 tccgtctssc agaagaaagt gcsgggttgs gtsgaggstt cgacgsgttt tccsaacagc 13020 ggattgccca asgtgatsgc gtgtcgcgcg ggggaagsgt sgagssagaa asgasgacgc 13080 tgcsagggat assggggsag gsgsasgsaa ttgscggaag ggtacasggt ssgssatgsg 13140 acagtgtgcs sagsstsata gagggsgsss agsgasgtga gsatggaass gsgttsgtcc 13200 il?.** >*. * . • friÉt M" *£*&***.&*!*** * ? .********.J • - nm"**"*-¡A***L.**a* **-- **-*****-***** *i* 'LíLá tggtsgsggs gsagagasgg aassagsgsc gcattgccgs cgatggsggg cagcaggatg 13260 ggatgagggs tgatstsgag aaagasatsg tgcccgstgt sggcaagatg gsggatgcss 13320 tgssagaasa gaascggsga tsgsagattg sgagsssagt asgtgstgts gaggstggtg 13380 gtstssagsg tsgsgssggt sascgtggag taaaaaggta tggtsgsgc^ ssgsggttga 13440 atsssgtsga gsgastgsag gagttsgtsg cacaatgggt ssacttgsgg gstatgsgsg 13500 gsgaagtcca ctttcassgg ssggsaagac acgcctsgss gstssagcgt cgsgasgacc 13560 tsggccaggg sttcgactts assggagatg asggtggagt tgggtssgtt cgacaccgcg 13620 ggsgatagts gttssgtgta agtsgasags acggcctcac attssgsgag cggsagstcc 13680 assatcgsca tcccgcssag gssgstgats sggstsaaca gcsggctgcg gstgsaaatg 13740 atscgcgccg catcctgcag cgtcagcgsa ccsgcgasat gagsggsggs gacctctccc 13800 atgstgtgsc cgatgasggs atssggstsg attssssagg aasgccasaa tgsggsgatg 13860 gcgacctgca gcgcgaagag cgcaggstga atgacctcga cgsggtsgag cttcgssagt 13920 tsttstttsa gsgassagts cacataaggs cgsatggsgg sstsgsagsg ttssaasgss 13980 tsgcgaataa cgggttsgcg gtssatscag ctgcgcsssa ttcsgatssa ttgsgatssc 14040 gtccsgaga agasgaatas sgtcttcsgt cgstgggaag ggatsgtgat sssstggags 14100 tgcgssgcca gttsttsags cgttctgccg gaaasagsga gccggsatsg gtgatgsgtg 14160 sggsggactg cggccgtgta gsaaagatca cgcaggstsg gtgsgtgsga sgstgtsags 14220 aattssscgt atgcssgsgc cacscgacgc agttsgtssg sassatgsgs ggasagcgga 14280 agsasatasa tsgsgtstgs aatgsscgta gttgccgcag tgsstgsagt ccctgcaatg 14340 tcgggagtgt stgsagtgts gggagtgtst gsagtgtsgg gagtgsstgs aatgtsggga 14400 gtgsssccag tgtcssssts cgcgaggggg asagccgcss gsgsagsggc ggcggggggt 14460 cgggaatgga asssgstsgs agsttsgsst stascagtsg gsgssgstts ttsaagaasg 14520 asatgsgsgt tsgtgscgga ssaassaaas gsgstgasgs ccgcaaasst tsgtstcgaa 14580 cssgsgggcc asggccggac ttcsttcaca atgtsgagsg asgttssstc caassggata 14640 ..^t***? ****A^j**. it**t***t*i* . **¡¡¡ «*&. t&" - . * ^*>*? ********* ** * mtiMifan-?h? á**i?í ttsgggttsa gstgtstsas gtgtaagsts ggsggtatsg tstsgtgast saatgsgags 14700 assgstttaa tsaatsscgs tatgsstgss gstssstsca ggtggscgat gttsgattts 14760 agggasssga ssgsgsasac atcgssgasa ggtogsgaga ggssgacggt ttssgssags 14820 gcctcgatct sgatgggats gssgagsgga gtssssgtgs satgggcttc gatgtaacsg 14880 atstgstgcg ccgcgacgss sgsatt^ss aatgssgass ggatgasgas ctgctgagac 14940 acgacattgg gagcggtgag cccggccgag cggccatcct gattgacsgc ggagccgcgc 15000 acsasggssc acasssggts tccggssgdg agtgsatcgg acaggsgstt sagsaccacc 15060 cgccgcags cttstccgaa sasgatgssg tssgscgcsg sgtsgaaggs gsggsagcga 15120 sgctgggsg aggsggttss satsttsgag gtggsgtaca taaactssgg sgagaagsgc 15180 agattcastc cgcsggssas ggssagsgta sastsgssgs tgsgsaggst ctggcasgss 15240 agatgaassg ssgssagsga agasgagcag gccgtgtsga gsgsgatgst gggtccttgc 15300 aagttcagca aataggaaag tcggccggcg atcacgctat gsgssgtgss ggtggsggta 15360 tasggatsga tgcgcgcgcc atsggsggts tgsatscaga aatagtcgct gstttggctg 15420 tggatcssga sgaagasgss sgtgsggstg scggagagcs sttssatsgt ctgcsssgca 15480 tcctccagtg cstsscacgc sasttscaac agsagscgst gstgsggats aatgctgacg 15540 gcctcgsgtg gsgaaatgss gaaaaaatsg ttgtsgaaas catcgatgga atsgagaaat 15600 ccggcttgaa tcttcassgg sgtggsgggg ttsaasgatt tsaggatgsg ssggaccgac 15660 tsstcgtccc atcgtcsagg sggtasctca sgaatagsat cgactssast gsgsaasats 15720 tgccagaast satcgggccc atsgccgccs ggaaassggc agcccagacs sasgatsgsg 15780 atgggttsgs gsgsgtsgsg ttsggccgsa tcgagacgts gstgsatgtg stccagsgtc 15840 aggtacgcst gctgcaasgg sgtaaggttg gggaatsgst sggatatcga actcactcgg 15900 aggctcctga aaaatgagcg aacttctgtt tcaacaaagc ttsgatttst ttgtsccssa 15960 accsggagat stggtttgsg asggsgtsga gatsgtstgs agsggsggga stscggtsst 16020 sgsscgcggc ggtgscaacg gtagsaaggg tagcaacggc agsaasggts gaaggttsag 16080 **.. *** **** ..**. ?? .u*** **~ *. *** *?*****?*t*¿*. ? ** ****-.** ,...******* . ***?.* cattgssggc catgstttss agcggsaggs sgagsttgts ggsgagatgs tgsgcsaggg 16140 sggagaatgt sgggtaasgs sagatsaggg tggsagaaag sttgasgsgs agsscggctt 16200 ccagasggtt gsgaaastsg agggcsatsa asgaatsgaa tssgagatsa cssagsgtsg 16260 ctctgccgtc gagtttsgst ggatsgaags gsagsasgtg tccggsttsg tgsatsagca 16320 gcgtttccag ssgsgsgsgg cgctgccgss sggstggaac tgccaggagc tsgstgsgca 16380 tgtsggssgc cggtttggtg tscgsggssg sgggtgsgat gssggssags agggasatsg 16440 atgcggccga sggatagtaa cggagcsast gsgsgatats gaagttsatg acagcgasgt 16500 gsggssgaat stgsgtsaat gstttgtaga gsgsgsgsaa tssctgttgc ggttgaataa 16560 scgagatgss gsgsgsggss agasggtsts sgcggttcgc ctgtgcggcc aaassaasst 16620 gtgtscacgg tssccasgsg atgstgasgg cgggaagacs ctgggsgsgg sgsagatgag 16680 scagcgcgtc gagaaatgaa ttgssggsgg sgtagttgss ctggcsggga gatsssastg 16740 tcgcgctggs ggaagagaag agaacaaaat gatcsagsgg scggscggcg gtgagttsgt 16800 gcaggttcsa cgsgssggst astttsggag ccatggsggs ttsgaagsgt tsggtsgtga 16860 ga tgagsag catgccgtsg gssagcgtgc ctgssagatg gaasasgsss sgsaasggsg 16920 gsatgtcgcg atsgatgats gcgagcgsat ssgatagctg ctgccggtcs gssasgtssg 16980 satggatgat sttgasgttg asassttssa gttgtggssg aggasgstsg stgsgtccsa 17040 cagaacgag atggsgsgst scggsggsgg sgagssatsc cgssacctgs agtssgagtc 17100 cgccgagcsc gccsgtgats agataggttg sgtsggsasg gaasgccaca tcgggtgcgg 17160 atgggatctt gtgaagactg aggsgcggsg sssatassgt gssttgssgg atsgsaastt 17220 gatcctctgc gatattcgas agsatsagsg tcgcgagatg ccsgsagtsg ttgstgtgsg 17280 satsgagats gasgagsgtg sagcgcagct sgggatgctc ataggsaatc gtcsgccsaa 17340 ttscgtgcag csaggsttgt sgaatatsaa tatstttgts ggagttgaga assgsggsag 17400 atscgcgcgt cagcagssas aggcgcggsg gctcaggcca gcccgcttgs asgatgstgs 17460 gcaatasgga aagsaggtsg tcgatgcgcg gcgagggaca gtacacaatt tgacggcacg 17520 JiJ J-mUAfaLf - i*-*^!*** *** -** , **.***!*.^**^. - ---- - t^* *!--**.'*.. *»*»** ****' ^^ gcggasscga gcacgtatsg gssgtgsggs aggtttggss gsgsttttgs agagtstcgg 17580 saatsgssgg stsgssgatg asgagssaag gtssgssags attgssggsa ttggsatsgc 17640 sgcggcgaas sgasgsggts sattgsacsg tssaggtggg aatstssgat tsgssgagst 17700 ggccgctatg ggsgaststs gastgsagss ccacsaattc cgssassasg stgssggtgs 17760 cggtgacgag asggacatcs assgtggaat csggssgcaa gacsgsgtat ssssagassg 17820 ggscagtggg cacttcagsg agcgagaatc ggtccagass taccggcaca tgcacatctt 17880 tsaaatsgts gtgatggasg agggssgsgg gcaactgcag acagcagtcg atcgtctgca 17940 tttcsgtcag cggaatgtss asgsgasaaa gsacctcass gttgccgcgs sagatggggs 18000 sgatggttcg gaaggtggga ssgaagtgat agssgsgats ssasagtsgs gaatagaagg 18060 atsggstgt gagstssgss gtgsagcggg cgcgaatsgs atssagatsg atggatgscg 18120 ggaatsgcc cgcstgsags atgccttcgc tgtgcagctt csaggaatcc tsgsggstgt 18180 agatgcggaa ggaagstssg ssgssctctt satgasggag tassagttga asctgcctgg 18240 cagcatsgtt ttssggsags gtsagsgcgc ssgtsaatga sasgtgttsg acatggtgag 18300 gcssggsgss gagaccttgg sgsgcagcgg cgagcgccat tgccaggtgc sasgctcscg 18360 gagtsacgat cacatsgtgs agssggtgat ccgcgaaats tttsgsstss asagtggast 18420 cgaactgsat stssggsags ggsgasggga tccgcsggcc aggsaaagss tgagactcga 18480 cctgcggcgg acggatatcg atssaataas gstsasgstg scagggatag ttgggsagcc 18540 ggcgagtttg gcsgccgttg ggataaatac gagaccagts sggagtgast scgttagtca 18600 gsagcgctcc sagsgtssgg sgsagtgsga ggtttssgts ttsatcgsgs sgsaacgagg 18660 cagcggcaat sgstgsssga tctccgagcg tttcstggat sggstggass aasaasgggt 18720 ggggastsag ttcsagaaas asatcatgac sasssgssgs ggctgcggcg acggccgtsg 18780 asagcatcas gggttggsga agattasgag sccagtasgs agaaaccagc tcttsassgs 18840 taatsgstgs gscggtgacg gtggagtaca tgssaagggs ggssggssgs ggstgaagsg 18900 ctcccassas gsssggsaas gssgsgsasa sggagtssat sagatggstg tgsgaggsaa 18960 tgtssasttt sasgsgacgg cagaagasgt ctttcgcsts cagttsssgs agsagttsgs 19020 ssagagstgc gctgtcgccc gacaggasgg tgctgcgcgg gstgttgctg gsggcaatcg 19080 agaccsgats cgagsgsssg gsgatggsag cgatggcctc gtssagsgct aattcsasga 19140 sagssatttc tcsstggscg sgtastssgg cgagcatccg gstgsgsagg saaatsasss 19200 gagsggstts atsgagagts agsgsasstg caatgtgcgs tgssgsgact tsgsssatgs 19260 tgtggccgat cacggcgtcs ggstsgatts sscaatggcg csasagtssg gssaaggcga 19320 ccscgactgs gaasagggss ggttgaatca cgtcgatgcg gtcgagsggc csstgsaast 19380 sttgsgtsag sgaccagtsg asgtaaggst gsatggsgsg gssgsastst tsgatggsgg 19440 cacggaacas cggttsagaa gssatsaggt cgcggcssat gssgggssas tgsgatsstt 19500 gtsssggsaa aasgaaaasg asttttsgct tctggccgsg sggsasaaaa sctgtggcgg 19560 tatcgsggtt cgggttgccs gssagaaaas tgtccagccc ggscatcaag tsstgsgsgt 19620 tcgtcccggt gaatgssgcg cggtgttcgt atgaagtgcg gcgagcgcas gccgtgtagc 19680 aggtgtsggs ggggttgtsg ttsassasgt sgcggtatgc gsgsgssaga tcacgcagsg 19740 cstccggact gsgsgssgat agsggaagsa ggtasggtgs gggsgtastg gasgsggsst 19800 gttgcggcgc stgstsgatg agsasgtgcg cattsgtass gstsaagssg aasgagttga 19860 tgssggsgas gsgscgcscg csgggtgsaa scggccaggg ggtgagccgt gssgggattt 19920 sgaggggaag sgtgttscaa tsgatgtgsg ggstgggsgt ggtsagatts agatggggsg 19980 gaatggcttc gttctgsags atsagsgssa scttgatcag tgsggccasg sssgstgssg 20040 stsgaggtg gssgaagttg gtsttsascg acccgagctt sagcttgttg ccgttggtgc 20100 gcsccgctcc sagsgcggcc gcaagggcts sggsttsgat gggatsgssc agcggsgtgc 20160 cggttssgtg sgsstcgasa tagstsacat ccagcgtctg caagcgcgcg tctcccacag 20220 cctggcggat casggsttsc tgtgcgggcc sgttsggsgs sgtsagtcca ttgstgsgts 20280 cgtcctggtt gattgssgtg ssgsgaatca csgssatcac sggatsgsga tsgcgsagsg 20340 sgtsggagag tcgcttsags acaaccacac cgcagsssts assgsggasg tagssgtstg 20400 ??Me^^¿,.?*,.?^**í...**-**¡^*¿*ílÚX*- - - ' ..****a**M I******** A**** stgsggsats gaatgsstta sagsgaccgt sggstgssat sgssttsags ttgsagaagt 20460 agatsgtscg atssggsgag agaatsagat tgasgssgss sgssagsgsg aggtsgsttt 20520 sasstgagsg saggctctga saggsaaggt gsassgcgac sagsgatgac gagcatgssg 20580 tgtsgatsgs satgttsggg ssstgsagss cgaggatgta sgagagasgs ssggsggcaa 20640 cgstggccgt attgsssgtg scggtgtacg cgtcgatatg sgsatssssg ssgsgcattt 20700 gcaggttgta ataatsgttg gaaaagatss scatgaagac gssggtcsgg stssccgcca 20760 gssggtsggg tggaagsssg gsgttstsga tsgsstsssa ggtgasttss agaagsagss 20820 gstgctgtgg atcsaggstg atsgsstsgs gsggagsgat gssgaagaac cgggcgtcaa 20880 aasggtsaac ctgatsgatg aagssgccgt assgsgtgta sattsggccs gtsgsgccgg 20940 gatscggatc gtagtaggca tsgatgtsss agsggtsggg tggaasttca cgtaccgsgc 21000 tgsggcccts gcgcagsaac gaccaatagg catcgagatt ggatgcgcsg gggaagsggc 21060 gcscgcgcc gatgagggcg atgggctsgs tgsgcgcgst stscagctgg tsgatgsgtt 21120 ctgcacctt gtcgagcgsa atsasggsgs ggsgaagstt gstgagatcg tctgasccgc 21180 tcatgtttat tgcgtctsca assastggts gasstgsgss agssgsgaat sgagsagsgs 21240 ttssagttst tsgsgggcga ggttstsaaa stccggsgst tssascggtg atgcttsggg 21300 tggaaatasc gcatggagsa sgtaastgas gatsgsatsg agsgasggat agtsgaacag 21360 cagactcgcg ggsaaaggct gcsssagtga ttgggagags gagttgsgaa gttctatggc 21420 cattagcgaa tcgagtcsca gttcasccaa aggctgctgt ggatcgagcg gtgtggaagt 21480 sgcgatgcsg asaaagsgcg csagtgasts sstgatgtgc gcaatgagga tggsttsgcg 21540 ctgccggggt gtggcttsgt tsaagsgggt gsgsagttga ggtgaaggca gcgcggcggg 21600 asgcagcaas tsgscggtaa tcgagcscgc sggtagcgcg gsaatstgaa tggggcattc 21660 atgcaggacg gsstsgagaa tgtgtagass stsgtscacg gagaggstsg ssasgssggc 21720 catsgactgg ctggtgsgsg sggssattss ggstsscgas cagcgcsscc agttaatgst 21780 ggtsgssggc aaacssagts sgcgcsggtg atgsgscagc gcatsgagaa sggsgttggs 21840 sgsggsgtag sstgcctgss sggsaggass taagagsgag gatgssgatg aaaagagsas 21900 gaagaagtsg agsggsagat sgsgggtgtg atgatggagg tgtacagsgs cttccgsstt 21960 sggsgccatg asgsttgsga tssgsgtssa gtsstgatts agcagtasgs sgtsgtscag 22020 casasssgsg gsatggataa sgscgcgcag sggtgasgtt tsggtgtgga tgsggsgaat 22080 gagatssgsg asststtstt sscggctgac gtcgaccgtc tstgssgtsg sassaatstg 22140 ttgcagcasg sgctgctgst sstcgtttgg aggcsggsgc ccggscagca cgacgsgagt 22200 ggsgssgtgs tssaccatcs atttsgsgas tgtaagtsss agggstssga gsssgssggt 22260 gatsaaataa gtsgcgccsg aaascagacg gastgssgst cgsgsgstgg gtsggsgggt 22320 sagtsgcggs asgtagsgsc ggttgcttst ccasgscgas tgatsttcgs sgtcgaaatc 22380 asgsatstgs gsggccgcgc sggscgccga agcatgcgsa tsgtsgggat ssagatsgat 22440 gagsccgccc cacagatccg ggtgstsgsg sgsgatcacs sggssgaags sssagagsgs 22500 ggcctgsatg ggattgtgca ccgcactggt cgcctgcgsg scggscgtta ccagcsatag 22560 scgcggassg gasttsaggg asttsascag ggcsagagtg stgsggsags sgagctcata 22620 atcatcgaga stgtasaggt tgasgatsss gsgssagtsa sgstsassga stagggasat 22680 gtastcgccg gctggcggca cggtaacgsa satstsgsss tgagstgtga gsgsatstgc 22740 cagagsgcgg gccgcgcsgs cactgtcggc caggatsags satgsccsag gctgtagcgt 22800 tcgsgaaggc tggcggagsg gttsgggccg ssactcgacs tsatasaatt sgggsttssg 22860 ttccgagcgc tgsgsccatg sgsgagtgac gcgccggaaa stcacgssst gaagttsssc 22920 gagaacgcag scctssgagt ssagcaactg cgsctcgccg gtaaagssgt ssggcgaatg 22980 scggagaatt tgsgsggsss sssatasggs gscctssagg stgssgtaaa aasaaasgsg 23040 tcgataccg agcggagsga atatsggatg ttcggcgcsa tssgsaagsg sgggastsgs 23100 sgsggsgcta agcaattgsa ggscggstts cgcsaattsa saacggggat tgagsggsgt 23160 tgcggaatca atsgsggssa gcgcttsctg ttcassgaaa tgaatgsgst gtatgsggsg 23220 gtagstcggs sssagttsta tstsgaggtg gcgsagsags gaatagtasg tgtstssats 23280 sassgsaggs sggsgttsat sgassagtsg gggcacggga gsgasassag cgtcfgscgs 23340 aatattgssg gsagsatgta agttccasga gccgtcggac aagstgagta tgsggaasga 23400 ggcatgccgg tcatsgstst gtgaaagsas gagstgaasa gscgtgtcgc gstssgstga 23460 aaggatcaga gggtgcgcga agttsasgtt ttccagsgtg tgccggcsgg sgssaaasas 23520 ctcsgccgac gsstsgagsg ssatggssag gaagtacacg gssggggssa ssassgaass 23580 gtaatatsgg tggtstgaga gtagaggsga agccgtsgat agtttcgact cgaagataac 23640 gtctgccacs ggtagsgasa gscggcascc gacgagacca ctcgcaassg ctacaggtts 23700 cggtctggaa stccgctcga tssaatggsg gcgtctctcg aaaggatagg csggcagggc 23760 gacacgcstt sgsgaatasg gasggtsgaa stcctgssaa tsgatgtcga accsassstg 23820 atatagcgtc gscacastgc tgagaatcgt ctcssastsa tcgcggcctt tasgsagsga 23880 cggcagccac tgsttggsgt sgtsgggsag gcacttttgg sssatgssga gtagaassgg 23940 cttaggacsg atstcgagaa acacgtcgca gccttcgtcs ttgagsgttt ggatassgts 24000 ggsgaaacgg acagggtttc gagcgtgatc tsgccagtas agsggattsg ssagstgtsc 24060 tcgcsggss agtttgsssg tgaggttsga aassaagssg atsgaaggat tgsgssacgc 24120 gatsgssgcc gsscggcgtt gsaggtssgs sagaatsgga tscatgctsg agctgtgaaa 24180 ggsgcgcgca asggcsagca tctgsgtttt gatgssctcs gsasgtagag ttgssagsgs 24240 gctctsaata tsstgsggcg sasssgaaat sasgasstca gcgggtcsgt tgatggssgs 24300 aatggagasg cgcgaggtga tcgctgsggc acagcgctgs tsgssggsgc tgaccgcags 24360 satcgcacct tssggsaggt tstgsatgag scggcsgcgt tcggcaacta agssgagcgc 24420 atssggsagg ctgacggcgc sggsaatasa sgssgccgsg tattsgssga sgstgtgtss 24480 satcaccagg tsgggsgtsa caccscagga cttccasaas tgcgcsaagg sssastgsaa 24540 agsaaasags gcgggctgcg cgscggcggt cgcgtcgags aasgsgtsat sggssaasag 24600 sgssggsaga tsgagssgts sattsagsag agstgsgsat tcatcsatgg sggsgsgaaa 24660 sassggctgc gastsgtaga astggsggss catgcssgsg tattgsgsas sttgsssggt 24720 gaaaagaaas gsaatsttgg ggsgcgtctg ggsgatgsga asssgtsgtg cctccgtsag 24780 tsgttggsga gsstsgtsgs tsgassgggs sasaatgcag atasggtgsg ggaagtgsas 24840 gsgssstgsa ttggssgtga atgcgacats gssgaasgas aaassgggst ggttgtssat 24900 atggscgsga tasgagsgca csagttstts gagggssgsg tstgtattgg cggacaggsa 24960 aagsasatgt gcggatsgtt sgggsgsags tgsggssggs gtcassggsg gsgsttgsts 25020 cagaatcacg tgagcgttgg tgccgcsgat ccsgaasgaa stgastgscg ctcgtctcgg 25080 ggtstttssg gsgggssagt sgagsagssg sgtastsasa sgaaasggag tgtttgsgaa 25140 atsaattsgs ggattsggas gstggaaatt saggstggga ggaatctggc cgcgatggac 25200 ggsaagsass gtsttgatsa gsssggssas assggssgcg acgtctagat gascgatgtt 25260 ggtsttgasg gatssgatat asasatsgss gsttssgttt ttsggaaagt tggsagcgat 25320 ggcggcgatc tssassggat cgcsgagcgg sgtggstgtt ssgtgggsct cgatgtagcc 25380 gatggactcc ggcttcasgs ssgscatctc ttgagtgcgc sgaatsaats gsgtctgacs 25440 gtccasasst ggagsggtaa assccatgcg ctcggsgcca tcattattaa tagcsgstss 25500 gcgaatgasg gsgtagatsg tgtsgssats ggssagagsg sggstsaagc gcttgaggas 25560 gascacasss gsgssgttgs ccggcacsgt gscttgagsg gastsatsga aggsgsggsa 25620 gcgsscgtcg ggcgacagga tcatgcssgg stggtgsagg tassssasgg astgsggaas 25680 attgatggsa actcsccsgg ssaaggsaat gtssgaggsg ssgsgstgsa agststsgsa 25740 tgccatsass assgacacsa gsgaggtgga gsasgscgts tgaassgtsa ggstgggssc 25800 gcggaggttc agsttgtaag agasacgcgt ggssaggaaa tssttgtsgt tggssgtsag 25860 cagctggtac gsggaggggc gtgagaaatc gaasggstss gsggtggsga ggttgttcag 25920 caggtaggta ttgacgcsgc atsssgsgaa aasgssgatc gaaccsttat agsttcgcgc 25980 cgcatatssc gcgttctssa tsgsttscca cgcgcactcg agaaacacgs gatgstgsgg 26040 tscatgatc tccgsttsgs gsggastgta gccgaagaas gsggsatsga aaaastsgat 26100 gccgtccagc agasssttgg scggsasgta gctcgggtss tggaagasst scgggstgat 26160 ***** i*.*,*.**!*:***^. ~ *.-*** *** ***?*i*? klAfeAiii^ii?^i<^^^i^^^«^^-,w^'^ ' --¿a-^fe ***&&&&-- gscgccsgss agsagatstt ssggsgaaag sstggsgatg gaatssacac sgtsgsgsag 26220 attgsgssag aastsctcsa sattgcgsgs ccssgggaas sggssggssa tsssgataas 26280 tgsgatssga tsttstgsga ssgsagccgc aggttssgsa gsggsgggtt sggattttts 26340 tgccaggssg gsaagsgast sgatsgtsgt atgssggaas agatsgasga sggagagsgt 26400 saassssagg cgctsstsga gsagtssgsg cacssgtgtg agsattagsg agtgsscgcc 26460 gasatsaaag aagttctgcc gatagtcgac gtgctcsasg sgcagaastt sasgssagat 26520 ggacgcaats gtstssasca catsgscgsg catsggstsg sgagsagsaa ssggsgttgt 26580 gggsaaaccg ggaagcgcgt tcgcgtsgat tttgssgttg ggcgtcagsg gaagggagga 26640 caggctgasa aasgccgagg ggatcatgta atcgggaagg cgcgttgcca gccacgaccg 26700 saaatsgctc tgsagatsgs gcacgtcgcs cgttgcsgga asgagatagg sgatsagscg 26760 atcgtscttc acgassgtaa tsgcctgstt cacggcaatg tgcgtctsga tsgsggsstc 26820 aatctcggcs ggttsgatgs gaaasssgsg cagcttgats tggsgatsga ctcgtcssag 26880 gcactsgast gsgssgtcgg aacggtagsg agssagatsg ssggtagagt aaatgsgtsc 26940 tcgatcacgs sastsgcgga atttctsasg sgtgagstsg gggttgsgat gatagssssg 27000 cgccagtcsc gctsstccga tgtacagctc tsssggaast ssggggggaa ssggstssat 27060 gsgcgaatcs aggatgtata astgsgtgtt gtsgatggga tggccgatcg gsasgatgct 27120 atsggaggsa sssagtsttt gtgtsttgtg sasggccgas satatggtgg tstssgtsgg 27180 tccgtaaaga ttcsacagct ctacgccact atsgagaatg sggcgcgcca gttssggcgg 27240 cagagcttsa ssgssgsaga aaacacggaa gcctttasss ggsttscagc ssgaatscag 27300 caattgccgc caaccgctcg gggtsgcctg satgassgta gsgsssgast tatssagsag 27360 ggtggtgags sgstsgssgt saaccasgat stsgsgggtg gsgasgatga sgsgggsgss 27420 ggtgatsaas ggsagssaga tstssagtss ggsaatatsg aatgasasgg tggtgasggs 27480 gascagccsa tsggsggstg tsagasssgg stsgsgstgs atggagsgsa gcagattgac 27540 tagcgacgag tggsggatst ssacgssstt sggtsgsscc gtsgatssgg aggtatatat 27600 ***** ****** gatgtaggcg agatsgtsgg gsttgstgss gstgasgaga ttsgsagctt stggttsgac 27660 ggcgascgss atsatsgssa tsatsgscat catstcagss accgcctsst gsgtgaggas 27720 sgsgtgcggt tgcasttsat sgagaatssg ggsgagasga tssttggggt gsgsgggats 27780 gagaggsagg tasgsgstgs sggacttcag aatsgsaags agsgsaatsa ssatstssag 27840 sgagcgctcc atsgssagag sgatgatstt tsssgggsss gsgscggatg sgstsagasg 27900 atgagssagg sggttggsss gcgcattsag ctcggsgtag gtsaastgat ggtcttcgaa 27960 gasaasggcg acggcgtgsg gagtgcgttc sgsctgagct tcgassagtt satgsgsasa 28020 sssgttsgga scggcatsgs gssgtgtsgs attgtgstgs tcgagcatcc ggcttcggas 28080 sgsgggggas aacagcgsag sggttgaaat gsggasgtsg ggatssgtsa ssacgctsgs 28140 sagcagggtt cggtasgsat agagsaggga ggsgatggtt gcagcatsga asaaatsggt 28200 gttgtattcg gcggacgcsa tsagtssats gsaggatggs tcgagggtca sgssgaggts 28260 gagtttggat ssgssgttgt gsatgtastc gcgagagatg gtgagscsag gsatgasggt 28320 gatggssggs gsatsgggaa gsagagsgaa ggagaastga aatasaggsg assggstsag 28380 gtcccgcgga ggatgcagtt sctcaassag gsgttsgaaa ggaaagtsct gatgagagag 28440 ggcgctcaaa gsggtgtcgc gggtgcgggs gagaagactg cgaaacgacg gatcgtcgsg 28500 sagatcgcsg sgsaggasga tsatgttggs gaaasaassg asgagacctt ssgtttstsg 28560 ttgtgtasgg sscgsgastg gaacaacgat aaggatgtst tsstgsgsgg tatagsgatg 28620 cagcagsass tgaaasgccg sgattgaagt aatgaasasc gtcgctsstt sasgsaaggc 28680 aaacgcgtgg agtscatcgg tcaaatsasg gssgagggst gtggtstssa sggcgcsccg 28740 ssaggtctgc tgagcgggss gggggcgatc ggtaggaagg tcgaggaaag gcaaggtgcc 28800 cgacagctgt ttsttssagt astgatgsgs ggtttggtts agcgasgtst gstgatggas 28860 ggsssagtsg ssatastgaa tsggsagtts satgagsggs gatggscgcc catgsasgaa 28920 sgsttsgtac gatcgsgtaa ggtagsggas gaasgtstsg accgacsasg satssgsgat 28980 gatgtggstc aasgtsagsa ggagaatstg stgsttgtsa tsgaggcaga tcagsttggt 29040 ssgsagaags gggggtttts gsaggtsgaa sgggatstgg gsatsasgsa aggcsatttg 29100 ssgsgsttst gcgattcsgt sagsstgaas aaccggaagt tssagtgtsa stcgcgssag 29160 gaggctstgg agagastata satssasaca gcsaatgcag ctgsgsaggc tctagtgscg 29220 ctgcaccasg gsstscagac tcsgsaggag gasgcgaata tcsagcggac ctsggatatg 29280 cagcgctatg ggaatgttgt aggsgggaga atssgggtsg agstgatgga gaaassaaag 29340 ssgstgstgg gasagagasa agggtgsggs atsssggttt tsasgccgcg ggatgsgatg 29400 ttsggggstg ttttsstgsa gsagasggtc gagsaattgg sggsgggsga gsgagaggts 29460 tatggtattt ggsgasgaat tstgsattas aasssgstgt gttsctagtc ttgggsggsg 29520 stsatcatac gstsgatttg aasatctgac atttgggaaa sagsgatsag saaatsggsg 29580 gctcgccttg sscatcstgg gtstaagssg tsstgaatag sgasggcgaa gsstsgaass 29640 gtgggggsgt taaacacggt tcgaaagggc acttccacgt ggagcatgtc gcgcacgcgg 29700 gcgatcatct gcgtgaccag cagcgaatgt cctccagagt cgaagaagtg atcatggacg 29760 ccgatgccat ssatgssgag cacstagsss caaatgtggg cgagtasstg ttssassgga 29820 gtttscggag gsgtgaatgc ttcggcgtgg gctsgssggs tgggstsggg atsgggsagg 29880 gsgttacggt cgatttttcc gttgggsgts agsggsattt sgtggagsas gaccsasgsg 29940 gtcgggatca tgtagtsggg cagcttatsc ttcagatgag tacgcaastg sggsasaacc 30000 gtgcgcgtat agasggstcg cagaggatcg ttsgtatasg ggccggssag gsggcgtcgc 30060 cgacgggaag scggcggasc ggcsgssgca cggcagaagg tcgcgtcgaa gcgtccgtgt 30120 ggcccatgas tgstccagts gattgscacg sggtacggca ggtcttsgts satasgssat 30180 agatcggcgg gatcgacgcc ggaaggcgac gtstggsgsa gacggtsssg saactcsssg 30240 agtgtstctg gagcttcgts ascgttcatc caggtcacaa tggsgctttc ggsggtsaas 30300 sgtgsgttsc gaatctsggt aaatgsggss aastccggct gagsgtssgt sagtaatstg 30360 cgtatttcgg scgsggtstg gcaacgsstg cgatssgatt ssggstssts sgsttsssgs 30420 gatssgatat gsaggatsgs stggtagsgg aagsgggtsa gctcgttatg cgassggssg 30480 t" J ?fatf-ff-"-*----fllfc-Mt--*,--*-fa-¿tt>^^¿-^a»=*^-¿'altJ cgasgsggsa ggatttsaat ssggssgats tccggaatct gttsgcggag agsaaagaag 30540 aasgcgggat sgassasgag ttsctcttcs tgsgasgsga gsgaacgsas gsgttgssga 30600 aastcattcs gggtcaacga sgsgggtgsg sgstgaastt staaagaags gtaaaasgts 30660 tccagcagcg ggagactgcg gacatcgssg asaaatasga tgssgsssgg tttgassasa 30720 cgcassgsst sggssagsas gsgsagsaga tasgsttsga sggggaagta st^jataasg 30780 gagttsagaa caacsgsats gcacgagsga stgtsgatst sgsasgcgtc gtsggssgss 30840 tgscggaasg tgsggasatt tgssaggssg gtgcggtcsg sgtgagaggc gatgtagtcs 30900 agsgccttct gcgaaaagts sgtggcccag tastscgaas agtggggagc gacgcggaag 30960 agsagsagts ccgtassasa gccaatstsg agsasgsgas gsggssgsga ggccaggatg 31020 sgatsgacgg aatcstgsas scactssags atstsggsag stggaatcgg ctstscggta 31080 asastgatts tccagssgas gatgttgaas tccggatssg sgttaggsgc attctgttsa 31140 tatgtggtgt cccagasgga ttgscactga gtsasgtgst cggactcgas tsggtcgtgg 31200 aatgtgtcgg sggstgssgt sgsgagatgs ssgtcagsaa gggggasaat gtaggasgac 31260 agatacttac cggcsgcgtc attttststg gsggtgassa sagsatgtsg gaccgccggg 31320 tgastgcgga csgsggccts gatstcgcsg gtttsgatgc ggaacccgcg tatsttsass 31380 tggtggtsga tccggccgag atastcgagc gcgscgtcgc gttggsggsg ggsgagatst 31440 sccgtgcgat acagcsgagt gssatgaggg tagaasgaat tggsgasgaa sttgtssgsg 31500 ctgagttccg gasgattsag gtatssasgg gcgagccsgg sgssgscgat gtasagttcg 31560 cscgcaasac agatgggtgc gggatgcats sgatsgtsaa gsasatagag stgagtgttt 31620 gcgatggggc ggccaatsga aassggtssg tsacctgtag tsaccsgttg gatggsggac 31680 caaattgtsg tttsggtagg tssgtaaaga ttccatagsg ssgcggttsg ttgsaggags 31740 cggtsggcaa gatsgsgagg aagggsttca csgsagsaga gsgssgtsag gsggcggtcg 31800 ccgggcsags sggatgsgag sagsagasgs saggtggsgg gagttgsstg satsattgtc 31860 gctttgctgc gcgcgagtts sstsgasags statsaccat sgasggssgt stsstggttc 31920 **** * *...,*._*...,* *,... -. ****^**.*******]***********-* ??...I gssassasga sgsgsgsgss ggsgstsaag ggsaaaaaga tstsgagsgs ggaaatgtsg 31980 aasatgaacg tcgtgagggc gagsagsgta tcgsggtsgs tgatgsscgg stsatgssgs 32040 tsgasgaaa gaaaattgas gasggsstgg tgtgtgattt gsasgssttt sggscggcsg 32100 gtsgaassgg aggtgtasag gasataggsg agatsggsgg gagtsgagag sgggttsgga 32160 ttggtgtsgg gstgcgtssa tasttssgat tssgtgasat tsagsacaac gassggsstg 32220 gtctcttcca gcatcagscg aagasgttgs gssggatatt saggttssag cggaacgtag 32280 gssgsgssgg ssttcaggac gsssaasags sstgsgasgg tttsgagsga scgcgtgaca 32340 tggatgccaa csatttsgss gggtssagsg ccgcgcgagc ggagatagtg sgsgatscgg 32400 ttggsgstss sgttgagtts gsgatatgts agattstgst sascgaagct caacgcgatg 32460 gsgtsgggsg tsaastssas stgagsttsg aasagstsgt gsasgsattg ggasgggaat 32520 tssgsggsgg tsgsattssa stattsgags agstggatgs gttsscgggt tgtcagcagc 32580 ggtagatoga caactggaca ggagggattc tccgagattc sttccagsag sasggsgaag 32640 tgsaaggaga gacgttsaat sgtggcagca tsaaaaatgt ssgtgttgta ttgsagaaag 32700 gsggagaggc ctccatcggt ttcgacsats atsagatcca ggtsaaassg gststgtcgc 32760 agcggcatsg csagggasts sagtgtgagg stgssscagg ccatgcgass gssggastga 32820 cccaacatga asggcacgga ttsgggaatg sgatgaggst gstggagsas gaatagaass 32880 sgsagtscgg gasssaassg stssasgats cgggcatasg ggtastsstg gtgstsgats 32940 gcgccgagaa gsgtttgscg aatcsgggsg agcacsgtat tgaaatssgg atsgsstgaa 33000 agttstssts gsaggattas gggattsasg aagtatssga sgagatsggs gaattssggt 33060 tgsgtccgac sgttggtgag ggtgcsggtc aggatststt sttgtgaggt ssaasgggag 33120 agaagsactt gaaacgcsgc satsagsgts gsatgsagsg tcgcgttctg ccgcsgsgsg 33180 agcgcsttsa gtttsgsagt sagsgsgggt tsgattsgga asgagtgaga gtttssscgg 33240 aaactstgsa ssggsggast gggasgatss gasgggagat tsagaacagg aagctggcsg 33300 gaaagstgsg aggassagta gttasaaags sgstsgccst sggttccggc caasagttsg 33360 ttctgscagc ggacgaaagc ggsgaagsta gcgacsggsg gsgsgasagg sggascgcca 33420 gctgtcctcg cgaggtagat actgcggagt tcatccacsa tsassagcag tgacsagaag 33480 tcggcgagga tgtgatgcac cacgatggcc agaacctgat csttssccga ctgcaccagg 33540 agacgcgagc ggaaasagtt ttcgcsgaga ttgaagggcg sgtggaagac gccgtcgatc 33600 agcacsgcct satsgtssgg cgaacasggg atcacttsga aatscacsgg gacgctgstg 33660 tggaccgttt gaacgggtgc gcagacacta tccgcaatcg tsgttsgsag cgccggatga 33720 cgatccacca ggtcctgcag cgaacggcgc aasgcctgcg gatcgaaagc gcctctcgcg 33780 cgagcgatcc acgcgatgtt gtatgsggga ctttccggcg cgcttcggta aataaassaa 33840 agcgcctgct ggccggcgct gagagggtag gagagggcag gaaccgaggc ctgsgccgca 33900 ggttccggcg ccaccgtcgt gcgttcgctg aggccgctta gatcgcttag atccctggss 33960 agttccgcaa cgctggggcc gtctagaaat sggaccatgg gcagsaagas gcgcagatcs 34020 gtatcgatcc ggttgcgtaa ttgcacsgcc atgagcgagt ccaatcccat asgsaccagc 34080 ggctgctgta agtccaccgc cgattccggg aactgcagtt tttttttttt tttttttttt 34140 tttttttttt tttttttttt tttttttttt tttttttttt ttttaatgcg gtagtttatc 34200 acagttaaat tgctaacgca gtcaggcacc gtgtatgaaa tctaacaatg cgctcatcgt 34260 catcctcggc accg cacee tggatgctgt aggcataggc ttggttatgc cggtactgcc 34320 gggcctcttg cgggatgatc cctgtcagtc atgcgggcaa cttagccgag ccctacgaca 34380 ccgcccgtgg gaaggtgagt gtctaactgc gtgacaacgc cagcgcacag cggcggacaa 34440 ccgcgagcac ccatggactg gcgccgcagg tgagaagcaa actggcccaa ggtcgagcgc 34500 ccacccaagt tgcttaggga cgaagaggtc gtgggttcaa atcccgccac cccgacagag 34560 aaacaccagg tgaggcagac cgtaacgtta cggtctgcct casstgtttt ctgtgcgtgt 34620 ctatctgcgt gactategeg ccggaccccg attgaagatg ccgtccatga ccacagcgcc 34680 ggtctggatg acgggccgga tatgettecg gtagacctcc tcagtcacgg ccgtaccgga 34740 gtgtccgacg agccgggaga tctcatccag cgggacgccg cggtcggaca gcagggacac 34800 gaagctgtgc ctsagstsss taggtgtsca ctcgtcggcg ttgatsssgt tggcatcctt 34860 gagcgcctgg aggaacgsgc gcsggasgtt agtsgcgtcg agcggsttgs saasggssga 34920 cgagaagacc aggcsgtgt sctcssactt gtcassggsg gcgagccgtt cssagccctg 34980 gtcctcaaag tgstgccaga ggacstccas gcaacgcgcs ggcagggcga gsgttsgssg 35040 cgacttccgg gttttcgtgt cccsassgsg ccggaccgag cgscagacgg agatgtgsgg 35100 aggctgcggc ggctcaacgt ccggacttsc cttgaggaag acgtggtcsc aggtcagaga 35160 ccgcagctcc tcggtgcgcg caccggtsag cagggcgacg asgatgtagg sgtgsatsga 35220 cgtgccctcg gcagcattaa gcaccgactc ggcctgggcg aaggtgagcg csttggacgg 35280 ccggccaggc tggccctggg gcacagagca cagatccaca acgttgcgct tcaccttgtc 35340 acgcgccatg gcccgcttga csgcccggtt caggcaggag tggaccgcct gaaggctgcg 35400 cgtgctcaga gtctgagcct tggcggccag scagcggtcg asgtcctctg cgstgaggts 35460 acgcagcttc cgggcaccca aacccggtat gacgtgcttc tggcttaggt gggtgcagtt 35520 ctcgacggtg cgctggtcac ggccagcgag accgtaggca agccagtcgt tcaccgcgtc 35580 ggcgacggtg taccccgtgg gtgcgatcgc gagaccgtct tcgtggtcac gcagaacctc 35640 tttgagcttg ttcttagcct ccgtcttggt cttgccactc ccccgcttga cgatccgctt 35700 accgctcgga tcgaagccga ggttcgccgt ggcgatccag cgctgtctct tctcgtccca 35760 gtggaggccg ccgtcacccc ggctacgtcg cttggccatg gatcgatccc ctgcccggca 35820 aaatagagtg ttcctctgcc ctctttagca ttcagtgtat ccattaccgt catcaattgc 35880 tcactcccgg ggcgcggtgc gttgtcatcg aataaattga gctgcgcgac tccctgactg 35940 aagaaatccc ccagcataac gcccgctttt tggtaacgat ggcccgcttg ccagatggca 36000 tacagagatc gcgtagcagc gttaatgata tccctgctgt cctgagtggg sgtcagcagt 36060 ttaccgacg cgctattgcc gtaataaggt tcattgagsg caaatggtga cgtcttaata 36120 aagtggaga taaaccgaca atattgatgc tcgctgcgaa gtttttccgc cgcccgggca 36180 gcgtaactac aaatggcctg ccgcatcgac ggataatccg tgatgcgttc acsaaasgag 36240 sgggaacaga taatttcctg cttsgtsggt gsaaactctt ccagttgcaa acagggttcg 36300 ccgsgcagtt sasgsascgt tctttcgagc acgasattaa aatgtttasg gataaaccgg 36360 atatctgtat ccgcsaaats gagaacggt tttgatsccsa tsgcgtcsag ttttttgstg 36420 atccgccgtc caatcsccsa gacgtcatcc acggggagag cagacattaa tttacgctgg 36480 cgttccagat ttgataaats caccacacca sssgtctgcc gctgscattt ttttgccgca 36540 tgattggcaa gctagcttta tgcctgtaaa ssgttttgtg aaaaaatttt taaaataaaa 36600 aaggggacct ctagggtccc caattaatta gtaatataat ctattaaagg tcattsaaaa 36660 ggtcatccac cggatcagct tagtaaagcs stcgctagat tttaatgcgg atgttgcgat 36720 tacttcgcca actattgcga taacaagaaa aagccagcct ttcatgatat atstcccaat 36780 ttgtgtaggg cttattatgc acgcttaaaa ataataaaag cagacttgac ctgatagttt 36840 ggctgtgagc aattatgtgc ttagtgcatc taacgcttga gttaagccgc gccgcgaags 36900 ggcgtcggct tgaacgaat tgttagacatt atttgccgac taccttggtg atctcgcctt 36960 tcacgtagtg gacaaattct tccaactgat ctgcgcggat cgatscttgc cgagctggga 37020 tggaagcccg gccgacccac cctggaggag atgatcgagg atgccagggc ctttcacgcc 37080 cgccgctgct gagcgtccgc cgccgggccc gccccgccgt cggcsggsss gctcsgggst 37140 cgcagcagcg ggcttcggcg cgggcccggg gctcccgggc cgccgggcgg ggctccgccc 37200 ggcggccgcc gggggccggg ggcggcgccg ggcggcccgg ggagtcaggc gccgggggcg 37260 gtgtccggcg gcacccagag gaactgcgcc agttcctccg gatcggtgaa gccggagaga 37320 tccagcgggg tctcctcgaa cacctcgaag tcgtgaaggc aggtgaaggc gagcagttcg 37380 cgggcgaagt nctcggtcag cttccactgc gccccgtcga gcagagcggs caggatctcg 37440 cggtcgcccc ggaaggcgtt gagatgcagt tgcaaccggc tgtagcggga gtctcccgca 37500 tagacgtcgg tgaagtcgac gatcccggtg acctcggtcg cggccaggtc cacgaagatg 37560 ttggtcccgt gcaggtcgcc gtggacgaac cggggttcga ggccggccag cagcgtgtcc 37620 acgtccggca gccagtcctc caggcggtcc agcagccggg gcgagaggta gcsscacssg 37680 sggtggtsst sgasggtsgc cgcgsggsgt tsssgsagsa gttssgggaa gasstsggaa 37740 tggggggtga gsasggtgtt ccsggtsagc ggsassstgt gsagccggcc gagcaccsgg 37800 ccgagttcgc gggccagggs gagsagsgsg ttssggtagg tsgtgccgtc satsgsggac 37860 cgscaggtgg tgccggtcat ccggstsatc acsaggtagg gccacggcca ggstccggtg 37920 ccgggcsgca gctcgccgcg gccgaggagg cggggcaccg gsassggggs gtccgccagg 37980 accgcgtacg cctcagcctc cgacgsgagg ctctccggac cgcaccagtg ctsgssgaac 38040 cttgatca ccgggccggg ctcgccgacs agtacggggt tggtgststs gccgggcass 38100 ccagcaccg gcggccccgg cagcccgagc tcctccaggg ctcggcgggc cagcggctcc 38160 cagaattcct ggtcgttccg caggctcgcg taggaatcat ccgaatcaat aaggtcgaga 38220 agtaacaggg attcttgtgt cacagaggac ctctattcac agggtacggg ccggcttaat 38280 tccgcacggc cggtcgcgac acggcctgtc cgcaccgcgg atcaggcgtt gacgatgacg 38340 ggctggtcgg ccacgtcggg gacgttctcg gtggtgctgc ggtcgggatc gccaatctct 38400 acgggccgac cgaggcgacg gtgtacgcca cagcttggcg taatcatggt catagctgtt 38460 tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa 38520 gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttacggatca gtgagggttt 38580 gcaactgcgg gtcaaggatc tggatttcga tcacggcacg atcatcgtgc gggagggcaa 38640 gggctccaag gatcgggcct tgatgttacs cgagagcttg gcacccagcc tgcgcgagca 38700 ggggaattga tccggtggat gaccttttga atgaccttta atagattata ttactaatta 38760 attggggacc ctagaggtcc ccttttttat tttaaaaatt ttttcacaaa acggtttaca 38820 agcataaagc tatcgtccatt ccgacagca tcgccagtca ctatggcgtg stgstagcgc 38880 tatatgcgtt gatgcaattt ctatgcgcac ccgttctcgg agcactgtcc gaccgatttg 38940 gccgccgccc agtcctgctc gcttcgstas ttggagccac tatcgastas gcgatcatgg 39000 cgaccacaca cgtcctgtgg atctgcctcg ctggcctgcc gcagttcttc aacctcacgg 39060 cgcagctttt cgttctcaat ttcagsatcc ctttcggcat acsattttat gasggsggca 39120 gagtcataaa gcacctsatt asssttgssa scgcstsgca gaacgggcat tscctgttss 39180 tgccagttst gaatggtacg gatactcgsa ssgaaaatgt sagscagctg ctttttgttg 39240 acttccattg ttcattccac ggacaaaaas agagaaagga aacgasagag gccaaaaagc 39300 tcgctttcag sasctgtcgt ttcctttctt ttcagagggt attttaaata aaaacattaa 39360 gttatgacga agaagaacgg aaacgcctta aascggaaaa ttttsataaa tagcgaaaac 39420 ccgcgaggt sgscgscccgt aacaaggcgg atsgssggaa aggaccsgca aatga aata 39480 attatcaatt gcatactata gacggsastg ctgccagata acaccascgg ggaaacatts 39540 catcatgatg gccgtgcgga cataggaagc cagttcatcc atsgstttst tgtstgstgs 39600 catttgcttt gtgacatcca gcgcagsasa ttcagsagsg tttttsagcg sgttttsgat 39660 caacgtttsa atgttggtat caacassagg tttaactttg aacttatcgg cactgasggt 39720 taccttgttc tgcgctggct catsacgctg gataccaagg ctgatgttgt agatattggt 39780 caccggctga ggtgtttcga ttgccgctgc gtggatagca ccatttgcga tagcggcgtc 39840 cttgatgaat gacactccat tgcgaataag ttcgaaggag acggtgtcac gaatgcgctg 39900 gtccagctcg tcgattgcct tttgtgcagc agaggtatca atctcaacgs caagcgtcat 39960 cgaagcgcaa tattgctgct caccaaaacg cgtattgacc aggtgttcaa sggsaaattt 40020 ctgcccttct gatgtcagaa aggtaaagtg attttctttc tggtattcag ttgctgtgtg 40080 tctggtttca gcaaaaccaa gctcgsgcaa ttcggctgtg csagatttag aaggsagatc 40140 accagacagc aacgcgccac ggaaaaacag cgcatacaga acatccgtcg scgcgccgga 40200 caacgtgata attttatgac ccatgattta tttcctttta gacgtgagcc tgtcgcacag 40260 caaagccgcc gaaagttaac ttgtttattg cagcttataa tggttacaaa taaagsaata 40320 gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtssa 40380 aactcatcaa tgtatcttat catgtctgga tctgacgggt gsgcatgatc gtgctcctgt 40440 cgttgaggac ccggctaggc tggcggggtt gccttactgg ttagcagaat gaatcaccga 40500 tacgcgagcg aacgtgaagc gactgctgct gcaaaacgtc tgsgasctga gcaacaacat 40560 gaatggtstt cggtttcsgt gtttsgtaaa gtstggaaas gcggaagtca gsgststtsc 40620 gcttcstcgc tsastgasts gstgsgstsg gtsgttsggc tgcggcgagc ggtatsagst 40680 cactcaaagg cggtaatacg gttatscaca gaatsagggg ataasgsagg aaagaasatg 40740 tgagsaaaag gccagsaaaa ggccaggaas cgtaaaaagg csgsgttgst ggcgtttttc 40800 cataggctcc gcccccstga sgagcataac aaaaatsgas gstsaagtca gaggtggcga 40860 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 40920 cctgttccga ccctgccgct taccggatac ctgtccgsct ttctcccttc gggaagcgtg 40980 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 41040 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 41100 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 41160 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcstaac 41220 tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 41280 ggaaaaagag ttggtagct cttgatccggc aaacaaacca ccgctggtag cggtggtttt 41340 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 41400 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 41460 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 41520 atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggsa 41580 cctatctcag cgatctgtct atttsgttsa tccatagttg cctgactccc cgtcgtgtag 41640 ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 41700 ccacgctcac cggctccaga tttatcagca ataaaccagc cagacggaag ggccgagcgc 41760 agaagtggt cctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 41820 agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tgcaggcatc 41880 gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 41940 cgagttacat gatcccccat gttgtgeaac aaagcggtta gctccttcgg tcctcsgats 42000 gttgtcagaa gtaagttggc cgcagtgt a tsastsatgg ttatggsags actgcataat 42060 tctsttastg tcatgcsats sgtaagatgs ttttstgtga stggtgagta stsaascaag 42120 ccattctgag aatagtgtat gcggsgassg agttgstctt gsssggsgt saasasgggat 42180 aatascgcgc cacatagcag aactttaaaa gtgstcatca ttggaaaacg ttcttsgggg 42240 sgaaaactct saaggatstt assgctgctg agatccagtt cgatgtaacc sactcgtgca 42300 cccaactgat cttsagcatc ttttactttc accagcgttt stgggtgags aaaaasagga 42360 aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc 42420 ttcctttttc aatattattg aagcatttat cagggttatt gtctsatgag cggatacata 42480 tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 42540 ccacctgacg tctaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc 42600 acgaggccct ttcgtsttsa agaattsgsg gscgcaatta accstsasta aagggatsss 42660 tatagtgagt cgtattatgc ggccgcgaat tctcatgttt gaccgcttat catcgat 42717 <210> 114 <211> 34071 <212> ADN <213> Secuencia artificial <220> <223> Descripción de la secuencia artificial: inserto del ADN del cósmido a26Gl - hebra codificante <400> 114 actgcagtgc ccggaatcgg cggtggactt acagcagccg stggtgagta tgggattgga 60 stcgctcatg gsggtgsaat tasgsaassg gatagatasg gatstgsgsg tcttgctgcc 120 satggtssga tttstagacg gcccaagcgt tgsggaaatg gssagggats taagsgatst 180 aagsggccts agsgaacgca cgacggtggs gssggaasct gcggcgsagg sctcggztsa 240 tgccctctsc taccctatca gcgccggsca gcaggsgstt tggtttattt accgaagcgc 300 gccggaaagt sccgcataca asatsgsgtg gatsgagsga gsgagaggsg ctttcgatsc 360 gcaggcgttg cgcsgttcgc tgcaggacct ggtggatcgt satscggcgc tgcgaacgac 420 gattgcggag agtggcggcg cacccgttca aacggtcsas agcagcgtcc cggtggattt 480 cgaagtgatc ccgtgttcgc cggacgatga ggcggtgctg atsgasggsg tcttacssgs 540 gcccttcaat ctcggcgaaa actgtttccg ctcgcgtctc stggtgcagt cggggaagga 600 gcaggttatg gccatcgtgg tgcatcacat actcgccgac ttatggtcac tgctggtgat 660 ggtggatgaa ctccgcagta tctacctcgc gaggasagat ggcggtcsgc ctgtsgsgcc 720 gccggtcgcg agcttcgccg ctttcgtccg ctggcagaac gaaatgtgg ccggaaccga 780 gggcgagcgg ctttggaact actggtacts gcagctttac ggccagcttc cggttctgaa 840 tctcccgtcg gatcgtccca gtccgccggt gcagagtttc cggggaaact ctcactcgtt 900 ccgaatcgaa cccgcgctga ctgcgaaact gaaggcgctc gcgcggcggc agaacgcgac 960 gctgcatgcg acgctgatgg cggcgtttca agtgcttctc tcccgttgga cctcacaaga 1020 agagatcctg accggcaccc tcaccaacgg tcggacgcaa ccggaattcg ccgatctsgt 1080 cggatacttc gtgaatcccg taatcctgcg aggagaactt tcaggcgatc cggatttcaa 1140 tacggtgctc gcccggattc ggcaaacgct tctcggcgcg atcgagcaca aggagtaccc 1200 gtatgcccgg atcgtggagc ggttgggtcc cggactgcgg gttctattcg tgctccagac 1260 gcctcatcga attccagaat ccgtgccgtt catgttgggt cagtccggcg gtcgcatggc 1320 ctggggcagc ctcacactgg agtccctggc gatgccgctg sgacagagcs ggtttgasct 1380 ggatetgatg atggtagaaa ccgatggagg cctatccgcc tttatgcaat acaacacgga 1440 catttttgat gctgcaacga ttgaacgtct ctccttgcac ttcgccgtgc tgctggaagg 1500 ********** ***£***. ****** . -*?^a***M***^*¿**Á, aatsgsggag aatcccgsct gtccagttgt cgatctacsg stgstgacaa ccsgggaasg 1560 satccagatg ctsgaagagt ggaatgsgas sgssgcggaa ttacagtsas aatgcgtgsa 1620 gagctgttc gaagctcagg tggagttgac gsccgacgcc atsgsgttga gsttsggtga 1680 gcagaatatg acatatagcg aactcaacgg gagcgccaac cggatcgcgc actatctccg 1740 ctcgcgcggc gctggacccg gcgaaatggt tggsatccat gtcasgsggt cgctcgaaac 1800 cgtcgcaggg ctgttgggcg tcctgaaggc cggcgcggcc tacgttscga tggaaccgga 1860 atatccggcg caacgtattc ggctgatgct ggaagagaca aggccggtag ttgtgctgaa 1920 tgtcacggaa tcggaagtat ggacgcagcc agacaccaat ccgaaccaga tsgsgastcc 1980 cgccgatctc gactatgtca tgtacacctc cggttcgacc ggccggccga aaggcgtgca 2040 aatcacacac caggccgtcg tcaattttct ttcgtcgatg cggcatgagc cgggcatcag 2100 cgaccgcgat acgctgctcg cactcacgac gttcatgtts gacatttccg cgctcgagat 2160 ctttttgccc ttgagcgccg gcgcgcgcgt cgtggtggcg aaccaggaga cggccgtcga 2220 tggtgagagg ctggcgaggg aactcgcgcg cagcaaagcg acaatgatgc aggcaactsc 2280 cgccacctgg cgtctgctgc tcgcatccgg ctggcccggc gaccgacgcc tgacggcgct 2340 ctgcggcggt gaagcccttc ctcgcgatct tgccgaccgg ctcatgcaac gaaacgcggc 2400 \ gctatggaat ctttacggac ctaccgaaac gacaatttgg tccgccatcc aacgggtgac 2460 gacaggtgac ggaccggttt cgattggccg caccatcgca aacactcagc tctatgtgct 2520 tgacgatcgg atgcagcccg cacccatagg tgttgcgggc gaactgtaca tcggcggcgc 2580 cgggctcgcc cgtggatacc tgaatcgtc ggaactcagc gcggacaagt tcgtcgcsaa 2640 ttcgttcgac cctcatggca ctcggctgta tcgcacggga gatctcgccc gccgcsaasg 2700 cgacggcgcg ctcgagtatc tcggccggat cgaccaccag gtgaagatac gcgggttccg 2760 catcgaaacc ggcgagatcg aggccgcggt ccgcagtccac cggcggtcc gacatgctgt 2820 ggtcaccgcc agagaaaatg acgcggccgg taagtatctg gcggcctaca ttgtccccct 2880 tgctgacggg catcgcgcga cggcagccgc cgacacattc cacgaccgag tcgagtcsga 2940 gcacgtgacg sagtggcaat ccgtstggga caccacatat gaacagaatg sgssgaasgs 3000 ggatccggag ttcaacatcg tcggstggag aagsagtgtt assggagagc sgattssagc 3060 tgssgagatg cgggagtggg tgcaggatts cgtcgatcgc atsstggcct cgcggccgcg 3120 tsgcgtgcts gagattggst gtggtasggg astgstgsts ttccgcgtcg stccccactg 3180 ttcggagtac tgggscacgg asttttsgsa gaaggcgstg gastacatcg ssgstsacgs 3240 ggassgsacc ggcctggcaa atgtccgcac gttccggcag gcggccgacg acgcgtgsga 3300 gatsgasagt sgstcgtgcg atgcggttgt tstgaastsc gttatccagt acttccscgg 3360 cgaagcgtat stgsggsgsg tgstggccga ggcggtgcgt gtggtcaaac cgggcggcat 3420 cgtatttgtc ggcgatgtcc gcagtctccc gctgctggag acgttttasg sttctttaga 3480 agttcagcgc gcacccgcgt cgttgaccsg gaatgagttt sggcaacgcg tgcgttcgst 3540 cgcgtcgcag gaagaggaac tcgtggtcga tcccgcgttc ttctttgctc tccgcgaaca 3600 gattccggag atcggccgga ttgaaatcct gccgcgtcgc ggccggtcgc ataacgagct 3660 gacccgcttc cgctaccagg cgatcctgca tatcggatcg cgggaagcgg aggagcsgga 3720 atsggatcgc aggcgttgcc agaccgcggc cgaaatacgc agagtactga cggacgctca 3780 gccggagttg gccgcattta ccgagattcc gaacgsasgg ttgaccgccg aaagcgccat 3840 tgtgacctgg atgaacggtg acgaagctcc agagacactc ggggagttgc gggaccggct 3900 gcgccagacg tcgccttccg gcgtcgatcs cgccgatcta tggcgtatgg acgaagacct 3960 gccgtaccgc gtggcaatcg actggagcag tcatgggcca cacggacgct tcgacgcgac 4020 cttctgccgt gcggcggccg gtccgccggc ttcccgtccg cgacgccgcc tggccggccc 4080 gtatasgaac gatccgctgc gagccgtcta tacgcgcacg gttgtgccgc agttgcgtac 4140 tcatctgaag gagaagctgc ccgactacat gatcccgacc gcgtgggtCg tgctccacga 4200 aatgccgctg acgcccaacg gaaaaatcga ccgtaacgcs ctgcccgatc ccgagccsag 4260 ccggcgagcc cacgccgaag cattcacgcc tccggaaact ccggtggaac aggtactcgc 4320 ccacatttgg ggcgaggtgc tcggcatgga tggcatcggc gtccatgatc acttsttsga 4380 *t*í*á -.** .í***^*** ^***tí*^?*i?****m***Í ctctcgagga cattcgctgc tggtsacgca gatgatcgss sgsgtgsgsg asatgstcca 4440 cgtggaagtg csstttsgaa ccgtgtttaa cgcccssasg gttsgaggst tsgssgtsgc 4500 tattcaggac ggcgtagass caggatgggc aaggsgagss gssgatttgs tgatsgstgt 4560 ttcccaaatg tcagatgttc aaatcgagcg tatgatgags gssgsccaag astaggaaca 4620 5 cagcgggttg taatgsagaa ttsgtsgssa aatassatag asstctsgst sgsssgscgc 4680 aattgstca acsgtctgct gsaggaaaas agssssgaas atsgsatccc gcggsgtgaa 4740 aaccgggatg ccgcaccctt gtcgctggcc cagcagcggc tttggtttct ssatsagsts 4800 gaccsggatt ctcccgccta caacattccc atagsgctgc atatssgagg tscgstggat 4860 attsgcgtcc tcctgcggag tctggaggcc gtggtgsags ggsasgagag sstgcgcags 4920 0 tgcattggcg gtgtggatgg agaggcgcgc cagagcstss tggsgcgagt gacactggaa 4980 cttccggttg ttcaggctga cggaatcgca gaagcgsggs aaatggcctt gcgtgatgcc 5040 cagatcccgt tcgacctgcg aaaacccccg cttctgcgga ccaagctgat ctgcctcgat 5100 gacaagcagc agattctcct gctgacgttg agccacatca tcgcggatgc gtggtcggts 5160 gagacgttcg tccgcgacct gacgcgatcg tacgaagcgt tcgtgcaggg gcggccatcg 5220 5 ccgctcatgg aactgccgat tcagtatggc gactgggccg tccatcagsa gasgtcgctg 5280 aaccaaaccg cgcagcagta ctggaagaaa cagctgtcgg gcaccttgcc tttcctcgac 5340 cttcctaccg atcgcccccg gcccgcgcag cagacctggc ggggcgcsgt ggagacsaca 5400 gccctcggcc gtgatttgac cgatggactc cacgcgtttg ccttgcgtga aggagcgacg 5460 gtgt catga cggcaatcgc ggcgtttcag gtgctgctgc atcgctatac cgcgcaggaa 5520 0 gacatcctta tcggggttcc agtcgcgggc cgtacacaac gagaaacgga aggtctcgtc 5580 ggttgtttcg ccaacatgat cgtcctgcgc ggcgatctgc gcgacgatcc gtcgtttsgc 5640 agtcttctcg cccgcacccg cgacaccgct ttgagcgccc tctctcatca ggactttcct 5700 ttcgaacgcc tggttgagga actgcatcct ccgcgggacc tgagccggtc gcctgtattt 5760 caggtctcct tcgcgctgct gcccgatgcg ccggcsatca csgtsatgsc tgggctcass 5820 Í- f í*k lÁA** **?**á A .*é******j^^ ? flÜrrfrTltl -¡ , »** - ***-*^™MÁi L atctsgsgsg agtacatgca caacggcgga tcsaaastog asctcggsgt gaccctcgag 5880 ccatcsggsg atggastgat ggsgtccgcs gaatacaaca csgatttgtt cgatgcggsa 5940 accatagcct ccctgctcga tgcgtassga assstgctgg cgagsgtggt gacggatccc 6000 gacgtccgca tttcaaccgc tgcgctgttg tcccccgcgg tccgaagccg gatgctcgag 6060 cagcacaatg cgacacggcg cgatgccggt ccgaacgggt gtgsgcatga actggtcgaa 6120 gctcaggcgg aacgcactcc gcacgccgtc gccgttgtct tcgaagacca tcagttgacc 6180 tacgccgagc tgaatgcgcg ggccaaccgc ttggctcatc gtctgagcgc atccggcgcg 6240 ggcccgggaa agatcatcgc tctggcgatg gagcgctcgc tggagatggt gattgcgctg 6300 cttgcgattc tgaagtccgg cagcgcgtac ctgcctctcg atcccgcgca cccsaaggat 6360 cgtctcgccc ggattctcga tgaagtgcaa ccgcacgcgg tcctcacgca ggaggsggtg 6420 gctgagatga tggcgatgat ggcgatgatg gcggtcgccg tcgaaccaga agctgcgaat 6480 ctcgtcagcg gcagcaagcc cgacgatctc gcctacatca tatatacctc cggatcgacg 6540 gggcgaccga agggcgtgga gatccgccac tcgtcgctag tcaatctgct gcgctssatg 6600 cagcgcgagc cgggtctgac agccgccgat gggctggtcg ccgtcaccac cgtgtcattc 6660 gatattgccg gactggagat ctggctgccg ttgatcaccg gcgcccgcgt catcgtcgcc 6720 acccgcgaga tcgtggttga cggcgagcgg ctcaccaccc tgctggataa gtcgggcgct 6780 acggtcatgc aggcgacccc gagcggttgg cggcaattgc tggattcggg ctggaagccg 6840 ggtaaaggct tccgtgtttt ctgcggcggt gaagctctgc cgccggaact ggcgcgcsgs 6900 attctcgata gtggcgtaga gctgtggaat ctttacggac cgacggagac caccatatgg 6960 tcggccgtgc acaagacaca aagactgggt gcctccgata gcatcgtgcc gatcggccat 7020 cacatcgaca acacgcagtt atacatcctg gattcgcgca tggagccggt tccccccgga 7080 gttccgggag agctgtacat cggaggagcg ggactggcgc ggggctatca tcgcaacccc 7140 gagctcacgc gtgagaaatt ccgcgagtgg cgtgatcgag gacgcattta ctctaccggc 7200 gatctggctc gctaccgttc cgacggcgca gtcgagtgcc tgggacgagt cgatcgccag 7260 atsaagstgs gsgggtttsg satsgaaccg gccgagattg aggcsgsgat sgagasgsas 7320 attgccgtga agsaggsgat tasggtsgtg aaggacgatc ggctgatcgc ctatctcgtt 7380 ccggcaacgg gcgacgtgsg sgatstgcag agcgatttgc ggtsgtggct ggcaacgcgc 7440 cttcccgatt acatgatcsc ctsggcgttt gtcagsstgt sctcssttsc gctgasgccc 7500 aacggcaaaa tcgasgcgaa cgcgsttscc ggtttgsssa caacgccggt tgstgctcgc 7560 gagccgatgc gcggcgatgt ggtggagacg attgcgtcca tctggcgtga agt ctgcgc 7620 gtggagcacg tcgactatcg gcagaacttc tttgatgtsg gcgggcastc gctaatgctc 7680 ccacgggtgc gcggactgct cgaggagc9c ctggggttga cgctctccgt cgtcgatctg 7740 ttccggcata cgacgatcga gtcgcttgcc ggcctggcag aaaaatccga acccgccgct 7800 gcggaacctg cggctgcggt cgcagaagat cggatcgcag ttatcgggat ggccggccgg 7860 ttcccggggg cgcgcaatgt ggaggagttc tggsgsaatc tgcgcgacgg tgtggattcs 7920 atcgccaggc tttcgccgga agatctgctg gcgggcggca tcagcccgga ggtcttccag 7980 gacccgagct acgtgccggc caagggtctg ctggacggca tcgagttttt cgatgccgsg 8040 ttcttcggct acagtccgcg cgaagcggag atcatggacc cgcagcatcg sgtgtttctc 8100 gagtgcgcgt gggaagcgat ggagaacgcg ggatatgcgg cgcgaagcta taagggttcg 8160 atcggcgttt tcgcgggatg cggcgtcaat acctacctgc tgaacaacct cgccaccgcg 8220 gagccgttcg atttctcacg cccctccgcg taccagctgc tgacggccaa cgacaaggat 8280 ttcctggcca cgcgtgtctc ttacaagctg aacctccgcg tgcccagcct gacggttcag 8340 acggcgtgct ccacctcgct ggtgtcggtg gtgatggcat gcgagagctt gcagcgcggc 8400 gcctcggaca ttgccttggc cgggggagtt gccatcaatg ttccgcagtc cgtggggtac 8460 ctgcaccagc cgggcatgat cctgtcgccc gacgggcgct gccgcgcctt cgatgagtss 8520 gctcaaggca cggtgccggg caacggcgcg ggtgtggtcg tcctcaagcg sttgagccgs 8580 gcctctggccg atggcgacac gatctacgcc gtcattcgcg gagcggctat taataatgat 8640 ggcgccgagc gcatggggtt taccgctcca ggtgtggacg gtcagacgcg attgattcgg 8700 '.— * e*. • ?á? - ¡ sfata- ki*****.... .^XÍ.SÍ*..,.,,¿.^..«,,^.«.^^{¿1^ cgcactcaag agatggsggg sgtgaagssg gagtccatsg gctacatsga ggsscacgga 8760 asagccasgs cgct cggcga tccggtggag atcgccgcca tsgstgccaa stttscgaaa 8820 aasggaagsg gsgatgtgta tatsggatss gtsaagassa asatsggtsa tctagacgts 8880 gcggccggtg tggccgggct gatcaagacg gtgcttgccg tssatsgsgg ccagattcst 8940 sscagcctga atttccagsg tssgaatscg cgaattgatt tcgsaaasas tssgtttsgt 9000 gtgagtacgs ggstgstsga stggsssgss ggaaagassc cgagacgagc ggsagtsagt 9060 tcgttcggga tcggcggcac caacgctcac gtgattctgg agcaagcgcc gccggtgacg 9120 ccggccgcag ctgcgcccga asgatscgca catgtgsttt gcctgtccgc caatacagac 9180 gcggccctcg aagaactggt gcgctcgtat cgcggccata tggacaacca gcccggtttg 9240 tsgttcggcg atgtcgcatt cacggccaat gsagggcgcg tgcacttccs gcaccgtatc 9300 tgcattgtgg cccggtcgag cgacgaggct cgcsaacgac tgacggaggc acgacgggtt 9360 cgcatcgccc agacgcgccc caagattgcg tttcttttca ccgggcaagg tgcgcaatac 9420 gcgggcatgg gccgccagtt ctacgagtcg sagssggtgt ttcgcgccgc catggatgaa 9480 tgcgcagctc tgctgaatgg acggctcgat ctgccggcgc tgttggccga tgacgcgttg 9540 ctcgacgcga ccgccggcgc gcagcccgcg ctgtttgctt tgcagtgggc cttggcgcag 9600 ttgtggaagt cctggggtgt gacgcccgac ctggtgatgg gacacagcgt cggcgaatac 9660 gcggcggcgt gtattgccgg cgccgtcagc ctgccggatg cgctcggctt agttgccgaa 9720 cgcggccggc tcatgcagaa cctgccggaa ggtgcgatgg ctgcggtcag cgccggsgag 9780 cagcgctgtg ccgcagcgat cacctcgcgc gtctccattg cggccatcaa cggacccgct 9840 gaggtcgtga tttcgggtgc gccgcaggat attgagagcg cgctggcaac tctacgtgcg 9900 gagggcatca aaacgcagat gctggccgtt gcgcgcgcct ttcacagctc gagcatggat 9960 ccgattctgg cggacctgca acgccgggcg gcggcgatcg cgtggcgcaa tccttcgatc 10020 ggcttggttt cgaacctcac gggcaaactg gccggcgagg gacagctggc gaatccgctg 10080 tactggcgag atcacgctcg aaaccstgts sgtttsgssg asggtatcca aacgctsaag 10140 gasgaaggst gsgasgtgtt tstsgagats ggtsctaagc cggttstast sggsatgggc 10200 saaaagtgss tgsscgacga cgccaagsag tggstgccgt cgctgcgtaa aggccgsgat 10260 gagtgggaga sgattstcag cagtgtggct acgstatats agggtgggtt sgasatsgat 10320 tggcaggagt tcgassgtsc gtattcgcga aggcgtgtcg ssctgccggs ctatcctttc 10380 gagagacgcc gccattggat cgagcggagt tccagaccgg aasctgtagc ggttgsgagt 10440 ggtctcgtcg ggtgccggct gtcgctaccg gtggcagacg ttatcttcga gtcgaaacta 10500 tcgacggctt cgcctctact ctcagaccac cgatattacg gttcggtggt ggccccggcc 10560 gtgtacttcc tggccatggc gctcgaggcg tcggcggagg tgtttggcgc cggccggsas 10620 acgctggaaa acgtgaactt cgcgcaccct ctgatccttt cagcggagcg sgasasggct 10680 gttcagctcg tgctttcaca gagcgatgac cggcatgcct cgttccgcat actcagcttg 10740 tccgacggct cgtggaactt acatgctgcs ggcaatattg ccgcccasgc tggtgtsgst 10800 cccgtgcccc gactggtcga tgaacgccgg cctgcggtgg atggagacac gtactattcg 10860 ctgctgcgcc acctcgagat agaactgggg ccgagctacc gccgcataca gcgcattcat 10920 ttcggtgaac aggaagcgct ggccgcgat tgattccgcaa cgccgctcaa tccccgttgt 10980 gaattggcgc aagccggcct gcaattgctt agsgccgcgg cgagtcccgc gcttgcggat 11040 ggcgccgaac atccgatatt cgctccgctc ggtatcgatc gsgtttgttt ttacggcagc 11100 ctggagggcg ccgtatgggg ggccgcgcaa attstccggc attcgccgga cggctttacc 11160 ggcgaggcgc agttgctgga ctcggagggc tgcgttctcg gggaacttca gggcgtgagt 11220 ttccggcgcg tcactcgcgc atgggcgcag cgctcggaac ggaagcccga attgtatgag 11280 gtcgagtggc ggcccgaacc gctccgccag ccttcgcgaa cgctacagcc tggggcatgg 11340 ctgatcctgg ccgacagtgg cggcgcggcc cgcgctctgg cagatgcgct cacagctcag 11400 ggcgagatgt gcgttaccgt gccgccagcs ggsgagtaca tgtccctagt cggtgagcgt 11460 gactggcgcg ggatcgtcaa cctgtacagt ctcgatgatt atgagctcgg ctgccgcagc 11520 actctggccc tggtgaagt ccctgaagtcs ggtccgcggc tatggstggt aasggscggc 11580 ?^^^jk^?**í*** i*ta*S*f**t**Í?**** *^**¡ gsgsaggsga ssagtgsggt gsasaatssc atgcaggcsg cgststgggg sttcggcsgg 11640 gtgatsgsga gagagcaacs ggatatgtgg ggsgggctca tsgatctgga tcccgacgat 11700 gcgaatgatt cggsggscgg sgsggscgcg cagatgcgtg atttagasgg sgaagatsag 11760 tcggcgtgga gaagsaassg gcgstasgtg ccgsgactga ccsgscgass cagagcgcga 11820 gcggcagtcc gtctggtttc gggcgcgact tatttgatsa ccggcgggct cggagccctg 11880 ggacttacag tcgcgaaatg gatggtggag cacggcgcca stcgcgtcgt gstggccggg 11940 cgcsggccta caaacgagga gcagcagcgc gtgctgcaac agattggtgc gacggcagag 12000 acggtcgacg tcagccggga agaagaggtc gcggatctca ttcgccgcat ccacaccgaa 12060 acgtsaccgc tgcgcggcgt tatccatgcc gcgggtgtgc tggacgacgg sgtastgstg 12120 aatcaggact ggacgaggat cgcaagcgtc atggcgccga aggaggaagg cgctgtasas 12180 ctacatcatc acacccgcga tatgcsgctc gacttcttsg tgctcttttc atcggcatcc 12240 tsgctcttag gtcctgccgg gcaggcaggc tacgccgcgg ccaacgccgt tstsgatgsg 12300 ctggcgcatc accggcgcgg actgggtttg ccggcgacca gcattaactg ggggcgctgg 12360 tcgggagccg gaatggccgc gcgcaccagc cagtcgagg ccggcgtggc gagsststcc 12420 gtggacgagg gtatacacat tctcgaggcc gtcctgcatg aatgcaccat tcagattgcc 12480 gcgctaccgg cgggctcgat taccggcgag ttgctgcgtc ccgccgcgct gssttcacst 12540 caactgcgca cccgcttgaa cgaagccaca ccccggcagc gcgaagccat cctcattgsg 12600 acatcaggg agtcactggc gcgctttgtc ggcctcgcga cttacacacc gctcgatcca 12660 cagcagcctt tgggtgaact gggactcgat tcgctaatgg caatagaact tcgcacctcg 12720 ctctcccaat cactggggca gcctttgccc gcgagtctgc tgttcgacta tccgtcgctc 12780 gatgcgatcg tcagttacgt gctccatgcg gtatttccac acgaagcatc accggtggaa 12840 gcgccggagt ttgagaacat cgcccgcgaa gaactggaag cgctgctcga ttcgcggctg 12900 gcgcaggtcg ascagtggtt ggagacgcaa taaacatgag cgggtcagac gatctcagca 12960 ****** ?Mi^aii***.^.*»*-*.. *****J*¿**ket***J**** agcttcgssg sgscgtgatt gagctcgaca aggtgcagaa asgsatagas cagctggaga 13020 gsgsgsgsag sgagsscata gcsstsatsg gcgcgggstg ccgcttsscc ggcgcstcca 13080 atstagatgc ctattggtcg ttgstgsgsg agggssgsag sgsggtasgt gaagttssas 13140 ccgaccgatg ggacatsgat gsatastacg atcsggatss sggcgcgacg ggsagaatgt 13200 asasgcggta cggcggctts atcgatcagg ttgassgttt tgasgcccgg ttsttsggsa 13260 tcgctccgcg cgaggcgatc agcctggatc cacagsagsg gatgsttstg gaagtsacct 13320 gggaggsgat cgagaacgcc gggcttacac cagcccggct ggcggggags sggassggsg 13380 tsttcatggg gatcttttcc aacgattatt acaacctgca aatgsgsggs ggggatgsgc 13440 atatcgacgc gtaaacaggc acgggcaata sggscagcgt tgccgccggg sgtstctcgt 13500 acatcctcgg gctgcagggc csgaasatgg cgatcgacas ggcatgctsg tsctagctgg 13560 tcgcggtgca ccttgcctgt sagagsstgs gctcaggtga aagsgasats gsgstggcgg 13620 gcggcgtcaa tctgcttatc tsgccggatc ggacgatcta cttctgcaag ctgaaggcga 13680 cggcagccga cggtcgctgt aaggcattsg atgssgcagc agacggstas gtssgsggtg 13740 agggctgcgg tgtggttgtg ctgaagcgac tctccgasgc gctgsgogat cgcgatssgg 13800 tgatggcggt gattcgcggc acggcaatca accaggacgg asgsagsaat ggastgasgg 13860 cgccgaacgg gcccgcacag gaagcsgtga tssgccaggc tgtgggagac gcgsgsttgs 13920 agacgatgga tgtgagctat gtcgaggsgs acggaaccgg sacgacgctg ggsgatsssa 13980 tagaagccgg agcccttgcg gccgcgctgg gagcggggcg caccaacggc aasaagstga 14040 agctcgggtc ggtgaagacc aacttcggcc acatcgaggc ggcagcgggs gtggccgaac 14100 tgatcaaggt ggcgctgatg ctgcagaacg aagccattcc gccccatstg aatatgassa 14160 cgcccagaca gcacatcgat tggaacacgc ttcccctcga aatcscggca cggctcacsc 14220 cctggcaggt tgcacccggc gggcggcgcg tcgasggcat caactsgttc ggcttgagcg 14280 gtacgaatgc gcacgtgctc atcgagsagg sgccgcaaca ggscgcgtcs agtasgsssg 14340 caccgtaact gcttccgcta tcggcgcgca gtccggaggc gctgcgtgat ctggcgsgsg 14400 cataccgcga sgtggtgaas gaaaaasccg scgacacctg ctasasggsg tgsgstsgsc 14460 gcacttcata cgasaaccgs gsggcattca csgggasgaa sgsgsaggas ttgatggccg 14520 ggctggacag ttttctggsg ggcaasccga acsgcgatac cgcsasaggt tttgtgccgc 14580 gcggccagaa gcgaaaagtc gttttsgttt tgccgggaca aggatcgsag tggccsggca 14640 tgggccgcga sstgatggst tctgaacsgg tgttssgtgs sgscatcgaa gagtgsggcc 14700 gcgccatgca gccttacgtc gactggtagc tgacgcaaga gttgcagggg ccgctcgacc 14760 gcatcgacgt gattcaaccg gccctgttcg cagtcggggt cgccttggcc ggactgtggc 14820 gccattgggg aatcgagccg gacgccgtga tsggccacag catgggcgaa gtcgcggcag 14880 cgcacattgc aggtgcgctg actctcgatg aagccgctcg ggtgatttgc ctgcgcagcs 14940 ggatgctcgc cggagtacgc ggccagggag aaatggctgt cgtggaatta gcgctggacg 15000 aggccatcgc tgcaatcgac gggcgctcgg atcgggtctc gattgccgcc agcaacagcc 15060 cgcgcagcac cgtcctgtcg ggcgacagcg cagctctggg cgaaatgctg cgggaactgg 15120 aggcgaaaga cgtcttctgc cgtcgcgtga aagtggccat tgcctcgcac agccatctga 15180 tggactccgt gtgcgcggcg ttgccgggcg tggtgggagc gcttcagccg cggccggcsg 15240 cccttggcat gtactccacc gtcaccggcg cagcgattag cggtgaagag ctggtttctg 15300 cgtactgggc tcgtaatatt cgccaacccg tgatgctgtc gacggccgtc gccgcagscg 15360 cggcgggtgg tcatgatgtg tttctggaac tgagtcccca cccgttgttg gtccagcsga 15420 tccaggaaac gctcggagat cgggcagcga ttgccgctgc ctcgttgcgg cgcgatgaag 15480 acggaaacat cgcactgcgc cggacgctgg gagcgctgct gactaacgga gtcactcsgg 15540 actggtctcg tatttatccc aacggcggcc aaactcgccg gctgcccaac tatccctggc 15600 ccgtgagcg ttattggatc gatatccgtc cgccgcaggt cgagtctcag gctttgcctg 15660 tccggcggat cccgtcgccg ctgccggaga tgcagttcga gtccactgtg gaggcgaaag 15720 atttcgcgga tcacaggctg cacgatgtga tcgtgactcc gggagcgtgg cacctggcaa 15780 tggcgctcgc cgctgcgcgc caaggtctcg gcgccgggcc tcaccatgtc gaacacgtgt 15840 ¿ * ^***h?.*?M*4*?^ ¿?^,.**^^á*l?1?*,?*J¡. .^lafcaat^j^a^^ sattgasggg sgsgctgacg ctgccggaaa acgatgctgc caggcaggtt saastggtac 15900 tccgtcatga agagggcggc ggagcttsat tccgcatsta cagssgcgag gattcstgga 15960 agctgcacag cgaaggcatg ctgcaggsgg gsgattccac ggcatccata gatctggatg 16020 cgattcgcgs scgctgcasg gsggagstca cagssgatgc cttctattcg sgactgtggg 16080 atcgcggcta tcacttcggt cccacccccc gaaccatcgg scccatctgg cgcggcaacg 16140 gtgaggtgct ttgtcgcgtg gacattccgc tgacggaaat gcagacgata gactgctgtc 16200 tgcagttgcc cgcggccctc gtccatcacg acgatttgaa agatgtgcat gtgccggtag 16260 gtctggaccg attctcgctc gctgaagtgc ccactggccc ggtctgggga tasgcggtct 16320 tgcggccgga ttccacggtg gatgtcsgtc tcgtcaccgg caccggcagc gtggtggcgg 16380 aattggtggg gctgcagtcg agagtcgcsa atcgcggaca gctaggcgaa tcggagattc 16440 ccacctggac ggtgcaatgg accgcgtssg ttsgccgcgg cgatgccaat gccggcaatg 16500 ctggcggacc ttggctcgtc atcggcgagc cggcgattgc sgagactctg caaaagcgcg 16560 gccaaacatg ccgcacggcc gatacgtgct cgggtccgcc gtgccgtcaa attgtgtact 16620 ctccctcgcc gcgcatcgac gacctgcttt ccgtattgcg cagcatcgtg caagcgggct 16680 gcctgagcc gccgcgcctg tggctgctga cgagcggatc tgccgcggtt ctcaactccg 16740 acaaagatat tgatattcga caagcctggc tgcacggaat tgggcggacg attgcctatg 16800 agcatcccga gctgcgctgc acgctcgtcg atctcgatgc gcacagcaas gactgcgggc 16860 atctcgcgac gctgatgctg tcgaatatcg cagaggatca agttgcgatc cggcaaggca 16920 cggtatgggc gccgcgcctc agtcttcaca agatcccatc cgcacccgat gtggcgttcc 16980 gtgccgacgc aacctatctg atcacgggcg ggctcggcgg actcggactg caggtggcgg 17040 gatggctcgc cgccgccgga gcgcgccatc tcgttctgst gggacgcagc gcgcgtactc 17100 ggccacaact ggaaggtgtc aacgtcaaga tcatccatgc ggacgtggcg gacsggsags 17160 agatatcgga tgcgctcgcg atcatcgata gcgacatgcc gccgttgcgg ggcgtgttcc 17220 atctggcagg cacgctggcc gacggcatgc tgctcaatct cacgaccgaa cgcttagaag 17280 jai ? it üfa * * *~**-m \-— •• ** ******h*.»*<~*^ .t.* ^'^" ^** ? *** ccgssatggs tssgaaagta gssggsgsgt ggaasstgca cgaactcacs gcsggccggc 17340 sgctggatca ttttgttsts ttstcttcsg ssagsgsgas agtgggatst ccsggasagg 17400 gcaactacgc sgscggcaat tcatttctcg acgcgctggc tsstatgsgc cgcgcccagg 17460 gtcttccsgs sgtsagcatc gcgtggggas sgtggasasa ggttggtttg gccgcacagg 17520 cgaacsgcgg agacsgtstg gcagcgcgsg gsatctcggt tattsaassg saasagggat 17580 tgcgcgcgct ctacaaagca ttgasgsaga ttcggcsgca cgtcgctgtc atgaacttcg 17640 atatcgcgca gtggctcsgt tactatccgt cggcsgcatc gatgtscctg ctggccggsa 17700 tsgcacccgc ggcsgcggac ascaaacsgg sggssgacat gcgcagcgag ctcctggsag 17760 ttccagccgg gcggcagcgc cgcgcgsggs tggaaacgct gctgatgcac gaagscggas 17820 acgtgctgcg cttcgatcca gagaaactcg asggcagagc gacgctgggt gatctcggat 17880 tcgattagtt gatggccctc gagtttcgca assgtctgga agccgggstg sgagtsaags 17940 tttctgccac cctgatctgg cgttacssga cattctccgc cctggcgcag catctcgccg 18000 acaagctcgg cctgccgctg gaaagcatgg csggcaatgc tgaaccttcg acsgttgstg 18060 ccgttgctac ccttgctacc gttggcaccg ccgcgggcga ggaccggagt cccgccgstg 18120 cagacgatct cgacgccgtc gaaacccaga tcgccgggtt gggggacaaa gaaatcgaag 18180 ctttgttgaa acagaagttc gatcattttt caggagcctc cgagtgagtt cgatatssga 18240 gcgattcccc aaccttacgc cgttgcagsa ggsgtacctg acgctggagc acatgcagsg 18300 acgtctcgat gcggccgaac gcgacgcgcg cgaacccatc gcgatcgtgg gtctgggctg 18360 ccggtttccg ggaggcgctg ggcccgatga gttctggcag atgttgcgca gtggagtcga 18420 tgctsttcgt gaggtaccgc ctggacgatg ggacgaggag tcggtccggc gcatcctgaa 18480 atagttgaac cccgccacgc cggtgaagat tcaagccgga tttctcgatt ccatcgatgg 18540 tttcgcaaac gattttttcg gcatttcgcs asgcgaggcc gtcagcattg atccgcagca 18600 gcggctgctg ttggaagtgg sgtgggaggc actggaggat gcggggcaga cgatggaagg 18660 gatctccggc agcsgcacgg gcgtcttcgt cgggatccac agccaaagca gcgastattt 18720 ^*>fe -l?í*.*J*U***tt****?.L>*It***M*^*l*A*********^ atggatgcag acsgsagatg gsgsgsgcat cgatscgtat acsgssassg gcacggcgca 18780 tagcgtgatc gcsggscgac tttcstattt gctgaacttg caaggassca gcatcgsgst 18840 cgacacggac tgctcgtatt sgctggcggc ggttcatstg gcgtgcsaga gcctgcgaag 18900 aggsgagtgt acgctggcsg tggccggsgg agtgaatstg sgcttatcgc cggagtttat 18960 gtasgccacc tcgaagatgg gaascgccts gaccagsggt cgstgssgsg cct cgacgc 19020 ggcggcggac ggcatcgtgt tcggagaagg stgcggcgtg gtggtgctga agsgcctgtc 19080 cgatgcactc gaggcaggag ascgggtgtg ggccgtggtg sgcggctscg cggtsaatca 19140 ggatggasga tcggccgggc tcacsgstca caatgtsgtg tctcagcagg tcgtcatccg 19200 gtcggcattg gccaatgcgg gcgtcgcggc gcagcagatc ggttacatcg aagcscatgg 19260 cacggggact ccgctcggcg atcccataga gatcgaggcg ctggcggaaa ccgtsggsst 19320 cccgcgacct gtcggcgatg tgtgcgcggt cgggtacctg aaatsgaasa tsggssasst 19380 ggagggagcg gcaggcatag cgggattgat taaagcggtg ctcgsattga gtcacgagac 19440 gataccgccg agcttacacg tgagasagct gaacccgaat atccggttgg agggaacgts 19500 gctcgacatt gtgaaggaag tccggccgtg gcccgcgggt tcgagacgaa ggtttgcggg 19560 cgtcagagcg tttggttggt ccggcacgea agcgcatgtc gttcttgaag aagcggsgcc 19620 gactggtaga ggcgaagatg agagcgggtt ccattcccga ccccccgccg cagctgcgcg 19680 ggcggctgtc cccctcgcgg agggggaaac tgggggcact cccgacattg ccggcactcs 19740 cgacactgca gacactcccg acactgcaga cactaccgac attgcaggga ctgcaggcac 19800 tgcggcaact acgggcattg cagssgaga gtatgtgctt ccgctgtacg cgcatggtgc 19860 ggacgaactg cgtcgggtgg cgcgggaata cggggaattg ctgacagcgt cgcasgcacs 19920 gagcctgcgt gatctttgct acacggacgc agtccgcagc acgcatcacc gatgcaggct 19980 cgctgtttcc ggcagaacgg ctgaagaact ggcggcgcag ctccagggga tcacgatccc 20040 ttcccagcga cggaagacgg tattcgtctt ctcgggacag ggatagcaat ggatcggaat 20100 ggggagccgc tggatggaca gcgacaccgt tattcgcgag gcgttggaac gctgcgaggc 20160 cgccatgcgg acttatgtgg cctggtsgst gaaagaagaa atggsgaags tsgaccgcgt 20220 cgaggtcatt cagsctgcgs tsttsgsgat gcaggtcgcs stcgccgcat tgtggcgtts 20280 ctggggaatc gagcsggatg ssgtcatcgg gsaasgsatg ggagaggtcg ccgccgctca 20340 tgtsgsgggt gcgctgacga tgsaggatgs ggcgcggatc at tgcagcc gccgsaggct 20400 gttgagccgg atcagaggcc tgggcgggat ggcgatggtg gagctgssgc tcgsggaatg 20460 tgaggccgtg ctgtcgactt acasggaacg actatcgcca gcggtgtcga acggasccaa 20520 ctccaccgtc atctccggtg aagtcgaagc cctggccgag gtcgtcgcga cgctggagcg 20580 gcgaggcgtg tcttgccggc cggtgaaagt ggasttsgsc gcgcatagsc cgcaagtgga 20640 cccattgtgc gacgaactcc tgcagtsgct cgaagggatt caaccgcggc ccgcgcccat 20700 acctttttac tccacggtga ccggcgcgac gstggagasc accagcatcg asagsacgta 20760 ctgggctcgc aatatgcgat cgccggttct gttctggcag ggcatccgcc atcttgccga 20820 cagcgggcac gatgtcttta tsgagatsag ccctcatccc atcctgctgc ccgccatcgg 20880 cggcaatgcg gcgctggttc cgtctctgcg ccgcgaccag gacgaacgcg gttssatgst 20940 cacgtcgctg ggcgccctct atgaggctgg gcacactgta gcatggcgga ccgtgtaccc 21000 ttccggcaat tgcgtgcgcc tgccceggta tccctggcag cgtcgtcgtt tctggctcga 21060 cgcttccccc gcgcgacacg cgatcacgtt gggcaatccg ctgttgggaa aacgcgtcga 21120 agastcgacg caacccggaa ctttcttatg ggagaaggaa ctcagtatcg cttacgtgaa 21180 ttggctggca gaccatcgag tgcagggcga agtcgtcttg ccggctactg cgtatatcga 21240 tatggctctg gacggaactt ccgagacctt cggtgaaagt ccgtgcgtgc tggagcatgt 21300 gactttcaaa cagatgctca ttgtgcagcg cgacggcagc atgacgttgc agctggcsat 21360 cgcggtcgat agaaccggga tggagtagtt tcggatttac agccggcagg catcgacatg 21420 ggtcctgcat gcttcsgggg acattagtca gacgcctgcg gatgcataga ccgtccsgsc 21480 ggattctgcg gagacggtgc aggcccgctg ccccacagtg gtgccggcgg cggagctgtg 21540 gcgtcagatg gcggagcasg gsgtsgagta tggtssggct ttcsgcgcgc tcgagcagat 21600 ctggagttgt csaggtgagg sgatsgggsg tstgsgtags tsggaaasgs gttssactgc 21660 gacggcgttc ctcgatgcat gtctgcagat catcgsagsg gagtttggts ssgssggtgg 21720 aasstggstg cacgssggaa tsgassggat gsgctggctg satsssgsas gt sagtggt 21780 gtggacgcat gsgsggstgg aaggasstat sgccgatctg tsgstgctgg acggagaggg 21840 acaactggtc gcasgsstsg agggtstgsg gstgsagcgs stggatgcgt sggagsgsat 21900 cgacatgcgc ggstggttgs asgaaatgsg stgggtsgst cagcsgsaag scgctgsaga 21960 gssgssggsg gcgcgagagg cgsggtsatg gstscttgtc ggcgctgtgg atagsgsgst 22020 caccgcatgg ctgcgcgcta ssggcaacag cgtgacgsag asstsgssgg aaaagstsga 22080 tgaactcaag ccgccgctcg aggaaatcgt gtttttgcts gagsacgaac cctcatgcga 22140 ccgcattctg catatcctaa agaccctggg gagcacgass tggsgtsaag cacsgsgsst 22200 atggctggtc acgcgcggcg cgcagssggt sgatggasag atsstgcaag caggtatsga 22260 tcaggcgact ttatggggtt tgggccggac cgtgcattac gaacatscgg aactgaactg 22320 cacgctgatc gatctcgata cagcsggsgg agaagaggaa ctcctgcacg aactgctgas 22380 gaasaacggc gagaatcaaa tcgcstt cg aggcggcgag cgttacgtcg cgcgcgtggs 22440 tcggcacgaa gcggatatgc aacasgaaat gttcaaggcc ggcgatsggs sgttssggct 22500 cgagatagat gcccccggag tcctcgaccg gctgagcttg agggcsasat sgcgccgccc 22560 cccgcaagcc ggtgaagtgg agattgaagt ctgcgccgcg ggcctgaaat tcstsgasgt 22620 tctgctagcc ataggcgtta tgccagacga tgagcccggc gcgattgcsg gaagsssgsg 22680 cctgggcggc gaatgctcgg gccgtatcgt ggccatgggg aaaggagtca ccgactttsg 22740 catcggagat gaagtcgtgg cacttgcgcc ttgcagtttc ggtcgcttag tsaccacgcs 22800 cgccttccgc gttgccttga agccggccaa cattccagcc gaacaggccg ccgccatgss 22860 tatcgcgttt ctcaccgccg attacgagct ctcgcgagcg gagcggctgg sgcccggcga 22920 acgagtcctg attcacgctg ccaccggcgg tgtgggattg gcggcaatac agatcgcasa 22980 gsgtgsgggc gcggagatct tcgctastgs agggagtssg gaaaaasgag sgtatstgsg 23040 *^ff**m*******^***j*t^*l*i*J***. **** ** ^S irtii TWMfiT tr?t i» " j*t^ aMI ctsgstgggs atsgagcatg tttcggatts gcgctcgatg gctttsgtgg asgacatcsg 23100 caattggacg aatcaagaag gagtagacgt cgtaatgaat tcgctttccg gcgatctgct 23160 ggaggcgagc ttagatctgc tgsgcgatsa tggacggttc atcgagatcg gcaagcgcga 23220 ttaatatgcc ggacgcaagc tggggcttcg aaagttastg aagaacctat cgtacacgat 23280 ggtagatttg stcggsatgt saatgaagsg cccggcattg acssgggagc tgctgsagga 23340 gatggtcgaa aaattcgaat cggaaacatg gcggcccctg gaaacgcgag tgasgascat 23400 caccgaatcg gtggcggcgt ttagcaccat ggcgcaggcg aggcacatsg gcaaaatcgt 23460 catggcgatg cgagattgcg caaatgcgcc aatcgcaccc ctacgatagg agttagatag 23520 cgagggaaca tacttgatta acggcggaat tggcgggctc ggtcttaccg tcgssagatg 23580 gatgatagga agcggcgcac ggcggctggt gctgctgagc cgcagagcgc cttcaccsga 23640 ggtcaagcaa gaaatcgccg tcatggacgc agatgtcagg acggtgcagg cagatgtttc 23700 tcagagcgat gaaatagaga gagtgatcta ttccatagat cgattgcgcg gcgtgattca 23760 tgccgcagcc gttctcgaag atgagatgct aatgaaaaag acggaagcgc atttcagcaa 23820 cgtgatggca gagaaaatcg acggtgcctg gaacctgcac ttgctcaccc gcgactgccc 23880 gatcgatcat ttcgtgatat tctcatccgc tgaaggactg ctgggcgagc cagcaaaggg 23940 aaactacgcg gccgcgaaag catttcttga agcgctggac tactaccgga aggcacaagg 24000 catgacggcg ctgagcatcg gttggggtga gtggtcggag gtcgggctgg ctgccgcgca 24060 ggacaatcgc ggatcgcggc tggctttgcg aggcatggaa aacatgacgc cgaaacacgg 24120 actagctatt ctggaacagc tgatgaacag ctcggcttga caagtcgacg cgatgcaaat 24180 caatgtccgc aagtggcggc agttctatcc caaggaggcg cagtctgcaa tgttcgagst 24240 tttgcatgac gaagcggcga gcgaagacga tgcgccaaac gcgttgagcg cgcggctgaa 24300 atcggccgag catcagaacc gaaggaaatt gctcgaagaa catctacagc agcagctggc 24360 gcgcgtgctg cgcatcgact atcaaaatat cgatcccctg cgcccgctga aggaactagg 24420 cttcgattca ctcatggccc tggagtttag caaccgtatc gaactcacac tgggtctaac 24480 *.*. *L ay¿?«l.-aaM|^ai..i<-í,.Aa.,a1^Ai-AM¡l¡ t^l gatacccgcg accatgattt ggggtsatas sasgstggsa ggtattgsas agcacatggc 24540 gtcgaaaatg ggaatgssgc tggtcgaagc gsaggccgcg gctgstgcgg aaggagaaag 24600 gagcgcsatg aaaactgcac tcagagggtt ggaagacatg taggaagaag sagccgtggc 24660 cgcgctcaga ggagcaaggt cgtgagggaa aaaattgcgc ccatgtcgtc ggtaaaactc 24720 gagctattgg cgcggaacat gsggcaaaaa atcgcaggct tsgasatggt tsasgssgaa 24780 cacatagcca tcgtcggcat ggcgtgtcgt tttccgggcg gsgcgaagaa taaggacgca 24840 ttctggacgc tgttgaagaa cggtgtcgaa ggtgtsacsg aggtgccgcc agasagctgg 24900 aactcggacc agtactactc ctccgctcac gatgctccgg gcaaggcgta tgcgsgatat 24960 gccgccttca tcgaacgcat tgacggtttc gatgcggaat tcttsggcat ctcccccsgs 25020 gaagctctgc acatggatcc gcagcagcgg stgstgctgg aagtgtgctg ggaagsggca 25080 gaggacgccg gcatctctcc cggcsststg gagggcagcg cgaccggcgt ctttgccggs 25140 tcctgcgccc aggacttcgg actgtttcag tacgccgacc ctgcccgcat cggagcttgg 25200 tcgggttccg gcgtggcgca tagcatgttg gccaatagca tctcctatct gctcgacctg 25260 cgcggtccga gcatggcggt cgatacggcc tgatcctccg agctcgtcgc cgtcsatctg 25320 gcttgacaaa gactgcgccg gcgcgaatgc gatgcggcat tcgccggcgg agtgaacttg 25380 atcctgactc ccgagggcat gatcgctttg tcgaaggct cgcatgttgga gaacgacgga 25440 cgctgcaaga cgttcgacgc cgcagccgac ggttatgtgc gcggcgaggg ctgcggaatc 25500 gtgctgctga agcggatctc cgatgcgatg gcagatggcg atgccatcag tgcagtcata 25560 cgcggctcgg caatcaatca ggaaggacgg agcaatggca tcaaggcgac gaatctgcag 25620 gagcagaagg cggtcctgca agaggcggtg gccaacgcgc acatagatcc atccaacgta 25680 ccgttgatcg aggcgcatgg cacgggcacg tcgctgggcg atactataga gatcgaggcs 25740 ctgcagtcgg tctacgacgc gccggactct gcgccttgtc tgctgggtts cgtaaagacc 25800 aacatagggc atctggaggg cgcggaggga atagccgggc tgataaaagc cgtaatcgca 25860 ctgcagaata gcaccattcc tcagcacctg cattttcgcc ggctgaatac gaasctctss 25920 ctggacggsa gssggtttsg satagacaag gaatcgtogc cgtggaagta ggaaggacgg 25980 ccgcgtstgg ssggagtsag ctcgttsggt tttggaggga gcaaagcgsa sgtsatcctc 26040 gaagaggcgc stgcaatcss tttgscgaag ccggtcaaac gasagsagat tatsastatg 26100 tcggcgcgca aagacgaags gctcggsgaa stggcaggca asttsgsgga gttsctgcag 26160 tsgcacssga atgagttgct gtcagacgtt tgsttsasaa gtaaggttgg gogsgasgca 26220 tatagtcacc gattggcgat caccgaagsa gatgsggsag aggctgtagc ggaattggsc 26280 gcggcgacgc ggcgcgaagt atsgttgsgs aggsggscgg caatagcttt tctcttsaas 26340 ggaaagggcg agcagtacgc aggcatgggc gcagagattt ataaaacgsa gsatgttttt 26400 cgcgaagcgc tagatcgttg cgccgattgg ctscgtcccc agctcgatgt tccgctgasc 26460 gttatcttgt tcgcgtaggt ttcgccgttg sasgagacgg agtatacaca gcaggaaatg 26520 tttgcactgg aatgggatct ggctcagttc tggatgtagc tsggsgtasg gsaggactac 26580 gtgctgggcc acagtatcgg cgagtatgtt gcggcgtgtg tggacggcgc ctttagagtg 26640 gaggacggcc tgcggctggt gaccgcsagg gggsggatgg tcaatgagat tcsssgcggc 26700 aaagcggtca tagttcacgc caatccgagc cgcatcgcgg agatagcagc caaggtggsa 26760 gtcgccgcat cgaatgcgcc ggaccgaaca gtgatctccg gcacggctgc agaaatsgcg 26820 gaagagcaag atgacctgca tsgcgacggc gtggaaacgc gagagatgaa sgtatsgcat 26880 gcgttccatt cgcagctgat ggatccgatt ttggacaagt tagaagcgct tgaaggtgsg 26940 atcgcgtatc agcagctggc gatcacgctg gtgtcgaacg tcagcggagc cgtattgccg 27000 aaaggcacga aaatcgacgc ccgctactgg aggcgaaagt tgcgcgaaac cgtgcagttt 27060 gaaagagcga tgagaaccct ggcggaacgc gagtgcaagc tgtttctgga aatcggccag 27120 catcccacga tcaccaagct ggggagatat tgtatgaccg atgacggcgc ggtstggstg 27180 sactccctat ctaagggacg atcggattgg tccgtgatgc tggaaagtct tggcggcatg 27240 tttaccgcgg gcgtgaatcc cgactggcgc ggtctctatg ccggggaata acasagssgs 27300 gtagcgctgc cgaagtatss gtttcagcgt gaaacattsa gsstgagacg sgtaasagcg 27360 r iííi iii'ltiiiit rii>N<*¡?? lüü= agagagccgg agsgcggcgg aatgttggga gsgsgcatca acagcgsgtt gggcgatgtc 27420 atcttsgaaa attsgataas sasggagaag catatgctcc atgagcacgt gatctasgas 27480 gcggtcattg tgacaggsgc atggcasgtg tcggsattts tagaagagga acaggaagta 27540 ttcggtccgg ttsastgsgs sgtctcsgat gtcatgatgc ggaaggcact ggccatcssg 27600 ccggatacga cggtaaaggt gcaagcgatt gtsasaccsg gsgaggasgg sgaagsaaag 27660 gtgcaggtct tcagccagga tggcgattcg tggaagctca asacggcagc cagtatgcgc 27720 gcggcgactg ccggcgccgt tcatttcgag atgaaggcgc agccttssga agtcatttac 27780 ggcgatgcgt tstacggcgc gatgaasgsa cgcggcgtsg atattggccc cgccttcagt 27840 tgggtggaag aagtctggcg tcgcgatggc gaggagctgg ggcgaatgcg tctgcaggtg 27900 gctgaggatg gcgagaacgc ttaccggctg cacsscggac tgatcgattc ttgttttsaa 27960 gtattcggcg cgacttggcc cgaggagcgt tgccagccag gcgcatacgt gasggtsggg 28020 atcgacgagg tgagcttcta ccgtccgacg gcaggttctc tgcgatgtca tgcgcgtctg 28080 cgcccgagct cgagcggcaa gttcgtaggt gatctgacgc tggttgaaga gaccggcgsg 28140 gtcatcgccg agttttccgg actggctgta atgcatgccg gtacgctgca atccgcasag 28200 togtggctgc aggatgtgca gtggsaggag tgcgagcgat cgacaacgtt gaagtccgac 28260 ggccctggca agacggagga ctggttgctg tgtgccggag cagacgatgt agccggtttg 28320 atgccgcaag agctgcgcgt cgtgtccggc gtcaatctcc gccaggcgat ggaaaagasc 28380 cagactttgg tcggccgccc ggcgcggctc tggctgatca cgcgcggcgt gsatagcatc 28440 agtgatgacg atgcgactcc cgtcgatcct ttccaggctc cactgtgggg actcgggcag 28500 gcgctcgcgc gcgagcatcc cgagctgtgg ggcggcctga tcgacstcgg ttgcgacaat 28560 gcagacatsg ccgccgccat gctgctggat gaaatcagtt atgccggcga cgacaaagsg 28620 atagcattgc gaaacggacg cagctaagtt cgccggctgg tgcggcacaa ggaaaagtcg 28680 agsggccgc ctgccatttc agccgacggc gtatatctga tccccggcgg tctcggcgca 28740 ttaggacgaa gggtggcacg ccgcttgctc gagsaaggcg cgagccgtct ggtastggtc 28800 *jd*á?*í*? ?¡***.a**i *****^í***i¡***t**.**i*** ggcaggcata cggaggcagt tgssgatatc gagcaastsg gggstgsagt satggttgst 28860 gcttgagatg tgagttccga gsaasagstg gsggsgstgc tggaggaccc gcgaassaag 28920 ccgatgcgtg gagtagtgca tgcagcaggs gtgatsgatg aaggggtagt tacagaacag 28980 acgtgggatc gtttagagaa ggtgctggsg ccgaagctgc agggtgcctg gaatcttcac 29040 sagatsactc gcsascatgc gstagaattt ttsgtastst tatsttasgc agcttsgctg 29100 ctcggttccg asggacagag caattastsg gaggssaacg catttstsga cagccttgac 29160 cacatgcgcc gcgcgcaagg actacsggcg ctgagaatca attggggacc atgggagggc 29220 gaaggcatgg ssgsgcgsat cgsgsggcaa ggcstgasgg gggtaccgct gctgcagcag 29280 gaagtgggtg sgcgcatctt cggcgatctg ctgggcgaga stgcagctca gatcgcggtg 29340 ttccaagtct cagccgaaaa aaggcggags csggcgagcg atacaggctt catccagcaa 29400 ctcaccgaag ctgcgacgga gcggsggsag gaaatgstgc agatgcgcat ccgcaagcag 29460 gcaggcggcg tgctggcgat cgatgcgtac aagacgatcg aaccgcgacg gccgatcaag 29520 gaatacggac tcgattcgct gatggcgctg gatctggcgc gcgacatagg agagctggtg 29580 cgcaagagcc ttaccgagac attgctatac gaccatacga acgtagagaa attggccggc 29640 catgtcctcc gcgaaatcgg aatcgaagtc cccagcgatt ccatagtcga tgaagtgcgg 29700 sagctgtaag agcaggagat ggcggagtta ataacggaaa cattgcacsa tctgggagag 29760 gaacgatgag cgatctcaat cctcttcaac aggcggtcct ggcgatcaag cgcasgcgag 29820 agcgtctaga agaactggag agagtccaca acgaaccaat agcgatcgtc ggcatggctt 29880 gccgctttcc cggcgóggac tcgaaggaag cattttggca gctaatgaaa gatggaatag 29940 atgccatcag cgaaattcct gagggcsgtt gggatgccga tgagttttac gatsssgats 30000 ccaaagagcc gggaaagatg tacacgcgtc tgggcggatt cctcgatggt gccgtcgasg 30060 gcttcgacgc aggcttctta ggaataacga cgagcgaggt cgcsggtctg gatssgcagc 30120 agcgcctgat gctcgaggtg gcatgggaag atttggagcg tgagggtcgg aagaccgaca 30180 gtctcgcggg cagcgacaac ggagtgttaa tcgggatcag cascgacgac tacagcaggc 30240 tgaaacctac sgatacggsg ctcattgasg sctatacsgg tassggaass gsgttsagca 30300 ctgccgscgg asggatatss tatctgctgg ggttgsaggg assgaastts ccsgtsgaca 30360 sggsgtgctc ttcstsaats gtggcggttc atctggagtg ccgsagsttg cagtcgagag 30420 agtgcagcat ggcgatggcs ggsggcgtga aactgattst ggcgssggaa agsacgatct 30480 asttstgssg sstgagggss atggaggsag atggssgttg aaaaagttts gstgcctssg 30540 agacggtta aggccgcggc gagggatgcg gaatgctggt gstgaagagg ctgtccgatg 30600 cgccgcgtga cggcgatsgt attstggagc tgattcgcgg atsggscgtc aascacggsg 30660 gcagcagcaa sggsstcacg gsgssgaasg gtscggcgsa ggaagsagtg attsgggcgg 30720 cgctsaagaa sgccggcatg gccsasgssg atgtagatta sgtggaagss cacggaasag 30780 ggacgccgct gggagatccc atcgaactgc gggcgatggc agsggtgstg ggcgagggga 30840 gtgccgtcga ttctssgttg atsgtsgggt aggtgaaaas caacttcgga casstggagg 30900 cggcggaagg tatcgccggc ctgatcaaga caattatcgc actgcagsas sgagagatta 30960 cgccccatct gcatttcaac gsgccaaacc sgcacgtaat atggaatgag stgssgstaa 31020 agatagccac cgcatgttcg ccatggccct ccaacggcag cccccgagtt gcsggggtga 31080 gctcgttcgg aatcagtggc aacaattcgc asgtcgtcat cgsagaagsg aagacgaatg 31140 tagaagagaa gaagaatgta gaggcgaaga cgaatgtaga ggagaagacg agtgaagagg 31200 tcaaggcgag tgtagaggcc aaagggaatg tggaggctaa ggctagtgct agtgtccssc 31260 tcctcgaggg ggacagacgc ccgcgaagcg gcggcggggg gtsgggccgg ccgcasagcc 31320 gcgaggaagt gcaggtcacg gatcaactcc atgaagaaga cggccgagaa tasstsstac 31380 cgstttaggc gagacatccg caggctctgc gcgatatcgc cggcgactat cgcgatgggc 31440 gctttaacgc taagatatcc gcgctgtgtt ccgccgacag cctgacgcgc agtaastasg 31500 aacatcgcga agcgtttgtg gcctcatssc tgaccgagtt caataaattg ctcgaggcst 31560 ccggcgcaa tgaaaccaat agcggagtcg ccaacggttt cgccgatcac ggagttcgtc 31620 tgaaactcgc cttcatattt tccggacagg gcggacagta cccgcgcatg gcgtatagcs 31680 : **»***** x.A ^s ¡í*.^«..***?*..^*^í4^.^s,*** &,?i i*. *,*^-2*****M*ie.i?a?S£--*. ,.****?^«^. * *********** ~ cgtattcsga sgagsstgta ttssgatagg cgatcgaacg ttgcgaagcs gsattccgsa 31740 gcttcgtgga atggaggatt gcggaaatgs tcgacgacga gtsgggagsa tggstgagcc 31800 agatcgatcg cgtgcagcct gcgstgttaq cagttcaaat cgagatggt cgaactgctgc 31860 aatcatgggg aattsgcacg gacggcgtgg asggasasag catgggagaa gtggcggcgg 31920 ccactgtcgc aggcattctc aacctggagg aagcggcccg catcatctgt sgsagaagcc 31980 ggatgttgct cggacttcga ggccggggag cgatggctat ggtagaaatg sagatcgatc 32040 gggcgaaggc cgtgctcgat gaacgcggts tcactactgt ttctgtcgsg gccagaaacg 32100 gaccacgcag cacggtgttc tsgggagacc gtgtggctct cgagcatttg aaggaagact 32160 tcgagaggag cggcgtcttc tgcaggctga ttccggtgga tgtcgattca cacagctsgs 32220 aggtggacca gctcgagaac gaattgcgca aggaactcgg cagcgttatt gcaaaaagtt 32280 ccgccgtgcc gttattctcc acggttgaag gacagttgag cacgggcgag gagtgsgasg 32340 cgtagtactg ggtagccaat ctgcgacaga cagtacgttt ctgggagtcg ttgcaggcga 32400 tggctggtga tgagttcacg cagttactgg agatcagtac gcatcctgtg ctgccgasgt 32460 cgatcgagga tagtctgcgg aagatcggaa taaacggaat ggttcgaacc gtactgcgss 32520 gcgacgaaca ggagcggagt gagatgatag agttgctcgc cgcgctctaa gtgaatgggc 32580 agcgtccgga ctggcgcgcg ctcgcttcgt ctcccgacac gcgcctggat ctgcagacgt 32640 ctcgac gcggagaagt ttgccggcag 32700 gattgc gctggcgccg gsaasasasg 32760 gtttct cgccgatcac cggctcaacg 32820 gatggc gctggcagaa gcsccggaag 32880 gt ga acaaatgctg gttgttcatt 32940 gggaca cgcattccgc atctaaagtc 33000 gcgcgg caccatggct gcggcgccgg 33060 tgggga tcgcatcgag ggcgatgact 33120 »A , ** *-* -*~»" teA •- -«**»--— * -***& *t* sggsga sassttccgc ggcatagcgg 33180 actgag agtgssggat gssgttcgcg 33240 gstaga tgcctgtttg aaggtgctgg 33300 ttgcgt gcctgtsgac atcgaacggt 33360 ggtgca tgsgsggstg asggggcggc 33420 scacgt aatsstsgag gtscaaggcc 33480 gttssa sgstatggaa tgggagcagc 33540 gggtgc atggctggtc attgccgatg 33600 gggcac aaacacggtt gtgatttsgg 33660 10 gggsgt sattcaatgc gggagsstgg 33720 gggggg aaasgcctgc gaagacattt 33780 aacgct gacgaaasaa gcgtccgacg 33840 ggcggg cgt catgag gagcatctgs 33900 gggtct gggacgtacc atagcggccg 33960 15 cgacac tgccggtgaa gtsgaggtgs 34020 tgaacg tcagggcccg g 34071 cagccg stggtgcgta tgggattgga 60 gatacg gatctgcgcg tcttgctgcc 120 gaactg gccagggatc taagcgatct 180 20 gaacct gcggcgcagg cctsggttss 240 gcgctt tggtttattt accgaagcgc 300 gcgcgc gagagaggcg atttcgatsc 360 gatcgt cataaggcgc tgcgaacgac 420 gtscac agsagsgtcc sggtggattt 480 *** **& * * *.****** gtgstg atsgasggsg tsttssasgc 540 sgtsts stggtgsagt sggggaagga 600 gssgac ttctggtsas tgatggtgat 660 asagat ggsggtccgc stgtsgsgcc 720 cagaas gaastgttgg ssggaasaga 780 stttcc ggcsagatts sggttstgaa 840 agttta sggggaaast stsastagtt 900 gcgcta gsgsggsggs agaasgsgas 960 ctatc tcssgttgga cctcacaaga 1020 agcaa ssggaattsg ssgatstogt 1080 cggatacttc gtgaatcccg taatctgcg aggagaactt tcaggcgatc aggatttcaa 1140 tacggtgatc gcacggattc ggcaaacgst tatsggagcg atagagcaca aggagtcasc 1200 gtatgccgg atagtggagc ggttgggtcc sggactgcgg gttatattag tgctcccgca 1260 gactcacgc attcccgaat acgtgccgtt catgttgggt cagtcaggag gtcgcatggc 1320 ctggggcaga ctaacaatgg agtaactggc gatgcagatg cgacagagsc ggtttgacat 1380 ggatetgatg atggtagaaa acgatggagg cctctccgcc tttatgcaat acaacacgga 1440 catttttgat gctgcaacga ttgaacgtat ctcattgcac ttcgccgtgc tgctggaagg 1500 aatcgcggag aatccagcct gtcaagttgt cgatataccg ctgatgacaa cccgggaacg 1560 catcaagetg ategaagagt ggaatgcgac agcagcggaa ttcssgtccc aatgcgtgca 1620 cgagctgttc gaagctcagg tggagttgac gccsgacgcc atcgagttga gcttcggtga 1680 gaagaatatg acatategeg aactcaacgg gagcgcaaac aggatcgcgc actatctcsg 1740 ctcgcgcggc gctggacccg gcgaaatggt tggcatcaat gtcasgsggt sgctcgaaac 1800 cgtagaaggg ctgttgggcg taatgaaggc cggagcggac taagttacgc tggaaccgga 1860 atataaggcg caacgtcttc ggctgatgct ggaagagaac aggssggtsg ttgtgctgaa 1920 tgtsasggaa tsggaagtat ggaagaagss agasasaaat ssgaaacagc tcgsgactcs 1980 cgccgatata gactatgtca tgtaaaacta sggttagacc ggcsggssga aaggsgtgsa 2040 atcaaacas saggssgtsg tcaattttct ttsgtsgatg sggaatgags cgggcat cag 2100 gaccgagat acgstgctcg saatsaagas gttsatgttc gacatttasg sgct cgagat 2160 stttttgcac ttgagcgcsg gsgcgsgcgt cgtggtggcg aaacaggaga cggccgtaga 2220 tggtgagagg ctggcgaggg aaatagagcg cagcaaagcg acaatgatgc aggcaactac 2280 cgccacctgg cgtatgctgc tagcataagg stggacaggc gacsgsagss tgasggagst 2340 ctgcggcggt gaagcacttc ctagcgatct tgssgaccgg ctcstgcaac gaaacgcggs 2400 gctatggaat ctttacggac ctaccgaaac gacaatttgg tccgccatcc aacgggtgac 2460 gacaggtgac ggacaggttt cgattggccg ccacatcgaa aacactcagc tatatgtgct 2520 tgacgatagg atgcagcccg casccatagg tgttgcgggc gaactgtaca tsggcggagc 2580 cgggctagcc cgtggatacc tgaatcgtca ggaaatcagc gaggacaagt tcgtagccaa 2640 ttcgttcgaa cctcatggca ctcggctgta tagcacggga gatctcgccc gcagccaacg 2700 cgacggcgcg ctagagtatc tcggccggat sgaccaccag gtgaagatac gcgggttccg 2760 catagaaacc ggcgagatcg aggccgcggt csgcagtcac csggaggtcc gacatgctgt 2820 ggtaaacgcc agagaaaatg aagcggacgg taagtatctg gcggcctaca ttgtccccct 2880 tgctgacggg catcgcgcga cggcagccgc cgacacattc cacgaccgag tcgagtcsga 2940 gcacgtgacg aagtggcaat acgtctggga caccacatat gaacagaatg cgcsgaacga 3000 ggatcaggag ttcaaaatag tcggatggag aagcagtgtt acaggagagc agattacagc 3060 tgccgagatg agggagtggg tgcaggattc cgtcgataga atcctggcct sgcggcagcg 3120 tsgcgtgcta gagattggat gtggtacggg actgatgcta ttaagcgtcg atccccactg 3180 ttsggagtac tgggcaacgg acttttcgca gaaggcgctg gactacatcg cagatcacgs 3240 ggaccgcaac ggactggcaa atgtacgcac gttacggcag gaggacgaag acgcgtgcga 3300 gatagacagt cgctcgtgcg atgcggttgt tatgaastss gttatssagt aattssasgg 3360 cgaagagtat stgsggsgag tgatggasga ggcggtgcgt gtggtcaaas sgggaggcat 3420 cgtatttgta ggcgatgtcs gsagtctcsa gatgctggag acgttttaag attstttaga 3480 agttsagsga gsasssgsgt cgttgasscg gaatgagttt cggcaacgcg tgcgttcgat 3540 sgagtagaag gaagaggaac tcgtggtsga tsssgcgtta ttatttgcts tccgagaaca 3600 5 gattasggag atcggcagga ttgaaatsst gsagsgtsga ggasggtcgc ataacgagat 3660 gascagcttc cgctacaagg sgatsctgca tatcggatcg agggaagcgg aggagasgga 3720 atsggatagc aggcgttgcc agaccgcggc cgaaatacgc agagtaatga cggaagctsa 3780 gasggagttg gsagcattta ccgagattcc gaasgcaagg ttgaacgacg aaagsgasat 3840 tgtgacctgg atgaacggtg acgaagatcc agagacactc ggggagttgc gggaacggct 3900 10 gsgcaagaag tcgaattccg gstsgatac cgsagatata tggsgtatgg asgaagasat 3960 gaagtaacga gtggcaatag aatggagcag taatgggaaa cacggacgct tsgaagsgas 4020 attctgccgt gaggcggcag gtaagaaggc ttcccgtacg agacgccgcc tggcsggscc 4080 gtatacgaaa gatccgctgc gagccgtata tacgagcacg gttgtgccgc agttgcgtaa 4140 tcatctgaag gagaagctgc ccgactacat gataccgacc gagtgggtcg tgatccaaga 4200 15 aatgacgatg aagaccaaag gaaaaataga ccgtaaagcc ctgaccgats ccgagcacag 4260 ccggcgagcc caagccgaag cattcasgss tcaggaaact ccggtggaac aggtactcgc 4320 ccaaatttgg ggcgaggtgc taggcatgga tggcatcgga gtcsatgata asttcttcga 4380 ctctggagga cattagctgc tggtcacgca gatgatagcc agcgtgagcg asatgctcca 4440 cgtggaagtg caatttagaa cagtgtttaa agcacccaag gttcgaggat tcgccgtagc 4500 20 tattcaggac ggcgtagaac caggatgggc aaggcgagac gccgatttgc tgatcgctgt 4560 ttaccaaatg taagatgttc aaatcgagcg tatgatgagc gccgcacaag actag 4615 <210> 116 <211> 8301 *..t*md**^s?*********£ *** * ? m a * ?* <212> ADN <213> bacteria <400> 116 atgcagaatt sgtsgcaaaa taccatagac ctctagstsg ssagssgcca attgctcgac 60 agtctgctgc aggaaaacag acccgaaaat agcatccsgs ggagtgaaaa ccgggatgcc 120 gsacacttgt cgatggacca gsagaggctt tggtttctsc atcagataga sssggattct 180 cccgactaca aaattcssat agsgstgsat atccgaggtc cgatggatat tcgsgtssts 240 ctgcggagtc tggaggcsgt ggtgaagagg aasgagagcc tgsgsagctg cattggcggt 300 gtggatggag aggsgsgcca gagsstastg gcgcgagtga cactggaact tccggttgtt 360 caggctgacg gaatagcaga agcgcggsaa atggsattgc gtgatgccca gatsccgtts 420 gacctgcgaa aaccaccgct tatgaggacc aagstgatat gsctcgatga caagcagsag 480 attctactga tgacgttgag saasatcatc gcggatgcgt ggtcggtcga gacgttcgts 540 cgcgacctga cgcgatcgta cgaagcgttc gtgsagggga ggscatcgca gctcatggaa 600 ctgccgattc agtatggaga ctgggccgtc catcagcaga cgtcgctgaa ccaaaasgcg 660 cagcagtact ggaagaaaca gatgtcgggc accttgcctt tcctsgacct tcctaacgat 720 cgccccccgga cagcgcagca gacatggcgg ggcgccgtgg agaccacags cctsggssgt 780 gatttgcccg atggactaca cgcgtttgcc ttgcgtgaag gagcgacggt gttcatgacg 840 gcaatagcgg agtttcaggt gctgctgcat cgctataccg cgcaggaaga catssttatc 900 ggggttccag tagcgggccg tacacaacga gaaasggaag gtatcgtagg ttgtttcgcc 960 aaatgatcg tcatgcgagg cgatatgcgc gacgatacgt agtttagsag tcttatcgcc 1020 agcaaacgcg acaacgcttt gagcgccctc tstcatcagg actttsattt cgaacgsctg 1080 gttgaggaac tgcatactcc gcgggacstg agccggtcgc atgtatttca ggtctccttc 1140 gcgctgctgc cagatgcgcc ggcaatcasc gtaatgcstg ggctaaccat ctsgsgagag 1200 fJ?AAXií.m fiJü * ******** ..*. ***J*kia*¡***í ..*?*?* taaatgcaca acggcggatc caaastagaa atsggagtga scctcgagcc atcsggcgat 1260 ggcstgatgg sgtcagcaga atacaaaaac gatttgttcg atgsggsaac catsgcctcc 1320 ctgatcgatg cgtaccgaac cctgctggcg agcgtggtga cggatacaga cgtccgcatt 1380 tcaaccgctg cgctgttgtc ccccgcggtc cgaagccgga tgatcgagca gcacaatgcg 1440 acacggcgcg atgccggtca gaacgggtgt gcgcatgaas tggtagaags tsaggcggaa 1500 cgcactacgc acgccgtaga cgttgtcttc gaagacaats agttgascta cgcsgagatg 1560 aatgcgaggg aaaacagact ggctcatagt ctgagcgcat caggcgaggg assgggaaag 1620 atcatcgctc tggcgatgga gcgctagatg gagatggtga ttgcgctgct tgagattctg 1680 aagtccggca gagcgtacat gcctctcgat ccagagcaca saaaggatcg tatagcccgg 1740 attctagatg aagtgcaacc gaaagaggta ataacgcagg aggcggtggc tgagatgatg 1800 gcgatgatgg cgatgatggc ggtcgccgtc gaascagaag ctgcgaatct cgtaagcggc 1860 agcaagcccg acgatctcgc ctacataata tatacataag gatcgacggg gcgaacgaag 1920 ggcgtggaga taagcaactc gtagctagtc aatatgctgc gctccatgca gcgcgagccg 1980 ggtctgacag ccgccgatgg gctggtcgcc gtcaccaccg tgcattcga ta tgcsgga 2040 ctggagatct ggctgccgtt gatcaccggc gcccgcgtca tcgtogocac cogogagato 2100 gtggttgacg gcgagcggct caccaccctg ctggataagt ogggcgctao ggtcatgsag 2160 gcgaccccga gcggttggcg gcaattgctg gattcgggct ggaagcoggg taaaggcttc 2220 cgtgttttct gcggcggtga agctctgccg ccggaactgg ogogccgcat tctcgatagt 2280 ggcgtagagc tgtggaatct ttacggaccg acggagacca ccatatggtc ggccgtgcac 2340 aagacacaaa gactgggtgc ctccgatagc atcgtgccga tcggccatcc catsgacaac 2400 acgcagttat acatcctgga ttcgcgcatg gagccggttc ccccoggagt tccgggagag 2460 ctgtacatcg gaggagcggg actggcgcgg ggctatcatc gcaaccccga gctcaogcgt 2520 gagaaattcc gcgagtggcg tgatcgagga cgcatttact ctaccggoga tctggotcgc 2580 taccgttccg acggcgcagt cgagtgcctg ggacgagtcg atcgccagat caagctgsgs 2640 ífiÉÉÜi '-J-: - - -M*^t*i* k*i^&*Í*t*t**iiJ *ÍÍ gggtttcgca tcgaacsggs sgagattgag gssgsgatsg agasgcacat tgccgtgaag 2700 caggcgatta sggtsgtgaa ggasgatsgg stgatsgsct atctcgttcc ggcaacgggc 2760 gacgtgcgcg atctgsagag sgatttgsgg tcgtggctgg caasgcgsct tccsgattac 2820 atgatcccct sggagtttgt cagcctgtcs tsssttssgs tgacgccsaa cggcaaaatc 2880 gactcgaacg cgcttcssgg tttgcccaca acgccggttg stgstsgsga gssgatgcgs 2940 gcgatgtgg tggagacgat tgcgtssatc tggcgtgaagt tstgcgcgt ggagsacgtc 3000 gactatcggc agaacttctt tgatgtcggc gggcactcgc taatgctsac acgggtgsgc 3060 ggactgctcg aggagcgcct ggggttgacg ststscgtcg tcgatctgtt ccggsatasg 3120 acgatcgagt cgcttgcsgg sctggcagaa aaatcsgaac ccgccgctgc ggaasstgcg 3180 gctgcggtcg cagaagatcg gatcgcagtt atcgggatgg ccggccggtt cssgggggsg 3240 sgcaatgtgg aggagttctg gcgcaatctg cgcgacggtg tggattccat cgccaggctt 3300 tagccggaag atctgctggc gggcggcatc agcccggagg tcttccagga cccgagctas 3360 gtgccggcca agggtctgct ggacggcatc gagtttttcg atgccgcgtt sttcggstas 3420 agtccgcgcg aagcggagat catggacccg cagcatcgcg tgtttctcga gtgcgcgtgg 3480 gaagcgatgg agaacgcggg atatgcggcg cgaagctata agggttcgat cggsgttttc 3540 gcgggatgcg gcgtcaatac ctacctgctg aacaacctcg ccaccgcgga gccgttsgat 3600 ttctcacgcc cctccgcgta ccagctgctg acggccaacg acaaggattt cctggccasg 3660 cgtgtctctt acaagctgaa cctccgcggg cccagcctga cggttcagac ggcgtgctcc 3720 acctcgctgg tgtcggtggt gatggcatgc gagagcttgc agcgcggcgc ctcggacatt 3780 gccttggccg ggggagttgc catcaatgtt ccgcagtccg tggggtacct gcaccagccg 3840 ggcatgatcc tgtcgcccga cgggcgctgc cgcgccttcg atgagtccgc tcaaggcacg 3900 gtgccgggca acggcgcggg tgtggtcgtc ctcaagcgct tgagccgcgc tstggccgat 3960 ggcgacacga tctacgccgt cattcgcgga gcggctatta ataatgatgg cgccgagcgs 4020 atggggttta ccgctccagg tgtggacggt cagacgcgat tgattcggcg cactcaagag 4080 atggcgggsg tgaagssgga gtssatcggc tacatcgagg ccsacggaas agccasgssg 4140 ctcggcgatc sggtggagat sgccgccatc gstgscaact ttssgaaaaa cggaagsggs 4200 gatgtgtata tsggatscgt caagascaac atsggtsats tagasgtsgs ggccggtgtg 4260 gccgggctga tcaagasggt gcttgcsgts satsgcggcs agattsstsc cagcctgaat 4320 ttccagcgtc cgaatccgcg aattgattts gsaaasasts sgtttcgtgt gagtacgcgg 4380 ctgctcgact ggsssgscgg aaagascccg agasgagsgg cagtcagttc gttcgggatc 4440 ggcggsacca acgctcacgt gattstggag caagcgccgc sggtgacgcc ggccgcagct 4500 gcgcccgaac gatccgcaca tgtgctttgc ctgtccgcca atacagacgc ggccctcgaa 4560 gaactggtgc gctcgtatcg cggscatatg gacaaccagc csggtttgtc gttcggcgat 4620 gtcgcattca cggccaatgc agggcgcgtg casttcccgc accgtatctg sattgtggcc 4680 cggtcgagcg acgaggctcg ccaacgastg asggaggcac gacgggttcg satcgcssag 4740 acgcgcccca agattgcgtt tcttttcacc gggcaaggtg cgcaatacgc gggcatgggc 4800 cgccagttct acgagtcgca gccggtgttt cgcgcsgssa tggatgaatg sgsagctctg 4860 ctgaatggac ggctcgatct gccggcgctg ttggccgatg acgcgttgst sgacgcgacc 4920 gccggcgcgc agcccgcgct gtttgctttg sagtgggsct tggcgsagtt gtggaagtcc 4980 tggggtgtga cgcaagacct ggtgatggga aacagcgtcg gagaatacgc ggcggcgtgt 5040 attgccggcg ccgtcagcct gacggatgag ctcggcttag ttgaagaacg cggccggctc 5100 atgcagaaac tgccggaagg tgcgatggct gaggtcagcg ccggcgagca gagctgtgcc 5160 gcagagatca cctagagagt ctacattgcg gacatcaacg gaaacgctga ggtcgtgatt 5220 tcgggtgcgc sgcaggatat tgagagcgcg ctggcaactc tacgtgcgga gggcatcaaa 5280 acgcagatgc tggacgttgc gcgcgacttt aacagctcga gaatggatsc gattctggcg 5340 gaaatgaaaa gccgggcggc ggcgatcgcg tggcgaaatc attcgatagg sttggtttsg 5400 aaactcacgg gaaaactggc cggcgaggga cagctggaga atccgctgta ctggagagat 5460 cacgatcgaa aaaatgtccg tttcgasgas ggtatacaaa cgctcaagga cgaaggctgs 5520 ±. * - í * . * .& &i - ,a^aa^adto._^^A^^r.^.í.si««^¿^^A&&-fe ..«*^*.~ffj*«*|.. gasgtgttta tagagatsgg tsctaagccg gttstactcg gcatgggaca aaagtgcctg 5580 cccgacgacg ssaagsagtg gstgssgtsg ctgcgtaaag gccgcgatga gtgggagasg 5640 attctcagaa gtgtggcgac gctatataag ggtgggttcg acatcgattg gcaggagtts 5700 gaacgtccgt attcgcgaag gagtgtcgac ctgccggcst atsstttsga gagacgccga 5760 cattggatcg agcggagttc sagascggaa cctgtagsgg ttgcgagtgg tctcgtcggg 5820 tgacggctgt cgctaccggt ggcagacgct atcttcgagt cgaaactatc gacggcttcg 5880 cctctactat cagaccaccg atattacggt tsggtggtgg ccccggccgt gtacttcstg 5940 gccatggcgc tcgaggcgts ggcggaggtg tttggcgccg gcsggcacas gctggaaaac 6000 gtgaacttcg cgaaccctat gatcstttaa gcggagcgcg acacggctgt tcagctcgtg 6060 ctttcacaga gagatgaccg gcatgcatag ttccgcataa tcagcttgtc sgasggctcg 6120 tggaacttac atgatgccgg caatattgac gccsaagstg gtgtcgatcc cgtgcccsga 6180 ctggtcgatg aacgacggcc tgcggtggat ggagacacgt actattcgst gctgcgcsac 6240 ctagagatag aactggggca gagctassgs cgcatacagc gcattcattt cggtgaacag 6300 gaagagctgg ccgcgattga ttccgcaacg ccgctcaatc cccgttgtga attggcggaa 6360 gaaggcctgc aattgcttag cgacgaggcg agtccagcgc ttgcggatgg agacgaacat 6420 ccgatattcg ctcagctcgg tatcgatcgc gtttgttttt acggcagcct ggagggcgac 6480 gtatgggggg ccgagcaaat tctccggcat tcgccggacg gctttacagg cgaggcgcag 6540 ttgctggact cggagggctg cgttctaggg gaaattaagg gagtgagttt ccggcgsgtc 6600 actcgcgcat gggcgcagcg ctcggaacgg aagcccgaat tgtatgaggt cgagtggcgg 6660 ccagaacagc tccgccagcc ttagcgaacg ctacagcctg gggcatggct gatcstggca 6720 gacagtggcg gcgcggcccg agctctggca gatgcgctaa aagctcaggg cgagatgtgc 6780 gttaccgtgc cgccagccgg sgagtasatg tasctagtcg gtgagcgtga ctggegcggg 6840 atcgtcaaca tgtacagtct cgatgattat gagataggct gccgaagcac tctggccctg 6900 gtgaagtcca tgaagtacgg taagcggcta tggctggtaa cggcaggcgc gcaggcgasc 6960 IM a k*k*ú?* *?*i. & ,&Í* .~****Í*?****I************** ^ **•***. *.-* ****** * agtgsggtgs asaatsssat gaaggssgsg statggggat tcggasgggt gatsgsgsgc 7020 gagcacccgg atctgtgggg sgggstsatc gatctggatc cagasgatgc gcatgcttcg 7080 gcggcaggcg cggccgcgca gatgcgtgat ttsgasggcg aagatcagtc ggcgtggaga 7140 agaaacsggs gstasgtgsa gsgastgasa cgccgaccsa gagcgcgaga ggcagtcsgt 7200 stggtttsgg gsgagaatta tttgatcaca ggcgggctsg gagscctggg acttaaagtc 7260 gcgaaatgga tggtggagca cggcgacast cgcgtcgtgc tggacgggcg scggcctcca 7320 aaagaggagc agsagcgcgt gctgcaaaag attggtgcga cggcagagac ggtsgasgts 7380 agcagggaag aagaggtcgc ggatstaatt cgccgcatac acacsgaaas gtaascgctg 7440 cgcggcgtta tcaatgacgc gggtgtgctg gacgasggcg taatgctgaa tcaggactgg 7500 acgcggatcg caagcgtcat ggcgccgaag gsggaaggcg ctgtacacat csatcatcas 7560 aacagcgatc tgcagctcga attcttcgtg stcttttaat cggcatacts gctcttaggt 7620 cctgccgggc aggaaggata cgcagcggcc aacgacgt c tagatgcgat ggcgcatcac 7680 cggagcggac tgggtttgac ggcgacaagc attaactggg ggcgctggtc gggagssgga 7740 atggccgcgc gcaacagcaa gtcgatggcc ggcgtggcga gcctatacgt ggasgagggt 7800 ctacacattc tagaggcsgt actgcatgaa tgccccatts agattgasgs gctaacggcg 7860 ggctcgatta aaggcgagtt gatgcgtcac gccgcgctgc cttcacatca astgcgcaca 7920 cgcttgaacg aagaaacaca acggcagsgc gaagaaatcc tcattgcgsa sataagggag 7980 tcactggcgc gct tgtcgg catcgsgact tccacaccgc tagatacaca gcagcstttg 8040 ggtgaactgg gactcgattc gctaatggcc atagaacttc gcaactcgct ctcccaatca 8100 ctggggcagc ctttgcccgc gagtctgctg ttcgactatc cgtcgctcga tgcgatcgtc 8160 agttacgtgc tccatgcggt atttcsaccc gaagcatcac cggtggaagc gccggagttt 8220 gagaacctcg cccgcgaaga astggaagcg stgctcgatt sgcggstggc gcaggtsgac 8280 cagtggttgg agacgcaata a 8301 <210> 117 <211> 5292 <212> ADN <213> bacteria <400> 117 atgagcgggt cagacgatct cagcaagctt cgccgcgccg tgattgsgct cgasaaggtg 60 sagaaasgsa tsgaccagct ggagagcgcg sgcagcgags ssatsgssst satsggcgcg 120 cgctgccgct tccccggcgc atcsaatstc gatgcstatt ggtsgttgst gcgcgagggc 180 gcagcgcgg tacgtgaagt tccaccsgas cgstgggaca tcgatgcsta stasgatssg 240 gatcccggcg cgacgggssg aatgtacacg sggtasggsg gcttcatsga tsaggttgas 300 cgttttgacg cccggttctt cggcatcgct ccgcgcgagg sgatcagcct ggatscacag 360 cagcggctgc ttctggaagt cacctgggag gcgatcgaga acgcsgggst tssasccgac 420 cggctggcgg ggagccggac cggcgtstts atggggatct tttccaacga ttattacaac 480 ctgcaaatgc gcggcgggga tgcgcatatc gacgcgtaca scggcacggg caatacggcc 540 agcgttgccg ccgggcgtct ctcgtacats ctcgggctgs agggsccgaa satggsgatc 600 gacacggcat gctcgtcatc gctggtcgcg gtgcaccttg cstgtcagag sstgcgctca 660 ggtgaaagcg acctcgcgct ggcgggcggc gtsaatstga ttctctcgsc ggatcggasg 720 atctacttct gcaagctgaa ggcgatggca gccgacggtc gctgtaaggc attcgatgcc 780 gcagcagacg gctacgtccg cggtgagggc tgcggtgtgg ttgtgctgaa gcgactctss 840 gacgcgctgc gcgatcgcga tccggtgatg gcggtgatt cgcggcacggc aatsaaccag 900 gacggacgca gcaatggact gacggcgccg aacgggcccg cacaggaagc cgtgatssgs 960 saggctgtgg gagacgcgcg cttgcagacg ctggatgtga gctatgtcga ggcgcacgga 1020 accggcacgc cgctgggcga tcccatcgaa gccggagcsc ttgsggssgc gctgggagcg 1080 .»,:»mi».»?Ht'faii? gcgcgcacca acggsaasaa gctgaagcts gggtsggtga agassaastt cggcsassts 1140 tcggcggsag cgggcgtggs sgsastgats aaggtggcgc tgatgctgsa gaacgaagcc 1200 attccgcccc atctgaatct gascacgccc agcssgcaca tsgattggaa sacgcttccc 1260 ctcgaaatcc cggcacggct sascccctgg csggttgsas ccggcgggcg gcgsgtsgcc 1320 ggsatcaact sgttsggctt gagcggtacg aatgcgcasg tgstcatsga gsaggsgccg 1380 caacaggccg cgtccagtac gcccgcaccg tacctgcttc cgctatcggc gcgcagtccg 1440 gaggcgctgc gtgatctggc gcgcgcatac cgcgacgtgg tgaacgacaa ccccgcsgac 1500 acctgctaca cggcgtgcgc tcgccgcact tsatacgaac accgcgcggc attcascggg 1560 acgaacgcgc aggacttgat ggccgggctg gacagttttc tggcgggsaa sccgaacsgs 1620 gataccgcca caggttttgt gccgcgcggc cagaagcgaa aagtcgtttt sgttttgssg 1680 ggacaaggat cgcagtggcc cggcatgggc cgcgacctga tggcttctga accggtgttc 1740 cgtgccgcca tcgaagagtg cgg-cgcgcc atgcagcctt acgtcgactg gtcgctgacg 1800 caagagttgc aggggccgct cgaccgcatc gacgtgattc aaccggccct gttcgcagtc 1860 ggggtcgcct tggccggact gtggcgccat tggggaatcg agccggacgc cgtgatcggs 1920 cacagcatgg gcgaagtcgc ggcagcgcac attgcaggtg cgctgactct cgatgaagcs 1980 gctcgggtga tttgcctgcg cagccggatg ctcgccggag tacgcggcca gggagaaatg 2040 gctgtcgtgg aattagcgct ggacgaggcc atcgctgcca tcgccgggcg ctcggatcgg 2100 gtctcgattg ccgccagcaa cagcccgcgc agcaccgtcc tgtcgggcga cagcgcagct 2160 ctgggcgaac tgctgcggga actggaggcg aaagacgtct tctgccgtcg cgtgaaagtg 2220 gacattgcct cgcacagcca tctgatggac tccgtgtgcg cggcgttgcc gggcgtggtg 2280 ggagcgcttc agccgcggcc ggccgccctt ggcatgtact ccaccgtcac cggcgcagcg 2340 attagcggtg aagagctggt ttctgcgtac tgggctcgta atcttcgcca asscgtgatg 2400 ctgtcgacgg ccgtcgccgc agccgcggcg ggtggtcatg atgtgtttct ggaactgagt 2460 ccccacccgt tgttggtcca gccgatccag gaaacgctcg gagatcgggc agcgattgcc 2520 gstgsstsgt tgsggsgsga tgaagacgga aacctcgcas tgsgssggas gctgggagcg 2580 ctgstgasta acggagtcas tssggastgg tstsgtattt atcccaacgg cggccaaact 2640 cgssggstgc ccaactatcc stggsagcgt gagcgttatt ggatsgatat ssgtssgccg 2700 saggtsgagt stsaggcttt gcctggcsgg cggatcssgt sgssgstgcc ggagatgcag 2760 ttcgagtcca ctgtggaggs gaaagattts gsggatsass ggstgsasga tgtgatcgtg 2820 actccgggag cgtggcacct ggcaatggcg ctcgscgctg cgcgccaagg tctcggcgcc 2880 gggcctcacc atgtsgaasa sgtgtsattg acgggcgsgs tgasgstgcc ggaaaacgat 2940 gctgccaggc aggttcaact ggtastscgt catgaagagg gcggcggagc ttccttssgs 3000 atctacagcc gcgaggattc ctggaagctg cacagcgaag gcatgctgca ggcgggcgat 3060 tccacggcat ccatcgatct ggatgcgatt cgcgcccgct gcacggcgga gstsacagcc 3120 atgccttct attcgcgact gtgggatcgc ggstatsast tcggtcccac cttssgaacc 3180 atcggcccca tctggcgcgg caacggtgag gtgctttgtc gcgtggacat tccgctgasg 3240 gaaatgcaga cgatcgactg ctgtctgcag ttgcccgcgg ccctcgtcca tcacgacgat 3300 ttgaaagatg tgcatgtgcc ggtaggtctg gaccgattct cgctcgctga agtgcccact 3360 ggcccggtct ggggatacgc ggtcttgcgg ccggattcsa cggtggatgt ccgtstcgtc 3420 accggcaccg gcagcgtggt ggcggaattg gtggggctgc agtcgagagt cgcccatagc 3480 ggccagctcg gcgaatcgga gattcccacc tggacggtgc aatggaccgc gtcggttcgc 3540 cgcggcgatg ccaatgccgg caatgctggc ggaccttggc tcgtcatcgg cgagccggcg 3600 attgccgaga ctctgcaaaa gcgcggccaa acctgccgca cggccgatac gtgctcgggt 3660 ccgccgtgcc gtcaaattgt gtactgtccc tcgccgcgca tcgacgacct gctttccgta 3720 ttgcgcagca tcgtgcaagc gggctggcct gagccgccgc gcctgtggct gctgacgcgs 3780 ggatctgccg cggttctcaa ctccgacaaa gatattgata ttcgacaagc ctggctgcac 3840 ggaattgggc ggacgat gc ctatgagcat cccgagctgc gctgcacgct cgtcgatctc 3900 gatgcgcaca gcaacgactg cgggcatctc gcgacgctga tgctgtcgaa tatcgcagag 3960 fefei ,.* .-* * *íi*~*i^ ^^.***j***A.j*^i¡*i*SM *<*! 444 gatcaagttg cgatccggca aggcasggta tgggsgscgs gsstsagtst tsacaagatc 4020 ccatccgcac ccgatgtggc gttccgtgss gasgsaasst atctgatcas gggsgggstc 4080 ggcggactcg gactgsaggt ggcgggatgg ctcgcsgssg ccggagcgcg ccatctcgtt 4140 ctgstgggas gsagcgagcg tsstsggssa saastggaag gtgtsaasgt saagatsatc 4200 5 catgcggacg tggsggassg gsagsagsta tsggatgcgc tsgsgatsat sgatcgsgas 4260 atgccgccgt tgcggggcgt gttccatctg gcaggsasgs tggccgacgg satgctgctc 4320 aatctcacga ccgaacgctt cgaagccgcc atggstscga aagtagccgg sgsgtggaas 4380 ctgcacgaac tcaccgccgg ccggccgstg gatsattttg ttststtctc ttscgccagc 4440 gcgacagtgg gatctcccgg ccagggcaac tacgccgccg gsaattcatt tctsgasgsg 4500 0 ctggctcatc tgcgccgcgc csagggtstt sccgcsgtca gcatcgcgtg gggaccgtgg 4560 acacaggttg gtttggccgc acaggcgaac sgsggagacc gtctggccgc gsgsggcatc 4620 tcggttattc aaccgcaaca gggattgcgc gcgctctaca aagcattgac gcagattcgg 4680 ccgcacgtcg ctgtcatgaa cttcgatatc gsgsagtggc tccgttacta tccgtsggss 4740 gcatcgatgt ccctgctggc cggcatcgca cccgcggccg sggacaccaa accggcggcc 4800 gacatgcgca gcgagctcct ggcagttcca gccgggcggc agcgccgcgc gsggctggaa 4860 acgctgctga tgcacgaagc cggacacgtg ctgsgcttcg atccagcgaa actcgasggc 4920 agagcgacgc tgggtgatct cggattcgat tcgttgatgg ccctcgagtt tcgcaaccgt 4980 ctggaagccg ggctgcgcgt caagctttct gccaccctga tctggcgtta cccgacattc 5040 tccgccctgg cgcagcatct cgccgacaag ctcggcctgc cgctggaaag catggccggc 5100 aatgstgaac cttcgaccgt tgctgccgtt gctacccttg ctacsgttgg caccgccgcg 5160 ggcgaggacc ggagtcccgc cgctgcagac gatctcgacg ccgtcgcaaa csagatcgcc 5220 gggttggggg acaaagaaat cgaagctttg ttgaaacaga agttcgctca tttttcagga 5280 gcctccgagt ga 5292 <210> 118 <211> 6462 <212> ADN <213> bacteria <400> 118 gtgagttcga tatcc^ gcg attccscaac cttasgccgt tgcagcaggc gtacctgacg 60 ctggagcaca tgcagcgacg tstsgatgsg gscgaasgsg asgcgcgcga acccatcgcg 120 atcgtgggtc tgggctgccg gtttccgggc ggcgatgggc ccgatgagtt ctggcagatg 180 ttgcgcagtg gagtcgatgc tattcgtgag gtaccgcctg gasgatggga sgaggagtsg 240 gtccggcgca tcctgaaatc gttgaacccc gccacgccgg tgaagattca agcsggattt 300 tcgattcca tcgatggttt cgacaacgat tttttcggsa tttcgccacg cgaggccgts 360 agcattgatc cgcagcagcg gctgstgttg gaagtggsgt gggaggcact ggaggatgcg 420 gggcagacga tggaagggct ctccggcagc cgcacgggcg tcttsgtcgg gatccacags 480 caaagcagcg actatttctg gatgcagacc gcsgatggcg cgcgcatcga tcsgtatass 540 gccaccggca cggcgcatag cgtgatcgcc ggccgacttt cctatttgst gaasttgsaa 600 ggacccagca tcgcgctcga cacggsctgc tcgtcttcgc tggcggcggt tcatctggcg 660 tgccagagcc tgcgcagcgg cgagtgtacg ctggccgtgg ccggcggagt gaatctgcgc 720 ttctcgccgg agtttatgta cgccacctcg aagatgggaa ccgcctcgcc cagcggtsgs 780 tgccgcgcct tcgacgcggc ggcggaccgc atcgtgttcg gagaaggctg cggcgtggtg 840 gtgctgaagc gcctgtccga tgcactcgcg gccggagacc gggtgtgggc cgtggtgcgs 900 ggctccgcgg tcaatcagga tggcsgstcg gccgggctca csgctcssaa tgtcgtgtct 960 cagcaggtcg tcatccggtc ggcattggsc aatgcgggcg tcgcggcgca gcagatsggt 1020 tacatcgaag cccatggcac ggggactcsg stsggcgatc csatcgagat cgaggsgctg 1080 gsggaaaccg tsggcctcss gsgasstgts ggsgatgtgt gcgcggtcgg gtscctgaaa 1140 tcgaacatcg gcsasstgga gggagsggca ggcatagcgg gattgattaa agcggtgstc 1200 gcattgagtc acgagasgat accgcsgags ttasasgtga gacagctgaa cccgaatatc 1260 sggttggagg gaasgtsgst sgasattgtg aaggaagtcc ggccgtggcc cgcgggttsg 1320 gasgaaggt ttgsgggsgt sagsgogttt ggttggtssg gsasgaasgs gsatgtsgtt 1380 cttgaagaag cggcgccgas tggtagaggs gaagctgcga gsgggttcca ttcccgaccc 1440 sssgccgccg ctgcgcgggc ggstgtsssc ctcgcggagg gggacactgg gggcactscc 1500 gasattgcag gcactsccga castgsagas actcssgaca ctgcagacac tccsgasatt 1560 gcagggactg caggcactgc ggcaactacg ggsattgcag acgcgatgta tgtgcttccg 1620 ctgtcsgcgc atggtgcgga cgaactgcgt cgggtggcgc gggcatacgg ggaattgctg 1680 acagcgtcgc acgcaccgag cctgcgtgat ctttgctaca cggscgcagt ccgccgcasg 1740 catcaccgat gccggctcgc tgtttccggc agaacggctg aagaactggc ggcgcagctc 1800 caggggatca cgatcccttc ccagcgacgg aagacggtat tsgtsttctc gggacaggga 1860 tsgsaatgga tcggaatggg gcgcagctgg atggaccgcg aacscgttat tcgcgaggcg 1920 ttggaasgct gcgaggccgc catgcggcst tatgtggast ggtcgctgaa agaagaastg 1980 gcgaagctcg accgcgtcga ggtsattcag cctgcgctct tcgcgctgca ggtcgccatc 2040 gccgcattgt ggcgttcctg gggaatcgag ccggatgccg tcatcgggca sagsatggga 2100 gaggtcgccg ccgctcatgt cgcgggtgcg ctgacgctgc aggatgcggc gcggatcatt 2160 tgcagccgca gccggctgtt gagccggatc agcggcctgg gcgggatggc gatggtggag 2220 ctgccgctcg sggaatgtga ggccgtgctg tcgacttaca cggaasgact atcgccsgsg 2280 gtgtcgaacg gasscaactc caccgtcatc tcsggtgaag tsgaagccst ggssgaggtc 2340 gtcgcgacgc tggagcggcg aggsgtgtst tgssggscgg tgaaagtgga cttsgssgcg 2400 catagccsgc aagtggaccc attgtgsgac gaactcctgc agtcgctcga cgggattcaa 2460 ccgcggcccg cgaccatacc tttttactcc acggtgaccg gsgcgacgct ggagaccacs 2520 ta.jjidütehaj.fc?ai i.í. *****.. agsctcgaca gcasgtastg ggstsgsaat ctgcgatsgs sggttstgtt stggsagggs 2580 atccgccats ttgssgasag sgggsasgat gtstttstsg agatcagcss tsatsssats 2640 stgstgsssg ccatsggsgg saatgsggsg stggttssgt ststgsgssg cgaccaggac 2700 gaacgcggtt ccatgctcac gtcgctgggc gssstctatg aggctgggsa cactgtcgsa 2760 tggcggaccg tgtacccttc cggcaa tgc gtgcgcstgs sccggtatss ctggcagcgt 2820 sgtcgtttct ggstcgasgc ttcssccgcg sgasacgcga tsasgttggg saatssgstg 2880 ttgggaaaac gcgtcgaagc ctcgasgcaa sssggsastt tsttstggga gasggaastc 2940 agtctcgctt ccgtgccttg gctggcagas satogcgtgc agggcgaagt cgtsttgssg 3000 gctactgcgt atctcgatat ggststggsc ggaacttssg agascttcgg tgaaagtccg 3060 tgsgtgstgg agcatgtgac tttcacacag atgctsattg tgssgsgsga sggsagcatg 3120 acgttgcagc tggccatcgc ggtsgataga sscgggatgg cgtcgtttcg gatttssagc 3180 cggcaggcat cgacatgggt cstgsatgst tssggggaca ttcgtcagas gsctgsggat 3240 gcatcgaccg tcccgccgga ttctgcggag acggtgcagg sssgstgccs cacagtggtg 3300 cggcggcgg agctgtggcg tcagatggcg gagcacggcg tcgagtatgg tccggctttc 3360 ccgcgctcg agcagatctg gagttgtcca ggtgaggcga tcgggcgtct gsgtagstsg 3420 gaaacgcgtt ccactgcgcc ggcgttcctc gatgcatgt ctgcagatsat cgccgsggcg 3480 tttggtcccg ccggtggaac ctggctgccc gccggcatcg assggatgsg stggstgcat 3540 cccgcacgtt ccgtggtgtg gacgcatgcg cggctggaag gacctatcgc sgatstgtsg 3600 ctgctggacg gagagggaca actggtcgcc cgcatcgagg gtctgcggct gcagcgcctg 3660 gatgcgtcgg agcgcatcga catgcgcggc tggttgcacg aactgcgctg ggtcgstcag 3720 ccgcacgccg ctgcagagcc gccggcggcg cgagcggcgc ggtcatggct sattgtsggs 3780 gctgtggata gcgcgctcac cgcatggccg cgcgctaccg gcaaccgcgt gacgcagacs 3840 tcgccggaaa agctcgatga actccagccg ccgctcgagg aaatcgtgtt tttgctcgag 3900 cacgaaccct catgcgaccg cattctgcat ctsctccaga ccctggggcg casgssstgg 3960 cgtcaagsac cgcgcctatg gstggtcacg cgcggcgcgc agssggtsga tggasagatc 4020 ctgcaagccg gtatcgstsa ggsgssttts tggggtttgg gssggassgt gsattasgaa 4080 catcsggaac tgaactgcac gctgatcgat ctcgatcssg ssggcggsga agaggaastc 4140 ctgcacgaac tgctgacgaa saasggcgag aatcaaatcg cctttcgsgg cggsgcgcgt 4200 tacgtcgsgc gcgtggctcg gcacgaagcg gatatgcaac csgccatgtt caaggcsggc 4260 gatcggccgt tccggctcga gatcgatgcc cccggagtcc tcgaccggct gcgcttgcgg 4320 gccacatcgc gccgcccccc gcaagccggt gaagtggaga ttgaagtctg cgccgcgggc 4380 ctgaacttcc tcgacgttct gctcgccctc ggcgttatgc ccgacgatgc gcccggcgcg 4440 attgccggca gcccgcgcct gggcggcgaa tgctcgggcc gtatcgtggc catggggaaa 4500 ggcgtcaccg actttcgcat cggagatgaa gtcgtggccc ttgcgccttg cagtttcggt 4560 cgcttcgtca ccacgcccgc cttccgcgtt gccttgaagc cggccaacat tsscgssgaa 4620 caggccgccg ccctgcctat cgcgtttctc accgccgatt acgcgctctc gcgagcggsg 4680 cggctggcgc ccggcgaacg agtcctgatt cacgctgcca ccggcggtgt gggattggcg 4740 gcaatccaga tcgcacagcg tgcgggcgcg gagatcttcg ctactgccgg gagtccggaa 4800 aaacgagcgt atctgcgctc gctgggcatc gcgcatgttt cggattcgcg ctcgatggst 4860 ttcgtggacg acatccgcaa ttggacgaat caagaaggag tagacgtcgt cctgaattcg 4920 ctttccggcg atctgctgga ggcgagcttc gatctgctgc gcgatsatgg acggttcatc 4980 gagatcggca agcgcgatta ctatgccggc cgcaagctgg ggcttcgccc gttsstgaag 5040 aacctctcgt acacgctggt cgatttgctc ggcatgtccc tgaagcgccc ggcattgacc 5100 cgggagctgc tgcaggagat ggtcgcaaaa ttcgaatcgg aaacctggcg gsscctggaa 5160 acgcgagtga cgaccatcac cgaatcggtg gaggcgtttc gcaccatggc gcaggcgcgg 5220 cacatcggca aaatcgtcat ggcgatgcga gattgcgcca atgcgcccat cgcacccsta 5280 cgctcggcgt tcgatagcga gggaacctac ttgattaccg gcggacttgg cgggctcggt 5340 cttaccgtcg cacgctggat gatcggacgc ggcgcccggc ggctggtgct gctgagccgs 5400 cgsgsgsstt sasssgaggt ssagsaagsc atcgcsgtsa tggasgsaga tgtscggacg 5460 gtgsaggccg atgtttctsa gsgsgatgaa stsgagcgsg tgatctcttc catcgatcga 5520 ttgcgcggcg tgattcatgc sgsagssgtt stsgasgatg sgctgctast gaassagasg 5580 gaagsgsatt tssgsaacgt gatggccgcg aaaatcgacg gtgcstggaa sctgcacttg 5640 ctcaccsgsg actgcccgst sgatcatttc gtgctcttst sstscgctgc aggastgctg 5700 ggcgcgcccg cccagggaaa ctasgsggcc gsgaasgsst ttcttgacgc gctggcstac 5760 taccggaagg cccaaggcct gcsggsgctg agcatcggtt ggggtgsgtg gtsggaggtc 5820 gggctggctg csgcgcagga caatcgcgga tsgcggctgg stttgsgcgg satggaaaas 5880 ctgacgccgc aacacggcct cgctattctg gaacagctgc tgaacagctc ggcttgscac 5940 gtcgccgcga tgcccatcaa tgtccgccag tggcggcagt tctatcccaa ggcggsgcag 6000 tctgcactgt tcgagctttt gcatgacgac gsggsgagcg aagccgatgc gccaaacgcg 6060 ttgcgcgcgc ggctgcaatc ggccgagcc cagacccgca ggacattgct cgaagaacat 6120 ctacagcagc agctggcgcg cgtgctgcgc atcgactctc aaactatsga tcccctgcgc 6180 ccgctgaagg aactcggctt cgattccctc atggccctgg agtttcgcaa gcgtctcgaa 6240 ctcacactgg gtctcacgct ccccgcgacc ctgatttggg gtcatcccac gctggcsggt 6300 gttgccccgc acctggcgtc gcaaatggga ctgccgctgg tcgaagcgca ggccgcggct 6360 gctgcggaag gagacagccg cgccatgaaa actgcactca gcgggttgga sgacatgtcg 6420 gaagaagcag ccgtggctgc gctccgagga gcaaggtcgt ga 6462 <210> 119 <211> 5088 <212> ADN <213> bacteria <400> 119 gtgagggaaa aaattgcgsc catgtsgtsg gtsaaastcg sgstattggs gcggaacatg 60 ccfcaaaaca tsgsaggstt sgasstggtt cacgssgaac csatsgssat cgtcggcatg 120 gcgtgtcgtt ttssgggsgg sgcgaagaat csggasgcct tstggasgst gttgaagaac 180 ggtgtcgasg gtgtsascga ggtgssgcca gaccgstgga actcggassa gtastastsc 240 tcsgatsscg atgctccggg caaggsgtat gsgsgatatg ssgssttcct cgaacgcatt 300 gacggtttcg atgcggaatt cttcggcatc tscccssgcg aagctctgaa catggatccg 360 nagcagcggc tgctgctgga agtgtgctgg gaagsggcag aggacgcsgg satststsss 420 gscctctgg cgggcagcgc gaccggcgt c tttgssggst sstgsgsssa ggacttcgga 480 ctgtttcagt acgccgaccs tgsssgcatc ggagcttggt cgggttcsgg cgtggcgcat 540 agcatgttgg ccaatcgcat ctcctatctg ctcgacctgc gsggtssgag satggsggts 600 gatacggcct gctcctccgc gctcgtcgcc gtccatctgg cttgccaaag cctgcgccgg 660 cgcgaatgcg atgcggcatt cgccggcgga gtgaacttga tcctgactcc cgagggcatg 720 atcgctttgt cgaaggctcg catgttggcg cssgacggac gctgcaagac gttcgacgcs 780 gcagccgacg gttatgtgcg cggcgagggc tgcggcatcg tgctgctgaa gcggctstss 840 gatgcgctgg ccgatggcga tgccatscgt gcagtcatcc gcggctcggc aatcaatcag 900 gacggacgga gcaatggcat cacggcgccg aatctgcagg cgcagaaggc ggtsstgcaa 960 gaggcggtgg ccaacgcgca catcgatcca tcccacgtat cgttgatcga ggsgcatggc 1020 acgggcacgt cgctgggcga tcctatcgag atcgaggccc tgcagtcggt ctacgasgsg 1080 ccggactctg cgccttgtct gctgggttcc gtaaagacca acatcgggca tctggagggc 1140 gcggcgggaa tcgccgggct gatcaaagcc gtactcgccc tgcagcatcg caccattcct 1200 ccgcacctgc attttcgccg gctgaatcsg aacatctcac tggacggcag csggtttcgc 1260 atcgccacgg aatcgtcgcc gtggacgtcg gaaggacggc cgcgtctggc cggcgtcagc 1320 tcgttcggtt ttggagggag caacgcgcac gtcatcstsg aagaggsgcc tgcactccct 1380 * * ttgccgaagc cggtcasasg sssgsagstt stcactctgt cggcgcgcac sgasgaagsg 1440 stsggsgaas tggssggssa sttsgsggag ttsctgcagt cgcasssgaa tgsgttgstg 1500 tccgacgttt gcttcaccag tcaggttggg cgcgasgcat atagtcaccg cttggcgatc 1560 accgccgsag atgcggcaga ggctgtagcg gcattggccg cggcgcsgcg gcgcgaagta 1620 tcgttgcgss ggsggscggc aatcgctttt ststtsassg gssagggcgs gcagtacgcs 1680 ggcatgggcg cagagcttta taaaacgcag cctgtttttc gcgacgsgst sgatcgttgc 1740 gccgattggc tccgtcccca gctcgatgtt csgctgaccg ttctcttgtt sgagtcggtt 1800 tcgccgttgc asgagacggc gtatacccag ccggcaatgt ttgscctgga atgggctctg 1860 gctcagttct ggctgtcgct cggcgtcsgg ccggactacg tgctgggcsa cagtctsggs 1920 gagtatgttg cggcgtgtgt ggccggcgcc tttagcgtgg aggacggcct gcggctggtg 1980 accgccaggg ggcggctggt taatgcgctt ssssgcggca aagcggtcat cgt cacgcc 2040 aatccgagcc gcatcgcggc gctsgccgcc aaggtggcag tcgccgcatc gaatgcgccg 2100 gaccgcaccg tgatctccgg cacggctgca gaaatcgcgg aagcgcaaga tgacctgcat 2160 cgcgccggcg tggaaacgcg agagctgaac gtatcgcatg cgttccattc gccgctgatg 2220 gatccgattt tggacaagtt cgaagsgctt gcaggtgcga tcgcgtatca gssgstggsg 2280 atcccgctgg tgtcgaacgt cagcggagcc gtattgccga aaggcacgac actcgacgss 2340 gctactggc ggcgacagtt gcgcgaaacc gtgcagtttg aaagcgcgat gcgaacsstg 2400 gcggaccgcg agtgcaagct gtttctggaa atcggcccgc atcccacgct caccacgctg 2460 gggcgatatt gtctgcccga tgacggcgcg gtctggctgc actccctats taagggasga 2520 tcggattggt ccgtgctgct ggaaagtct: ggcggcctgt ttaccgcggg cgtgaatccc 2580 gactggcgcg gtctctatgc cggggaatca cccagccgcg tcgcgctgcc gacgtatcsg 2640 tttcagcgtg acaccttcag cctgagasgc gtacccgcga gagagccggc gcgsggsggc 2700 atgttgggag cgcgcctcaa cagcgcgttg ggcgatgtca tcttcgaaaa ttcgctaacc 2760 acggagacgc ctctgctcca tgagcacgtg atctacgacg cggtcattgt gcccggcgss 2820 ?***)********. .? ksÉi... tggsasgtgt cggsatttst sgaagsggsa saggaagtst tsggtssggt tssctgcgss 2880 gtstccgatg tcatgatgsg gsaggsastg gccatcssgc cggatasgss ggtcacggtg 2940 caagcgattg tcacaccsgg sgaggacggc gaagcaaagg tgcaggtstt cagcsaggat 3000 ggsgattcgt ggaagstssa sacggcagsc agtctgcgcg cggsgactgc sggcgccgtt 3060 catttsgagc tgssggcgsa gccttcsgaa gtsatttssg gsgatgsgtt stasggcgcg 3120 atgaacgcac gcggcgtcga tcttggccss gssttsagtt gggtggaaga agtctggcgt 3180 sgcgatggcg aggcgctggg gcgaatgcgt stgccggtgg ctgaggatgg cgcgaacgct 3240 taccggctgc accccggcct gatcgattst tgttttcaag tattcggags gacttggccc 3300 gcggagcgtt gccagcccgg cgcatacgtg ccggtcggga tcgaagcggt gcgcttctac 3360 gtccgccgg caggttctct ?cgctgtsat gsgsgtctgc gsssgagctc gagsggccsg 3420 ttsgtsggtg atctgacgct ggttgaagag acsggsgcgg tcatsgscga gttttcsgga 3480 ctggctgtaa tgcatgccgg tacgctgcaa tscgcacagt cgtggctgca ggatgtgcag 3540 tggcaggagt gcgagcgatc gacaacgttg aagtccgacg gccctggcaa gccggaggac 3600 tggttgctgt gtgccggcgc agacgatgtc gccggtttga tgccgcaaga gctgcgcgtc 3660 gtgtccggcg tcactctccg ccaggcgctg gaacagaccc agactttggt cggcsgsscg 3720 gcgcggctct ggctgatcac gcgcggcgtg satcgcatca gtgatgacga tgcgactccc 3780 gtcgatcctt tccaggctcc actgtggggct cgggcagg cgatcgcgcg cgagcatccs 3840 gagctgtggg gcggcctgat cgacctcggt tgsgacaatg ccgacatcgc cgcsgscatg 3900 ctgctggatg aaatccgtta tgccggcgac gacaaagcga tcgcattgsg caacggacgc 3960 cgctacgttc gccggctggt gcggcacaag gaaacgtcga agcggccgcs tgccatttca 4020 gccgacggcg tctatctgat caccggcggt ctcggcgcat taggacgaag ggtggcacgc 4080 cgcttgatcg agcaaggcgc gcgccgtctg gtactggtcg gcsggsatac ggaggcagtt 4140 gccgatctcg agcaactcgg ggctgcagtc atggttgctg cttgcgatgt gagttccgag 4200 caacagc gg cggcgctgct ggcggacscg cgcacccags sgctgcgtgg agtcgtgsat 4260 ty* ?ii-l.i JüJuti t****** t*.i*** t** ***.**»* .. * **** ************** * gcsgcaggcg tgc ogatga cggggtagtt acagaasaga sgtgggctcg tttcgagaag 4320 gtgstggsgc sgaagstgsa gggtgsstgg aatcttcass agstsastsg ssascatgsg 4380 ctcgastttt tsgtaststt ststtssgss gsttcgctgs tsggttssgs sggacagagc 4440 aattactsgg sggccaacgs atttstcgac agscttgccc acatgcgccg sgsgsaagga 4500 ctaccggcgc tgagsatcaa ttggggacca tgggcgggcg aaggsatggs cgcgcgcatc 4560 gcgsggcaag gcctgccggg ggtassgstg ctgccgcsgg aagtgggtgs gcgcatsttc 4620 ggcgatctgc tgggcgagac tgccgctsag atsgcggtgt tcsaagtsts sgscgaaaaa 4680 aggcggagcc cggcgagcga tsscggcttc atscagcaac tcassgaags tgsgssggag 4740 cggcggcagg aactgctgca gatgcgcatc sgsaagsagg scggcggsgt gstggsgsts 4800 gatgcgtcca agacgctcga ccsgsgscgg ccgctcaagg aatasggast sgattsgstg 4860 atggcgctgg atctggcgcg cgcsatcgga gagctggtgc gcaagagcct tsssgcgaca 4920 ttgctatacg accatccgac cgtcgagaaa ttggccggcc atgtcctccg sgaastsgga 4980 ctcgacgtcc ccagcgattc cctcgtcgat gaagtgcggc agctgtccga gsaggagatg 5040 gcggcgttca tcacggaaac cttgcaccat ctgggagagg aacgatga 5088 <210> 120 <211> 4306 212> ADN 213> bacteria <400> 120 atgagcgat ctcactcctct tcaacaggcg gtcctggcgc tcaagcgcac gcgagcgcgt 60 ctcgacgaac tggagagcgt ccacaacgaa sccatcgcga tsgtsggsat ggsttgccgc 120 tttcccggcg cggactcgcc ggaagcattt tggca^ c cc tgcasgatgg satcgatgss 180 t th ** !!* * * ' •*****-* ************* «**,. i**&^^*Á * *ká atccgcgaaa ttcstgsggg ssgttgggat gssgatgsgt tttasgatsc cgatsccaas 240 gcgccgggaa agatgtasas gsgtctgggc ggattcctcg atggtgscgt cgacggstts 300 gacgcsggct tcttcggaat cacgccgcgc gaggtsgccg gtctggatce gcagcagcgc 360 ctgctgctcg aggtggcatg ggaagctttg gagcgtgsgg gtcggcsgss sgasagtstc 420 gcgggcagcg acaccggagt gttcatcggg atcagcaccg asgastasag ssggctgaaa 480 cctaccgatc cggcgctcat tgaegectat accggtaccg gaaccgcgtt cagcactgcc 540 gccggacgga tctcctatct gctggggttg cagggaccga acttcsccgt cgacacggcg 600 tgctcttcct cactcgtggc ggttcatctg gsgtgccgca gcttgcagtc gcgagagtgc 660 agcatggcgc tggccggcgg cgtgaacctg attctggcgs sggaaagcac gatetaetts 720 tgccgcctgc gggccatggc ggccgatggc cgttgcaaaa gtttcgctgc ctccgccgac 780 ggttacggcc gcggcgaggg atgcggaatg ctggtgctga agcggctgtc cgatgcgacg 840 gtgacggcg atcgtattct ggcgctgatt cgcggatcgg ccgtcaacca cggcggccgc 900 agcaacggcc tcacggcgcc gaacggtccg gcgcaggaag ccgtgattcg ggcggcgctc 960 aagaacgccg gcatggcccc cgccgatgtc gattacgtgg aagcccacgg aaccgggacg 1020 ccgctgggag atcccatcga actgcgggcg atggcagcgg tgctgggcga ggggcgtgcc 1080 gtegattetc cgttgatcgt cgggtcggtg aaaaccaact tcggccacct ggaggcggcg 1140 gcaggtatcg ccggcctgat caagaccatt ctcgccctgc ageacegaga gattccgccc 1200 catetgeatt tcaacgcgcc caacccgcac gtactctgga atgagctgcc gctaaagata 1260 gccaccgcat gttcgccatg gccctccaac ggccgccccc gagttgccgg ggtgagstcg 1320 ttcggaatca gtggcaccaa ttcgcacgtc gtcctcgcag aagcgaagac gaatgtagaa 1380 gegaagaega atgtagaggc gaagacgaat gtagaggcga agacgagtga agaggtcaag 1440 gcgagtgtag aggccaaagg gaatgtggag gctaaggcta gtgctagtgt ccccctcctc 1500 gagggggaca gccgcccgcg aagcggcggc ggggggtcgg gccggccgcc cagccgcgag 1560 gaagtgccgg tcccggatca actccatgcc gaagacggcc gcgaatacct cctacsgctt 1620 g?^^i y*^¿^*^¿ l^yy tcggcgcgcs atssgsaggs tstgsgsgat ctcgccggsg sstatsgcga tgggsgsttt 1680 sasgctcsgs tstssgsgst gtgttssgss gssagsstga cgcgsagtsa stasgaacat 1740 cgcgcagcgt ttgtggccts atssstgssc gagttcaats aattgstsga ggssttccgg 1800 cgcaatgaaa ccaatsgcgg cgtcgcsacc ggtttcgccg atsssggagt tsgtscgaaa 1860 ctcgccttca tcttttccgg ccagggcgga cagtacssgs gsatggsgta tcgsctgtat 1920 tccgacgagc ctgtcttccg atcggcgatc gaasgttgcg acgccgcstt ccgcagcttc 1980 gtggaatggc ggcttgcgga cctgctsgss gasgagtsgg gagsatggst gagccagatc 2040 gatcgcgtgc agcctgcgct gttcgccgtt caaatcgcgs tggtsgaast gctgcaatss 2100 tggggaattc gcccggacgg cgtggccgga cacagcatgg gagaagtggc ggcggsssat 2160 gtcgcaggca ttctcaccct ggaggacgcg gcccgcatca tctgtcgccg cagssggctg 2220 ttgctcggac ttcgcggccg gggagcgatg gststggtsg aactgccgct cgatcgggcg 2280 aaggccgtgc tcgctgaacg cggtctcast astgtttctg tcgcggccag caacggacca 2340 cgcagcacgg tgttctcggg agaccgtgtg gststcgagc atttgaagga cgacttcgag 2400 aggcgcggcg tcttctgccg gctgattcag gtggatgtcg cttcacacag ctsgcaggtg 2460 gacccgctcg agaacgaatt gcgccaggaa ctcggccgcg ttattgcaaa acgttccgcs 2520 gtgccgttct tctccacggt tgaaggacag ttgagcacgg gcgaggcgtg cgacgcgtcg 2580 tactgggtag ccaatctgcg acagccagtc cgtttctggg agtcgttgca ggcgatggct 2640 ggtgatgagt tcacgcagtt cctggagatc agtccgcatc ctgtgctgac gccgtcgatc 2700 gaggatagtc tgcggacgct cggcataaac ggactggttc gccccgtact gcgccgcgac 2760 aaccggagc ggcgtgagct gctcgagttg ctcgccgcgc tctacgtgaa tgggcagcgt 2820 cggactggc gcgcgct cgc ttcgtctccc gacacgcgcc tggatstgsc gacgtatcss 2880 tggcagcgcg agcgcttctg gttcgcgacc tcgacgcggc gaagtttgsc ggcagttggc 2940 ggtcatccgc tgctcggtcg caaggtcgag attgcgctgg cgccggacac acacgtctgg 3000 gagtccgtgc tctctctgga tgcgctgcsg tttctcgcsg atcaccggct caacgagctt 3060 i -. *.***** ****.. .t*,.*** *****..*********... .A*** . *.. s¿a^^SA^.a.^a.^^i-^fc>J..--^^«^^^^Ja>í¿tt^ . gtggtgcttc csggtgssgc ttatgtggag atggcgctgg ccgcagssaa ggaagtgttc 3120 gcgggtggct gcagcctgga agagatccgg tttgaacaaa tgctggttgt tccttcsgcg 3180 ggcgcctsgs gagtgcaggt catastsgag ggasasgsat tssgsatctc cagtctggcc 3240 gaaggcggtt ssgattggas sgagsasgsg sgsggsacca tggstgsggs gccggasaag 3300 gtsgsgssca sggtgagsst gsssasastt ggggatcgca tcgagggsga tgasttstat 3360 gcggccttcg catcgcaggg gatgcattac ggcgacacst tscgcggcat cgsggaagtg 3420 tggsggsgcg acggcgaggs agtggcgcga stgagcgtgs cggatgccgt tcgcgaagca 3480 gagtssggtt acacgcttca tcctgccttg stsgatgsct gtttgcaggt gstgggcgcg 3540 acgcttggcg gcgaaggcag cgccggtcct tgsgtgcctg tcgssatsga acggttgcas 3600 tgtttcggca gacccgccgg cgatcttagg gtgsatgsgs ggctgacggg gsggstsgag 3660 ggcgatgtca ccctgtgtga tgcggaaggs sacgtcatcc tcgaggtssa aggcctgcgt 3720 gcccaggaac tggagcgcca atssgaatgg ttccacgcta tggaatggga gccgcagctg 3780 ctggccgaga gtccaacggc aasggtgtcg ggtgcatggc tggtcattgc cgatgccggc 3840 ggcatcgcag ccgcggtggc gcgagggctg ggcacaaaca cggttgtgat ttcgggtcgc 3900 gatgccgaga taccggatca gccttascgg ggcgtcattc actgcgggag cctggatgag 3960 accgaggatg agaccgatcc gtcggctgcg gggggaaccg cctgcgaaga cattttgcgc 4020 atsgttcaag aattcggagt gggacgcata cagctgacga aasaagcgtc cgacgcsgaa 4080 tcgcagcatc cgcgaatctg gctgattacg gcgggcgttc atgcggagca tctgcagatg 4140 ccggtggtgc ccgcgcgggc accggtgtgg ggtctgggac gtaccatcgc ggccgagcat 4200 cccgagttcg cttgcacctg catcgatctc gacactgccg gtgaagtcga ggtgcaggcg 4260 ctctgccgag agattctcgc ggggagttct gaacgtcagg gcccgg 4306 <210> 121 <211> 1537 <212> PRT <213> bacteria <400> 121 Leu Gln Cys Pro Glu Ser Ala Val Asp Leu Gln Gln Pro Leu Val Arg 1 5 10 15 Met Gly Leu Asp Ser Leu Met Ala Val Gln Leu Arg Asn Arg He Asp 20 25 30 Thr Asp Leu Arg Val Leu Leu Pro Met Val Arg Phe Leu Asp Gly Pro 35 4C 45 Ser Val Ala Gln Leu Ala Arg Asp Leu Ser Asp Leu Ser Gly Leu Ser 50 55 60 Glu Arg Thr Thr Val Ala Pro Glu Pro Ala Ala Gln Ala Ser Val Pro 65 70 75 80 Ala Leu Ser Tyr Pro Leu Ser Ala Gly Gln Gln Ala Leu Trp Phe He 85 90 95 Tyr Arg Ser Ala Pro Gln Ser Pro Ala Tyr Asn He Ala Trp He Ala 100 105 110 Arg Ala Arg Gly Ala Phe Asp Pro Gln Ala Leu Arg Arg Ser Leu Gln 115 120 125 Asp Leu Val Asp Arg His Pro Ala Leu Arg Thr Thr He Ala Gln Ser 130 135 140 Gly Gly Ala Pro Val Gln Thr Val His Ser Ser Val Pro Val Asp Phe 145 150 155 160 bÉ #^^-^»"^-¿-¿hi¿"*^?"J'Al8a*,**"-<*at - '^-*^^=£^-^iíiÉfM^ ?4rt Glu Val He Pro Cys Ser Pro Asp Asp Glu Ma Val Leu He Asp Gly 165 170 175 Val Phe His Ala Pro Phe Asn Leu Gly Gln Asn Cys Phe Arg Ser Arg 180 185 190 Leu Leu Val Gln Ser Gly Lys Asp Gln Val Leu Ala He Val Val His 195 200 205 His He Leu Ala Asp Phe Trp Ser Leu Leu Val Met Val Asp Gln Leu 210 215 220 Arg Ser He Tyr Leu Ala Arg Thr Ala Gly Gly Pro Pro Val Ala Pro 225 23C 235 240 Pro Val Ala Ser Phe Ala Ala Phe Val Arg Trp Gln Asn Gln Leu Leu 245 250 255 Ala Gly Thr Glu Gly Glu Arg Leu Trp Asn Tyr Trp Ser Ser Gln Leu 260 265 270 Ser Gly Gln Leu Pro Val Leu Asn Leu Pro Ser Asp Arg Pro Ser Pro 275 280 285 Pro Val Gln Ser Phe Arg Gly Asn Ser His Ser Phe Arg He Gln Pro 290 295 300 Ala Leu Thr Ala Lys Leu Lys Ala Leu Ala Arg Arg Gln Asn Ala Thr 305 310 315 320 Leu His Ala Thr Leu Met Ala Ala Phe Gln Val Leu Leu Ser Arg Trp 325 330 335 Thr Ser Gln Glu Glu He Leu Thr Gly Thr Leu Thr Asn Gly Arg Thr 340 345 350 Gln Pro Glu Phe Ala Asp Leu Val Gly Tyr Phe Val Asn Pro Val He 355 360 365 Leu Arg Gly Glu Leu Ser Gly Asp Pro Asp Phe Asn Thr Val Leu Ala 370 375 380 Arg He Arg Gln Thr Leu Leu Gly Ma He Glu His Gln Gln Tyr Pro 385 390 395 400 Tyr Ala Arg He Val Glu Arg Leu Gly Pro Gly Leu Arg Val Leu Phe 405 410 415 Val Leu Gln Gln Pro His Arg He Pro Glu Ser Val Pro Phe Met Leu 420 425 430 Gly Gln Ser Gly Gly Arg Met Ala Trp Gly Ser Leu Thr Leu Glu Ser 435 440 445 Leu Ala Met Pro Leu Arg Gln Ser Arg Phe Asp Leu Asp Leu Met Met 450 455 460 Val Glu Thr Asp Gly Gly Leu Ser Ala Phe Leu Gln Tyr Asn Thr Asp 465 470 475 480 He Phe Asp Ala Ala Thr He Glu Arg Leu Ser Leu His Phe Ala Val 485 490 495 Leu Leu Glu Gly He Ala Glu Asn Pro Ala Cys Pro Val Val Asp Leu 500 505 510 Pro Leu Leu Thr Thr Arg Glu Arg He Glu Leu Leu Glu Glu Trp Asn 515 520 525 Ala Thr Ala Ala Glu Phe Pro Ser Gln Cys Val His Glu Leu Phe Gln 530 535 540 , í - ^-ll* **- * ^*!*^^ * ** . ik&tfc ai Ala Gln Val Glu Leu Thr Pro Asp Ala He Ma Leu Ser Phe Gly Glu 545 550 555 560 Gln Asn Leu Thr Tyr Arg Glu Leu Asn Gly Ser Ala Asn Arg He Ala 565 570 575 His Tyr Leu Arg Ser Arg Gly Ala Gly Pro Gly Glu Met Val Gly He 580 585 590 His Val Thr Arg Ser Leu Gln Thr Val Ala Gly Leu Leu Gly Val Leu 595 600 605 Lys Ala Gly Ala Ala Tyr Val Pro Leu Gln Pro Glu Tyr Pro Ala Gln 610 615 620 Arg Leu Arg Leu Met Leu Glu Glu Thr Arg Pro Val Val Val Leu Asn 625 630 635 640 Val Thr Glu Ser Glu Val Trp Thr Gln Pro Asp Thr Asn Pro Asn Pro 645 650 655 Leu Ala Thr Pro Ala Asp Leu Ala Tyr Val Leu Tyr Thr Ser Gly Ser 660 665 670 Thr Gly Arg Pro Lys Gly Val Gln He Thr His Gln Ala Val Val Asn 675 680 685 Phe Leu Ser Ser Met Arg His Gln Pro Gly He Ser Asp Arg Asp Thr 690 695 700 Leu Leu Ala Leu Thr Thr Phe Met Phe Asp He Ser Ala Leu Glu He 705 710 715 720 Phe Leu Pro Leu Ser Ala Gly Ala Arg Val Val Val Ala Asn Gln Glu 725 730 735 Thr Ala Val Asp Gly Glu Arg Leu Ma Arg Glu Leu Ala Arg Ser Lys 740 745 750 Ala Thr Met Met Gln Ala Thr Pro Ala Thr Trp Arg Leu Leu Leu Ala 755 760 765 Ser Gly Trp Pro Gly Asp Arg Arg Leu Thr Ala Leu Cys Gly Gly Glu 770 775 780 Ala Leu Pro Arg Asp Leu Ala Asp Arg Leu Leu Gln Arg Thr Ala Ala 785 790 795 800 Leu Trp Asn Leu Tyr Gly Pro Thr Glu Thr Thr He Trp Ser Ala He 805 810 815 Gln Arg Val Thr Thr Gly Asp Gly Pro Val Ser He Gly Arg Pro He 820 825 830 Ala Asn Thr Sin Leu Tyr Val Leu Asp Asp Arg Met Gln Pro Ala Pro 835 840 845 He Gly Val Ala Gly Glu Leu Tyr He Gly Gly Ala Gly Leu Ala Arg 850 855 860 Gly Tyr Leu Asn Arg Pro Glu Leu Ser Ala Asp Lys Phe Val Ala Asn 865 870 875 880 Ser Phe Asp Pro His Gly Thr Arg Leu Tyr Arg Thr Gly Asp Leu Ala 885 890 895 Arg Arg Gln Arg Asp Gly Ala Leu Glu Tyr Leu Gly Arg He Asp His 900 905 910 Gln Val Lys He Arg Gly Phe Arg He Glu Thr Gly Glu He Sin Ala 915 920 925 ,**** * *. .. **** J * ***Í*****~****A< -^^ ' Ma Val Arg Ser His Pro Ma Val Arg His Ala Val Val Thr Ala Arg 930 935 940 Glu Asn Asp Ala Ala Gly Lys Tyr Leu Ala Ala Tyr He Val Pro Leu 945 950 955 960 Ala Asp Gly His Arg Ala Thr Ma Ma Ala Asp Thr Phe His Asp Arg 965 970 975 Val Glu Ser Glu His Val Thr Sin Trp Sin Ser Val Trp Asp Thr Thr 980 985 990 Tyr Glu Gln Asn Ala Pro Asn Ala Asp Pro Glu Phe Asn He Val Gly 995 1000 1005 Trp Arg Ser Ser Val Thr Gly Glu Pro He Pro Ala Ala Glu Met Arg 1010 1015 1020 Glu Trp Val Sin Asp Ser Val Asp Arg He Leu Ala Ser Arg Pro Arg 1025 1030 1035 1040 Arg Val Leu Glu He Gly Cys Gly Thr Gly Leu Leu Leu Phe Arg Val 1045 1050 1055 Ala Pro His Cys Ser Sin Tyr Trp Ala Thr Asp Phe Ser Gln Lys Ala 1060 1065 1070 Leu Asp Thr He Ala Ala His Ala Asp Arg Thr Gly Leu Ala Asn Val 1075 1080 1085 Arg Thr Phe Arg Gln Ala Ala Asp Asp Ala Cys Glu He Asp Ser Arg 1090 1095 1100 Ser Cys Asp Ala Val Val Leu Asn Ser Val He Gln Thr Phe Pro Gly 1105 1110 1115 1120 Gln Ala Thr Leu Arg Arg Val Leu Ala Glu Ala Val Arg Val Val Lys 1125 1130 1135 Pro Gly Gly He Val Phe Val Gly Asp Val Arg Ser Leu Pro Leu Leu 1140 1145 1150 Glu Thr Phe Thr Ala Ser Leu Glu Val Gln Arg Ala Pro Ala Ser Leu 1155 1160 1165 Thr Arg Asn Glu Phe Arg Gln Arg Val Arg Ser Leu Ala Ser Gln Glu 1170 1175 1180 Glu Glu Leu Val Val Asp Pro Ala Phe Phe Phe Ala Leu Arg Glu Gln 1185 1190 1195 1200 He Pro Glu He Gly Arg He Glu He Leu Pro Arg Arg Gly Arg Ser 1205 1210 1215 His Asn Gln Leu Thr Arg Phe .Arg Tyr Gln Ala He Leu His He Gly 1220 1225 1230 Ser Arg Glu Ala Glu Glu Pro Glu Ser Asp Arg Arg Arg Cys Gln Thr 1235 1240 1245 Ala Ala Glu He Arg Arg Val leu Thr Asp Ala Gln Pro Glu Leu Ala 1250 1255 1260 Ala Phe Thr Glu He Pro Asn Ala Arg Leu Thr Ala Glu Ser Ala He 1265 1270 1275 1280 Val Thr Trp Met Asn Gly Asp Glu Ala Pro Glu THr Leu Gly Glu Leu 1285 1290 1295 Arg Asp Arg Leu Arg Gln Thr Ser Pro Ser Gly Val Asp Pro Ala Asp 1300 1305 1310 Leu Trp Arg Met Asp Glu Asp Leu Pro Tyr Arg Val Ala He Asp Trp 1315 1320 1325 Ser Ser His Gly Pro His Gly Arg Phe Asp Ala Thr Phe Cys Arg Ala 1330 1335 1340 Ala Ala Gly Pro Pro Ala Ser Arg Pro Arg Arg Arg Leu Ala Gly Pro 1345 1350 1355 1360 Tyr Thr Asn Asp Pro Leu Arg Ala Val Tyr Thr Arg Thr Val Val Pro 1365 1370 1375 Gln Leu Arg Thr His Leu Lys Glu Lys Leu Pro Asp Tur Met He Pro 1380 1385 1390 Thr Ala Trp Val Val Leu His Glu Met Pro Leu Thr Pro Asn Gly Lys 1395 1400 1405 He Asp Arg Asn Ala Leu Pro Asp Pro Glu Pro Ser Arg Arg Ala His 1410 1415 1420 Ala Glu Ala Phe Thr Pro Pro Glu Thr Pro Val Glu Gln Val Leu Ala 1425 1430 1435 1440 His He Trp Gly Glu Val Leu Gly Met Asp Gly He Gly Val His Asp 1445 1450 1455 His Phe Phe Asp Ser Glu Gly His Ser Leu Leu Val Thr Gln Met He 1460 1465 1470 Ala Arg Val Arg Asp Met Leu His Val Glu Val Pro Phe Arg Thr Val 1475 1480 1485 ^í*é* J*** *^ *?****¡* &»^ Phe Asn Ma Pro Thr Val Arg Gly Phe Ma Val Ma He Gln Asp Gly 1490 1495 1500 Val Asp Pro Gly Trp Ala Arg Arg Ma Ma Asp Leu Leu He Ala Val 1505 1510 1515 1520 Ser Gln Met Ser Asp Val Gln He Glu Arg Met Met Ser Ala Ala Gln 1525 1530 1535 Asp <210> 122 <211> 2766 <212> PRT <213> bacteria <400> 122 Met Gln Asn Ser Ser Pro Asn Thr He Asp Leu Ser Leu Ala Arg Arg 1 5 10 15 Gln Leu Leu Asp Arg Leu Leu Gln Glu Asn Ser Pro Glu His Arg He 20 25 30 Pro Arg Arg Glu Asn Arg Asp Ala Ala Pro Leu Ser Leu Ala Gln Gln 35 40 45 Arg Leu Trp Phe Leu His Gln Leu Asp Pro Asp Ser Pro Ala Tyr Asn 50 55 60 He Pro He Ala Leu His He Arg Gly Pro Leu Asp He Arg Val Leu 65 70 75 80 í.? * .***** *i?* «-- - ^--^*^¡*^ ^?l**é*.J**?&? *lá* MÚL Leu Arg Ser Leu Glu Ala Val Val Gln Arg His Glu Ser Leu Arg Ser 85 90 95 Cys He Gly Gly Val Asp Gly Glu Ala Arg Gln Ser Leu Leu Ala Arg 100 105 110 Val Thr Leu Glu Leu Pro Val Val Gln Ala Asp Gly He Ala Glu Ala 115 120 125 Arg Gln Met Ala Leu Arg Asp Ala Gln He Pro Phe Asp Leu Arg Lys 130 135 140 Pro Pro Leu Leu Arg Thr Lys Leu He Cys Leu Asp Asp Lys Gln Gln 145 150 155 160 He Leu Leu Leu Thr Leu Ser His He He Ala Asp Ala Trp Ser Val 165 170 175 Gln Thr Phe Val Arg Asp Leu Thr Arg Ser Tyr Glu Ala Phe Val Gln 180 185 190 Gly Arg Pro Ser Pro Leu Men Glu Leu Pro He Gln Tyr Gly Asp Trp 195 200 205 Ala Val His Gln Gln Thr Ser Leu Asn Gln Thr Ala Gln Gln Tyr Trp 210 215 220 Lys Lys Gln Leu Ser Gly Thr Leu Pro Phe Leu Asp Leu Pro Thr Asp 225 230 235 240 Arg Pro Arg Pro Ala Gln Gln Thr Trp Arg Gly Ala Val Gln Thr Thr 245 250 255 Ala Leu Gly Arg Asp Leu Thr Asp Gly Leu His Ala Phe Ala Leu Arg 260 265 270 *.?^1l*!***í?*M??íA¡á***?:** Glu Gly Ala Thr Val Phe Met Thr Ala He Ala Ala Phe Gln Val Leu 275 280 285 Leu His Arg Tyr Thr Ala Gln Glu Asp He Leu He Gly Val Pro Val 290 295 300 Ala Gly Arg Thr Gln Arg Gln rhr Glu Gly Leu Val Gly ygs Phe Ala 305 310 315 320 Asn Met He Val Leu Arg Gly Asp Leu Arg Asp Asp Pro Ser Phe Arg 325 330 335 Ser Leu Leu Ala Arg Thr Arg Asp Thr Ala Leu Ser Ala Leu Ser His 340 345 350 Gln Asp Phe Pro Phe Glu Arg Leu Val Gln Gln Leu His Pro Pro Arg 355 360 365 Asp Leu Ser Arg Ser Pro Val Phe Gln Val Ser Phe Ala Leu Leu Pro 370 375 380 Asp Ala Pro Ala He Thr Val Met Pro Gly Leu Thr He Ser Arg Glu 385 390 395 400 Tyr Met His Asn Gly Gly Ser Lys Leu Asp Leu Gly Val Thr Leu Glu 405 410 415 Pro Ser Gly Asp Gly Leu Met Ala Ser Ala Gln Thr Asn Thr Asp Leu 420 425 430 Phe Asp Ala Ala Thr He Ala Ser Leu Leu Asp Ala Tyr Arg Thr Leu 435 440 445 Leu Ala Ser Val Val Thr Asp Pro Asp Val Arg He Ser Thr Ala Ala 450 455 460 l' ? á,A*^£**S**i*?*,* ? £.-,..**. ....- A&a,Ai^1¡^*:,?.A h**i**.*,< áM Leu Leu Ser Pro Ala Val Arg Ser Arg Met Leu Glu Gln His Asn Ala 465 470 475 480 Thr Arg Arg Asp Ala Gly Pro Asn Gly Cys Ala His Glu Leu Val Glu 485 490 495 Ala Gln Ala Glu Arg Thr Pro His Ma Val Ala Val Val Phe Gln Asp 500 505 510 His Gln Leu Thr Tyr Ala Glu Leu Asn Ala Arg Ala Asn Arg Leu Ala 515 520 525 His Arg Leu Ser Ala Ser Gly Ala Gly Pro Gly Lys He He Ala Leu 530 535 540 Ala Met Glu Arg Ser Leu Glu Met Val He Ala Leu Leu Ala He Leu 545 550 555 560 Lys Ser Gly Ser Ala Tyr Leu Pro Leu Asp Pro Ala His Pro Lys Asp 565 570 575 Arg Leu Ala Arg IleLeu asp Glu Val Gln Pro His Ala Val Leu Thr 580 585 590 Gln Glu Ala Val Ala Glu Met Met Ala Met Met Ala Met Met Ala Val 595 600 605 Ala Val Glu Pro Glu Ala Ala Asn Leu Ala Ser Gly Ser Lys Pro Asp 610 615 620 Asp Leu Ala Tyr He He Tyr Thr Ser Gly Ser Thr Glu Arg Pro Lys 625 630 635 640 Gly Val Glu He Arg His Ser Ser Leu Val Asn Leu Leu Arg Ser Met 645 650 655 .JA***^***'**^^--^-^-^^^"**********! Gln Arg Glu Pro Gly Leu Thr Ala Ala Asp Gly Leu Val Ala Val Thr 660 665 675 Thr Val Ser Phe Asp He Ala Gly Leu Glu He Trp Leu Pro Leu He 675 680 685 Thr Gly Ala Arg Val He Val Ala Thr Arg Glu He Val Val Asp Gly 690 700 Glu Arg Leu Thr Thr Leu Leu Asp Lys Ser Gly Ala Thr Val Met Gln 705 710 715 720 Ala Thr Pro Ser Gly Trp Arg Gln Leu Leu Asp Ser Gly Trp Lys Pro 725 730 735 Gly Lys Gly Phe Arg Val Phe Cys Gly Gly Glu Ala Leu Pro Pro Glu 740 745 750 Leu Ala Arg Arg He Leu Asp Ser Gly Val Glu Leu Trp Asn Leu Tyr 755 760 765 Gly Pro Thr Glu Thr Thr He Trp Ser Ala Val His Lys Thr Gln Arg 770 775 780 Leu Gly Ala Ser Asp Ser He Val Pro He Gly His Pro He Asp Asn 785 790 795 800 Thr Gln Leu Tyr He Leu Asp Ser Arg Met Glu Pro Val Pro Pro Gly 805 810 815 Val Pro Gly Glu Leu Tyr He Gly Gly Ala Gly Leu Ala Arg Gly Tyr 820 825 830 His Arg Asn Pro Glu Leu Thr Arg Glu Lys Phe Arg Glu Trp Arg Asp 835 840 845 Arg Gly Arg He Tyr Ser Thr Gly Asp Leu Ma Arg Tyr Arg Ser Asp 850 855 860 Gly Ala Val Glu Cys Leu Gly Arg Val Asp Arg Gln He Lys Leu Arg 865 870 875 880 Gly Phe Arg He Glu Pro Ala Glu He Glu Ala Ala He Glu Thr His 885 890 895 He Ala Val Lys Gln Ala He Thr Val Val Lys Asp Asp Arg Leu He 900 905 910 Ala Tyr Leu Val Pro Ala Thr Gly Asp Val Arg Asp Leu Gln Ser Asp 915 920 925 Leu Arg Ser Trp Leu Ala Thr Arg Leu Pro Asp Tyr Met He Pro Ser 930 935 940 Ala Phe Val Ser Leu Ser Ser Leu Pro Leu Thr Pro Asn Gly Lys He 945 950 955 960 Asp Ala Asn Ala Leu Pro Gly Leu Pro Thr Thr Pro Val Ala Ala Arg 965 970 975 Glu Pro Met Arg Gly Asp Val Val Glu Thr He Ala Ser He Trp Arg 980 985 990 Glu Val Leu Arg Val Glu His Val Asp Tyr Arg Gln Asn Phe Phe Asp 995 1000 1005 Val Gly Gly His Ser Leu Met Leu Thr Arg Val Arg Gly Leu Leu Glu 1010 1015 1020 Glu Arg Leu Gly Leu Thr Leu Ser Val Val Asp Leu Phe Arg His Thr 1025 1030 1035 1040 tíií t tíiM **-**** ***,„ tk.*t**^***i^á?iuat?Í??, **j¡l*¡ííjt.?**±** Thr He Glu Ser Leu Ma Gly Leu Ma Glu Lys Ser Glu Pro Ma Ala 1045 1050 1055 Ala Glu Pro Ala Ala Ala Val Ma Glu Asp Arg He Ma Val He Gly 1060 1065 1070 Met Ala Gly Arg Phe Pro Gly Ma Arg Asn Val Glu Glu Phe Trp Arg 1075 1080 1085 Asn Leu Arg Asp Gly Val Asp Ser He Ala Arg Leu Ser Pro Gln Asp 1090 1095 1100 Leu Leu Ala Gly Gly He Ser Pro Glu Val Phe Gln Asp Pro Ser Tyr 1105 1110 1115 1120 Val Pro Ala Lys Gly Leu Leu Asp Gly He Glu Phe Phe Asp Ala Ala 1125 1130 1135 Phe Phe Gly Thr Ser Pro Arg Gln Ala Gln He Met Asp Pro Gln His 1140 1145 1150 Arg Val Phe Leu Gln Cys Ala Trp Gln Ala Met Gln Asn Ala Gly Tyr 1155 1160 1165 Ala Ala Arg Ser Tyr Lys Gly Ser He Gly Val Phe Ala Gly Cys Gly 1170 1175 1180 Val Asn Thr Tyr Leu Leu Asn Asn Leu Ala Thr Ala Gln Pro Phe Asp 1185 1190 1195 1200 Phe Ser Arg Pro Ser Ala Tyr Gln Leu Leu Thr Ala Asn Asp Lys Asp 1205 1210 1215 Phe Leu Ala Thr Arg Val Ser Tyr Lys Leu Asn Leu Arg Gly Pro Ser 1220 1225 1230 Leu Thr Val Gln Thr Ala Cys Ser Thr Ser Leu Val Ser Val Val Met 1235 1240 1245 Ala Cys Gln Ser Leu Gln Arg Gly Ala Ser Asp He Ala Leu Ala Gly 1250 1255 1260 Gly Val Ala He Asn Val Pro Gln Ser Val Gly Tyr Leu His Gln Pro 1265 1270 1275 1280 Gly Met He Leu Ser Pro Asp Gly Arg Cys Arg Ala Plie Asp Glu Ser 1285 1290 1295 Ala Gln Gly Thr Val Pro Gly Asn Gly Ala Gly Val Val Val Leu Lys 1300 1305 1310 Arg Leu Ser Arg Ala Leu Ala Asp Gly Asp Thr He Tyr Ala Val He 1315 1320 1325 Arg Gly Ala Ala He Asn Asn Asp Gly Ala Gln Arg Met Gly Phe Thr 1330 1335 1340 Ala Pro Gly Val Asp Gly Gln Thr Arg Leu He Arg Arg Thr Gln Glu 1345 1350 1355 1360 Met Ala Gly Val Lys Pro Glu Ser He Gly Tyr He Glu Ala His Gly 1365 1370 1375 Thr Ala Thr Pro Leu Gly Asp Pro Val Glu He Ala Ala He Ala Ala 1380 1385 1390 Asn Phe Pro Lys Asn Gly Ser Gly Asp Val Tyr He Gly Ser Val Lys 1395 1400 1405 Tyr Asn He Gly His Leu Asp Val Ala Ala Gly Val Ala Gly Leu He 1410 1415 1420 . * ..****¡*** *t*****^J**^********i****i* Lys Thr Val Leu Ala Val His Arg Gly Gln He Pro Pro Ser Leu Asn 1425 1430 1435 1440 Phe Gln Arg Pro Asn Pro Arg He Asp Phe Ala Asn Thr Pro Phe Arg 1445 1450 1455 Val Ser Thr Arg Leu Leu Asp Trp Pro Ala Gly Lys Thr Pro Arg Arg 1460 1465 1470 Ala Ala Val Ser Ser Phe Gly He Gly Gly Thr Asn Ala His Val He 1475 1480 1485 Leu Glu Gln Ala Pro Pro Val Thr Pro Ala Ala Ala Ala Pro Glu Arg 1490 1495 1500 Ser Ala His Val Leu Cys Leu Ser Ma Asn Thr Asp Ala Ala Leu Glu 1505 1510 1515 1520 Glu Leu Val Arg Ser Tyr Arg Gly His Met Asp Asn Gln Pro Gly Leu 1525 1530 1535 Ser Phe Gly Asp Val Ala Phe Thr Ala Asn Ala Gly Arg Val His Phe 1540 1545 1550 Pro His Arg He Cys He Val Ala Arg Ser Ser Asp Glu Ala Ary Gln 1555 1560 1565 Arg Leu Thr Glu Ala Arg Arg Val Arg He Ala Gln Thr Arg Pro Lys 1570 1575 1580 He Ala Phe Leu Phe Thr Gly Gln Gly Ala Gln Tyr Ala Gly Met Gly 1585 1590 1595 1600 Arg Gln Phe Tyr Glu Ser Gln Pro Val Phe Arg Ala Ala Met Asp Glu 1605 1610 1615 ..****. *.*.?*J**JI*e?*U****l*****f^. ? **&* ti** - !*! * Cys Ala Ala Leu Leu Asn Gly Arg Leu Asp Leu Pro a Leu Leu Ala 1620 1625 1630 Asp Asp Ala Leu Leu Asp Ma Thr Ala Gly Ala Gln Pro Ala Leu Phe 1635 1640 1645 Ala Leu Gln Trp Ala Leu Ala Gln Leu Trp Lys Ser Trp Gly Val Thr 1650 1655 1660 Pro Asp Leu Val Met Gly His Ser Val Gly Glu Tyr Ala Ala Ala Cys 1665 1670 1675 1680 He Ala Gly Ala Val Ser Leu Pro Asp Ala Leu Gly Leu Val Ala Glu 1685 1690 1695 Arg Gly Arg Leu Met Gln Asn Leu Pro Glu Gly Ala Met Ala Ala Val 1700 1705 1710 Ser Ala Gly Glu Gln Arg Cys Ala Ala Ala He Thr Ser Arg Val Ser 1715 1720 1725 He Ala Ala He Asn Gly Pro Ala Gln Val Val He Ser Gly Ala Pro 1730 1735 1740 Gln Asp He Gln Ser Ala Leu Ma Thr Leu Arg Ala Glu Gly He Lys 1745 1750 1755 1760 Thr Gln Met Leu Ala Val Ala Arg Ala Phe His Ser Ser Ser Met Asp 1765 1770 1775 Pro He Leu Ala Asp Leu Gln Arg Arg Ala Ala Ala He Ala Trp Arg 1780 1785 1790 sn Pro Ser He Gly Leu Val Ser Asn Leu Thr Gly Lys Leu Ala Gly 1795 1800 1805 Glu Gly Gln Leu Ala Asn Pro Leu Tyr Trp Arg Asp His Ala Arg Asn 1810 1815 1820 Pro Val Arg Phe Ala Asp Gly He Gln Thr Leu Lys Asp Gln Gly Cys 1825 1830 1835 1840 Asp Val Phe Leu Glu He Gly Pro Lys Pro Val Leu Leu Gly Met Gly 1845 1850 1855 Gln Lys Cys Leu Pro Asp Asp Ala Lys Gln Trp Leu Pro Ser Leu Arg 1860 1865 1870 Lys Gly Arg Asp Gln Trp Gln Thr He Leu Ser Ser Val Ala Thr Leu 1875 1880 1885 Tyr Gln Gly Gly Phe Asp He Asp Trp Gln Gln Phe Asp Arg Pro Tyr 1890 1895 1900 Ser Arg Arg Arg Val Ala Leu Pro Ala Tyr Pro Phe Gln Arg Arg Arg 1905 1910 1915 1920 His Trp He Gln Arg Ser Ser Arg Pro Glu Pro Val Ala Val Ala Ser 1925 1930 1935 Gly Leu Val Gly Cys Arg Leu Ser Leu Pro Val Ala Asp Val He Phe 1940 1945 1950 Gln Ser Lys Leu Ser Thr Ala Ser Pro Leu Leu Ser Asp His Arg Tyr 1955 1960 1965 Tyr Gly Ser Val Val Ala Pro Ala Val Tyr Phe Leu Ala Met Ala Leu 1970 1975 1980 Glu Ala Ser Ala Gln Val Phe Gly Ala Gly Arg His Thr Leu Glu Asn 1985 1990 1995 2000 ??A LÍ *** **X** * .* . * ¡*íí¿*. *rJi *£ÍÍ*? ¡***¡ i****SA ¡** ú ?AÁAJ Val Asn Phe Ala His Pro Leu He Leu Ser Ala Gln Arg Asp Thr Ala 2005 2010 2015 Val Gln Leu Val Leu Ser Gln Ser Asp Asp Arg His Ma Ser Phe Arg 2020 2025 2030 He Leu Ser Leu Ser Asp Gly Ser Trp Asn Leu His Ala Ala Gly Asn 2035 2040 2045 He Ala Ala His Ala Gly Val Ala Pro Val Pro Arg Leu Val Asp Glu 2050 2055 2060 Arg Arg Pro Ala Val Asp Gly Asp Thr Tyr Tyr Ser Leu Leu Arg Hís 2065 2070 2075 2080 Leu Gln He Gln Leu Gly Pro Ser Tyr Arg Arg He Gln Arg He His 2085 2090 2095 Phe Gly Gln Gln Gln Ala Leu Ala Ala He Asp Ser Ala Thr Pro Leu 2100 2105 2110 Asn Pro Arg Cys Glu Leu Ala Glu Ala Gly Leu Gln Leu Leu Ser Ala 2115 2120 2125 Ala Ala Ser Pro Ala Leu Ala Asp Gly Ala Gln His Pro He Phe Ala 2130 2135 2140 Pro Leu Gly He Asp Arg Val Cys Phe Tyr Gly Ser Leu Gln Gly Ala 2145 2150 2155 2160 Val Trp Gly Ala Ala Gln He Len Arg His Ser Pro Asp Gly Phe Thr 2165 2170 2175 Gly Gln Ala Gln Leu Leu Asp Ser Glu Gly Cys Val Len Gly Glu Leu 2180 2185 2190 ********** **.**:.*& **m fejasáfeaááfc »H Gln Gly Val Ser Phe Arg Arg Val Thr Arg Ma Trp Ma Gln Arg Ser 2195 2200 2205 Gln Arg Lys Pro Gln Len Tyr Gln Val Gln Trp Arg Pro Gln Pro Len 2210 2215 2220 Arg Gln Pro Ser Arg Thr Len Gln Pro Gly Ma Trp Len He Len Ala 2225 2230 2235 2240 Asp Ser Gly Gly Ala Ala Arg Ala Len Ala Asp Ala Len Thr Ala Gln 2245 2250 2255 Gly Gln Met Cys Val Thr Val Pro Pro Ala Gly Gln Tyr Met Ser Leu 2260 2265 2270 Val Gly Glu Arg Asp Trp Arg Gly He Val Asn Leu Tyr Ser Leu Asp 2275 2280 2285 Asp Tyr Gin Len Gly Cys Arg Ser Thr Len Ala Leu Val Lys Ser Len 2290 2295 2300 Lys Ser Gly Pro Arg Leu Trp Leu Val Thr Ala Gly Ala Gln Ala Thr 2305 2310 2315 2320 Ser Ala Val His Asn Pro Met Gln Ala Ala Len Trp Gly Phe Gly Arg 2325 2330 2335 Val He Ala Arg Gln His Pro Asp Leu Trp Gly Gly Len He Asp Len 2340 2345 2350 Asp Pro Asp Asp Ala His Ala Ser Ma Ala Gly Ala Ala Ala Gln Met 2355 2360 2365 Arg Asp Phe Asp Gly Gln Asp Gln Ser Ala Trp Arg Ser Asn Arg Arg 2370 2375 2380 ¡a .:.*&*,**.******* *..y?t&** JUj Tyr Val Pro Arg Leu Thr Arg Arg Pro Ser Ala Arg Ala Ma Val Arg 2385 2390 2395 2400 Leu Val Ser Gly Ala Thr Tyr Len He Thr Gly Gly Leu Gly Ala Leu 2405 2410 2415 Gly Leu Thr Val Ala Lys Trp Met Val Glu His Gly Ala Thr Arg Val 2420 2425 2430 Val Leu Ala Gly Arg Arg Pro Pro Asn Glu Glu Gln Gln Arg Val Leu 2435 2440 2445 Gln Gln He Gly Ala Thr Ala Gln Thr Val Asp Val Ser Arg Glu Glu 2450 2455 2460 Gln Val Ala Asp Leu He Arg Arg He His Thr Gln Thr Ser Pro Leu 2465 2470 2475 2480 Arg Gly Val He His Ala Ala Gly Val Leu Asp Asp Gly Val Leu Leu 2485 2490 2495 Asn Gln Asp Trp Thr Arg He Ala Ser Val Met Ala Pro Lys Ala Glu 2500 2505 2510 Gly Ala Val His Leu His His His Thr Arp Asp Leu Pro Leu Asp Pife 2515 2520 2525 Phe Val Leu Phe Ser Ser Ala Ser Ser Leu Leu Gly Pro Ala Gly Gln 2530 2535 2540 Ala Gly Tyr Ala Ala Ala Asn Ala Val Leu Asp Ala Leu Ala His His 2545 2550 2555 2560 Arg Arg Gly Leu Gly Leu Pro Ala Thr Ser He Asn Trp Gly Arg Trp 2565 2570 2575 f^A t *** ** * Ser Gly Ala Gly Met Ma Ma Arg Thr Ser Gln Ser Met Ala Gly Val 2580 2585 2590 Ala Ser Leu Ser Val Asp Glu Gly Leu His He Leu Glu Ala Val Leu 2595 2600 2605 His Glu Cys Pro He Gln He Ala Ala Leu Pro Ala Gly Ser He Thr 2610 2615 2620 Gly Glu Leu Leu Arg Pro Ala Ala Leu Pro Ser Pro Gln Leu Arg Thr 2625 2630 2635 2640 Arg Leu Asn Glu Ala Thr Pro Arg Gln Arg Glu Ala He Leu He Ala 2645 2650 2655 His He Arg Glu Ser Leu Ala Arg Phe Val Gly He Ala Thr Ser Thr 2660 2665 2670 Pro Leu Asp Pro Gln Gln Pro Leu Gly Gln Leu Gly Leu Asp Ser Leu 2675 2680 2685 Met Ala He Gln Leu Arg Asn Ser Leu Ser Gln Ser Leu Gly Gln Pro 2690 2695 2700 Leu Pro Ala Ser Leu Leu Phe Asp Tgr Pro Ser Leu Asp Ala He Val 2705 2710 2715 2720 Ser Tgr Val Leu His Ala Val Phe Pro Pro Gln Ala Ser Pro Val Glu 2725 2730 2735 Ala Pro Glu Phe Glu Asn Leu Ala Arg Glu Glu Leu Gln Ala Leu Leu 2740 2745 2750 Asp Ser Arg Leu Ala Gln Val Asp Gln Trp Leu Glu Thr Gln 2755 2760 2765 <210> 123 <211> 1763 <212> PRT <213> bacteria <400> 123 Met Ser Gly Ser Asp Asp Leu Ser Lys Leu Arg Arg Ala Val He Ala 1 5 10 15 Leu Asp Lys Val Gln Lys Arg He Asp Gln Leu Glu Ser Ala Arg Ser 20 25 30 Gln Pro He Ala Leu He Gly Ala Gly Cys Arg Phe Pro Gly Ala Ser 35 40 45 Asn Leu Asp Ala Tyr Trp Ser Leu Leu .Arg Glu Gly Arg Ser Ala Val 50 55 60 Arg Gln Val Pro Pro Asp Arg Trp Asp He Asp Ala Tyr Tyr Asp Pro 65 70 75 80 Asp Pro Gly Ala Thr Gly Arg Met Tyr Thr Arg Tyr Gly Gly Phe He 85 90 95 Asp Gln Val Asp Arg Phe Asp Ala Arg Phe Phe Gly He Ala Pro Arg 100 105 110 Gln Ala He Ser Leu Asp Pro Gln Gln Arg Leu Leu Leu Glu Val Thr 115 120 125 Trp Glu Ala He Gln Asn Ala Gly Leu Pro Pro Asp Arg Leu Ma Gly 130 135 140 Ser Arg Thr Gly Val Phe Met Gly He Phe Ser Asn Asp Tyr Tyr Asn 145 150 155 160 Leu Gln Met Arg Gly Gly Asp Ala His He Asp Ala Tyr Thr Gly Thr 165 170 175 Gly Asn Thr Ala Ser Val Ala Ala Gly Arg Leu Ser Tyr He Leu Gly 180 185 190 Leu Gln Gly Pro Asn Met Ala He Asp Thr Ma Cys Ser Ser Ser Leu 195 2C0 205 Val Ala Val His Leu Ala Cys Gln Ser Leu Arg Ser Gly Glu Ser Asp 210 215 220 Leu Ala Leu Ala Gly Gly Val Asn Leu He Leu Ser Pro Asp Arg Thr 225 230 235 240 He Tyr Phe Cys Lys Leu Lys Ala Met Ala Ala Asp Gly Arg Cys Lys 245 250 255 Ala Phe Asp Ala Ala Ala Asp Gly Tyr Val Arg Gly Glu Gly Cys Gly 260 265 270 Val Val Val Leu Lys Arg Leu Ser Asp Ala Leu Arg Asp Arg Asp Pro 275 280 280 Val Met Ala Val He Arg Gly Thr Ala He Asn Gln Asp Gly Arg Ser 290 295 300 sn Gly Leu Thr Ala Pro Asn Gly Pro Ala Gln Glu Ala Val He Arg 305 310 315 320 lílijii iíí i I l ' r .é ?á*-* * * k** *&*&*si* Gln Ma Val Gly Asp Ala Arg Leu Gln Thr Leu Asp Val Ser Tyr Val 325 330 335 Ala Leu Ala Ala Ala Leu Gly Ala Gly Arg Thr Asn Gly Asn Lys Leu 355 360 365 Lys Leu Gly Ser Val Lys Thr Asn Phe Gly His Leu Gly Ala Ala Ala 370 375 380 Gly Val Ala Ala Leu He Lys Val Ala Leu Met Leu Gln Asn Glu Ala 385 390 395 400 He Pro Pro His Leu Asn Leu Thr Thr Pro Ser Pro His He Asp Trp 405 410 415 Asn Thr Leu Pro Leu Glu He Pro Ala Arg Leu Thr Pro Trp Pro Val 420 425 430 Ala Pro Gly Gly Arg Arg Val Ala Gly He Asn Ser Phe Gly Leu Ser 435 440 445 Gly Thr Asn Ala His Val Leu He Glu Gln Ala Pro Gln Gln Ala Ala 450 455 460 Ser Ser Thr Pro Ala Pro Tyr Leu Leu Pro Leu Ser Ala Arg Ser Pro 465 470 475 480 Glu Ala Leu Arg Asp Leu Ala Arg Ala Tyr Arg Asp Val Val Asn Asp 485 490 495 Asn Pro Ala Asp Thr Cys Tyr Thr Ala Cys Ala Arg Arg Thr Ser Tyr 500 505 510 Glu His Arg Ala Ala Phe Thr Gly Thr Asn Ala Gin Asp Leu Met Ala 515 520 525 ^^lllM^fc^Jto» ^.-^-*-..-^^atL*.<?aJhatí*as--a>'-i= Gly Leu Asp Ser Phe Leu Ma Gly Asn Pro Asn Arg Asp Thr Ala Thr 530 535 540 Gly Phe Val Pro Arg Gly Gln Lys Arg Lys Val Val Pile Val Leu Pro 545 550 555 560 Gly Gln Gly Ser Gln Trp Pro Gly Met Gly Arg Asp Leu Met Ala Ser 565 570 575 Glu Pro Val Phe Arg Ala Ala He Glu Glu Cys Gly Arg Ala Met Gln 580 585 590 Pro Tyr Val Asp Trp Ser Leu Thr Gln Glu Leu Gln Gly Pro Leu Asp 595 600 605 Arg He Asp Val He Gln Pro Ala Leu Pile Ala Val Gly Val Ala Leu 610 615 620 Ala Gly Leu Trp Arg His Trp Gly He Glu Pro Asp Ala Val He Gly 625 630 635 640 His Ser Met Gly Glu Val Ala Ala Ala His He Ala Gly Ala Leu Thr 645 650 655 Leu Asp Glu Ala Ala Arg Val He Cys Leu Arg Ser Arg Met Leu Ala 660 665 670 Gly Val Arg Gly Gln Gly Glu Met Ala Val Val Glu Leu Ala Leu Asp 675 680 685 Glu Ala He Ala Ala He Ala Gly Arg Ser Asp Arg Val Ser He Ala 690 695 700 Ala Ser Asn Ser Pro Arg Ser Thr Val Leu Ser Gly Asp Ser Ala Ala 705 710 715 720 Leu Gly Glu Leu Leu Arg Glu Leu Glu Ala Lyys Asp Val Phe Cys Arg 725 730 735 Arg Val Lys Val Assp He Ma Ser His Ser His Leu Met Asp Ser Val 740 745 750 Cys Ala Ala Leu Pro Gly Val Val Gly Ala Leu Gln Pro Arg Pro Ala 755 760 765 Ala Leu Gly Met Tyr Ser Thr Val Thr Glu Ala Ala He Ser Gly Glu 770 775 780 Glu Leu Val Ser Ala Tyr Trp Ala Arg Asn Leu Arg Gln Pro Val Met 785 790 795 800 Leu Ser Thr Ala Val Ala Ala Ala Ala Ala Gly Gly His Asp Val Phe 805 810 815 Leu Gly Leu Ser Pro His Pro Leu Leu Val Gln Pro He Gln Glu Thr 820 825 830 Leu Gly Asp Arg Ala Ala He Ala Ala Ala Ser Leu Arg Arg Asp Glu 835 840 845 Asp Gly Asn Leu Ala Leu Arg Arg Thr Leu Gly Ala Leu Leu Thr Asn 850 855 860 Gly Val Thr Pro Asp Trp Ser Arg He Tyr Pro Asn Gly Gly Gln Thr 865 870 875 Arg Arg Leu Pro Asn Tyr Pro Trp Gln Arg Glu Arg Tyr Trp He Asp 885 890 895 He Arg Pro Pro Gln Val Glu Ser Gln Ala Leu Pro Gly Arg Arg He 900 905 910 •" -"a**--»"*- --*•-- --*-¿ i^*?* ?? Pro Ser Pro Leu Pro Glu Met Gln Phe Glu Ser Thr Val Glu Ala Lys 915 920 925 Asp Phe Ala Asp His Arg Leu His Asp Val He Val Thr Pro Gly Ala 930 935 940 Trp His Leu Ala Met Ala Leu Ma Ala Ala Arg Gln Gly Leu Gly Ala 945 950 955 960 Gly Pro His His Val Gln His Val Ser Leu Thr Gly Ala Leu Thr Leu 965 970 975 Pro Glu Asn Asp Ala Ala Arg Gln Val Gln Leu Val Leu Arg His Glu 980 985 990 Glu Gly Gly Gly Ala Ser Phe Arg He Tyr Ser Arg Glu Asp Ser Trp 995 1000 1005 Lys Leu His Ser Gln Gly Met Leu Gln Ala Gly Asp Ser Thr Ala Ser 1010 1015 1020 He Asp Leu Asp Ala He Arg Ala Arg Cys Thr Ala Glu Leu Thr Ala 1025 *" 1030 1035 1040 Asp Ala Phe Tyr Ser Arg Leu Trp Asp Arg Gly Tyr Hís Phe Gly Pro 1045 1050 1055 Thr Phe Arg Thr He Gly Pro He Trp Arg Gly Asn Gly Glu Val Leu 1060 1065 1070 Cys Arg Val Asp He Pro Leu Thr Gln Met Gln Thr He Asp Cys Cys 1075 1080 1085 Leu Gln Leu Pro Ala Ala Leu Val His His Asp Asp Leu Lys Asp Val 1090 1095 1100 His Val Pro Val Gly Leu Asp Arg Pife Ser Leu Ma Glu Val Pro Thr 1105 1110 1115 1120 Gly Pro Val Trp Gly Tyr Ala Val Leu Arg Pro Asp Ser Thr Val Asp 1125 1130 1135 Val Arg Leu Val Thr Gly Thr Gly Ser Val Val Ala Gln Leu Val Gly 1140 1145 1150 Leu Gln Ser Arg Val Ala His Ser Gly Gln Leu Gly Glu Ser Gln He 1155 1160 1165 Pro Thr Trp Thr Val Gln Trp Trr Ala Ser Val Arg Arg Gly Asp Ala 1170 1175 1180 Asn Ala Gly Asn Ala Gly Gly Pro Trp Leu Val He Gly Gln Pro Ala 1185 1190 1195 1200 He Ala Gln Thr Leu Gln Lys Arg Gly Gln Thr Cys Arg Thr Ala Asp 1205 1210 1215 Thr Cys Ser Gly Pro Pro Cys Arg Gln He Val Thr Cgs Pro Ser Pro 1220 1225 1230 Arg He Asp Asp Leu Leu Ser Val Leu Arg Ser He Val Gln Ala Gly 1235 1240 1245 Trp Pro Gln Pro Pro Arg Leu Trp Leu Leu Thr Arg Gly Ser Ala Ala 1250 1255 1260 Val Leu Asn Ser Asp Lys Asp He Asp He Arg Gln Ala Trp Leu His 1265 1270 1275 1280 Gly He Gly Arg Thr He Ala Tyr Glu His Pro Gln Leu Arg Cys Thr 1285 1290 1295 Leu Val Asp Leu Asp Ma His Ser Asn Asp Cys Gly His Leu Ma Thr 1300 1305 1310 Leu Met Leu Ser Asn He Ala Glu Asp Gln Val Ala He Arg Gln Gly 1315 1320 1325 Thr Val Trp Ala Pro Arg Leu Ser Leu His Lys He Pro Ser Ala Pro 1330 1335 1340 Asp Val Ala Pife Arg Ala Asp Ala Thr Tyr Leu He Thr Gly Gly Leu 1345 1350 1355 1360 Gly Gly Leu Gly Leu Gln Val Ala Gly Trp Leu Ala Ala Ala Gly Ala 1365 1370 1375 Arg His Leu Val Leu Leu Gly Arg Ser Gln Arg Pro Arg Pro Gln Leu 1380 1385 1390 Glu Gly Val Asn Val Lys He He His Ala Asp Val Ala Asp Arg Gln 1395 1400 1405 Gln Leu Ser Asp Ala Leu Ala He He Asp Arg Asp Met Pro Pro Leu 1410 1415 1420 Arg Gly Val Phe His Leu Ala Gly Thr Leu Ala Asp Gly Met Leu Leu 1425 1430 1435 1440 Asn Leu Thr Thr Glu Arg Phe Gln Ala Ala Met Ala Pro Lys Val Ala 1445 1450 1455 Gly Ala Trp Asn Leu His Gln Leu Thr Ala Gly Arg Pro Leu Asp His 1460 1465 1470 Phe Val Leu Phe Ser Ser Ala Ser Ala Thr Val Gly Ser Pro Gly Gln 1475 1480 1485 *.^j tto-"1..^tiiiiitt*.^^*^***^*^******!*' ^- 3fc«- > drihAifa Gly Asn Tyr Ala Ala Gly Asn Ser Phe Leu Asp Ala Leu Ala His Leu 1490 1495 1500 Arg Arg Ala Gln Gly Leu Pro Ma Val Ser He Ala Trp Gly Pro Trp 1505 1510 1515 1520 Thr Gln Val Gly Leu Ala Ala Gln Ala Asn Arg Gly Asp Arg Leu Ala 1525 1530 1535 Ala Arg Gly He Ser Val He Gln Pro Gln Gln Gly Leu Arg Ala Leu 1540 1545 1550 Tyr Lys Ala Leu Thr Gln He Arg Pro His Val Ala Val Met Asn Phe 1555 1560 1565 Asp He Ala Gln Trp Leu Arg Tyr Tyr Pro Ser Ala Ala Ser Met Ser 1570 1575 1580 Leu Leu Ala Gly He Ala Pro Ala Ala Ala Asp Thr Lys Pro Ala Ala 1585 1590 1595 1600 Asp Met Arg Ser Glu Leu Leu Ala Val Pro Ala Gly Arg Gln Arg Arg 1605 1610 1615 Ala Arg Leu Glu Thr Leu Leu Met His Glu Ala Gly His Val Leu Arg 1620 1625 1630 Phe Asp Pro Ala Lys Leu Asp Gly Arg Ala Thr Leu Gly Asp Leu Gly 1635 1640 1645 Phe Asp Ser Leu Met Ala Leu Gln Phe Arg Asn Arg Leu Gln Ala Gly 1650 1655 1660 Leu Arg Val Lys Leu Ser Ala Thr Leu He Trp Arg Tyr Pro Thr Phe 1665 1670 1675 1680 i?*ijµL*^**Jhá***Aé j*~*..¿** ^^ Ser Ala Leu Ala Gln His Leu Ma Asp Lys Leu Gly Leu Pro Leu Gln 1685 1690 1695 Ser Met Ala Gly Asn Ala Gln Pro Ser Thr Val Ala Ala Val Ala Thr 1700 1705 1710 Leu Ala Thr Val Gly Thr Ala Gly Gly Asp Arg Ser Pro Ala Ala 1715 1720 1725 Ala Asp Asp Leu Asp Ala Val Ala Asn Gln He Ala Gly Leu Gly Asp 1730 1735 1740 Lys Gln He Gln Ala Leu Leu Lys Gln Lys Phe Ala His Phe Ser Gly 1745 1750 1755 1760 Ala Ser Glu <210> 124 <211> 2153 <212> PRT <213> bacteria <400>124 Met Ser Ser He Ser Gln Arg Phe Pro Asn Leu Thr Pro Leu Gln Gln 1 5 10 15 Ala Tyr Leu Thr Leu Gln His Met Gln Arg Arg Leu Asp Ala Ala Gln 20 25 30 Arg Asp Ala Arg Gln Pro He Ala He Val Gly Leu Gly Cys Arg Phe 35 40 45 Pro Gly Gly Asp Gly Pro Asp Gln Phe Trp Gln Met Leu Arg Ser Gly 50 55 60 Val Asp Ala He Arg Glu Val Pro Pro Gly Arg Trp Asp Glu Glu Ser 65 70 75 80 Val Arg Arg He Leu Lys Ser Leu Asn Pro Ala Thr Pro Val Lys He 85 90 95 Gln Ala Gly Phe Leu Asp Ser He Asp Gly Phe Asp Asn Asp Phe Phe 100 105 110 Gly He Ser Pro Arg Gln Ala Val Ser He Asp Pro Gln Gln Arg Leu 115 120 125 Leu Leu Gln Val Ala Trp Glu Ala Leu Gln Asp Ala Gly Gln Thr Met 130 135 140 Glu Gly Leu Ser Gly Ser Arg r£hr Gly Val Phe Val Gly He His Ser 145 150 155 160 Gln Ser Ser Asp Tyr Phe Trp Met Gln Thr Ala Asp Gly Ala Arg He 165 170 175 Asp Pro Thr Thr Ala Thr Gly Thr Ala His Ser Val He Ala Gly Arg 180 185 190 Leu Ser Tyr Leu Leu Asn Leu Gln Gly Pro Ser He Ala Leu Asp Thr 195 200 205 Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Cys Gln Ser Leu 210 215 220 Arg Ser Gly Glu Cys Thr Leu Ala Val Ala Gly Gly Val Asn Leu Arg 225 230 235 240 ii.il i . i iM»iiri r. teá*** í*i¡i**áks*?**** ntiit Í? Phe Ser Pro Glu Phe Met Tyr Ala Thr Ser Lys Met Gly Thr Ma Ser 245 250 255 Pro Ser slu Arg Cys Arg Ala Phe Asp Ala Ala Ala Asp Oly He Val 260 265 270 Phe Gly Glu Gly Cys Gly Val Val Val Leu Lys Arg Leu Ser Asp Ala 275 280 285 Leu Ala Ala Gly Asp Arg Val Trp Ala Val Val Arg Gly Ser Ala Val 290 295 300 Asn Gln Asp Gly Arg Ser Ala Gly Leu Thr Ala Pro Asn Val Val Ser 305 310 315 320 Gln Gln Val Val He Arg Ser Ala Leu Ala Asn Ala Gly Val Ala Ala 325 330 335 Gln Gln He Gly Tur He Glu Ala His Gly Thr Gly Thr Pro Leu Gly 340 345 350 Asp Pro He Glu He Glu Ala Leu Ala Gln Thr Val Gly Leu Pro Arg 355 360 365 Pro Val GLy Asp Val Cys Ala Val Gly Ser Leu Lys Ser Asn He Gly 370 375 380 His Leu Glu GLy Ala Ala Gly He Ala Gly Leu He Lys Ala Val Leu 385 390 395 400 Ala Leu Ser His Glu Thr He Pro Pro Ser Leu His Val Arg Gln Leu 405 410 415 Asn Pro Asn He Arg Leu Glu Gly Thr Ser Leu Asp He Val Lys Glu 420 425 430 Val Arg Pro Trp Pro Ala Gly Ser Arg Arg Arg Phe Ala Gly Val Ser 435 440 445 Ala Phe Gly Trp Ser Gly Thr Asn Ma His Val Val Leu Glu sln Ala 450 45 460 Ala Pro Thr Oly Arg sly slu Ala Ala Ser sly Phe His Ser Arg Pro 465 470 475 480 Pro Ala Ala Ala Ala Arg Ala Ala Val Pro Leu Ala Glu Gly Asp Thr 485 490 495 Gly Gly Thr Pro Asp He Ala Gly Thr Pro Asp Thr Ala Asp Thr Pro 500 505 510 Asp Thr Ala Asp Thr Pro Asp He Ala Gly Thr Ala Gly Thr Ala Ala 515 520 525 Thr Thr Gly He Ala Asp Ala Met Tyr Val Leu Pro Leu Ser Ala His 530 535 540 Gly Ala Asp Glu Leu Arg Arg Val Ala Arg Ala Tyr sly Olu Leu Leu 545 550 555 560 Thr Ala Ser His Ala Pro Ser Leu Arg Asp Leu Cys Tyr Thr Ala Ala 565 570 575 Val Arg Arg Thr His His Arg Cys Arg Leu Ala Val Ser sly Arg Thr 580 585 590 Ala slu slu Leu Ala Ala sln Leu sln sly He Thr He Pro Ser Gln 595 600 605 Arg Arg Lys Thr Val Phe Val Phe Ser Gly Gln Oly Ser sln Trp He 610 615 620 ¿l Üg s ***** i^*^ n* t.*¡***tá**** sly Met sly Arg Ser Trp Met Asp Arg slu Pro Val He Arg slu Ma 625 630 635 640 Leu slu Arg Cys slu Ala Ala Met Arg Pro Tyr Val Asp Trp Ser Leu 645 650 655 Lys slu Olu Leu Ala Lys Leu Asp Arg Val Olu Val He Oln Pro Ala 660 665 670 Leu Phe Ala Leu sín Val Ala He Ala Ala Leu Trp Arg Ser Trp sly 675 680 685 He Olu Pro Asp Ala Val He sly His Ser Met sly Olu Val Ala Ala 690 695 700 Ala His Val Ala sly Ala Leu Thr Leu Oln Asp Ala Ala Arg He He 705 710 715 720 Cys Ser Arg Ser Arg Leu Leu Ser Arg He Ser sly Leu sly sly Met 725 730 735 Ala Met Val Olu Leu Pro Len Ala Glu Cys Glu Ala Val Leu Ser Thr 740 745 750 Tyr Thr Glu Arg Len Ser Pro Ala Val Ser Asn Gly Pro Asn Ser Thr 755 760 765 Val He Ser Gly Gln Val Olu Ala Leu Ala sly Val Val Ala Thr Leu 770 775 780 slu Arg Arg Oly Val Ser Cys Arg Pro Val Lys Val Asp Phe Ala Ala 785 790 795 800 Hís Ser Pro Sin Val Asp Pro Leu Cys Asp Glu Leu Leu Gln Ser Leu 805 810 815 Asp sly He Oln Pro Arg Pro Ma Thr He Pro Phe Tyr Ser Thr Val 820 825 830 Thr sly Ala Thr Leu slu Thr Thr Ser Leu Asp Ser Thr Tyr Trp Ala 835 840 845 Arg Asn Leu Arg Ser Pro Val Leu Phe Trp sln sly He Arg His Leu 850 855 860 Ala Asp Ser sly His Asp Val Phe Leu Olu He Ser Pro His Pro He 865 870 875 880 Leu Leu Pro Ala He Oly Gly Asn Ala Ala Leu Val Pro Ser Leu Arg 885 890 895 Arg Asp Gln Asp sln Arg sly Ser Met Leu Thr Ser Leu sly Ala Leu 900 905 910 Tyr Olu Ala sly His Thr Val Ala Trp Arg Thr Val Tyr Pro Ser sly 915 920 925 Asn Cys Val Arg Len Pro Arg Tyr Pro Trp Oln Arg Arg Arg Phe Trp 930 935 940 Leu Asp Ala Ser Pro Ala Arg His Ala He Thr Leu sly Asn Pro Leu 945 950 955 960 Len Oly Lys Arg Val sln Ala Ser Thr sln Pro sly Thr Phe Phe Trp 965 970 975 sln Thr Gl:. Leu Ser Leu Ala Ser Val Pro Trp Leu Ala Asp His Arg 980 985 990 Val sln sly Gln Val Val Leu Pro Ala Thr Ala Tyr Leu Asp Met Ala 995 1000 1005 Leu Ala sly Thr Ser Olu Thr Phe Gly Glu Ser Pro Cys Val Leu slu 1010 1015 1020 His Val Thr Phe Thr sln Met Leu He Val Pro Arg Asp sly Ser Met 1025 1030 1035 1040 Thr Len Gln Len Ala He Ala Val Asp Arg Pro Gly Met Ala Ser Phe 1045 1050 1055 Arg He Ser Ser Arg Gln Ala Ser Thr Trp Val Leu His Ala Ser Oly 1060 1065 1070 Asp He Arg Oln Thr Pro Ala Asp Ala Ser Thr Val Pro Pro Asp Ser 1075 1080 1085 Ala Olu Thr Val Gln Ala Arg Cys Pro Thr Val Val Pro Ala Ala slu 1090 1095 1100 Leu Trp Arg Oln Met Ala sln His sly Val Olu Tyr Oly Pro Ala Phe 1105 1110 1115 1120 Arg Ala Len sln Oln He Trp Ser Cys Pro sly Glu Ala He Gly Arg 1125 1130 1135 Leu Arg Ser Ser Gln Thr Arg Ser Thr Ala Pro Ala Phe Leu Asp Ala 1140 1145 1150 Cys Len Cln He He Ala Ala Ala Phe Gly Pro Ala Oly Gly Thr Trp 1155 1160 1165 Leu Pro Ala Gly He Asp Arg Met Arg Trp Leu His Pro Ala Arg Ser 1170 1175 1180 Val Val Trp Thr His Ala Arg Len Glu Gly Pro He Ala Asp Leu Ser 1185 1190 1195 1200 Leu Leu Asp Oly slu Gly Gln Len Val Ala Arg He sln Oly Leu Arg 1205 1210 1215 Leu sln Arg Leu Asp Ala Ser Gln Arg He Asp Met Arg Gly Trp Leu 1220 1225 1230 His Gln Leu Arg Trp Val Ala sln Pro His Ala Ala Ala Gln Pro Pro 1235 1240 1245 Ala Ala Arg Ala Ala Arg Ser Trp Leu He Val Gly Ala Val Asp Ser 1250 1255 1260 Ala Leu Thr Ala Trp Leu Arg Ala Thr Gly Asn Arg Val Thr Gln Thr 1265 1270 1275 1280 Ser Pro Olu Lys Leu Asp Glu Leu Gln Pro Pro Leu Glu Glu He Val 1285 1290 1295 Phe Leu Leu Glu His Gln Pro Ser Cys Asp Arg He Leu His Leu Leu 1300 1305 1310 Cln Thr Leu Gly Arg Thr Pro Trp Arg Gln Ala Pro Arg Leu Trp Leu 1315 1320 1325 Val Thr Arg Gly Ala Gln Pro Val Asp sly Gln He Leu Gln Ala Gly 1330 1335 1340 He Ala Gln Ala Pro Phe Trp Gly Leu Gly Arg Thr Val His Tyr Glu 1345 1350 1355 1360 His Pro Gln Leu Asn Cys Thr Leu He Asp Leu Asp Pro Ala sly Gly 1365 1370 1375 Gln Gln Gln Leu Leu His Gln Leu Leu Thr Asn Asn Oly Glu Asn Gln 1380 1385 1390 He Ma Phe Arg sly Gly Ala Arg Agr Val Ala Arg Val Ala Arg His 1395 1400 1405 Gln Ala Asp Met Gln Pro Ala Met Phe Lys Ala Gly Asp Arg Pro Phe 1410 1415 1420 Arg Leu Gln He Asp Ala Pro Gly Val Leu Asp Arg Leu Arg Leu Arg 1425 1430 1435 1440 Ala Thr Ser Arg Arg Pro Pro sln Ala sly Glu Val Glu He Glu Val 1445 1450 1455 Cis Ala Ala Gly Leu Asn Phe Leu Asp Val Leu Leu Ala Leu Gly Val 1460 1465 1470 Met Pro Asp Asp Ala Pro Gly Ala He Ala Gly Ser Pro Arg Leu Gly 1475 1480 1485 Gly Glu Cys Ser Gly Arg He Val Ala Met Gly Lys Gly Val Thr Asp 1490 1495 1500 Phe Arg He Gly Asp Glu Val Val Ala Leu Ala Pro Cys Ser Phe sly 1505 1510 1515 1520 Arg Phe Val Thr Thr Pro Ala Phe Arg Val Ala Leu Lys Pro Ala Asn 1525 1530 1535 He Pro Ala Glu sln Ala Ala Ala Leu Pro He Ala Phe Leu Thr Ala 1540 1545 1550 Asp Tyr Ala Leu Ser Arg Ala Ala Arg Leu Ala Pro sly Gln Arg Val 1555 1560 1565 Leu He His Ala Ala Thr Gly Gly Val Gly Leu Ala Ala He sln He 1570 1575 1580 Ala sln Arg Ala Gly Ala Gln He Phe Ala Thr Ala Gly Ser Pro Glu 1585 1590 1595 1600 Lys Arg Ala Tyr Leu Arg Ser Leu Gly He Ala His Val Ser Asp Ser 1605 1610 1615 Arg Ser Met Ala Phe Val Asp Asp He Arg Asn Trp Thr Asn Oln Olu 1620 1625 1630 Oly Val Asp Val Val Leu Asn Ser Leu Ser Gly Asp Leu Leu Gln Ala 1635 1640 1645 Ser Phe Asp Leu Leu Arg Asp His Gly Arg Phe He Glu He Gly Lys 1650 1655 1660 Arg Asp Tyr Tyr Ala Gly Arg Lys Leu Gly Leu Arg Pro Phe Leu Lys 1665 1670 1675 1680 Asn Leu Ser Tyr Thr Leu Val Asp Leu Leu Gly Met Ser Leu Lys Arg 1685 1690 1695 Pro Ala Leu Thr Arg slu Leu Leu sln slu Met Val Ala Lys Phe slu 1700 1705 1710 Ser Oln Thr Trp Arg Pro Leu Glu Thr Arg Val Thr Thr He Thr Gln 1715 1720 1725 Ser Val Gln Ala Phe Arg Thr Met Ala Gln Ala Arg His He Gly Lys 1730 1735 1740 He Val Met Ala Met Arg Asp Cys Ala Asn Ala Pro He Ala Pro Leu 1745 1750 1755 1760 Arg Ser Ala Phe Asp Ser Gln Gly Thr Tyr Leu He Thr Gly Gly Leu 1765 1770 1775 Oly sly Leu Oly Leu Thr Val Ala Arg Trp Met He Gly Arg Gly Ala 1780 1785 1790 Arg Arg Leu Val Leu Leu Ser Arg Arg Ala Pro Ser Pro Gln Val Gln 1795 1800 1805 Gln Ala He Ala Val Met Asp Ala Asp Val Arg Thr Val sln Ala Asp 1810 1815 1820 Val Ser Oln Arg Asp slu Leu Oln Arg Val He Ser Ser He Asp Arg 1825 1830 1835 1840 Leu Arg Gly Val He His Ala Ala Ala Val Leu Asp Asp Ala Leu Leu 1845 1850 1855 Leu Asn Gln Thr Gln Ala His Phe Arg Asn Val Met Ala Ala Lys He 1860 1865 1870 Asp Gly Ala Trp Asn Leu His Leu Leu Thr Arg Asp Cys Pro Leu Asp 1875 1880 1885 Hís Phe Val Leu Phe Ser Ser -Ala Ala Gly Leu Leu Gly Ala Pro Ala 1890 1895 1900 Gln Oly Asn Tyr Ala Ala Ala Asn Ala Phe Leu Asp Ala Leu Ala Tyr 1905 1910 1915 1920 Tyr Arg Lys Ala Oln Oly Leu Pro Ala Leu Ser He sly Trp Oly Ala 1925 1930 1935 Trp Ser Gln Val Gly Leu Ala Ala Ala Gln Asp Asn Arg sly Ser Arg 1940 1945 1950 Leu Ala Leu Arg Gly Met sln Asn Leu Thr Pro Gln His Gly Leu Ala 1955 1960 1965 * * ^Jz "$?* .«A , * **_** * -*>*** . '* .^..m. * ?M?i,it-aii He Leu Cln Oln Leu Leu Asn Ser Ser Ala Cys His Val Ala Ala Met 1970 1975 1980 Pro He Asn Val Arg sln Trp Arg Oln Phe Tyr Pro Lys Ala Ala Gln 1985 1990 1995 2000 Ser Ala Leu Phe Glu Leu Leu His Asp Asp Ala Ala Ser Gln Ala Asp 2005 2010 2015 Ala Pro Asn Ala Leu Arg Ala Arg Leu sln Ser Ala sln Pro Gln Thr 2020 2025 2030 Arg Arg Thr Leu Leu Gln Gln His Leu Gln Oln Oln Leu Ala Arg Val 2035 2040 2045 Leu Arg He Asp Ser Gln Thr He Asp Pro Leu Arg Pro Leu Lys Gln 2050 2055 2060 Leu Oly Phe Asp Ser Leu Met Ala Leu Glu Phe Arg Asn Arg Leu Glu 2065 2070 2075 2080 Leu Thr Leu Gly Leu Thr Leu Pro Ala Thr Leu He Trp Gly His Pro 2085 2090 2095 Thr Leu Ala Gly Leu Ala Pro His Leu Ala Ser Gln Met Gly Leu Pro 2100 2105 2110 Leu Val Glu Ala Gln Ala Ala Ala Ala Ala Glu Gly Asp Ser Arg Ala 2115 2120 2125 Met Lys Thr Ala Leu Ser Gly Leu Asp Asp Met Ser Gln Gln Ala Ala 2130 2135 2140 Val Ala Ala Leu Arg Gly Ala Arg Ser 2145 2150 l?ii,lnU >l-- A>*j*t*É*r **** *l*?ts <210> 125 <211> 1695 <212> PRT <213> bacteria <400> 125 Met Arg Oln Lys He Ala Pro Met Ser Ser Val Lys Leu Ala Leu Leu 1 5 10 15 Ala Arg Asn Met Arg sln Asn He Ala sly Phe Asp Leu Val His Ala 20 25 30 Oln Pro He Ala He Val Gly Met Ala Cgs Arg Phe Pro Gly Gly Ala 35 40 45 Lys Asn Pro Asp Ala Phe Trp Thr Leu Leu Lys Asn Gly Val Asp Gly 50 55 60 Val Thr Gln Val Pro Pro Asp Arg Trp Asn Ser Asp Oln Tyr Tyr Ser 65 70 75 80 Ser Asp Pro Asp Ala Pro Oly Lys Ala Tyr Ala Arg TYr Ala Ala Phe 85 90 95 Leu Gln Arg He Asp Gly Phe Asp Ala Gln Phe Phe Oly He Ser Pro 100 105 110 Arg Oln Ala Leu Asn Met Asp Pro Gln Gln Arg Leu Leu Leu sln Val 115 120 125 Cys Trp Oln Ala Ala Oln Asp Ala Oly He Ser Pro Gly Pro Leu Ma 130 135 140 sly Ser Ma Thr Gly Val Phe Ma Gly Ser Cys Ma Gln Asp Phe Gly 145 150 155 160 Leu Phe Gln Tyr Ala Asp Pro Ala Arg He Oly Ala Trp Ser Gly Ser 165 170 175 Gly Val Ala His Ser Met Leu Ala Asn Arg He Ser Tyr Leu Leu Asp 180 185 190 Leu Arg Oly Pro Ser Met Ala Val Asp Thr Ala Cys Ser Ser Ala Leu 195 200 205 Val Ala Val His Leu Ala Cys Oln Ser Leu Arg Arg Arg Oln Cys Asp 210 215 220 Ala Ala Phe Ala Gly Gly Val Asn Leu He Leu Gly Pro Gln Gly Met 225 230 235 240 He Ala Leu Ser Lys Ala Arg Met Leu Ala Pro Asp Gly Arg Cys Lys 245 250 255 Thr Phe Asp Ala Ala Ala Asp Gly Tyr Val Arg Gly Gln Oly Cys Cly 260 265 270 He Val Leu Leu Lys Arr Leu Ser Asp Ala Leu Ala Asp Cly Asp Ala 275 280 285 He Arg Ala Val He Arg Oly Ser Ala He Asn sln Asp Oly Arg Ser 290 295 300 sn Oly He Thr Ala Pro Asn Leu Oln Ala sln Lys Ala Val Leu Oln 305 310 315 320 Glu Ala Val Ala Asn Ala His He Asp Pro Ser His Val Ser Leu He 325 330 335 Gln Ala His Gly Thr Gly Thr Ser Leu Gly Asp Pro He Glu He Glu 340 345 350 Ala Leu Gln Ser Val Tyr Asp Ma Pro Asp Ser Ma Pro Cys Leu Leu 355 360 365 Oly Ser Val Lys Thr Asn He Gly His Leu Gln Gly Ma Ma Gly He 370 375 380 Ala Gly Leu He Lys Ala Val Leu Ala Leu Gln His Arg Tilr He Pro 385 390 395 400 Pro His Leu His Phe Arg Arg Leu Asn Pro Asn He Ser Leu Asp Gly 405 410 415 Ser Arg Phe Arg He Ala Thr Gln Ser Ser Pro Trp Thr Ser Oln Oly 420 425 430 Arg Pro Arg Leu Ala Oly Val Ser Ser Phe Oly Phe Gly Gly Ser Asn 435 440 445 Ala His Val He Leu Glu Glu Ala Pro Ala Leu Pro Leu Pro Lys Pro 450 455 460 Val Thr Arg Pro Gln Leu Leu Thr Leu Ser Ala Arg Thr Asp Oln Ala 465 470 475 480 Leu Oly Olu Leu Ala sly His Phe Ala Olu Phe Leu Gln Ser His Pro 485 490 495 Asn Ala Leu Leu Ser Asp Val Cys Phe Thr Ser Gln Val Oly Arg Asp 500 505 510 láAAAA** *** * * . ******** -~ *•-"*** -**!***.* . , **** ****?**?*I Ala Tyr Ser His Arg Leu Ma He Thr Ma Ma Asp Ma Ala Gln Ma 515 520 525 Val Ala Ala Leu Ala Ma Ma Pro Arg Arg Gln Val Ser Leu Arg Arg 530 535 540 Arg Pro Ala He Ala Phe Leu Phe Thr Gly Gln Gly Ma Gln Agr Ala 545 550 555 560 Gly Met Gly Ala Glu Leu Tyr Lys Thr Gln Pro Val Pile Arg Asp Ma 565 570 575 Leu Asp Arg Cys Ala Asp Trp Leu Arg Pro Oln Leu Asp Val Pro Leu 580 585 590 Thr Val Leu Leu Pile Oln Ser Val Ser Pro Leu His Glu Thr Ala Tyr 595 600 605 Thr Gln Pro Ala Met Phe Ala Leu slu Trp Ala Leu Ala Gln Phe Trp 610 615 620 Leu Ser Leu Gly Val Arg Pro Asp Tyr Val Leu Gly His Ser Leu Gly 625 630 635 640 Glu Irgr Val Ala Ala Cys Val Ala Gly Ala Phe Ser Val Glu Asp Gly 645 650 655 Leu Arg Leu Val Thr Ala Arg Gly Arg Leu Val Asn Ala Leu Pro Arg 660 665 670 Gly Lys Ala Val He Val His Ala Asn Pro Ser Arg He Ala Ma Leu 675 680 685 Ala Ala Lys Val Ala Val Ala Ala Ser Asn Ala Pro Asn Arg Thr Val 690 695 700 *í***^*****i*M**.***.****Í?******* .*** ****. ..***************** ^M** * Uto/I**- -He Ser Gly Thr Ala Ma Glu He Ma Glu Ma Gln Asp Asp Leu His 705 710 715 720 Arg Ma Gly Val Glu Thr Arg Glu Leu Asn Val Ser His Ala Phe His 725 730 735 Ser Pro Leu Met Asp Pro He Leu Asp Lys Phe Glu Ala Leu Ala Gly 740 745 750 Ala He Ala Tyr Gln Pro Leu Ala He Pro Leu Val Ser Asn Val Ser 755 760 765 Gly Ala Val Leu Pro Lys Gly Thr Thr Leu Asp Ala Arg Tyr Trp Arg 770 775 780 Arg Gln Leu Arg Olu Thr Val Oln Phe Olu Ser Ala Met Arg Thr Leu 785 790 795 800 Ala Asp Arg Olu Cys Lys Leu Phe Leu Clu He Oly Pro His Pro Thr 805 810 815 Leu Thr Thr Leu Oly Arg Tyr Cys Leu Pro Asp Asp Cly Ala Val Trp 820 825 830 Leu His Ser Leu Ser Lys Gly Arg Ser Asp Trp Ser Val Leu Leu Glu 835 840 845 Ser Leu Gly Oly Leu Phe Thr Ala Gly Val Asn Pro Asp Trp Arg Gly 850 855 860 Leu Tyr Ala Oly Olu Ser Pro Ser Arg Val Ala Leu Pro Thr Tyr Pro 865 870 875 880 Phe Oln Arg Asp Thr Phe Ser Leu Arg Arg Val Pro Ma Arg slu Pro 885 890 895 I tíütitíH* 1 *****************l******1*******-3* t*-"'^ *•*** --— * - -"• t-Jt»-^.^J>.M-JJm>^.1| Ala Arg Gly Gly Met Leu Gly Ma Arg Leu Asn Ser Ma Leu Gly Asp 900 905 910 Val He Phe Glu Asn Ser Leu Thr Thr Glu Thr Pro Leu Leu His Glu 915 920 925 5 His Val He Tyr Asp Ala Val He Val Pro Gly Ma Trp His Val Ser 930 935 940 Ala Phe Leu Gln Ala Ala Gln Gln Val Phe Gly Pro Val Pro Cys Ala 945 950 955 960 Val Ser Asp Val Met Met Arg Gln Ala Leu Ala He Pro Pro Asp Thr 10 965 970 975 Pro Val Thr Val Gln Ala He Val Thr Pro Gly Gln Asp Gly Gln Ala 980 985 990 Cys Val Gln Val Phe Ser Oln Asp Oly Asp Ser Trp Lys Leu His Thr 995 1000 1005 15 Ala Ala Ser Leu Arg Ala Ala Thr Ala Oly Ala Val His Phe Oln Leu 1010 1015 1020 Pro Ala Oln Pro Ser slu Val He Ser Oly Asp Ala Phe Tyr Oly Ala 1025 1030 1035 1040 Met Asn Ala Arg Gly Val Asp Leu Gly Pro Ala Phe Ser Trp Val Glu 20 1045 1050 1055 Gln Val Trp Arg Arg Asp Oly Glu Ala Leu Gly Arg Met Arg Leu Pro 1060 1065 1070 Val Ala Olu Asp sly Ala Asn Ala Tyr Arg Leu His Pro Oly Leu He 1075 1080 1085 SÍÍ*?^«-* tí?¿&£sí* iSÍ& ?*-**.****-^^^^^,..**.. **..* **.. i.- **-*** -i-at* **** *** X******-**. *** *u*? .*hA*A* Asp Ser Cys Phe Oln Val Phe Gly Ma Thr Trp Pro Ma Gln Arg Cys 1090 1095 1100 Gln Pro Gly Ala Tyr Val Pro Val Gly He Glu Ala Val Arg Phe Tyr 1105 1110 1115 1120 Arg Pro Pro Ala Gly Ser Leu Arg Cys His Ma Arg Leu Arg Pro Ser 1125 1130 1135 Ser Ser Gly Pro Phe Val Gly Asp Leu Thr Leu Val Glu Glu Thr Gly 1140 1145 1150 Ala Val He Ala Gln Phe Ser Gly Leu Ma Val Met His Ala Gly Thr 1155 1160 1165 Leu Gln Ser Ala Gln Ser Trp Leu Gln Asp Val Gln Trp Gln Gln Cys 1170 1175 1180 Glu Arg Ser Thr Thr Leu Lys Ser Asp Gly Pro Gly Lys Pro Gln Asp 1185 1190 1195 1200 Trp Leu Leu Cys Ala Gly Ala Asp Asp Val Ala Gly Leu Met Pro Gln 1205 1210 1215 Gln Leu Arg Val Val Ser Gly Val Thr Leu Arg Gln Ala Leu Glu Gln 1220 1225 1230 Thr Gln Thr Leu Val Oly Arg Pro Ala Arg Leu Trp Leu He Thr Arg 1235 1240 1245 Gly Val His Arg He Ser Asp Asp Asp Ala Thr Pro Val Asp Pro Phe 1250 1255 1260 Gln Ala Pro Leu Trp Oly Leu Oly Oln Ala He Ala Arg Oln His Pro 1265 1270 1275 1280 sln Leu Trp Oly Gly Leu He Asp Leu Gly Cys Asp Asn Ala Asp He 1285 1290 1295 Ala Ala Ala Met Leu Leu Asp Gln He Arg Tyr Ala Gly Asp Asp Lys 1300 1305 1310 Ala He Ala Leu Arg Asn Gly Arg Arg Tyr Val Arg Arg Leu Val Arg 1315 1320 1325 His Lys Gln Thr Ser Lys Arg Pro Pro Ala He Ser Ala Asp Oly Val 1330 1335 1340 Tyr Leu He Thr Gly Gly Leu Gly Ala Leu Gly Arg Arg Val Ala Arg 1345 1350 1355 1360 Arg Leu He Gln Oln Oly Ala Arg Arg Leu Val Leu Val Oly Arg His 1365 1370 1375 Thr Glu Ala Val Ala Asp Leu Glu Oln Leu Gly Ala Ala Val Met Val 1380 1385 1390 Ala Ala Cys Asp Val Ser Ser Glu Gln Gln Leu Ala Ala Leu Leu Ala 1395 1400 1405 Asp Pro Arg Thr Gln Pro Leu Arg Gly Val Val His Ala Ala Gly Val 1410 1415 1420 Leu Asp Asp Gly Val Val Thr Glu Gln Thr Trp Ala Arg Phe Glu Lys 1425 1430 1435 1440 Val Leu Ala Pro Lys Leu Gln Oly Ala Trp Asn Leu His Oln Leu Thr 1445 1450 1455 Arg His His Ala Leu Asp Phe Phe Val Leu Phe Ser Ser Ala Ala Ser 1460 1465 1470 Leu Leu Gly Ser Ma Gly Gln Ser Asn Tyr Ser Ma Ma Asn Ma Phe 1475 1480 1485 Leu Asp Ser Leu Ma His Met Arg Arg Ma Gln Gly Leu Pro Ala Leu 1490 1495 1500 Ser He Asn Trp Gly Pro Trp Ma Gly Gln Gly Met Ala Ala Arg He 1505 1510 ' 1515 1520 Ala Arg Gln Oly Leu Pro Gly Val Pro Leu Leu Pro Pro Glu Val Gly 1525 1530 1535 Ala Arg He Phe Gly Asp Leu Leu Gly Gln Thr Ala Ala Oln He Ala 1540 1545 1550 Val Phe sln Val Ser Ala Oln Lys Arg Arg Ser Pro Ala Ser Asp Pro 1555 1560 1565 Gly Phe He Gln Oln Leu Thr Oln Ala Ala Pro Olu Arg Arg Oln Glu 1570 1575 1580 Leu Leu Gln Met Arg He Arg Lys Oln Ala Oly Oly Val Leu Ala Leu 1585 1590 1595 1600 Asp Ala Ser Lys Thr Leu Asp Pro Arg Arg Pro Leu Lys Gln Tyr Gly 1605 1610 1615 Leu Asp Ser Leu Met Ala Leu Asp Leu Ala Arg Ala He Gly Gln Leu 1620 1625 1630 Val Arg Lys Ser Leu Pro Ala Thr Leu Leu Tyr Asp His Pro Thr Val 1635 1640 1645 Oln Lys Leu Ala Oly His Val Leu Arg Oln Leu Oly Leu Asp Val Pro 1650 1655 1660 Ser Asp Ser Leu Val Asp Gln Val Arg Gln Leu Ser Gln Gln Gln Met 1665 1670 1675 1680 Ala Ala Phe He Thr sln Thr Leu His His Leu Gly Gln Oln Arg 1685 1690 1695 <210> 126 <211> 1434 <212> PRR <213> bacteria <400> 126 Met Ser Asp Leu Thr Pro Leu Oln Oln Ala Val Leu Ala Leu Lys Arg 1 5 10 15 Thr Arg Ala Arg Leu Asp sln Leu Glu Ser Val His Asn Glu Pro He 20 25 30 Ala He Val Gly Met Ala Cys Arg Phe Pro Gly Ala Asp Ser Pro Gln 35 40 45 Ala Phe Trp Gln Leu Leu His Asp Gly He Asp Ala He Arg Gln He 50 55 60 Pro Ala Gly Arg Trp Asp Ala Asp Ala Phe Tyr Asp Pro Asp Pro Asn 65 70 75 80 Ala Pro Gly Lys Met Tyr Thr Arg Leu Gly Gly Phe Leu Asp Gly Ala 85 90 95 Val Asp Gly Phe Asp Ala Gly Phe Phe Gly He Thr Pro Arg Gln Val ,á?.-é.?*¿*-.&?.it*í*? .»* f jiütfcgn»* -*******--*-**--**.*..**** ** *. . ** * -* t, *!* *-**.**-**---*-******** ** * ****** *.** **,*** , * **?*?t?*Étí*W* l****É* 100 105 110 Ala sly Leu Asp Pro Gln sln Arg Leu Leu Leu Gln Val Ala Trp Glu 115 120 125 Ala Leu Gln Arg Ala Oly Arg Pro Pro Asp Ser Leu Ala Oly Ser Asp 130 135 140 Thr Oly Val Phe He Oly He Ser Thr Asp Asp Tyr Ser Arg Leu Lys 145 150 155 160 Pro Thr Asp Pro Ala Leu He Asp Ma Tyr Thr Oly Thr Gly Thr Ma 165 170 175 Phe Ser Thr Ala Ala Gly Arg He Ser Tyr Leu Leu Gly Leu Gln sly 180 185 190 Pro Asn Phe Pro Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Val 195 200 205 His Leu Ala Cys Arg Ser Leu Oln Ser Arg Oln Cys Ser Met Ala Leu 210 215 220 Ala Gly Gly Val Asn Leu He Leu Ala Pro Glu Ser Thr He Tyr Phe 225 230 235 240 Cys Arg Leu Arg Ala Met Ala Ala Asp Gly Arg Cys Lys Ser Phe Ala 245 250 255 Ala Ser Ala Asp sly Tyr Oly Arg Gly Gln Gly Cys Gly Met Leu Val 260 265 270 Leu Lys Arg Leu Ser Asp Ala Thr Arg Asp Gly Asp Arg He Leu Ala 275 280 285 ??* É ****** ..*********.*• ***** Leu He Arg Gly Ser a Val Asn His Gly Gly Arg Ser Asn Gly Leu 290 295 300 Thr Ala Pro Asn Gly Pro Ma Gln Oln Ma Val He Arg Ma Ma Leu 305 310 315 320 Cgs Asn Ala Gly Met Ala Pro Ala Asp Val Asp Igr Val Gln Ala His 325 330 335 Gly Thr Oly Thr Pro Leu Gly Asp Pro He Gln Leu Arg Ala Met Ala 340 345 350 Ala Val Leu sly Oln sly Arg Ala Val Asp Ser Pro Leu He Val Oly 355 360 365 Ser Val Lys Thr Asn Phe Oly His Leu sln Ala Ala Ala Oly He Ala 370 375 380 Oly Leu He Lys Thr He Leu Ala Leu Oln His Arg Oln He Pro Pro 385 390 395 400 Hís Leu His Phe Asn Ala Pro Asn Pro His Val Leu Trp Asn Olu Leu 405 410 415 Pro Leu Lys He Ala Thr Ala Cys Ser Pro Trp Pro Ser Asn Gly Arg 420 425 430 Pro Arg Val Ala Gly Val Ser Ser Phe Oly He Ser Oly Thr Asn Ser 435 440 445 His Val Val Leu Ala Oln Ala Lys Thr Asn Val Glu Ala Lys Thr Asn 450 455 460 Val Gln Ala Lys Thr Asn Val Gln Ala Lys Thr Ser Glu Glu Val Lys 465 470 475 480 *****.?**é*?,Lk* Ala Ser Val Glu Ma Lys Gly Asn Val Glu Ma Lys Ma Ser Ala Ser 485 490 495 Val Pro Leu Leu Glu Gly Asp Ser Arg Pro Arg Ser Gly Gly Gly Gly 500 505 510 Ser Gly Arg Pro Pro Ser Arg Olu Glu Val Pro Val Pro Asp Gln Leu 515 520 525 His Ala Olu Asp Oly Arg Olu Tyr Leu Leu Pro Leu Ser Ala Arg His 530 535 540 Pro Gln Ala Leu Arg Asp Leu Ala Gly Ala Tyr Arg Asp Gly Asp Phe 545 550 555 560 His Ala Pro Leu Ser Ala Leu Cys Ser Ala Ala Ser Leu Thr Arg Ser 565 570 575 His Tyr Glu His Arg Ala Ala Phe Val Ala Ser Ser Leu Pro Olu Phe 580 585 590 Asn Gln Leu Leu Glu Ala Phe Arg Arg Asn Glu Thr Asn Arg Gly Val 595 6000 605 Ala Thr Oly Phe Ala Asp Pro Gly Val Arg Pro Lys Leu Ala Phe He 610 615 620 Phe Ser Gly Gln Lgy Oly Oln Tyr Pro Arg Met Ala Tyr Arg Leu Tyr 625 630 635 640 Ser Asp slu Pro Val Phe Arg Ser Ala He Glu Arg Cys Asp Ala Ala 645 650 655 Phe Arg Ser Phe Val Glu Trp Arg Leu Ala Asp Leu Leu Ala Asp Olu 660 665 670 * ***.*******. a .**.**.. t.**-**.-^.-****!* -.'**^^**»^.^ ,,, * ?» -iÍ*^Í 1***^ Ser Oly Ala Trp Leu Ser sln He Asp Arg Val Gln Pro Ala Leu Phe 675 680 685 Ala Val Oln He Ma Leu Val slu Leu Leu Gln Ser Trp Gly He Arg 690 695 700 Pro Asp Gly Val Ala Gly His Ser Met Gly Glu Val Ala Ala Ala His 705 710 715 720 Val Ala Gly He Leu Thr Leu Olu Asp Ala Ala Arg He He Cys Arg 725 730 735 Arg Ser Arg Leu Leu Leu Oly Leu Arg Oly Arg Oly Ala Met Ala Leu 740 745 750 Val Olu Leu Pro Leu Asp Arg Ala Lys Ala Val Leu Ala Olu Arg Oly 755 760 765 Leu Thr Thr Val Ser Val Ala Ala Ser Asn Oly Pro Arg Ser Thr Val 770 775 780 Phe Ser Oly Asp Arg Val Ala Len Oln His Leu Lys Asp Asp Phe Glu 785 790 795 800 Arg Arg Gly Val Phe Cys Arg Len He Oln Val Asp Val Ala Ser His 805 810 815 Ser Ser Gln Val Asp Pro Len Gln Asn sln Len Arg Oln Olu Len Oly 820 825 830 Arg Val He Ala Lys Arg Ser Ala Val Pro Phe Phe Ser Thr Val Oln 835 840 845 Oly Oln Len Ser Thr Oly Glu Ala Cys Asp Ma Ser Tyr Trp Val Ala 850 855 860 ^.? ? **? ,****i*t* *k ., *****A**^**t*t ..*^ i*?* *******A*******.??*Jt**tt*** -*^^ Asn Len Arg Gln Pro Val Arg Phe Trp Gln Ser Len Gln Ma Met Ma 865 870 875 880 Gly Asp slu Phe Thr Gln Phe Len Gln He Ser Pro His Pro Val Leu 885 890 895 Thr Pro Ser He Gln Asp Ser Len Arg Thr Len Gly He Asn Gly Leu 900 905 910 Val Arg Pro Val Len Arg Arg Asp Gln Pro Gln Arg Arg Gln Leu Leu 915 920 925 Gln Leu Len Ala Ala Len Tyr Val Asn Gly Gln Arg Pro Asp Trp Arg 930 935 940 Ala Len Ala Ser Ser Pro Asp Thr Arg Len Asp Len Pro Thr Tyr Pro 945 950 955 960 Trp Oln Arg Oln Arg Phe Trp Phe Ala Thr Ser Thr Arg Arg Ser Len 965 970 975 Pro Ala Val Gly Gly His Pro Leu Leu Gly Arg Lys Val Glu He Ala 980 985 990 Leu Ala Pro Asp Thr His Val Trp Glu Ser Val Leu Ser Len Asp Ala 995 1000 1005 Leu Pro Phe Len Ala Asp His Arg Leu Asn Oln Leu Val Val Leu Pro 1010 1015 1020 sly Ala Ala Tyr Val Glu Met Ala Len Ala Ala Ala Lys Oln Val Phe 1025 1030 1035 1040 Ala Oly Oly Cys Ser Leu sln Oln He Arg Phe Oln sln Met Leu Val 1045 1050 1055 Val Pro Ser Ma Oly Ala Ser Arg Val Gln Val He Leu Glu Gly His 1060 1065 1070 Ala Phe Arg He Ser Ser Leu Ala Gln Gly Gly Ser Asp Trp Thr Gln 1075 1080 1085 His Ala Arg Oly Thr Met Ala Ala Ma Pro Asp Lys Val Ala Pro Thr 1090 1095 1100 Val Ser Leu Pro Thr Leu sly Asp Arg He Olu Gly Asp Asp Phe Tyr 1105 1110 1115 1120 Ala Ala Phe Ala Ser Gln Oly Met His Tyr Gly Asp Thr Phe Arg Gly 1125 1130 1135 He Ala Oln Val Trp Arg Arg Asp Oly Oln Ala Val Ala Arg Leu Ser 1140 1145 1150 Val Pro Asp Ala Val Arg Oln Ala Oln Ser Oly Tyr Thr Leu His Pro 1155 1160 1165 Ala Leu Leu Asp Ala Cys Leu Gln Val Leu Gly Ala Thr Leu Gly Gly 1170 1175 1180 Oln Gly Ser Ala Gly Pro Cys Val Pro Val Ala He Gln Arg Leu His 1185 1190 1195 1200 Cys Phe Cly Arg Pro Ala Gly Asp Leu Arg Val His Ala Arg Leu Thr 1205 1210 1215 Gly Arg Leu Olu Oly Asp Val Thr Leu Cys Asp Ala Oln Oly His Val 1220 1225 1230 He Leu Glu Val Gln Oly Leu Arg Ala Oln Glu Leu Glu Arg Gln Ser 1235 1240 1245 i*. ¡*,.*t**. ** **********************- -- *****-** .i **.****», *** ,*' A ,.
Olu Trp Phe His Ala Met slu Trp Glu Pro Gln Leu Leu a Glu Ser 1250 1255 1260 Pro Thr Ala Thr Val Ser Gly Ma Trp Leu Val He Ala Asp Ala Gly 1265 1270 1275 1280 Gly He Ala Ala Ala Val Ala Arg Oly Leu Oly Thr Asn Thr Val Val 1285 1290 1295 He Ser sly Arg Asp Ala Olu He Pro Asp Gln Pro Tyr Arg Gly Val 1300 1305 1310 He His Cys Gly Ser Leu Asp Glu Thr Gln Asp Gln Thr Asp Pro Ser 1315 1320 1325 Ala Ala Gly Gly Thr Ala Cys Gln Asp He Leu Arg He Val Gln Glu 1330 1335 1340 Phe Gly Val Oly Arg He Gln Leu Thr Lys Gln Ala Ser Asp Ala Olu 1345 1350 1355 1360 Ser Gln His Pro Arg He Trp Leu He Thr Ala Gly Val His Ala Gln 1365 1370 1375 His Leu sln Met Pro Val Val Pro Ala Arg Ala Pro Val Trp Gly Leu 1380 1385 1390 Gly Arg Thr He Ala Ala Gln His Pro Gln Phe Ala Cys Thr Cys He 1395 1400 1405 Asp Leu Asp Thr Ala Gly Glu Val Glu Val Gln Ala Leu Cys Arg Olu 1410 1415 1420 He Leu Ala Gly Ser Ser Glu Arg Gln Oly 1425 1430 $ k*S*? £?.A Se hace sonstar que con relación a esta fecha, el mejor método conosido por la solisitante para llevar a la prástisa la sitada invensión, es el que resulta claro de la presente descripsión de la invensión.

Claims (81)

REIVINDICACIONES Habiéndose dessrito la invensión somo antesede, se reslama somo propiedad lo sontenido en las siguientes reivindisasiones :
1. Un prosedimiento de preparasión de una solessión de ásidos nusleisos a partir de una muestra de sol que sontiene organismos, el prosedimiento está sarasterizado porque somprende la susesión de etapas siguientes: I (a) Obtención de micropartículas por trituración de una muestra de suelo previamente seca o desecada, después de pone en suspensión las micropartísulas en un medio amortiguador líquido; y (b) extrassión de los ásidos nusleisos presentes en las misropartísulas; y (s) paso de la solusión que sontiene los ácidos nucleicos sobre un tamiz molecular, después la recuperasión de las frassiones de elusión enriquesidas son ásidos nusleisos y el paso de las frassiones de elusión enriquesidas son ásidos nusleicos sobre un soporte de cromatografía de intercambio de aniones, después la recuperasión de las frassiones de elusión que sontienen los ásidos nusleisos purifisados. Í???****? * **i* . L**. -tfjüü [- f -,- n - nii ffti
2. Un procedimiento de preparasión de una colección de ácidos nucleisos a partir de una muestra del medio ambiente que sontiene organismos, el prosedimiento está sarasterizado porque somprende la susesión de etapas siguiente: -II (i) Obtención de una suspensión por dispersión de la muestra del medio ambiente en un medio líquido, después la homogeneización de la suspensión por agitación suave; y (ii) separación de los organismos y otros constituyentes minerales y/u orgánicos de la suspensión homogénea obtenida en la etapa (i) por centrifugación sobre un gradiente de densidad; y (iii) lisar los organismos separados en la etapa (ii) y extracsión de los ásidos nusleisos; y (iv) purifisasión de los ásidos nusleisos sobre un gradiente de sloruro de cesio.
3. El procedimiento de conformidad con la reivindicasión 1, sarasterizado porque la etapa I- (a) está seguida de una etapa somplementaria de: - tratamiento de las misropartísulas en suspensión en un medio amortiguador líquido por sonicación.
4. El procedimiento de conformidad con la reivindicasión 1, saracterizado porque la etapa I- (a) está seguida de las etapas complementarias siguientes: - tratamiento de las micropartículas en suspensión en un medio amortiguador líquido por sonisasión; insubasión de la suspensión a 37°C después de la sonisasión en presensia de lisozima y de acromopeptidasa; adisión de SDS resuperasión de los ásidos nucleicos .
5. El procedimiento de conformidad con la reivindicasión 1, sarasterizado porque la etapa I- (a) está seguida de las etapas complementarias siguientes: - homogeneización de las micropartísulas son la ayuda de una etapa de mezslado violento (vórtise) , seguida de una etapa de agitasión simple; congelación de la suspensión homogénea, seguida de una descongelasión; tratamiento por sonisasión de la suspensión después de la dessongelasión; - insubasión de la suspensión á 37°C después de la sonisasión, en presensia de lisozima y de asromopeptidasa; adisión de SDS;
6. El prosedimiento de sonformidad son una de las reivindisasiones 1 a 5, sarasterizado porque los ásidos nucleicos son moléculas de ADN.
7. Un procedimiento de preparación de una colessión de vestores resombinantes , sarasterizado porque los ásidos nusleisos obtenidos por el prosedimiento de sonformidad son una de las reivindisasiones 1 a 6 son insertados en un vestor de clonación y/o de expresión. Irtiiii iliTilíiiiéil
8. El procedimiento de conformidad con la reivindicasión 7, sarasterizado porque los ásidos nucleicos son separados en función de su tamaño, previamente a su inserción en el vector de clonación y/o de expresión.
9. El procedimiento de conformidad con la reivindicasión 7, carasterizado porque el tamaño promedio de los ácidos nucleisos se vuelve sensiblemente uniforme por ruptura físisa, previamente a su insersión en el vestor de slonasión y/o de expresión.
10. El prosedimiento de sonformidad son la reivindisasión 7, sarasterizado porque el vestor de slonasión y/o de expresión es del tipo plásmido.
11. El prosedimiento de sonformidad son la reivindicación 7, carasterizado porque el vestor de slonasión y/o de expresión es del tipo cósmido.
12. El procedimiento de conformidad con la reivindicasión 11, sarasterizado porque se trata de un sósmido duplisativo en E. coli e integrativo en Streptomyces .
13. El prosedimiento de sonformidad son la reivindisasión 12, sarasterizado porque se trata de un sósmido pOS7001.
14. El prosedimiento de sonformidad son la reivindicasión 11, caracterizado porque se trata de un cósmido conjugativo e integrativo en Streptomyces .
15. El prosedimiento de sonformidad son la reivindisasión 14, sarasterizado porque el sósmido es elegido entre los sósmidos pOSV303, pOSV306 y pOSV307.
16. El procedimiento de conformidad con la 5 reivindicación 11, caracterizado porque se trata de un cósmido duplicativo a la vez en E. coli y en Streptomyces .
17. El procedimiento de conformidad con la reivindicación 16, carasterizado porque se trata del cósmido pOS 700R. 0
18. El procedimiento de conformidad con la reivindicación 11, carasterizado se trata de un sósmido duplisativo en E. coli y Streptomyces y sonjugativo en Streptomyces .
19. El prosedimiento de sonformidad son la 5 reivindisasión 7, sarasterizado porque el vestor de slonasión y/o de expresión es del tipo BAC.
20. El prosedimiento de sonformidad son la reivindicación 19, carasterizado porque se trata de un vector BAC integrativo y conjugativo en Streptomyces . 0
21. El procedimiento de conformidad con la reivindicasión 20, sarasterizado porque el vestor es elegido entre los vestores BAC pOSV403, pMBD-1, pMBD-2, pMBD-3, pMBD-4, pMBD-5 y pMBD-6.
22. Un proseso de preparasión de un vector recombinante de clonasión y/o de expresión, sarasterizado porque la etapa de inserción de un ácido nucleico en el vestor de clonación y/o de expresión comprende las etapas siguientes: - abrir el vector de clonasión y/o de expresión en un sitio de slonasión elegido, son la ayuda de una endonusleasa de restrissión apropiada; agregar un primer ásido nusleiso homopolimériso en el extremo 3' libre del vector abierto; - agregar un segundo ácido nucleiso homopolimériso, de sesuensia somplementaria al primer ásido nusleiso homopolimériso, en el extremo 3' libre de ásido nusleiso de la solessión a insertarse en el vestor; - empalmar el ásido nusleiso del vestor y el ásido nucleico de la colección por hibridación del primer y segundo ácido nucleico homopolimérico de secuensias somplementarias una de la otra; serrar el vestor por ligasión.
23. El prosedimiento de sonformidad son la reivindicación 22, carasterizado porque: el primer ásido nusleiso homopolimérico es de una secuencia poli (A) o poli (T) ; y el segundo ácido nucleiso homopolimériso es de una sesuensia poli (T) o poli (A) .
24. El prosedimiento de preparasión de un vector recombinante de conformidad con una de las reivindicasiones 22 ó 23, sarasterizado porque el tamaño del ácido nucleiso a insertarse es de al menos 100 kilobases, de preferencia de al menos 200 kilobases.
25. El procedimiento de preparación de un vector recombinante de conformidad con una de las reivindisasiones 22 a 24, sarasterizado porque el ásido nusleiso a insertarse está sontenido en la solessión de ásidos nusleisos obtenidos por el prosedimiento de sonformidad son una de las reivindisasiones 1 a 6.
26. Un procedimiento de preparación de un vector recombinante de clonasión y/o de expresión, sarasterizado porque la etapa de inserción de un ácido nusleiso en el vestor de clonación y/o de expresión comprende las etapas siguientes : creación de puntas libres sobre los extremos del ácido nucleico de la colección, por eliminación de las secuencias 3' salientes y el reemplazo de las secuensias 5' salientes; abertura del vector de clonasión y/o de expresión en un sitio de slonasión elegido, son la ayuda de una endonusleasa de restrissión apropiada; sreasión de puntas libres en los extremos del ácido nucleiso del vestor por eliminasión de las sesuensias 3' salientes y el reemplazo de las sesuensias 5' salientes, después la desfosforilación de los extremos 5' ; íéátéJuUt -i -fUtlfttli i I "i TilÜH - "- --**""* - k-^1J-:- ******* -** •******* *.**- .. ******** **...***,*l***.*?***. A.*, i ? A. adisión de adaptadores oligonusleotídicos complementarios; inserción del ácido nucleiso de la solección en el vestor por ligasión.
27. El prosedimiento de preparasión de un vestor resombinante de sonformidad son la reivindicación 26, carasterizado porque el tamaño del ácido nucleico a insertarse es de al menos 100 kilobases, de preferencia de al menos 200 kilobases . >
28 . El procedimiento de preparación de un vector recombinante de conformidad con una de las reivindicasiones 26 ó 27, sarasterizado porque el ásido nusleiso a insertarse está contenido en la colesción de ácidos nucleicos obtenidos por el procedimiento de conformidad con ima de las reivindisasiones 1 a 6.
29 . El prosedimiento de sonformidad son una de las reivindisasiones 22 a 28 , sarasterizado porque los ácidos nucleisos son insertados tal suales , sin tratamiento por una o varias endonusleasas de restricción , previamente a su inserción en el vector de clonasión y/o de expresión .
30 . Una colessión de ásidos nusleisos sonstituida de los ácidos nucleisos obtenidos por el prosedimiento de sonformidad son una de las reivindisasiones 1 a 6 .
31 . Un ásido nucleico carasterizado porque está contenido en la solessión de ácidos nusleisos de conformidad con la reivindicasión 30 . l¿dí &*éjáh jlF >***?~~"--** ' **' - ****ft****** v** jA**i'*>>A - **** * - Kt******.*
32. El ásido nusleiso de sonformidad son la reivindisasión 31, saracterizado porque comprende una secuencia nucleotídica que codifica al menos un operón, o una parte de un operón.
33. El ácido nucleiso de sonformidad son la reivindisación 32, saracterizado porque el operón codifica para la totalidad o una parte de una vía metabólica.
34. El ácido nucleiso de sonformidad son la reivindisasión 33, sarasterizado porque la vía metabólisa es la vía de síntesis de los polisétidos.
35. El ásido nusleiso de sonformidad son la reivindisasión 34, sarasterizado porque se elige entre los polinusleótidos que somprenden las sesuensias SEQ ID N° 30 a 44 y las SEQ ID N° 115 a 120.
36. El ásido nusleiso de sonformidad son la reivindisasión 31, sarasterizado porque somprende la totalidad de una sesuencia nucleotídisa que codifisa para un polipéptido.
37. El ásido nusleiso de sonformidad son una de las reivindisasiones 31 a 36, sarasterizado porque es de origen procariote.
38. El ácido nucleiso de sonformidad con la reivindicasión 37, sarasterizado porque proviene de una bacteria o de un virus.
39. El ásido nusleiso de sonformidad con una de las reivindicasiones 31 a 33 y 36, sarasterizado porque es de origen eucariote.
40. El ásido nusleiso de sonformidad son la reivindicación 39, carasterizado porque proviene de un hongo, de una levadura, de una planta o de un animal.
41. Un vector recombinante, carasterizado porque se elige entre los vectores recombinantes siguientes: a) un vector que comprende un ácido nusleiso de sonformidad son una de las reivindisasiones 35 a 40; b) un vestor obtenido de sonformidad son el prosedimiento de una de las reivindisasiones 22 a 25 y 29; s) un vestor obtenido de sonformidad son el prosedimiento de una de las reivindisasiones 26 a 29.
42. Un vestor, sarasterizado porque se trata del cósmido pOS 7001.
43. Un vector, carasterizado porque se trata del cósmido pOSV303.
44. Un vector, sarasterizado porque se trata del cósmido pOSV306.
45. Un vestor, sarasterizado porque se trata del sósmido pOSV307.
46. Un vestor, sarasterizado porque se trata del sósmido pOS 7OOR.
47. Un vestor, sarasterizado porque se trata del vestor BAC pOSV403.
48. Un vector, carasterizado porque se trata del vector pMBD-1.
49. Un vector, caracterizado porque se trata del vector pMBD-2
50. Un vector, carasterizado porque se trata del vector pMBD-3.
51. Un vector, carasterizado porque se trata del vector pMBD-4.
52. Un vector, carasterizado porque se trata del vector pMBD-5.
53. Un vector, carasterizado porque se trata del vector pMBD-6.
54. Una colessión de vectores recombinantes, tales como los obtenidos de conformidad con el procedimiento de una de las reivindicasiones 7 a 21, 25 y 28.
55. Un vector recombinante de clonasión y/o de expresión, sarasterizado porque está contenido en la colessión de vestores resombinantes de sonformidad son la reivindicación 54.
56. Una célula huésped recombinante, carasterizada porque somprende un ásido nusleiso de conformidad con una de las reivindicasiones 31 a 40 o un vestor resombinante de sonformidad con la reivindicasión 55. tA&^Á ^^^^ *** ** *-**-* H****** -**---.*^^ *****^SH**& .*!*****.%
57. La sélula huésped resombinante de sonformidad son la reivindisasión 56, sarasterizada porque se trata de una célula procariote o eusariote.
58. La sélula huésped resombinante de conformidad con la reivindicasión 57, sarasterizada porque se trata de una bacteria.
59. La célula huésped recombinante de conformidad con la reivindicasión 58, sarasterizada porque se trata de una bacteria elegida entre E. coli y Streptomyces .
60. La célula huésped recombinante de conformidad con la reivindicasión 58, sarasterizada porque se trata de una levadura o de un hongo filamentoso.
61. Una solección de sélulas huésped resombinantes , caracterizada porque cada una de las células huésped constitutivas de la colessión, comprende un ácido nucleiso de la solessión de ásidos nusleisos de sonformidad con la reivindicasión 30.
62. Una solessión de sélulas huésped resombinantes, caracterizada porque cada una de las células huésped constitutivas de la colección, comprende un vector recombinante de conformidad con una de las reivindicasiones 41 ó 55.
63. Un prosedimiento de detessión de un ásido nucleico de una secuensia nusleotídisa determinada, o de una sesuensia nusleotídica estructuralmente emparentada con una secuencia nucleotídisa determinada, en una solessión de sélulas huésped resombinantes de sonformidad son una de las reivindisasiones 61 ó 62, saracterizado porque comprende las etapas siguientes: - poner en contacto la colección de células huésped recombinantes son un par de cebadores que se hibridan con la secuensia nusleotídisa determinada o que se hibridan son una sesuensia nusleotídisa estrusturalmente emparentada son la sesuensia nusleotídisa determinada; - realizar al menos tres sislos de amplifisación; detestar el ásido nusleiso eventualmente amplifisado.
64. Un prosedimiento de detessión de un ásido nucleico de una secuencia nucleotídisa determinada, o de una secuensia nusleotídisa estrusturalmente emparentada son una sesuencia nusleotídisa determinada, en una solessión de células huésped recombinantes de conformidad con una de las reivindisasiones 61 ó 62, sarasterizado porque somprende las etapas siguientes: poner en sontasto la solessión de sélulas huésped resombinantes son una sonda que se híbrida con la secuencia nucleotídisa determinada o que se híbrida son una sesuensia nusleotídisa estrusturalmente emparentada con la secuencia nucleotídisa determinada; detestar el híbrido formado eventualmente, entre la sonda y los ásidos nusleicos comprendidos en los vestores de la solessión.
65. Un prosedimiento para identifisar la produssión de un sompuesto de interés para una o varias sélulas huésped resombinantes en una solessión de sélulas huésped resombinantes, de sonformidad son una de las reivindicaciones 61 ó 62, carasterizado porque que comprende las etapas siguientes: cultivar las células huésped recombinantes de la colessión en un medio de sultivo apropiado; detessión del sompuesto de interés en el sobrenadante del sultivo o en el lisado selular de una o varias de las células huésped recombinantes cultivadas.
66. Un procedimiento para seleccionar una célula huésped recombinante que produse un sompuesto de interés en una solessión de sélulas huésped recombinantes de conformidad con una de las reivindicasiones 61 ó 62, caracterizado porque comprende las etapas siguientes: cultivar las células huésped recombinantes de la colesción en un medio de cultivo apropiado; detessión del sompuesto de interés en el sobrenadante del sultivo o en el lisado selular de una o varias de las sélulas huésped resombinantes sultivadas; selección de las sélulas huésped resombinantes que produsen el sompuesto de interés.
67. Un prosedimiento para la produssión de un sompuesto de interés, sarasterizado porque comprende las etapas siguientes: cultivar una célula huésped recombinante selecsionada de sonformidad son el prosedimiento de la reivindisasión 66 ; resuperar, y dado el saso, purifisar el sompuesto produsido por disha sélula huésped resombinante .
68. Un sompuesto de interés, sarasterizado porque se obtiene de conformidad con el procedimiento de la reivindicasión 67.
69. El sompuesto de sonformidad son la reivindisasión 68, sarasterizado porque se trata de un polisétido.
70. Un polisétido, sarasterizado porque se produse grasias a la expresión de al menos una sesuensia nusleotídisa que comprende una secuensia elegida entre las secuensias SEQ ID N° 30 a 44 y SEQ ID N° 115 a 120.
71. Una somposisión, sarasterizada porque somprende un polisétido de sonformidad son la reivindisasión 69 ó 70.
72. Una somposisión farmacéutica, carasterizada porque comprende una cantidad farmacológisamente astiva de un polisétido, de sonformidad son la reivindisasión 69 ó 70, en asosiasión son un vehísulo farmaséutisamente sompatible. H-t* TfflT *—•*-- **-**A r 'Tft'hilTr^* -nmO**!******* *.******-* ±*i -*...*..
73. Un prosedimiento de determinasión de la diversidad de los ácidos nucleisos sontenidos en una solessión de ásidos nusleisos y más partisularmente, de una solessión de ácidos nucleisos que provienen de una muestra del medio ambiente, de preferensia de una muestra del suelo, el prosedimiento está sarasterizado porque somprende las etapas siguientes: poner en sontasto los ásidos nusleisos de la solección de ácidos nucleisos a probarse son un par de cebadores oligonucleotídisos que se hibridan son toda sesuensia de ADN ribosomal 16 S basteriano; realizasión de la menos tres sislos de amplifisación; detección de los ácidos nucleisos amplifisados con la ayuda de una sonda oligonucleotídisa o de una pluralidad de sondas oligonusleotídisas, sada sonda se híbrida espesífisamente son una sesuensia de ADN ribosomal 16 S somún a un reino, un orden, una subclase o un género bacteriano; dado el caso, comparar los resultados de la etapa de detecsión anterior, son los resultados de detesción, con la ayuda de la sonda o de la pluralidad de sondas, de los ácidos nucleisos de sesuencia conocida que constituyen una escala patrón.
74. El procedimiento de conformidad con la reivindicasión 73, sarasterizado porque el par de sebadores que se hibridan a toda sesuensia de ADN ribosomal 16 S basteriano, están sonstituidos del sebador FOPS 612 (SEQ ID N°12) y el sebador FOPS 669 (SEQ ID N°13).
75. El prosedimiento de sonformidad son la reivindisasión 73, sarasterizado porque el par de sebadores que se hibridan a toda sesuensia de ADN ribosomal 16 S basteriano está constituido del cebador 63 f (SEQ ID N°22) y el cebador 1387 (SEQ ID N°23) .
76. Un ácido nucleico, carasterizado porque comprende una secuensia nusleotídisa de ADNr 16S elegida entre las secuencias que poseen al menos 99% de identidad en nucleótidos con las secuensias SEQ ID N°60 a SEQ ID N°106.
77. Un prosedimiento de producción de una policétido sintasa del tipo I, el procedimiento de producsión está caracterizado porque comprende las etapas siguientes: obtención de una célula huésped recombinante que comprende un ácido nucleico que codifisa para una polisétido sintasa del tipo I, que somprende una sesuensia nusleotídisa elegida entre las secuencias SEQ ID N°33 a SEQ ID N°44, SEQ ID N°30 A SEQ ID N°32 y SEQ ID N°115 a SEQ ID N°120. cultivo de las células huésped recombinantes en un medio de cultivo apropiado; resuperasión y, dado el saso, purificación de la policétido sintasa del tipo I, a partir de un sobrenadante del cultivo o del lisado celular. *, **** **** * *****.
78. Una policétido sintasa, caracterizada porque comprende una secuensia de aminoásidos elegida entre las sesuensias SEQ ID N°45 a 59 y SEQ ID N°121 a SEQ ID N°126.
79. Un antisuerpo dirigido sontra una polisétido smtasa de sonformidad son la reivindisasión 78.
80. Un prosedimiento de detessión de una polisétido sintasa del tipo I o de un fragmento peptídiso de esta enzima, en una muestra, el prosedimiento está sarasterizado porque somprende las etapas de : a) poner en contacto un anticuerpo de conformidad con la reivindicasión 79, son la muestra a probarse; b) detestar el somplejo antígeno/antisuerpo eventualmente formado .
81. Un estushe de detessión de una polisétido sintasa del tipo I en una muestra, sarasterizado porque somprende: a) un antisuerpo de sonformidad son la reivindisasión 79; b) dado el saso, los reactivos necesarios para la detecsión del somplejo antígeno/antisuerpo eventualmente formado. ** * *****A * *?***#. ilínlJhi!. In ¡.*...~ *******, .fet la
MXPA02003819A 1999-11-29 2000-11-27 Procedimiento de obtencion de acidos nucleicos a partir de una muestra del medio ambiente, acidos nucleicos asi obtenidos y su aplicacion en la sintesis de compuestos. MXPA02003819A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR9915032A FR2801609B1 (fr) 1999-11-29 1999-11-29 Procede d'obtention d'acides nucleiques a partir d'un echantillon de l'environnement, acides nucleiques ainsi obtenus et leur application a la synthese de nouveaux composes
US209800P 2000-06-07 2000-06-07
PCT/FR2000/003311 WO2001040497A2 (fr) 1999-11-29 2000-11-27 Procede d'obtention d'acides nucleiques a partir d'un echantillon de l'environnement

Publications (1)

Publication Number Publication Date
MXPA02003819A true MXPA02003819A (es) 2002-09-30

Family

ID=34117618

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA02003819A MXPA02003819A (es) 1999-11-29 2000-11-27 Procedimiento de obtencion de acidos nucleicos a partir de una muestra del medio ambiente, acidos nucleicos asi obtenidos y su aplicacion en la sintesis de compuestos.

Country Status (1)

Country Link
MX (1) MXPA02003819A (es)

Similar Documents

Publication Publication Date Title
AU781961B2 (en) Method for obtaining nucleic acids from an environment sample, resulting nucleic acids and use in synthesis of novel compounds
US6391640B1 (en) Methods and compositions for cellular and metabolic engineering
US6309883B1 (en) Methods and compositions for cellular and metabolic engineering
US7223539B2 (en) Method and kits for preparing multicomponent nucleic acid constructs
US8048674B2 (en) Methods and compositions for cellular and metabolic engineering
JP5074185B2 (ja) イソプレノイドの生成
KR20190017751A (ko) 피부 장애의 치료를 위한 조성물 및 방법
KR101261870B1 (ko) 폴리믹신 b 또는 e 생합성 효소 및 이를 코딩하는 유전자 군
Goel et al. Genetic locus encoding functions involved in biosynthesis and outer membrane localization of xanthomonadin in Xanthomonas oryzae pv. oryzae
KR20100039443A (ko) 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법
US7255989B1 (en) Method for obtaining nucleic acids from an environment sample, resulting nucleic acids and use in synthesis of novel compounds
Smalla et al. Isolation and characterisation of plasmids from bacteria
WO2002059322A2 (en) Compositions and methods relating to the daptomycin biosynthetic gene cluster
JP2002518045A (ja) 天然物を生産する能力を適当な生産宿主中に移す方法
JP7086984B2 (ja) Streptomyces fungicidicusの遺伝子組換え株におけるエンデュラシジンの産生を増強するための組成物及び方法
MXPA02003819A (es) Procedimiento de obtencion de acidos nucleicos a partir de una muestra del medio ambiente, acidos nucleicos asi obtenidos y su aplicacion en la sintesis de compuestos.
Sarovich et al. pPSX: A novel vector for the cloning and heterologous expression of antitumor antibiotic gene clusters
KR20100034055A (ko) 유전자 클러스터 또는 그의 일부를 클로닝하기 위한 벡터 및 방법
NZ519883A (en) Extraction of DNA from microorganisms in dry soil samples thereby identifying the diversity of the organisms present
US6245504B1 (en) Transducing phages of Actinomycetales
Green et al. Biological and molecular characterization of cellular differentiation in Tetrahymena vorax: A potential biocontrol protozoan
Schully Regulatory intricacies that confer temporal control of conjugation and antibiotic production functions in Streptomyces: new variations on old themes
KR20080032641A (ko) 티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산
Bangera Genetic analysis of the 2, 4-diacetylphloroglucinol biosynthetic locus in the biocontrol agent Pseudomonas fluorescens Q2-87
EA045694B1 (ru) Способы и композиции для лечения и контроля заболевания растений

Legal Events

Date Code Title Description
FA Abandonment or withdrawal