CA2393041A1 - Procede d'obtention d'acides nucleiques a partir d'un echantillon de l'environnement, acides nucleiques ainsi obtenus et leur application a la synthese de nouveaux composes - Google Patents

Procede d'obtention d'acides nucleiques a partir d'un echantillon de l'environnement, acides nucleiques ainsi obtenus et leur application a la synthese de nouveaux composes Download PDF

Info

Publication number
CA2393041A1
CA2393041A1 CA002393041A CA2393041A CA2393041A1 CA 2393041 A1 CA2393041 A1 CA 2393041A1 CA 002393041 A CA002393041 A CA 002393041A CA 2393041 A CA2393041 A CA 2393041A CA 2393041 A1 CA2393041 A1 CA 2393041A1
Authority
CA
Canada
Prior art keywords
vector
dna
nucleic acids
nucleic acid
collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
CA002393041A
Other languages
English (en)
Inventor
Pascale Jeannin
Jean-Luc Pernodet
Michel Guerineau
Pascal Simonet
Sophie Courtois
Carmela Cappellano
Francois Francou
Alain Raynal
Maria Ball
Guennadi Sezonov
Karine Tuphile
Asa Frostegard
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aventis Pharma SA
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from FR9915032A external-priority patent/FR2801609B1/fr
Application filed by Individual filed Critical Individual
Publication of CA2393041A1 publication Critical patent/CA2393041A1/fr
Abandoned legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P33/00Antiparasitic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P33/00Antiparasitic agents
    • A61P33/02Antiprotozoals, e.g. for leishmaniasis, trichomoniasis, toxoplasmosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/06Immunosuppressants, e.g. drugs for graft rejection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Veterinary Medicine (AREA)
  • General Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Oncology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Communicable Diseases (AREA)
  • Transplantation (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

La présente invention concerne un procédé de préparation d'acides nucléiques à partir d'un échantillon de l'environnement, plus particulièrement un procédé d'obtention d'une collection d'acides nucléiques à partir d'un échantillon. L'invention est également relative aux acides nucléiques ou aux collections d'acides nucléiques obtenus selon le procédé et leur application à la synthè se de nouveaux composés, notamment de nouveaux composés d'intérêt thérapeutique . L'invention a également pour objet les moyens nouveaux mis en oeuvre dans le procédé d'obtention d'acides nucléiques ci-dessus, tels que de nouveaux vecteurs et des nouveaux procédés de préparation de tels vecteurs ou encore des cellules hôtes recombinantes comprenant un acide nucléique de l'inventio n. L'invention concerne encore des procédés pour détecter un acide nucléique d'intérêt au sein d'une collection d'acides nucléiques obtenus selon le procédé ci-dessus, ainsi que les acides nucléiques détectés par un tel procé dé et les polypeptides codés par de tels acides nucléiques.

Description

Procédé d'obtention d'acides nucléiques à partir d'un échantillon de l'environnement, acides nucléiques ainsi obtenus et leur application à la synthèse de nouveaux composés s La présente invention concerne un procédé de préparation d'acides nucléiques à partir d'un échantillon de l'environnement, plus particulièrement un procédé d'obtention d'une collection d'acides nucléiques à partir d'un échantillon. L'invention est également relative aux acides nucléiques ou aux collections d'acides nucléiques obtenus io selon le procédé et leur application à la synthèse de nouveaux composés, notamment de nouveaux composés d'intérêt thérapeutique.
L'invention a également pour objet les moyens nouveaux mis en oeuvre dans le procédé d'obtention d'acides nucléiques ci-dessus, tels que de nouveaux vecteurs et des nouveaux procédés de préparation 1s de tels vecteurs ou encore des cellules hôtes recombinantes comprenant un acide nucléique de l'invention.
L'invention concerne encore des procédés pour détecter un acide nucléique d'intérêt au sein d'une collection d'acides nucléiques obtenus selon le procédé ci-dessus, ainsi que les acides nucléiques 2o détectés par un tel procédé et les polypeptides codés par de tels acides nucléiques.
L'invention a également trait à des acides nucléiques obtenus et détectés selon les procédés ci-dessus, en particulier des acides nucléiques codant pour une enzyme participant à la voie de biosynthèse.
2s d'antibiotiques tels que les ~3-lactames, les aminoglycosides, les nucléotides hétérocycliques ou encore des polykétides ainsi que l'enzyme codée par ces acides nucléiques, les polykétides produits grâce à l'expression de ces acides nucléiques et enfin des compositions pharmaceutiques comprenant une quantité pharmacologiquement active 3o d'un polykétide produit grâce à l'expression de tels acides nucléiques.
Depuis la découverte de la production de la streptomycine par les actinomycètes, la recherche de nouveaux composés d'intérêt thérapeutique, et tout particulièrement de nouveaux antibiotiques, a eu recours de manière accrue à des méthodes de criblage des métabolites 3s produits par les micro-organismes du sol.
2 De telles méthodes consistent principalement à isoler les organismes de la microflore tellurique, à les cultiver sur des milieux nutritifs spécialement adaptés , puis à détecter une activité
pharmacologique dans les produits retrouvés dans les surnageants de s culture ou dans les lysats cellulaires ayant, le cas échéant, subi au préalable une ou plusieurs étapes de séparation et/ou de purification.
Ainsi, les méthodes d'isolement et de culture in vitro des organismes constituant la microflore tellurique ont permis, à la date d'aujourd'hui, de caractériser environ 40.000 molécules, dont environ la io moitié présente une activité biologique.
Des produits majeurs ont été caractérisés selon de telles méthodes de culture in vitro, tels que des antibiotiques (pénicilline, érythromycine, actinomycine, tétracycline, céphalosporine), des anti-cancéreux, des anticholestérolémiants ou encore des pesticides.
Is Les produits d'intérêt thérapeutique d'origine microbienne connus à ce jour proviennent majoritairement (environ 70%) du groupe des actinomycètes et plus particulièrement du genre Streptomyces.
Toutefois, d'autres composés thérapeutiques, tels que les teicoplanines, la gentamycine et les spinosines, ont été isolés à partir de micro-20 organismes de genres plus difficiles à cultiver tels que Micromonospora, Actinomadura, Actinoplanes, Nocardia, Streptosporangium, Kitasatosporia ou encore Saccharomonospora.
Mais la pratique illustre le fait que la caractérisation de nouveaux produits naturels synthétisés par les organismes de la 2s microflore du sol est restée limitée, en partie du fait que l'étape de culture in vitro aboutit le plus souvent à une sélection d'organismes déjà
connus antérieurement.
Les méthodes de séparation et de culture in vitro des organismes telluriques en vue d'identifier de nouveaux composés 3o d'intérêt présentent donc de nombreuses limites.
Chez les actinomycètes, par exemple, le taux de redécouverte d'antibiotiques déjà connus antérieurement est d'environ 99%. En effet, des techniques de microscopie en fluorescence ont permis de dénombrer plus de 10'° cellules bactériennes dans 1g de sol, alors que
3 seulement 0,1 à 1% de ces bactéries peuvent ëtre isolées après ensemencement sur des milieux de culture.
A l'aide de techniques de cinétique de réassociation d'ADN, il a pu être montré qu'entre 12.000 et 18.000 espèces bactériennes peuvent s être contenues dans 1 g de sol, alors qu'à ce jour, seuls 5000 micro organismes non eucaryotes ont été décrits, tout habitat confondu.
Des études d'écologie moléculaire ont permis d'amplifier et cloner de nombreuses séquences nouvelles d'ADNr 16S à partir d'ADN
de l'environnement.
io Les résultats de ces études ont conduit à tripler le nombre de divisions bactériennes caractérisées antérieurement.
A la date d'aujourd'hui, les bactéries sont subdivisées en 40 divisions, certaines d'entre elles n'étant constituées que par des bactéries ne pouvant ëtre cultivées. Ces derniers résultats témoignent de Is l'ampleur de la biodiversité microbienne restée inexploitée à ce jour.
Des travaux récents ont tenté de surmonter les nombreux obstacles à l'accès à la biodiversité de la microflore du sol, dont notamment l'étape de culture in vitro préalable à l'isolement et la caractérisation de composés d'intérêt industriel, surtout d'intérêt 2o thérapeutique.
Des méthodes ont ainsi été mises au point qui incluent une étape d'extraction de l'ADN des organismes telluriques, le cas échéant après un isolement préalable des organismes contenus dans les échantillons de sol.
2s L'ADN ainsi extrait, après lyse des cellules bactériennes sans étape préalable de culture~in vitro, est cloné dans des vecteurs utilisés pour transfecter des organismes hôtes, afin de constituer des banques d'ADN provenant de bactéries du sol.
Ces banques de clones recombinants sont utilisées pour 3o détecter la présence de gènes codant pour des composés d'intérêt thérapeutique ou alternativement pour détecter la production de composés d'intérêt thérapeùtique par ces clones recombinants.
Toutefois, les méthodes d'accès direct à l'ADN de la microflore du sol, décrites dans l'état de la technique présentent des inconvénients 3s lors de la mise en oeuvre de chacune des étapes décrites ci-dessus, de
4 nature à affecter considérablement la quantité et la qualité du matériel génétique obtenu et exploitable.
L'état de la technique concernant chacune des étapes de construction de banques d'ADN provenant d'échantillons de sol est s détaillé ci-après, ainsi que les inconvénients techniques identifiés par le demandeur et qui ont été surmontés selon la présente invention.
1. Etape d'extraction de l'ADN à partir d'un échantillon du to sol.
1.1 Extraction directe d'ADN de l'environnement.
II s'agit pour l'essentiel d'un procédé mettant en oeuvre des ts techniques d'extraction d'ADN réalisées directement sur l'échantillon dans l'environnement, le plus souvent après une lyse in situ préalable des organismes de l'échantillon.
De telles techniques ont été mises en oeuvre sur des échantillons provenant de milieux aquatiques, que ce soit d'eau douce 20 ou marine. Elles comprennent une première étape de concentration préalable des cellules présentes librement ou sous forme de particules, consistant en général en une filtration de grands volumes d'eau sur différents dispositifs de filtration, par exemple filtration classique sur membrane, filtration tangentielle ou rotationnelle ou encore ultrafiltration.
2s La taille des pores est comprise entre 0,22 et 0,45 mm et nécessite souvent une préfiltration dans le but d'éviter des colmatages dus au traitement de grands volumes.
Dans un second temps, les cellules récoltées sont lysées directement sur les filtres dans des petits volumes de solutions, par 3o traitement enzymatique et/ou chimique.
Cette technique est par exemple illustrée par les travaux de STEIN et al. , 1996, Journal of Bacteriology, Vo1.178 (3): 591-599 qui décrit le clonage de gènes codant pour de l'ADN ribosomal et pour un facteur d'élongation de la transcription (EF 2) à partir d'Archaebactéries 3s du plancton marin.

s Des techniques d'extraction directe d'ADN à partir d'échantillons de sol ou de sédiment ont été également décrites, basées sur des protocoles de lyse physique, chimique ou enzymatique réalisée in situ.
s Par exemple, le brevet US N°5,824,485 (Chromaxome Corporation) décrit une lyse chimique des bactéries directement sur l'échantillon prélevé par addition d'un tampon de lyse chaud à base d'isothiocyanate de guanidium.
La demande Internationale n°WO 99/20.799 (WISCONSIN
io ALUMNI RESEARCH. FOUNDATION) décrit une étape de lyse des bactéries in situ à l'aide d'un tampon d'extraction contenant une protéase et du SDS.
D'autres techniques ont également été utilisées telles que la réalisation de plusieurs cycles de congélation-décongélation de 1s l'échantillon puis pressage de l'échantillon décongelé à haute pression.
Ont été également utilisées des techniques de lyse des bactéries à l'aide d'une succession d'étapes.de sonication, de chauffage par micro-ondes et de chocs thermiques (PICARD et al. (1992).
Toutefois, les techniques d'extraction directe d'ADN de l'état de 20 la technique décrites ci-dessus ont une efficacité très variable du point de vue quantitatif et qualitatif.
Ainsi, les traitements chimiques ou enzymatiques in situ de l'échantillon ont le désavantage de ne lyser que certaines catégories de micro-organismes du fait de la résistance sélective des différents micro-2s organismes indigènes à l'étape de lyse en raison de leur morphologie hétérogène.
Ainsi, les bactéries à Gram-positif résistent à un traitement à
chaud au détergent SDS alors que la quasi-totalité des cellules à Gram-négatif sont lysées .
3o En outre, certains des protocoles d'extraction directe décrits ci-dessus favorisent l'adsorption des acides nucléiques extraits sur les particules minérales de l'échantillon, réduisant ainsi significativement la quantité d'ADN accessible.
Par ailleurs, si certains protocoles de l'état de la technique 3s divulguent une étape de traitement mécanique pour lyser les micro-organismes de l'échantillon prélevé, une telle étape de lyse mécanique est systématiquement effectuée en milieu liquide dans un tampon d'extraction, ce qui ne permet pas une bonne homogénéisation de l'échantillon de départ sous la forme de particules fines permettant une s accessibilité maximale à la diversité des organismes présents dans l'échantillon. Des essais de broyage ont également été effectués sur échantillon de sol brut à l'aide de billes de verre, mais la quantité d'ADN
extrait était faible.
II a été observé selon l'invention qu'une première étape de lyse Io mécanique in situ en milieu liquide avait des effets négatifs sur la quantité d'ADN susceptible d'être extrait.
La quantité d'ADN directement utilisable pour le clonage dans des vecteurs recombinants est également tributaire des étapes de purification subséquentes à son extraction.
Is Dans l'état de la technique, l'ADN extrait est ensuite purifié, par exemple par l'utilisation de.polyvinylpolypyrrolidone, par une précipitation en présence d'acétate d'ammonium ou de potassium, par des centrifugations sur gradient de chlorure de césium, ou encore des techniques chromatographiques, notamment sur support 2o d'hydroxyapatite, sur colonne échangeuse d'ions ou encore tamisage moléculaire ou par des techniques d'électrophorèse sur gel d'agarose.
Les techniques de purification d'ADN décrites antérieurement, surtout lorsque celles-ci sont combinées avec les techniques d'extraction d'ADN de l'environnement précitées, sont susceptibles de conduire à .
2s une co-purification de l'ADN avec des composés inhibiteurs provenant de l'échantillon initial qui sont difficiles à éliminer.
La co-extraction de composés inhibiteurs avec l'ADN nécessite la multiplication du nombre d'étapes de purification ce qui conduit à des pertes importantes de l'ADN initialement extrait et réduit simultanément 30 la diversité du matériel génétique initialement contenu dans l'échantillon, ainsi que sa quantité.
Un autre but de l'invention a été de surmonter les inconvénients des protocoles de purification antérieurs et de mettre au point une étape de purification d'ADN permettant de maintenir de manière optimale la diversité de l'ADN de l'échantillon initial, d'une part, et, de favoriser quantitativement son obtention, d'autre part.
Tout particulièrement, les améliorations qualitatives et quantitatives à la purification d'ADN sont maximales lorsqu'elles font s appel à une combinaison d'un procédé d'extraction direct de l'ADN selon l'invention et d'un procédé de purification ultérieur, comme cela sera décrit ci-après.
1.2. Extraction indirecte d'ADN de l'environnement.
to De telles techniques ont recours à une première étape de séparation des différents organismes de la microflore tellurique des autres constituants de l'échantillon de départ, préalablement à l'étape d'extraction de l'ADN proprement dite.
is Dans l'état de la technique, la séparation préalable d'une fraction microbienne d'un échantillon de sol comprend le plus souvent une dispersion physique de l'échantillon par broyage de ce dernier en milieu liquide, par exemple en utilisant des dispositifs du type Waring Blender ou encore un mortier.
20 II a également été décrit des dispersions chimiques, par exemple sur des résines échangeuses d'ions ou encore des dispersions à l'aide de détergents non spécifiques tels que le déoxycholate de sodium ou du polyéthylène glycol. Quel que soit le mode de dispersion, l'échantillon solide doit être mis en suspension dans de l'eau, du tampon 2s phosphate ou une solution saline.
L'étape de dispersion physique ou chimique peut être suivie d'une centrifugation sur gradient de densité permettant la séparation des cellules contenues dans l'échantillon et des particules de ce dernier, étant entendu que les bactéries ont des densités inférieures à celles de 30 la plupart des particules du sol.
L'étape de dispersion physique peut aussi être suivie alternativement d'une étape de centrifugation à faible vitesse ou encore une étape d'élutriation cellulaire.
L'ADN peut ensuite être extrait des cellules séparées par toutes 3s les méthodes de lyse disponibles et être purifié par de nombreuses méthodes, y compris les méthodes de purification décrites au paragraphe 1.1 précédent. Notamment, l'inclusion des cellules dans de l'agarose à bas point de fusion peut être réalisée afin de ménager la lyse.
s Toutefois, les méthodes décrites dans l'état de la technique connues du demandeur ne donnent pas ,satisfaction du fait de la présence, dans les fractions contenant l'ADN extrait, de constituants indésirables de l'échantillon de départ ayant une influence significative sur la qualité et la quantité d'ADN final.
to La présente invention se propose de résoudre les difficultés techniques rencontrées dans les procédés de l'art antérieur comme cela sera décrit ci-après.
2. Caractérisation moléculaire de l'ADN extrait.
ts Lorsque l'on désire construire une banque d'ADN à partir d'un échantillon de l'environnement, en particulier à partir d'un échantillon de sol, il est avantageux de vérifier la qualité et la diversité de la source d'ADN extrait et purifié préalablement à son insertion dans des vecteurs 2o appropriés.
L'objectif d'une telle caractérisation moléculaire de l'ADN extrait et purifié est d'obtenir des profils représentant les proportions des différents taxons bactériens présents dans cet extrait d'ADN. La caractérisation moléculaire de l'ADN extrait et purifié permet de 2s déterminer si des artéfacts ont été introduits lors de la mise en oeuvre des différentes étapes d'extraction et de purification et, le cas échéant, si la diversité d'origine de l'ADN extrait et purifié est représentative de la diversité microbienne présente initialement dans l'échantillon, notamment dans l'échantillon de sol.
3o A la connaissance du demandeur, il est recouru dans l'état de la technique à des procédés d'hybridation quantitative mettant en oeuvre des sondes oligonucléotidiques spécifiques de différents groupes bactériens, appliqués directement à l'ADN extrait de l'environnement.

Malheureusement, une telle approche est peu sensible et ne permet pas de détecter des genres ou des groupes taxonomiques présents en faible abondance.
L'état de la technique décrit aussi des procédés de PCR
s quantitative, telle que la MPN-PCR ou encore la PCR quantitative par compétition. Toutefois, ces techniques présentent d'importants inconvénients.
Ainsi, la MPN-PCR est d'une utilisation complexe du fait de la multiplication des dilutions et des répétitions qui la rend inappropriée 1o pour un grand nombre d'échantillons ou de couples d'amorces.
Par ailleurs, la PCR quantitative par compétition est d'une mise en oeuvre difficile du fait de la nécessité de construire un compétiteur spécifique à l'ADN cible qui, en outre, n'induit pas de biais ou d'artéfacts dans la compétition proprement dite.
is II est ainsi proposé selon l'invention un procédé de précriblage d'une banque d'ADN provenant d'un échantillon de l'environnement qui est à la fois rapide, simple et fiable et permet de tester la qualité de l'ADN préalablement extrait et purifié et de déterminer ainsi l'intérêt de construire une banque de clones préparés à partir de cet ADN purifié de 2o départ.
3. Vecteurs pour le clonage de l'ADN extrait et purifié à
partir d'un échantillon de l'environnement.
2s De nombreux vecteurs ont déjà été décrits dans l'état de la technique afin de cloner de l'ADN préalablement extrait d'un échantillon de l'environnement.
Ainsi, selon la description de la demande internationale n°WO
99/20.799, peuvent être utilisés des vecteurs viraux, des phages, des 3o plasmides, des phagemides, des cosmides, des phosmides, des vecteurs du type BAC (chromosome artificiel bactérien) ou encore le bactériophage P1, des vecteurs de type PAC (chromosome artificiel basé sur le bactériophage P1), des vecteurs du type YAC (chromosome artificiel de levure), des plasmides de levure ou tout autre vecteur capable de maintenir et d'exprimer de manière stable un ADN
génomique.
L'exemple 1 de la demande PCT n°WO 99/20.799 décrit la construction d'une banque d'ADN génomique par clonage dans un s vecteur du type BAC.
A la connaissance du demandeur, aucune banque d'ADN
provenant d'un échantillon de l'environnement n'avait encore été
effectivement réalisée avec des vecteurs de type conjugatif, une telle technique étant rendue pour la première fois accessible et reproductible 1o par l'homme du métier grâce à l'enseignement de la présente invention.
4. Hôtes cellulairés Dans l'état de la technique, de nombreuses cellules hôtes ont 1s été décrites comme pouvant étre utilisées afin d'héberger les vecteurs contenant les inserts d'ADN provenant de l'ADN extrait et purifié à partir d'un échantillon de l'environnement.
Ainsi, la demandè PCT N°WO 99/20.799 cite de nombreux hôtes cellulaires appropriés, tels que Escherichia coli, en particulier la zo souche DH 10B ou encore la souche 294 (ATCC 31446, la souche E.
soli 8, E. Coli X 1776 (ATCC N°31.537), E.coli DH5 a et E.coli W3110 (ATCC n°27.325).
Cette demande PCT cite également d'autres cellules hôtes appropriées telles que Enterobacfer, Erwinia, Klebsiella, Proteus, 2s Salmonelle, Serratia, Schigella ou encore des souches du type bacillus telles que 8. subtilis et 8. licheniformis ainsi que les bactéries du genre Pseudomonas, Streptomyces ou Acfinomyces.
Le brevet US N°5,824,485 cite en particulier la souche de Streptomyces lividans TK66 ou encore des cellules de levure telles que 3o celles de Saccharomyces pombe.
5. Caractérisation de Gènes d'intérêt dans des bangues d'ADN provenant d'un échantillon de l'environnement.

La demande PCT N° WO 99/20.799 décrit une identification du phénotype de différents clones appartenant à la banque d'ADN de B.cereus, respectivement un clone produisant de l'hémolysine, un clone hydrolysant l'esculine ou encore un clone produisant un pigment orange.
s Des techniques de mutagenèse basées sur l'utilisation d'un transposon codant pour l'enzyme pho A ont permis subséquemment d'isoler des clones mutés et de caractériser les séquences responsables des phénotypes observés.
L'article de STEIN et al. (1996) précité décrit l'utilisation Io d'amorces spécifiques de l'ADN ribosomal afin d'amplifier l'ADN inséré
dans les vecteurs hébergés par certains clones d'une banque d'ADN
génomique d'Archaebactéries de plancton marin et l'identification de plusieurs séquences codantes dans l'ADN ainsi amplifié.
L'article de BORSCHERT S. et al., (1992) décrit le criblage is d'une banque d'ADN génomique de Bacillus subfilis à l'aide de couples d'amorces hybridant avec des régions conservées de peptide synthétases connues afin d'identifier un ou plusieurs gènes correspondant dans le génome de Bacillus subtilis.
Cette technique a permis de détecter un fragment d'ADN
2o chromosomique d'environ 26 kb portant une partie de l'opéron de biosynthèse de la surfactine.
L'article de KAH-TONG S, et a1.(1997) décrit le criblage d'une banque d'ADN provenant du sol à l'aide d'amorces hybridant avec des séquences conservées de l'opéron responsable de la voie de 2s biosynthèse des polykétides de type II et montre l'identification, au sein de cette banque d'ADN, de séquences apparentées au gène PKS-a. Cet article décrit aussi la construction de cassettes d'expression hybrides dans lesquelles la séquence de la sous-unité PKS-~, retrouvée naturellement dans l'opéron responsable de la biosynthèse des 3o polykétides, a été remplacée par différentes séquences apparentées retrouvées dans la banque d'ADN.
De même, l'article de HONG-FU et al. , (1995) décrit la construction de cassettes d'expression contenant les différentes phases de lecture ouverte de l'opéron responsable de la biosynthèse des 3s polykétides, les différentes cassettes d'expression ayant été construites artificiellement en combinant les phases de lecture ouverte qui ne sont pas retrouvées ensemble naturellement dans le génome de Streptomyces coelicolor. Cet article montre que la combinaison, dans les cassettes d'expression artificielles, de cadres de lecture ouvert s originaires de différentes souches bactériennes permet la production de polykétides ayant différentes caractéristiques structurales et des activités antibiotiques plus ou moins grandes vis-à-vis de Bacilles subfilis et Bacilles cereus.
Les polykétides font partie d'une grande famille de produits 1o naturels de structure variable et possédant une grande diversité
d'activités biologiques. Font partie des polykétides par exemple, les tétracyclines et l'érythromycine (antibiotiques), le FK506 (immunosuppresseur), la doxorubicine (agent anti-cancéreux), la monensine (un agent coccidiostatique) ainsi que l'avermectine (un agent 1s antiparasitaire).
Ces molécules sont synthétisées grâce à des enzymes multifonctionnelles appelées polykétides synthases, qui catalysent des cycles de condensation répétés entre des acyl thioesters (en général des acétyl, propionyl, malonyl ou méthylmalonyl thioesters). Chaque cycle de 2o condensation aboutit à la formation, sur une chaîne croissante carbonée, d'un groupe ~i-kéto qui peut ensuite subir, le cas échéant, une ou plusieurs séries d'étapes réductrices.
Compte-tenu de l'intérêt clinique important des polykétides, leur mécanisme commun de biosynthèse ainsi que le haut degré de 2s conservation observé entre les groupes de gènes codant pour les polykétides synthases, il s'est développé un intérêt accru pour le développement de nouveaux polykétides par génie génétique.
De nouveaux pofykétides artificiels ont ainsi été produits par génie génétique, tels que la méderrhodine A ou la dihydrogranatirhodine.
3o La grande majorité des molécules nouvelles de polykétides obtenues par génie génétique sont très différentes, du point de vue structural, des polykétides correspondants naturels.
De l'état de la technique, il ressort ainsi qu'il existe un besoin d'obtention de nouveaux pôlykétides d'intérêt et tout particulièrement de 3s polykétides d'intérêt thérapeutique présentant notamment, par rapport à

leurs homologues naturels, un niveau accru d'activité antibiotique ou encore un spectre d'activité antibiotique différent, soit plus large que celui des polykétides connus, soit au contraire plus sélectif.
Ce besoin est, comme cela sera décrit ci-après, en partie s comblé selon la présente invention.
DESCRIPTION DE L'INVENTION
L'invention concerne tout d'abord un procédé pour la io construction de banques d'ADN provenant d'un échantillon de l'environnement, un tel échantillon pouvant ëtre indifféremment un milieu aquatique (eau douce ou marine), un échantillon de sol (couche superficielle du sol, sous-sol ou sédiments), ou encore un échantillon d'organismes eucaryotes contenant une microflore associée, tel que par is exemple un échantillon provenant de plantes, d'insectes ou encore d'organismes marins et possédant une microflore associée.
La mise au point d'un procédé de construction d'une banque d'ADN d'un échantillon de l'environnement, et tout particulièrement d'un échantillon de sol, comprend des étapes critiques dont la mise en oeuvre 2o doit être nécessairement optimisée pour l'obtention d'une banque d'ADN
dont le contenu en acides nucléiques d'intérêt répond aux objectifs initialement fixés.
Une première étape critique consiste en l'extraction et la purification ultérieure des acides nucléiques contenus initialement dans 2s l'échantillon, c'est-à-dire principalement des acides nucléiques contenus dans les divers organismes composant la microflore de cet échantillon.
La qualité de la pûrification de l'ADN extrait est déterminante sur le résultat obtenu.
Une seconde étape importante d'un procédé de construction 3o d'une banque d'acides nucléiques provenant d'un échantillon de l'environnement est l'évaluation de la diversité génétique des acides nucléiques extraits et purifiés. La mise au point d'une étape de réalisation simple et fiable de pré-criblage de l'ADN extrait et purifié afin de vérifier qu'il rend compte, au moins partiellement, de la diversité
3s phylogénétique des organismes présents initialement dans l'échantillon de départ, permet en effet de déterminer l'intérêt ou non d'utiliser la source initiale d'ADN extrait et purifié pour la construction de la banque d'acides nucléiques proprement dite ou au contraire de ne pas poursuivre la construction de la banque d'acides nucléiques du fait s d'artéfacts trop importants introduits au moment de l'extraction et de la purification des . acides nucléiques. II a en outre été identifié selon l'invention que la qualité des inserts introduits dans les vecteurs pour construire la banque est déterminante. II a ainsi été déterminé que l'utilisation d'enzymes de restriction pour cliver l'ADN extrait et purifié à
1o partir de l'échantillon de l'environnement était de nature à introduire des artéfacts ou " biais " dans la structure des inserts obtenus. En effet, l'ADN extrait du sol ou d'autres environnements, provenant en très grande majorité d'organismes non cultivables, est composé de molécules dont le taux de bases G et C est par définition inconnu et de 1s plus variable en fonction de l'origine de ces organismes.
Une troisième étape critique est l'insertion des acides nucléiques extraits et purifiés dans des vecteurs capables d'intégrer des acides nucléiques de longueur choisie, d'une part, et, d'autre part, d'en permettre la transfection ou encore l'intégration dans le génome dans 2o des hôtes cellulaires déterminés ainsi que, le cas échéant, d'en permettre l'expression dans de tels hôtes cellulaires.
Constituent des vecteurs d'intérêt, les vecteurs capables d'intégrer des acides nucléiques de grande taille, c'est-à-dire de taille supérieure à 100 kb lorsque l'objectif poursuivi consiste en un clonage et 2s en une identification d'un _opéron complet capable de diriger une voie complète de biosynthèse d'un composé d'intérêt industriel, en particulier d'un composé d'intérêt pharmaceutique ou agronomique.
DEFINITIONS
Au sens de la présente invention, on entend par " acides nucléiques ", " polynucléotides " et " oligonucléotides " aussi bien des séquences d'ADN, d'ARN, que des séquences hybrides ARN/ADN de .
plus de 2 nucléotides, indifféremment sous la forme simple brin ou 3s double brin.

Le terme " banque " ou " collection " est utilisé dans la présente description en référence indifféremment à un ensemble d'acides nucléiques extraits et, le cas échéant purifiés, provenant d'un échantillon de l'environnement, à un ensemble de vecteurs recombinants, chacun s des vecteurs recombinants de l'ensemble comprenant un acide nucléique provenant de l'ensemble d'acides nucléiques extraits et, le cas échéant purifiés précités, ainsi qu'à un ensemble de cellules hôtes recombinantes comprenant un ou plusieurs acides nucléiques provenant de l'ensemble des acides nucléiques extraits et, le cas échéant, purifiés io précités, lesdits acides nucléiques étant soient portés par un ou plusieurs vecteurs recombinants, soit intégrés dans le génome desdites cellules hôtes recombinantes.
On désigne par " échantillon de l'environnement "
indifféremment un échantillon d'origine aquatique, par exemple d'eau is douce ou saline, ou un échantillon tellurique provenant de la couche superficielle d'un sol, de sédiments ou encore de couches inférieures du sol (sous-sol), ainsi que des échantillons d'organismes eucaryotes, le cas échéant multicellulaires, d'origine végétale, provenant d'organismes marins ou encore d'insectes et possédant une microflore associée, cette 2o microflore associée constituant des organismes d'intérêt.
On entend par " opéron " selon l'invention, un ensemble de cadres ouverts de lecture dont la transcription et/ou la traduction est co-régulée par un ensemble unique de signaux de régulation de la transcription et/ou de la traduction. Selon l'invention, un opéron peut 2s également comprendre lesdits signaux de régulation de la transcription et/ou de la traduction.
Par " voie métabolique " aux fins de l'invention ou encore " voie de biosynthèse " on entend un ensemble de réactions biochimiques anaboliques ou cataboliques réalisant la conversion d'une première 3o espèce chimique en une seconde espèce chimique.
Par exemple, unè voie de biosynthèse d'un antibiotique est constituée de l'ensemble des réactions biochimiques convertissant des métabolites primaires en produits intermédiaires des antibiotiques, puis subséquemment en antibiotiques.

Par séquence de régulation placée " en phase " (en anglais operably linked) par rapport à une séquence nucléotidique dont l'expression est recherchée, on signifie que la ou les séquences de régulation de la transcription sont localisées, par rapport à ia séquence s nucléotidique d'intérêt dont l'expression est recherchée, de manière à
permettre l'expression de ladite séquence d'intérêt, la régulation de la dite expression étant dépendante de facteurs interagissant avec les séquences nucléotidiques régulatrices.
Selon une autre terminologie, on peut dire également que la 1o séquence nucléotidique d'intérêt dont l'expression est recherchée est placée " sous le contrôle " des séquences nucléotidiques régulatrices de la transcription.
Le terme " isolé " au sens de la présente invention désigne un matériel biologique qui a été soustrait à son environnement originel Is (l'environnement dans lequel il est localisé naturellement).
Par exemple, un polynucléotide ou un polypeptide présent à
l'état naturel dans un organisme (virus, bactérie, champignon, levure, plante ou animal) n'est pas isolé. Le même polypeptide séparé de son environnement naturel ou le même polynucléotide séparé des acides 2o nucléiques adjacents au sein desquels il est naturellement inséré dans le génome de l'organisme, est isolé.
Un tel polynucléotide peut être inclus dans un vecteur et/ou un tel polynucléotide peut être inclus dans une composition et demeure néanmoins à l'état isolé, du fait que le vecteur ou la composition ne 2s constitue pas son environnement naturel.
Le terme " purifié " ne nécessite pas que le matériel soit présent sous une forme de pureté absolue, exclusif de la présence d'autres composés. II s'agit plutôt d'une définition relative.
Un polypeptide ou un polynucléotide est à l'état purifié après 3o purification du matériel de~départ d'au moins un ordre de grandeur, de préférence 2 ou 3 et préférentiellement 4 ou 5 ordres de grandeur.
Le " pourcentage d'identité " entre deux ~ séquences de nucléotides ou d'acides aminés, au sens de la présente invention, peut être déterminé en comparant deux séquences alignées de manière 3s optimale, à travers une fenêtre de comparaison.

La partie de la séquence nucléotidique ou polypeptide dans la fenêtre de comparaison peut ainsi comprendre des additions ou des délétions (par exemple des " gaps ") par rapport à la séquence de référence (qui ne comprend pas ces additions ou ces délétions) de s manière à obtenir un alignement optimal des deux séquences.
Le pourcentage est calculé en déterminant le nombre de positions auquel une base nucléique ou un résidu d'aminoacide identique est observé pour les deux séquences (nucléique ou peptidique) comparées, puis en divisant le nombre de positions auquel il io y a identité entre les deux bases ou résidus d'aminoacides par le nombre total de positions dans la fenêtre de comparaison, puis en multipliant le résultat par 100 afin d'obtenir le pourcentage d'identité de séquence.
L'alignement optimal des séquences pour la comparaison peut être réalisé de manière informatique à l'aide d'algorithmes connus Is contenus dans le package de la Société WISCONSIN GENETICS
SOFTWARE PACKAGE, GENETICS COMPUTER GROUP (GCG), 575 Science Doctor, Madison, WISCONSIN.
A titre d'illustration, le pourcentage d'identité de séquence pourra être effectué à l'aide du logiciel BLAST (versions BLAST 1.4.9 de 2o Mars 1996, BLAST 2Ø4. de Février 1998 et BLAST 2Ø6. de Septembre 1998), en utilisant exclusivement les paramètres par défaut (S.F. Altschul et al., J. Mol. Biol. 1990 215: 403-410, S. F. Altschul et al., Nucleic Acids Res. 1997 25: 3389-3402). Blast recherche des séquences similaires/homologues à une séquence " requête " de 2s référence, à l'aide de l'algorithme d'Altschul et al. La séquence requête et les bases de données utilisées peuvent être peptidiques ou nucléiques, toute combinaison étant possible.
EXTRACTION ET PURIFICATION D'ACIDES NUCLEIQUES
3o PROVENANT D'UN ECHANTILLON DE L'ENVIRONNEMENT.
1. Extraction directe d'acides nucléigues II a été montré selon la présente invention que, pour l'obtention 3s d'une banque d'acides nucléiques provenant d'organismes contenus l8 dans un échantillon du sol, il était important de créer des conditions dans lesquelles, d'une part, les différents organismes de l'échantillon sont rendus accessibles aux étapes ultérieures d'extraction des acides nucléiques et, d'autre part, que l'étape initiale de traitement de s l'échantillon de sol permette une lyse mécanique maximale des organismes de l'échantillon de nature à rendre directement accessibles les acides nucléiques de ces organismes, principalement l'ADN
génomique et plasmidique, aux tampons utilisés pour les étapes ultérieures d'extraction.
io II a été ainsi démontré selon l'invention qu'une accessibilité
maximale des acides nucléiques provenant~des micro-organismes d'un échantillon du sol était atteinte par un broyage poussé et à sec de l'échantillon de sol préalablement séché afin d'obtenir des micro-particules. Le demandeur a ainsi déterminé que le séchage de is l'échantillon de sol préalable à tout traitement ultérieur provoque une diminution significative de la cohésion de l'échantillon de sol brut et favorise en conséquence sa désagrégation ultérieure sous la forme de micro-particules, lorsqu'un traitement par broyage approprié est opéré.
De manière surprenante, le demandeur a montré que des 2o micro-particules d'échantillons de sol sec réunissaient des propriétés physico-chimiques favorables à l'extraction d'une quantité optimale d'acides nucléiques qui, dans leur nature, pouvaient être représentatifs de la diversité génétique des organismes présents initialement dans l'échantillon de sol de départ. II a été montré en particulier que le 2s procédé d'extraction directe d'acides nucléiques selon l'invention permettait l'extraction d'ADN provenant de micro-organismes rares, tels certains Streptomyces rares ou des micro-organismes sporulés.
Par " micro-particules " de l'échantillon de sol aux fins de la présente invention, on entend des particules dérivées de l'échantillon 3o ayant une taille moyenne d'environ 50 Nm, c'est à dire comprise en moyenne entre 45 et 55 pm/.
Selon l'invention, les micro-particules sont obtenues à partir d'échantillons de sol préalablement séchés ou dessiqués puis broyés jusqu'à l'obtention de micro-particules de taille moyenne comprise entre 2Nm et 50pm, avant remise en suspension dans un milieu tampon liquide des micro-particules obtenus.
Un tel milieu tampon liquide peut consister en un tampon d'extraction d'acides nucléiques, en particulier un tampon d'extraction s d'ADN conventionnel bien connu de l'homme du métier.
Le broyage de l'échantillon de sol en micro-particules a pour double fonction de lyser mécaniquement la majorité des organismes présents dans l'échantillon de sol initial et de rendre accessibles les organismes non lysés par ce traitement mécanique à des étapes 1o facultatives ultérieures de lyse chimique et/ou enzymatique.
Ainsi, un premier objet de l'invention consiste en un procédé de préparation d'une collection d'acides nucléiques à partir d'un échantillon de sol contenant des organismes, ledit procédé comprenant une première étape (I-(a)) d'obtention de micro-particules par broyage de 1s l'échantillon de sol préalablement séché ou dessiqué, puis mise en suspension des micro-particules dans un milieu tampon liquide.
De manière tout à fait préférée, l'étape de broyage est réalisée à l'aide d'un dispositif à billes d'agate ou de tungstène ou encore à l'aide d'un dispositif à anneaux de tungstène. Ces dispositifs sont préférés car 20 la dureté de matériaux . comme l'agate ou le tungstène facilite significativement l'obtention des micro-particules de la taille spécifiée ci-dessus. Pour cette raison, on ne choisira pas préférentiellement, voire on évitera, un recours à un dispositif de broyage à billes de verre, qui s'est révélé beaucoup moins efficace.
2s Le séchage ou la classification de l'échantillon de sol peut-être réalisée par toute méthode .connue de l'homme du métier. Par exemple, l'échantillon de sol brut peut être séché à température ambiante pendant une durée de 24 à 48 heures.
Comme indiqué précédemment, le milieu tampon liquide peut 3o consister en un milieu d'extraction de l'ADN présent dans les micro particules. On utilisera de manière tout à fait préférée un tampon d'extraction désigné TENP çontenant respectivement 50 mM tris, 20 mM
EDTA, 100 mM NaCI et 1 % (poids/volume) de polyvinylpolypyrrolidone, à
pH 9,0.

Le procédé de préparation d'une collection d'acides nucléiques à partir d'un échantillon de sol est en outre caractérisé en ce que l'étape d'obtention de micro-particules par broyage de l'échantillon de sol préalablement séché ou dessiqué est suivie d'une étape I-(b) s d'extraction des acides nucléiques présents dans les micro-particules.
II est constant que l'extraction des acides nucléiques est accompagnée d'une co-extraction de composés et/ou de constituants du sol indésirables nécessitant la purification ultérieure des acides nucléiques extraits, une telle étape de purification ultérieure devant être 1o à la fois suffisamment sélective pour permettre l'élimination des composés et/ou constituants du sol indésirables et d'un rendement suffisant pour entraîner une perte faible en quantité de l'ADN
préalablement extrait.
II a été montré selon l'invention qu'une étape de purification de 1s l'ADN extrait des micro-particules de l'échantillon de sol répondant aux critères de sélectivité et de rendement définis ci-dessus, comprend un traitement de l'ADN extrait par une combinaison de deux étapes successives de chromatographie, respectivement une chromatographie sur tamis moléculaire et une chromatographie d'échange d'anions.
Selon une autre caractéristique du procédé ci-dessus, l'étape I-(b) d'extraction des acides nucléiques est suivie d'une étape I-(c) de purification des acides nucléiques extraits à l'aide des deux étapes de chromatographie suivantes:
- passage de la solution contenant les acides nucléiques sur un tamis moléculaire, puis récupération des fractions d'élution enrichies en acides nucléiques;
- passage des fractions d'élution enrichies en acides nucléiques sur un support de chromatographie d'échange d'anions, puis récupération des fractions d'élution contenant les acides nucléiques.
La nature et l'ordre des étapes de chromatographie ci-dessus sont essentiels à une bonne sélectivité et un excellent rendement de l'étape de purification de l'ADN préalablement extrait des micro-particules de l'échantillon du sol préalablement séché ou dessiqué.
De manière très avantageuse, le support chromatographique du type " tamis moléculaire " de l'étape de purification d'acides nucléiques s ci-dessus consiste en un support chromatographique de type Sephacryl~
S400 HR ou un support chromatographique de caractéristiques équivalentes.
De manière tout à fait préférée, le support chromatographique d'échange d'anions utilisé lors de la seconde étape de purification de 1o l'ADN extrait est un support de type Elutip~ d, ou un support chromatographique de caractéristiques équivalentes.
En combinant les étapes I-(a) d'obtention de micro-particules de l'échantillon de sol sec, I-(b) d'extraction des acides nucléiques présents dans les micro-particules et I-(c) de purification par les étapes 1s chromatographiques décrites ci-dessus, il a été possible selon l'invention d'extraire directement l'ADN du sol sans purification préalable des cellules des organismes contenus initialement dans l'échantillon, tout en évitant la co-extraction de contaminants du sol, tels que par exemple les acides humiques qui est observée avec les procédés de l'état de la 2o technique.
Les contaminants, tels que les acides humiques affectent sévèrement les analyses et les utilisations subséquentes des acides nucléiques dont la purification est recherchée.
Selon le procédé ci-dessus, il est en outre possible d'accéder 2s aux acides nucléiques contenus dans les organismes qui n'ont pas été
lysés mécaniquement au cours de l'étape I-(a) d'obtention de micro particules de l'échantillon de sol, dans le but d'obtenir une collection quasi-exhaustive de la diversité génétique des acides nucléiques présents initialement dans l'échantillon de sol. Ainsi, les micro-particules 3o de l'échantillon de sol peuvent faire l'objet d'étapes ultérieures de traitement de lyse chimique, enzymatique ou physique, ou encore d'une combinaison de traitements chimiques, enzymatiques ou physiques.
Selon un premier aspect, le procédé de préparation d'une collection d'acides nucléiques à partir d'un échantillon de sol selon l'invention, peut être en outre caractérisé en ce que l'étape I-(a) est suivie des étapes suivantes:
~ traitement de la suspension de sol dans un milieu tampon s liquide par sonication;
~ extraction et récupération des acides nucléiques.
De manière préférée, on aura recours, pour un traitement par to sonication, à un dispositif de type à micro-pointe en titane, tel que le dispositif 600 W Vibracell Ultrasonicator commercialisé par la Société
Bioblock ou encore un sonicateur de type Cup Horn.
De manière tout à fait préférée, l'étape de sonication est réalisée à une puissance de 15 W pendant une durée de 7 à 10 min et 1s comprend des cycles successifs de sonication, la sonication proprement dite étant réalisée pendant 50% de la durée de chaque cycle.
Selon un second aspect, le procédé ci-dessus peut être en outre caractérisé en ce que l'étape I-(a) est suivie des étapes suivantes:
20 ~ traitement de la . suspension de sol dans un milieu tampon liquide par sonication;
~ incubation de la suspension à 37°C après sonication en présence de lysozyme et d'achromopeptidase;
zs ~ addition de SDS avant centrifugation et précipitation des acides nucléiques;
~ récupération des acides nucléiques précipités.
De préférence, l'étape d'incubation en présence de lysozyme et d'achromopeptidase sera réalisée à une concentration finale de 0,3 mg/ml de chacune des deux enzymes, préférentiellement pendant 30 minutes à 37°C.

De manière préférée, le SDS sera utilisé à une concentration finale de 1 % et pendant un temps d'incubation de 1 heure à la température de 60°C avant centrifugation et précipitation.
Selon un troisième aspect, le procédé de préparation d'une s collection d'acides nucléiques à partir d'un échantillon de sol ci-dessus est en outre caractérisé en ce que l'étape I-(a) est suivie des étapes suivantes:
- homogénéisation de la suspension de sol avec une étape de io mixage violent (vortex) suivie d'une étape de simple agitation;
- congélation de la suspension homogène suivie d'une décongélation ;
- traitement par sonication de la suspension après décongélation;
is - incubation de la suspension à 37°C après sonication en présence de lysozyme et d'achromopeptidase;
- addition de SDS avant centrifugation et précipitation des acides nucléiques;
récupération des acides nucléiques.
De manière préférée, les suspensions de micro-particules de sol sont passées au vortex puis homogénéisées par une agitation douce sur un agitateur à rotation circulaire pendant une durée de deux heures avant d'être congelées à -20°C.
2s Préférentiellement, les suspensions sont à nouveau agitées violemment par vortex pendant 10 minutes, après décongélation et avant l'étape de sonication.
II va sans dire que les acides nucléiques extraits par les modes de réalisation du procédé d'extraction directe d'acides nucléiques décrit 3o ci-dessus sont préférentiellement purifiés selon l'étape de purification constituée d'un premier passage sur tamis moléculaire puis un passage subséquent des fractions d'élution obtenues à l'issue de la chromatographie sur tamis moléculaire sur un support chromatographique d'échange d'anions.
3s 2. Extraction indirecte des acides nucléigues Selon un second mode de réalisation du procédé de préparation d'une collection d'acides nucléiques à partir d'un échantillon s de l'environnement, selon l'invention, ledit échantillon de l'environnement subit un premier traitement de nature à permettre la séparation des organismes, contenus dans cet échantillon, des autres macro-constituants de l'échantillon.
Ce second mode de réalisation du procédé de préparation Io d'une collection d'acides nucléiques selon l'invention favorise l'obtention d'acides nucléiques de grande taille, qui sont pratiquement impossibles à
obtenir selon le premier mode de réalisation du procédé selon l'invention décrit ci-dessus, l'étape de lyse mécanique opérée pour l'obtention des micro-particules ayant également pour effet de casser physiquement les is acides nucléiques de l'échantillon de sol ou des acides nucléiques contenus dans les organismes de l'échantillon de sol.
L'obtention d'acides nucléiques de grande taille a ,été
recherchée par le demandeur dans le but d'isoler et de caractériser les acides nucléiques comprenant, au moins partiellement, l'ensemble des 2o séquences codantes appartenant à un même opéron capable de diriger la biosynthèse d'un composé d'intérêt industriel.
De manière préférée, on obtient, en mettant en oeuvre le second mode de réalisation du procédé de préparation d'une collection d'acides nucléiques à partir d'un échantillon de sol selon l'invention , des 2s acides nucléiques ayant une taille supérieure à 100 kb, de préférence supérieure à 200, 250 ou 300 kb, et de manière tout à fait préférée d'acides nucléiques d'une taille supérieure à 400, 500 ou encore 600 kb.
Ce second mode de réalisation d'un procédé de préparation d'une collection d'acides . nucléiques à partir d'un échantillon de 30 l'environnement selon l'invention est constitué d'une combinaison de quatre étapes successives destinées à l'obtention des acides nucléiques ayant les caractéristiques décrites ci-dessus.
Lorsque l'échantillon de l'environnement est un échantillon de sol, il a été montré selon l'invention qu'une première étape d'obtention 3s d'une suspension par dispersion de l'échantillon de sol en milieu liquide 2s favorisait l'accessibilité des organismes contenus dans l'échantillon sans provoquer de lyse mécanique significative des cellules.
La première étape d'obtention d'une dispersion de l'échantillon s de sol ci-dessus rend accessibles les organismes de l'échantillon au milieu extérieur et permet également une dissociation partielle des organismes de l'échantillon et des macro-constituants. Elle rend ainsi possible une séparation ultérieure des organismes contenus initialement dans l'échantillon des autres constituants de ce dernier.
io Lorsque l'échantillon de l'environnement provient par exemple de végétaux, d'organismes marins ou d'insectes, un traitement préalable par broyage est nécessaire afin de rendre les organismes de la microflore associée accessible aux étapes ultérieures du procédé.
Ainsi, le présent procédé comprend une étape de séparation Is des organismes des autres constituants minéraux et/ou organiques obtenus précédemment par une centrifugation sur un gradient de densité. Les organismes ainsi séparés sont ensuite soumis à une étape de lyse puis d'extraction des acides nucléiques .
L'étape de centrifugation sur un gradient de densité a, de 2o manière surprenante, permis de séparer les cellules d'organismes des particules de sol contenues dans la suspension de l'échantillon. On aurait en effet pu s'attendre à ce qu'une proportion des cellules soient entraînées avec les macro-particules au sein de la phase de gradient. En outre, il n'avait jamais été démontré jusqu'à présent qu'une 2s centrifugation sur gradient de densité d'un échantillon de sol permettait de retrouver, à l'interface phase aqueuse/gradient, une population d'organismes représentative de la diversité des organismes présents dans l'échantillon de départ, du fait que ces organismes sont de volume, densité et forme extrêmement variables. On pouvait raisonnablement 3o supposer qu'ils seraient retrouvés indifféremment au sein de la phase aqueuse, à l'interface phase aqueuse/gradient de densité et également au sein du gradient de densité lui-même.
Ainsi, l'homme du métier pouvait s'attendre à ce que des organismes présentant des densités plus faibles ou plus grandes que la 3s densité du gradient de densité utilisé (densité du gradient de densité

comprise entre 1,2 et 1,5 g/ml , préférentiellement 1,3 g/ml) ne pouvait être récupérés, ce qui aurait eu pour effet d'introduire un biais dans la représentativité des organismes effectivement séparés et, par voie de conséquence, également dans la diversité des acides nucléiques s extraits.
En outre, dans un mode de réalisation particulier du procédé, une étape de germination des spores, en particulier d'actinomycètes, est réalisée, ce qui a pour effet d'accroître de manière significative la quantité d'ADN d'actinomycètes récupérée.
Io La dernière étape consiste en une étape de purification des acides nucléiques ainsi extraits sur un gradient de chlorure de césium.
De manière surprenante, la purification des acides nucléiques sur le gradient de chlorure de césium permet une élimination substantielle, voire complète, des substances composant le gradient de is densité. Cette caractéristique est déterminante en ce qui concerne l'utilisation ultérieure des acides nucléiques purifiés car le gradient de densité est connu comme un puissant inhibiteur enzymatique, capable le cas échéant d'inhiber l'activité catalytique des enzymes utilisées pour préparer l'insertion des acides nucléiques extraits dans des vecteurs.
2o Selon ce second mode de réalisation, le procédé de préparation d'une collection d'acides nucléiques à partir d'un échantillon de l'environnement contenant des organismes selon l'invention comprend la succession d'étapes suivantes:
2s (i) obtention d'une suspension par dispersion de l'échantillon de l'environnement en milieu liquide puis homogénéisation de la suspension obtenue par agitation douce;
(ü) séparation des organismes des autres constituants minéraux 3o et/ou organiques de la suspension homogène obtenue à l'étape (i) par centrifugation sur un gradient de densité;
(iii) lyse des microorganismes séparés à l'étape (ü) et extraction des acides nucléiques ;

(iv) purification des acides nucléiques sur un gradient de chlorure de césium .
Préférentiellement, la suspension de l'échantillon de sol est s obtenue par dispersion de cet échantillon par broyage à l'aide d'un dispositif de type Waring Blender ou un dispositif de caractéristiques équivalentes. De manière tout à fait préférée, la suspension d'échantillon est obtenue après trois broyages, successifs d'une durée d'une minute chacun dans un dispositif de type Waring Blender. De préférence, io l'échantillon broyé sera refroidi dans la glace entre chacun des broyages.
De manière préférée, les organismes sont ensuite séparés des particules du sol par centrifugation sur un coussin de densité du type " Nycodenz ", commercialisé par la Société Nycomed Pharma AS. (Oslo Norvège). Les conditions préférées de centrifugation sont de 10.OOOg is pendant 40 minutes à 4°C, avantageusement dans un rotor à godets mobiles du type " rotor TST 28.38 " commercialisé par la Société
KONTRON.
L'anneau d'organismes localisé, après centrifugation, à
l'interphase de la phase supérieure aqueuse et de la phase inférieure de 2o Nycodenz est alors prélevé et lavé par centrifugation avant reprise du culot cellulaire dans un tampon approprié.
L'étape (iii) de lyse des organismes séparés à l'étape (ü) décrite ci-dessus peut être réalisée de toute manière connue de l'homme du métier.
2s Avantageusement, les cellules sont lysées dans une solution Tris 10 mM-EDTA 100mM à pH 8.0 en présence de lysozyme et d'achromopeptidase, avantageusement pendant une heure à 37°C.
L'extraction proprement dite de l'ADN peut être avantageusement réalisée par addition d'une solution de lauryl sarcosyl 30 (1 % du poids final de la solution) en présence de protéinase K et incubation de la solution finale à 37°C pendant 30 minutes.
Les acides nucléiques extraits à l'étape (iii) sont ensuite purifiés sur un gradient de chlorure de césium. Préférentiellement, l'étape de purification des acides nucléiques sur un gradient de chlorure de césium est réalisée par centrifugation à 35.000 tours/minute pendant 36 heures, par exemple sur un rotor du type Kontron 65.13.
Selon un aspect particulier du procédé de préparation d'une collection d'acides nucléiques à partir d'un échantillon de sol contenant s des organismes selon l'invention, lesdits acides nucléiques sont constitués majoritairement, sinon exclusivement, de molécules d'ADN.
Selon un autre aspect, les acides nucléiques peuvent être récupérés après inclusion des organismes, séparés sur un gradient de densité, dans un bloc d'agarose et lyse, par exemple chimique et/ou io enzymatique, des organismes inclus dans le bloc d'agarose.
Un autre objet de l'invention consiste en une collection d'acides nucléiques constitués des acides nucléiques obtenus à l'étape II-(iv) du procédé de préparation d'une collection d'acides nucléiques selon is l'invention ou encore obtenue à l'étape (c) ou une étape ultérieure du procédé de préparation d'une collection d'acides nucléiques selon l'invention.
L'invention est encore relative à un acide nucléique caractérisé
en ce qu'il est contenu dans une collection d'acides nucléiques telle que 2o définie ci-dessus.
Selon un premier aspect, un tel acide nucléique constitutif d'une collection d'acides nucléiques selon l'invention est caractérisé en ce qu'il comprend une séquence nucléotidique codant au moins un opéron, ou une partie d'un opéron.
2s De manière tout à fait préférée, un tel opéron code pour la totalité ou une partie d'une voie métabolique.
L'exemple 9 décrit la construction d'une banque d'ADN
génomique à partir d'une souche de Streptomyces alboniger et son clonage respectivement dans les cosmides navettes pOS7001 et 3o pOS700R. II a été montré selon l'invention que dans la banque d'ADN
réalisée dans le vecteur intégratif pOS7001 neuf clones contiennent des séquences nucléotidiques appartenant à l'opéron responsable de la voie de biosynthèse de la puromycine. De même, il a pu être identifié au sein de la banque d'ADN réalisée dans le vecteur réplicatif pOS 7008 douze clones contenant des séquences nucléotidiques de l'opéron responsable de la voie de biosynthèse de la puromycine.
En particulier, certains cosmides intégratifs et replicatifs des banques réalisées présentent, après digestion par les endonucléases de s restriction Clal et EcoRV, un fragment d'une taille de 12 kb susceptible de contenir la totalité des séquences de l'opéron responsable de la voie de biosynthèse de la puromycine.
Ainsi, selon un autre aspect, un acide nucléique selon l'invention contient, au moins en partie, des séquences nucléotidiques de to l'opéron responsable de la voie de biosynthèse de la puromicyne.
L'exemple 2 ci-après décrit la construction d'une banque d'ADN
selon un procédé conforme à la présente invention dans un vecteur pBluescript SK- à partir d'un sol contaminé par du lindane.
Les vecteurs recombinants ont été transfectés dans des 1s cellules d'Escherichia coli DH10B puis les cellules transformées ont été
cultivées dans un milieu de culture approprié en présence de lindane. Un criblage des clones de cellules transformées de la banque a permis de montrer que, sur 10.000 clones criblés, 35 d'entre eux présentaient un phénotype de dégradation du lindane . La présence du gène IinA chez 2o ces clones a pu être confirmée par amplification PCR grâce à des amorces spécifiques de ce gène.
Ainsi, selon un autre aspect, l'invention concerne également un acide nucléique contenant une séquence nucléotidique de la voie métabolique provoquant la biodégradation du lindane.
2s II est donc clairement démontré, comme décrit plus haut, qu'un procédé de préparation d'une collection d'acides nucléiques à partir d'un échantillon de sol contenant des organismes selon l'invention ainsi qu'un procédé de préparation d'une collection de vecteurs recombinants contenant les acides nucléiques constitutifs de la collection d'acides 3o nucléiques précités était tout à fait apte à l'isolement et à la caractérisation de séquences nucléotidiques incluses dans un opéron.
Une démonstration supplémentaire de l'aptitude d'un procédé
selon l'invention à l'identification de séquences nucléotidiques codantes impliquées dans une voie de biosynthèse régulée sous la forme d'un 3s opéron est en outre décrite plus loin: il s'agit du clonage et de la caractérisation de séquences codant pour des polykétides synthases impliquées dans la voie de biosynthèse des polykétides, qui appartiennent à une famille de molécules dont certains représentants sont d'un intérêt thérapeutique majeur, en particulier antibiotique.
s La présente invention a donc en outre pour objet un acide nucléique constitutif d'une collection d'acides nucléiques selon l'invention, caractérisé en ce qu'il comprend la totalité d'une séquence nucléotidique codant pour un polypeptide.
Selon un premier aspect, un acide nucléique constitutif d'une io collection d'acides nucléiques selon l'invention est d'origine procaryote.
Selon un second aspect, un acide nucléique constitutif d'une collection d'acides nucléiques selon l'invention provient d'une bactérie ou d'un virus.
Selon un troisième aspect, un acide nucléique constitutif d'une Is collection d'acides nucléiques selon l'invention est d'origine eucaryote.
En particulier, un tel acide nucléique est caractérisé en ce qu'il provient d'un champignon, d'une levure, d'une plante ou d'un animal.
CARACTERISATION MOLECULAIRE DE LA COLLECTION D'ACIDES
2o NUCLEIQUES EXTRAITS DU SOL.
Afin de surmonter les nombreux inconvénients techniques des méthodes de caractérisation des banques d'ADN extraits et purifiés à
partir d'un échantillon de l'environnement qui ont été décrits dans la 2s partie de la description relâtive à l'état de la technique, le demandeur a mis au point un procédé simple et fiable permettant de caractériser qualitativement et semi-quantitativement les acides nucléiques obtenus à
l'issue du procédé décrit ci-dessus.
Le procédé selon l'invention consiste ainsi à amplifier 3o universellement un fragment de 700 pb localisé à l'intérieur d'une séquence d'ADN ribosomal de type 16 S, puis d'hybrider l'ADN amplifié
avec une sonde oligonucléotidique de spécificité variable et enfin de comparer l'intensité d'hybridation de l'échantillon par rapport à une gamme étalon externe d'ADN de séquence ou d'origine connue.

L'amplification préalable à l'hybridation avec la sonde oligonucléotidique permet de quantifier des genres ou des espèces de micro-organismes peu abondants. De plus, l'amplification par des amorces universelles permet, lors de l'hybridation, d'utiliser une large s série de sondes oligonucléotidiques.
Ainsi, l'invention a en outre pour objet un procédé de détermination de la diversité des acides nucléiques contenus dans une collection d'acides nucléiques, et tout particulièrement d'une collection d'acides nucléiques provenant d'un échantillon de l'environnement, 1o préférentiellement d'un échantillon du sol, ledit procédé comprenant les étapes suivantes:
- mise en contact des acides nucléiques de la collection d'acides nucléiques à tester avec un couple d'amorces ts oligonucléotidiques hybridant à toute séquence d'ADN ribosomal 16 S
bactérien;
- réalisation d'au moins trois cycles d'amplification ;
- détection des acides nucléiques amplifiés à l'aide d'une sonde oligonucléotidique ou d'une pluralité de sondes oligonucléotidiques, 2o chaque sonde hybridant spécifiquement avec une séquence d'ADN
ribosomal 16 S commune à un règne, un ordre, une sous-classe ou un genre bactérien;
- le cas échéant, comparaison des résultats de l'étape de détection précédente avec les résultats de détection, à l'aide de la sonde 2s ou de la pluralité de sondes d'acides nucléiques de séquence connue constituant une gamme étalon.
De manière préférée, un premier couple d'amorces hybridant avec des régions universellement conservées du gène de l'ARN
ribosomal 16 S est constitué respectivement des amorces FGPS 612 30 (SEQ ID N°12) et FGPS 669 (SEQ ID N°13).
Un second mode de réalisation d'un couple d'amorces préféré
selon l'invention est constitué du couple d'amorces universelles 63 f (SEQ ID N°22) et 1387r (SEQ ID N°23).
Selon un mode particulier de réalisation d'un procédé de 3s détermination de la diversité des acides nucléiques d'une collection d'acides nucléiques, l'étape d'amplification à l'aide d'un couple d'amorces universelles peut être réalisée sur une collection de vecteurs recombinants dans chacun desquels a été inséré un acide nucléique de la collection d'acides nucléiques considérée, préalablement à l'étape s d'hybridation avec les sondes oligonucléotidiques spécifiques d'un règne, d'un ordre, d'une sous-classe ou d'un genre bactérien particulier.
Un tel procédé de détermination de la diversité des acides nucléiques contenus dans une collection est tout particulièrement applicable aux collections d'acides nucléiques obtenus conformément à
Io l'enseignement de la présente description.
Ainsi, l'exemple 3 détaille un procédé de préparation d'une collection d'acides nucléiques à partir d'un échantillon de sol contenant des organismes comprenant une étape d'extraction indirecte d'ADN par dispersion d'un échantillon du sol préalablement à la séparation des is cellules sur gradient de Nycodenz, lyse des cellules puis purification de l'ADN sur gradient de chlorure de césium.
La collection d'acides nucléiques ainsi obtenue a été utilisée telle quelle ou sous la forme d'inserts dans des vecteurs de type cosmide dans un procédé d'amplification à l'aide des amorces 2o universelles de l'ADNr 16 S précitées, puis les ADN amplifiés ont été
soumis à une étape de détection à l'aide de sondes oligonucléotidiques de séquences SEQ ID N°14 à SEQ ID N°21 qui sont présentées dans le tableau 4.
Les résultats montrent , qu'un procédé de préparation d'une 2s collection d'acides nucléiques à partir d'un échantillon de sol contenant des organismes selon l'invention permet d'accéder à l'ADN de plus de 14% de la microflore tellurique totale, soit 2 x 108 cellules par gramme de sol, alors que la microflore totale cultivable ne représente qu'à peine 2%
de la population microbienne totale.
3o Afin de déterminer la diversité phylogénétique d'une collection d'acides nucléiques préparés conformément à l'invention, 47 séquences du gène ARNr 16S ont été isolées et séquencées. Ces séquences correspondent respectivement aux séquences nucléotidiques SEQ ID
N°60 à SEQ ID N°106.

Les acides nucléiques comprenant les séquences SEQ ID N°
60 à SEQ ID N° 106 font également partie de l'invention, ainsi que les acides nucléiques possédant au moins 99 %, préférentiellement 99,5%
ou 99,8% d'identité en acides nucléiques avec les acides nucléiques s comprenant les séquences SEQ ID N° 60 à SEQ ID N° 106. De telles séquences peuvent être utilisées notamment en tant que sondes pour cribler des clones d'une banque d'ADN et identifier ainsi ceux , parmi les clones de la banque, qui contiennent de telles séquences, ces séquences étant suceptibles d'être à proximité de séquences codantes 1o d'intérêt, telles que des séquences codant pour des enzymes impliquées dans la voie de biosynthèse de mëtabolites antibiotiques, par exemple des polykétides.
La comparaison des séquences d'ARNr 16S à partir d'une banque d'ADN réalisée conformément à l'invention avec les séquences Is répertoriées dans la base données RDP (Maidak B.L., Cole J.R., Parker C.T., Garrity G.M., Larsen N., Li B., Lilburn T.G., McCaughey, M.J., Olsen G.J., Overbeek R., Pramanik S., Schmidt T.M., Tiedje J.M., Woese C.R. (1999) " A new projet of the RDP (Ribosomal Database Project) " Nucleic Acids Research Vol. 27: 171-173) ont permis de 2o déterminer que les acides nucléiques contenus dans une collection d'acides nucléiques selon l'invention proviennent d'a-protéobactéries, de ~i-protéobactéries, de â-protéobactéries, de y-protéobactéries, d'actinomycètes ainsi que d'un genre apparenté à acidobactérium. Ces résultats, présentés dans le tableau 7 ainsi que par l'arbre as phylogénétique de la figure 7 rendent compte de la grande diversité
phylogénétique des acides nucléiques contenus dans une banque d'ADN préparée conformément au procédé selon l'invention.
VECTEURS DE CLONAGE ET/OU D'EXPRESSION
Chacun des acides nucléiques contenus dans une collection d'acides nucléiques préparés conformément à l'invention peut être inséré dans un vecteur de clonage et/ou d'expression.
A cette fin, tous types de vecteurs connus de l'état de la 3s technique peuvent être utilisés, tels que des vecteurs viraux , des phages, des plasmides, des phagemides, des cosmides, des phosmides, des vecteurs de type BAC, des bactériophages P1 , des vecteurs de type BAC, des vecteurs de type YAC, des plasmides de levure ou encore tout autre vecteur connu de l'état de la technique par s l'homme du métier.
On aura avantageusement recours selon l'invention à des vecteurs permettant une expression stable des acides nucléiques d'une banque d'ADN. A cette fin, de tels vecteurs incluent préférentiellement des séquences de régulation de la transcription qui sont localisées en io phase (" operably linked ") avec l'insert génomique de manière à
permettre l'initiation et/ou la régulation de l'expression d'au moins une partie dudit insert d'ADN.
II résulte de ce qui précède, que l'invention concerne encore un procédé de préparation d'une collection de vecteurs recombinants ts caractérisé en ce que les acides nucléiques obtenus à l'étape II-(iv) ou à
l'étape I-(c) ou toute autre étape ultérieure d'un procédé de préparation d'une collection d'acides nucléiques à partir d'un échantillon de sol contenant des organismes selon l'invention sont insérés dans un vecteur de clonage et/ou d'expression.
2o Préalablement à leur insertion dans un vecteur de clonage et/ou d'expression, les acides nucléiques constitutifs d'une collection d'acides nucléiques selon l'invention peuvent être séparés en fonction de leur taille, par exemple par électrophorèse sur un gel d'agarose, le cas échéant après digestion à l'aide d'une endonucléase de restriction.
2s Selon un autre aspect, la taille moyenne des acides nucléiques constitutifs d'une collection d'acides nucléiques selon l'invention peut être rendue d'une taille sensiblement uniforme par la mise en oeuvre d'une étape de rupture physique préalablement à leur insertion dans le vecteur de clonage et/ou d'expression.
3o Une telle étape de rupture physique ou mécanique des acides nucléiques peut consister en des passages successifs de ces derniers, en solution, dans un canal métallique d'environ 0,4 mm de diamètre, par exemple le canal d'une aiguille de seringue ayant un tel diamètre.
La taille moyenne des acides nucléiques peut dans ce cas être 3s comprise entre 30 et 40 kb de longueur.

La construction des vecteurs préférés selon l'invention est shématisée dans les figures 25 (cosmide intégrarif conjugatif) et 26 (BAC
intégratif ).
Des vecteurs de clonage et/ou d'expression pouvant être s avantageusement utilisés aux fins d'insertion des acides nucléiques contenus dans une collection ou banque d'ADN selon l'invention sont notamment les vecteurs décrits dans le brevet européen N°EP-0 350 341 et dans le brevet US N°5 688 689, de tels vecteurs étant spécialement adaptés à la transformation de souches d'actinomycètes.
1o De tels vecteurs contiennent, outre une séquence d'ADN de l'insert, une séquence d'attachement att ainsi qu'une séquence d'ADN codant pour une intégrase (séquence int) fonctionnelle dans les souches d'actinomycètes.
Toutefois, il a été observé selon l'invention que certains is vecteurs de clonage et/ou d'expression présentaient des inconvénients et que leur capacité fonctionnelle théorique n'était pas atteinte dans la pratique.
Ainsi, il est apparu que le système d'intégration contenu dans des vecteurs de l'état de la technique, et notamment dans les vecteurs zo décrits dans le brevet européen n°EP 0 350 41 ne permettait pas en réalité une bonne intégration de l'insert d'ADN de la banque au sein du chromosome bactérien.
Partant de l'hypothèse que les déficits fonctionnels d'intégration 2s de tels vecteurs au sein du chromosome bactérien étaient dus à un défaut dans l'expression du gène de l'intégrase présent dans ces vecteurs, le demandeur a tout d'abord cherché à augmenter l'expression du gène de l'intégrase en substituant au promoteur de la transcription initial un promoteur de la transcription susceptible d'augmenter 3o significativement le nombre de transcrits de l'intégrase.
Les résultats ont été décevants et la fonction d'intégration au chromosome de ces vecteurs n'a pas été améliorée.
De manière surprenante, il a été montré selon l'invention que les difficultés d'expression de l'intégrase contenues dans cette famille de vecteurs intégratifs ne se situait pas au niveau de la quantité
d'expression des transcrits, mais au niveau de leur stabilité.
Selon une seconde hypothèse, le demandeur a pu montrer que le défaut de stabilité des transcrits de l'intégrase était causé par des s déficits dans la terminaison de la transcription de l'ARN messager correspondant.
Le demandeur a alors inséré un site terminateur placé en aval de la séquence codant pour l'intégrase du vecteur de manière à obtenir un ARN messager de taille déterminée. L'insertion d'un signal de Io terminaison additionnel en aval de la séquence nucléotidique codant pour l'intégrase du vecteur a permis l'obtention d'une famille de vecteurs intégratifs de type cosmide et de type BAC .
Préférentiellement, le site terminateur est placé en aval du site d'attachement att.
is En outre, le demandeur a mis au point de nouveaux vecteurs conjugatifs et de nouveaux vecteurs réplicatifs du type cosmide et de nouveaux vecteurs conjugatifs de type BAC qui peuvent avantageusement être utilisés pour l'insertion des acides nucléiques 2o constitutifs d'une collection d'acides nucléiques préparés selon le procédé de l'invention.
Lorsque l'insertion de fragments d'ADN de taille moyenne est recherchée, on utilise préférentiellement des vecteurs du type cosmide, capables de recevoir des inserts ayant une taille maximale d'environ 50 2s kb.
De tels vecteurs cosmidiques sont tout particulièrement adaptés pour l'insertion d'acides nucléiques constitutifs d'une collection d'acides nucléiques obtenus selon le procédé de l'invention comprenant une première étape d'extraction directe d'ADN par lyse mécanique des 30 organismes contenus dans l'échantillon de sol initial.
Lorsque l'insertion d'acides nucléiques de grande taille, en particulier d'acides nucléiques d'une taille supérieure à 100 kb, voire supérieure à 200, 300, 400, 500 ou 600 kb est recherchée, on aura alors recours préférentiellement à des vecteurs du type BAC capables de 3s recevoir des inserts d'ADN d'une telle taille.

De tels vecteurs de type BAC sont tout particulièrement adaptés pour l'insertion des acides nucléiques constitutifs d'une collection d'acides nucléiques obtenus conformément au procédé selon l'invention dans lequel la première étape est constituée d'une extraction s indirecte de l'ADN par séparation préalable des organismes contenus dans l'échantillon de sol initial et élimination des macro-constituants dudit échantillon de sol.
En particulier, des vecteurs du type BAC sont avantageusement mis en oeuvre pour l'insertion d'acides nucléiques de grande taille 1o contenant, au moins partiellement, la séquence nucléotidique d'un opéron.
Ainsi, le procédé de préparation d'une collection de vecteurs recombinants de clonage et/ou d'expression selon l'invention est en outre caractérisé en ce que le vecteur de clonage et/ou d'expression est is du type plasmide.
Selon un autre aspect, un tel procédé est caractérisé en ce que le vecteur de clonage et/ou d'expression est du type cosmide.
Selon un premier aspect, il peut s'agir d'un cosmide réplicatif chez E.coli et intégratif chez Streptomyces. Un vecteur cosmidique tout à
zo fait préféré répondant à une telle définition est le cosmide pOS7001 décrit à l'exemple 3.
Selon encore un autre aspect, le vecteur cosmidique est conjugatif et intégratif chez Streptomyces.
De manière générale, des vecteurs conjugatifs de type cosmide 2s ou de type BAC, qui comprennent dans leurs séquences nucléotidiques un motif reconnu par la machinerie enzymatique cellulaire appelé
" origine de conjugaison " sont utilisés chaque fois que l'on veut éviter un recours à des techniques de transformation lourdes et peu automatisables.
3o Par exemple, la transfection de vecteurs initialement hébergés par des cellules de E.coli dans des cellules de Streptomyces nécessite classiquement une étape de récupération du vecteur recombinant contenu dans les cellules de Escherichia coli, et sa purification préalable à l'étape de transformation de protoplastes de Strepfomyces. II est 3s communément admis qu'une transfection d'un ensemble de 1000 clones de Escherichia coli dans Streptomyces requiert l'obtention d'environ 8000 clones pour que chaque clone de E. coli ait une chance d'être représenté.
A l'inverse, une étape de transfection par conjugaison d'un s vecteur hébergé par E.coli vers des cellules de Streptomyces nécessite le même nombre de clones de chacun des micro-organismes, l'étape de conjugaison ayant lieu " clone à clone " et ne comprenant en outre pas les difficultés techniques liées à l'étape de transfert de matériel génétique par transformation de protoplastes, par exemple en présence io de polyéthylène glycol.
Afin d'optimiser la construction de banque d'ADN chez Streptomyces, il a été mis au point selon l'invention, de nouveaux vecteurs conjugatifs de type cosmide et de type BAC de nature à
permettre une efficacité maximale de l'étape de conjugaison.
is Notamment, les nouveaux vecteurs conjugatifs selon l'invention ont été construits en plaçant un gène marqueur de sélection à l'extrémité
de l'ADN du vecteur qui est transféré à la bactérie réceptrice en dernier Iieu.Ce perfectionnement aux vecteurs conjugatifs de l'état de la technique permet de ne sélectionner positivement que les bactéries 2o réceptrices ayant reçu la totalité de l'ADN du vecteur et, en conséquence, la totalité de l'ADN de l'insert d'intérêt.
Des cosmides conjugatifs et intégratifs chez Sfreptomyces préférés selon l'invention sont les cosmides pOSV303, pOSV306 et pOSV307 décrits à l'exemple 5.
2s Selon un autre aspect, un procédé de préparation d'une collection de vecteurs recombinants selon l'invention est mis en oeuvre à
l'aide d'un cosmide réplicatif à la fois chez E.coli et chez Streptomyces.
Un tel cosmide est avantageusement le cosmide pOS 7008 décrit à
l'exemple 6.
3o Selon encore un autre aspect, le procédé ci-dessus peut être mis en oeuvre avec un cosmide réplicatif chez E. coli et Streptomyces et conjugatif chez Streptomyces.
Un tel cosmide réplicatif et conjugatif peut être obtenu à partir d'un cosmide réplicatif conforme à l'invention, par l'insertion d'une origine de transfert appropriée, telle que RK2, comme décrit à l'exemple pour la construction du vecteur pOSV303.
Selon un autre mode de réalisation avantageux du procédé de préparation d'une collection de vecteurs recombinants selon l'invention, s on a recours à un vecteur de clonage et/ou d'expression de type BAC.
Selon un premier aspect, le vecteur du type BAC est intégratif et conjugatif chez Streptomyces.
De manière tout à fait préférée, un tel vecteur BAC intégratif et conjugatif chez Streptomyces est le vecteur BAC pOSV 403 décrit à
Io l'exemple 8, ou encore les vecteurs BAC pMBD-1, pMBD-2, pMBD-3, pMBD-4, pMBD-5 et pMBD-6 décrits à l'exemple 15.
L'invention a en outre pour objet un vecteur recombinant caractérisé en ce qu'il est choisi parmi les vecteurs recombinants suivants:
is a) un vecteur comprenant un acide nucléique constitutif d'une collection d'acides nucléiques selon l'invention;
b) un vecteur tel qu'obtenu selon un procédé éliminant tout recours à l'action d'une endonucléase de restriction sur le fragment d'ADN à insérer, tel que décrit précédemment.
2o De manière tout à fait préférée, l'invention est également relative à un vecteur choisi parmi les vecteurs suivants:
- le cosmide pOS7001;
- le cosmide pOSV303;
2s - le cosmide pOSV306;
- le cosmide pOSV307;
- le cosmide pOS700R;
- le vecteur BAC pOSV403;
- le vecteur BAC pMBD-1;
30 - le vecteur BAC pMBD-2;
- le vecteur BAC pMBD-3;
- le vecteur BAC pMBD-4;
- le vecteur BAC pNIBD-5;
- le vecteur BAC pMBD-6.

L'invention est en outre relative à une collection de vecteurs recombinants tels qu'obtenus selon l'un quelconque des procédés selon l'invention.
s Procédé de préparation d'un vecteur recombinant de clonage et/ou d'expression selon l'invention.
Les techniques conventionnelles d'insertion d'ADN au sein d'un vecteur afin de préparer un vecteur de clonage et/ou d'expression io recombinant font classiquement appel à une première étape au cours de laquelle une endonucléase de restriction est incubée à la fois avec l'ADN
à insérer et avec le vecteur récepteur créant ainsi des extrémités compatibles entre l'ADN à insérer et l'ADN du vecteur permettant l'assemblage des deux ADN avant une étape de ligation finale Is permettant l'obtention du vecteur recombinant.
Toutefois, une telle technique conventionnelle présente des inconvénients notables, tout particulièrement lorsque est recherchée l'insertion d'acides nucléiques de grande taille dans un vecteur de clonage et/ou d'expression.
2o En effet, l'action préalable d'une enzyme de restriction sur les fragments d'ADN destinés à être insérés dans un vecteur est susceptible de réduire notablement la taille de cet ADN préalablement à son insertion dans le vecteur. II va sans dire qu'une réduction significative de la taille de l'ADN préalablement à son insertion sur un vecteur est une 2s situation particulièrement défavorable lorsqu'est recherché le clonage de fragments d'ADN de grande taille susceptible de contenir l'ensemble des séquences codantes et, le cas échéant, également des séquences régulatrices, d'un opéron dont l'expression constitue une voie de biosynthèse complète d'un métabolite d'intérêt industriel, et tout 3o particulièrement d'un composé d'intérêt thérapeutique.
Pour remédier aûx inconvénients des techniques de l'art antérieur, il a été mis au point selon l'invention deux procédés de préparation d'un vecteur recombinant de clonage et/ou d'expression qui ne nécessitent pas le recours à une endonucléase de restriction sur 3s l'ADN à insérer préalablement à son introduction au sein du vecteur. De 4l tels procédés sont en conséquence tout à fait adaptés au clonage de longs fragments d'ADN susceptibles de contenir, au moins partiellement, l'ensemble des séquences codantes et, le cas échéant, également des séquences régulatrices, d'un opéron complet responsable d'une voie de s biosynthèse.
Selon .un premier aspect, un procédé de préparation d'un vecteur recombinant de clonage et/ou d'expression selon l'invention est caractérisé en ce que l'insertion d'un acide nucléique dans le vecteur de clonage et/ou d'expression, comprend les étapes suivantes:
1o - ouvrir le vecteur de clonage et/ou d'expression à un site de clonage choisi, à l'aide d'une endonucléase de restriction appropriée;
- ajouter un premier acide nucléique homopolymérique à
is l'extrémité 3' libre du vecteur ouvert;
- ajouter un second acide nucléique homopolymérique, de séquence complémentaire au premier acide nucléique homopolymérique, à l'extrémité 3' libre de l'acide nucléique à insérer 2o dans le vecteur;
- assembler l'acide nucléique du vecteur et l'acide nucléique par hybridation du premier et du second acide nucléique homopolymérique de séquences complémentaires l'une de l'autre;
2s - refermer le vecteur par ligation.
Un tel procédé est décrit aux exemples 10 et 13 ci-après.
De manière avantageuse, le procédé ci-dessus peut comporter 30 les caractéristiques suivantes, isolément ou en combinaison:
le premier acide nucléique homopolymérique est de séquence poly(A) ou poly(T);

- le second acide nucléique homopolymérique est de séquence poly(T) ou poly(A).
De manière tout à fait préférée, les acides nucléiques s homopolymériques ont une longueur comprise entre 25 et 100 bases nucléotidiques, préférentiellement entre 25 et 70 bases nucléotidiques.
Le procédé de préparation d'un vecteur recombinant de clonage et/ou d'expression décrit ci-dessus est particulièrement adapté à
la construction de banques d'ADN dans des vecteurs de type BAC.
io Ainsi, selon un mode de réalisation avantageux du procédé de préparation d'un vecteur recombinant décrit ci-dessus, ledit procédé est en outre caractérisé en ce que la taille de l'acide nucléique à insérer est d'au moins 100 kb, et préférentiellement d'au moins 200, 300, 400, 500 ou 600 kb.
is Un tel procédé de préparation est donc particulièrement adapté
à l'insertion des acides nucléiques contenus dans une collection d'acides nucléiques obtenus selon le procédé de l'invention.
Afin de permettre l'insertion de fragments d'ADN de grande taille dans des vecteurs de clonage et/ou d'expression, il a été mis au 2o point selon l'invention, un second procédé ayant permis d'éliminer tout recours à l'action d'une endonucléase de restriction sur l'ADN destiné à
être inséré au sein du vecteur.
Un tel procédé de préparation d'un vecteur recombinant de clonage et/ou d'expression selon l'invention est caractérisé en ce que 2s l'étape d'insertion d'un açide nucléique dans ledit vecteur de clonage et/ou d'expression comprend les étapes suivantes:
- création de bouts francs sur les extrémités de l'acide nucléique de la collection par élimination des séquences 3' sortantes et 3o remplissage des séquences 5' sortantes;
- ouverture du vecteur de clonage et/ou d'expression à un site de clonage choisi à l'aide d'une endonucléase de restriction appropriée;
3s - adition d'adaptateurs oligonucléotidiques complémentaires ;

- création de bouts francs aux extrémités de l'acide nucléique du vecteur par élimination des séquences 3' sortantes et remplissage des séquences 5' sortantes, puis déphosphorylation des extrémités 5' s afin de prévenir une recircularisation du vecteur;
- insertion de l'acide nucléique de la collection dans le vecteur par ligation.
io De manière préférée, l'élimination des séquences 3' sortantes est réalisée à l'aide d'une exonucléase, telle que l'enzyme de Klenow.
De manière préférée, le remplissage des séquences 5' sortantes est réalisé à l'aide d'une polymérase, et de manière tout à fait préférée de la T4 polymérase, en présence des quatre nucléotides ts triphosphates.
Un procédé de préparation d'un vecteur recombinant de clonage et/ou d'expression par élimination des séquences 3' sortantes et remplissage des séquences 5' sortantes tel que décrit ci-dessus est particulièrement adapté à la construction de banques d'ADN à partir de 2o vecteurs de type cosmide.
Un tel procédé d'obtention de vecteurs recombinants est décrit à l'exemple 12.
Dans un mode particulier de préparation d'un vecteur recombinant selon l'invention, des oligonucléotides comprenant un ou 2s plusieurs sites de restriction rares sont ajoutés sur le vecteur au niveau du site de clonage de l'ADN à insérer, conformément à l'enseignement de l'exemple 10. Cet ajout d'oligonucléotides facilite la récupération ultérieure des inserts sans clivage de ces derniers.
3o CELLULES HOTES
Bien que tout type de cellules hôtes puisse être utilisé pour la transfection ou la transformation avec un acide nucléique ou un vecteur recombinant selon l'invention, notamment une cellule hôte procaryote ou 3s eucaryote, on utilisera de préférence des cellules hôtes dont les caractères physiologiques, biochimiques et génétiques sont bien caractérisés, facilement cultivables à grande échelle et dont les conditions de culture pour la production de métabolites soient bien connues.
s De manière préférentielle, la cellule hôte réceptrice d'un acide nucléique ou d'un vecteur recombinant selon l'invention est phylogénétiquement proche des organismes donneurs contenus initialement dans l'échantillon de l'environnement desquels les acides nucléiques sont originaires.
io De manière tout à fait préférée, une cellule hôte selon l'invention doit posséder un usage des codons similaire, ou du moins proche, des organismes donneurs présents initialement dans l'échantillon de l'environnement, tout particulièrement de l'échantillon de sol.
is La taille des fragments d'ADN susceptible de porter les séquences nucléotidiques d'intérét recherchées peut être variable. Ainsi, des enzymes codées par des gènes de taille moyenne de 1 kb pourront être exprimées à partir d'inserts de petite taille alors que l'expression de métabolites secondaires nécessiteront le maintien dans l'organisme hôte 2o de fragments de taille bien supérieure, par exemple de 40 kb à plus de 100 kb, 200 kb, 300 kb, 400 kb ou 600 kb.
Ainsi, les cellules hôtes de Escherichia coli constituent un choix privilégié pour le clonage de grands fragments d'ADN.
De manière tout à fait préférée, on aura recours à l'utilisation de 2s la souche de Escherichia coli désignée DH10B et décrite par Shizuya et al; (1992) pour laquelle des protocoles de clonage dans des vecteurs BAC ont été optimisés.
Toutefois, d'autres souches de Escherichia coli peuvent être avantageusement utilisées pour la construction d'une banque d'ADN
3o selon l'invention, telles que les souches E.coli Sure, E.coli DH5 a, ou encore E.coli 294 (ATCC N°31446).
En outre, la construction d'une banque d'ADN par transfection de cellules de E.coli avec des vecteurs recombinants selon l'invention est également possible, l'expression de gènes de divers procaryotes tels que Bacilles, Thermotoga, Corynebacterium, Lactobacillus ou Clostridium ayant été décrite dans la demande PCT N°WO 99/20799.
De manière générale, des cellules hôtes de E.coli peuvent dans s tous les cas constituer des hôtes transitoires dans lesquels des vecteurs recombinants selon l'invention pourront être maintenus avec une grande efficacité, le matériel génétique pouvant être facilement manipulé et archivé et façon stable.
Dans le but d'exprimer la plus grande diversité moléculaire io possible, d'autres hôtes cellulaires pourront être également avantageusement mis en oeuvre tels que des cellules de Bacilles, Pseudomonas, Streptomyces, Myxococcus, Aspergillus nidulans ou encore Neurospora crassa.
II a en outre été montré selon la présente invention, que des Is cellules de Streptomyces lividans peuvent être utilisées avec succès et constituent des systèmes d'expression complémentaires à Escherichia coli.
Streptomyces lividans constitue un modèle pour l'étude de la génétique des Streptomyces et a également été utilisé comme hôte d'expression 2o hétérologue de nombreux métabolites secondaires. Streptomyces lividans, possède en commun avec d'autres actinomycètes tels que Streptomyces coelicolor, Streptomyces griseus, Streptomyces fradiae, ainsi que Streptomyces griseochromogenes, les molécules précurseurs et les systèmes de régulation nécessaires à l'expression de tout ou 2s partie des voies de biosynthèses complexes, telles que par exemple la voie de biosynthèse des polykétides ou encore la voie de biosynthèse des polypeptides non ribosomiques représentant des classes de molécules de structures très diverses.
Streptomyces lividans présente également l'avantage 3o d'accepter l'ADN étranger avec des efficacités de transformation élevées.
Ainsi, l'invention concerne aussi une cellule hôte recombinante comprenant un acide nucléique selon l'invention, constitutif d'une collection d'acides nucléiques préparée selon un procédé conforme à

l'invention, ou encore une cellule hôte recombinante comprenant un vecteur recombinant tel que défini précédemment.
Selon un premier aspect, il peut s'agir d'une cellule hôte recombinante d'origine procaryote ou eucaryote.
s Avantageusement, une cellule recombinante selon l'invention est une bactérie, et de manière tout à fait préférée une bactérie choisie parmi E.coli et Streptomyces.
Selon un autre aspect, une cellule hôte recombinante selon l'invention est caractérisée en ce qu'il s'agit d'une levure ou encore d'un 1o champignon filamenteux.
L'invention a également trait à une collection de cellules hôtes recombinantes, chacune des cellules hôtes constitutive de la collection comprenant un acide nucléique provenant d'une collection d'acides nucléiques réalisée conformément à un procédé de préparation d'une ts collection d'acides nucléiques à partir d'un échantillon de sol contenant des organismes tel que décrit ci-dessus.
L'invention est également relative à une collection de cellules hôtes recombinantes, chacune des cellules hôtes constitutives de la collection comprenant un vecteur recombinant selon l'invention.
2o En raison de la grande taille des inserts il est nécessaire d'avoir une efficacité maximale de transformation. Dans ce but, une souche réceptrice de Streptomyces lividans exprimant l'intégrase de pSAM2 de façon constitutive afin de favoriser l'intégration site-spécifique du vecteur est préférée. Pour cela, le gène int sous contrôle d'un promoteur fort est 2s intégré dans le chromosome. La surproduction d'intégrase n'induit pas de phénomènes d'excision (Raynal et al., 1998).
La production d'un nouveau métabolite à partir de l'insert pourrait être toxique pour Streptomyces si l'insert ne contient pas de gènes de résistance à l'antibiotique produit ou si ce gène est peu ou pas 3o exprimé. La capacité des différents gènes permettant à Streptomyces ambofaciens de résister à l'antibiotique qu'il produit est étudiée (Gourmelen et al., 1998; Pernodet et al., 1999). Certains de ces gènes codent des transporteurs de type ABC susceptibles de conférer un large spectre de résistance. Ces gènes peuvent être introduits et surexprimés 3s dans la souche hôte de Streptomyces lividans.

A l'inverse, une souche hypersensible aux antibiotiques peut être utilisée (Pernodet et al., 1996), afin de détecter dans la banque la présence de gènes de résistance. En effet, chez les micro-organismes producteurs d'antibiotique, ces gènes de résistance sont souvent s associés aux gènes de la voie de biosynthèse de l'antibiotique. La sélection de clones résistants peut permettre d'effectuer simplement un premier tri avant les tests plus complexes de détection d'un nouveau métabolite produit par le clone.
ISOLEMENT ET CARACTERISATION DE NOUVELLES SEQUENCES
NUCLEOTIDIQUES CODANT POUR DES POLYKETIDES
SYNTHASES.
Selon l'invention, une collection de cellules hôtes is recombinantes a été obtenue après transfection des cellules hôtes par une collection de vecteurs recombinants contenant chacun un insert d'acide nucléique provenant d'une collection d'acides nucléiques préparée conformément au procédé selon l'invention.
Plus précisément, les fragments d'ADN obtenus selon le 2o procédé de l'invention dans lequel il est mis en oeuvre ûne étape d'extraction indirecte d'ADN des organismes contenus dans l'échantillon de sol ont été tout d'abord clonés dans le cosmide intégratif pOS7001.
L'étape d'insertion des fragments d'ADN dâns le cosmide intégratif pOS7001 a été réalisée selon le procédé de l'invention dans 2s lequel des queues de polynucléotides homopolymériques poly(A) et poly(T) ont été ajoutées à l'extrémité 3' respectivement de l'acide nucléique du vecteur et des fragments d'ADN à insérer.
Les vecteurs recombinants ainsi construits ont été encapsidés dans des têtes de phage lambda et les phages obtenus ont été utilisés 3o pour infecter des cellules de E. coli selon des techniques bien connues de l'homme du métier.
Une banque d'environ 5000 clones de Escherichia coli a été
obtenue.
Cette banque de clones a été criblée avec des couples 3s d'amorces spécifiques d'une séquence nucléotidique codant pour une enzyme impliquée dans la voie de biosynthèse des polykétides, l'enzyme PKS de type I, aussi désignée ~i-kétoacyl synthase .
On rappelle ici que les polykétides constituent une classe chimique d'une grande diversité structurale comprenant un nombre s important de molécules d'intérêt pharmaceutique tels que la tylosine, la monensine, la vermectine, l'érythromycine, la doxorubicine ou encore le FK506.
Les polykétides sont synthétisés par condensation de molécules d'acétate sous l'action d'enzymes appelées polykétide io synthases (PKSs). II existe deux types de polykétide synthases. Les polykétide synthases de type II sont impliquées en général dans la synthèse des antibiotiques aromatiques polycycliques et catalysent la condensation d'unités acétate de façon itérative.
Les polykétide synthases de type I sont impliquées dans la is synthèse des polykétides macrocycliques ou macrolides et constituent des enzymes modulaires multifonctionnelles.
Compte-tenu de leur intérêt thérapeutique, il existe un besoin dans l'état de la technique d'isoler et de caractériser de nouvelles polykétides synthases qui peuvent être utilisées pour la production de 2o nouveaux composés pharmaceutiques, notamment de nouveaux composés pharmaceutiques à activité antibiotique.
Le criblage de la banque de clones recombinants décrite ci-dessus à l'aide d'amorces PCR amplifiant sélectivement des séquences nucléotidiques codant pour des polykétide synthases de type I a permis zs d'identifier des clones recombinants contenant des inserts d'ADN
comprenant une séquence nucléotidique codant pour de nouvelles polykétide synthases. Les séquences nucléotidiques codant pour ces nouvelles polykétides synthases sont référencées comme les séquences SEQ ID N°33 à SEQ ID N°44 et SEQ ID N°115 à SEQ ID
N°120.
3o Un autre objet de l'invention consiste en un acide nucléique codant pour une nouvelle polykétide synthase I, caractérisé en ce qu'il comprend l'une des séquences nucléotidiques SEQ ID N°34 à SEQ ID
N°44 et SEQ ID N°115 à SEQ ID N°120.
De préférence, un tel acide nucléique se présente sous une 3s forme isolée etlou purifiée.

L'invention concerne aussi un vecteur recombinant comprenant un polynucléotide comprenant l'une des séquences SEQ ID N°34 à SEQ
ID N°44 et SEQ ID N°115 à SEQ ID N°120 L'invention a également trait à une cellule hôte recombinante s comprenant un acide nucléique choisi parmi les polynucléotides comprenant l'une des séquences nucléotidiques SEQ ID N°34 à SEQ ID
N°44 et SEQ ID N° 115 à SDEQ ID N°120 ainsi qu'à une cellule hôte recombinante comprenant un vecteur recombinant dans lequel est inséré un polynucléotide comprenant l'une des séquences 1o nucléotidiques SEQ ID N°34 à SEQ ID N°44 et SEQ ID
N°115 à SEQ ID
N°120.
Avantageusement, les vecteurs recombinants contenant un insert d'ADN codant pour une nouvelle polykétide synthase de type I
selon l'invention sont des vecteurs de clonage et d'expression.
is De préférence, une cellule hôte recombinante telle que décrite ci-dessus est une bactérie, une levure ou encore un champignon filamenteux.
Les séquences en acides aminés de nouvelles polykétide synthases provenant d'organismes contenus dans un échantillon de sol 20 ont été déduites des séquences nucléotidiques SEQ ID N°34 à SEQ ID
N°44 ET SEQ ID N° 115 à SEQ ID N°120 ci-dessus. II
s'agit des polypeptides comprenant l'une des séquences en acides aminés SEQ ID
N°48 à SEQ ID N°59 et SEQ ID N° 121 à 126.
L'invention concerne encore de nouvelles polykétides 2s synthases comprenant une séquence en acides aminés choisie parmi les séquences SEQ ID N°48 à SEQ ID N°59 et SEQ ID N° 121 à SEQ ID
N°126.
Fait également partie de l'invention la séquence nucléotidique SEQ ID N°114 qui comprend six cadres ouverts de lecture qui codent 3o respectivement les polypeptides de séquences SEQ ID N°121 à SEQ ID
N°126.
Fait également partie de l'invention la séquence nucléotidique SEQ ID N°113 du cosmide a26G1, qui contient la séquence complémentaire de la séquence SEQ ID N°114.

On a aussi extrait et amplifié selon l'invention de l'ADN
génomique provenant de souches bactériennes pures, telles que Streptomyces coelicolor (ATCC N°101.478), Streptomyces ambofaciens (NRRL N°2.420), Streptomyces lactamandurans (ATCC N°27.382), s Streptomyces rimosus (ATCC N°109.610), Bacillus subtilis (ATCC
N°6633) ou encore Bacillus lichenifomis et Saccharopolyspora erythrea.
Une amplification par PCR de l'ADN de chacune des souches bactériennes décrites ci-dessus a été effectuée à l'aide des couples d'amorces spécifiques des séquences nucléiques de polykétide io synthase de type 1.
De nouveaux gènes de polykétide synthases de type I
bactériennes ont ainsi pu être isolés et caractérisés. II s'agit des séquences nucléiques de séquences SEQ ID N°30 à SEQ ID N°32.
L'invention a donc en outre pour objet des séquences ts nucléotidiques codant pour de nouvelles polykétides synthases de type I
choisies parmi les polynucléotides comprenant l'une des séquences nucléotidiques SEQ ID N°30 à SEQ ID N°32.
Font également partie de l'invention des vecteurs recombinants comprenant les séquences nucléotidiques codant pour de nouvelles 2o polykétides synthases de type ( définies ci-dessus.
L'invention concerne aussi des cellules hôtes recombinantes caractérisées en ce qu'elles contiennent un acide nucléique codant pour une nouvelle polykétide synthase de type I comprenant une séquence nucléotidique choisie parmi les séquences SEQ ID N°30 à SEQ ID
N°32 2s ainsi que des cellules hôtes recombinantes comprenant un vecteur recombinant tel que défini ci-dessus.
L'invention a également pour objet des polypeptides codés par des séquences comprenant les acides nucléiques SEQ ID N° 30 à 32, et plus précisément des polypeptides comprenant les séquences d'acides 3o aminés SEQ ID N° 47 à SEQ ID N° 50.
L'invention a en outre pour objet un procédé de production d'une polykétide synthase de type I selon l'invention, ledit procédé de production comprenant les étapes suivantes:

s1 - obtention d'une cellule hôte recombinante comprenant un acide nucléique codant pour une polykétide synthase de type I
comprenant une séquence nucléotidique choisie parmi les séquences SEQ ID N°33 à SEQ ID N°44, SEQ ID N°30 à SEQ ID
N°32 et SEQ ID
s N°115 à SEQ ID N°120;
- culture des cellules hôtes recombinantes dans un milieu de culture approprié;
io - récupération et, le cas échéant, purification de la polykétide synthase de type I à partir du surnageant de culture ou du lysat cellulaire.
Les nouvelles polykétide synthases de type I obtenues selon le is procédé décrit ci-dessus peuvent être caractérisées par fixation sur une colonne de chromatographie d'immuno-affinité sur laquelle des anticorps reconnaissant ces polykétides synthases ont été préalablement immobilisés.
Les polykétide synthases de type I selon l'invention, et plus 2o particulièrement les polykétide synthases recombinantes décrites ci-dessus peuvent être aussi purifiées par des techniques de chromatographie liquide à haute performance (HPLC), telles que par exemple des techniques de chromatographie en phase inverse ou de chromatographie d'échanges d'anions ou de cations, bien connues de 2s l'homme du métier. .
Les polykétide synthases, recombinantes ou non recombinantes, selon l'invention peuvent être utilisées pour la préparation d'anticorps.
Selon un autre aspect, l'invention a donc encore pour objet un 3o anticorps reconnaissant spécifiquement une polykétide synthase de type I selon l'invention ou un .fragment peptidique d'une telle polykétide synthase.
Les anticorps selon l'invention peuvent être monoclonaux ou polyclonaux . Les anticorps monoclonaux peuvent être préparés à partir s2 de cellules d'hybridome selon la technique décrite par KOHLER et MILSTEIN C. (1975), Nature, Vo1.256:495.
Les anticorps polyclonaux peuvent être préparés par immunisation d'un mammifère, en particulier des souris, des rats ou des s lapins avec une polykétide synthase de type I selon l'invention, le cas échéant en présence d'un composé adjuvant de l'immunité, tels que l'adjuvant complet de Freund, l'adjuvant incomplet de Freund, l'hydroxyde d'aluminium ou encore un composé de la famille des muramyl peptides.
io Constituent également des " anticorps " au sens de la présente invention, les fragments d'anticorps tels que les fragments Fab, Fab', F(ab')2, ou encore les fragments d'anticorps simple chaîne contenant la partie variable (ScFv) décrits par MARTINEAU et al. (1998) J. Mol. Biol., Vo1.280 (1):117-127 ou encore dans le brevet US 4,946,778, ainsi que ts les anticorps humanisés décrits par REINMANN KA et al. (1997), AIDS
Res. Hum. Retroviruses, vo1.13(11):933-943 ou par LEGER O.J et al.
(1997), Hum. Antibodies, vol.8 (1): 3-16.
Les préparations d'anticorps selon l'invention sont utiles notamment dans des tests immunologiques qualitatifs ou quantitatifs 2o visant, soit à simplement détecter la présence d'une polykétide synthase de type I selon l'invention, soit à quantifier la quantité de cette polykétide synthase, par exemple dans le surnageant de culture ou le lysat cellulaire d'une souche bactérienne susceptible de produire une telle enzyme.
2s Un autre objet de l'invention consiste en un procédé de détection d'une polykétide synthase de type I selon l'invention ou un fragment peptidique de cette enzyme, dans un échantillon, ledit procédé
comprenant les étapes de 3o a) mettre en contact un anticorps selon l'invention avec l'échantillon à tester;
b) détecter le complexe antigène/anticorps éventuellement formé.
3s L'invention est également relative à un kit ou nécessaire de détection d'une polykétide synthase de type I selon l'invention dans un échantillon, comprenant a) un anticorps selon l'invention;
s b) le cas échéant, des réactifs nécessaires à la détection du complexe antigène/anticorps éventuellement formé.
Un anticorps dirigé contre une polykétide synthase de type I
selon l'invention peut être marqué à l'aide d'un marqueur détectable isotopique ou non isotopique, selon des procédés bien connus de io l'homme du métier.
Le criblage d'une banque d'ADN selon l'invention à l'aide d'une paire d'amorces hybridant avec des séquences cibles dont la présence est recherchée, telles que des séquences de la voie de biosynthèse de la puromycine, des séquences du gène IinA impliquées dans la 1s biodégradation du lindane ou encore des séquences codant pour des polykétides synthases de type I ont été détaillées ci-avant.
L'invention a donc pour objet un procédé de détection d'un acide nucléique de séquence nucléotidique déterminée, ou de séquence nucléotidique structuralement apparentée à une séquence nucléotidique 2o déterminée, dans une collection de cellules hôtes recombinantes selon l'invention, caractérisé en ce qu'il comprend les étapes suivantes:
- mettre en contact la collection de cellules hôtes recombinantes avec un couple d'amorces hybridant avec la séquence nucléotidique déterminée ou hybridant avec la séquence nucléotidique 2s structurellement apparentée à une séquence nucléotidique déterminée;
- réaliser au moins trois cycles d'amplification ;
- détecter l'acide nucléique éventuellement amplifié.
Pour les conditions d'amplification appropriées en fonction des 3o séquences cibles recherchées, l'homme du métier pourra se référer avantageusement aux exemples ci-dessous.
Selon un autre aspect, l'invention concerne aussi un procédé
de détection d'un acide nucléique, de séquences nucléotidiques déterminées, ou de séquences nucléotidiques structurellement 3s apparentées à une séquence nucléotidique déterminée, dans une collection de cellules hôtes recombinantes selon l'invention, caractérisé
en ce qu'il comprend les étapes suivantes:
- mettre en contact la collection de cellules hôtes recombinantes avec une sonde hybridant avec la séquence s nucléotidique déterminée ou hybridant avec une séquence nucléotidique structurellement apparentée à la séquence nucléotidique déterminée;
- détecter l'hybride éventuellement formé entre la sonde et les acides nucléiques compris dans les vecteurs de la collection.
io Pour effectuer le criblage d'une banque d'ADN selon l'invention en vue de détecter la présence d'une séquence nucléotidique codant pour un polypeptide capable de dégrader le lindane, on a détecté les clones recombinants d'intérêt par leur phénotype correspondant à leur capacité à dégrader le lindane. Dans ce but, les clones isolés et/ou des Is ensembles de clones de la banque d'ADN préparée ont été mis en culture dans un milieu de culture en présence de lindane et la dégradation du lindane a été observée par la formation d'un halo trouble dans l'environnement immédiat des cellules.
L'invention concerne aussi un procédé pour identifier la 2o production d'un composé d'intérêt par une ou plusieurs cellules hôtes recombinantes dans une collection de cellules hôtes recombinantes selon l'invention, caractérisé en ce qu'il comprend les étapes suivantes:
- culture des cellules hôtes recombinantes de la collection dans un milieu de culture approprié;
2s - détection du composé d'intérét dans le surnageant de culture ou dans le lysat cellulaire d'une ou plusieurs des cellules recombinantes cultivées.
L'invention a en outre pour objet un procédé pour sélectionner une cellule hôte recombinante produisant un composé d'intérêt dans une 3o collection de cellules hôtes recombinantes selon l'invention, caractérisé
en ce qu'il comprend les étapes suivantes:
- culture des cellules hôtes recombinantes de la collection dans un milieu de culture approprié;

Ss - détection du composé d'intérêt dans le surnageant de culture ou dans le lysat cellulaire d'une ou plusieurs des cellules hôtes recombinantes cultivées;
- sélection des cellules hôtes recombinantes produisant le s composé d'intérêt.
L'invention concerne encore un procédé pour la production d'un composé d'intérêt caractérisé en ce qu'il comprend les étapes suivantes:
- cultiver une cellule hôte recombinante sélectionnée selon le Io procédé décrit ci-dessus;
- récupérer et, le cas échéant, purifier, le composé produit par ladite cellule hôte recombinante.
L'invention est également relative à un composé d'intérêt caractérisé en ce qu'il est obtenu selon le procédé ci-dessus décrit.
is Un composé d'intérêt selon l'invention peut consister en un polykétide produit grâce à l'expression d'au moins une séquence nucléotidique comprenant une séquence choisie parmi les séquences SEQ ID N°33 à 44, SEQ ID N°30 à 32 et SEQ ID N°115 à
SEQ ID
N°120.
2o L'invention concerne encore une composition comprenant un polykétide produit grâce à l'expression d'au moins une séquence nucléotidique comprenant une séquence choisie parmi les séquences SEQ ID N°33 à SEQ ID N°44, SEQ ID N°30 à SEQ ID
N°32, et SEQ ID
N°115 à SEQ ID N°120.
2s Un polykétide produit grâce à l'expression d'au moins une séquence nucléotidique ci-dessus est préférentiellement le produit de l'activité de plusieurs séquences codantes incluses au sein d'un opéron fonctionnel dont les produits de traduction sont les différentes enzymes nécessaires à la synthèse d'un polykétide, l'une des séquences ci-ao dessus étant comprise et exprimée dans ledit opéron. Un tel opéron comprenant une séquence d'acide nucléique selon l'invention codant pour une polykétide synthase peut être construit par exemple selon l'enseignement de Borchert et al. (1992).
L'invention est encore relative à une composition 3s pharmaceutique comprenant une quantité pharmacologiquement active s6 d'un polykétide selon l'invention, le cas échéant en association avec un véhicule pharmaceutiquement compatible.
De telles compositions pharmaceutiques seront avantageusement adaptées pour l'administration, par exemple par voie s parentérale, d'une quantité d'un polykétide synthétisé par une polykétide synthase de type I selon l'invention allant de1 Ng/kg par jour à 10 mg/kg par. jour, de préférence au moins 0,01 mg/kg par jour et de manière tout à fait préférée entre 0,01 et 1 mg/kg par jour.
Les compositions pharmaceutiques selon l'invention peuvent io être indifféremment administrées par voie orale, rectale, parentérale, intraveineuse; sous-cutanée ou encore intradermique.
L'invention concerne aussi l'utilisation d'un polykétide obtenu grâce à l'expression d'une polykétide synthase de type I selon l'invéntion pour la fabrication d'un médicament, en particulier d'un médicament à
ts activité antibiotique.
L'invention sera en outre illustrée, sans pour autant être limitée, par les figures et les exemples ci-après.
La figure 1 illustrè le schéma des différentes étapes de lyse 2o effectuées selon les protocoles 1, 2, 3n 4a, 4b, 5a, et 5b décrits à
l'exemple 1.
La Figure 2 illustre une. électrophorèse sur gel d'agarose 0.8%
des ADN extraits à partir de 300 mg du sol n°3 (Côte St André) après différents traitements de lyse (protocoles 1 à 5, cf. Fig. 1). M : marqueur 2s de poids moléculaire de phage lambda La Figure 3 illustre la proportion de différents genres d'actinomycètes cultivés à la suite des traitements 1 à 5 (cf. Fig. 1 ). Le nombre d'ufc (unité formant colonie) a été déterminé sur un milieu 3o sélectif pour ce groupe de bactéries. Un nombre total d'environ 400 colonies a été analysé.
La Figure 4 illustre la. récupération d'ADN de phage lambda digéré par Hindlll additionné dans les sols à différentes concentrations 3s avant (G) ou après (G*) broyage. Les traitements T (chocs thermiques) s7 et S (sonication) sont des traitements additionnels de lyse. La quantification a été réalisée par analyse au phospho-imageur après hybridation en dot-blot. Un échantillon de chaque sol a été utilisé pour chaque concentration de phage lambda ajouté. Les caractéristiques des s sol sont reproduites dans le tableau 1. Les échantillons correspondant à
et 15 Ng d'ADN ajouté n'ont pas été traités.
La Figure 5 illustre l'amplification par PCR des ADN extraits à
partir de sol n°3 selon les protocoles 1, 2, 3, 5a et 5b. Les amorces 1o FGPS 122 et FGPS 350 (tableau 2) ont été utilisés afin de cibler Streptosporangium spp. indigènes. Les extraits d'ADN ont été utilisés non dilués ou dilués au 1/10~"'e et 1/100~me . M : marqueur de poids moléculaires 123 pb ( Gibco BRL), C : contrôle d'amplification sans ADN.
1s La Figure 6 illustre les quantités d'ADN extrait après inoculation de spores (a) ou de mycélium (b) de S. lividans OS48.3 inoculés dans les sols à différentes concentrations. La quantités de mycélium ajoutée dans le sol correspond au nombre de spores inoculées dans le milieu de germination. Environ 50% des spores ont germé, le nombre de cellules ou de génomes contenues dans les hyphes des spores germées n'a pas été déterminé. Les quantités de spores et de mycélium inoculées ne sont donc pas directement comparables. Le protocole d'extraction a été
mené selon le protocole 6 (cf. section matériel et méthodes). Le symbole (') indique que de l'ARN a été inclus dans le tampon d'extraction. L'ADN
2s cible a été amplifié par PCR avec les amorces FGPS 516 et FGPS 517, la quantification a été réalisée par phosphoimageur après hybridation en dot blot en utilisant le sonde FGPS 518. Un échantillon de chaque sol a été utilisé pour chaque concentration d'hyphes ou de spores. Les caractéristiques des sols sont décrites dans le tableau 1.
La figure 7 représente l'arbre phylogénétique obtenu par l'algorithme de Neighbour Joining , positionnant les séquences d'ADNr 16S contenues dans la banque d'ADN du sol, par rapport à des bactéries de références cultivées.
3s En grisé:.les séquences issues des pools de clones de la banque.

s8 Les valeurs de bootstrap sont indiquées au niveau des noeuds, après rééchantillonnage de 100 répétitions. La barre d'échelle indique le nombre de substitutions par site. Le numéro d'accès des séquences s dans la base de données Genbank est indiqué entre parenthèses.
La figure 8 représente un schéma du vecteur pOSint 1.
La figure 9 représente un schéma du vecteur pWED1.
1o La figure 10 représente un schéma du vecteur pWE15 (ATCC
N° 37503).
La figure 11 représente un schéma du vecteur pOS 7001.
1s La figure 12 représente un schéma du vecteur pOSV010.
La figure 13 représente le fragment contenant un site " cos "
inséré dans le plasmide pOSV010 au cours de la construction du vecteur 2o pOSV 303.
La figure 14 représente un schéma du vecteur pOSV 303.
La figure 15 représente un schéma du vecteur pE116.
2s La figure 16 représente un schéma du vecteur pOS 700 R.
La figure 17 représente un schéma du vecteur pOSV 001.
3o La figure 18 représente le schéma du vecteur pOSV 002.
La figure 19 représente un schéma du vecteur pOSV 014.
La figure 20 représente un schéma du vecteur pBAC 11.
3s La figure 21 représente un schéma du vecteur pOSV 403.
La figure 22 représente les gels d'électrophorèse d'ADN de la banque après digestion par les enzymes BamHl et Dral des clones s positifs de la banque criblée avec les oligonucléotides PKS-I.
La figure 23 illustre la production de puromycine par les recombinants de S. lividans comparée à la production de la souche sauvage S. alboniger.
io La Figure 24 illustre Alignement de PKSs du sol avec les sites actifs conservés d'autres PKSs. Les références pour chaque peptide sont indiquées. Les domaines béta-kétoacyl synthase ont été alignés en utilisant le programme PILEUP de GCG (Wisconsin Package Version 1s 9.1, Genetics Computer Group, Madison, Wisc).
La Figure 25 illustre la construction d'un cosmide intégratif conjugatif.
2o La Figure 26 illustre la construction d'un BAC intégratif conjugatif.
La figure 27 illustre le schéma de construction du vecteur pOSV
308.
La figure 28 illustre le schéma de construction du vecteur pOSV306.
La figure 29 illustre le schéma de construction du vecteur 3o pOSV307.
La figure 30 illustre le schéma de construction du vecteur PMBD-1.

La figure 31 présente une carte détaillée du plasmide pMBD-2 ainsi qu'un schéma de construction du vecteur pMBD-3.
La figure 32 illustre une carte détaillée du plasmide pMBD-4.
s La figure 33 illustre le schéma de construction du plasmide pMBD-5 à partir du plasmide pMBD-1.
La figure 34 illustre la carte détaillée du vecteur pBTP-3.
io La figure 35 illustre le schéma de construction du vecteur pMBD-6 à partir du vecteur pMBD-1.
La figure 36 illustre la carte du cosmide a26G1 dont l'insert is d'ADN contient des cadres ouverts de lecture codant pour plusieurs polykétides synthase.
La figure 37 est un schéma représentant l'insert d'ADN (brin +) du cosmide a26G1, sur lequel sont positionnés les différents cadres de 20 lecture codant pour plusieurs polykétides synthase.
EXEMPLES:
EXEMPLE 1: Procédé de préparation d'une collection d'acide_s nucléigues à partir d'un échantillon de sol contenant des 2s organismes, comprenant une étape d'extraction directe d'ADN à
partir de l'échantillon de sol.
1. MATERIEL ET METHODES
30 1.1 SOLS: Les caractéristiques des six sols utilisés dans cette étude sont listées dans le tableau 1.
La teneur en argile et en matière organique va respectivement de 9 à 47% et de 1,7 à 4,7%, le pH variant de 4,3 à 5,8.
Des échantillons de sol ont été collectés à partir de la couche 3s supe~cielle de 5 à 10 cm de profondeur. Toutes les racines visibles ont
6( été éliminées et les sols ont été conservés à 4°C pendant quelques jours si nécessaire, après quoi ils ont été séchés pendant 24 heures à la température ambiante et tamisés (taille moyenne de maille 2 mm) avant d'être conservés jusqu'à plusieurs mois à 4°C.
s 1.2 SOUCHES BACTERIENNES ET CONDITIONS DE CULTURE:
L'ADN extracellulaire ainsi que les souches bactériennes fournissant des cellules végétatives, des spores ou des hyphae, utilisées pour innoculer les échantillons de sol, ont été choisies de telle sorte que leur présence io puisse être suivie spécifiquement.
Afin d'obtenir de grandes quantités d'ADN extracellulaire, la souche lysogénique de E.coli 1192 Hfr P4X (metB), contenant le phage lambda C1857 Sam7, a été cultivée sur milieu Luria-Bertani (LB) pendant deux heures à 30°C, puis 30 minutes à 40°C, puis 3 heures à
37°C.
1s L'ADN du phage lambda a été extrait selon la technique décrite par SAMBROOK J. et al. (1989) Molecular Cloning: A Laboratory Manual, tnd, ed. Cold Spring Harbor Laboratory, Cold Spring Harbor N.Y.
La souche avirulente de Bacillus anthracis (STERNE 7700) a été utilisée comme inoculum de cellules bactériennes. Bacillus anthracis 2o a été multiplié sur un bouillon de culture de type " trypticase soy broth "
(TSB) (Biomérieux, Lyon, France) pendant environ 6 heures, en vérifiant que la DOsoo soit maintenue en dessous de 0,6. Ces conditions permettent le développement des cellules végétatives sans formation de spores (Patra et al., (1996), FEMS Immunol. Medical Microbiology, 2s vo1.15:223-231.). Les spores de Streptomyces lividans OS48.3 (CLERC-BARDIN et al. non publié) ont été éliminées mécaniquement des cultures de l'organisme sur ~un milieu R2YE (HOPWOOD et al., (1985), Genetic Manipulation of Streptomyces-A Laboratory Manual. The John Innes Foundation , Norwich ,United Kingdom). Les hyphae de S.lividans 3o OS48.3 ont été obtenus à partir des spores en pré-germination, car l'on s'attendait à ce que l'utilisation de hyphae courtes minimise la rupture et la perte subséquente d'ADN. Les spores ont été mises en suspension dans du tampon TES ' (Acide N-Tris [hydroxyméthyl]méthyl-2-aminoéthanesulfonique ; Sigma-Aldrich Chimie, France) (0,05M; pH 8) 3s (Holben WE et al., (1988), APPL. Environ. Microbiol. vo1.54:703-711,
7 PCT/FR00/03311 puis ont été soumises à un choc thermique (50°C pendant 10 minutes suivi d'un refroidissement sous un courant d'eau froide puis ajoutées à
un volume égal de milieu de pré-germination (extrait de levure 1 %, casaminoacides 1 % CaCl2 0,01 M).
s La solution a été incubée à 37°C sur un agitateur. La proportion de spores germées a été estimée à environ 50%, en accord avec les résultats de HOPWOOD et al. (1985). Après centrifugation, les culots ont été resuspendus dans du tampon TES, ajoutés à 3% de milieu TSB, et incubés à 37°C jusqu'à l'obtention d'une D04so de 0,15 (HOPWOOD et io al. , (1985)). Streptomyces hygroscopicus SWN 736 et Streptosporangium fragile AC1296 (Institute Pushino, Moscou) ont été
cultivés selon des techniques décrites par HICKEY et TRESNER (1952).
L'ADN des spores et des hyphae de S. Lividans a été extrait à
partir des cultures pures selon le protocole de lyse 6 décrit ci-dessous is (excepté qu'aucun broyage n'a été réalisé), tandis que les spores de S.
hygroscopicus et de S. fragile ont été extraites par lyse chimique/enzymatique (Hintermann et al., 1981).
1.3 CHOIX DU TAMPON D'EXTRACTION: Un tampon TENP (50 mM
2o Tris, 20 mM EDTA, 100 mM NaCI, 1 % pds/vol de polyvinylpolypyrrolidone développé par PICARD (1992) a été utilisé. Des tampons similaires ont été ultérieurement utilisés par d'autres auteurs (CLEGG et al., 1997; KUSKE et al., 1998; ZHOU et al., 1996).
Le Tris et l'EDTA protègent l'ADN de l'activité nucléase, le NaCI
2s apporte un effet dispersant et la PVPP absorbe les acides humiques et les autres composés phénoliques (HOLBEN et al. (1988); PICARD et al., .
(1992).
Dans cette étude, l'efficacité d'extraction de ce tampon a été
évaluée à différents pH (6,0 - 10,0) en utilisant 20 sols différents ayant 3o une gamme de pH de 5,8 à.8,3 et une teneur en matière organique entre 0,2 et 6,3%. Ces vingt sols (les autres caractéristiques ne sont pas indiquées) ont été utilisés uniquement dans cette expérience. La quantité
d'ADN a été déterminée de manière colorimétrique comme décrit par RICHARD (1974), et détaillé ci-après.

1.4 PROTOCOLE DE LYSE IN SITU ET D'EXTRACTION D'ADN:
Plusieurs protocoles utilisant un nombre croissant d'étapes ont été
testés afin d'évaluer l'efficacité de différentes techniques pour lyser les microbes du sol in situ. Pour ces expériences, la microflore indigène du s sol a été ciblée dans six sols. Des expériences additionnelles ont été
conduites afin d'étudier les effets des traitements de lyse sur l'ADN
libéré, en analysant les quantités et la qualité d'ADN récupéré provenant d'un ADN de phage lambda préalablement additionné aux sols.
Une fois qu'un protocole optimisé (désigné protocole 6) a été
io développé, ce protocole a été utilisé pour quantifier l'ADN provenant d'Actinomycètes indigènes et d'ADN provenant de bactéries Gram positives inoculées dans les sols sélectionnés. Dans tous les cas, les échantillons de sol ont été séchés et passés au tamis comme décrit ci dessus.
is Après broyage, 0,5 ml de tampon TENP ont été ajoutés à 200 mg poids sec de sol excepté pour le protocole 1 dans lequel le tampon a été ajouté à un sol non broyé).
Pour les divers traitements de lyse (voir ci-dessous), les suspensions de sol ont été passées au Vortex pendant dix minutes et 2o centrifugées (4000 g pendant cinq minutes), après quoi une fraction aliquote (25 p1) du surnageant a été analysée par électrophorèse sur gel (0,8% d'agarose). ' Une autre fraction aliquote du surnageant représentant un volume connu, généralement 350 p1, a été précipitée avec de 2s l'isopropanol.
Cinq fractions aliquotes (représentant de l'ADN dérivé de 1 g de sol) ont été réunies et resuspendues dans 100 NI d'un tampon TE stérile (10 mM Tris, 1 mM EDTA, pH 8,0) avant purification (protocole D, voir ci-dessous) et quantification, soit par hybridation (Dot Blot) de l'ADN total, 3o soit par hybridation (Dot Blot) des produits d'amplification PCR (voir ci-dessous).
Les signaux d'hybridation ont été quantifiés par imagerie par phosphorescence (technique de " phospho-imaging " voir ci-dessous).

1.5 EVALUATION DES METHODES DE LYSE CELLULAIRE IN SITU:
La qualité et la quantité de l'ADN extrait après un nombre croissant d'étapes de traitement de lyse (protocole 2-5b) ont été comparées à
celles de l'ADN extracellulaire obtenu après lavage du sol avec un s tampon d'extraction (protocole 1; voir aussi figure 1).
Protocole 1: Pas de traitement de Iyse.
Le tampon TENP a été ajouté à un sol non broyé, une étape 1o d'extraction d'ADN a été réalisée comme décrit ci-dessus.
Protocole 2. Broyage du sol suivi d'une extraction d'ADN.
Deux types de dispositifs différents ont été utilisés pour le is broyage du sol.
Afin de comparer leur efficacité respective, 5g de sol sec ont été broyés pendant 30 secondes dans un broyeur contenant des anneaux de tungstène, ou pendant des temps variés jusqu'à 60 minutes dans un broyeur de sol contenant un mortier et des billes en agate (20 2o mm de diamètre).
Le tampon TENP est ensuite ajouté et l'ADN est extrait comme décrit ci-dessus.
Les résultats d'électrophorèse sur gel ont montré qu'un broyage de 40 minutes en utilisant des billes en agate étaient nécessaires afin 2s d'obtenir des quantités d'ADN extraits équivalentes à celles obtenues après 30 secondes de broyage en utilisant des anneaux de tungstène.
La distribution de taille des fragments d'ADN est similaire quelle que soit la méthode employée.
Ainsi, ces traitements ont été considérés comme équivalents et 3o celui qui sera utilisé dans les protocoles décrits ci-dessous ne sera en conséquence pas spécifié.
Dans les protocoles 3 à 5, l'efficacité de plusieurs autres traitements de lyse ultérieure au broyage du sol a été testée, soit séparément, soit dans différentes combinaisons.

6s Protocole 3:
Ce protocole est identique au protocole 2 , sauf qu'il comprend une étape d'homogénéisation à l'aide d'un mixeur de type Ultraturrax s (tanker et Kunkel, IKA Labortechnik, Allemagne) réglé à la moitié de la vitesse maximale pendant 5 minutes.
PROTOCOLES 4a et 4b:
1o Ces protocoles sont identiques au protocole 3 à .l'exception d'une étape additionnelle de sonication.
Deux types de dispositifs sonicateurs ont été comparés : un sonicateur à micropointe de titane (600W Vibracell Ultrasonicator, Bioblock, Illkirch, France) (Protocole 4a) et un sonicateur de type Cup ts Horn (protocole 4b).
La micropointe Vibracell produisant des ultrasons est en contact direct avec la solution de sol.
En ce qui concerne le dispositif de type Cup Horn, la solution de sol est conservée dans des tubes qui sont placés dans un bain d'eau à
2o travers lequel passent les ultrasons.
Des expériences préliminaires ont été réalisées afin de déterminer les conditions optimales pour les deux sonicateurs (résultats non présentés).
Le meilleur compromis, en terme de quantité d'ADN extrait et 2s de taille de fragments, consiste en une sonication avec la micropointe de titane et le sonicateur de type Cup Horn respectivement pendant 7 et 10 minutes, en réglant la puissance à 15 W et avec des cycles actifs à 50%.
Protocoles 5a et 5b:
Après sonication avec une micropointe de titane ou un dispositif de type Cup Horn (respectivement protocoles 4a et 4b) du lysozyme et de l'achromopeptidase ont été ajoutés, chacune des enzymes à une concentration finale de 0,3 rüg/ml.

Les suspensions de sol ont été incubées pendant 30 minutes à
37°C, après quoi du lauryl sulfate à une concentration finale de 1 % a été ajouté, puis des suspensions ont été incubées pendant 1 heure à
60°C avant centrifugation et précipitation comme décrit ci-dessus.
s En plus des protocoles décrits ci-dessus, l'effet de la sonication (Cup Horn, voir protocole 4b) et de chocs thermiques (30 secondes dans l'azote liquide suivi de trois minutes dans l'eau bouillante, les traitements étant répétés trois fois ) sur l'ADN de phage lambda digéré par Hindlll préalablement ajouté au sol ont été examinés (voir ci-après).
io Des chocs thermiques ont été suggérés dans l'état de la technique comme des moyens de lyse cellulaire in situ (PICARD et al.
(1992)).. Cependant, du fait qu'un tel traitement a un effet préjudiciable sur l'ADN libre (voir la section résultats) il n'a pas été
inclus dans les protocoles décrits ci-dessus.
is PROTOCOLE OPTIMISE
Après évaluation des différents traitements de lyse, un protocole optimisé a été défini, désigné protocole 6. Le protocole 6 est 2o identique au protocole 5b excepté que, avant la sonication, les suspensions de sol sont soumises à un traitement par Vortex puis agitées par rotation sur une roue pendant deux heures avant d'être congelées à - 20°C.
Après décongélation, les suspensions de sol sont passées au 2s Vortex pendant 10 minutes avant sonication. Le protocole 6 a été utilisé
dans les expériences dans lesquelles les sols ont été ensemencés avec des cellules bactériennes ainsi que dans les expériences dans lesquelles les actinomycètes indigènes ont été quantifiés (voir ci-dessous).
30 1.6 COMPTAGE AU MICROSCOPE: L'efficacité du broyage du sol comme méthode pour lyser des cellules bactériennes a été examinée au microscope.
5g de sol brut séché ont été mélangés dans un dispositif de type Waring Blender avec 50 ml d'eau stérilisée ultrapure pendant 1,5 3s minutes; simultanément, 1g (poids sec) de sol broyé (protocole n°2) a été mis en suspension dans 10 ml par agitation pendant 10 minutes. Les suspensions de sol ont fait l'objet de dilutions en séries et de l'acridine orange a été ajoutée à une concentration finale de 0,001 %.
Après 2 minutes, les suspensions ont été filtrées à travers une s membrane de marque NUCLEOPORE de type 0,2 Nm black. Chaque filtre a été rinçé avec de l'eau stérile lysée, traitée avec 1 ml d'isopropanol pendant 1 minute afin de fixer les cellules bactériennes, puis rincé de nouveau.
Les cellules bactériennes ont été comptées à l'aide d'un 1o microscope a épifluorescence du type Zeiss Universal avec un objectif 100x. Pour chacun des types de sol, trois filtres ont été 'comptés, et au moins 200 cellules ont été comptées sur chacun des filtres.
1.7 NUMERATION DES ACTINOMYCETES CULTIVABLES ET
1s NOMBRE TOTAL D'UNITES FORMANT COLONIES (CFU): Les actinomycètes ayant survécu aux traitements de lyse (protocoles 1-5) ont été examinés spécifiquement avec le sol n°3 (Côte Saint André, voir tableau 1 ).
Après une dilution de 10 fois d'une solution d'extrait de levure 20 (6% poids/volume) et de SDS (0,05%) afin d'induire la germination (Hayakawa et al. (1988)), les suspensions de sol ont été diluées en séries dans de l'eau stérile, incubées à 40°C pendant 20 minutes et ensemencées sur du milieu HV (HAYAKAWA et al., 1987).
Le milieu HV a été additionné de actidione (50 mg/I) et de 2s nystatine (50 mg/ml).
Les colonies d'actinomycètes ont été comptées après incubation pendant 15 jours à 28°C.
Au total, environ 400 colonies ont été examinées.
L'identification a été réalisée sur la base des caractéristiques 3o morphologiques macro-et microscopiques ainsi que sur l'analyse de la teneur en acide diaminopimélique des isolats (SHIRLING et al., 1966);
STANECK et al., 1974; WILLIAMS et a1.,1993).
La quantité totale de bactéries cultivables (CFU totales) a été
également déterminée pour chacun des protocoles de lyse 1 à 5. Les 3s suspensions de sol ont été diluées en série et ensemencées en triple sur un milieu agar Bennett (WAKSMAN et al., 1961 ) additionné de nystatine et d'actidione (chacune à 50 mg/I).
Chaque boîte de Pétri a été couverte d'un filtre de nitrate de cellulose (Millipore) et incubée pendant trois jours à 28°C. Après la s numération des colonies sur les membranes, les filtres ont été retirées et les boîtes de Pétri ont été à nouveau incubées pendant 7 jours à 28°C
puis comptées à nouveau.
1.8 RECUPERATION DE L'ADN DE PHAGE LAMBDA AJOUTE AUX
1o SOLS: L'ADN de phage lambda a été digéré avec Hindlll, extrait par un mélange de phénol-chloroforme, précipité puis resuspendu dans de l'eau stérile ultrapure selon des protocoles standard (SAMBROOK et a1.,1989).
Des dilutions correspondant respectivement à 0, 2,5, 5, 7,5, 10 is et 15 Ng d'ADN/g de poids sec de sol ont été préparées dans des volumes de 60 p1. Ces dilutions d'ADN ont été ajoutées à des lots de 5g de sol sec qui ont été subséquemment vigoureusement mélangés par vortex pendant 5 minutes avant broyage.
L'ADN de phage lambda a aussi été ajouté à un sol avant 2o broyage à des concentrations correspondant à 0, 10 et 15 pg d'ADN/g de poids sec du sol.
Après broyage, le tampon d'extraction est ajouté et l'ADN est extrait selon le protocole 2(voir ci-dessus).
2s 1.9 SATURATION DES SITES D'ADSORPTION AVEC DE L'ARN: Afin de déterminer si la saturation des sites d'adsorption d'acides nucléiques des colloïdes du sol pouvait augmenter le taux de récupération de l'ADN, le terreau sablonneux (sol n°4) et le sol argileux (sol n°5) ont été
incubés avec une solution d'ARN avant tout autre traitement.
3o De l'ARN commercial de Saccharomyces cerevisiae (BOHRINGER MANNHEIM, MEYLAN, France) a été dilué dans du tampon phosphate (pH 7,1 ) et ajouté aux échantillons de sol sec et tamisés (2 ml/g de sol) à des concentrations finales de 20, 50 et 100 mg d'ARN/g de poids sec du sol.

Les tubes contenant les suspensions de sol ont été agités par rotation pendant deux heures à température ambiante. Après centrifugation, les culots de sol ont été séchés au four (50°C) pendant la nuit. L'ADN de phage lambda a ensuite été ajouté aux sols (0, 20 ou 50 s Ng/g de poids sec du sol) afin de simuler le sort de l'ADN libéré après lyse cellulaire.
L'ADN a été extrait selon le protocole n°2. II a été déterminé par la suite qu'un effet identique de l'addition d'ARN sur la récupération .
d'ADN pouvait être atteint en ajoutant l'ARN directement au tampon io d'extraction.
Cette procédure simplifiée a été utilisée pour le sol argileux n°5 dans les expériences dans lesquelles les micro-organismes ont été
inoculés dans les sols.
L'ARN a ensuite été ajouté à une concentration correspondant is à 50 mg d'ARN/g de poids sec du sol.
1.10 DETERMINATION . QUALITATIVE ET QUANTITATIVE DE
L'EFFICACITE DES PROTOCOLES D'EXTRACTION: La qualité de l'ADN (absence de dégradation) a été estimée sur la base de la taille des 2o fragments d'ADN ou de la position relative des bandes de migration d'ADN après électrophorèse d'une fraction aliquote d'une solution d'ADN
sur un gel d'agarose à 0,8%.
L'intensité de fluorescence a permis une estimation semi-quantitative des rendements d'extraction.
2s Une autre fraction aliquote a été utilisée pour des déterminations quantitatives de la teneur en ADN par hybridation (Dot Blot) et analyse au phospho-Imager. Le protocole d'hybridation sur tache a été décrit par SIMONET et al. (1990).
Les membranes d'hybridation (GeneScreen plus, Life Science 3o Products, Boston, Etats-Unis d'Amérique) ont été préhybridées pendant au moins 2 heures dans 20 ml d'une solution contenant 6 ml de 20 x SSC, 1 ml de solution de DENHARDT's, 1 ml de SDS à 10% et 5 mg d'ADN de sperme de saumon.
L'hybridation a été réalisée pendant une nuit dans la même 3s solution en présence d'une sonde marquée préalablement à deux lavages des membranes dans un tampon SSC 2 x pendant 5 minutes à
température ambiante, puis un troisième lavage dans du tampon SSC 2 x, SDS 0,1% et un quatrième lavage dans du tampon SSC 1 x, SDS
0,1% pendant 30 minutes à la température d'hybridation.
s Les signaux d'hybridation ont été quantifiés avec un système d'imagerie radioanalytique BIORAD (Molecular Analyst Software, BIORAD, Ivry S/Seine, France).
Afin de quantifier la quantité totale d'ADN dérivée de la microflore indigène, les différents sols ont été extraits selon les io protocoles n°1 à 5. L'ADN non amplifié a été appliqué sur les membranes de Dot Blot et hybridé' en utilisant la sonde universelle FGPS431 (tableau 2).
Cette sonde, qui hybride aux positions 1392-1406 du gène de l'ADNr 16S de E.coli (Amann et al. (1995)) a été marquée à ses 1s extrémités avec un ATPa32P en utilisant une polynucléotide kinase T4(BOEHRINGER MANNHEIM, Melan, France).
Une courbe de calibration a été préparée à partir de l'ADN de E.coli DHSa. La conversion des calculs aux bactéries du sol a nécessité
une simplification, partant de l'hypothèse que le nombre de copies 2o moyen (rrn) est de 7, comme pour E.coli.
L'ADN de phage lambda digéré par Hindlll a été utilisé pour quantifier la récupération de l'ADN extracellulaire. Des extraits non amplifiés à partir de sols, auxquels de l'ADN de phage lambda avait été
ajouté, ont été hybridés avec de l'ADN de phage lambda digéré par 2s Hindlll marqué au hasard en utilisant le fragment Klenow (B~ehringer Mannheim, Melan, France).
Les quantités d'ADN ont été calculées par interpolation à partir d'une courbe de calibration préparée avec l'ADN purifié.
La quantité totale d'ADN extrait à partir des sols n°1, 2, 3, 4 et 3o selon le protocole n°2 (broyage) a également été quantifiée de manière colorimétrique selon la technique décrite par RICHARD (1974).
Brièvement, de l'ADN a été mélangé avec du HC104 concentré
(la concentration finale de HC104 était de 1,5 N). On a mélangé 2,5 volumes de cette solution avec 1,5 volumes de DPA (diphénylamine, 3s Sigma-Aldrich, France) et laissé incuber le mélange à la température 7l ambiante pendant 18 heures, préalablement à la détermination de la DO
à 600 nn. Les extraits d'ADN du sol ont été quantifiés par rapport à une courbe standard réalisée par l'ADN extrait à partir de E.coli DHSa selon les protocoles standards (SAMBROOK et al., (1989)).
1.11 DEVELOPPEMENT D'UNE TECHNIQUE DE QUANTIFICATION
D'ADN EN UTILISANT L'AMPLIFICATION PCR ET L'HYBRIDATION:
Pour les amplifications par PCR, de l'ADN polymérase Taq (Appligene Oncor, France) a été utilisé selon les instructions du fabricant.
io , Le programme PCR utilisé pour toutes les amplifications est le suivant: dénaturation initiale pendant 3 minutes à 95°C, puis 35 cycles consistant en 1 minute à 95°C, 1 minute à 55°C et 1 minute à
72°C, suivie par une extension finale à 72°C pendant 3 minutes.
L'ADN isolé et purifié à partir de Streptosporangium fragile a été
1s utilisé comme témoin à des concentrations allant de 100 fg à 100 ng.
Afin d'amplifier spécifiquement l'ADN de ce genre bactérien, on a choisi les amorces FGPS122 et FGPS350 (tableau 2), complémentaires à une partie de l'ADNr 16S, après alignement des séquences d'ADNr 16S d'actynomycètes. Leur spécificité a été testée 2o sur une collection de souches d'actynomycètes (Streptomycès, Streptosporangium et d'autres genres fortement apparentés).
Les produits de PCR ont été hybridés avec la sonde oligonucléotidique FGPS643 (tableau 2). Afin de simuler le niveau de pureté obtenu en routine avec de l'ADN extrait à partir du sol, des 2s témoins d'ADN pur de S. fragile ont été mélangés avec les extraits de sol obtenus après des traitements selon les protocoles de lyse 4b et 5b puis purifiés selon le protocole D.
Avant utilisation, les extraits de sol ont été traités avec de la DNase (une unité de DNase/ml, GIBCO BRL) pendant 30 minutes à
3o température ambiante. La DNase a ensuite été inactivée par chauffage à
65°C pendant 10 minutes. Une vérification de l'inactivation a été
réalisée par PCR. Les concentrations d'acides humiques ont été mesurées par spectrophotométrie (D028onm) contre une courbe standard d'acides humiques commerciaux (Sigma).

Des solutions de sol traitées à la Dnase non diluées, diluées 10x et diluées x 100 ont été mélangées de 100. fg à 100ng d'ADN de S.
fragile avant l'amplification par PCR. Dans une autre série d'expériences, les concentrations croissantes d'ADN de Streptomyces s hygroscopicus de (100 pg à 1 Ng) ont été ajoutées à l'ADN de S. fragile afin de simuler la présence d'ADN non-cible et son influence sur le procédé PCR.
1.12 PURIFICATION DES EXTRAITS D'ADN BRUT: Quatre méthodes io de purification d'ADN ont été comparées. L'ADN a été extrait à partir de 1 g (poids sec de sol selon le protocole 4a et remis en suspension dans 100 NI de tampon TE8 (50 mM Tris, 20 mM (EDTA, pH 8,0).
Protocole A
~s Elution à travers deux colonnes successives Elutip d (SCHLEICHER et SCHUELL, Dassel, Allemagne) (PICARD et al., (1992)).
2o Protocole B:
Elution à travers une colonne SEPHACRYL S200 (Pharmacia Biotech, Uppsala, Suède) suivie d'une élution à travers une colonne Elutip d (NESME et al. (1995)).
2s Protocole C:
Séparation à l'aide d'un système aqueux à deux phases avec 17,9% (poids/poids) de PEG 8000 (Merck, Darmstadt, Allemagne) et 30 14,3% (poids/poids) de (NH4)2S04(ZASLAVSKY,(1995)).
Après un mélange vigoureux au vortex, les deux phases ont été
laissées à température ambiante pour leur séparation.
1 ml de chacune des phases a été transféré dans un autre tube, mélangé avec 100p1 de l'échantillon et laissé à 4°C pendant une 3s nuit pour permettre la séparation.

La phase inférieure a été dialysée pendant une heure à travers une membrane Millipore en présence d'un excès d'un tampon TE 7,5 (10 mM Tris, 1 mM EDTA à pH 7,5 et 1 M Mg C12) afin d'éliminer les sels en excès.
s Protocole D:
Elution à travers une colonne de type Microspin Sephacryl S400 HR (Pharmacia Biotech, Uppsala, Suède) , suivie d'une élution à
io travers une colonne de type Elutip d.
Chaque protocole est terminé par une étape de précipitation à
l'éthanol, et l'ADN est remis en suspension dans 10 NI de tampon TE
7,5. L'efficacité des protocoles de purification a été vérifiée par amplification PCR de fractions aliquotes non diluées des solutions d'ADN
is et de fractions aliquotes diluées 10 et x 100 fois, en utilisant des protocoles standard (voir ci-dessous).
1.13 RECUPERATION DE L'ADN A PARTIR DE MICROORGANISMES
INNOCULES:
2o Les cellules, spores et hyphae ont été lavées deux fois et dénombrées par comptage sur plaque ou comptage microscopique direct. Des lots de 5g de sol sec et tamisé (sols n°2, 3 et 5) ont été inoculés avec 100 p1 d'une suspension de spores et d'hyphae de S. lividans à des concentrations correspondànt à 0,103, 105, 10' et 109 spores/g de poids 2s sec de sol, ou avec des cellules végétatives de B.anthracis à des concentrations correspondant à 0,10' et 109 cellules par gramme de poids sec du sol.
Les quantités de hyphae de S. lividans ont été calculées sur la base du nombre de spores desquelles elles sont originaires. Après 3o addition des suspensions ~ bactériennes, les échantillons de sol sont mélangés vigoureusement par vortex pendant 5 minutes avant broyage.
L'ADN est extrait selon le protocole n°6 (voir ci-dessous).
L'amplification PCR suivie d'une hybridation sur tache (Dot Blot) et imagerie par phosphorescence (phospho-imaging) a été utilisée afin de quantifier les quantités d'ADN récupérées à partir des cellules, des spores et du mycélium bactérien inoculé dans les sols.
L'extraction d'ADN a été réalisée selon le protocole de lyse n°6.
L'amplification PCR et l'hybridation ont été réalisées comme décrit ci s dessus. Les amorces et les sondes sont ciblées sur des régions chromosomiques localisées en dehors de la région 16S, et sont hautement spécifiques des organismes respectifs, de manière à éviter des signaux de bruit de fond.
Pour les sols ensemencés avec 8. anthracis, les amorces 8499 io et 8500 ont été utilisées (Patra et al. (1996)) et les produits d'amplification ont été hybridés avec la sonde oligonucléotidique C501 (tableau 2).
Pour les sols ensemencés avec S. lividans , les réactions PCR
ont été réalisées en utilisant les amorces FGPS516 et FGPS517, et les ts produits d'amplification ont été hybridés avec la sonde oligonucléotidique FGPS518 (tableau 2).
La région amplifiée est une partie de la cassette construite spécifiquement pour obtenir la souche OS48.3 (CLERC-BARDIN et al., non publié).
2o Les comptes de calibration ont été dans tous les cas obtenus en utilisant l'ADN purifié de~l'organisme cible.
2. RESULTATS
25 2.1 CHOIX DU TAMPON D'EXTRACTION:
20 sols différents ont été utilisés afin de déterminer le pH optimal du tampon d'extraction d'ADN. Pour tous les sols, le rendement en ADN
augmente avec les pH croissants du tampon. Le rendement pour chaque 3o pH (+/- sd), calculé comme le pourcentage de la valeur la plus haute pour chacun des sols, est le suivant: pH 6,0 : 31 +/- 13; pH 7,0: 43 +/-16; pH 8,0: 60 +/- 14; pH 9,0: 82 +/- 12; pH 10,0: 98 +/- 3.
Pour 16 des 20 sols, le rendement le plus élevé a été obtenu à
3s pH 10,0, alors que pour les quatre autres sols le plus haut rendement a été obtenu à pH 9,0. Cependant, à pH 10,0, des quantités plus grandes de matériel humique ont été libérées, comparées à pH 9,0 (résultats non présentés). En conséquence, le pH 9,0 a été choisi pour toutes les expériences présentées ci-dessous.

2.2 EFFICACITE DES PROTOCOLES D'EXTRACTION D'ADN:
L'ADN total des organismes indigènes du sol a été extrait et quantifié de manière à évaluer l'efficacité de nombreux protocoles de lyse cellulaire io in situ. Des échantillons des sols 1-6 (tableau 1) ont été traités selon les protocoles n°1 à 5 décrits dans la section Matériel et Méthodes (figure 1 ). .
Après l'extraction d'ADN, les suspensions de sols ont été
précipitées avec de l'isopropanol, et des fractions aliquotes des culots is remis en suspension ont été analysées par électrophorèse sur gel , dans une première étape, afin d'estimer la qualité et la quantité de l'ADN
libéré.
Cependant, la couleur de l'extrait d'ADN devenait de plus en plus sombre au fur et à mesure du nombre croissant d'étapes de lyse, 2o du fait de la co-extraction de composés, tels que les acides humiques, avec l'ADN.
Certains de ces extraits bruts de couleur sombre ne migrent pas de la manière attendue dans les gels d'agarose.
En conséquence, les solutions d'ADN brut ont été purifiées 2s (protocole B) avant quantification. Les électrophorèses sur gel des solutions purifiées obtenues après les différents traitements de lyse sont exemplifiées sur le sol n°3 (figure 2).
Une comparaison visuelle au rayonnement ultra-violet des intensités de l'ADN coloré a permis une estimation semi-quantitative de 30 l'efficacité des traitements. De plus, la présence de profils de migration de tailles multiples de fragments (bandes discrètes) d'ADN et la disparition des fragments longs indique qu'une dégradation de l'ADN a eu lieu.
Aucun ADN n'a pu être extrait du sol argileux n°5.

Une quantification plus précise de l'ADN de tous les sols, extrait selon les protocoles n°1 à 5, a été réalisée par hybridation sur tache (Dot Blot) sans étape d'amplification PCR préalable et en utilisant une sonde oligonucléotidique complémentaire d'une séquence hautement s conservée de la région d'ADNr 16S (sonde FGPS 431, tableau 2).
L'ADN a été détecté dans les extraits de tous les sols après chacune des différentes étapes de lyse, à l'exception du sol argileux n°5.
Les résultats concordent avec les estimations réalisées après gel d'électrophorèse.
io Afin de comparer avec une méthode indépendante pour la quantification, l'ADN extrait selon le protocole n°2 (tous les sols sauf le sol n°5) a été également quantifié en utilisant une méthode colorimétrique de détection de l'ADN (RICHARD, 1974).
On a trouvé une bonne corrélation (r = 0,88) entre l'ADN
is quantifié en utilisant cette technique colorimétrique et les résultats obtenus par hybridation de type Dot Blot/radio-imagerie, confirmant l'hypothèse selon laquelle le nombre de copies moyen des bactéries du sol (rrn) est de 7.
L'hybridation (Dot Blot) a montré que les quantités d'ADN
2o extracellulaires, comme déterminé par extraction sans traitement de lyse (protocole n°1), allait de 4Ng/g pour le sol acide (n°6) à 36 Ng/g pour le sol n°3 (tableau 3).
Le broyage du sol (protocole n°2 ) a augmenté les quantités d'ADN extrait à partir de tous les sols (p.ex. 26 Ng/g de sol) pour le sol 2s n°6 et 59 Ng/g de sol (pour le sol n°3) (tableau 3; figure 2).
Pour les deux traitements de broyage (voir la section Matériel et Méthodes) la migration discrète d'ADN a été détectée sur les gels d'agarose, indiquant que les molécules d'ADN ont été partiellement dégradées (figure 2).
3o La taille des fragments d'ADN est comprise entre 20 et 0,2 kb.
L'intensité de bande des fragments les plus petits est très faible, indiquant que la majeure partie des fragments ont une taille bien supérieure à 1 kb.
Le protocole n°3 comprend une étape d'homogénéisation dans 3s un dispositif mixeur de type Ultraturax après l'addition du tampon d'extraction aux échantillons de sol. Cette étape conduit à une augmentation des quantités d'ADN extrait, comme déterminé par hybridation sur tache (Dot Blot) pour deux des sols (le terreau sablonneux n°3 et le sol acide n°6), alors que les deux sols riches en s matière organique (sols n°1 et n°2) ont conduit à l'obtention de quantités plus faibles d'ADN.
Les protocoles n°4a et n°4b ont permis d'évaluer l'influence de deux types de sonication sur les rendements en ADN à partir de sols préalablement broyés et homogénéisés .
io La sonication n'a pas eu d'effet positif sur le rendement en ADN, comparé au protocole n°3, excepté pour le sol n°6.
Toutefois, l'efficacité de lyse des deux types de sonicateur diffèrent. Pour les sols n°2, 3 et 4, les quantités d'ADN extraits les plus grandes ont été
obtenues en utilisant la micropointe de titane (tableau 3; figure 2), alors is que pour les sols n°1 et n°6, le rendement en ADN était supérieur en utilisant le dispositif Cup Horn.
Des résultats contradictoires ont été également obtenus lorsque l'on a ajouté une étape de lyse enzymatique/chimique (protocoles n°5a et 5b) après l'étape de sonication: dans certains cas, les quantités 2o d'ADN extraites ont été plus grandes que celles récupérées selon les protocoles n°4a et 4b, alors que dans d'autres cas les rendements étaient moindres (tableau 3).
2.3 COMPTAGE DIRECT DES MICRO-ORGANISMES:
2s Des comptes au microscope du nombre total de cellules bactériennes après coloration à l'acridine orange ont été réalisés pour tous les sols, avant et après broyage.
Avant broyage, le nombre de bactéries par gramme de poids 3o sec du sol allait de 1,4 x 109 (+/- 0,4) dans le sol tropical n°5 à
10 x 109 (+/- 0,7) dans le sol provenant de la Côte Saint-André (sol n°3) (tableau 1 ).
Après broyage, les nombres de cellules ont été respectivement de 45, 74, 75, 54, 34 et 75% des valeurs initiales pour les sols n°1 à
6.
3s 2.4 NUMERATION DES ACTINOMYCETES CULTIVABLES
APPARTENANT A DIFFERENTS GENRES:
Une modification dans les populations d'actinomycètes dans le sol n°3 a s été remarquée après les différents traitements de lyse (figure 3).
Par exemple, les colonies de Streptomyces sp. dominaient la flore viable d'actinomycètes lorsqu'aucun traitement de lyse n'est appliqué (protocole n°1), et représentaient 65% du nombre total de colonies identifiées. Après broyage, le pourcentage de colonies de io Streptomyces a diminué pour atteindre 51 %, alors que la proportion de colonies appartenant au genre Micromonospora a augmenté de 14% à
41 %.
La lyse chimique/enzymatique (protocoles 5a et 5b) est apparue comme particulièrement efficace pour la lyse des 1s streptomycètes. Lorsque tous les traitements de lyse ont été appliqués, y compris une lyse chimique/enzymatique (protocoles 5a et 5b), la microflore d'actinomycètes, qui comprenait encore plus de 106 CFU/g de sol, était dominée par les espèces appartenant au genre Micromonospora, alors qu'aucune ou très peu de colonies de 2o Streptomyces ont été récupérées.
Les organismes appartenant aux genres tels que Strepfosporangium, Actinomadura, Microbispora, Dactilosporangium et Actinoplanes sont apparus sur les plaques en faible nombre (2-8% du nombre total de colonies identifiées) après broyage, homogénéisation 2s avec le dispositif Ultraturrax, et sonication, mais étaient généralement absents lorsque ces traitements étaient combinés avec une lyse chimique/enzymatique.
Le nombre total de bactéries cultivables restant après chaque traitement de lyse (protocoles 2 à 5) a été aussi recherché pour le sol 3o n°4. Les résultats indiquent que le nombre de bactéries cultivables ne décroît pas avec l'intensité des traitements de lyse (environ 2 x 106 CFU/g de sol dans tous les cas, et également lorsqu'un traitement n'est appliqué, tel que selon le protocole n°1).
L'obtention de ces faibles valeurs de CFU est probablement 3s due au fait que du sol sec a été utilisé et que seules les bactéries les plus résistantes se sont multipliées sur les plaques. Le nombre d'actinomycètes formant colonies était généralement plus grand que celui des CFU total (toutes les bactéries) du fait qu'une étape de germination de spores, comprise dans le protocole de détection des s actynomycètes, manquait lors du contrôle des bactéries totales.
2.5 RECUPERATION DE L'ADN DU PHAGE LAMBDA AJOUTE:
Le but de ces expériences était d'estimer de quelle manière des io traitements de lyse successifs pouvaient affecter la récupération d'ADN
nu , et si ces traitements successifs 'de lyse contribuaient à sa dégradation.
L'ADN pouvait être soit une fraction d'ADN extracellulaire libérée à partir d'organismes déjà morts, qui peuvent persister dans le 1s sol pendant des mois (WARD et al., 1990), soit de l'ADN libéré à partir d'organismes lysés facilement pendant les premières étapes du traitement. Afin de simuler cette situation, de l'ADN de phage lambda digéré par Hindlll a été ajouté, à diverses concentrations, aux sols avant et après broyage. En plus du broyage, une combinaison des autres 2o traitements de lyse a été testée, y compris la sonication (dispositif Cup Horn, voir protocole n°4b) et des chocs thermiques (voir la section Matériel et Méthodes).
Après extraction, des fractions aliquotes qui devraient théoriquement contenir de 25 à 150 ng d'ADN de phage lambda ont été
2s analysées par électrophorèse sur gel. Aucun fragment d'ADN spécifique du phage lambda n'a pu être observé lorsque l'ADN a été inoculé dans les échantillons de sol préalablement au broyage, indépendamment de la dose ou du type de sol.
Lorsque l'ADN a été ajouté après broyage, et extrait sans étape 3o de traitement de lyse additionnelle, les profils spécifiques d'ADN de phage lambda ont été détectés dans les extraits de quatre des cinq sols testés. .
Dans tous ces cas, une relation directe de cause à effet a été
obtenue entre la quantité d'ADN ajoutée et l'intensité des signaux sur les 3s gels d'agarose. Les intensités des signaux étaient, cependant, inférieures aux intensités de signaux attendues si on les compare à
celles des standards moléculaires.
De plus, la bande à 23 kb était absente dans plûsieurs cas, indiquant que les longs fragments étaient préférentiellement adsorbés s aux particules du sol, ou étaient plus sensibles à la dégradation, comparés aux fragments courts.
Aucune bande n'a été détectée dans les échantillons de sol tropical n°5 qui est caractérisé par une très haute teneur en argile (tableau 1 ).
io Pour une quantification plus précise, la récupération d'ADN a été déterminée sur un dispositif d'imagerie par phosphorescence (phospho-imager) après hybridation en tache (Dot Blot). Selon cette technique, l'ADN a été détecté dans tous les échantillons, y compris ceux qui avaient été inoculés avant broyage, à l'exception du sol n°5 is dans lequel aucun ADN n'a pu être détecté.
Dans tous les autres sols, la quantité d'ADN extrait augmente avec l'augmentation de taille de l'inoculum (figures 4a-d).
Cependant, les récupérations d'ADN de phage lambda étaient faibles. Lorsque le broyage était le seul traitement de lyse appliqué, les 2o récupérations étaient comprises entre 0,6 et 5,9% de l'ADN ajouté
lorsque celui-ci était ajouté avant broyage, et de 3,6 à 24% de l'ADN
ajouté lorsque ce dernier était ajouté après broyage. Les plus hauts niveaux de récupération ont.été obtenus à partir du sol n°2.
L'électrophorèse sur gel de fractions aliquotes d'échantillons 2s traités par choc thermique et sonication n'a permis d'observer des bandes d'ADN dans aucun des échantillons, y compris l'essai dans lequel l'ADN avait été ajouté après broyage. Les expériences d'hybridation en tache (Dot Blot) ont confirmé ces résultats.
Les signaux d'hybridation obtenus à partir de suspensions de 3o sol qui ont été traitées par chocs thermiques et sonication ont été, tout au plus, faibles.
L'échantillon présentant la plus forte quantité d'ADN (15 Ng d'ADN/g de poids sec du sol) était le seul pour lequel le signal obtenu était sensiblement différent du niveau du bruit de fond.

Aucune différence,( ou de faibles différences) n'a été observée entre les échantillons traités par choc thermique et ceux traités par chocs thermiques et sonication, indiquant que les chocs thermiques ont un effet préjudiciable sur l'ADN. Les récupérations les meilleures ont été
s observées pour le sol n°2, qui a la plus forte teneur en matière organique (tableau 1 ), alors qu'aucun ADN n'a été récupéré à partir du sol argileux n°5:
Des expériences additionnelles ont été réalisées avec des échantillons non broyés de sols n°4 et n°5, qui ont été
ensemencés avec io 20 et 50 Ng d'ADN de phage lambda par gramme de sol.
Les échantillons ont été extraits immédiatement ou après une période d'incubation d'une heure à 28°C, puis les extraits d'ADN ont été
purifiés et analysés par électrophorèse sur gel.
L'incubation du sol n°4 pendant une heure après l'inoculation 1s n'a pas conduit à des profils qualitativement ou quantitativement différents de ceux obtenus sans incubation ou de ceux observés antérieurement lorsque l'ADN avait ajouté après broyage.
Ces résultats indiquent que la dégradation enzymatique par les nucléases du sol ne seraient pas impliquée dans le faible taux de 2o récupération d'ADN. De plùs, l'absence d'étape de broyage ne permet pas une augmentation de la récupération de l'ADN à partir du sol n°5, indiquant que les modifications de structure du sol dûes au broyage n'augmentent pas significativement l'adsorption des acides nucléiques sur les colloïdes.
2s 2.6 SATURATION DES SITES D'ADSORPTION AVEC L'ARN:
La plupart des profils obtenus sur les gels d'agarose ne diffèrent pas significativement des profils précédents dans lesquels le traitement 3o d'ARN n'a pas été effectué.
Par exemple, aucune bande n'a été détectée à partir du sol riche en argile n°5, indépendamment des concentrations d'ARN et des concentrations d'ADN de phage lambda utilisées.

De plus, les bandes spécifiques d'ADN de phage lambda digérées par Hindlll restaient indétectables dans le terreau sablonneux traité par l'ARN (sol n°4) lorsque l'ARN est ajouté avant le broyage.
L'intensité des bandes obtenues à partir d'échantillons s ensemencés avec l'ADN après broyage augmente avec la concentration d'ARN, indiquant que le traitement pourrait avoir un effet positif.
Cependant, les résultats après hybridation et analyse par imagerie à phosphorescence n'ont pas confirmé les résultats de l'électrophorèse. Par exemple, l'effet positif du traitement d'ARN sur la io récupération d'ADN à partir du terreau argileux, lorsque l'ADN a été
ajouté après broyage, n'apparaît pas clairement.
D'un autre côté, un effet positif de l'ARN a été trouvé pour le sol riche en argile (n°5) lorsque l'ADN a été ajouté après broyage.
Bien que les signaux d'hybridation pour les échantillons is contrôle ne diffèrent pas des niveaux de bruit de fond, des quantités significatives d'ADN ont été libérées à partir des échantillons traités par l'ARN, et les signaux ont augmenté avec la quantité d'ADN ajoutée ainsi qu'avec la concentration d'ARN.
Cependant, même pour la plus forte concentration d'ARN (100 2o mg/g de poids de sol sec) le taux de récupération n'a jamais dépassé
3%.
2.7 PURIFICATION DES EXTRAITS BRUTS D'ADN:
2s Des quatre protocoles testés, la meilleure amplification des extraits d'ADN non dilués (1 NI d'extrait dans 50 NI de mélange PCR) a été
observée après l'élution à travers des colonnes de type Microspin S400 suivie d'une élution à travers une colonne de type Elutip d, comme le montre l'électrophorèse sur gel des produits PCR.
3o L'ADN purifié par le système aqueux double phase (protocole C) a donné des quantités plus faibles de produits PCR après amplification à partir d'extrait d'ADN non dilué.
Aucun produit d'amplification n'a pu être obtenu à partir des extraits non dilués après amplification à la suite de la mise en oeuvre 3s des protocoles A ou B. En conséquence, le protocole B (voir section Matériels et Méthodes) a été utilisé pour toutes les expériences dans lesquelles les amplifications PCR etiou les hybridations sur tâche (Dot Blot) ont été réalisées.
s 2.8 QUANTIFICATION PAR PCR ET HYBRIDATION:
La première étape était de déterminer si les quantités de produit PCR
étaient proportionnelles au nombre de molécules d'ADN cibles initialement présentes dans le tube réactionnel. De l'ADN de io Streptosporangium fragile a été utilisé comme cible (voir section Matériels et Méthodes).
Les amorces utilisées ont été les amorces FGPS122 et FGPS350 (tableau 2). L'électrophorèse sur gel des produits PCR a montré que l'intensité de bande augmente avec l'accroissement de la is concentration des cibles. Les produits PCR ont été hybridés avec la sonde oligonucléotidique FGPS643 (tableau 2), et les signaux ont été
quantifiés par imagerie par phosphorescence (phospho-imaging).
On a trouvé une bonne corrélation (rz= 0,98) entre le log[nombre de cibles] et le log[intensité du signal d'hybridation].
2o On a ensuite recherché si l'efficacité de l'amplification PCR était affectée par les acides humiques et l'ADN non cible. Lorsqu'on l'analyse par électrophorèse sur gel, l'intensité accrue des bandes des produits PCR, correspondant aux différentes quantités d'ADN cible, était conservée lorsque l'amplification était réalisée avec des solutions d'ADN
2s auxquelles on avait ajouté des extraits de sol traités à la DNase, contenant des acides humides à des concentrations allant jusqu'à 8ng dans le mélange PCR d'un volume de 50 NI.
Avec 20 ng d'acide humique dans le mélange PCR, les bandes correspondant aux faibles niveaux d'ADN cible ont disparu, et à des 3o concentrations d'acide humique de 80 ng et à des concentrations supérieures, aucune bande n'était visible .
Les quantités variées d'ADN cible de S.fragile ont permis de fournir les quantités attendues de produit PCR lorsque, avant amplification, l'ADN de S. fragile a été mélangé avec de l'ADN de 3s Streptomyces hygroscopicus et ajouté au mélange PCR de 50 p1 dans une gamme de 100 pg à 1 Ng afin de simuler l'ADN non-cible libéré à
partir de la microflore du sol.
2.9 QUANTIFICATION DES ACTINOMYCETES INDIGENE DU SOL
s APRES DIFFERENTS TRAITEMENTS DE LYSE:
On a appliqué le protocole de purification D suivi d'une amplification par PCR comme décrit ci-dessus afin de quantifier les actinomycètes appartenant au genre Streptosporangium dans le sol n°3 après 1o extraction conformément aux protocoles n°1, 2, 3, 5a et 5b (figure 5).
Après broyage, (protocole n°2) la quantité d'ADN cible provenant de cet actinomycète a été estimée par hybridation (Dot Blot) et radio-imagerie comme étant de 2,5 +/- 1,3 ng /g de poids de sol sec.
Si l'on postule que le contenu en ADN est de 10 fg par cellule, Is comme pour Streptomyces (Gladek et al. 1984), cette valeur correspond à approximativement 2,5 x 105 génomes. Des valeurs similaires ont été
obtenues après les autres traitements de lyse (respectivement 2,6 +/-1,1 et 1,8 +/- 1,3 ng d'ADN/g de sol sec en utilisant respectivement les protocoles 3 et 4b).
2.10 EFFICACITE DE LA RECUPARATION D'ADN A PARTIR DE
SOLS PREALABLEMENT INOCULES AVEC DES BACTERIES:
Trois sols (n°2, 3 et 5) ont été inoculés avec des spores ou des hyphae 2s de Streptomyces lividans à différentes concentrations (voir section Matériel et Méthodes). Les quantités de mycélium ajoutées au sol (figure 6b) correspondent au nombre de spores inoculées dans le milieu de germination. Approximativement 50% de ces spores ont germé. Le nombre exact de cellules dâns les hyphae des spores germinées n'a pas ~o été déterminé. En conséquence, les quantités de spores et de mycélium ensemencées dans les sols ne sont pas directement comparables.
Pour chaque échantillon de sol, le protocole d'extraction n°6, la méthode de purification D, et l'amplification PCR combinée avec l'hybridation sur tache (Dot Blot) et l'imagerie par phosphorescence 3s (phospho-imaging) ont été utilisés pour dénombrer les ADNs cibles spécifiques qui avaient été libérés. L'ADN extrait peut être clairement distingué du bruit de fond seulement lorsque le nombre de spores ajoutées dépasse 105 pour les sols n°3 et n°5 et 10' pour le sol n°2 (figure 6a).
s Lorsque le mycélium est ajouté, l'ADN extrait peut être détecté
au-delà d'une quantité correspondant à 103 spores/g de sol pour les sols n°2 et n°3, et au-delà de 10' spores/g pour le sol n°5 (figure b).
Au-dessus du niveau de détection, le signal d'hybridation augmente avec des quantités croissantes des cellules inoculées.
io Pour l'inoculum de spores, une augmentation de 100 fois dans le nombre de cellules ensemencées conduit à une augmentation de presque 100 du rendement d'ADN. Cette augmentation est clairement inférieure lorsque les hyphae sont inoculées, particulièrement dans les sols n°2 et n°3 (figure 6).
1s Au contraire, les résultats obtenus lorsque l'ADN de phage lambda a été utilisé comme inoculum, l'ADN a également été récupéré à
partir du sol riche en argile (n°5) lorsque les cellules bactériennes ont été
utilisées comme inoculum. Cependant, pour ce dernier aussi, le traitement par l'ARN a augmenté la récupération d'ADN de 2o Streptomyces à partir de ce sol à la fois pour les spores et le mycélium (figure 6).
Le fait d'ensemencer des sols avec des cellules végétatives de Bacilles anthracis a fourni des taux de récupération similaires à ceux obtenus pour Streptomyces.
2s De plus, les taux de récupération d'ADN à partir du sol n°5 ont augmenté après traitement par l'ARN également pour cet inoculum.
Exemple 2: Construction d'une banque d'ADN de faible poids moléculaire (<10 kb) à partir d'un sol contaminé par du lindane 3o clonage et expression du gène IinA
Cet exemple décrit la construction d'une librairie d'ADN du sol dans E. coli. II permet de démontrer le clonage et l'expression de gènes de petite taille issus d'une microflore non cultivable .

Le lindane est un pesticide organochloré, récalcitrant à la dégradation et persistant dans l'environnement. En aérobie, sa biodégradation est catalysée par une déhydrochlorinase, codée par le gène IinA, permettant de transformer le lindane en 1,2,4-s trichlorobenzène. Le gène IinA n'a été identifié que parmi deux souches isolées du sol : Sphingomonas paucimobilis, isolé au Japon (Seeno et Wada 1989, Imai et al 1991, Nagata et al 1993) et Rhodanobacter lindaniclasücus isolé en France (Thomas et al 1996, Nalin et al 1999).
Pourtant le potentiel de dégradation du lindane, mis en évidence io par dosage des ions chlorures libérés et amplification par PCR du gène IinA à partir de sols ayant été en contact ou non avec du lindane, semble être répandu plus largement dans l'environnement (Biesiekierska Galguen, 1997).
is 1. Extraction directe d'ADN de sol Les sols secs sont broyé pendant 10 minutes dans un broyeur à
force centrifuge Restch équipé 6 billes de tungstene. 10 grammes de sol broyé sont mis en suspension dans 50 ml de tampon TENP pH 9 (Tris 2o 50 mM, EDTA 20 mM, NaCI 100 mM, polyvinylpolypirrolidone 1 % wiv), et homogénéisés au vortex pendant 10 min.
Après centrifugation de 5 minutes, 4000 g à 4°C, le surnageant est précipité à l'acétate de sodium (3M, pH 5.2) et à l'isopropanol, pour être repris dans du tampon TE stérile (Tris 10 mM, EDTA 1 mM, pH 8.0).
2s L'ADN extrait est ensuite purifié sur colonne de tamisage moléculaire S400 (Pharmacie) et sur colonne échangeuse d'ions Elutip d (Schleicher et Schuell), selon les instructions des fabricants, puis conservé dans du TE.
2. Construction de la bangue d'ADN extrait du sol dans le 3o vecteur pBluescript SK-Le vecteur pBluescript SK- et l'ADN extrait du sol sont chacuns digérés par les enzymes Hindlll et BamHl (Roche), à raison de 10 unités d'enzymes pour 1 Ng d'ADN (incubation 2 heures à 37°C). Les ADN sont ensuite ligués par action de la T4 DNA ligase (Roche), une nuit à 15°C, à
raison d'une unité d'enzyme pour 300 ng d'ADN (environ 200 ng d'ADN
insert et 100 ng de vecteur digéré). Les cellules d'Escherichia coli électrocompétentes, ElectroMAX DH10B T"" (Gibco BRL) sont s transformées par le mélange de ligation (2 NI) par électroporation (25 NF, 200 et 500 SZ, 2,5 kV) (Biorad Gene Pulser).
Après une heure d'incubation dans le milieu LB, les cellules transformées sont diluées de façon à obtenir environ 100 colonies par io boîte puis sont étalées sur milieu LB (10 g/1 Tryptone, 5 g/1 extrait de levure, 5 g/ NaCI) additionné d'Ampiciline (100 mg/I), de y-HCH (500 mg/I), de X-gal 60 mg/I (5-bromo-4-chloro-3-indolyl-a-D-galactoside), et d'IPTG 40 mg/I (isopropylthio-(3-D-galactoside), et incubées une nuit à
37°C. Le y-hexachlorocyclohexane (Merck-Schuchardt) étant insoluble Is dans l'eau, une solution à 50 g/1 est préparée dans du DMSO (dimethyl sulfoxyde) (Sigma).
Une banque de 10 000 clones a ainsi été obtenue.
3.Clonaae et expression du Gène IinA
Le criblage de la banque s'effectue par visualisation d'un halo de dégradation du lindane autour de la colonie (le lindane précipitant dans les milieux de culture). Sur 10 000 clones criblés, 35 présentaient ainsi une activité de dégradation du lindane. La présence du gène IinA chez 2s ces clones a pu être confirmée par PCR grâce à des amorces spécifiques, décrites par Thomas et al (1996). Des digestions réalisées sur les inserts ainsi que sur les produits d'amplification ont montré des profils identiques entre tous les clones criblés et le témoin de référence, R. lindaniclasticus. Les clones portant le gène IinA présentaient 3o également un insert de même taille (environ 4 kb).
II ainsi pu être démontré que l'ADN du sol pouvait être cloné et exprimé chez un hôte hétérologue : E. coli, et que des gènes issus d'une microflore difficilement cultivable pouvaient être exprimés. Des banques 3s réalisées à partir de digestion partielle d'ADN extrait du sol par des enzymes de restriction telles que Sau3Al sont donc aussi envisageables.

EXEMPLE 3:
Procédé de préparation d'une collection d'acides nucléigues à
partir d'un échantillon de sol, comprenant une étape d'extraction s indirecte de l'ADN.
1. MATERIEL ET METHODES.
1.1 Extraction de la fraction bactérienne du sol.
io 5g de sol sont dispersés dans 50 ml de NaCI 0.8% stérile, par broyage au Waring Blendèr pendant 3 x 1 minute, avec refroidissement dans la glace entre chaque broyage. les cellules bactériennes sont alors séparées des particules du sol par centrifugation sur un coussin de is densité de Nycodenz (Nycomed Pharma AS, Oslo, Norvège). Dans un tube à centrifugation, 11,6 ml d'une solution de Nycodenz de densité de 1.3 g.ml-~ (8g de Nycodenz suspendu dans 10 ml d'eau stérile) sont placés en dessous de 25' ml de la suspension de sol précédemment obtenue. Après centrifugation à 10.000 g dans un rotor à godets mobiles 20 (rotor TST 28.38, Kontron) pendant 40 minutes à 4°C, l'anneau cellulaire, se situant à l'interphase de la phase aqueuse et de la phase Nycodenz, est prélevé, lavé dans 25 ml d'eau stérile et centrifugé à
10.000 g pendant 20 minutes. Le culot cellulaire est ensuite repris dans une solution Tris 10 mM; EDTA 100 mMn pH 8Ø
2s Préalablement à la dispersion du sol au Waring Blender, une étape d'enrichissement du sol dans une solution d'extrait de levure peut être incluse afin de permettre notamment la germination des spores bactériennes du sol. 5 g de sol sont alors incubés dans 50 ml d'une solution stérile de NaCI 0.8% - extrait de levure 6%, pendant 30 minutes 3o à 40°C. L'extrait de levure est éliminé par centrifugation à 5000 rpm pendant 10 minutes afin d'éviter la formation de mousse durant le broyage..
1.2 Lyse des cellules bactériennes du sol.
3s - Lyse des cellules en milieu liquide et purification sur gradient de chlorure de césium.
Les cellules sont lysées dans une solution Tris 10 mM, EDTA
100 mM, pH 8.0 contenant 5 mg.ml-' de lysozyme et 0.5 mg.ml-' s d'achromopeptidase pendant 1 heure à 37°C . Une solution de lauryl sarcosyl (1 % final) et de protéinase K (2 mg.ml-') est ensuite ajoutée et incubée à 37°C pendant 30 minutes. La solution d'ADN est alors purifiée sur un gradient de densité de chlorure de césium par centrifugation à 35 000 rpm pendant 36 heures sur un rotor Kontron 65.13. Le gradient de 1o chlorure de césium employé est un gradient à 1g/ml de CsCI, possédant un indice de réfraction de 1,3860 (Sambrook et al., 1989).
- Lyse des cellules après inclusion dans un bloc d'agarose.
Les cellules sont mélangées à un volume égal d'agarose à
1.5% (poids/volume) Seaplaque (Agarose Seaplaque FMC Products.
is TEBU, Le Perray en Yvelines, France). à bas point de fusion et coulées dans un bloc de 100 NI. Les blocs sont ensuite incubés dans une solution de lyse : EDTA 250 mM, saccharose 10.3%, lysozyme 5 mg.ml~' et achromopeptidase 0.5 mg.ml-' à 37°C pendant 3 heures. Les blocs sont alors lavés dans une solution de Tris 10 mM - EDTA 500 mM et 2o incubés une nuit à 37°C dans de l'EDTA 500 mM contenant 1 mg.ml-' de protéinase K et du lauryl sarcosyl 1 %. Après plusieurs lavages dans du Tris-EDTA, les blocs sont conservés dans de l'EDTA 500 mM.
La qualité des ADN ainsi extraits est contrôlée par ' électrophorèse en champs pulsés.
2s La quantité d'ADN extrait a été évaluée sur gel d'électrophorèse par rapport à une gamme étalon d'ADN de thymus de veau.
1.3 Caractérisation moléculaire de l'ADN extrait du sol 3o Les ADN extraits du sol sont caractérisés par hybridation PCR, méthode qui consiste à amplifier dans un premier temps les ADNs à
l'aide d'amorces situées sur des régions universellement conservées du gène de l'ARNr16S, puis à.hybrider les ADNs amplifiés avec différentes sondes oligonucléotidiques de spécificité connue (tableau 4), dans le but de quantifier l'intensité du signal d'hybridation par rapport à une gamme étalon externe d'ADN génomique.
Les ADN extraits du sol ainsi que les ADN génomiques extraits de cultures pures sont amplifiés avec les amorces FGPS 612-669 s (tableau 1 ) dans les conditions standard d'amplification par PCR. Les produits d'amplification sont ensuite dénaturés par un volume égal de NaOH 1 N, déposés sur une membrane de Nylon (GeneScreen Plus, Life Science Products) et hybridés avec une sonde oligonucléotidique marquée à son extrémité par du g32P ATP par action de la T4 to polynucléotide kinase. Après préhybridation de la membrane dans une solution de 20 ml contenant 6 ml de SSC 20X, 1 ml de solution de Denhardt, 1 ml de SDS 10% et 5 mg d'ADN hétérologue de sperme de saumon, les hybridations sont conduites durant une nuit à la température définie par la sonde. Les membranes sont lavées deux fois dans du SSC
Is 2X pendant 5 minutes à température ambiante, puis une fois dans du SSC 2X SDS 0,1 % et une seconde fois dans du SSC 1 X, SDS 0,1 pendant 30 minutes à la température d'hybridation. Les signaux d'hybridation sont quantifiés à l'aide du logiciel Molecular Analyst (Biorad, Ivry sur Seine, France) et les quantités d'ADN sont estimées par 2o interpolation des courbes étalons obtenues à partir des ADN
génomiques.
2. RESULTATS ET DISCUSSION
2s 2.1 Extraction et lyse de la fraction bactérienne du sol La séparation des cellules microbiennes des particules du sol, préalablement à l'extraction de l'ADN, est une alternative présentant de nombreux avantages par rapport aux méthodes d'extraction directe de 30 l'ADN dans le sol. En effet, l'extraction de la fraction microbienne limite la contamination de l'extrait d'ADN par de l'ADN extracellulaire présent librement dans le sol ou par de l'ADN d'origine eucaryote. Mais surtout, l'ADN extrait de la fraction microbienne du sol présente des fragments de plus longue taille et une meilleure intégrité que l'ADN extrait par lyse 3s directe JACOBSON et RASMUSSEN (1992). De plus, la séparation des particules de sol permet d'éviter une contamination de l'extrait d'ADN par des composés humiques et phénoliques, composés pouvant, par la suite, nuire gravement aux efficacités de clonage.
Une des étapes déterminantes pour l'extraction des cellules du s sol est la dispersion de l'échantillon de sol afin de dissocier les cellules adhérant à la surface ou à l'intérieur des agrégats de particules de sol.
Trois cycles de broyage successifs d'une minute chacun permettent d'obtenir une meilleure efficacité d'extraction des cellules ainsi qu'une plus grande quantité d'ADN récupéré, par rapport à un unique cycle de 1o broyage d'une minute 30.
Le tableau 5 rapporte les efficacités d'extraction obtenues après centrifugation sur gradient de Nycodenz , sur la microflore totale viable (dénombrée par microscopie après coloration à l'acridine orange), sur la microflore totale cultivable (dénombrée sur milieu solide 1s Trypticase-Soja 10%), et sur la microflore d'actinomycètes cultivables sur milieu HV agar (après incubation à 40°C dans une solution d'extrait de levure 6% -SDS 0,05% afin de provoquer la germination des sprores).
D'autre part, l'ADN extrait a été quantifié soit après une lyse des cellules en milieu liquide (sans purification sur gradient de chlorure de césium) 2o soit après une lyse des cellules incluses dans un bloc d'agarose (après digestion de l'agarose par une b-agarase).
Les résultats montrent que plus de 14% de la microflore tellurique totale est récupéré par cette méthode (soit 2 108 cellules par gramme de sol), et que la microflore totale cultivable ne représente qu'à
2s peine 2% de la population microbienne totale.
D'autre part, la quantité d'ADN extrait des cellules est de 330 ng par gramme de sol sec. En estimant le contenu d'ADN par cellule microbienne du sol entre 1.6 et 2.4 fg, et compte tenu de la quantité de cellules extraites (2 108 cellules par gramme de sol), on peut estimer que 30 la quasi-totalité des cellules ont été lysées et qu'ainsi la lyse n'apporte pas d'important biais à cette approche.
Les électrophorèses en champs pulsés ont montré que l'ADN
du sol extrait après gradient de Nycodenz et de CsCI pouvait atteindre une taille de 150 kb et que la lyse en bloc d'agarose permettait d'extraire 3s des fragments supérieurs à 600kb.

Ces résultats confirment l'intérêt de cette approche indépendante de la culture pour la construction de banques d'ADN de l'environnement, en se présentant comme une alternative aux méthodes directes d'extraction d'ADN.
s 2.2 Caractérisation moléculaire de l'ADN extrait du sol.
Le but de la caractérisation moléculaire de l'ADN extrait du sol est d'obtenir des profils représentant les proportions des différents Io taxons bactériens présents dans l'extrait d'ADN. II s'agissait également de connaître les biais d'extraction induits par la séparation préalable de la réaction cellulaire du ' sol, en comparaison avec une méthode d'extraction directe faute de visualisation directe de la diversité
microbienne présente dans les sols. En effet, peu d'informations ont été
is rassemblées sur l'extraction des cellules sur gradient de Nycodenz en fonction de leur structure morphologique (diamètre des cellules, formes filamenteuses ou sporulées).
Les méthodes jusqu'ici en place étaient basées sur des:
- hybridations quantitatives utilisant des sondes 20 oligonucléotidiques spécifiques à différents groupes bactériens, appliqués directement d'ADN extrait de l'environnement.
Malheureusement, cette approche n'est pas très sensible et ne permet pas de détecter des genres ou des groupes taxonomiques présents en faible abondance AMANN (1995).
2s - PCR quantitatives telles que la MPN-PCR (Most Probable Number) SYKES et al. (1992) ou la PCR quantitative par compétition DIVIACCO et al. (1993). Les inconvénients respectifs de chacune de ces approches sont (i) la lourdeur d'utilisation du fait de la multiplication des dilutions et des répétitions qui rend la technique inappropriée pour un 3o grand nombre d'échantillons ou de couples d'amorces, et (ü) la nécessité
de construire un compétiteur spécifique à l'ADN cible et n'induisant pas de biais dans 1â compétition.
La méthode mise en place selon la présente invention consiste à amplifier universellement un fragment de 700 pb à l'intérieur de la 3s séquence d'ADNr 16S, à hybrider cet amplifiat avec une sonde oligonucléotidique de spécificité variable (au niveau du règne, de l'ordre, de la sous classe ou du genre) et à comparer l'intensité d'hybridation de l'échantillon par rapport à une gamme étalon externe. L'amplification préalable à l'hybridation permet de quantifier des genres ou des espèces s de micro-organismes peu abondants. De plus, l'amplification par des amorces universelles permet, lors de l'hybridation, d'utiliser une large série de sondes oligonucléotidiques. Elle permet de comparer entre eux différents modes de lyse (extraction directe ou indirecte) sur des groupes taxonomiques bien définis.
io Les résultats sont rassemblés dans le tableau 6.
Ils montrent des profils similaires entre les deux méthodes d'extraction (directe et indirecte). Ainsi, il apparaît que l'extraction préalable de la fraction microbienne tellurique n'introduit pas de réels biais parmi les taxons testés. La seule différence significative entre les is deux approches d'extraction semblerait être la plus grande abondance de séquences d'ADNr appartenant aux y protéobactéries dans l'extrait par la méthode d'extraction indirecte.
De plus, un effet significatif de l'incubation de l'échantillon de sol dans une solution d'extrait de levure est observé sur les populations 2o sporulées du sol (Gram+, bas pourcentage de GC et Actinomycètes).
Cette étape provoque la germination des spores, et permet d'une part certainement une meilleure récupération de ce type de cellules et d'autre part une plus grande efficacité de la lyse sur des cellules en germination.
Cette approche permet une analyse semi-quantitative, ciblée 2s sur les principaux taxons définis à partir de micro-organismes cultivés et habituellement retrouvés dans les sols. Seuls des outils moléculaires permettent d'estimer l'importance des différents taxons, les méthodes de mise en culture étant trop restrictives et dépendantes de la spécificité du milieu utilisé.
3o Les résultats montrent qu'une grande part de la population microbienne n'est pas représentée dans les groupes phylogénétiques décrits, mettant ainsi en évidence l'existence de nouveaux groupes composés de micro-organismes non cultivés jusqu'à présent, ou non cultivables.

Ainsi, de nouvelles sondes peuvent être définies à partir de séquences déterminées à partir d'ADN extrait du sol (nouveaux phylums composés de micro-organismes non cultivés, LUDWIG et al. (1997) afin d'obtenir une image plus exacte de la composition de l'extrait d'ADN.
s Exemple 4 : - CONSTRUCTION DU COSMIDE POS 7001 Caractéristigues de POS 7001:
Réplicatif chez E. coli io Intégratif chez Streptomyces Sélectionnable chez E. coli AmpR,. HygroR et Streptomyces HygroR
Les propriétés du cosmide permettent d'insérer de grands fragments d'ADN entre 30 et 40kb.
is II comprend 1 - Le promoteur inductible tipA de Streptomyces lividans 2 - Le système d'intégration spécifique de l'élément pSAM2 3 - Le gène de résistance à l'hygromycine 4- le cosmide pWED1, dérivé de pWED15 1) - Le promoteur inductible du Gène tip A de S, lividans Le gène tipA code une protéine de 19 KD dont la transcription est induite par l'antibiotique thiostrepton ou nosiheptide. Le promoteur de 2s tipA est bien régulé: induction en phase exponentielle et en phase stationnaire (200X) Murakami T, Holt TG, Thompson CJ. J. Bacteriol 1989 ;171 :1459-66 2) - Le Gène de résistance à l'hyaromycine - Hygromycine: antibiotique produit par S. hygroscopicus - Le gène de résistance code une phôsphotransfèrase (hph) - Le gène utilisé provient d'une cassette construite par Blondelet et al dans laquelle le gène hyg est sous contrôle de son propre promoteur et du promoteur plac inductible par l'IPTG Blondelet-Rouault et al ; .
Gene 1997 ;190 :315-7 3) - Le système d'intégration site-spécifigue s L'élément pSAM2 s'intègre dans le chromosome par un mécanisme d'intégration site-spécifique. La recombinaison a lieu entre deux séquences identiques de 58 pb présentes sur le plasmide (attP) et sur le chromosome (attB).
io Le gène int, situé à proximité du site attP, est impliqué dans l'intégration site-spécifique de pSAM2, et son produit présente des similitudes avec les intégrases des bactériophages tempérés d'entérobactéries. II a été démontré qu'un fragment de pSAM2 ne contenant que le site d'attachement attP ainsi que le gène int était is capable de s'intégrer de la même manière que l'élément entier. Voir brevet français n°88 06638 du 18/05/1988, ainsi que Raynal A et al. Mol Microbiol 1998 28 :333-42).
4) - Construction du cosmide pOS7001 Etape 1/ Le promoteur TipA a été isolé du plasmide pPM927 (Smokvina et al. Gene 1990; 94:53-9 ) sur un fragment Hindlll-BamHl de 700 paires de bases et cloné dans le vecteur pUC18 (Yannish-Perron et al., 1985) digéré par Hindlll/BamHl Etape 2/ Ce fragment Hindlll-BamHl a ultérieurement été transféré de pUC18 à pUC19 (Yannish-Perron et al., 1985).
Etape 3/ Un insert BamHl-BamHl de 1500 paires de bases portant le 3o gène int et le site attP de pSAM2 a été isolé du plasmide pOSint1, représenté à la Figure 8, (Raynal A et al. Mol Microbiol 1998 28 :333-42) et cloné au site BamHl du vecteur précédent (pUC19/TipA), dans l'orientation permettant de mettre le gène int sous contrôle du promoteur TipA.
3s Etape 4/ Le site BamHl situé en 5' du gène int a été supprimé par digestion partielle BamHl puis traitement par l'enzyme Klenow. Un fragment Hindlll-BamHl portant TipA-int-attP a ainsi été isolé de pUC19 et transféré dans pBR322 Hindlll/BamHl.
s Etape 5/ La cassette Hygromycine isolée de pHP45S2hyg (Blondelet-Rouault et al., 1997) sur un fragment Hindlll-Hindlll a été clonée au site Hindlll situé en amont du promoteur TipA.
1o Etape 6/ Le site Hindlll situé entre la cassette S2Hyg et le promoteur TipA a été supprimé par traitement Klenow aprés digestion partielle Hindlll.
Etape7/ Le plasmide obtenu à l'issue de l'étape précédente permet ns d'isoler un fragment unique Hindlll-BamHl, portant tous les éléments S2Hyg/TipA/int attP, qui a été cloné après traitement Klenow au site EcoRV du cosmide pWED1. Le cosmide pWED1, représenté à la Figure 9, dérive du cosmide pWE15, représenté à la Figure 10 (Wahl GM, et al.
. Proc Natl Acad Sci U S A 1987 84:2160-4) par délétion d'un fragment ao Hpal-Hpal portant le gène Neomycine et l'origine SV40.
Une carte du vecteur pOS 7001 est représentée à la Figure 11.
Exemple 5: Construction de plusieurs cosmides coyuaatifs et 2s intéuratifs chez Streptomyces, les vecteur pOSV 303, pOSV306 et pOSV307 5.1 Construction du vecteur pOSV303.
3o Etant donné que l'empaquetage sélectionne les clones ayant une taille supérieure à 30kb, seuls 10 à 15% des clones ne contiennent pas d'insert, il n'est donc pas vraiment nécessaire d'avoir un système de sélection des recombinants, ce qui permet de construire un vecteur plus petit.

Construction:
Etape 1 : le vecteur pOSV001 Clonage d'un fragment Pstl-Pstl de 800 paires de bases portant l'origine de transfert OriT du réplicon RK2 (Guiney et al., 1983), dans le s plasmide pUC19 ouvert par Pstl. Cette étape de clonage permet d'obtenir un vecteur transférable de E. coli à Streptomyces par conjugaison.
La carte du vecteur pOSV 001 est représentée à la Figure 17.
Io Etape 2 : le vecteur pOSV002 Insertion du marqueur Hygromycine (cassette S2hyg), et sélectionnable chez Streptomyces, de sorte que le gène conférant la résistance à l'hygromycine soit transféré en dernier ce qui permet de s'assurer du transfert complet du BAC avec l'insert d'ADN du sol.
is Clonage de la cassette Hygromycine isolée de pHP45S2hyg sur un fragment Hindlll-Hindlll portant le gène de résistance à l'Hygromycine..
Ce fragment est cloné au site Pstl (position 201 ) du vecteur pOSV001.
Ce site Pstl a été choisi, compte tenu du sens du transfert, pour que le marqueur Hygro soit le dernier transféré lors de la conjugaison. Les 2o extrémités Pstl et Hindlll sont rendues compatibles après traitement par le fragment Klenow de l'ADN polymérase permettant de générer des "bouts francs". L'orientation du fragment S2hyg est déterminée en fin de construction.
La carte du vecteur pOSV002 est représentée à la Figure 18.
Etape 3 : le vecteur pOSV010 Le fragment Xbal-Hindlll isolé du plasmide pOSV002 et contenant le marqueur de résistance à l'hygromycine et l'origine de transfert est cloné dans le plasmide pOSint1 digéré par Xbal et Hindlll.
3o L'orientaion des sites est telle que le marqueur hygromycine sera toujours transféré en dernier.
Le plasmide pOSint1, représenté à la Figure 8, a été décrit dans l'article de Raynal et al.( Raynal A et al. Mol Microbiol 1998 28 :333-42).
Cette construction permet l'expression de l'intégrase chez E.
3s coli et chez Streptomyces.

Etape 4 : insertion du site " cos "
Le principe est d'insérer un site " cos " dans le plasmide pOSV010 permettant l'empaquetage dans le plasmide pOSV010, s représenté à la Figure 12.
L'obtention du fragment " cos " est représentée à la Figure 13.
Ce fragment est obtenu par PCR. A partir d'un fragment portant les extrémités cohésives (cos) de ~, (bactériophage lambda ou cosmide pHC79), une amplification par PCR est réalisée à l'aide des to oligonucléotides correspondant aux séquences -50/+130 par rapport au site cos. Ces oligonucléotides contiennent en outre les sites de clonage Nsil, compatible Pstl, Xhol, compatible Sall, EcoRV, " bout franc ".
L'addition des sites rares Swal et Pacl permet d'isoler et/ou de Is cartographier l'insert cloné.
Le fragment PCR est borné par un site Pstl à l'extrémité 5' et par un site Hincll à l'extrémité 3', permettant le clonage dans le vecteur pOSV010 (Figure 12) prélablement digéré par les enzymes Nsil et EcoRV, provoquant la délétion du répresseur laclq.
2o La carte du vecteur pOSV303 est représentée sur la Figure 14.
Le vecteur pOSV303, contient des sites de clonage tels que le site Nsil, .
compatible Pstl, le site Xhol, compatible Sall ou encore le site EcoRV
pour l'obtention de " bouts francs ".
2s 5.2 Construction du vecteur pOSV306 Etape 1: Construction du vecteur pOSV308.
Le vecteur pOSV308 a été construit selon le procédé illustré à
30 la figure 27. Un fragment , de 643 pb contenant la région cos a été
amplifié à l'aide du couple d'amorces de séquences SEQ ID N°107 et SEQ ID N°108 à partir du vecteur cosmide pHc79 décrit par HOHM B
and COLLINS (1980).

Ce fragment nucléotidique amplifié a été cloné directement dans le vecteur pGEMT-easy commercialisé par la Société PROMEGA, comme illustré à la figure 27 afin de produire le vecteur pOSV308.
Etape 2: Construction du vecteur pOSV306.
Le vecteur pOSV010 a été construit comme décrit à l'étape 3 de construction du vecteur pOSV303, comme décrit au paragraphe 5.1 du présent exemple.
io Le vecteur pOSV10 a été digéré par les enzymes EcoRV et Nsil afin d'exciser un fragment de 7874 pb qui a été ultérieurement purifié, comme cela est illustré à la figure 28.
Puis, le vecteur pOSV308 obtenu à l'étape 1 ) ci-dessus a été
soumis à une digestion par les enzymes EcORV et Pstl afin d'exciser un i5 fragment de 617 pb, qui a été ultérieurement purifié.
Puis, le fragment cos de 617 pb obtenu à partir du vecteur pOSV308 a été intégré par ligation dans le vecteur pOSV10, afin d'obtenir le vecteur pOSV306, comme cela est illustré à la figure 28.
20 5.3 Construction du vecteur pOSV307.
Le cosmide pOSV307 contient toujours le gène Laclq, afin d'améliorer la stabilité du cosmide dans Streptomyces, par exemple dans la souche S17-1 de Streptomyces.
25 Afin de construire le vecteur pOSV307, on a soumis le vecteur pOSV010 à une digestion par l'enzyme Pvull, pour obtenir un fragment de 8761 pb qui a été purifié, puis déphosphorylé.
Ensuite, le vecteur pOSV308, tel qu'obtenu comme décrit à
l'étape 1) du paragraphe 5.2 ci-dessus, a été digéré par l'enzyme EcoRl 3o afin d'obtenir un fragment de 663 pb, qui a été ensuite purifié et traité
par l'enzyme de Klenow.
Le fragment nucléotidique ainsi traité a été intégré dans le vecteur pOSV010 après ligation afin d'obtenir le vecteur pOSV307, comme illustré à la figure 29.

Exemple 6 : - Construction du cosmide réplicatif navette E. coli-StreptomYces pOS700R.
Les fragments du plasmide pE116 (Volff et al., 1996) représenté
s à la Figure 15 ont été isolés et traités par Klenow. Ces fragments contiennent les séquences nécessaires à la replication et à la stabilité
provenant du plasmide SCP2.
Ces deux fragment sont insérés séparément dans le site EcoRV du cosmide pWED1 conduisant à 2 clones différents.
1o La cassette Hygromycine isolée de pHP45S2hyg sur un fragment Hindlll-Hindlll a été clonée au site Hindlll des cosmides pWED1 contenant l'insert ScP2 sous forme de fragments Pstl-EcoRl ou Xbal. Elle confère une résistance à l'Hygromycine sélectionnable à la fois chez E. coli et chez Streptomyces.
1s Transformation de S. lividans et détermination de l'efficacité de transformation.
II est apparu que le cosmide contenant l'insert Xbal était moins stable que celui contenant le fragment Pstl EcoRl. C'est donc ce dernier qui a été retenu sous le nôm de pOS700R.
2o La carte du vecteur pOS 7008 est représentée sur la Figure 16.
Exemple 7: Efficacité de transformation des vecteurs inté4ratifs (pOS7001) et réplicatifs 2s Possibilités Rendre la souche de S. lividans résistante au thiostrepton par intégration du plasmide pT01 portant le marqueur de résistance au thiostrepton Préparation de protoplastes à partir de S. lividans cultivée en 3o présence de thiostrepton Avec le vecteur pOS7001, l'efficacité de transformation est d'environ 3000 transformants par pg d'ADN.
Avec le vecteur pOS700R, l'efficacité de transformation est d'environ 30 000 transformants par Ng d'ADN.
3s Exemple 8: Construction d'un vecteur BAC intéctratif chez Streptomyces et conüugatif Caractéristiaues:
s Réplicatif chez E. coli Transférable par conjugaison de E. coli aux Streptomyces Intégratif chez Strepfomyces Sélectionnable chez E. coli et Streptomyces 1o Capable d'insérer de grands fragments d'ADN ; il faut souligner qu'il est nécessaire de disposer d'ADN du sol dont la taille est comprise éntre 100 et 300kb et non contaminé par des petits fragments. En effet les petits fragments sont très préférentiellement intégrés.
Doté d'un crible permettant de sélectionner les plasmides 1s portant un insert. Ce crible permet en éliminant les vecteurs refermés sur eux même et non digérés de travailler avec un rapport plus élevé entre vecteur et DNA à insérer ce qui permet d'avoir une meilleure efficacité
de clonage pour constituer des banques.
20 Construction:
Etape 1 : le vecteur pOSV001 Clonage d'un fragment Pstl-Pstl de 800 paires de bases portant 2s l'origine de transfert OriT du réplicon RK2 (Guiney et al., 1983), dans le plasmide pUC19 ouvert par Pstl. Cette étape de clonage permet d'obtenir un vecteur transférable de E. coli à Streptomyces par conjugaison.
La carte du vecteur pOSV 001 est représentée à la Figure 17.
Etape 2 : le vecteur pOSV002 Insertion du marqueur Hygromycine (cassette S2hyg), et sélectionnable chez Streptomyces, de sorte que le gène conférant la résistance à l'hygromycine soit transféré en dernier ce qui permet de s'assurer du transfert complet du BAC avec l'insert d'ADN du sol.
Clonage de la cassette Hygromycine isolée de pHP45S2hyg sur un fragment Hindlll-Hindlll portant le gène de résistance à l'Hygromycine..
s Ce fragment est cloné au site Pstl (position 201) du vecteur pOSV001.
Ce site Pstl a été choisi, compte tenu du sens du transfert, pour que le marqueur Hygro soit le dernier transféré lors de la conjugaison. Les extrémités Pstl et Hindlll sont rendues compatibles après traitement par le fragment Klenow de l'ADN polymérase permettant de générer des 1o "bouts francs". L'orientation du fragment S2hyg est déterminée en fin de construction.
La carte du vecteur pOSV002 est représentée à la Figure 18.
Etape 3 : le vecteur pOSV010 1s Le fragment Xbal-Hindlll isolé du plasmide pOSV002 et contenant le marqueur de résistance à l'hygromycine et l'origine de transfert est cloné dans le plasmide pOSint1 digéré par Xbal et Hindlll.
L'orientation des sites est telle que le marqueur hygromycine sera 2o toujours transféré en dernier.
Le plasmide pOSint1, représenté à la Figure 8, a été décrit dans l'article de Raynal et al.( Raynal A et al. Mol Microbiol 1998 28 :333-42).
2s Cette construction permet l'expression de l'intégrase chez E.
coli et chez Streptomyces.
Etape 4 : le vecteur pOSV014 3o Addition d'une "cassette" permettant à terme de sélectionner dans la construction finale les plasmides ayant insérés de l'ADN
étranger.
Cette "cassette" porte le gène codant pour le répresseur CI du phage ~, et le gène conférant la résistance à la tétracycline. Ce gène porte dans 3s sa région 5' non codante la séquence cible du répresseur. L'insertion d'ADN dans le site Hindlll situé dans la séquence codante de CI conduit à la non production du répresseur et donc à l'expression de la résistance à la tétracycline.
Elle est portée par le plasmide pUN99 décrit dans l'article : Nilsson et al .
s (Nucleic Acids Res 1983, 11:8019-30) Un fragment Pvull-Hindlll isolé de pOSV010 et contenant les séquences Int, attP, Hygro et oriT est cloné au site Mscl de pUN99 .
La carte du vecteur pOSV014 est représentée sur la Figure 19.
1o Etape 5 : le vecteur pOSV 403, vacteur BAC intégratif et coniugatif Cette dernière étape de clonage dans pBAC11 (représenté à la Figure. 20) permet de conférer au plasmide final des caractéristiques de BAC (Bacterial Artificial Chromosome), en particulier l'aptitude à
1s accepter des inserts d'ADN de très grande taille.
Le fragment Pstl-Pstl du vecteur pOSV014 portant l'ensemble des éléments et fonctions décrits précédemment est cloné dans le pasmide pBAC11 (pBeIoBAC11) digéré par Notl. Les extrémités sont rendues compatibles pat traitement avec l'enzyme de Klenow.
2o La carte du vecteur pOSV403 est représentée sur la Figure 21. Le schéma de la Figure 21 indique l'orientation retenue.
Etape 6 Le vecteur pOSV403 contient les sites Hindlll et Nsil. Le site 2s Nsil est assez rare chez Streptomyces et présente l'avantage d'être compatible avec Pstl. En revanche, le site Pstl est fréquent chez Streptomyces et peut être utilisé pour effectuer des digestions partielles.
Les clones recombinants portant un insert cloné dans le répresseur CI, et donc inactivant ce répresseur deviennent résistants à
30 la tétracycline. Etant donné que les BACs ne sont présents qu'à raison d'une copie par cellule, il faut sélectionner les clones recombinants avec une dose plus faible de tétracycline que la dose habituelle de 20 Ng/ml, par exemple avec une dose de 5 pg/ml. Dans ces conditions il n'y a aucun bruit de fond.

II est aussi possible d'utiliser un système développé et commercialisé par la société InVitrogen, dans lequel l'insertion d'ADN
dans le vecteur inactive un inhibiteur de la gyrase dont l'expression est toxique pour E. coli. Le fragment est préférentiellement isolé à partir du s vecteur pZErO-2 (http://www.invitrogen.comn.
Exemple 9 : Construction d'une bangue de S. alboniger dans les 2 cosmides intégratif (pOS7001) et replicatif (pOS700R) l0 1 ) - Construction de la Bangue Pour évaluer l'efficacité du système de clonage, la voie de biosynthèse de la puromycine de Sfrepi'omyces alboniger, a été clonée dans les deux cosmides navettes pOS7001 et pOS700R. Les gènes de 1s la voie de biosynthèse de ~la puromycine sont portés par un fragment d'ADN BamHl d'environ 15 Kb.
L'ADN génomique de Streptomyces alboniger a été isolé. 90% de cet ADN possède un poids moléculaire compris entre 20 et 150 Kb, déterminé par électrophorèse en champ pulsé.
2o Les deux cosmides ont été digérés par l'enzyme BamHl (site unique de clonage).
Les conditions de digestion partielle BamHl de l'ADN
génomique ont été déterminées (50 pg d'ADN et 12 unités d'enzyme, 5 minutes de digestion). Après vérification de la taille par électrophorèse 2s en gel d'agarose, l'ADN partiellement digéré a été introduit dans les vecteurs. Dans la ligation, 15 Ng d'ADN génomique + 2 Ng du vecteur intégratif ou 5 Ng du vecteur réplicatif ont été utilisés.
Chaque mélange de ligation a été utilisé pour l'encapsidation in vitro de l'ADN dans les têtes de bactériophage lambda. Les mélanges 3o d'encapsidation (0,5m1) ont été titrés (Vecteur intégratif pOS7001 = 7,5 x 105 cosmides/ml, Vecteur réplicatif= 5 x 104 cosmides/ml).
Les cosmides ont été utilisés pour transfecter E. coli et générer ainsi deux banques d'environ 25000 clones résistant à l'ampicilline.
L'ADN de l'ensemble de ces clones a été isolé et quantifié.

lOs Pour tester les banques, plusieurs clones ont été choisis, l'ADN
purifié et a été digéré par BamHl, afin de vérifier la présence et la taille des inserts. Les clones testés contiennent entre 20 et 35 Kb d'insert de S. alboniger.
s 2) - Identification des clones contenant la voie de biosynthèse de la puromycine Les clones susceptibles de contenir la voie complète de biosynthèse de 1o la puromycine ont été identifiés par hybridation avec une sonde correspondant au gène de résistance à la puromycine, le gène pac de 1,1 kb. (Lacalle et al. Gene 1989;79, 375-80 ) Banpue faite dans le Vecteur Intégratif pOS 7001:
1s Parmi 2000 clones analysés, 9 clones ont hybridé avec la sonde et ils contiennent des inserts d'environ 40 kb.
Ban4ue faite dans le Vecteur replicatif pOS 7008:
Parmi 2000 clones analysés, 12 clones ont hybridé avec la sonde; ils contiennent des inserts d'environ 40 kb.
En utilisant les données publiées par Tercero et al. (J Biol 2s Chem. 1996; 271, 1579-90), les clones contenant la totalité de la voie de biosynthèse ont été identifiés, après hybridation avec des sondes appropriées. Certains cosmides intégratifs et replicatifs présentent après digestion Clal-EcoRV un fragment de 12360 paires de bases, ce qui laisse supposer un insert contenant la totalité de la voie de biosynthèse 3o de la puromycine.
4) - Vérification de la production de puromycine par les clones résistants (Rhône-Poulenc).

a) Matériels et Méthodes Souches et conditions de culture s Trois clones résistants ont été sélectionnés pour vérifier la production de puromycine. Ils correspondent aux recombinants de S. lividans contenant un insert dans le vecteur intégratif pOS7001 (G 20) ou un insert dans le vecteur réplicatif (G21 et G22).
1o Des souches de référence ont été utilisées pour s'assurer que les milieux de culture utilisés permettaient cette production. II s'agit de la souche sauvage S. alboniger ATCC 12461, productrice de puromycine et de la souche recombinante S. lividans contenant le cluster complet de is la puromycine cloné dans le plasmide pRCP11 (Lacalle et al, 1992, the EMBO journal, 11, 785-792) (G23).
Les souches sont ensemencés dans un milieu de culture dont la composition est la suivante 20 Peptone bactriologique Organotechnie5 glI de milieu final Extrait de levure Springer 5 Extrait de viande Liebig 5 Glucose Prolabo 15 CaC03 (1) Prolabo 3 2s NaCI Prolabo 5 Agar (2) Difco 1 (~) Les 3g de carbonate sont mélangés à 200m1 d'eau distillée puis stérilisés à part. L'addition se faisant après stérilisation.
30 (2) L'agar est préalablement.fondu dans 100m1 d'eau distillée avant d'être ajouté aux autres ingrédients du milieu pH ajusté à 7,2 avant stérilisation stérilisation 25 minutes à 121 °C
3s 50 pg/I d'hygromycine et 5 pg/I de thiostrepton sont ajoutés au milieu après stérilisation de façon à maintenir une pression de sélection des clones contenant un insert grâce au gène marqueur présent sur le vecteur ( le gène de résistance au thiostrepton étant porté par le s plasmide pRCP11).
50 ml de milieu de culture liquide, répartis en erlenmeyers de 250 ml, sont ensemencés avec 2 ml de suspension aqueuse de spores et de mycelium de chacune des souches. Les cultures sont incubées pendant l0 4 jours à 28°C avec une agitation de 220 trs/mn.50 ml de milieux de production, répartis en erlenmeyers de 250 ml, sont ensuite ensemencés avec 2 ml de ces pré-cultures. Le milieu de production utilisé est un milieu industriel optimisé pour la production de pristinamycine (milieu RPR 201 ). Les cultures sont incubées à 28°C, avec une agitation de 1s 220trs/mn. Après différents temps d'incubation, un erlenmeyer de chaque culture est amené à pH 11 puis extrait par 2 fois 1 volume de dichlorométhane. La phase organique est concentrée à sec sous pression réduite, puis l'extrait est repris par 10 NI de méthanol. 100 p1 de la solution méthanolique sont analysés en CLHP munie d'un détecteur à
2o barrette de diodes dans un système gradient eau-acétonitrile 0,05% TFA
V/V sur colonne C18 pour la détection de la puromycine.
b) Résultats Les analyses HPLC comparatives à partir des cultures des 2s différentes souches montrent la production de puromycine dans la culture de la souche sauvage à partir de 24 h d'incubation. Une production, bien que plus faible, est aussi nettement détectée à partir de 48 h dans la culture du clone G20 contenant le cosmide pOS7001 (figure 23). La puromycine a également été détecté à l'état de trace dans le 3o clone G23 contenant l'opéron complet codant pour le composé dans le plasmide pRCP11. Néanmoins, aucune production n'a été observée dans les cultures des clones G21 et G22 contenant le cosmide pOS700R. Les résultats sont reportés sur la Figure 23.

c) Conclusions Les résultats obtenus permettent de démontrer l'efficacité du s système de clonage développé dans le cosmide pOS7001 pour exprimer chez un hôte hétérologue tel que S. lividans une voie de biosynthèse complète sous le contrôle de séquences régulatrices qui lui sont propres.
D'autre part, ces données valident également le criblage des banques obtenues sur la base de la résistance des clones à la puromycine to puisqu'il a conduit à identifier parmi un petit nombre de clones, un recombinant capable d'exprimer la voie de biosynthèse associée au gène de résistance. L'absence de production de puromycine chez les autres clones peut probablement s"expliquer par le clonage d'une partie seulement de l'opéron contenant le gène de résistance mais dépourvue Is de certaines séquences de régulation, transduction ou transcription nécessaires à la synthèse du composé.
EXEMPLE 10 : - CLONAGE D'ADN DU SOLDANS DES VECTEURS
1) - Préparation de l'ADN du sol à cloner Les différents fragments d'ADN doivent être purifiées selon leur destination Cosmides La taille des molécules doit être comprise entre 30 et 40kb. Or , l'ADN extrait du sol est hétérogène en taille et comprend des molécules atteignant 200 ou 300kb. Afin d'homogénéiser les tailles, l'ADN est cassé mécaniquement par passage de la solution à travers une aiguille de 0,4mm de diamètre. Les fragments d'une taille voisine de 30kb ne sont pas affectés par ces passages répétés à travers une aiguille et il n'est donc pas nécessaire de faire une séparation par la taille surtout que l'empaquetage dans les particules élimine automatiquement les inserts courts.

BACs Préparation de l'ADN
L'ADN du sol est séparé par electrophorèse en champ pulsé (type s CHEF) dans des conditions telles que les fragments compris entre 100 et 300kb sont concentrés dans une bande d'environ 5mm. Ceci est obtenu en réalisant la migration dans un gel à 0,7% d'agarose normal ou 1 % d'agarose à bas point de fusion avec un temps de pulsation de 100 secondes pendant 20 heures et à une température 1o de 10°C.
Récupération de l'ADN
Deux méthodes sont utilisées, leur choix dépend de la taille des 1s molécules que l'on veuf isoler, soit jusqu'à 150kb soit au dessus.
- Jusau'à 150kb La porosité d'un gel à 0,7% d'agarose permet la sortie de l'ADN par 2o électroélution à condition d'absence totale de bromure d'ethidium.
Cet ADN est ensuite manipulé avec des instruments de pipetage à
orifice agrandi et hydrophobe pour éviter la fragmentation mécanique des molécules.
- Entre 100 et 300kb La bande contenant les fragments d'une taille entre 100 et 300kb est découpée. Pour la migration un gel d'agarosé à 1 % et à bas point de fusion est utilisé. Cette propriété permet de fondre le gel à une température supportable pour l'ADN de 65°C et de le digérer ensuite 3o par l'agarase (Agarase commercialisée par la société Boehringer) à
une température de 45°C suivant les prescriptions du fournisseur.

2) - Utilisation des cosmides intégratifs pOS7001 et replicatifs pOS700R
s Construction par gueues polyA polyT
Principe Un vecteur cosmide, ouvert à un site de clonage quelconque, est modifié
aux extrémités 3' en ajoutant un polynucléotide monotone. D'autre part, 1o l'ADN à cloner est modifié aux extrémités 3' en ajoutant un polynucléotide monotone pouvant s'apparier au précédent.
L'association vecteur-fragment à cloner se fait par ces polynucléotides et la séquence cos du vecteur permet l'empaquetage in vitro de l'ADN dans is des capsides de phage Lamda.
Préparation du vecteur Le vecteur utilisé est un vecteur autoréplicatif chez E. coli et intégratif 2o chez Streptomyces.
Pour E. coli, la sélection se fait sur la résistance à l'ampicilline et pour Streptomyces, elle se fait sur la résistance à l'hygromycine .
Le cosmide est ouvert à l'un des 2 sites possibles (BamHl ou Hindlll) et 2s les extrémités 3' sont rallongées par du polyA avec de la terminale transférase dans les conditions où le fournisseur de l'enzyme prévoit l'addition de 50 à 100 nucléotides.
Préparation de l'ADN à insérer.
Les extrémités 3' de l'ADN sont rallongées par du polyT avec de la terminale transférase dans. les conditions fournissant un allongement comparable à celui du vecteur. Dans les conditions expérimentales décrites par le fabricant les queues polyA polyT sont longues de 30 à 70 3s bases Assemblage des molécules et encapsidation in vitro.
Pour l'assemblage des molécules, on mélange une molécule de vecteur s pour une molécule d'ADN inséré. La concentration de l'ADN en masse est de 500 Ng.ml-'.
Le mélange est encapsidé et I"efficacité de transfection dépend de la souche utilisée comme réceptrice et de l'ADN inséré : nulle avec l'ADN
test et la souche DHSa, l'efficacité est comparable pour les souches io SURE et DH10B ; à l'extraction le rendement en ADN est cependant plus élevé avec la souche DH10B.
Construction par déphosphorylation is L'ADN du sol est mis en bouts francs par élimination des séquences 3' sortantes et remplissage des séquences 5' sortantes. Cette opération est faite avec : enzyme de Klenow, T4 polymérase, les 4 nucléotides triphosphates. Le vecteur cosmidique est digéré par BamHl, puis traité
par l'enzyme de Klenow pour le rendre bout franc puis déphosphorylé
2o pour éviter qu'il ne se referme sur lui même. Après ligation, le mélange est encapsidé et transfecté comme précédemment décrit.
3l - Utilisation des pBAC
Principe.
2s Le plasmide pBAC conjugatif et intégratif possède les sites Hindlll et Nsil comme sites de clonage. L'insertion d'une séquence d'ADN à ces sites inactive le répresseur CI du phage Lambda qui contrôle l'expression du gène de la résistance à la tétracycline. L'inactivation du répresseur rend 3o donc la cellule résistante à cet antibiotique (5pg.ml-'). Le clonage à ces sites est facilité par la modification du vecteur et la préparation de l'ADN
à cloner.

Préparation du vecteur. Exemple Hindlll Pour que le vecteur ne se referme pas sur lui-même, le site Hind III est s modifié : la première base (A) est remise en place pour former une séquence 5' sortante, qui ne peut pas s'apparier avec ses semblables.
L'opération est effectuée par l'enzyme de Klenow en présence de dATP.
Le succès de l'opération est vérifié en effectuant une ligation du vecteur 1o sur lui-même avant et après traitement à l'enzyme de. Klenow. A quantité
d'ADN testé identique, on obtient 3000 clones avant traitement et 60 après traitement.
Préparation de l'ADN (taille comprise entre 100 et 300kb).
1s Mise en bouts francs de l'ADN.
L'ADN est mis en bouts francs par élimination des séquences 3' sortantes et remplissage des séquences 5' sortantes. Cette opération est faites avec : enzyme de Klenow, T4 polymérase, les 4 2o nucléotides triphosphates.
Préparation des extrémités.Exemple Hindlll L'addition de l'ADN sur le vecteur se fait au moyen d'oligo nucléotides reconnaissant la séquence Hindlll modifiée du vecteur.
2s Ils contiennent des sites de restriction rares pour permettre les clonages ultérieurs (Swal ; Notl). cette technique est dérivée de celle de : Elledge SJ, Mulligan JT, Ramer SW, Spottswood M, Davis RW.
Proc Natl Acad Sci U S A 1991 Mar 1;88(5):1731-5 Deux oligonucléotides complémentaires sont utilisés 3o Oligo 1 : 5'-GCTTATTTAAATATTAATGCGGCCGCCCGGG-3' (SEQ ID N°25) Oligo 2: 5'-CCCGGGCGGCCGCATTAATATTTAAATA-3' (SEQ ID
N°26) Ils sont phosphorylés en 5' par la polynucléotide kinase de T4 en présence d'ATP, après leur hybridation. Cette étape de phosphorylation peut être éliminée en utilisant les oligo-nucléotides déjà phosphorylés.
s La ligation de cet adaptateur double brin avec l'ADN à insérer dans un vecteur est faite par la ligase de T4 en présence d'un très grand excès d'adaptateur (1000 molécules d'adaptateur pour une molécule d'ADN à insérer), en 15 heures à 14°C.
L'excès d'adaptateur est éliminé par électrophorèse sur un gel 1o d'agarose et les molécules d'intérêt sont récupérées du gel par hydrolyse de celui-ci par de l'agarase ou par électroélution.
Ligation vecteur- ADN .
La ligation se fait à 14°C sur 15 heures avec 10 molécules de 1s vecteur pour une molécule d'insert.
Transformation.
La souche réceptrice est la souche DH10B. La transformation se fait par électroporation. Pour exprimer la résistance à la tétracycline, les 2o transformants sont incubés à 37 °C pendant 1 heure en milieu sans antibiotique. La sélection des clones se fait par culture pendant une nuit , sur milieu gélosé LB additionné de tétracycline à SNg.ml~'.
2s Exemple 11 : CONJUGAISON CLONE A CLONE ENTRE E. COLI ET
STREPTOMYCES
CONJUGAISON ENTRE E COLI SOUCHE S17.1 CONTENANT PPM803 ET

Introduction II est possible d'effectuer des conjugaisons entre E. coli et Streptomyces (Mazodier et al, 1989). L'adaptation de cette méthode en développant 3s une technique dite en goutté où l'on mélange 10 NI d'une culture de E.

coli contenant un vecteur recombinant à une goutte de S. lividans récepteur consiste à réaliser une transformation de clone à clone en s'assurant qu'à la fin de l'opération toute la banque construite dans E.
coli est introduite dans S. lividans. Une transformation en vrac amènerait s obligatoirement à une multiplication des clones de Streptomyces transformants afin d'être pratiquement sûr que la banque dans E. coli est corüplètement représentée dans S. lividans.
De plus cette méthode est facilement automatisable.
1o Essais préliminaires Conjugaison entre E, coli souche S17.1 contenant le vecteur pOSV303 et S. lividans TK21.
Dans ces conditions, on mélange 6 x 106 cellules de E. coli avec 2 x 106 1s spores pré-germées de S. lividans dans un volume final de 20 NI.
Mise au point de la méthode II est connu que l'ADN extrait de certains actinomycètes est modifié et de 2o ce fait ne peut être introduit dans certaines souches de E. coli sans qu'il soit restreint. La souche de E. coli DH10B qui accepte ces ADN n'est pas capable de transférer à Streptomyces un plasmide ne contenant que oriT, et il est donc nécessaire d'en construire une. II faudrait y introduire par intégration dans le chromosome un dérivé de RP4 capable de fournir 2s en trans toutes les fonctions nécessaires pour assurer le transfert des clones recombinants contenant l'origine de transfert oriT.
Exemple 12 : Construction d'une bangue cosmidiclue dans E. coli et Streptomyces lividans : Clonage de l'ADN du sol L'objectif est la construction d'une librairie d'ADN de grande taille issue de l'environnement, sans étape préalable de culture.des microorganismes, dans le but d'accéder aux gènes métaboliques de bactéries (ou de tout autre organisme) que l'on ne sait pas cultiver dans 3s des conditions standard de laboratoire.

La procédure décrite a été utilisée pour générer une banque d'ADN dans Escherichia coli utilisant le cosmide navette E. coli-S.
lividans pOS7001 et de l'ADN extrait et purifié de la fraction bactérienne d'un sol . Cette dernière méthode permet d'obtenir de l'ADN d'une grande pureté et d'une taille moyenne de 40 kb. Aussi, afin d'éviter pour le clonage une digestion partielle de l'ADN extrait, a été adoptée une stratégie alternative basée sur l'utilisation de l'enzyme terminale tranférase qui permet d'ajouter des queues de polynucléotides aux 1o extrémités 3' de l'ADN et du vecteur.
5 pg d'ADN ont été extraits de 60 mg de sol de " la Côte Saint André " selon le protocole décrit à l'exemple 3 et traités avec de la terminale transférase (Pharmacia) pour rallonger les extrémités 3' avec un polynucléotide monotone (poly T) (Exemple 10).
Le cosmide intégratif pOS7001 est préparé selon le protocole B1, Orsay. Après une étape classique de purification en présence de phénol/chloroforme, l'ADN et le vecteur sont assemblés en mélangeant une molécule de vecteur et une molécule d'ADN inséré. Le mélange est ensuite encapsidé dans les têtes de bactériophages lambda (kit 2o Amersham) qui servent à transfecter E. coli DH10B. Les cellules transfectées sont ensuite ensemencées sur milieu LB agar en présence d'ampicilline pour sélection des recombinants résistants à cet antibiotique.
Une banque d'environ 5000 clones d'E. coli résistants à
l'ampicilline a été obtenue. Chaque clone a été ensemencé en milieu LB ou TB + ampicilline dans un puits de microplaque (96 puits) et conservé à -80°C .
3o La séquence aux sites d'insertions des fragments du sol dans le vecteur, pOS7001, générés pendant la construction de la banque a été analysée.
Pour cela 17 cosmides de la banques ont été purifié et sequencé avec une amorce, seq.5' CCGCGAATTCTCATGTTTGACCG 3', qui hybride entre les site BamHl et le site de clonage Hindlll présente dans le 3s vecteur.

Les séquences obtenues ont permis d'estimer que la longueur des queues homopolymériques aux points de jonctions est très variable, entre 13 et 60 poly-dA/dT. Au-delà des queues, les séquences des s fragments du sol ainsi générées possèdent un pourcentage en G+C
entre 53 et 70 %. Des pourcentages si élevés étaient inattendus, mais des résultas similaires ont été déjà reportés sur des préparation brut d'ADN à partir de sol (Chatzinotas A. et al., 1998).
1o Une stratégie de " pooling " de 48 ou 96 clones à été utilisée pour l'analyse de la richesse microbienne et métabolique. L'ADN
cosmidique extrait à partir de ces " pools " de clones à été utilisé ensuite pour réaliser des expériences de PCR ou d'hybridation.
1s Exemple 13 : Diversité de l'ADN ribosomigue 16S au sein de l'ADN
cloné.
a~ Matériels et méthodes 2o Les cosmides de la banque sont extraits à partir de pools de clones par lyse alcaline puis sont purifiés sur gradient de chlorure de césium, afin de prélever la bande d'ADN cosmidique sous forme super-enroulée et dans le but d'éliminer tout ADN chromosomique d'Escherichia coli pouvant interférer dans l'étude.
2s Après linéarisation des cosmides par action de la nucléase S1 (50 unités, 30 minutes à 37°C), les séquences d'ADNr 16S contenues dans les pools de clones sont amplifiées dans les conditions standard d'amplification, à partir des amorces universelles 63f (5'-CAGGCCTAACACATGCAAGTC-3') et 1387r (5'-3o GGGCGGWGTGTACAAGGC-3') définies par MARCHESI et a1.(1998).
Les produits d'amplification d'environ 1.5 kilobases sont purifiés à partir du kit Qiaquik gel extraction (Qiagen) puis directement clonés dans le vecteur pCR II (Invitrogen) chez Escherichia coli TOP10, selon les instructions du fabricant. L'insert est alors amplifié à l'aide des amorces 3s M13 Forward et M13 reverse spécifiques au site de clonage du vecteur pCR II. Les produits d'amplification de taille attendue (environ 1,7 kb) sont analysés par RFLP (Restriction Fragment Length Polymorphism) à
l'aide des enzymes Cfol, Mspl et BstUl (0,1 unités) afin de sélectionner les clones à séquencer. Les profils de restriction obtenus sont séparés s sur gel d'agarose Metaphore 2.5% (FMC Products) contenant 0,4 mg de bromure d'éthidium par ml.
Les séquences d'ADNr 16S sont alors déterminées directement en utilisant les produits PCR purifiés par le kit " Qiaquick gel extraction "
à l'aide des amorces de séquençage définies par Normand (1995). Les io analyses phylogénétiques sont obtenues en comparant les séquences avec les séquences d'ADNr 16S procaryotes rassemblées dans la base de données Ribosomal Database Project (RDP), version 7,0 MAIDAK et a1.(1999) grâce au programme SIMILARITY MATCH, permettant d'obtenir les valeurs de similarité par rapport aux séquences de la base is de données.
b) Résultats Pour déterminer la diversité phylogénétique représentée dans la banque, 47 séquences du gène ARNr16S ont été isolées à partir de 2o pools de 288 clones et ont été séquencées dans leur quasi-totalité. Les résultats sont rapportés dans le tableau 7.
L'analyse des séquences par interrogations des bases de données révèle que la majorité des séquences (>61 %) présentent des 2s pourcentages de similarité inférieurs ou égaux à 95% avec des espèces bactériennes identifiées (tableau 7). Sur les 47 séquences analysées, 28 séquences ont pour plus proches voisins des bactéries non cultivées, dont les séquences ont été directement issues d'ADN extrait de l'environnement. La majorité de ces séquences présentent par ailleurs 3o des pourcentages de similarité très faibles (88-95%), 17 séquences sur 28 diffèrent ainsi de plus de 5% par rapport à leurs voisins les plus proches.
Parmi les séquences pouvant être classées dans un groupe phylétique, une majorité de séquences appartiennent à la sous classe a 3s des protéobactéries (18 séquences avec un pourcentage de similarité

compris entre 89 et 99%). Un second groupe de séquences est représenté par la sous classe g des protéobactéries, comprenant 9 séquences dont les pourcentages de similarité varient entre 84 et 99%).
Les groupes des b-protéobactéries, d-protéobactéries, firmicutes à bas s G+C% et à haut G+C% comprennent respectivement 1, 4, 3 et 5 séquences. Seule une séquence n'a pu être classée au sein des grands groupes taxonomiques bactériens dénis : la séquence a22.1 (19), son plus proche voisin Aerothermobacter marianas (avec une similarité de 89%) étant lui même une souche isolée de l'environnement marin et non 1o classifiée à l'heure actuelle. Enfin, 6 séquences peuvent être classées au sein du groupe des Acidobacteriuml Holophaga. Ce groupe présente la particularité de n'être représenté que par deux bactéries cultivées Acidobacterium capsulatum et Holophaga foetida, l'ensemble de ce groupe étant composé par des bactéries dont seul le gène ARNr16S a 1s été détecté par amplification et clonage à partir d'ADN extrait d'échantillon de l'environnement (principalement de sol), Ludwig et al (1997). Les faibles valeurs de similarité entre les différentes séquences composant ce groupe laisse présager une grande hétérogénéité et diversité au sein de ce groupe.
2o L'ensemble des résultats est représenté sur le tableau 7.
Ces résultats montrent que les séquences contenues dans la banque cosmidique proviendraient de micro-organismes non seulement diversifiés phylogénétiquerüent mais surtout de micro-organismes n'ayant jamais été isolés jusqu'à ce jour.
2s Les résultats du séquençage des ADN amplifiés ont permis d'établir un arbre phylogénétique des organismes présents dans l'échantillon de sol dont les séquences caractérisées sont originaires.
L'arbre phylogénétique représenté à la figure 7 a été réalisé à
3o partir de l'alignement des séquences par le logiciel MASE (Faulner et Jurak, 1988) etcorrigé par la méthode des 2 paramètres de Kimura (1980), et à l'aide de l'algorithme Neighbour Joining (Saitou et Nei 1987).
L'analyse phylogénétique a permis de comparer les séquences ADNr 16S clonées dans la banque d'ADN du sol, avec les séquences d'ADNr 3s 16S procaryotes rassemblées dans les bases de données Ribosomal Database Project (RDP), (version 7.0, programme SIMILARITY-MATCH, Maidak et al 1999), et dans la base GenBank grâce au logicel BLAST
2.0 (Atschul et al, 1997).
s Exemple 14 : Présélection Qénétiaue de la bangue pour l'évaluation de la richesse métaboligue Pour caractériser la banque obtenue en terme de diversité
io métabolique et identifier .les clones contenant des inserts portant des gènes pouvant être impliqués dans des voies de biosynthèse, il a été
développé selon l'invention des techniques de criblage génétique basées sur des méthodes PCR afin de détecter et d'identifier des gènes PKS de type I.
1s 1 Souches bactériennes, plasmides et conditions de culture S. coelicolor ATCC101478, S. ambofaciens NRRL2420, S.
lactamandurans ATCC27382, S. rimosus ATCC109610, 8. Subtilis 2o ATCC6633 et 8. licheniformis THE1856 (collection RPR) ont été utilisés comme sources d'ADN pour les expériences de PCR. S. lividans TK24 est la souche hôte utilisée pour le cosmide navette POS1700.
Pour la préparation d'ADN génomique, de suspensions de spores, de protoplastes et pour la transformation de S. lividans, on a 2s suivi les protocoles standard décrits dans Hopwood et a1.(1986).
Escherichia coli Top10 (INVITROGEN) a été utilisé comme hôte pour le clonage des produits PCR et E. coli Sure (STRATAGENE) a été utilisé
comme hôte pour le cosmide navette pOS7001. Les conditions de culture de E. coli, la préparation de plasmides, la digestion de l'ADN, 30 l'électrophorèse sur gel d'agarose ont été realisées suivant les procédures standard (Sambroock et a1.,1996).
2. Amorces PCR:
Les couples d'amorces a1-a2 et b1-b2 ont été definis par 3s l'equipe de N. Bamas-Jacques et leur utilisation a été optimisée pour le criblage de l'ADN des souches pures et de la banque du sol pour la recherche de gènes codant PKSI) Tableau 8 s Amorces PCR homologues aux Gènes PKSI utilisées pour le criblage de la bangue..
a1 (+) 5' CCSCAGSAGCGCSTSTTSCTSGA 3' a2 (-) 5' GTSCCSGTSCCGTGSGTSTCSA 3' b1 5' CCSCAGSAGCGCSTSCTSCTSGA 3' b2 5' GTSCCSGTSCCGTGSGCCTCSA 3' io Conditions d'amplification Pour la recherche de PKS I à partir de l'ADN de souches pures, le mélange d'amplification contenait : dans un volume final de 50 NI, entre 50 et 150 ng d'ADN génomique, 200 NM de dNTP, 5mM de MgCl2 1s final, 7% de DMSO, tampon 1x Appligene, 0,4 ~1M de chaque primer et 2,5U de Taq Polymerase Appligène. Les conditions d'amplification utilisées sont : dénaturation à 95°C pendant 2 minutes, hybridation à
65°C pendant 1 minute, élongation à 72°C pendant 1 minute, pour le premier cycle, suivi par 30 cycles où la température est diminuée 2o jusqu'à 58°C comme décrit dans K. Seow et aL, 1997. L'étape d'extension finale s'effectue à 72°C pendant 10 minutes.
Pour la recherche de PKS I à partir de l'ADN de la banque, les conditions PCR sont les mêmes que ci-dessus pour le couple a1-a2 en 2s utilisant entre 100 et 500 ng de cosmide extrait de pools de 48 clones.
Pour le couple d'amorces b1-b2 , 500ng de cosmides issus de pools de 96 clones ont été utilisés. Le mélange d'amplification contenait 200 NM

l21 de dNTP, 2,5mM de MgCl2 final, 7% de DMSO, tampon 1x Quiagen, 0,4 pM de chaque primer et 2,5U de Taq polymerase Hot-start (Qiagen). Les conditions d'amplification utilisées sont : dénaturation 15' à 95°C
suivie par 30 cycles : 1' de dénaturation à 95°C + 1' d'hybridation à
65°C pour s le premier cycle et 62°C pour les autres cycles, 1' d'élongation à
72°C, étape d'extension finale de 10' à 72°C.
L'identification des clones positifs à partir des pools de 48 ou 96 clones est effectuée à partir des répliques des microplaques mères correspondantes sur milieu solide ou toute autre méthode standard de 1o réplication.
3 Sous-clonage et séguençage Les produits PCR des clones identifiés ont été séquencés selon le 1s protocole suivant Les fragments sont purifiés sur gel d'agarose (Gel Extraction Kit (Qiagen))et clonés dans E.coli TOP 10 (Invitrogen) à l'aide du kit TOPO
TA cloning kit (Invitrogen). L'ADN plasmidique de sous-clones est extrait par lyse alcaline sur un Biorobot (Qiagen) et dialysé durant 2 h sur 2o membrane VS 0,025pm (Millipore). Les échantillons sont séquencés avec les amorces M13 " Universal " et " Reverse " sur le séquenceur ABI
377 96( PERKIN ELMER).
4) Résultats Définition et validation des amorces PCR
Deux régions très conservées de PKS du type I d'actinomycètes, comprenant le site actif de l'enzyme, ont été ciblées pour l'amplification 3o de gènes homologues avec des amorces dégénérées. Ces deux régions correspondent aux séquences PQQR(L)(L)LE et VE(A)HGTGT
respectivement.
Des amorces (tableau 8) ont été testées avec l'ADN de souches 3s productrices ou non de macrolides: Streptomyces coelicolor, Streptomyces ambofaciens, producteur de spiramycine, et Saccharopolyspora erythraea, producteur de l'erythromycine. Quelles que soient les amorces utilisées, des bandes représentant des fragments d'environ 700 pb et correspondant à la longueur du fragment s attendu, ont été obtenues avec toutes les souches.
Ces résultats démontrent la spécificité des amorces a et b pour les gènes PKS I de souches productrices ou de gènes silencieux chez S. coelicolor.
Le séquençage des produits PCR obtenus avec le couple 1o d'amorces a1-a2 a permis d'identifier, à partir de la souche S.
ambofaciens, la séquence d'un gène KS déjà décrite (Demande de brevet européen n° EP0791656) comme appartenant à la voie de biosynthèse du planténolide, précurseur macrolidique de la spiramycine, et deux séquences jamais décrites, Stramb 9 et Stramb12, (voir liste 1s séquences).
En ce qui concerne, S. erythraea, la méthode de criblage a -permis l'identification d'une séquence de KS (sacery17) identique à
celle du KS du module 1 déjà publiée dans Genebank (Numéro d'accès 2o M63677), codant pour la synthétase 1 (DEBS1) du 6-deoxyérythronolide B. Une autre séquence non corrélée à la voie de biosynthèse de l'érythromycine a été identifiée et il s'agit de la séquence SEQ ID N° 32.
25 Conclusion Une méthode pour analyser la présence de gènes codant pour les PKS du type I par PCR à partir de différents micro-organismes a été
mise au point. La structure très conservée du domaine de la keto-synthétase du type I a permis de réaliser une méthode PCR basée sur 30 l'utilisation d'amorces dégénèrées biaisées en GC pour le choix des codons.
Cette approche montre la possibilité d'identifier des gènes ou clusters impliqués dans la voie de biosynthèse des polyketides du type I.
Le clonage de ces gènes permet la création d'une collection qui pourra ensuite être utilisés pour construire des hybrides polyketides. Le même principe peut être appliqué à d'autres classes d'antibiotiques.
Les résultats obtenus ici montrent aussi la présence de gènes pouvant appartenir à des clusters silencieux (SEQ ID N° 30 à 32).
s La présence de clusters silencieux a été déjà documentée dans S. lividans et leurs expressions sont déclenchées par des régulateurs spécifiques ou pleiotropiques (Horinouchi et al. ;Umeyama et al. 1996) .
Ces résultats suggèrent que la détection de gènes appartenant à des voies dites silencieuses codent en réalité pour des enzymes actives 1o capable de.diriger, en association avec les autres enzymes spécifiques de la voie, les étapes enzymatiques nécessaires pour la synthèse des métabolites secondaires.
Criblage de la banctue 1s Le criblage a été effectué dans les conditions décrites dans la section Matériels et Méthodes en utilisant les couples d'amorces validées à partir de souches productrices.
En présence du couple d'amorces a1-a2 , la taille des produits 2o PCR obtenus à partir de l'ADN cosmidique extrait de pools de 48 ou 96 clones était d'environ 700 bp, donc en accord avec les résultats attendus.
L'intensité des bandes obtenues était variable, mais une seule bande d'amplification était présente pour chaque pool d'ADN cible.
2s Dans ces conditions, 8 groupes d'ADN cible ont été détectés, correspondant à 9 clones positifs après déréplication.
Le criblage effectué avec le second couple d'amorces, b1-b2, a donné
des résultats d'amplification moins spécifiques puisque de nombreuses bandes satellites étaient observées à côté de la bande de 700 bp.
3o Néanmoins, 9 groupes d'ADN cible ont été détectés, correspondant à 14 clones positifs après déréplication à partir de ces clones positifs, l'ADN a été extrait pour les étapes de séquençage et de transformation de .S.
lividans.

Analyse des cosmides La digestion des cosmides identifiés par PCR avec l'enzyme Dral, reconnaissant un site riche en AT, libère un fragment supérieur à
s 23 kb (figure 22). Ceci suggère que la méthode PCR cible préférentiellement l'ADN du sol contenant un haut pourcentage en G+C.
Ce résultat est la conséquence de la dégénérescence des amorces utilisées, biaisées en GC pour le choix des codons. Les inserts, comme attendu dans le cas de cosmides, ont une taille supérieure à 23 kb, sauf 1o dans un cas ( clone a9B12), ce qui pourrait traduire une certaine instabilité des cosmides. D'autre part, pârmi tous les clones sélectionnés, seulement deux d'entre eux, GS.F1 et GS.G11, ont montré
le même profil de restriction indiquant un faible taux de redondance dans la banque.
1s Les cosmides sélectionnés ont été transférés dans Streptomyces lividans par transformation de protoplastes en présence de PEG 1000. L'efficacité de transformation varie entre 30 et 1000 transformants par pg d'ADN cosmidique utilisé.
2o Séauençaae et analyse phyloQénétigue des génes PKS I du sol La méthode de PCR mise à point sur les souches pures a été
utilisée comme décrite sur les cosmides de la banque et 24 clones ont ainsi été identifiés.
2s Les produits de PCR d'environ 700 bp obtenus à partir de l'ADN de deux pools (48 clones) et de 8 clones uniques, ont été clonés, après purification sur gel d'agarose , et séquencés. Cela a permis l'identification de 11 séquences.
3o L'alignement des séquences protéiques déduites PKSs I du sol avec d'autres PKSs I présentes dans différents micro-organismes (figure 24) montre la présence d'une région très conservée qui correspond à la région consensus du site active de la b-kétoacyl synthétase.
3s L'analyse des séquences obtenues avec la méthode " Codonpreference " (Gribskov et al., 1984 ; Bibb et al., 1984) a révélé la présence d'un fort biais dans l'usage des codons riches en G+C dans une seule phase de lecture. Les protéines déduites selon cette phase s de lecture montrent une forte similarité avec des KSs du type I connus programme Blast). En particulier, la similarité entre les séquences de KSs du sol et des KSs du cluster de l'érythromycine est d'environ 53%.
Après déréplication d'un pool et identification du clone unique, la séquence du produit PCR obtenu à partir de ce clone est identique à
1o celle du pool ce qui confirme la fiabilité de la méthode utilisée. -L'analyse dé la séquence du produit PCR d'un clone a permis l'identification probable de 3 gènes KSI différents. Une de ces séquences (SEQ ID N° 34) a une similarité de 98,7% avec la séquence d'un autre pool, suggérant qu'elles codent pour la même enzyme. Les 1s deux autres séquences sont différentes mais fortement homologues.
Ici, il est décrit pour la première fois le clonage et l'identification dans une banque d'ADN du sol de voies de biosynthèse de métabolites secondaires contenant des gènes codant des KS du type I.
Le pourcentage élevé en G+C des séquences du sol suggère 2o qu'elles puissent dériver de génomes ayant un usage des codons similaire à ceux d'actinomycètes.
Même si les données disponibles dans la littérature sont réduites, on sait que les gènes codant des PKS du type I sont très diversifiés de par leur organisation physique dans le génome, la taille et le nombre de 2s modules contenus dans chaque gène.
La présence de plusieurs domaines provenant d'un seul clone est une confirmation de leur appartenance à des clusters de polyketides assymétriques. Dans un seul cas, deux clones semblent former un contigue puisqu'ils partagent la même séquence pour le domaine KS.
3o La taille des régions génétiques impliquées dans la synthèse des PKSI varie entre quelques kb pour la pénicilline à environ 120 kb pour la rapamycine. La dimension des inserts cosmidiques peut donc ne pas être suffisante pour l'expression des clusters les plus complexes.
Des gènes codant pour des PKSs I, capables de travailler de 3s façon itérative comme les PKS II et de contrôler la synthèse de polykétides aromatiques, ont été décrits (Jae-Hyuk et al., 1995). L'étude des clusters des PKSs I du sol pourrait apporter encore des nouveautés dans ce domaine.
s 5. Identification de 6 Gènes codant des polykétide_s synthases .
On poursuivant le criblage de la banque de cosmides selon les protocoles décrits dans le présent exemple, les inventeurs ont identifiés 1o un clone de cosmide contenant un insert de 34071 pb contenant plusieurs cadres ouverts de lecture codant pour des polypeptides du type polykétide synthase.
Plus précisément, le cosmide ainsi identifié par criblage de la banque contient six cadres ouverts de lecture codant pour des 1s polypeptides polykétide synthase ou pour des polypeptides fortement apparentés, des peptides synthase non ribosomiques. Une carte détaillée de ce cosmide est représentée à la figure 36.
La séquence nucléotidique complète du cosmide constitue la séquence SEQ ID N°113 du listage de séquences. L'insert d'ADN
2o contenu dans la séquence SEQ ID N°113 constitue la séquence nucléotidique complémentaire (brin - ) de la séquence nucléotidique codant pour les différents polykétides synthases.
La séquence nucléotidique de l'insert d'ADN contenue dans le cosmide de la figure 36 qui comprend les cadres de lecture ouverts 2s codant pour les polypeptides polykétides synthases (brin +) est schématisée sur la figure 37 et constitue la séquence SEQ ID N°114 du listage de séquences.
De plus, une carte détaillée des différents cadres de lecture ouverts contenus dans l'insert d'ADN de ce cosmide est représentée à la 3o figure 37.
Les caractéristiques des séquences nucléotidiques comprenant des cadres ouverts de lecture contenus dans l'insert d'ADN de ce cosmide sont détaillées ci-après.

Séguence ORF1 La séquence orf1 comprend un cadre ouvert de lecture partielle d'une longueur de 4615 nucléotides. Cette séquence constitue la s séquence SEQ ID N°115, qui débute au nucléotide en position 1 et se termine au nucléotide en position 4615 de la séquence SEQ ID N°114.
La séquence SEQ ID N°115 code pour le polypeptide ORF1 de 1537 acides aminés, ce polypeptide constituant la séquence SEQ ID
N°121.
1o Le polypeptide de séquence SEQ ID N°121 est apparenté aux peptides synthases non ribosomiques. Ce polypeptide possède un degré
d'identité en acides aminés de 37% avec le peptide synthase de Anabaena sp.90 référencé sous le numéro d'accès « emb CAC01604.1 » dans la base de données Genbank.
1s Séguence ORF2 La séquence nucléotidique orf2 a une longueur de 8301 nucléotides et constitue la séquence SEQ ID N°116, qui débute au 2o nucléotide en position 4633 et se termine au nucléotide en position 12933 de la séquence SEQ ID N°114.
La séquence ORF2 code pour le peptide ORF2 d'une longueur de 2766 acides aminés, ce polypeptide constituant la séquence SEQ ID
N°122.
2s Le polypeptide de séquence SEQ ID N°122 possède une identité de séquence en acides aminés de 41 % avec la séquence MtaD
de Stigmatella aurantiaca référencée sous le numéro d'accès « gb AAF
19812.1 » de la base de données GENBANK.
Le polypeptide ORF2 constitue une polykétide synthase.
Séguence ORF3 La séquence nucléotidique orf3 a une longueur de 5292 nucléotides et constitue la séquence SEQ ID N°117. La séquence SEQ
3s ID N°117 correspond à la séquence qui débute au nucléotide en position 12936 et qui se termine au nucléotide en position 18227 de la séquence SEQ ID N°114.
La séquence nucléotidique SEQ ID N°117 code pour le polypeptide polykétide synthase ORF3 de 1763 acides aminés, ce s polypeptide constituant la séquence SEQ ID N°123 selon l'invention.
Le polypeptide ORF3 de séquence SEQ ID N°123 possède une identité de 42% en acides aminés avec la séquence MtaB de Stigmatella aurantiaca référencée sous le n° d'accès « gb AAF 19810.1 » de la base de données GENBANK.
1o Séctuence ORF4 La séquence nucléotidique orf4 a une longueur de 6462 nucléotides et constitue la séquence SEQ ID N°118 selon l'invention.
1s La séquence nucléotidique SEQ ID N°118 correspond à la séquence débutant au nucléotide en position 18224 et se terminant au nucléotide en position 24685 de la séquence nucléotidique SEQ ID
N°114.
La séquence nucléotidique SEQ ID N°118 code pour le 2o polypeptide polykétide synthase ORF4 de 2153 acides aminés, ce polypeptide constituant la séquence SEQ ID N°124 selon l'invention.
Le polypeptide ORF4 de séquence SEQ ID N°124 possède une identité de séquence en acides aminés de 46% avec la séquence epoD
de Sorangium cellulosum référencée sous le n° d'accès « gb 2s AAF62883.1 de la base de données GENBANK.
Séauence ORF5 La séquence nucléotidique orf5 a une longueur de 5088 3o nucléotides et constitue la séquence SEQ ID N°119 selon l'invention.
La séquence SEQ ID N°119 correspond à la séquence débutant au nucléotide en position 24682 et se terminant au nucléotide en position 29769 de la séquence nucléotidique SEQ ID N°114.

La séquence nucléotidique SEQ ID N°119 code pour le polypeptide polykétide synthase ORFS de 1695 acides aminés, ce polypeptide constituant la séquence SEQ ID N°125 selon l'invention.
Le polypeptide polykétide synthase ORF5 de séquence SEQ ID
s N°125 possède une identité en acides aminés de 43% avec la séquence epod de Sorangium cellulosium référencé sous le n° d'accès « gb AAF
62883.1 » de la base de données GENBANK.
Séauence ORF6 1o La séquence nucléotidique orf6 a une longueur de 4306 nucléotides, et constitue la séquence SEQ ID N°120 selon l'invention.
La séquence nucléotidique SEQ ID N°120 correspond à la séquence débutant au nucléotide en position 29766 et se terminant au nucléotide 1s en position 34071 de la séquence SEQ ID ID N°114.
La séquence SEQ ID N°120 contient un cadre ouvert de lecture partielle codant pour le polypeptide ORF6 de 1434 acides aminés du type polykétide synthase, ce polypeptide constituant la séquence SEQ
ID N°126 selon l'invention.
2o Le polypeptide de séquence SEQ ID N°126 possède une identité en acides aminés de 43% avec la séquence epoD de Sorangium cellulosum référencée sous le numéro d'accès « gb AAF 62883.1 » de la base de données GENBANK.
2s EXEMPLE 15: Construction de vecteurs navettes de pe BAC
intégratifs chez Streptomyces Construction de vecteurs navettes du type BAC intégratifs e_t coniuaatifs chez Streptomvces 15.1 Construction du vecteur pMBD-1 Le vecteur BAC pMBD-1 a été obtenu selon les étapes suivantes:

Etape 1: Le vecteur pOSV010 a été soumis à une digestion par les enzymes PsTI et BstZ171 afin d'obtenir un fragment nucléotidique de 6,3 kb.
s Etape 2: Le vecteur pDNR-1 a été digéré par les enzymes Pstl et Pvull afin d'obtenir un fragment nucléotidique de 4,145 kb.
Etape 3: Le fragment nucléotidique de 6,3 kb provenant du vecteur pOSV017 a été fusionné par ligation au fragment de 4,15 kb 1o provenant du vecteur pDNR-1, afin de produire le vecteur pMBD-1, comme cela est illustré à la figure 30.
15.2 Construction du vecteur pMBD-2 1s Le vecteur pMBD-2 est un vecteur du type BAC contenant une boîte intégrative « ~c31 int-S2hyg ».
~c31 est un phage tempéré à spectre d'hôte large dont le site d'attachement (attP) est bien localisé. Le fragment ~c31 int est le fragment minimal de l'actinophage ~c31 capable d'induire l'intégration 20 d'un plasmide dans le chromosome de Streptomyces Lividans.
S2hyg est un dérivé de l'interposon S2 capable de conférer la résistance à l'hygromicine chez E.coli et S.Lividans.
Des vecteurs BAC contenant le système d'intégration ~c31 sont décrits par SOSIO et al. (2000) et dans la demande PCT n°99 6734 2s publiée le 29 Décembre 1999.
Le vecteur BAC pmBD-2 a été construit selon les étapes suivantes:
Etape 1: Construction d'une boîte intégrative ~c31 int S2hyg dans un plasmide multicopies de E.coli.
3o On a tout d'abord amplifié le fragment ~c31 int à partir du plasmide pOJ436 à l'aide du couple d'amorces suivant:
- L'amorce EV~c311 (SEQ ID N°109) (qui permet d'introduire un site EcoRV à l'extrémité 5' de la séquence ~c31) et l'amôrce BII~c31F
(SEQ ID N°110) (qui permet l'introduction d'un site BgLll à l'extrémité
3' 3s de la séquence ~c31).

Le fragment S2hyg a été obtenu par digestion à l'aide de l'enzyme BamHl du plasmide pHP45 S2hyg décrit par BLONDELET-ROUAULT (1997).
Puis la boîte intégrative ~c31 int-S2hyg a été clonée dans le s vecteur pMCS5 digéré par les enzymes Bglll et EcoRV.
Etape 2: Construction du vecteur pMBD-2 Le chromosome artificiel bactérien pBAce3.6 décrit par 1o FRENGEN et al. (1999) a été digéré par l'enzyme Nhel puis traité par l'enzyme Eco polymérase.
Puis, le vecteur pMCS5 ~c31 int-S2hyg a été digéré par les enzymes-SnaBl et EcoRV afin de récupérer la boîte intégrative.
La carte détaillée du vecteur pMBD2 est représentée à la figure 1s 31.
15.3 Construction du vecteur pMBD-3 Le vecteur pMBD-3 est un vecteur intégratif (~c31 int) et 2o conjuguatif (OriT) du type BAC, qui comprend le marqueur de sélection S2hyg.
La carte du vecteur pMBD-3 ainsi que son procédé de construction sont illustrés à la figure 31.
Le vecteur pMBD-3 a été obtenu en amplifiant le gène OriT à
2s partir du plasmide pOJ436 à l'aide du couple d'amorces de séquences SEQ ID N° 111 et SEQ ID N°112 qui contiennent des sites de restriction pacl.
Le fragment nucléotidique amplifié à l'aide des amorces SEQ
ID N°111 et SEQ ID N°112 a été cloné dans le vecteur pMBD2 3o préalablement digéré par l'enzyme Pacl. Le schéma de construction du vecteur pMBD-3 est illustré à la figure 31.

15.4 Construction du vecteur pMBD-4 La carte détaillée du vecteur pMBD-4 est représentée à la figure 32.
s Le vecteur pMBD4 a été obtenu en clonant la boite intégrative ~c31 int-SZhyg dans le vecteur pCYTAC2.
15.5 Construction du vecteur pMBD-5 1o Le schéma de construction du vecteur pMBD-5 est illustré à la figure 33.
Le vecteur pMBD-5 a été construit par recombinaison du fragment nucléotidique compris entre les deux sites IoxP du vecteur pMBD-1 illustré à la figure 33 avec le site loxp contenu dans le vecteur Is BAC désigné pBTP3, une carte détaillée du plasmide pBTP3 étant représentée à la figure 34.
15.6 Construction du vecteur pMBD-6 2o Le vecteur pMBD-6 a été construit en recombinant le fragment nucléotidique compris entre les deux sites IoxP du vecteur pMBD-1 au niveau du site IoxP du vecteur BAC pBeloBac11, comme représenté sur la figure 35.
2s -o .~ -a ~ m ~ M ~ (~D

c0 w r. 0 r->, O N

O ~ ~ ~ ~ ~ N

Z U ~ ~ N N l(7 fW ~ O ~

'p C

> ~

N Q

~
p) ~ U O (fl r V ~

~

~ o ~ ? ? p t ~

d Z U ~ m tn(O f~ ~ I' ~ f~

N =
N

= a0 ~ c0 00 0oM

N ~ Q. lf~~ l0 ~ '~~t N

O O ~ ~ .

N ~
N

O v N ' ~

' ~ 'fl ~ ~ ~ ~
C V

N :. I N CO O O M
G7 0 N c a O ~ N ~ '~i' ~t ~ ~ M
,.

Q.

N es L G:~ ~ ~ c-Q

J~ ~ C N N ~' ~ N C~D
N

d ~

J

C

E G7 O _N

L
C v a N ~ M N

~ tn ( CO N
O

v J C
d N N N

O O

V C C ~

= O O +' r CO ( p N

O ~ v~ p ~ ~

m p p ea -' -' ~ ~ a~~ ~ ~ a m m - Q Q 1- f- cuQ I- Q

-d V

C e 'O

U
, ~ Q ~ Li ~

N V (O Q O

C p ~

N G~ ~ ~~ ~ ~ ~ ~ ~ C

N ~ ~ ~ C N C f~O~ ' 0~

, -. ~
r O fa7 ,, ~ O Q. ~ ~i ~iC D >

d ,agi E ' c Z

~ N c~ ~ tf~CO

~
a~

v, N

a~

O U

O
N
~ _-Q.

U

o - - ~-~ r- (n N
N ~, 'O'O cac ca~ ~ ~ ~ c O
C C ,~ 7 p C ~ N N ~ N ~ ~ N O
N ~ cO w ~ c'UN C'ON O O fUp N
C ~ ~ N N N N c~9N N N .fi,"
a a U U a a. a.U U U c~ ~

V U

a w_ a c U
O U ~ - ~ U
~ ~ 7 7 ~ -Qt= N U a 7 ai '~
U ~ ~_ ~ ~ U s ~ U ~ ~ Q ~ ~' ru ~ I- U U U U H U U
~ ~ H la-U ~ - ' .
JN Q ~ ~ ~ U C~~ a ~ ~ uj ~ ~ U ~ U ~ H ~ C7~ ~ ~
H ~ U U C~ H
N ~ U Q ~ U ~ ~ Q Q c ~
a E"~ ~ C~ C~ .
Q C7 ~U'~ ~ ~ H v~ N

~ c V a' ~C
7 O - ~lJ c O N
M M M 'O U O

t ~ U
V ~ ~ ~ .C N

Q M f~ . . _ 00 OOap Z U
N ~ p~ V ~ ~ ~ (nt~/~~ U U
O ~ C ~ ~ ~ O O O Q V
m ~n C N cn~ ~ O O
~ '~ Q Q N ~ ~ b ~ N a' n N j :~ ~ ~ j , ~ > ; ~ c N cfl U Q Q , U U ~ ' ' N
~ m O N U m m ~
~ ~ ~

a~ a~ a> a~ ~ " Q
~ L L ~ L C
O O ~ O O O C ;p 'p tn O E ~ O ~ ~ O O U N
O N (a f0tn w w p IC f9U ~. C
O M N tWt ~ ~ ~ r ~ ~
V (n(n (n(n p N N ~ (O(n U O
E C~C~ C~C~ ~ ~n ~ C~ C~C~ -a ~ ~ ~.~ ~ ~ U u.

A

v cn N f~/J ' ~ ~ W LL
C C i ~ i ~ '~'+ O N
G7O ~ ~ + ~ ~ I~O N
r ~ ~ ~ ~ ~ N N
O ~ i i N ~
' . n > ;, L . . ~ - n ~ ~ 'c .r~ ' i N . , , + +p ~ +
. +i ~ ~ + + ; _ ~ ~ O O M ~ C Z
d i i ~ ~ ~ ~
N N i i ~ O +
c i i N O O
d O ~ ~ , M i X +
L N i i ~ i - ~ ~
~ C.' . ~ . M o+oa+o ~ ~
_NN ' f' i M ~ M CD ' >
O 'C i i N w ln N p, N ~ i ~ N ~ W ~ V ~ ~
J , ~ ; + + W :a c I
C ch y C ~ c0 N ~ r' ~ ~ U
Z N W O t~
m ~ . i ; ~~ O
a o ~ - Z ; ,~,z ~ a ~ ~ '~ ~ i '~ ~, Q
~ ' N ~ ~ 1 L ; v ~ . ~ E U
M . n W i i ~ ~ O
~ ; O i y ;
. e- i V ; \ + w i (n ~ + I
O N ~ O i y f + ' O L U
. N .~.~ ~ ~ U
O 'c i N. = M ~ O M :
Z N ; ~ O O M ~ C %~ +
O i ; N ; O C~ Z
0 i ; ~ ~ ~ W i ~ +
+r , , + + + ~ + N
a O i ; N 00O (p ; N
L ~ i ln lI~O N i O 7 _ 'Cfl. . ~ ; ; s ~; N N = N a v C i i i ~ N -; ; + + + ' W ; Q f6 4 d ~ o~c~ + ; u~ ~ --i i ~ N M ~ , . N d N i i ; ffl:n=..
~ O
i , N c i 'C N
7 i ~ O
; ~
'O ; p N O i :.~ _ p .~ ~ O
i ; i N E ~O
C ...0_-.0 ~
i ~ . C ' N i C tn O ~ O ~O N
i .~.i Q ; W. ~ r. + 'O
i O i ~% N ~ ; N C O
O L (/) ; V ~ + C
i >,N taE = 'rte.-. V O' n ~ ; 7 O ~ t O ~ tCC~ 7 ~ O
i U , Q ~Z
~ ~ Q a. U ~ ; ~ ~ ' idII
Z i ~- N M ~'(O i a ' ~ E
m >, p c Z
N
v mn o ~" ~' N

M O O
tn ~ O M Cfl I_~ O ~ ~ Op Ö ~N r c' ~ O O
i ~ O i i i i O N i CO I~ ~ M O O N ~ M O
l~ r ~ ~ ~ l~ r ~ O
r U
,d . CU.~ ~ C
U U ~
v~ Q ~ ~ Q (~ ~
ça ,~ ~ U f- ~ F-, U (~ Q Q
N ~ ~ U U U H Q U Q j U
ea ~ ~ a Q ~ C~ H C~ C~ U H
~
~ ~
~ Q U C~ ~ C.~ U C
m ~"~ V H' H F(~- Q H
~ o ' ~ ~ C~ C~ U U ~ ~ ~ U
~ 'Wn E- I- (~ H U ~" U C~
-op'~ v UU~Ua' ~ H~~C~
p~ ~ ~U~' (~la-~~~~~U' ~ ô
V Q H H C~ U I-I-a- U (.a'~ U
cn U C~ C~ U C~ C'~
o c â â â _v°~
c c c o 0 ô
â ~ -a N o~vo~ con c°n(~~ c ~ C~
.". '- ~ ô ion E

'a c a~ a~ o cn c E E o ~c ~~ ~c c~ v~ '~ Z
4? 4? :? ~ ~ .~ c ~n ~n N ~ c~a c~a ~o 0 0 o c V ~ ~ ~ ~ ~+O. .~ O' ~ O Ö ~N
E c o N O ~ ~ ~ ~ O O Q
(û ~. N
Ü ~ Ill LJ UJ ~ .~ ~ C~ U (n (n d~ ~ co r- I~ o o c c~ co cfl cfl cfl cfl cNO ~ ~ ~

n. â â â â â â â,. â
L~L ~ ~ L~L L~L ~ ~ L~L ~

a~

a~

~
v .n ~
v~

t1 t1 'O E
w Z
N

,~, >.
p - L
~ ~

O T ~ ~
~ ~
a >. ~ N M Q
' X a ~ O .O
J

d -a Z

Z N ~ c Q U O M M O Q

a ~D '~ Z ~-I -hl ~ 'O
N

d Q ~ N
N L O

, O M ~ _ _O
M M C

C

N
N I~

<i' f~ N

a _ N ~ - O O p ~ ~ O
N tn t1t1 t1 t1 p 'O (a O
~ C ~ N n ro00 ~ ~ ~ V O
W

~ 1 ~ ~ O O M O O ~ o O

'O 'O ~ ~ (fltn M i~ ~ 7 ~ ~

V C Q ODN (~ M .O ,Q
~

~ ~ c Z U ~

d N .~ ., ..
~ Q. O

'C N ~.(D ~ N t y - ~ C d 'a C ~

r O c ~ ~ p p _ ~ _ O
C G7 ~C~ O -f-ItI tI +~ p L
r,., G7 =
ea 'C ~ O V ~ <n~nO ~ <o ~ 0 N O U

cC M Z N m O O ~ O O ~ ~ ~ n' cC
,~

~'~ D O~ ~ ~ ~ r- c ~ N
~

lC w Q .~ ~ p e- CO M I' N U ( W fl ~ ' O U (D~ I Wl7 .
d ~
O ~

G~ H V U U
O v _ t t~
~ ~G ~ C N Q

~ N O

~C = U ~O L O ftf a .qt = tnm ~
~

O O .~~ ~ N ~ ~
C ~ ( O ~ M -p p ~ N O

~
Q

O t1t1 t1 t1 C ~
w N 'Q 'Q

~,~ ~ rn m M _ O O '~ C
O

V O O ~ O O r- O O ~ ;., O. p~ O

H C~ ~ p ' ~ '- ~ r ~ ~ Q
Ul W

- .....~ N M O N (O Q Q
G7 ~

N
m ~ 'O

V = Q 'O
'~ Q

H ~ \ -C fn '~ ~'~ ~ N

= ~ N U

~ ~ ~ a~ a :a ao a~

>

~ ~ a~ ~
~a _ ~ N _ _ a~ Q
' ~ o ~ 'C ~ ~ ~ O
~ U

O . .
d ~-- w p L ~ N N
U

N LtJ ' _ Z (v ue ~E N

C tn C v , ~ C

V ~ ~ ~ CCC Q O

_ _ V O ~ O a% N N

( ~

O O ~ N N N O ~ v=
~ ~

(C ~ U ~ ~ O ~ ~ ~ O ~ C

f~ f0 C C V ~ ? 1N O ~ O O Q ~

U :r a' ~ ~

_ N ~'~ a~ . ~ N ~ ~
fC c~

tna c'a~ N ~ U D O D ~ J ~
J

~(~ > 3 ~C _ . . . . "
~ . O

(n(nLULl! (n UJ LU (a ~ U CO 'a ~ > N

~n o ea > ~ ~ v v v~
~

O ~ e-~I I ~I I
O

' ~ 00 O CflCO
N

O M N

fB

s ' o ~ ~ ~ ~ ~ c a~ ~ ~ ~- '-i +i +i i .v~ ~ W ~ ~ ~

O ~ f~ ~ M d' C
.., Q ~ O ~ ~ O

O

d ~ W ~ 'tt V ~

vl ~I I . 'p a~

. ~' ~ ~ ~ o o ~ O

Cri I 0~ r C Q
d O
N ~ ~. .-..-.

r r r ~ I ~ ~I I

a v , ' M M ~- o v C M r c- r .Q a ~

d ~~ O

~ + w v ~ ~ ~ ~ ca .. C ~ r O r r c- p tC O ea ~ cUC t '.I.+..I'.I N
~~.
L

~ ~ ~ (n r p O O O o C7i G~ p C ~ M d' d: u7 j O 0 ~ O O
_ ~ r' d .O

H d N a ' =

_ a d o . ~ ~ . d. ~ ~ ~ (fl O
~G7 ~

-V G7 V e- ~ ~ ~- ~ f6 n ~~ I ~ ~-~ 'ca c \ ~ >
N

' O N N
' 0 p f~ O M -'~
~

O V ~ ~ ~ N O

v~ a o ~

r L ~ ~ ~ .
~ ~ a ~ ~ 'c'a _ w a~ _a~v V .n s ' O N V N C C C N
C O

C N ~ N '~ N O N ' ~

N N
N .

V O O -~ J

V +. ~ .. >. p v 3 U V + ~ ~ O

V N

LlJLIJ f~ N
~-h d N

O

V
~

_ O O O O
L

ai ~i~i ln ln Q) N ~ ~ ,L

H! U c.) L. O

~ ~

a a ca .n c c ~

d ~n a c c ~

o ~. '. ~- o C Q p Q ~ N

1~ ~ N . ~ :a ~

c c U :~ ~ a co Z

_ ~ ~ D N
N

G7 ~ 00 O
V

~ N J

N
~D

V V o Z V

p a~
Q

I~ ~ O f0 O I~ I~ ~ M p~ N

M

O
O

V

c N

N E ~ N ( .

c C C 7 ~ , O p Q N

N c tn U
t ~ ~ U fa f~ ~ .t~.tn .gin' ~ t~" Q ~ ~
O

O ~ ~ ~ I~ N ~ ~ ~ ~ , ~ O ~

N

~ ~ ~ 3 0 ~ N N ~ N

_ . C , a .Q ~ ~ t N ' O ~
O ~ ~' .c N t~- (Q U ~

p O "a3cr ~ m p L

a N r- _ th r M r ~ . et '. "-' ...

N CD O CO

U ~ ~ Lntn O h t O ~ f~ (0 ftfI f ~ fl ~ fl N M N

Z ( t ~ ~ ( M f f f ( f f f ~ i a Q O ~ 4B ~ 6 ~ N ~ M ~

t t ~ ~ M

(a ~ ~ f3 f>3(C fa I ~ y I I I I I I I I I I I I
~

,a~

y y y ~ W W W
N o~ ~f uimi ~ ~ ifl ~
'~ ~ ~ o~ ~ ~ ~ ~ o .N

-v N ~ _ ~ c v N = Q ~ ~ O O ,Q ~
7 ~ O
C O O V N N O O
c ~ ~ ~
a ~- Q- - ~ a a n.
p N ~ ~ p O ~ d ~
~ V _3 ~ Q
~ N O M ~ f~ I~ .r M M
O N C N a Z Z ~ (!~(n .iN'-~d N Q p O ~ ~ N C C
L 'N ~ U
' cn _O _p p N N O
j ~ U U c~ ~ rn ~ V

w ~
~
J =
=

'(f O O O O O O O O O O O O
~ O M ~ 00I~ O O ~ ~ O M M
I~ CO N ~ d' ~ OD ~t M N 00 00 a ~

N O O O O O O O O O O O O
.N

d 'a O

_ O N 3 ~
v ce N Q d Q ~ N
V L :v.. .V :-.

d d c ~ ai ~ ~n v~ ~n t a~ ~, a 'cc~a~ ~ ~ N o .
ao a~ o c c c ~ c 3 v E o 0 0 0 3 ~ -Q ~ 0 0 0 p ~ ~ N N
3 p 7 ~ m O ~ ~ ~ O V
N Q O ~ p 'DC ~ cV .
V ~ ~ c~ cn ~ ~ 3 0 0 V a ~ a L ~' ~ X J p O J p ~ ~ M N ~ M ~ r ~ 0~X0~ ~ M ~
~ tn M ~ '-'~ N I~ ~ C~ O M
C N M ~ N M O w. y - O N ~ r-Iv c ~ fa , ca G. O ~ M ~ ' O O (D n N N ~ ~ ~ ~ O ~ ~ ~ N ~ r-~ i ~ N ~ ~ f ~ f f~ , f4 , t0 V 1n M (E DO O O ln ~ O O e-o co cv cu co c~ ca ca ,agi N

O O
N
o .~

Q

C

N 'N O

~O N N
O C ~ Q ~ _ d:
C N ~ C
~ '~ a- O .
!9 ~ '~ d. wC.r C
d N ~ ~ m ~ ~
O N M M N
N a ;~ ~ ~ v) v) .C
C
O ~O ~ N N C C C
N cn ~ ~ O O O
cc > V ' _~o U U U C~
~ '~ U C~

_N
cn Q O
Q ~

a' w o 0 0 0 0 0 0 0 0 0 0 J C ~ ~ O O ~ N O lI~~ M M N ~t Q O ~~ d' 00 f~ O N ~ 00 lf~ I~ I~
~
E"
~
~C

.~ O O O O O O O a0 O O O

N
O N ~ C N N
.N .c~ E Q
~ C U _ O Q E ~, N ~ p -N ( p, C '0 'U N ~C
> '',~ f'l'ip~ ~ .ter X ~ C C . Q U
N C p ~ N ~ ~ ~ IV tJQ-d (~ +,.~ ~ fa ( O
U ~ N ~ N ~ C ,~ ( ~ p ~ j V N ~ ~ ~ ~ .C
Q' UU ~ -U U .'> > ~
~ o C ~ ~ Y Y Y
J Q ~ Z a~ p D
J

N .N~ N v 0~~0C~D
CO ~ ~ N O ~ ~ M_ O N (~ ~ ~ N
(a ~ ~ ~ ~ ~ ~ (a fNC~ C~ N
O M l!>
M ~ ~ O N O ~ r N ~ fB N N
d' O~ ~ ca cB
fa ~ ~ ~ .~ (~ ~ t0 f O i (B

~ M O O lf7M (D f~ tT

O O

O

O

N_N_ d Q j j ,4 c0 'p p 'O ~ .C

n. a ~ ~ ~ . r - .' .' - - -c o O ~ ~ ~ ~ M N

~ ~ ~ U U f~ ~ ,O

v fa f6 , ~ ~

C . . M M ~ C i "'-i''- ,p 7 , + ~ p ;O :O O O 'C p C , , L - 'C 'C N
C C C

. N N C t~ (~ N C N
'a'O w O p p ' O ~U O

_ _ ~ Q Q C
~ ( U ~

N C ~ ~ ~ ~ C o o ~ Q ~

~ ;

N N U O O c~ (~

M Q c9 ca Q Q Q p p N

N ~ ~ C
d >,>, ts O

r E ~ O N ~ 'a '~
C

p O LLI('>

j C~ U

c~c~

0 0 0 0 0 0 0 0 o a o 0 ln 00 N M O M 00 M ~ ln CO

Q) O O 0000 I~ 00 O I' CO O O

O O O O O M O O O O O O

N
L O C ln U 'O
-~
.

O U O ~
~

O_ ~p)O (afB ~ ~ ~ p U .~ ~' ~
- O
.

~ O

N ~n O O a T ~ cC O
O

N C _ L X X ~ U Q X ~ ~ L O
~ O O ~ 'C .

L L ~T ~ N ~ L in ~O i~

O O t0 C , U O ~ 3 O

O O O t0 C O ~ ~- V ~ ~
J

~ Q' (0(0 L O ~ L ~ O ce N ~ L E O , O ~
~ t) V p G7 ~ O ~ ~ O O O ~ p O E
' ~ ~ = ~ w o = ~

D o 0 ' 0 ~ Z - C
C

Q Q ~ ~ _ ~ ~ .
N

o .

L a o a N N ~ ~
N .~ ~. r.

O

~. _c0 ~ ~ 1~ 1~ O N M O M ~

v ~ N c' ~ ,O N
~

r _ N

M N ~ N ~ 00 00 00 ~ ln ~ ~
N

C fB N fa N f~ fa f6 N M M M tn i i ~ i f0 fa f~ ~ ~ O N

V 001~ O M I~ 1' t' 00 ~ U
a O O

O ~ O N

t I0 N f0 0 Z

TABLEAU 9 : Séquences Dsi nation SEQ ID N

Sondes et amorces FGPS614 . 15 63f 22 1387r 23 Oli o-1 Exem le 10 24 Oli o-2 Exem le 10 25 A2 ~ 27 Acides nucli ues PKS-I

Amb9 30 Amb12 31 A9b12 33 TABLEAU 9 (suite 1):Séquences Dsi nation SEQ ID N

A17d2-3 39 S uences d'acides amins PKS-I

Amb9 45 Amb12 ~ 46 A9b12 48 A17d2-3 54 S uences ADNr 16S

a24.1 2 , 60 a4.a6.a7 7 61 a52.a53.a5 15 62 a49.a50.a51 11 63 a4.a6.a7 14 64 a30.a31.a32 7 65 a37.a38.a39 6 66 a46.a47.a48 14 67 a49.a50.a51 1 68 a52.a53.a5 8 69 a8.a9.a10 13 70 a1.a2.a3 13 71 a43.a44.a4510 72 a27.a28.a29(5) 73 TABLEAU 9 (suite 2):Séquences Dsi nation SEQ ID N

a23.1 74 a25.1 75 a18.1 22 76 a33.1 77 a14.7 78 a21.7 79 a8.a9.a10 7 80 a8.a9.a10 18 81 a27.a28.a29 3 82 a34.a35.a36 5 83 a22.1 19 84 a11.a12.a13 5 85 a19.a20.a26 9 86 a40.a41.a42 6 87 a27.a28.a29 8 88 a27.a28.a29 12 89 a37.a38.a39 12 90 a46.a47.a48 6 91 a11.a12.a13 11 92 a15.a16.a17 12 93 a15.a16.a17 5 94 a19.a20.a26 13 95 a37.a38.a39 14 96 a8.a9.a10 9 97 a19.a20.a26 5 98 a43.a44.a45 4 99 a1.a2.a3 4 100 a4.a6.a7 23 101 a49.a50.a51 22 102 a8.a9.a10 2 103 a34.a35.a36 3 104 a34.a35.a36 10 105 a40.a41.a42 13 106 TABLEAU 9 (suite 3) Sé4uences Dsignation SEQ ID
N

Amorces cos 1 n (exemple 5) 107 cos 2 n (exemple 5) 108 EV~c 311 (exemple 15) 109 Bll~c 31 F (exemple 15) 110 Amorce 1 (exemple 15) 111 Amorce 2 (exemple 15 112 Acides nucliques PKS-I

Cosmide a2641 (vecteur + insert113 brin (-) Cosmide a2641 (insert - brin 114 (+) orf1 115 orf2 116 orf3 117 orf4 118 orf5 119 orf6 120 Squences acides amins PKS-I

REFERENCES
~ Amann, R. L, W. Ludwig, and K.-H. Schleifer. 1995. Phylogenetic identification and in situ detection of individual microbial cells without cultivation. Microbiol. Rev. 59:143-169.
~ Atschul S.F., Madden T.L., Sch~ffer A.A., Zhang J., Zhang Z., Miller W., Lipman D.J. (1997) " Gapped BLAST and PSI-BLAST : a nex generation of protein databses search programs " Nucleic Acid Researchs Vol 25 : 3389-3404 ' ~ Atschul SF et al., 1990, J. Mol Biol, 215 : 403-410.
~ Bakken, L. R. 1985. Separation and purification of bacteria from soit. Appl.
Environ. Microbiol. 49:1482-1487.
~ Bibb MJ, Findlay PR, Johnson MW, The relationship between base composition and codon usage in bacterial genes and its use for the simple and reliable identification of protein-coding sequences., Gene 30: 1-3, 157-66, Oct, 1984.
~ Biesiekierska-Galguen M. (1997) " Atténuation biologique de contaminants xénobiotiques dans le sol - modèle lindâne " Diplôme de DEA
National de Toxicologie, Université Claude Bernard Lyon I.
~ Blondelet-Rouault MH, Weiser J, Lebrihi A, Branny P, Pernodet JL.
Institut de Genetique et Microbiologie, URA CNRS 2225, Universite Paris XI, Orsay, France. Gene 1997 May 6;190(2):315-7 ~ Borchert S et al., 1992, Microbiology Letters, 92 : 175-180 ~ BLONDELET-ROUAULT, 1997, Gene, 315-317.

~ Boccard, F., Smokvina, T. Pernodet, J.L. Friedmann, A. & Guerineau M. (1989) . The integrated conjugative plasmid pSAM2 of Streptomyces ambofaciens is related to temperature bacteriophages. Embo J 8,973-80 ~ Chatzinotas A., Sandaa R-A., Sch~nhuber W., Amanna R., Daae F.L., Torsvik V., Zeyer J., Hahn D. (1998) " Analysis of broad-scale differences in micrôbial community composition of two pristine forest soils " Systematic and Applied Microbiology Vol 21 : 579-587 ~ Clegg, C. D., K. Ritz, and B. S. Griffiths. 1997. Direct ectraction of microbial community DNA from humified upland soils. Lett. Appl. Microbiol.
25:30-33.
~ Clerc-Bardin, S., J.-L. Pernodet, A. Frostegârd, and P. Simonet.
Development of a conditional suicide system for a Streptomyces lividans strain and its use to investigate conjugative transfer in soit. Submitted.
~ Elledge SJ, Mulligan JT, Ramer SW, Spottswood M, Davis RW.
Department of Biochemistry, Baylor College of Medicine, Houston, TX
77030. Proc Natl Acad Sci U S A 1991 Mar 1;88(5):1731-5 ~ Engelen, B., K. Meinken, F. Von Wintzingerode, H. Heuer, H.-P.
Malkomes, and H. Backhaus. 1998. Monitoring impact of a pesticide treatment on bacterial soit communities by metabolic and genetic fingerprinting in addition to conventional testing procedures. Appl. Environ.
Microbiol. 64:2814-2821.
~ Farrelly, V., F. A. Rainey, and E. Stackebrandt. 1995. Effect of genome size and rm gene copy number on PCR amplification of 16S rRNA genes from a mixture of bacterial species. Appl. Environ. Microbiol. 61:2798-2801.
~ Faulkner D.V., Jurka J. (1988) " Multiple Aligned Sequence Editor (MASE) " Trends in Biochemical Sciences Vol 13 : 321-322 ~ FRENGEN et al., 1999, Genomics, 58: 250-258.

~Frostegârd, d., Tunlid, A., and Bââth, E. 1991. Microbial biomass measured as total lipid phosphate in soils of different organic content. J.
Microbiol. Meth. 14:151-163.
~Giddings, G. 1998. The release of genetically engineered micro-organisms and viruses into the environment. New Phytol. 140:173-184.
~Gladek, A., and J. Zakrzewska. 1984. Genome size of Streptomyces.
FEMS Microbiol. Lett. 24:73-76.
~Gribskov M, Devereux J, Burgess RR, The codon preference plot: graphic analysis of protein coding sequences and prediction of gene expression., Nucleic Acids Res 12: 1 Pt 2, 539-49, Jan 11, 1984.
~Guiney et al., 1983, Proc. Natl. Acad. Sci USA, (12) : 3595-3598.
~ Gourmelen, A. Blondelet-Rouault, M.H. & Pernodet, J.L. (1998).
Characterization of a glycosyl transferase inactivating macrolides, encoded by gimA from Streptomyces ambofaciens, Antimicrob Agents Chemother 42, 2612-9.
~ Hayakawa, M., and H. Nonomura. 1987. Humic acid-vitamin agar, a new medium for the selective isolation of soit actinomycetes. J. Ferment. Technol.
65:501-509.
~ Hayakawa, M., Ishizawa K., and H. Nonomura. 1988. Distribution of rare actinomycetes in Japanese soils. J. Ferment. Technol. 66:367-373.
~ Hickey, R. J., and H. D. Tresner. 1952. A cobalt containing medium for sporulation of Streptomyces species. J. Bacteriol. 64:891-892.
~ Hintermann, G., R., Crameri, Kieser, T., and R. Hütter. 1981. Restriction analysis of the Streptomyces glaucescens genome by agarose gel electrophoresis. Arch. Microbiol. 130:218-222.

~ Holben, W. E., J. K. Jansson, B. K. Chelm, and J. M. Tiedje. 1988. DNA
probe method for the detection of specific microorganisms in the soil bacterial community. Appl. Environ. Microbiol. 54:703-711.
~ Hong Fu et al., 1995, Molecular diversity, 1 : 121-124 ~ Hopwood DA, Bibb M J, Chater K F, Kieser T., Bruton C.J., Kieser H.M., Lydiate D.J., Smith C.P., Ward J.M. and Scrempf H. 1985. Genetic Manipulation of Streptomyces. A Laboratory manual. The John Innes Foundation, Norwich, U.K.
~ Hopwood, D. A., M. J. Bibb, K. F. Chater, T. Kieser, C. J. Bruton, H. M.
Kieser, D. J. Lydiate, C. P. Smith, J. M. Ward, and H. Schrempf. 1985.
Genetic manipulation of streptomyces - a laboratory manual. The John Innes Foundation, Norwich, United Kingdom.
~ Hohm B. and Collins J., 1980, Gene, 11:291-298.
~ Horinouchi S., Malpartida F., Hopwood D. et Beppu T., Mol. Gen.
Genet. (1989) 215 :355-357.
~ Imai R., Nagata Y., Fukuda M., Takagi M., Yano K. (1991 ) " Molecular cloning of a Pseudomonas paucimobilis gene encoding a 17-kilodalton plypeptide that eliminates HCI molecules from ?-Hexachlorocyclohexane "
Journal of Bacteriology Vol 17 ", No21 : 6811-6819 ~ Jacobsen, C. S., and O. F. Rasmussen. 1992. Development and application of a new method to extract bacterial DNA from soit based on separation of bacteria from soit with cation-exchange resin. Appl. Environ.
Microbiol. 58:2458-2462.
Jae-Hyuk Y.U. and Leonard T.J.,1995. Sterigmetscytin biosynthesis in Aspergilus nidulans requires a ... type I polyketide synthase. J. Bacteriol, (August) : 4792-4800.

15l ~ Ka, J. O., W. E. Holben, and J. M. Tiedje. 1994. Analysis of competition in soit among 2,4-dichlorophenoxyacetic acid-degrading bacteria. Appl.
Environ. Microbiol. 60:1121-1128.
~ Kah-Tong S et al., 1997, J Bacteriol, G179(23) : 7360-7368 ~ Kimura M. (1980) " A simple method for estimating evolutionary rates of base substitutions through comparative studies of nucleotide sequences "
Journal of Molecular Evolution Vol 16 : 111-120 ~ Kuske, C. R., K. L. Bantou, D. L. Adorada, P. C. Stark, K. K. Hill, and P.
J. Jackson. 1998. Small-scale DNA sample preparation method for field PCR detection of microbial cells and spores in soit. Appl. Environ. Microbiol.
64:2463-2472.
~ Lacalle RA, Pulido D, Vara J, Zalacain M, Jimenez A. Centro de Biologia Molecular (CSIC-UAM), Universidad Autonoma, Canto Blanco, Madrid, Spain. Gene 1989 Jul 15;79(2):375-80 ~ Lee, S.-Y., J. Bollinger, D. Bezdicek, and A. Ogram. 1996. Estimation of the abondance of an uncultured soil bacterial strain by a competitive quantitative PCR method. Appl. Environ. Microbiol. 62:3787-3793.
~ Leff, L. G., J. R. Dana, J. V. McArthur, and L. J. Shimkets. 1995.
Comparison of methods of DNA extraction from stream sediments. Appl.
Environ. Microbiol. 61:1141-1143.
~ Liesack, W., and E. Stackebrandt. 1992. Occurrence of novel groups of the domain Bacferia as revealed by analysis of genetic material isolated from an Australian terrestrial environnent. J. Bacteriol. 174:5072-5078.
~ Liesack, W., P. H. Janssen, F. A. Rainey, N. L. Ward-Rainey, and E.
Stackebrandt. 1997. Microbial diversity is soil: the need for a combined approach using molecular and cultivation techniques. In J. D. Van Elsas, J.

T. Trevors, and E. M. H. Wellington (ed.), Modern soil microbiology, Marcel Dekker, Inc., New York. (p 375-439) ~ Lorentz, M. G., and W. Wackernagel. 1994. Bacterial gene transfer by natural genetic transformation in the environnent. Microbiol. Reviews 58:563-602.
~ Maidak B.L., Cole J.R., Parker C.T., Garrity G.M., Larsen N., Li B., Lilburn T.G., McCaughey M.J., Olsen G.J., Overbeek R., Pramanik S., Schmidt T.M., Tiedje J.M., Woese C.R. (1999) " A new project of the RDP
(Ribosomal Database Project) " Nucleic Acids Research Vol 27 : 171-173 ~ Mazodier P. et al., 1989, J. Bacteriol., 171(6) : 3583-3585.
~ Moré, M. L, J. B. Herrick, M. C. Silva, W. C. Ghiorse, and E. L. Madsen.
1994. Quantitative cell lysis of indigenous microorganisms and rapid extraction of microbial DNA from sediment. Appl. Environ. Microbiol.
60:1572-1580.
~ Murakami T, Holt TG, Thompson CJ, Unité de Génie Microbiologique, Institut Pasteur, Paris, France. J. Bacteriol 1989 Mar;171(3):1459-66 ~Nagata Y., Hatta T., Imai R., Kimbara K., Fukuda M., Yano K., Takagi M.
(1993) " Purification and characterization of ?-Hexachlorocyclohexane (?-HCH)dehydrochlorinase (LinA) from Pseudomonas paucimobilis "
Bioscience, Biotechnology and Biochemistry Vol 57 No 9 : 1582-1583 ~ Nalin R., Simonet P., Vogel T.M., Normand P. (1999) " Rhodanobacter lindaniclasticus gen.nov., sp., nov., a lindane-degrading bacterium "
International Journal of Systematic Bacteriology Vol 49 : 19-23 ~ Nesme, X., C. Picard, and P. Simonet. 1995. Specific DNA sequences for detection of soil bacteria. In J. T. Trevors, and J. D. van Elsas (ed.), Nucleic acids in the environnent, methods and application. Springer Lab Manual. (p 111-139) ~ Nilsson B, Uhlen M, Josephson S, Gatenbeck S, Philipson L. Nucleic Acids Res 1983 Nov 25;11(22):8019-30 ~ Normand P. et al., 1995, Océanis, 21 (1 ) : 31-56 ~Ogram, A. V., M. L. Mathot, J. B. Harsh., J. Boyle, and C. A. Pettigrew, JR. 1994. Effects of DNA polymer length on its adsorption to soils. Appl.
Environ. Microbiol. 60:393-396.
~Ogram, A., G. S. Sayler, and T. Barkay. 1987. The extraction and purification of microbial DNA from sediments. J. Microbiol. Methods 7:57-66.
~Olsen, R. A., and Bakken, L. R. 1987. Viability of soit bacteria:
optimization of the plate-counting technique. Microb. Ecol. 13:59-74.
~Paget, E., L. Docteur Monrozier, and P. Simonet. 1992. Adsorption of DNA on clay minerais: protection against DNasel and influence on gene transfer. FEMS Microbiol. Lett. 97:31-40.
~Patra, G., P. Sylvestre, V. Ramisse, J. Thérasse, and J.-L. Guesdon.
1996. Isolation of a specific chromosomic DNA sequence of Bacillus anthrasis and its possible use in diagnosis. FEMS Immunol. Medical Microbiology 15:223-231.
~ Pernodet J.L. Fish, S. Blondelet-Rouault, M.H. ~ Cundliffe, E. (1996).
The macrolide-lincosamide-streptogramin B resistance phenotypes characterized by using a specifically deleted, antibiotic-sensitive strain of Streptomyces lividans. Antimicrob Agents Chemother 40, 581, 5.
~ Pernodet J.L. , Gourmelen, A., Blondelet-Rouault, M.H. ~ Cundliffe, E.
(1999). Dispensable ribosomal resistance to spiramycin conferred by srmA in the spiramycin producer Streptomyces ambofaciens. 145, 2355-64.
.Picard, C., C. Ponsonnet, X. Nesme, and P. Simonet. 1992. Detection and enumeration of bacteria in soit by direct DNA extraction and polymerase chain reaction. Appl. Environ. Microbiol. 58:2717-2722.

~Preud'homme, J., Belloc, A., Charpentié, Y., and Tarridec, P. 1965. Un antibiotique formé de deux groupes de composants à synergie d'action : la pristinamycine C. R. Acad. Sci. 260 :1309-1312.
~Priemé, A., J. I. B. Sitaula, A. K. Klemedtsson, and L. R. Bakken. 1996.
Extraction of methane-oxidizing bacteria from soil particles. FEMS Microbiol.
Ecol. 21: 59-68.
~Prosser, J. 1994. Molecular marker systems for detection of genetically engineered micro-organisms in the environnent. Microbiol. 140:5-17.
~ Raynal A, Tuphile K, Gerbaud C, Luther T, Guérineau M, Pernodet JL ;
Laboratoire de Biologie et Génétique Moleculaire, Institut de Génétique et Microbiologie, URA CNRS 2225, Université Paris-Sud, Orsay, France. Mol Microbiol 1998 Apr;28(2):333-42 ~ Raynald A. Tuphile, K. Gerbaud, C., Luther, T. Guerineau, M. &
PERNODET, J.L. (1998). Structure of the chromosomal insertion site for pSAM2: functional analysis in Escherichia coli. Mol. Microbiol 28, 333-42.
~ Richard, G. M. 1974. Modifications of the diphenylamine reaction giving increased sensitivity and simplicity in the estimation of DNA. Analytical Biochem. 57:369-376.
~ Romanowski, G., M. G. Lorentz, and W. Wackernagel. 1993. Use of polymerase chain reaction and electroporation of Escherichia coli to monitor the persistence of extracellular plasmid DNA introduced into natural soils.
Appl. Environ. Microbiol. 59:3438-3446.
~ Saitou N., Nei M. (1987) " The Neighbour-Joining method : a new method for reconstructing phylogentic trees " Molecular and Biological Évolution Vol 2 : 112-118 ~ Sambrook J., Fritsch E. F. et Maniatis T. 1996. Molecular cloning : a laboratory manual, 2"d ed. Cold spring Harbor Laboratory Press, Cold Sring Harbor, N.Y.
~Sambrook, J., E. F. Fritsch, and T. Maniatis. 1989. Molecular cloning: a laboratory manual, tnd ed. Cold Spring Harbor Laboratory, Cold Spring Harbôr, N. Y.
~ Senoo K ., Wada H. (1989) " Isolation and identification of an aerobic ?-HCH-decomposing bacterium from soit " Soil Science, Plant Nutrition Vol 35, No 1 : 79-87.
~ Sezonov, G., Blanc, V., Bamas-Jacques, N., Friedmann, A. Pernodet, J.L. 8~ Guerineau, M.(1997). Complete conversion of antibiotic precursor to pristinamycin IIA by overexpression of Streptomyces pristinae biosynthetic genes. Nat Biotechnol 15,349-53.
~ Shirting, E. B., and D. Gottlieb. 1966. Methods for characterization of Streptomyces species. Int. J. Syst. Bacteriol. 16:313-340.
Shizuga et al., 1992, Proc. Natl. Acad. Sci USA, 89 : 8794-8797.
~ Siefert, J. L., and G. E. Fox. 1998. Phylogenetic mapping of bacterial morphology. Microbiology 144:2803-2808.
~ Simonet, P., P. Normand, A. Moiroud, and R. Bardin. 1990. Identification of Frankia strains in nodules by hybridization of polymerase chain reaction products with strain-specific oligonucleotide probes. Arch. Microbiol.
153:235-240.
~ Smalla, K., N. Cresswell, L. Mendonca-Hagler, A. Wolters, and D. J.
van Elsas. 1993. Rapid DNA extraction protocol from soit for polymerase chain reaction-mediated amplification. J. Appl. Bacteriol. 74:78-85.
~ SOSIO M. et al. 2000, Nature Biotechnology, vo1.18,:343-345.

~ Smit, E., P. Leeflang, and K. Wernars. 1997. Detection of shifts in microbial community structure and diversity in soit caused by copper contamination using amplified ribosomal DNA restriction analysis. FEMS
Microbiol. Ecol. 23:249-261.
~ Smokvina T, Mazodier P, Boccard F, Thompson CJ, Guerineau M.
Laboratoire de Biologie et Genetique Moleculaire, Universite Paris-Sud, Orsay, France. Gene 1990 Sep 28;94(1):53-9 ~ Smolvina, T., Mazodier, P. Boccard, F. Thompson, C.J. & Guerineau, M. (1990). Construction of a series of pSAM2-based integrative vectors for use in actinomycetes. Gene 94, 53-9.
~ Stackebrandt, E. 1988. Phylogenetic relationships vs. phenotypic diversity:
how to achieve a phylogenetic classification system of the eubacteria. Can.
J. Microbiol. 34:552-556.
~ Staneck, J. L., and G. D. Roberts. 1974. Simplified approach to identification of aerobic Actinomycetes by thin-layer chromatography. Appl.
Microbiol. 28:226-231.
~ Stapleton, R. D., S. Ripp, L. Jimenez, S. Cheol-Koh, J. T. Fleming, I. R.
Gregory, and G. S. Sayler. 1998. Nucleic acid analytical approaches in bioremediation: site assessment and characterization. J. Microbiol. Methods 32:165-178.
~ Steffan, R. J., J. GoksOyr, A. K. Bej, and R. Atlas. 1988. Recovery of DNA from soils and sediments. Appl. Environ. Microbiol. 54:2908-2915.
~ Tebbe, C. C., and W. Vahjen. 1993. Interference of humic acids and DNA
extracted directly from soil in detection and transformation of recombinant DNA from bacteria and a yeast. Appl. Environ. Microbiol. 59:2657-2665.

~ Tercero JA, Espinosa JC, Lacalle RA, Jimenez A . Centro de Biologia Molecular Severo Ochoa, Consejo Superior de Investigaciones Cientificas, Madrid, Spain. J Biol Chem 1996 Jan 19;271 (3):1579-90 ~ Thomas J-C., Berger F., Jacquier M., Bernillon D., Baud-Grasset F., Truffaut N., Normand P., Vogel T .M., Simonet P. (1996) " Isolation and Characterisation of a novel ?-Hexachlorocyclohexane-degrading bacterium "
Journal of Bacteriology Vol 178, No20 : 6049-6055 ~Torsvik, V. L. 1980. Isolation of bacterial DNA from soit. Soil Biol.
Biochem.
12:15-21.
~ Torsvik, V., R. Sa~rheim, and J. Goksmyr. 1996. Total bacterial diversity in soit and sediment communities - a review. J. Ind. Microbiol. 17:170-178.
~ Tsai, Y.-L., and B. Olson. 1991. Rapid method for direct extraction of DNA
from soil and sediments. Appl. Environ. Microbiol. 57:1070-1074.
~ Umeyama T., Tanabe Y., Aigle B.D. et Horinuochi S., FEMS (1996) 144 :177-184.
~ Van Elsas, J. D., G. F. Duarte, A. S. Rosado, and K. Smalla. 1998.
Microbiological and molecular biological methods for monitoring microbial inoculants and their effects in the soit environment. J. Microbiol. Methods 32:133-154.
.Van Elsas, J. D., V. M~ntynen, and A. C. Wolters. 1997. Soil DNA
extraction and assessment of the fate of Mycobacterium chlorophenolicum strain PCP-1 in different soils by 16S ribosomal RNA gene sequence based most-probable-number PCR and immunofluorescence. Biol. Fert. Soils 24:188-195.
~ Volff JN et al., 1996, Mol. Microbiol., 21(5) : 1037-1047.
~ Volossiouk, T., E. J. Robb, and R. N. Nazar. 1995. Direct DNA extraction for PCR-mediated assays. Appl. Environ. Microbiol. 61:3972-3976.

~ Wahl GM, Lewis KA, Ruiz JC, Rothenberg B, Zhao J, Evans GA. Proc Natl Acad Sci U S A 1987 Apr;84(8):2160-4 ~ Waksman, S. A. 1961. Williams and Wilkins (ed.) The actinomycetes.
Classification, identification and description of genera and species.Vol 2.
Baltimore.
~ Ward, D. M., R. Welter, and M. M. Bateson. 1990. 16S rRNA sequences reveal numerous uncultured microorganisms in a natural community. Nature 344:63-65.
~ Widmer, F., R. J. Seidler, and L. S. Watrud. 1996. Sensitive detection of transgenic plant marker gene persistence in soit microcosms. Mol. Ecol.
5:603-613.
~ Williams, S.T., R. Locci, A. Beswick, D. I. Kurtb~ke, V. D. Kuznetsov, F.
J. Le Monnier, P. F. Long, K. A. Maycroft, R. A. Palma, B. Petrolini, S.
Quaroni, J. I. Todd, and M. West. 1993. Detection and identification of novel actinomycetes. Res. Microbiol. 144:653-656.
~ Wilson, I. G. 1997. Inhibition and facilitation of nucleic acid amplification.
Appl. Environ. Microbiol. 63:3741-3751.
~Woese, C. R. 1987. Bacterial evolution. Microbiol. Rev. 51:221-271.
Yannish-Perron et al., 1985 , Gene, 33(1) : 103-119.
~Zaslavsky, B. Y. 1995. Separation of biomolecules, p. 503-667. In Aqueous two-phase partitioning. Boris Y. Zaslavsky (ed.) Physical Chemistry and Bioanalytical Applications, Marcel Dekker, Inc., New York.
~ Zhou, J., M. A. Bruns, and J. M. Tiedje.1996. DNA recovery from soils of diverse composition. Appl. Environ. Microbiol. 62:316-322.

LISTE DE SEQUENCES
<110> Aventis Pharma S.A.
<120> Procédé d'obtention d'acides nucléiques à partir d'un échantillon de sol, acides nucléiques ainsi obtenus et leur application à la synthèse de composés <130> Banque d'ADN du sol - RPR S.A.
<140>
<141>
<150> FR9915032 <151> 1999-11-29 <160> 126 <170> PatentIn Ver. 2.1 <210> 1 <211> 15 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: sonde <220>
<221> variation <222> (14) <223> Base A remplacée par G
<4'00> 1 acgggcggtg tgtac 15 <210> 2 <211> 22 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: amorce <400> 2 ggagagtttg atcatggctc ag 22 <210> 3 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: amorce <400> 3 cctggagtta agccccaagc 20 <210> 4 <211> 24 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: sonde <220>
<221> variation <222> (20) <223> T remplacée par C
<400> 4 gtgagtnnna acctgcccct gact 24 <210> 5 <211> 21 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: sonde <400> 5 gtgagtaacc tgcccccgac t 21 <210> 6 <211> 23 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: amorce <400> 6 ttaattcact tgcaactgat ggg 23 <210> 7 <211> 23 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: amorce <400> 7 aacgatagct cctacatttg gag 23 <210> 8 <211> 25 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la sêquence artificielle: sonde C501 <400> 8 ttgctgatac ggtatagaac ctggc 25 <210> 9 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: amorce <400> 9 tccagatcct tgacccgcag 20 <210> 10 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: amorce <400> 10 cacgacattg cactccaccg 20 <210> 11 <211> 16 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: sonde <400> 11 ccgtgagccg gatcag 16 <210> 12 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle:FGPS612 <220>
<221> variation <222> (2) <223> Base C remplacée par T
<220>
<221> variation <222> (7) <223> Base T remplacée par C
<220>
<221> variation <222> (7) <223> Base T remplacée par A
<400> 12 ccaacttcgt gccagcagcc 20 <210> 13 <211> 21 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle:FGPS669 <220>
<221> variation <222> (7) <223> Base A remplacée par G
<220>
<221> variation <222> (13) <223> Base A remplacée par C
<400> 13 gacgtcatcc ccaccttcct c 21 <210> 14 <211> 18 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence arti~ficielle:FGPS618 <220>
<221> variation <222> (5) <223> Base T remplacée par C
<400> 14 atggttgtcg tcagctcg . 18 <210> 15 <211> 21 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle:FGPS614 <400> 15 gtgtagaagt gaaattcgat t 21 <210> 16 <211> 18 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle:FGPS615 <400> 16 cggtggatga tgtggatt 1g <210> 17 <211> 18 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la sêquence artificielle:FGPS616 <400> 17 aggttaaaac tcaaatga 1g <210> 18 <211> 18 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle:FGPS621 <400> 18 atacgtaggt ggcaagcg 1g <210> 19 <211> 19 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle:FGPS617 <400> 19 gccggggtca actcggagg 19 <210> 20 <211> 18 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle:FGPS680 <220>
<221> variation <222> (11) <223> Base A remplacée par C
<220>
<221> variation <222> (11) <223> Base A remplacée par T
<220>
<221> variation <222> (13) <223> Base T remplacée par A
<400> 20 tgagtcccca actccccg 18 <210> 21 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle:FGPS619 <400> 21 gcttggggct taactccagg 20 <210> 22 <211> 21 <212> ADN
<213> Sêquence artificielle <220>
<223> Description de la séquence artificielle:amorce 63f <400> 22 caggcctaac acatgcaagt c 21 <210> 23
8 <211> 18 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: amorce 1387r <400> 23 gggcggngtg tacaaggc 1g <210> 24 <211> 30 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle:oligo-1 <400> 24 gcttatttaa atattaagcg gccgcccggg 30 <210> 25 <211> 28 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la sêquence artificielle:oligo-2 <400> 25 cccgggcggc cgcattaata tttaaata 2g <210> 26 <211> 23 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle:amorce al <400> 26 ccncagnagc gcntnttnct nga 23 <210> 27 <211> 22
9 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle:amorce a2 <400> 27 gtnccngtnc cgtgngtntc na 22 <210> 28 <211> 23 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle:amorce b1 <400> 28 ccncagnagc gcntnctnct nga 23 <210> 29 <211> 22 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence arti~ficielle:amorce b2 <400> 29 gtnccngtnc cgtgngcctc na 22 <210> 30 <211> 672 <212> ADN
<213> Streptomyces ambofaciens <400> 30 ccccagcagc acgtgttcct cgagacggtg tgggagacct tcgaatccgc cggagtggac 60 ccgcgcgcgg tacgcggtcg ttccgtcggg atgttcgtcg gcaccaacgg acaggactac 120 ccggtggtgt tggccggatc cgccgacgag ggcctggacg cccacgcggc caccggtaac 180 gcggcggcgg tgctgtccgg ccgggtctcg tacgccttcg gcctggaagg gccggcggtc 240 accgtcgaca cggcgtgttc gtcgtcgctg gtggcccttc acctggccgc gcaggcgctg 300 cggcgcggcg agtgcgatct ggcactcgcc ggcggtgtgt cggagatgtc caccgaggcg 360 gcgttcaccg agttcgcccg gcagggcggc ctggccgacg acggccgctg caaggccttc 420 tcggccgacg ccgacggcac gggctggggc gagggcgtcg gcgtcctgct ggtggagcgg 480 ctggcggacg cccgccgcaa cgggcaccgg gccctcgcgc tggtacgggg cagcgcggtc 540 aaccaggacg gcgcctccaa cggtctgacg gcacccaacg gcccgtccca gcagcgagtc 600 atccggcagg cactggcgga cgcccggctg tcgccgtcgg aggtcgacgc ggtcgagacc 660 cacggcaccg gc 672 <210> 31 <211> 665 <212> ADN
<213> Streptomyces ambofaciens <400> 31 ccccagcagc gcgtgttcct ggaagcgtcc tgggaggcgg tcgagcgggc aggcatcgac 60 atgcgcaccc tgcgcggtgg acgcaccggc gtcttcgccg gcgtgatgta ccacgactac 120 ccgtcggtgg tcgaccccga agcgctcgac ggctacctgg gcacggccaa cgccggcagc 180 gttctctccg gccgcatcgc ctacaccttc gggcttcagg gaccggcggt caccgtggac 240 acggcctgct cctcgtccct ggtggcgctg cacctcgccg cccaggcgct gcccgccggc 300 gagtgcgaac tcgccctggt cggtggggtc acggtcatgt ccggcccgat gatgttcgcg 360 ggcttcggcc tggaagacgg ctctgccgcc gacggccgct gcaaggcgtt cgccgccgcc 420 gccgacggca ccggctgggg cgagggtgtc ggtgtgctgc tggtggagcg gctgtcggac 480 gcccggcgcc acgggcaccg ggtgctggcc gtggtgcgcg gtagcgcggt caaccaggac 540 ggtgcctccg gcggcctcac cgcccccaac ggacctgccc agcagcgcgt catccgtcag 600 gccctggcga gcgcggcact cgtaccggcc gaggtcgacg cggtcgagac ccacggcacc 660 gggac 665 <210> 32 <211> 671 <212> ADN
<213> Saccharopolyspora erythraea <400> 32 ccgcaggagc gcgtgttcct ggaactcgct tgggaagcac ttgataacgc gggcatcgca 60 ccgcacagcc tcagggacag ccggacgggc gtgttcttcg gagctatgtg gcacggctac 120 gcgcagttcg cagccggagc cgtcgaccgc atcacccagc acaccgcgac cgggcacgac 180 ctgagcatca tcccggccag gatcgcctac ttcctgggct tgcgcggccc ggacatgacc 240 ctgaacaccg cgtgctcatc ggctttggtg gccatgcacc aggcacgcca aagcatcctg 300 ctgggcgaat cctcggtcgc cttggtcggc gggatcagct tgttggtcgc gctggacagc 360 atggtcgcca tgtcgcggtt cggagcgatg gccccggacg gccggtgcaa ggcattcgac 420 tctcgcgcga acggctacgt gcgcggcgaa ggcggcggtg tcgtggtgct caaaccgctg 480 tcgcgcgctc tggccgatgg caacccggtc tactgcgtcc tgcgcggcag cgcggtcaac 540 aacgacggct tcagcaatgg ccttaccgcg ccgagcccgg cggcgcagga gcaggtactg 600 cgcgacgcct acgccaacgc cggggtcgat ccggcacagg tcgactacgt cgagacccac 660 gggaccggca c 671 <210> 33 <211> 686 <212> ADN
<213> Organime Inconnu <220>

<223> Origine de la sêquence :organisme du sol <400> 33 ccgcaggagc gcgtgttcct cgagtcgtgc tgggaggcgc tggagcatgc tggatacgat 60 actgcacgct accccggccg catcgggctg tgggccggcg cgggcttcaa cagctacctc 120 ctgaccaatc tcatgaacaa ccgcgccttt ttagagagcg tgggcatgta ccagatcttt 180 ctgagcaacg acaaggactt catcgccacc cgcacggctt acaagttaaa cctgcgcggt 240 ccggcgatgg ccgtcggcac cgcctgttcc acatcgctgg tggcggttca cgaagcttgc 300 caggcgctgc ggctgggcga gtgtgacatg gcactggccg gtgctgcgtc tgtcagcacg 360 cccctccggg agggctacct ctaccaggaa ggcatgatta tgagccgtga cggcgtctgc 420 cgcccgtttg acgccgacgc cgatggcacg gtgctgggca atggcgtggc ggtcgtggtg 480 ctcaagcggc tggacgaagc gctccgggac ggtgacacgg tctacgccgt gattcgtggc 540 acggcggtca acaacgacgg ctctgtcaag atcgggttca cggcgcccag cgccgagggg 600 cagagccggg tcgtgcggga cgccctgcgg gcggccgcgg tcccggcgga gagcgtgacc 660 tacgtcgaca cgcacggcac cggcac 686 <210> 34 <211> 689 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 34 ccccagcagc gcctgttcct cgagtgcgcg tgggaagcga tggagaacgc gggatatgcg 60 gcgcgaagct ataagggttc gatcggcgtt ttcgcgggat gcggcgtcaa tacctacctg 120 ctgaacaacc tcgccaccgc ggagccgttc gatttctcac gcccctccgc gtaccagctg 180 ctgacggcca acgacaagga tttcctggcc acgcgtgtct cttacaagct gaacctccgc 240 gggcccagcc tgacggttca gacggcgtgc tccacctcgc tggtgtcggt ggtgatggca 300 tgcgagagct tgcagcgcgg cgcctcggac attgccttgg ccgggggagt tgccatcaat 360 gttccgcagt ccgtggggta cctgcaccag ccgggcatga tcctgtcgcc cgacgggcgc 420 tgccgcgcct tcgatgagtc cgctcaaggc acggtgccgg gcaacggcgc gggtgtggtc 480 gtcctcaagc gcttgagccg cgctctggcc gatggcgaca cgatctacgc cgtcattcgc 540 ggagcggcta ttaataatga tggcgccgag cgcatggggt ttaccgctcc aggtgtggac 600 ggtcagacgc gattgattcg gcgcactcaa gagatggcgg gcgtgaagcc ggagtccatc 660 ggctacatgg acacccacgg caccggcac 689 <210> 35 <211> 671 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 35 ccgcagcagc gcctcttcct cgaggtggca tgggaagctt tggagcgtgc gggtcggccg 60 cccgacagtc tcgcgggcag cgacaccgga gtgttcatcg ggatcagcac cgacgactac 120 agccggctga aacctaccga tccggcgctc attgacgcct ataccggtac cggaaccgcg 180 ttcagcactg ccgccggacg gatctcctat ctgctggggt tgcagggacc gaacttcccc 240 gtcgacacgg cgtgctcttc ctcactcgtg gcggttcatc tggcgtgccg cagcttgcag 300 tcgcgagagt gcagcatggc gctggccggc ggcgtgaacc tgattctggc gccggaaagc 360 acgatctact tctgccgcct gcgggccatg gcggccgatg gccgttgcaa aagtttcgct 420 gcctccgccg acggttacgg ccgcggcgag ggatgcggaa tgctggtgct gaagcggctg 480 tccgatgcga cgcgtgacgg cgatcgtatt ctggcgctga ttcgcggatc ggccgtcaac 540 cacggcggcc gcagcaacgg cctcacggcg ccgaacggtc cggcgcagga agccgtgatt 600 cgggcggcgc tcaagaacgc cggcatggcc cccgccgatg tcgattacgt ggacacccac 660 ggcaccggca c 671 <210> 36 <211> 758 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la sêquence :organisme du sol <400> 36 ccgcaggagc gcgtcttcct cgaacgcatt gacggtttcg atgcggaatt cttcggcatc 60 tccccccgcg aagctctgaa catggatccg cagcagcggc tgctgctgga agtgtgctgg 120 gaagcggcag aggacgccgg catctctccc ggccctctgg cgggcagcgc gaccggcgtc 180 tttgccggct cctgcgccca ggacttcgga ctgtttcagt acgccgaccc tgcccgcatc 240 ggagcttggt cgggttccgg cgtggcgcat agcatgttgg ccaatcgcat ctcctatctg 300 ctcgacctgc gcggtccgag catggcggtc gatacggcct gctcctccgc gctcgtcgcc 360 gtccatctgg cttgccaaag cctgcgccgg cgcgaatgcg atgcggcatt cgccggcgga 420 gtgaacttga tcctgactcc cgagggcatg atcgctttgt cgaaggctcg catgttggcg 480 cccgacggac gctgcaagac gttcgacgcc gcagccgacg gttatgtgcg cggcgagggc 540 tgcggcatcg tgctgctgaa gcggctctcc gatgcgctgg ccgatggcga tgccatctgt 600 gcagtcatcc gcggctcggc aatcaatcag gacggacgga gcaatggcat cacggcgccg 660 aatctgcagg cgcagaaggc ggtcctgcaa gaggcggtgg ccaacgcgca catcgatcca 720 tcccacgtat cgttgatcga cacgcacggc accggcac 758 <210> 37 <211> 704 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 37 ccgcagcagc gcgtgttcct cgagtgcgcc tgggaggcgg tggaaagcgc gggctacgat 60 cccgaaaaat atcccggcct gatcggagtt ttcgccgggg ccagcatcaa cagctatttc 120 ctttataacc tcgcgcacaa ccgggaattc gtcgcccgca tggcggggga gtaccaagtg 180 ggcgagtacc agacgatcct cggaaacgac aaggactacc tccccactcg cgtctcctac 240 aaattgaacc tgcgcggccc cagcctggcc gtgcagtccg cctgctcgac cggcctcgtc 300 gccgtttgtc aggccattca aaatctgcag acttatcagt gcgatatggc cctcgcgggc 360 ggcatctcga tttcgtttcc gcaaaagcgc gactaccgct tcaccgacga aggaatggtc 420 tctcgcgacg gtcactgccg cccgttcgac gccagcgcgc aaggcacggt cttcggcaac 480 ggggccggcg tcgtcctgat gaaaagattg gccgacgcag tgaccgatcg ggacacgatc 540 ctcgccgtga ttaggggcgc tgccgtgaac aacgacggcg gcgtcaaaat gggttacacg 600 gcgcccagtg ccgaaggtca ggcggaggcc atcaccctgg ccctcgcgct cgctggcgtc 660 agcccggaga ccatcacttg catggacacc cacggcaccg gcac 704 <210> 38 <211> 680 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 38 ccccagcagc gcgtgttcct cgaatgcgcc tgggcggcgc tggagcgccg ccggatatca 60 gggcgacacc ttccacggtg tccatcggcg gtctatgcct caagcggctt taacacctat 120 cttctgaacc tgcatgccaa tgccgcggtg cgccaatcga tcagcccgtt tgaactgttc 180 gtcgccaacg acaaggattt tctggcgacg cgcacggctt acaagctcaa tctgcgcggc 240 ccggccatga cagtgcagac ggcctgctcc tcatcgttgg ttgccgttca tgtcgccgcg 300 caaagcctcc tagcgggcga atgcgatatt gcgctcgcgg gcggcatcac ggtttcccgt 360 tcgcatggat atgtggcgcg cgaaggtgga atattgtctc ctgacgggca ttgccgggcg 420 ttcgatgcgg atgccggcgg aaccgttcca ggcagcggcg tcggcgttgt cgtgctcaag 480 cgtctcgaag atgcgcttgc agacggcgat acgatcgacg ccgtcatcat cggttcggcc 540 atcaacaatg atggcgcgct gaaggcgagc tttaccgcac cgcaggtgga cagccaggcc 600 ttggtcatca gcgaggccca tgcagctgcc ggaatatcgg ccgattccat cggttatatg 660 gacacccacg gcaccgggac <210> 39 <211> 671 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 39 ccgcagcagc gcctcttcct cgagctcacc tgggaagcgc tggaagatgc cggcatcccg 60 ccgtccacga ttgccggcac gaatgtcggc gttttcatgg gcgcgtcgca ggctgactac 120 ggccacaagt tcttcagcga ccacgccgtc gcggattccc atttcgccac cggcacctcg 180 ctggcggtcg tcgccaatcg catttcctac atctacgacc tgcgcggccc aagcctcact 240 gtagacacgg cgtgctcgtc gtcgctcgtc gcgctgcatc aggcggtgga agcgctccgc 300 tcggggcgga tcgaaacagc cattgtcggc ggcattaacg ttatcgccag cccggcgtcc 360 ttcatcgcct tctcgcaggc ctcgatgctg tcgccgacgg ggttgtgcca ggctttctcc 420 gccaaggccg atggctttgt ccgcggcgag ggcggcacgg ttttcgtcct gcgcaaggcg 480 gcgcatgcgc atggcagccg caacccggtg cgcgggctca ttctcgccac cgacgtcaat 540 tccgacgggc gtaccaacgg catctcgctg ccatcggccg aagcgcagga agtcctcctg 600 caacgcgtct attcacgcgc atcgatcgat ccgaaccgcc tggctttcgt cgacacccac 660 gggaccggca c 671 <210> 40 <211> 764 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 40 ccgcagcagc gcgtgttcct cgacggcatc gaccggttcg atccgcgtca cttcgcgatc 60 acgccgcgcg aggcgatcag catggacccg cagcagcggc tcctgctcga ggtcacgtgg 120 gaagcgctgg agcgcgccgg cgtggcgccc gatcgcctga ccggatccga caccggcgtc 180 ttcatcggca tcagcaccaa cgactacggc cagatcctgc tgcgcgcctc ggaccagatc 240 gatccgggga tgtacttcgg caccggcaac ctgttgaacg cggcggcggg acgcctctcg 300 tacgtcctcg gcctgcaggg tccgagcatg gcggtcgaca ccgcatgtcc gtcgtcgctg 360 gtggcgattc atctcgcgtg tcagagcctg cgcaaccgcg agtgccgcat ggcgctcgcc 420 ggcggcgcca acctggtgct cgtcccggaa gtgacggtca actgctgccg cgccaagatg 480 ctcgcgcctg acgggcgctg caagacgttc gacgccgcgg cggacggcta cgtccgcggc 540 gaaggggccg cggtgatcgt gctgaagcgg ctctccgacg cgctggcgga cggcgatccg 600 atcgtcgcgc tgatccgcgg atccgcggtc aatcaggacg gccgcagcgg cggcttcacc 660 gcgccgaacg aactggcgca gcaggcggtg atccggaccg cgctcgcggc agcgggcgtc 720 gccgcgtccg acatcggcta cgtggacacg cacggcaccg ggac 764 <210> 41 <211> 763 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 41 ccgcagcagc gcgtgttcct cgacggcatc gaccgcttcg atccgcagtt tttcgggatc 60 gcgccgcgcg aagcggccgg catcgatccg cagcagcggc tgctgctcga gacgacgtgg 120 gaagcgctgg aagacgccgg gacgtcgccg gaaaagctgc agggaacccc ggccggcgtg 180 ttcgtcggca tcaacagcat cgactacgcg acgctgcagc tgcagaactg cgatctggcc 240 agcatcgacg cctattcgct ctccggcagc gcgcacagca tcgcggccgg gcggctcgcc 300 tacgtgctcg gcctgcaggg gccggcgatg gcggtcgaca ccgcctgctc gtcgtcgctg 360 gtcgcgatcc acctggcgtg ccagagcctg cgcaacgacg actgccgcgt cgccgtggcc 420 ggcggcgtgc acgtcacgct gacgccgatc aacatggtcg tgttctcgaa gctgcgcatg 480 ctggcggcgg acggcaagtg caagacgttc gacggccgcg gcgacggatt cgtcgaaggc 540 gagggctgcg cggtcatcgt cctcaagcgg ttgtcgcacg cgcttgccga caaggatcgg 600 atcctcgcgc tggtgcgcgg ttcggcggtc aaccaggacg gcgcgagcag cggtctcacc 660 gcgccgaacg gtccggcgca ggaagcggtc atccgcgcgg cgttgaagcg ggccggcgtg 720 cagccggcgg aggtcggcta cgtggacacc cacggcaccg gca 763 <210> 42 <211> 668 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 42 ccgcaggagc gcgtgctgct ggaatcctcg tggcatgcgc tggaagacgc cggctatgcc 60 ggcgaaagca tcgccggcgc gcgctgcggc gtgtacatgg gcttcaacgg cggcgactac 120 ggcgacctgc tgtacggcca gccgtcgctg ccgccgcacg cgatgtgggg caacgccgcc 180 tcggtgctgt cggcgcgcat cgcctattac ctggacctgc aaggcccggc gatcaccctc 240 gacaccgcct gttcgagctc gttggtcgcg gtgcatctgg cctgccaggg gctgtggacc 300 ggcgagaccg atctggccct ggccggcggc gtgtggatcc agtgcacgcc cggattcctg 360 atctcctcca gccgcgccgg catgctctcg ccgaccggcc agtgccgcgc gttcggcgcc 420 ggcgccgacg gcttcgtgcc gtccgaaggc gtcggcgtgg tcgtgctcaa gcgcctgcag 480 gacgcgctcg acgccggcga ccacatntac ggcgtgatcc gcggcagcgc gatcaaccag 540 gacggcgcca gcaacggcat caccgcgccg agcgccgccg cccaggagcg cttgcagcgc 600 cacgtctacg acagcttcgg catcgacgcc tcgcgcctgc agatgatcga ggcccacggc 660 accggcac 668 <210> 43 <211> 671 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 43 ccgcaggagc gcgtgctgct ggaggtgact tgggaggcac tcgaagacgc cggccaagac 60 gtggaccgtc tggccgggcg gcccgtcggc gtcttcgtcg ggatctcgtc gaacgattac 120 ggccagcttc agaacggcga cccggccgac gtggacgcct acgtcggcac cggtaacgcg 180 ctgagcatcg ccgccaaccg actcagctac acgtttgact ttcgcggccc gagtctggcg 240 gtggacacgg cgtgctcgtc ttcactcgtc gcgatccatc tcgcctgcca gagcgttcgc 300 cgcggtgaag cggaactcgc cgtcgcggcc ggcgtcaact tgattctgac ccccggcctg 360 acggtgaatt tcacccgcgc cggcatgatg gcgcctgacg gccggtgcaa gacgttcgac 420 gcggccgcca acggctacgt gcgcggcgaa ggcgccggcg tcgtcgtgct caagccgctg 480 gcccaggcta tcgccgacgg cgacccgatc tacgcgatcg tccgtggcag cgccgtcaac 540 caggacggcc gttccaacgg cctcaccgcc ccgaaccgac aggcccaaga ggtcgtgctg 600 cgggccgcgt atcgtgacgc gggcatcagc ccggccgatg tcgacgccgt cgaggcccac 660 ggcaccggca c 671 <210> 44 <211> 707 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 44 ccccagcagc gcgtgttcct cgaggacgcg actgaggtcg acgtggatgc gctttcagac 60 ggcgaagacg tcgtgatcgc cggcatcatg cagcacatcg aggaggccgg catccactcg 120 ggcgattcat cgtgcgtgct tccgccggtc gacatcccgc cgaaggcgct gcagacgatc 180 cgcgatcaca cgttcaagct cgcgcgcgcg ttgaaggtca tcggcctgat gaacgtgcag 240 tacgcgattc agcgcgacaa ggtctacgtg attgaggtaa accctagggc ttctcgaact 300 gtcccgtatg tctcgaaggc gacaggcgtg ccgctggcga aggtcgcgtc acgcttgatg 360 accggacgca aactgcacga gctgttgccg gaaggggtcg agcgcggctg gatcaccacc 420 gcgggcgaga atttctacgt gaagtcgccg gtcttcccgt ggggtaagtt cccgggcgtt 480 gacactgtgc tcgggccgga gatgaaatcg accggcgaag tcatgggcgt cgccgacaac 540 ttcggcgagg ccttcgccaa ggcacagatc gccgccggca catacctgcc gaccgaaggt 600 accgtcttca tctcggtcaa cgaccgtgac aaaggcaacg tcattcagct ggcgcagcgt 660 ttctccgaac tcggtttcgg cattgtcgac acgcacggca ccgggac 707 <210> 45 <211> 225 <212> PRT
<213> Streptomyces ambofaciens <400> 45 Pro Gln Gln His Val Phe Leu Glu Thr Val Trp Glu Thr Phe Glu Ser Ala Gly Val Asp Pro Arg Ala Val Arg Gly Arg Ser Val Gly Met Phe Val Gly Thr Asn Gly Gln Asp Tyr Pro Val Val Leu Ala Gly Ser Ala Asp Glu Gly Leu Asp Ala His Ala Ala Thr Gly Asn Ala Ala Ala Val Leu Ser Gly Arg Val Ser Tyr Ala Phe Gly Leu Glu Gly Pro Ala Val Thr Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Leu His Leu Ala Ala Gln Ala Leu Arg Arg Gly Glu Cys Asp Leu Ala Leu Ala Gly Gly Val Ser Glu Met Ser Thr Glu Ala Ala Phe Thr Glu Phe Ala Arg Gln Gly Gly Leu Ala Asp Asp Gly Arg Cys Lys Ala Phe Ser Ala Asp Ala 130 135 ' 140 Asp Gly Thr Gly Trp Gly Glu Gly Val Gly Val Leu Leu Val Glu Arg Leu Ala Asp Ala Arg Arg Asn Gly His Arg Ala Leu Ala Leu Val Arg Gly Ser Ala Val Asn Gln Asp Gly Ala Ser Asn Gly Leu Thr Ala Pro Asn Gly Pro Ser Gln Gln Arg Val Ile Arg Gln Ala Leu Ala Asp Ala Arg Leu Ser Pro Ser Glu Val Asp Ala Val Glu Thr His Gly Thr Gly Thr <210> 46 <211> 207 <212> PRT
<213> Streptomyces ambofaciens <400> 46 Ala Ser Trp Glu Ala Val Glu Arg Ala Gly Ile Asp Met Arg Thr Leu Arg Gly Gly Arg Thr Gly Val Phe Ala Gly Val Met Tyr His Asp Tyr Pro Ser Val Val Asp Pro Glu Ala Leu Asp Gly Tyr Leu Gly Thr Ala Asn Ala Gly Ser Val Leu Ser Gly Arg Ile Ala Tyr Thr Phe Gly Leu Gln Gly Pro Ala Val Thr Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Leu His Leu Ala Ala Gln Ala Leu Pro Ala Gly Glu Cys Glu Leu Ala Leu Val Gly Gly Val Thr Val Met Ser Gly Pro Met Met Phe Ala Gly Phe Gly Leu Glu Asp Gly Ser Ala Ala Asp Gly Arg Cys Lys Ala Phe Ala Ala Ala Ala Asp Gly Thr Gly Trp Gly Glu Gly Val Gly Val Leu Leu Val Glu Arg Leu Ser Asp Ala Arg Arg His Gly His Arg Val Leu Ala Val Val Arg Gly Ser Ala Val Asn Gln Asp Gly Ala Ser Gly Gly Leu Thr Ala Pro Asn Gly Pro Ala Gln Gln Arg Val Ile Arg Gln Ala Leu Ala Ser Ala Ala Leu Val Pro Ala Glu Val Asp Ala Val <210> 47 <211> 223 <212> PRT
<213> Saccharopolyspora erythraea <400> 47 Pro Gln Glu Arg Val Phe Leu Glu Leu Ala Trp Glu Ala Leu Asp Asn Ala Gly Ile Ala Pro His Ser Leu Arg Asp Ser Arg Thr Gly Val Phe Phe Gly Ala Met Trp His Gly Tyr Ala Gln Phe Ala Ala Gly Ala Val 35 ~ 40 45 Asp Arg Ile Thr Gln His Thr Ala Thr Gly His Asp Leu Ser Ile Ile Pro Ala Arg Ile Ala Tyr Phe Leu Gly Leu Arg Gly Pro Asp Met Thr Leu Asn Thr Ala Cys Ser Ser Ala Leu Val Ala Met His Gln Ala Arg Gln Ser Ile Leu Leu Gly Glu Ser Ser Val Ala Leu Val Gly Gly Ile Ser Leu Leu Val Ala Leu Asp Ser Met Val Ala Met Ser Arg Phe Gly Ala Met Ala Pro Asp Gly Arg Cys Lys Ala Phe Asp Ser Arg Ala Asn Gly Tyr Val Arg Gly Glu Gly Gly Gly Val Val Val Leu Lys Pro Leu Ser Arg Ala Leu Ala Asp Gly Asn Pro Val Tyr Cys Val Leu Arg Gly Ser Ala Val Asn Asn Asp Gly Phe Ser Asn Gly Leu Thr Ala Pro Ser Pro Ala Ala Gln Glu Gln Val Leu Arg Asp Ala Tyr Ala Asn Ala Gly Val Asp Pro Ala Gln Val Asp Tyr Val Glu Thr His Gly Thr Gly <210> 48 <211> 211 <212> PRT
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 48 Ser Cys Trp Glu Ala Leu Glu His Ala Gly Tyr Asp Thr Ala Arg Tyr Pro Gly Arg Ile Gly Leu Trp Ala Gly Ala Gly Phe Asn Ser Tyr Leu Leu Thr Asn Leu Met Asn Asn Arg Ala Phe Leu Glu Ser Val Gly Met Tyr Gln Ile Phe Leu Ser Asn Asp Lys Asp Phe Ile Ala Thr Arg Thr Ala Tyr Lys Leu Asn Leu Arg Gly Pro Ala Met Ala Val Gly Thr Ala Cys Ser Thr Ser Leu Val Ala Val His Glu Ala Cys Gln Ala Leu Arg Leu Ser Gly Arg Val Ser Tyr Leu Gly Glu Cys Asp Met Ala Leu Ala Gly Ala Ala Ser Val Ser Thr Pro Leu Arg Glu Gly Tyr Leu Tyr Gln Glu Gly Met Ile Met Ser Arg Asp Gly Val Cys Arg Pro Phe Asp Ala Asp Ala Asp Gly Thr Val Leu Gly Asn Gly Val Ala Val Val Val Leu Lys Arg Leu Asp Glu Ala Leu Arg Asp Gly Asp Thr Val Tyr Ala Val Ile Arg Gly Thr Ala Val Asn Asn Asp Gly Ser Val Lys Ile Gly Phe Thr Ala Pro Ser Ala Glu Gly Gln Ser Arg Val Val Arg Asp Ala Leu Arg Ala Ala Ala Val Pro Ala Glu Ser Val <210> 49 <211> 229 <212> PRT
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 49 Pro Gln Gln Arg Leu Phe Leu Glu Cys Ala Trp Glu Ala Met Glu Asn Ala Gly Tyr Ala Ala Arg Ser Tyr Lys Gly Ser Ile Gly Val Phe Ala Gly Cys Gly Val Asn Thr Tyr Leu Leu Asn Asn Leu Ala Thr Ala Glu Pro Phe Asp Phe Ser Arg Pro Ser Ala Tyr Gln Leu Leu Thr Ala Asn Asp Lys Asp Phe Leu Ala Thr Arg Val Ser Tyr Lys Leu Asn Leu Arg Gly Pro Ser Leu Thr Val Gln Thr Ala Cys Ser Thr Ser Leu Val Ser Val Val Met Ala Cys Glu Ser Leu Gln Arg Gly Ala Ser Asp Ile Ala Leu Ala Gly Gly Val Ala Ile Asn Val Pro Gln Ser Val Gly Tyr Leu His Gln Pro Gly Met Ile Leu Ser Pro Asp Gly Arg Cys Arg Ala Phe Asp Glu Ser Ala Gln Gly Thr Val Pro Gly Asn Gly Ala Gly Val Val Val Leu Lys Arg Leu Ser Arg Ala Leu Ala Asp Gly Asp Thr Ile Tyr Ala Val Ile Arg Gly Ala Ala Ile Asn Asn Asp Gly Ala Glu Arg Met Gly Phe Thr Ala Pro Gly Val Asp Gly Gln Thr Arg Leu Ile Arg Arg Thr Gln Glu Met Ala Gly Val Lys Pro Glu Ser Ile Gly Tyr Met Asp Thr His Gly Thr Gly <210> 50 <211> 223 <212> PRT
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 50 Pro Gln Gln Arg Leu Phe Leu Glu Val Ala Trp Glu Ala Leu Glu Arg Ala Gly Arg Pro Pro Asp Ser Leu Ala Gly Ser Asp Thr Gly Val Phe Ile Gly Ile Ser Thr Asp Asp Tyr Ser Arg Leu Lys Pro Thr Asp Pro Ala Leu Ile Asp Ala Tyr Thr Gly Thr Gly Thr Ala Phe Ser Thr Ala Ala Gly Arg Ile Ser Tyr Leu Leu Gly Leu Gln Gly Pro Asn Phe Pro Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Val His Leu Ala Cys Arg Ser Leu Gln Ser Arg Glu Cys Ser Met Ala Leu Ala Gly Gly Val Asn Leu Ile Leu Ala Pro Glu Ser Thr Ile Tyr Phe Cys Arg Leu Arg Ala Met Ala Ala Asp Gly Arg Cys Lys Ser Phe Ala Ala Ser Ala Asp Gly Tyr Gly Arg Gly Glu Gly Cys Gly Met Leu Val Leu Lys Arg Leu 145 150 ~ 155 160 Ser Asp Ala Thr Arg Asp Gly Asp Arg Ile Leu Ala Leu Ile Arg Gly Ser Ala Val Asn His Gly Gly Arg Ser Asn Gly Leu Thr Ala Pro Asn Gly Pro Ala Gln Glu Ala Val Ile Arg Pila Ala Leu Lys Asn Ala Gly Met Ala Pro Ala Asp Val Asp Tyr Val Asp Thr His Gly Thr Gly <210> 51 <211> 252 <212> PRT
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 51 Pro Gln Glu Arg Val Phe Leu Glu Arg I,le Asp Gly Phe Asp Ala Glu Phe Phe Gly Ile Ser Pro Arg Glu Ala Leu Asn Met Asp Pro Gln Gln Arg Leu Leu Leu Glu Val Cys Trp Glu Ala Ala Glu Asp Ala Gly Ile Ser Pro Gly Pro Leu Ala Gly Ser Ala Thr Gly Val Phe Ala Gly Ser Cys Ala Gln Asp Phe Gly Leu Phe Gln Tyr Ala Asp Pro Ala Arg Ile 65 70 75 g0 Gly Ala Trp Ser Gl.y Ser Gly Val Ala His Ser Met Leu Ala Asn Arg Ile Ser Tyr Leu Leu Asp Leu Arg Gly Pro Ser Met Ala Val Asp Thr Ala Cys Ser Ser Ala Leu Val Ala Val Fais Leu Ala Cys Gln Ser Leu Arg Arg Arg Glu Cys Asp Ala Ala Phe Ala Gly Gly Val Asn Leu Ile Leu Thr Pro Glu Gly Met Ile Ala Leu Ser Lys Ala Arg Met Leu Ala Pro Asp Gly Arg Cys Lys Thr Phe Asp Ala Ala Ala Asp Gly Tyr Val Arg Gly Glu Gly Cys Gly Ile Val Leu Leu Lys Arg Leu Ser Asp Ala Leu Ala Asp Gly Asp Ala Ile Cys Ala Val Ile Arg Gly Ser Ala Ile 195 200 . 205 Asn Gln Asp Gly Arg Ser Asn Gly Ile Thr Ala Pro Asn Leu Gln Ala Gln Lys Ala Val Leu Gln Glu Ala Val Ala Asn Ala His Ile Asp Pro Ser His Val Ser Leu Ile Asp Thr His Gly Thr Gly <210> 52 <211> 234 <212> PRT
<213> Organime Inconnu <220>

<223> Origine de la sêquence :organisme du sol <400> 52 Pro Gln Gln Arg Val Phe Leu Glu Cys Ala Trp Glu Ala Val Glu Ser Ala Gly Tyr Asp Pro Glu Lys Tyr Pro Gly Leu Ile Gly Val Phe Ala Gly Ala Ser Ile Asn Ser Tyr Phe Leu Tyr Asn Leu Ala His Asn Arg Glu Phe Val Ala Arg Met Ala Gly Glu Tyr Gln Val Gly Glu Tyr Gln Thr Ile Leu Gly Asn Asp Lys Asp Tyr Leu Pro Thr Arg Val Ser Tyr Lys Leu Asn Leu Arg Gly Pro Ser Leu Ala Val Gln Ser Ala Cys Ser Thr Gly Leu Val Ala Val Cys Gln Ala Ile Gln Asn Leu Gln Thr Tyr Gln Cys Asp. Met Ala Leu Ala Gly Gly Ile Ser Ile Ser Phe Pro Gln Lys Arg Asp Tyr Arg Phe Thr Asp Glu Gly Met Val Ser Arg Asp Gly His Cys Arg Pro Phe Asp Ala Ser Ala Gln Gly Thr Val Phe Gly Asn Gly Ala Gly Val Val Leu Met Lys Arg Leu Ala Asp Ala Val Thr Asp Arg Asp Thr Ile Leu Ala Val Ile Arg Gly Ala Ala Val Asn Asn Asp Gly Gly Val Lys Met Gly Tyr Thr Ala Pro Ser Ala Glu Gly Gln Ala Glu Ala Ile Thr Leu Ala Leu Ala Leu Ala Gly Val Ser Pro Glu Thr Ile Thr Cys Met Asp Thr His Gly Thr Gly <210> 53 <211> 226 <212> PRT
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 53 Pro Gln Gln Arg Val Phe Leu Glu Cys Ala Trp Ala Ala Leu Glu Arg Arg Arg Ile Ser Gly Arg His Leu Pro Arg Cys Pro Ser Ala Val Tyr Ala Ser Ser Gly Phe Asn~Thr Tyr Leu Leu Asn Leu His Ala Asn Ala Ala Val Arg Gln Ser Ile Ser Pro Phe Glu Leu Phe Val Ala Asn Asp 50 5.5 60 Lys Asp Phe Leu Ala Thr Arg Thr Ala Tyr Lys Leu Asn Leu Arg Gly Pro Ala Met Thr Val Gln Thr Ala Cys Ser Ser Ser Leu Val Ala Val His Val Ala Ala Gln Ser Leu Leu Ala Gly Glu Cys Asp Ile Ala Leu Ala Gly Gly Ile Thr Val Ser Arg Ser His Gly Tyr Val Ala Arg Glu Gly Gly Ile Leu Ser Pro Asp Gly His Cys Arg Ala Phe Asp Ala Asp Ala Gly Gly Thr Val Pro Gly Ser Gly Val Gly Val Val Val Leu Lys Arg Leu Glu Asp Ala Leu Ala Asp Gly Asp Thr Ile Asp Ala Val Ile Ile Gly Ser Ala Ile Asn Asn Asp Gly Ala Leu Lys Ala Ser Phe Thr Ala Pro Gln Val Asp Ser Gln Ala Leu Val Ile Ser Glu Ala His Ala Ala Ala Gly Ile Ser Ala Asp Ser Ile Gly Tyr Met Asp Thr His Gly Thr Gly <210> 54 <211> 223 <212> PRT
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 54 Pro Gln Gln Arg Leu Phe Leu Glu Leu Thr Trp Glu Ala Leu Glu Asp Ala Gly Ile Pro Pro Ser Thr Ile Ala Gly Thr Asn Val Gly Val Phe Met Gly Ala Ser Gln Ala Asp Tyr Gly His Lys Phe Phe Ser Asp His Ala Val Ala Asp Ser His Phe Ala Thr Gly Thr Ser Leu Ala Val Val Ala Asn Arg Ile Ser Tyr Ile Tyr Asp Leu Arg Gly Pro Ser Leu Thr Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Leu His Gln Ala Val Glu Ala Leu Arg Ser Gly Arg Ile Glu Thr Ala Ile Val Gly Gly Ile Asn Val Ile Ala Ser Pro Ala Ser Phe Ile Ala Phe Ser Gln Ala Ser Met Leu Ser Pro Thr Gly Leu Cys Gln Ala Phe Ser Ala Lys Ala Asp Gly Phe Val Arg Gly Glu Gly Gly Thr Val Phe Val Leu Arg Lys Ala Ala His Ala His Gly Ser Arg Asn Pro Val Arg Gly Leu Ile Leu Ala Thr Asp Val Asn Ser Asp Gly Arg Thr Asn Gly Ile Ser Leu Pro Ser Ala Glu Ala Gln Glu Val Leu Leu Gln Arg Val Tyr Ser Arg Ala Ser Ile Asp Pro Asn Arg Leu Ala Phe Val Asp Thr His Gly Thr Gly <210> 55 <211> 254 <212> PRT
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 55 Pro Gln Gln Arg Val Phe Leu Asp Gly Ile Asp Arg Phe Asp Pro Arg His Phe Ala Ile Thr Pro Arg Glu Ala Ile Ser Met Asp Pro Gln Gln Arg Leu Leu Leu Glu Val Thr Trp Glu Ala Leu Glu Arg Ala Gly Val Ala Pro Asp Arg Leu Thr Gly Ser Asp Thr Gly Val Phe Ile Gly Ile Ser Thr Asn Asp Tyr Gly Gln Ile Leu Leu Arg Ala Ser Asp Gln Ile Asp Pro Gly Met Tyr Phe Gly Thr Gly Asn Leu Leu Asn Ala Ala Ala Gly Arg Leu Ser Tyr Val Leu Gly Leu Gln Gly Pro Ser Met Ala Val Asp Thr Ala Cys Pro Ser Ser Leu Val Ala Ile His Leu Ala Cys Gln Ser Leu Arg Asn Arg Glu Cys Arg Met Ala Leu Ala Gly Gly Ala Asn Leu Val Leu Val Pro Glu Val Thr Val Asn Cys Cys Arg Ala Lys Met Leu Ala Pro Asp Gly Arg Cys Lys Thr Phe Asp Ala Ala Ala Asp Gly Tyr Val Arg Gly Glu Gly Ala Ala Val Ile Val Leu Lys Arg Leu Ser Asp Ala Leu Ala Asp Gly Asp Pro Ile Val Ala Leu Ile Arg Gly Ser Ala Val Asn Gln Asp Gly Arg Ser Gly Gly Phe Thr Ala Pro Asn Glu Leu Ala Gln Gln Ala Val Ile Arg Thr Ala Leu Ala Ala Ala Gly Val Ala Ala Ser Asp Ile Gly Tyr Val Asp Thr His Gly Thr Gly 245 ~ 250 <210> 56 <211> 254 <212> PRT
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 56 Pro Gln Gln Arg Val Phe Leu Asp Gly Ile Asp Arg Phe Asp Pro Gln Phe Phe Gly Ile Ala Pro Arg Glu Ala Ala Gly Ile Asp Pro Gln Gln Arg Leu Leu Leu Glu Thr Thr Trp Glu Ala Leu Glu Asp Ala Gly Thr Ser Pro Glu Lys Leu Gln Gly Thr Pro Ala Gly Val Phe Val Gly Ile Asn Ser Ile Asp Tyr Ala Thr Leu Gln Leu Gln Asn Cys Asp Leu Ala Ser Ile Asp Ala Tyr Ser Leu Ser Gly Ser Ala His Ser Ile Ala Ala Gly Arg Leu Ala Tyr Val Leu Gly Leu Gln Gly Pro Ala Met Ala Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Ile His Leu Ala Cys Gln Ser Leu Arg Asn Asp Asp Cys Arg Val Ala Val Ala Gly Gly Val His Val Thr Leu Thr Pro Ile Asn Met Val Val Phe Ser Lys Leu Arg Met Leu Ala Ala Asp Gly Lys Cys Lys Thr Phe Asp Gly Arg Gly Asp Gly Phe Val Glu Gly Glu Gly Cys Ala Val Ile Val Leu Lys Arg Leu Ser His Ala Leu Ala Asp Lys Asp Arg Ile Leu Ala Leu Val Arg Gly Ser Ala Val Asn Gln Asp Gly Ala Ser Ser Gly Leu Thr Ala Pro Asn Gly Pro Ala Gln Glu Ala Val Ile Arg Ala Ala Leu Lys Arg Ala Gly Val Gln Pro Ala Glu Val Gly Tyr Val Asp Thr His Gly Thr Gly <210> 57 <211> 222 <212> PRT
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 57 Pro Gln Glu Arg Val Leu Leu Glu Ser Ser Trp His Ala Leu Glu Asp Ala Gly Tyr Ala Gly Glu Ser Ile Ala Gly Ala Arg Cys Gly Val Tyr Met Gly Phe Asn Gly Gly Asp Tyr Gly Asp Leu Leu Tyr Gly Gln Pro Ser Leu Pro Pro His Ala Met Trp Gly Asn Ala Ala Ser Val Leu Ser Ala Arg Ile Ala Tyr Tyr Leu Asp Leu Gln Gly Pro Ala Ile Thr Leu Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Val His Leu Ala Cys Gln Gly Leu Trp Thr Gly Glu Thr Asp Leu Ala Leu Ala Gly Gly Val Trp Ile Gln Cys Thr Pro Gly Phe Leu Ile Ser Ser Ser Arg Ala Gly Met Leu Ser Pro Thr Gly Gln Cys Arg Ala Phe Gly Ala Gly Ala Asp Gly Phe Val Pro Ser Glu Gly Val Gly Val Val Val Leu Lys Arg Leu Gln Asp Ala Leu Asp Ala Gly Asp His Xaa Tyr Gly Val Ile Arg Gly Ser Ala Ile Asn Gln Asp Gly Ala Ser Asn Gly Ile Thr Ala Pro Ser Ala Ala Ala Gln Glu Arg Leu Gln Arg His Val Tyr Asp Ser Phe Gly Ile Asp Ala Ser Arg Leu Gln Met Ile Glu Ala His Gly Thr Gly <210> 58 <211> 223 <212> PRT
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 58 Pro Gln Glu Arg Val Leu Leu Glu Val Thr Trp Glu Ala Leu Glu Asp Ala Gly Gln Asp Val Asp Arg Leu Ala Gly Arg Pro Val Gly Val Phe Val Gly Ile Ser Ser Asn Asp Tyr Gly Gln Leu Gln Asn Gly Asp Pro Ala Asp Val Asp Ala Tyr Val Gly Thr Gly Asn Ala Leu Ser Ile Ala Ala Asn Arg Leu Ser Tyr Thr Phe Asp Phe Arg Gly Pro Ser Leu Ala Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Ile His Leu Ala Cys Gln Ser Val Arg Arg Gly Glu Ala Glu Leu Ala Val Ala Ala Gly Val Asn Leu Ile Leu Thr Pro Gly Leu Thr Val Asn Phe Thr Arg Ala Gly Met Met Ala Pro Asp Gly Arg Cys Lys Thr Phe Asp Ala Ala Ala Asn 130 135 ~ 140 Gly Tyr Val Arg Gly Glu Gly Ala Gly Val Val Val Leu Lys Pro Leu Ala Gln Ala Ile Ala Asp Gly Asp Pro Ile Tyr Ala Ile Val Arg Gly Ser Ala Val Asn Gln Asp Gly Arg Ser Asn Gly Leu Thr Ala Pro Asn Arg Gln Ala Gln Glu Val Val Leu Arg Ala Ala Tyr Arg Asp Ala Gly Ile Ser Pro Ala Asp Val Asp Ala Val Glu Ala His Gly Thr Gly <210> 59 <211> 235 <212> PRT
<213> Organime Inconnu <220>
<223> Origine de la séquence :organisme du sol <400> 59 Pro Gln Gln Arg Val Phe Leu Glu Asp Ala Thr Glu Val Asp Val Asp Ala Leu Ser Asp Gly Glu Asp Val Val Ile Ala Gly Ile Met Gln His Ile Glu Glu Ala Gly Ile His Ser Gly Asp Ser Ser Cys Val Leu Pro Pro Val Asp Ile Pro Pro Lys Ala Leu Gln Thr Ile Arg Asp His Thr Phe Lys Leu Ala Arg Ala Leu Lys Val Ile Gly Leu Met Asn Val Gln Tyr Ala Ile Gln Arg Asp Lys Val Tyr Val Ile Glu Val Asn Pro Arg Ala Ser Arg Thr Val Pro Tyr Val Ser Lys Ala Thr Gly Val Pro Leu Ala Lys Val Ala Ser Arg Leu Met Thr Gly Arg Lys Leu His Glu Leu Leu Pro Glu Gly Val Glu Arg Gly Trp Ile Thr Thr Ala Gly Glu Asn Phe Tyr Val Lys Ser Pro Val Phe Pro Trp Gly Lys Phe Pro Gly Val Asp Thr Val Leu Gly Pro Glu Met Lys Ser Thr Gly Glu Val Met Gly Val Ala Asp Asn Phe Gly Glu Ala Phe Ala Lys Ala Gln Ile Ala Ala Gly Thr Tyr Leu Pro Thr Glu Gly Thr Val Phe Ile Ser Val Asn Asp Arg Asp Lys Gly Asn Val Ile Gln Leu Ala Gln Arg Phe Ser Glu Leu Gly Phe Gly Ile Val Asp Thr His Gly Thr Gly <210> 60 <211> 1269 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 60 taacaggaag aagcttgctt ctttgctgac gagtggcgga cgggtgagta acacgtggga 60 acctgcctta tggttcggga taacgtctgg aaacggacgc taacaccgga tgtgcccttc 120 gggggaaagt ttacgccatg agaggggccc gcgtccgatt aggtagttgg tggggtaatg 180 gcccaccaag ccgacgatcg gtagctggtc tgagaggatg atcagccaca ctgggactga 240 gacacggccc agactcctac gggaggcagc agtggggaat attggacaat gggggcaacc 300 ctgatccagc aatgccgcgt gagtgatgaa ggccttaggg ttgtaaagct ctttcgcacg 360 cgacgatgat gacggtagcg tgagaagaag ccccggctaa cttcgtgcca gcagccgcgg 420 taatacgaag ggggcgagcg ttgttcggaa ttactgggcg taaagggcgc gtaggcggcc 480 cgatcagtca gatgtgaaag ccccgggctc aacctgggaa ctgcatttga tactgtcggg 540 cttgagttcc ggagaggatg gtggaattcc cagtgtagag gtgaaattcg tagatattgg 600 gaagaacacc ggtggcgaag gcggccatct ggacggacac tgacgctgag gcgcgaaagc 660 gtggggagca aacaggatta gataccctgg tagtccacgc cgtaaacgat gaatgctaga 720 cgctggggtg catgcacttc ggtgtcgccg ctaacgcatt aagcattccg cctggggagt 780 acggccgcaa ggttaaaact caaaggaatt gacgggggcc cgcacaagcg gtggagcatg 840 tggtttaatt cgaagcaacg cgcagaacct taccaaccct tgacatgtcc attgccggtc 900 cgagagattg gaccttcagt tcggctggat ggaacacagg tgctgcatgg ctgtcgtcag 960 ctcgtgtcgt gagatgttgg gttaagtccc gcaacgagcg caacccctac cgccagttgc 1020 catcattcag ttgggcactc tggtggaact gccggtgaca agccggagga aggcggggat 1080 gacgtcaagt cctcatggcc cttatgggtt gggctacaca cgtgctacaa tagcggtgac 1140 agtgggacgc gaagtcgcaa gatggagcaa atccccaaaa gccgtctcag ttcggattgc 1200 actctgcaac tcgggtgcat gaagttggaa tcgctagtaa tcgcggatca gcacgccgcg 1260 gtgaatacg 1269 <210> 61 <211> 1500 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 61 ttttaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgggccctct 60 agatgcatgc tcgagcggcc gccagtgtga tggatatctg cagaattcgc ccttcaggcc 120 taacacatgc aagtcgaacg agggcttcgg ccctagtggc gcacgggtga gtaacacgtg 180 ggaacctgcc ttatggttcg ggataacgtc tggaaacgga cgctaacacc ggatgtgccc 240 ttcgggggaa agtttacgcc atgagagggg cccgcgtccg attaggtagt tggtggggta 300 atggcccacc aagccgacga tcggtagctg gtctgagagg atgatcagcc acactgggac 360 tgagacacgg cccagactcc tacgggaggc agcagtgggg aatattggac.aatgggggca 420 accctgatcc agcaatgccg cgtgagtgat gaaggcctta gggttgtaaa gctctttcgc 480 acgcgacgat gatgacggta gcgtgagaag aagccccggc taacttcgtg ccagcagccg 540 cggtaatacg aagggggcga gcgttgttcg gaattactgg gcgtaaaggg cgcgtaggcg 600 gcccgatcag tcagatgtga aagccccggg ctcaacctgg gaactgcatt tgatactgtc 660 gggcttgagt tccggagagg atggtggaat tcccagtgta gaggtgaaat tcgtagatat 720 tgggaagaac accggtggcg aaggcggcca tctggacgga cactgacgct gaggcgcgaa 780 agcgtgggga gcaaacagga ttagataccc tggtagtcca cgccgtaaac gatgaatgct 840 agacgctggg gtgcatgcac ttcggtgtcg ccgctaacgc attaagcatt ccgcctgggg 900 agtacggccg caaggttaaa actcaaagga attgacgggg gcccgcacaa gcggtggagc 960 atgtggttta attcgaagca acgcgcagaa ccttaccaac ccttgacatg tccattgccg 1020 gtccgagaga ttggaccttc agttcggctg gatggaacac aggtgctgca tggctgtcgt 1080 cagctcgtgt cgtgagatgt tgggttaagt cccgcaacga gcgcaacccc taccgccagt 1140 tgccatcatt cagttgggca ctctggtgga actgccggtg acaagccgga ggaaggcggg 1200 gatgacgtca agtcctcatg gcccttatgg gttgggctac acacgtgcta caatggcggt 1260 gacagtggga cgcgaagtcg caagatggag caaatcccca aaagccgtct cagttcggat 1320 tgcactctgc aactcgggtg catgaagttg gaatcgctag taatcgcgga tcagcacgcc 1380 gcggtgaata cgttcccggg ccttgtacac accgcccaag ggcgaattcc agcacactgg 1440 cggccgttac tagtggatcc gagctcggta ccaagcttgg cgtaatcatg gtcatagctg 1500 <210> 62 <211> 1366 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la sêquence :Organisme du sol <400> 62 acgacggcca gtgaattgta atacgactca ctatagggcg aattgggccc tctagatgca 60 tgctcgagcg gccgccagtg tgatggatat ctgcagaatt cgcccttcag gcctaacaca 120 tgcaagtcga acgaaggctt cggccttagt ggcgcacggg tgagtaacac gtgggaacct 180 gcctttcggt tcggaataac gtctggaaac ggacgctaac accggatacg cccttcgggg 240 gaaagttcac gccgagagag gggcccgcgt cggattaggt agttggtgag gtaatggctc 300 accaagcctt cgatccgtag ctggtctgag aggatgatca gccacactgg gactgagaca 360 cggcccagac tcctacggga ggcagcagtg gggaatattg gacaatgggc gcaagcctga 420 tccagcaatg ccgcgtgagt gatgaaggcc ttagggttgt aaagctcttt cgcacgcgac 480 gatgatgacg gtagcgtgag aagaagcccc ggctaacttc gtgccagcag ccgcggtaat 540 acgaaggggg ctagcgttgt tcggaattac tgggcgtaaa gggcgcgtag gcggcctgct 600 tagtcagaag tgaaagcccc gggctcaacc tgggaatagc ttttgatact ggcaggcttg 660 agttccggag aggatggtgg aattcccagt gtagaggtga aattcgtaga tattgggaag 720 aacaccggtg gcgaaggcgg ccatctggac ggacactgac gctgaggcgc gaaagcgtgg 780 ggagcaaaca ggattagata ccctggtagt ccacgccgta aacgatgaat gctagacgtc 840 ggggtgcatg cacttcggtg tcgccgctaa cgcattaagc attccgcctg gggagtacgg 900 ccgcaaggtt aaaactcaaa ggaattgacg ggggcccgca caagcggtgg agcatgtggt 960 ttaattcgaa gcaacgcgca gaaccttacc aacccttgac atgtccatta tgggcttcag 1020 agatgaggtc cttcagttcg gctgggtgga acacaggtgc tgcatggctg tcgtcagctc 1080 gtgtcgtgag atgttgggtt aagtcccgca acgagcgcaa cccctaccgt cagttgccat 1140 cattcagttg ggcactctgg tggaaccgcc ggtgacaagc cggaggaagg cggggatgac 1200 gtcaagtcct catggccctt atgggttggg ctacacacgt gctacaatgg cggtgacagt 1260 gggaagcgaa gtcgcgagat ggagcaaatc cccaaaagcc gtctcagttc ggatcgcact 1320 ctgcaactcg agtgcgtgaa gttggaatcg ctagtaatcg cggatc 1366 <210> 63 <211> 1360 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 63 acagctatga ccatgattac gccaagcttg gtaccgagct cggatccact agtaacggcc 60 gccagtgtgc tggaattcgc ccttcaggcc taacacatgc aagtcgaacg ccccgcaagg 120 ggagtggcag acgggtgagt aacgcgtggg aacataccct ttcctgcgga atagctccgg 180 gaaactggaa ttaataccgc atacgcccta cgggggaaag atttatcggg gaaggattgg 240 cccgcgttgg attagctagt tggtggggta aaggcctacc aaggcgacga tccatagctg 300 gtctgagagg atgatcagcc acattgggac tgagacacgg cccaaactcc tacgggaggc 360 agcagtgggg aatattggac aatgggcgca agcctgatcc agccatgccg cgtgagtgat 420 gaaggcctta gggttgtaaa gctctttcac cggagaagat aatgacggta tccggagaag 480 aagccccggc taacttcgtg ccagcagccg cggtaatacg aagggggcta gtgttgttcg 540 gaattactgg gcgtaaagcg cacgtaggcg gatatttaag tcaggggtga aatcccagag 600 ctcaactctg gaactgcctt tgatactggg tatcttgagt atggaagagg taagtggaat 660 tccgagtgta gaggtgaaat tcgtagatat tcggaggaac accagtggcg aaggcggctt 720 actggtccat tactgacgct gaggtgcgaa agcgtgggga gcaaacagga ttagataccc 780 tggtagtcca cgccgtaaac gatgaatgtt agccgtcggg cagtatactg ttcggtggcg 840 cagctaacgc attaaacatt ccgcctgggg agtacggtcg caagattaaa actcaaagga 900 attgacgggg gcccgcacaa gcggtggagc atgtggttta attcgaagca acgcgcagaa 960 ccttaccagc tcttgacatt cggggtttgg gcagtggaga cattgtcctt cagttaggct 1020 ggccccagaa caggtgctgc atggctgtcg tcagctcgcg tcgtgagatg ttgggttaag 1080 tcccgcaacg agcgcaaccc tcgcccttag ttgccagcat ttagttgggc actctaaggg 1140 gactgccggt gataagccga gaggaaggtg gggacgacgt caagtcctca tggcccttac 1200 gggctgggct acacacgtgc tacaatggtg gtgacagtgg gcagcgagac agcgatgtcg 1260 agctaatctc caaaagccat ctcagttcgg attgcactct gcaactcgag tgcatgaagt 1320 tggaatcgct agtaatcgca gatcagcatg tgcggtgaat 1360 <210> 64 <211> 1288 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 64 tccaggaaac agctatgacc atgattacgc caagcttggt accgagctcg gatccactag 60 taacggccgc cagtgtgctg gaattcgccc ttcaggccta acacatgcaa gtcgagcgcc 120 ccgcaagggg agcggcagac gggtgagtaa cgcgtgggaa tctacccatc cctacggaac 180 aactccggga aactggagct aataccgtat acgccctttg ggggaaagat ttatcgggga 240 tggatgagcc cgcgttggat tagctagttg gtggggtaaa ggcctaccaa ggcgacgatc 300 catagctggt ctgagaggat gatcagccac attgggactg agacacggcc caaactccta 360 cgggaggcag cagtggggaa tattggacaa tgggcgcaag cctgatccag ccatgcccgc 420 gtgagtgatg aaggtcttag gattgtaaag ctctttcacc ggagaagata atgacggtat 480 ccggagaaga agccccggct aactttcgtg ccagcagccg cggtaatacg aagggggcta 540 gcgttgttcg gaattactgg gcgtaaagcg cacgtaggcg gatatttaag tcaggggtga 600 aatcccagag ctcaactctg gaactgcctt tgatactggg tatcttgagt atggaagagg 660 taagtggaat tgcgagtgta gaggtgaaat tcgtagatat tcgcaggaac accagtggcg 720 aaggcggctt actggtccat tactgacgct gaggtgcgaâ agcgtgggga gcaaacagga 780 ttagataccc tggtagtcca cgccgtaaac gatgaatgtt agccgtcggc aagtttactt 840 gtcggtggcg cagctaacgc attaaacatt ccgcctgggg agtacggtcg caagattaaa 900 actcaaagga attgacgggg gcccgcacaa gcggtggagc atgtggttta attcgaagca 960 acgcgcagaa ccttaccagc ccttgacatg cccggacagc tacagagatg tagtgttccc 1020 ttcggggacc gggacacagg tgctgcatgg ctgtcgtcag ctcgtgtcgt gagatgttgg 1080 gttaagtccc gcaacgagcg caaccctcgc ccttagttgc cagcattcag ttgggcactc 1140 taaggggact gccggtgata agccgagagg aagtggggat gacgtcaagt cctnatggcc 1200 cttacgggct gggctacaca cgtgctacaa tgggtggtga cagtgggcag cgaaggaacg 1260 atcccgagct aatctccaaa agccatct 1288 <210> 65 <211> 1386 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 65 cgacggccag tgaattgtaa tacgactcac tatagggcga attgggccct ctagatgcat 60 gctcgagcgg ccgccagtgt gatggatatc tgcagaattc gcccttcagg cctaacacat 120 gcaagtcgag cgggcgtagc aatacgtcag cggcagacgg gtgagtaacg cgtgggaaca 180 taccttttgg ttcggaacaa cacagggaaa cttgtgctaa taccggataa gcccttacgg 240 ggaaagattt atcgccgaaa gattggcccg cgtctgatta gctagttggt agggtaatgg 300 cctaccaagg cgacgatcag tagctggtct gagaggatga tcagccacat tgggactgag 360 acacggccca aactcctacg ggaggcagca gtggggaata ttggacaatg ggcgcaagcc 420 tgatccagcc atgccgcgtg agtgatgaag gccctagggt tgtaaagctc ttttgtgcgg 480 gaagataatg acggtaccgc aagaataagc cccggctaac ttcgtgccag cagccgcggt 540 aatacgaagg gggctagcgt tgctcggaat cactgggcgt aaagggtgcg taggcgggtc 600 tttaagtcag gggtgaaatc ctggagctca actccagaac tgcctttgat actgaagatc 660 ttgagttcgg gagaggtgag tggaactgcg agtgtagagg tgaaattcgt agatattcgc 720 aagaacacca gtgggcgaag gcggctcact ggcccgatac tgacgctgag gcacgaaagc 780 gtggggagca aacaggatta gataccctgg tagtccacgc cgtaaacgat gaatgccagc 840 cgttagtggg tttactcact agtggcgcag ctaacgcttt aagcattccg cctggggagt 900 acggtcgcaa gattaaaact caaaggaatt gacgggggcc cgcacaagcg gtggagcatg 960 tggtttaatt cgacgcaacg cgcagaacct taccagccct tgacatgtcc aggaccggtc 1020 gcagagatgt gaccttctct tcggagcctg gagcacaggt gctgcatggc tgtcgtcagc 1080 tcgtgtcgtg agatgttggg ttaagtcccg caacgagcgc aacccccgtc cttagttgct 1140 accatttagt tgagcactct aaggagactg ccggtgataa gccgcgagga aggtggggat 1200 gacgtcaagt cctcatggcc cttacgggct gggctacaca cgtgctacaa tggcggtgac 1260 aatgggacgc taaggggcaa cccttcgcaa atctcaaaaa gcccgtctca gttcggattg 1320 ggctctgcaa ctcgagccca tgaagttgga atcgctagta atcgtggatc agcacgccac 1380 ggtgaa 1386 <210> 66 <211> 1223 <212> ADN
<213> Organime Inconnu <220>

<223> Origine de la séquence :Organisme du sol <400> 66 agcggcagag ggtgagtaac gcgtgggaat ctacccatct ctacggaaca actccgggaa 60 actggagcta ataccgtata cgtccttcgg gagaaagatt tatcggagat ggatgagccc 120 gcgttggatt agctagttgg tggggtaatg gcctaccaag gcgacgatcc atagctggtc 180 tgagaggatg atcagccaca ctgggactga gacacggccc agactcctac gggaggcagc 240 agtggggaat attggacaat gggcgaaagc ccgatccagc catgccgcgt gagtgatgaa 300 ggccctaggg ttgtaaagct ctttcaacgg tgaggataat gacggtaacc gtagaagaag 360 ccccggctaa cttcgtgcca gcagccgcgg taatacgaag ggggctagcg ttgttcggaa 420 ttactgggcg taaagcgcac gtaggcggac tattaagtca ggggtgaaat cccggggctc 480 aaccccggaa ctgcctttga tactggtagt ctcgagtccg gaagaggtga gtggaattcc 540 gagtgtagag gtgaaattcg tagatattcg gaggaacacc agtggcgaag gcggctcact 600 ggtccggtac tgacgctgag gtgcgaaagc gtggggagca aacaggatta gataccctgg 660 tagtccacgc cgtaaacgat ggaagctagc cgttggcaag tttâcttgtc ggtggcgcag 720 ctaacgcatt aagcttcccg cctggggagt acggtcgcaa gattaaaact caaaggaatt 780 gacgggggcc cgcacaagcg gtggagcatg tggtttaatt cgaagcaacg cgcagaacct 840 taccagccct tgacatcccg gtcgcggtta ccagagatgg tatccttcag ttcggctgga 900 ccggtgacag gtgctgcatg gctgtcgtca gctcgtgtcg tgagatgttg ggttaagtcc 960 cgcaacgagc gcaaccctcg cccttagttg ccagcattca gttgggcact ctaaggggac 1020 tgccggtgat aagccgagag gaaggtgggg atgacgtcaa gtcctcatgg cccttacggg 1080 ctgggctaca cacgtgctac aatggtggtg acagtgggca gcgagaccgc gaggtcgagc 1140 taatctccaa aagccatctc agttcggatt gcactctgca actcgagtgc atgaagttgg 1200 aatcgctagt aatcgcggat cag 1223 <210> 67 <211> 1237 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 67 cccgcagggg agtggcagag ggtgagtaac gcgtgggaat ctaccctttt ctacggaaca 60 actgagggaa acttcagcta ataccgtata cggccgagag gcgaaagatt tatcggagaa 120 ggatgagccc gcgttggatt agctagttgg tggggtaaag gcctaccaag gcgacgatcc 180 atagctggtc tgagaggatg atcagccaca ctgggactga gacacggccc agactcctac 240 gggaggcagc agtggggaat attggacaat gggcgcaagc ctgatccagc catgccgcgt 300 gagtgatgaa ggccctaggg ttgtaaagct ctttcaccgg tgaagataat gacggtaacc 360 ggagaagaag ccccggctaa cttcgtgcca gcagccgcgg taatacgaag ggggctagcg 420 ttgttcggat ttactgggcg taaagcgcac gtaggcggac tattaagtca ggggtgaaat 480 cccggggctc aaccccggaa ctgcctttga tactggtagt cttgagttcg aaagaggtga 540 gtggaattcc gagtgtagag gtgaaattcg tagatattcg gaggaacacc agtggcgaag 600 gcggctcact ggctcgatac tgacgctgag gtgcgaaagc gtggggagca aacaggatta 660 gataccctgg tagtccacgc cgtaaactat gagagctagg cgtcgggcag tatactgttc 720 ggtggcgcag ctaacgcatt aagctcttcg cctggggagt acggtcgcaa gattaaaact 780 caaaggaatt gacgggggcc cgcacaagcg gtggagcatg tggtttaatt cgaagcaacg 840 cgcagaacct taccagccct tgacatcccg atcgcggtta ccagagatgg tatccttcag 900 ttaggctgga tcggtgacag gtgctgcatg gctgtcgtca gctcgtgtcg tgagatgttg 960 ggttaagtcc cgcaacgagc gcaaccctcg cccttagttg ccatcattca gttgggcact 1020 ctaaggggac tgccggtgat aagccgagag gaaggtgggg atgacgtcaa gtcctcatgg 1080 cccttacggg ctgggctaca cacgtgctac aatggtggcg acagtgggca gcgagaccgc 1140 gaggtcgagc taatctccaa aagccatctc agttcggatt gcactctgca actcgagtgc 1200 atgaagttgg aatcgctagt aatcgtggat cagaatg 1237 <210> 68 <211> 1346 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 68 acgacgggcc agtgaattgt aatacgactc actatagggc gaattgggcc ctctagatgc 60 atgctcgagc ggccgccagt gtgatggata tctgcagaat tcgcccttca ggcctaacac 120 atgcaagtcg aacggatccc ttcggattag tggcggacgg gtgagtaaca cgcgggaacg 180 tgccctttgg ttcggaacaa ctcagggaaa cttgagctaa taccggataa gcctttcgag 240 ggaaagattt atcgccattg gagcggcccg cgtaggatta gctagttggt gaggtaaaag 300 ctcaccaagg cgacgatcct tagctggtct gagaggatga tcagccacat tgggactgag 360 acacggccca aactcctacg ggaggcagca gtggggaatc ttgcgcaatg ggcgaaagcc 420 tgacgcagcc atgccgcgtg aatgatgaag gtcttaggat tgtaaaattc tttcaccggg 480 gacgataatg acggtacccg gagaagaagc cccggctaac ttcgtgccag cagccgcggt 540 aatacgaagg gggctagcgt tgctcggaat tactgggcgt aaagggagcg taggcggata 600 gtttagtcag aggtgaaagc ccagggctca accttggaat tgcctttgat actggctatc 660 ttgagtacgg aagaggtatg tggaactccg agtgtagagg tgaaattcgt agatattcgg 720 aagaacacca gtggcgaagg cgacatactg gtccgttact gacgctgagg ctcgaaagcg 780 tggggagcaa acaggattag ataccctggt agtccacgct gtaaacgatg agtgctagtt 840 gtcggcatgc atgcatgtcg gtggcgcagc taacgcatta agcactccgc ctggggagta 900 cggtcgcaag attaaaactc aaaggaattg acgggggccc gcacaagcgg tggagcatgt 960 ggtttaattc gaagcaacgc gcagaacctt accacctttt gacatgcccg gaccgctcca 1020 gagatggagc tttcccttcg gggactggga cacaggtgct gcatggctgt cgtcagctcg 1080 tgtcgtgaga tgttgggtta agtcccgcaa cgagcgcaac cctcgctatt agttgccatc 1140 aggtttggct gggcactcta ataggaccgc cggtggtaag ccggaggaag gtggggatga 1200 cgtcaagtcc tcatggccct tacaaggtgg gctacacacg tgctacaatg gcgactacag 1260 agggctgcaa tcccgcgagg gggagccaat ccctaaaagt cgtctcagtt cggattgcac 1320 tctgcaactc gagtgcatga agttgg 1346 <210> 69 <211> 1500 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 69 acagctatga ccatgattac gccaagcttg gtaccgagct cggatccact agtaacggcc 60 gccagtgtgc tggaattcgc ccttcaggcc taacacatgc aagtcgaacg ccgtagcaat 120 acggagtggc agacgggtga gtaacacgtg ggaacgtgcc ctttggttcg gaacaacaca 180 gggaaacttg tgctaatacc gaataagccc ttacggggaa agatttatcg ccaaaggatc 240 ggcccgcgtc tgattagcta gttggtgggg taacggccca ccaaggctac gatcagtagc 300 tggtctgaga ggatgatcag ccacactggg actgagacac ggcccagact cctacgggag 360 gcagcagtta ggaatcttgg acaatgggcg caagcctgat ccagccatgc cgcgtgagtg 420 atgaaggcct tagggttgta aagctctttc agcggggaag ataatgacgg tacccgcaga 480 agaagccccg gctaacttcg tgccagcagc cgcggtaata cgaagggggc tagcgttgct 540 cggaatcact gggcgtaaag cgcacgtagg cggatcttta agtcaggggt gaaatcctgg 600 agctcaactc cagaactgcc tttgatactg gggatctcga gtccggaaga ggtgagtgga 660 actccgagtg tagaggtgaa attcgtagat attcggaaga acaccagtgg cgaaggcggc 720 tcactggtcc ggtactgacg ctgaggtgcg aaagcgtggg gagcaaacag gattagatac 780 cctggtagtc~cacgccgtaa acgatggatg ctagccgttg gcgggtttac tcgtcagtgg 840 cgcagctaac gcattaagca tcccgcctgg ggagtacggt cgcaagatta aaactcaaag 900 gaattgacgg gggcccgcac aagcggtgga gcatgtggtt caattcgaag caacgcgcag 960 aaccttacca gcccttgaca tgtcccgtat ggacttcaga gatgaggtcc ttcagttcgg 1020 ctggcgggaa cacaggtgct gcatggctgt cgtcagctcg tgtcgtgaga tgttgggtta 1080 agtcccgcaa cgagcgcaac cctcgccctt agttgccatc atttagttgg gcactctaag 1140 gggactgccg gtgataagcc gcgaggaagg tggggatgac gtcaagtcct catggccctt 1200 acgggctggg ctacacacgt gctacaatgg cggtgacagt gggacgcaat ggagcaatcc 1260 tgcgcaaatc tcaaaaagcc gtctcagttc ggattggggt ctgcaactcg accccatgaa 1320 gtcggaatcg ctagtaatcg cagatcagca cgctgcggtg aatacgttcc cgggccttgt 1380 acacaccgcc caagggcgaa ttctgcagat atccatcaca ctggcggccg ctcgagcatg 1440 catctagagg gcccaattcg ccctatagtg agtcgtatta caattcactg gccgtcgttt 1500 <210> 70 <211> 1113 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 70 gagctaatac cgtataatga cttcggtcca aagatttatc gcctgaggat gagcccgcgt 60 cggattagct agttggtagg gtaaaagcct accaaggcga cgatccgtag ctggtctgag 120 aggatgatca gccacactgg gactgagaca cggcccagac tcctacggga ggcagcagtg 180 gggaatattg gacaatgggc gcaagcctga tccagcaatg ccgcgtgagt gatgaaggcc 240 ttagggttgt aaagctcttt tacccgggaa gataatgact gtaccgggag aataagcccc 300 ggctaactcc gtgccagcag ccgcggtaat acggaggggg ctagcgttgt tcggaattac 360 tgggcgtaaa gcgcacgtag gcggctttgt aagttagagg tgaaagcccg gggctcaact 420 ccggaattgc ctttaagact gcatcgctcg aattgtggag aggtaagtgg aattccgagt 480 gtagaggtga aattcgtaga tattcggaag aacaccagtg gcgaaggcga cttactggac 540 acatattgac gctgaggtgc gaaagcgtgg ggagcaaaca ggattagata ccctggtagt 600 ccacgccgta aacgatgatg actagctgtc ggggcgctta gcgtttcggt ggcgcagcta 660 acgcgttaag tcatccgcct ggggagtacg gccgcaaggt taaactcaaa gaaattgacg 720 ggggcctgca caagcggtgg agcatgtggt ttaattcgaa gcaacgcgca gaaccttacc 780 agcgtttgac atgccaggac ggtttccaga gatggattcc ttcccttacg ggacctggac 840 acaggtgctg catggctgtc gtcagctcgt gtcgtgagat gttgggttaa gtcccgcaac 900 gagcgcaacc ctcgtcttta gttgctacca tttagttgag cactctagag aaactgccgg 960 tgataagccg gaggaaggtg gggatgacgt caagtcctca tggcccttac gcgctgggct 1020 acacacgtgc tacaatggcg gtgacaacgg gcagcaaact cgcgagagtg agcaaatccc 1080 gaaaagccgt ctcagttcgg attgttctct gca 1113 <210> 71 <211> 1225 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 71 ggagcggcgg acgggtgagt aacgcgtggg aacgtgccct ttggtacgga acaactgagg 60 gaaacttcag ctaataccgt atgtgccctt cgggggaaag atttatcgcc attggagcgg 120 cccgcgttgg attaggtagt tggtggggta aaggcctacc aagcctacga tccatagctg 180 gtctgagagg atgatcagcc acactgggac tgagacacgg cccagactcc tacgggaggc 240 agcagtaggg aatcttgcgc aatgggcgaa agcctgacgc agccatgccg cgtgtatgat 300 gaaggtctta ggattgtaaa atactttcac cggggaagat aatgacggta cccggagaag 360 aagccccggc taacttcgtg ccagcagccg cggtaatacg aagggggcta gcgttgctcg 420 gaattactgg gcgtaaaggg cgcgtaggcg gatatttaag tcgggggtga aagcccaggg 480 ctcaaccctg gaattgcctt cgatactgga tatcttgagt tcgggagagg tgagtggaat 540 gccgagtgta gaggtgaaat tcgtagatat tcggcggaac accagtggcg aaggcgactc 600 actggcccga tactgacgct gaggcgcgaa agcgtgggga gcaaacagga ttagataccc 660 tggtagtcca cgctgtaaac gatgagtgct agttgtcggc atgcatgcat gtcggtgacg 720 cagctaacgc attaagcact ccgcctgggg agtacggtcg caagattaaa actcaaagga 780 attgacgggg gcccgcacaa gcggtggagc atgtggttta attcgaagca acgcgcagaa 840 ccttaccacc ttttgacatg ccctgatcgc tggagagatc cagttttccc ttcggggaca 900 gggacacagg tgctgcatgg ctgtcgtcag ctcgtgtcgt gagatgttgg gttaagtccc 960 gcaacgagcg caaccctcgc cattagttgc catcattaag ttgggcactc taatgggacc 1020 gccggtggta agccggagga aggtggggat gacgtcaagt cctcatggcc cttacggggt 1080 gggctacaca cgtgctacaa tggcgactac agagggttgc aaacctgcga aggggagcta 1140 atccctaaaa gtcgtctcag ttcggattgc actctgcaac tcgagtgcat gaagtcggaa 1200 tcgctagtaa tcgcggatca gcatg 1225 <210> 72 <211> 1286 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 72 atgattagta gcaatactaa tcgatgacga gcggcggacg ggtgagtaat acgtaggaac 60 ctgcccttaa gcgggggata actaagggaa actttagcta ataccgcata aactcgagag 120 agaaaagctg cagcaatgtg gcacttgagg aggggcctgc gtcagattag ctagttggtg 180 aggtaatagc tcaccaaggc gatgatctgt aactggtctg agaggacgac cagtcacact 240 gggactgaga cacggcccag actcctacgg gaggcagcag tggggaatat tggacaatgg 300 gggcaaccct gatccagcga tgccgcgtgg gtgaagaagg ccttcgggtt gtaaagccct 360 ttaggtcggg aagaaggtta gtagaggaaa tgctattaac ttgacggtac cgacagaata 420 agcaccggca aactctgtgc cagcagccgc ggtaatacag agggtgcgag cgttaatcgg 480 atttactggg cgtaaagggc gcgtaggcgg tgagatgtgt gtgatgtgaa agccccaggc 540 tcaacctggg aagtgcatcg caaactgtct gactggagta tatgagaggg tggcggaatt 600 tccggtgtag cggtgaaatg cgtagagatc ggaaggaacg tcgatggcga aggcagccac 660 ctggcataat actgacgctg aggcgcgaaa gcgtggggat cgaacaggat tagataccct 720 ggtagtccac gctgtaaact atgagtacta gatgttggta ggggaaccta tcggtatcga 780 agctaacgcg ataagtattc cgcctgggaa gtacggccgc aaggttgaaa ctcaaatgaa 840 ttgacggggg cccgcacaag cggtggagca tgtggtttaa ttcgatgcaa cgcgaagaac 900 cttacctacc cttgacatcc tgagaatctg gcttagtagc tggagtgccg aaaggagctc 960 agagacaggt gctgcatggc tgtcgtcagc tcgtgttgtg agatgttggg ttaagtcccg 1020 taacgagcgc aacccttgcc cttagttgcc atcatttagt tggggactct aaggggaccg 1080 ccagtgatga actggaggaa ggcggggacg acgtcaagtc atcatggcct ttatgggtag 1140 ggccacacac gtgctacaat ggggcgtacg gagggtcgca aacccgcgag ggggagctaa 1200 tctcataaag cgtctcgtag tccggattgg agtctgcaac tcgactccat gaagttggaa 1260 tcgctagtaa tcgcgaatca gcattg 1286 <210>73 <211>1288 <212>ADN

<213>Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 73 cggggcaacc ctggcggcga gcggcgaacg ggtgagtaat gcatcggaac gtgtcctctt 60 gtgggggata accagtcgaa agactggcta ataccgcatg agatcgaaag atgaaagcag 120 gggaccgcaa ggccttgcgc gagaggagca gccgatgccg gattagctag ttggtggggt 180 aaaagcctac caaggcgacg atccgtagct ggtctgagag gacgaccagc cacactggga 240 ctgagacacg gcccagactc ctacgggagg cagcagtggg gaattttgga cagtgggggc 300 aaccctgatc cagccatgcc gcgtgtgtga agaaggcctt cgggttgtaa agcactttcg 360 gacggaacga aatcgcgcga gttaatagtt cgcgtggatg acggtaccgt aagaagaagc 420 accggctaac tacgtgccag cagccgcggt aatacgtagg gtgcgagcgt taatcggaat 480 tactgggcgt aaagtgtgcg caggcggctt cgcaagtcga gtgtgaaatc cccgagctta 540 acttgggaat tgcgctcgaa actacggagc cggagtgtgg cagaggaagg tggaattcca 600 cgtgtagcgg tgaaatgcgt agagatgtgg aggaacaccg atggcgaagg cggccttctg 660 ggccaacact gacgctcatg cacgaaagcg tggggagcaa acaggattag ataccctggt 720 agtccacgcc ctaaacgatg atgactagtt gttggaggag ttaaatcctt tagtaacgca 780 gctaacgcgt gaagtcatcc gcctggggag tacggtcgca agattaaaac tcaaaggaat 840 tgacgggggc ccgcacaagc ggtggatgat gtggtttaat tcgatgcaac gcgaaaaacc 900 ttacctaccc ttgacatgct aggaacgctg cagaaatgta gcggtgcccg aaagggaacc 960 tagacacagg tgctgcatgg ctgtcgtcag ctcgtgtcgt gagatgttgg gttaagtccc 1020 gcaacgagcg caacccctgc cattagttgc tacattcagt tgagcactct aatgggactg 1080 ccggtgacaa accggaggaa ggtggggatg acgtcaagtc ctcatggccc ttatgggtag 1140 ggctacacac gtcatacaat ggcgcgtaca gagggttgcc aacccgcgag ggggagccaa 1200 tcccagaaag cgcgtcgtag tccggattgg agtctgcaac tcgactccca tgaagtcgga 1260 atcgctagta atcgcggatc agcatgtc 1288 <210> 74 <211> 600 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 74 cgtgccagca gccgcggtaa tacgtaggtg gcaagcgttg tccggaatta ttgggcgtaa 60 agcgcgcgca ggtggtttct taagtctgat gtgaaagccc acggcttaac cgtggagggt 120 cattggaaac tgggagactt gagtgcagaa gaggaaagtg gaattccaag tgtagcggtg 180 aaatgcgtag agatttggag gaacaccagt ggcgaaggcg actttctggt ctgcaactga 240 cgctgaggcg cgaaagcatg gggagcaaac aggattagat accctggtag tccatgccgt 300 aaacgatgag tgctaagtgt tagggggttt ccgcccctta gtgctgcagc taacgcatta 360 agcactccgc ctggggagta cgaccgcaag gttgaaactc aaaggaattg acgggggccc 420 gcacaagcgg tggagcatgt ggtttaattc gaagcaacgc gaagaacctt accaggtctt 480 gacatcccga tgancgctct agagatagag ttttcccttc ggggacattg gtgacaggtg 540 gtgcatggtt gtcgtcagct cgtgtcgtga gatgttgggt taagtcccgc aacgagcgca 600 <210> 75 <211> 601 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 75 cgtgccagca gccgcggtaa tacgtaggtg gcaagcgttg tccggaatta,ttgggcgtaa 60 agcgcgcgca ggtggtttct taagtctgat gtgaaagccc acggcttaac cgtggagggt 120 cattggaaac tgggagactt gagtgcagaa gaggaaagtg gaattccaag tgtagcggtg 180 aaatgcgtag agatttggag gaacaccagt ggcgaaggcg actttctggt ctgcaactga 240 cgctgaggcg cgaaagcatg gggagcaaac aggattagat accctggtag tccatgccgt 300 aaacgatgag tgctaagtgt tagggggttt ccgcccctta gtgctgagct aacgcattaa 360 gcactccgcc tggggagtac gaccgcaagg ttgaaactca aaggaattga cgggggcccg 420 cacaagcggt ggagcatgtg gtttaattcg aagcaacgcg aagaacctta ccaggtcttg 480 acatcccgat gacgctctag agatagagtt ttcccttcgg ggacattggt gacaggtggt 540 gcatggttgt cgtcagctcg tgtcgtgaga tgttgggtta agtcccgcaa cgagcgcacc 600 c 601 <210> 76 <211> 1236 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 76 tgccctgtag acggggataa cttcgggaaa ccggagctaa taccggataa tcctcttccc 60 cacatgggga agagttgaaa ggcgctttcg cgtcactaca ggatgggccc gcggtgcatt 120 agctagttgg tagggtaacg gcctaccaag gcgacgatgc atagccgacc tgagagggtg 180 atcggccaca ttgggactga gacacggccc aaactcctac gggaggcagc agtagggaat 240 cttccacaat ggacgaaagt ctgatggagc aacgccgcgt gagtgatgaa ggttttcgga 300 tcgtaaaact ctgttgtaag ggaagaacca gtacgtcagg caatggacgt accttgacgg 360 taccttatta gaaagccacg gctaactacg tgccagcagc cgcggtaata cgtaggtggc 420 aagcgttgtc cggaattatt gggcgtaaag cgcgcgcagg tggtttctta agtctgatgt 480 gaaagcccac ggcttaaccg tggagggtca ttggaaactg ggagacttga gtgcagaaga 540 ggaaagtgga attccaagtg tagcggcgaa atgcgtagag atttggagga acaccagtgg 600 cgaaggcgac tttctggtct gcaactgacg ctgaggcgcg aaagcatggg gagcaaacag 660 gattagatac cctggtagtc catgctgtaa acgatgagtg ctaagtgtta gggggtttcc 720 gccccttagt gctgcagcta acgcattaag cactccgcct ggggagtacg accgcaaggt 780 tgaaactcaa aggaattgac gggggcccgc acaagcggtg gagcatgtgg tttaattcga 840 agcaacgcga agaaccttac caggtcttga catcccgatg atcgctctgg agatagagtt 900 ttcccttcgg ggacattggt gacaggtggt gcatggttgt cgtcagctcg tgtcgtgaga 960 tgttgggtta agtcccgcaa cgagcgcaac ccttaatctt agttgccatc atttagttgg 1020 gcactctaag gtgactgccg gtgataaacc ggaggaaggt ggggatgacg tcaaatcatc 1080 atgcccctta tgacctgggc tacacacgtg ctacaatgga cggtacaaag agtcgctaac 1140 tcgcgagagt atgctaatct catagaaccg ttctcagttc ggattgtagg ctgcaactcg 1200 cctacatgaa gccggaatcg ctagtaatcg cggatc 1236 <210> 77 <211> 815 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 77 caagcgttgt ccggaattat tgggcgtaaa gagctcgtag gcggtttgtc gcgtctgctg 60 tgaaaactcg aggctcaacc tcgggcttgc agtgggtacg ggcagactag agtgcggtag 120 gggtgactgg aattcctggt gtagcggtgg aatgcgcaga tatcaggagg aacaccgatg 180 gcgaaggcag gtcactgggc cgcaactgac gctgaggagc gaaagcatgg ggagcgaaca 240 ggattagata ccctggtagt ccatgccgta aacgttgggc actaggtgtg gggctcattc 300 cacgagttcc gtgccgcagc aaacgcatta agtgccccgc ctggggagta cggccgcaag 360 gcttaaaact caaagaaatt gacgggggcc cgcacaagcg gcggagcatg cggattaatt 420 cgatgcaacg cgaagaacct taccaaggct tgacatacac cggaaacttc cagagatggt 480 tgccccgcaa ggtcggtgta caggtggtgc atggttgtcg tcagctcgtg tcgtgaagat 540 gttgggttaa gtcccgcaac gagcgcaacc ctcgtcctat gttgccagca cgtgatggtg 600 gggactcata ggagactgcc ggggtcaact cggaggaagg tggggatgac gtcaaatcat 660 catgcccctt atgtcttggg cttcacgcat gctacaatgg ccggtacaaa gggctgcgat 720 accgcaaggt ggagcgaatc ccaaaaagcc ggtctcagtt cggattgggg tctgcaactc 780 gaccccatga agtcggagtc gctagtaatc gcaga 815 <210> 78 <211> 826 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 78 tcgtaggtgg cttgtcacgt cgggtgtgaa agcttggggc ttaactccag gtctgcattc 60 gatacgggct ggctagaggt aggtagggga gaacggaatt cctggtgtag cggtgaaatg 120 cgcagatatc aggaggaaca ccggtggcga aggcggttct ctgggcctta cctgacgctg 180 aggagcgaaa gcgtggggag cgaacaggat tagataccct ggtagtccac gctgtaaacg 240 ttgggcgcta ggtgtgggga ccttccacgg tttccgcgcc gtagctaacg cattaagcgc 300 cccgcctggg gagtacggcc gcaaggctaa aactcaaagg aattgacggg ggcccgcaca 360 agcggcggag catgttgctt aattcgacgc aacgcgaaga accttaccaa ggcttgacat 420 cgcccggaaa gcttcagaga tggagccctc ttcggactgg gtgacaggtg gtgcatggct 480 gtcgtcagct cgtgtcgtga gatgttgggt taagtcccgc aacgagcgca acccttgttc 540 aatgttgcca gcaacatcct tcggggtggt tggggactca ttggagactg ccggggtcaa 600 ctcggaggaa ggtggggacg acgtcaagtc atcatgcccc ttatgtcttg ggctgcaaac 660 atgctacaat ggccggtaca gagggttgcg ataccgcaag gtggagcgaa tccctaaaag 720 ccggtctcag ttcggattgg ggtctgcaac tcgaccccat gaagtcggag tcgctagtaa 780 tcgcagatca gcaacgctgc ggtgaatacg ttcccgggcc ttgtac 826 <210> 79 <211> 799 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 79 cgtaggcggt ttgtcgcgtc tgccgtgaaa gtccggggct caactccgga tctgcggtgg 60 gtacgggcag actagagtga tgtaggggag actggaattc ctggtgtagc ggtgaaatgc 120 gcagatatca ggaggaacac cgatggcgaa ggcaggtctc tgggcattaa ctgacgctga 180 ggagcgaaag catggggagc gaacaggatt agataccctg gtagtccatg ccgtaaacgt 240 tgggcactag gtgtggggga cattccacgt tttccgcgcc gtagctaacg cattaagtgc 300 cccgcctggg gagtacggcc gcaaggctaa aactcaaagg aattgacggg ggcccgcaca 360 agcggcggag catgcggatt aattcgatgc aacgcgaaga accttaccaa ggcttgacat 420 gaaccggaaa cacctggaaa caggtgcccc gcttgcggtc ggtttacagg tggtgcatgg 480 ttgtcgtcag ctcgtgtcgt gagatgttgg gttaagtccc gcaacgagcg caaccctcgt 540 tctatgttgc cagcgcgtta tggcggggac tcataggaga ctgccggggt caactcggag 600 gaaggtgggg acgacgtcaa atcatcatgc cccttatgtc ttgggcttca cgcatgctac 660 aatggccggt acaaagggtt gcgatactgt gaggtggagc taatcccaaa aagccggtct 720 cagttcggat tggggtctgc aactcgaccc catgaagtcg gagtcgctag taatcgcaga 780 tcagcaacgc tgcggtgaa 799 <210> 80 <211> 1250 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 80 tgccagcttg ctggtggatt agtggcgaac gggtgagtaa cacgtgagta acctgccctt 60 aactctggga taagcctggg aaactgggtc taatgccgga tatgactcct catcgcatgg 120 tggggggtgg aaagcttttt gtggttttgg atggactcgc ggcctatcag cttgttggtg 180 aggtaatggc tcaccaaggc gacgacgggt agccggcctg agagggtgac cggccacact 240 gggactgaga cacggcccag acttctacgg gaggcagcag tggggaatat tgcacaatgg 300 gcgaaagcct gatgcagcga cgccgcgtga gggatgacgg ccttcgggtt gtaaacctct 360 ttcagtaggg aagaagcgaa agtgacggta cctgcagaag aagcgccggc taactacgtg 420 ccagcagccg cggtaatacg tagggcgcaa gcgttatccg gaattattgg gcgtaaagag 480 ctcgtaggcg gtttgtcgcg tctgccgtga aagtccgggg ctcaactccg gatctgcggt 540 gggtacgggc agactagagt gatgtagggg agactggaat tcctggtgta gcggtgaaat 600 gcgcagatat caggaggaac accgatggcg aaggcaggtc tctgggcatt aactgacgct 660 gaggagcgaa agcatgggga gcgaacagga ttagataccc tggtagtcca tgccgtaaac 720 gttgggcact aggtgtgggg gacattccac gttttccgcg ccgtagctaa cgcattaagt 780 gccccgcctg gggagtacgg ccgcaaggct aaaactcaaa ggaattgacg ggggcccgca 840 caagcggcgg agcatgcgga ttaattcgat gcaacgcgag gaaccttacc aaggcttgac 900 atgaaccgga aatacctgga aacaggtgcc ccgcttgcgg tcggtttaca ggtggtgcat 960 ggttgccgtc agctcgtgtc gtgagatgtt gggttaagtc ccgcaacgag cgcaaccctc 1020 gttctatgtt gccagcgcgt tatggcgggg actcatagga gactgccggg gtcaactcgg 1080 aggaaggtgg ggacgacgtc aaatcatcat gccccttatg tcttgggctt cacgcatgct 1140 acaatggccg gtacaaaggg ttgcgatact gtgaggtgga gctaatccca aaaagccggt 1200 ctcagttcgg attggggtct gcaactcgac cccatgaagt cggagtcgct 1250 <210> 81 <211> 1210 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 81 cgctaatacc ggatacggcg cgagagtctt cggactttcg cgagaaagat tcgcaaggat 60 cactgaggga cgagcctgcg gcccatcagc tagttggtga ggtaagagct caccaaggct 120 aagacgggta gctggtctga gaggatgatc agccacactg gaactgagac acggtccaga 180 ctcctacggg aggcagcagt ggggaatatt gcgcaatggg cgaaagcctg acgcagccac 240 gccgcgtgag cgatgagggc cttcgggtcg taaagctctg tggggagaga cgaataaggc 300 cggtgaagag tcggccttga cggtatctcc ttagcaagca ccggctaact ccgtgccagc 360 agccgcggta atacggaggg tgcaaacgtt gctcggaatc attgggcgta aagcgcacgt 420 aggcggcgtg ataagttggg tgtgaaagcc ctgggctcaa cccaggaagt gcattcaaaa 480 ctgtcacgct tgaatctcgg agggggtcag agaattcccg gtgtagaggt gaaattcgta 540 gatatcggga ggaataccag tggcgaaggc gctggcctgg acgaagattg acgctgaggt 600 gcgaaagcgc ggggagcaaa caggattaga taccctggta gtccgcgctg taaacgatga 660 gtgctagacg ggggaggtat tgaccccttc gctgccgaag ctaacgcgtt aagcactccg 720 cctggggagt acggtcgcaa gactaaaact caaaggaatt gacgggggcc cgcacaagcg 780 gtggagcatg tggtttaatt cgacgcaacg cgcaaaacct tacctgggtt aaatccgccg 840 gaacctggct gaaaggctgg ggtgccctcc ggggaatcgg tgagaaggtg ctgcatggct 900 gtcgtcagct cgtgtcgtga gatgttgggt taagtcccgc aacgagcgca acccctatcg 960 tcagttgcca acattaaggt gggaactctg gcgagactgc cggtctaaac cggaggaagg 1020 tggggacgac gtcaagtcct catggccctt atgcccaggg ctacacacgt gctacaatgg 1080 ctggtacaat gagccgcaaa accgcgaggt caagctaatc tcaaaaaacc agtctcagtt 1140 cggatcggag tctgcaactc gactccgtga agctggaatc gctagtaatc gaagatcagc 1200 acgctttcgg 1210 <210> 82 <211> 1272 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 82 gatgccagct tgctggtgga ttagtggcga acgggtgagt aacacgtgag taacctgccc 60 ttaactctgg gataagcctg ggaaactggg tctaataccg gatatgactc ctcatcgcat 120 ggtggggggt ggaaagcttt ttgtggtttt ggatggactc gcggcctatc agcttgttgg 180 tgaggtaatg gctcaccaag gcgacgacgg gtagccggcc tgagagggtg accggccaca 240 ctgggactga gacacggccc agactcctac gggaggcagc agtggggaat attgcacaat 300 gggcgaaagc ctgatgcagc gacgccgcgt gagggatgac ggccttcggg ttgtaaacct 360 ctttcagtag ggaagaagcg aaagtgacgg tacctgcaga agaagcgccg gctaactacg 420 tgccagcagc cgcggtaata cgtagggcgc aagcgttatc cggaattatt.gggcgtaaag 480 agctcgtagg cggtttgtcg cgtctgccgt gaaagtccgg ggctcaactc cggatctgcg 540 gtgggtacgg gcagactaga gtgatgtagg ggagactgga attcctggtg tagcggtgaa 600 atgcgcagat atcaggagga acaccgatgg cgaaggcagg tctctgggca ttaactgacg 660 ctgaggaacg aaagcatggg gagcgaacag gattagatac cctggtagtc catgccgtaa 720 acgttgggca ctaggtgtgg gggacattcc acgttttccg cgccgtagct aacgcattaa 780 gtgccccgcc tggggagtac ggccgcaagg ctaaaactca aaggaattga cgggggcccg 840 cacaagcggc ggagcatgcg gattaattcg atgcaacgcg aagaacctta ccaaggcttg 900 acatgaaccg gaaatacctg gaaacaggtg ccccgcttgc ggtcggttta caggtggtgc 960 atggttgtcg tcagctcgtg tcgtgagatg ttgggttaag tcccgcaacg agcgcaaccc 1020 tcgttctatg ttgccagcgc gttatggcgg ggactcatag gagactgccg gggtcaactc 1080 ggaggaaggt ggggacgacg tcaaatcatc atgcccctta tgtcttgggc ttcacgcatg 1140 ctacaatggc cggtacaaag ggttgcgata ctgtgaggtg gagctgatcc caaaaagccg 1200 gtcccagttc ggattggggt ctgcaactcg accccatgaa gtcggagtcg ctagtaatcg 1260 cagatcagca ac 1272 <210> 83 <211> 1247 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 83 tgtttagtag caatactaaa tgatgacgag cggcggacgg gtgaggaaca cgtaggaacc 60 tgcccaagag agggggacaa ccaagggaaa ctttggctaa taccgcataa tctctacgga 120 gaaaagttgc ccgtaagggt ggcgcttttg gaggggcctg cgtccgatta gttagttggt 180 gaggtaatag ctcaccaaga ctgtgatcgg taactggtct gagaggacga ccagtcacac 240 tgggactgag acacggccca gactcctacg ggaggcagca gtggggaatc ttggacaatg 300 ggggcaaccc tgatccagcg atgccgcgtg ggtgaagaag gccttcgggt tgtaaagccc 360 tttaggcggg gaagaaggat atgggatgaa taagcctgta ttttgacggt acccgcagaa 420 taagcaccgg caaactctgt gccagcagcc gcggtaatac agagggtgcg agcgttaatc 480 ggatttactg ggcgtaaagg gcgcgtaggc ggttgtgtga gtgtgatgtg aaagccccgg 540 gctcaacctg ggaagtgcat cgcaaacgac acaactggag tatatgagag ggtggcggaa 600 tttccggtgt agcggtgaaa tgcgtagaga tcggaaggaa cgtcgatggc gaaggcagcc 660 acctggcata atactggcgc tgaggcgcga aagcgtgggg agcgaacagg attagatacc 720 ctggtagtca cgcccgtaaa cgatgagaac tagatgttgg agggggaacc cttcagtatc 780 gaagctaacg cgataagttc tccgcctggg aagtacagtc gcaagactga aactcaaaag 840 aattgacggg ggcccgcaca agcggtggag catgtggttt aattcgatgc aacgcgaaga 900 accttacctg cccttgacat cctgcgaatc ttgccgagag gtgagagtgc cgcagggagc 960 gcagagacag gtgctgcatg gctgtcgtca gctcgtgttg tgagatgttg ggttaagtcc 1020 cgtaacgagc gcaacccttg tccttagttg ccatcattta gttggggact ctaaggagac 1080 cgccggtgat gaaccggagg aaggcgggga cgacgtcaag tcatcatggc ctttatgggt 1140 agggctacac acgtgctaca atggggcgta cagagggtcg ccaacccgcg agggggagcc 1200 aatctcttaa agcgtctcgt agtccggatt ggagtctgca actcgac 1247 <210> 84 <211> 1292 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 84 ggctcgcaag agcaaccggc gaacgggtgc gtaacacgtg aacaacctgc cctcgtgtgg 60 gggatagccg ggctaacgcc cgggtaatac cgcatacgtt ctctctgggg agtcctgggg 120 agaggaaagc tccggcgcac ggggaggggt tcgcggccta tcagctagtt ggcggggtaa 180 tggcccacca aggcgacgac gggtagctgg tctgagagga tggccagcca cattgggact 240 gagagacggc ccagactcct acgggaggca gcagtgggga atcttgcgca atggccgaaa 300 ggctgacgca gcgacgccgc gtgtgggagg acgcctttcg gggtgtaaac cactgttgcc 360 cgggacgaac agcctctttc gagaggtctg acggtaccgg gtgaggaagc accggctaac 420 tccgtgccag cagccgcggt aatacggagg gtgcgagcgt tgtccggaat cattgggcgt 480 aaagggcgcg taggtggccc ggtcagttcg tggtgaaagc gcggggctca accctgcgtc 540 ggccatgaat actgccgcgg ctggagcact gtagaggcag gcggaattcc gggtgtagcg 600 gtggaatgcg tagagatccg gaagaacacc ggtggcgaag gcggcctgct gggcagtagc 660 tgacactgag gcgcgacagc gtggggagca aacaggatta gataccctgg tagtccacgc 720 cgtaaacgat gggcactagg cgcttggggg agcgaccccc cgagggccgg cgctaacgca 780 ttaagtgccc cgcctgggga gtacggccgc aaggctgaaa ctcaaaggaa ttgacggggg 840 cccgcacaag cggtggagca tgtggtttaa ttcgacgcaa cgcgaagaac cttacctagg 900 cttgacatac acgggaaacc ggtcagaaac ggccggccct cttcggagcc cgtgcacagg 960 tgctgcatgg ctgtcgtcag ctcgtgtcgt gagatgttgg gttaagtccc gcaacgagcg 1020 caacccctgt ctctagttgc cagcgcgtca tggcggggac tctagagaga ctgccggtgc 1080 caaaccggag gaaggtgggg atgacgtcaa gtcatcatgg tccttacgtc tagggctaca 1140 cacgtgctac aatggcgggg acagagggtc gcgagccggc aacggcaagc caatcccgta 1200 aaccccgcct cagttcggat tgtcgtctgc aactcgacgg catgaagctg gaatcgctag 1260 taatcgtgga tcagctacgc cacggtgaat ac 1292 <210> 85 <211> 1300 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 85 tcccttcggg agcaagtaca gcggcgaacg ggtgagtaac acgtaggtaa cctaccctgg 60 agactgggat aacctgccga aaggcgggct aataccagat aagaccacga gggctgcggc 120 ccttggggca aaaggtggcc tctacttgta agctaccact ccgggatggg cctgcgcgcc 180 attagctagt tggcggggta acggcccacc aaggcagaga tggctagctg gtctgagagg 240 atggccagcc acacagggac tgagacacgg cccagactcc tacgggaggc agcagtgggg 300 aatattgcgc aatgggcgaa agcctgacgc agcgacgccg cgtgggtgat gaaggccttc 360 gggtcgtaaa gccctgtcaa gagggacgaa accttgtcga cctaacacgt cggcaacctg 420 acggtacctc tgaaggaagc accggctaac tccgtgccag cagccgcggt aatacggagg 480 gtgcgagcgt tgttcggaat tactgggcgt aaagcgcgtg taggcggcct cttcagtctg 540 gtgtgaaagc ccggggctca accccggaag tgcattggat actgggaggc,tggagtaccg 600 gagaggaggg tggaattcct ggtgtagcgg tgaaatgcgt agatatcagg aggaacacct 660 gtggcgaagg cggccctctg gacggatact gacgctgaga cgcgaaagcg tggggagcaa 720 acaggattag ataccctggt agtccacgct gtaaacgatg ggcactaggt gttcggggta 780 ttgaccccct gagtgccgca gctaacgcat taagtgcccc gcctggggaa tacggccgca 840 aggttaaaac tcaaaggaat tgacgggggc ccgcacaagc ggtggagcat gtggtttaat 900 tcgacgcaac gcgaagaacc ttacctgggc tagacaacat cggacagcct cagaaatgag 960 gtctccccgc aaggggccgg tggttcaggt gctgcatggc tgtcgtcagc tcgtgtcgtg 1020 agatgttggg ttaagtcccg caacgagcgc aacccctgtc tctagttgct accattcagt 1080 tgagcactct agagagactg cccngtgtta aacgggagga aggtggggac gacgtcaagt 1140 cctcatggcc cttatgtcca gggctacaca cgtgctacaa tgggcgatac aaagggctgc 1200 gaacccgcga ggggaagcca atcccaaaaa gtcgctctca gttcggattg gagtctgcaa 1260 ctcgactcca tgaaggcgga atcgctagta atcgcggatc 1300 <210> 86 <211> 1186 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 86 caatgggcag cggcggacgg gtgagtaaca cgtgggaatg tacctttcgg tgcggaacaa 60 ctcagggaaa cttgagctaa tgccgcatac gcccttacgg ggaaagattt atcgccgaaa 120 gatcagcccg cgttggatta gctagttggt gaggtaatgg cccaccaagg cgacgatcca 180 tagctggttt gagagaacga ccagcctcac tgggactgag acacggccca gactcctacg 240 ggaggcagca gttgggaatc ttggacaatg ggggaaaccc tgatccagcc atgccgcgtg.300 agtgatgaag gccttcgggt tgtaaaactc tttcgacggg gacgataatg acggtacccg 360 tagaagaagc tccggctaac ttcgtgccag cagccgcggt aatacgaagg gggctagcgt 420 tgttcggaat tactgggcgt aaagcgtgcg caggcggcta tccaagtcag tggtgaaagc 480 ccggagctca actccggaat tgccattgaa actgtttagc ttgagtacga gagaggtgag 540 tggaataccc agtgtagagg tgaaattcgt agatattggg tagaacaccg gtggcgaagg 600 cggctcactg gctcgtaact gacgctcagg cacgacagcg tggggatcaa acaggattag 660 ataccctggt agtccacgcc gtaaacgatg aacgctagcc gttggatagc ttgctattca 720 gtggcgcagc taacgcatta agcgttccgc ctggggagta cggccgcaag gttgagactc 780 agaggaattg acgggggccc gcacaagcgg tggagcatgt ggtttaattc gacgcaacgc 840 gcagaacctt accagggttt gacatcctgt gctcgccggt gaaagccggt tttcccgcaa 900 gggacgcaga gacaggtgct gcatggctgt cgtcagctcg tgtcgtgaga tgttgggtta 960 agtcccgcaa cgagcgcaac cctcgccttt agttgccatc attcagttgg gcactctaga 1020 gggaccgccg gcgacaagcc ggaggaaggt ggggatgacg tcaagtcccc atggccctta 1080 caccctgggc tacacacgtg ctacaatggc ggtgacagtg ggcacgagct cgcgagagtc 1140 agctaatccc aaaaaaccgt cccagttcag attgcactct gcaact 1186 <210> 87 <211> 1454 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 87 cgacggccag tgaattgtaa tacgactcac tatagggcga attgggccct ctagatgcat 60 gctcgagcgg ccgccagtgt gatggatatc tgcagaattc gcccttcagg cctaacacat 120 gcaagtcgag cgagaaaggg cgcttcggcg cctgagtaca gcggcgcacg ggtgcgtaac 180 acgtgggcaa tctgtccttg agatggggat aacccagcga aagttgggct aataccgaat 240 aagactacag gaggcaactc ccgtggttaa agggtgctct ctgcggggag catgcgcttg 300 aggaggagcc cgcggcctat cagctagttg gtagggtcac ggcctaccaa ggcgaagacg 360 ggtagctggt ctgagaggat gaccagccac acggggactg agacacggcc ccgactccta 420 cgggaggcag cagtggggaa tattgggcaa tgggggaaac cctgacccag cgacgccgcg 480 tgggtgatga aggccttcgg gtcgtaaagc cctgtcgggc ggaacgaagg ttctcacggc 540 aaatagccgt gagaggtgac ggtaccgccg aaggaagcac cggccaactc cgtgccagca 600 gccgcggtaa gacggagggt gcaagcgttg ctcggaatca ctgggcgtaa agggtgcgta 660 ggcggtctcg caagtctggc gtgaaagccc aaggctcagc cttggaagtg cgctcgaaac 720 tgcgaggctg gagtgccgga ggggagagtg gaattcccgg tgtagcggtg aaatgcgtag 780 agatcgggag gaataccggt ggcgaaagcg actctctgga cggcaactga cgctgaggca 840 cgaaagcgtg gggagcaaac aggattagat accctggtag tccacgccgt aaacgatgga 900 cactaggtgt cgggggtatc cactccctcg gtgccgccgc taacgcagta agtgtcccgc 960 ctgggaagta cggtcgcaag attaaaactc aaaggaattg acgggggccc gcacaagcgg 1020 tggagcatgt ggttcaattc gatgcaacgc gaagaacctt acctgggttt gacatctggc 1080 gaatctctgg gaaaccagag agtgcccgca ggggagcgcc aagacaggtg ctgcatggct 1140 gtcgtcagct cgtgccgtga ggtgttgggt taagtcccgc aacgagcgca acccttaccc 1200 ttagttgccc ccgggtcaag ccgtggcact ccaagggaac tgcccgtgtt aagcgggagg 1260 aaggtgggga cgacgtcaag tcatcatggc ctttatatcc agggctacac acgtgctaca 1320 atggctggga canagcgtgg ccaacgcgcg agcgggagct aatcgcaaaa ccccagcctc 1380 agttcggatc ggagtctgca actcgactcc gtgaagctgg aatcgctagt aatcgcggat 1440 cagcatgccg cggt 1454 <210> 88 <211> 1307 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 88 cccttcgggg agcgagtaca gcggcgaacg ggtgagtaac acgtaggtaa cctaccctgg 60 tgactgggat aacttgccga aaggcgggct aataccagat aagaccacga gggctgcggc 120 ctttggggta aaagatggcc tctgcttgca tgctatcacg ccgggatggg cctgcgcgcc 180 attagctagt tggtgaggta acggctcacc aaggcagaga tggctagctg gtctgagagg 240 atggccagcc acactgggac tgagacacgg cccagactcc tacgggaggc agcagtgggg 300 aatattgcgc aatgggcgaa agcctgacgc agcgacgccg cgtgggtgat gaaggccttc 360 gggtcgtaaa gccctgtcaa gagggacgaa acctcgccga cccaatacgt cggcgacctg 420 acggtacctc tgaaggaagc accggctaac tccgtgccag cagccgcggt aatacggagg 480 gtgcaagcgt tgttcggaat cactgggcgt aaagcgcgtg taggcggcct tcttagtctg 540 gtgtgaaagc ccggggctca accccggaag agcattggat actggaaggc,tggagtaccg 600 gagaggaggg tggaattcct ggtgtagcgg tgaaatgcgt agatatcagg aggaacaccg 660 gtggcgaagg cggccctctg gacggatact gacgctgaga cgcgacagcg tggggagcaa 720 acaggattag ataccctggt agtccacgcc gtaaacgatg ggtactaggt gttcggggta 780 ttgaccccct gagtgccgca gctaacgcat taagtacccc gcctggggac tacggccgca 840 aggctaaaac tcaaaggaat tgacgggggc ccgcacaagc ggtggagcat gtggtttaat 900 tcgacgcaac gcgaagaacc ttacctgggc tagacaacac tggacagccc cagaaatggg 960 gtcttcccgc aagggactgg tggttcaggt gctgcatggc tgtcgtcagc tcgtgtcgtg 1020 agatgttggg ttaagtcccg caacgagcgc aacccctgtc tctagttgct accattaagt 1080 tgagcactct agagagactg cccgtgttaa acgggaggaa ggtggggacg acgtcaagtc 1140 ctcatggccc ttatgtccag ggctacacac gtgctacaat ggacagtaca aagggctgcg 1200 aacccgtgag ggggagccaa tcccaaaaag ctgttctcag ttcggattgg agtctgcaac 1260 tcgactccat gaaggcggaa tcgctagtaa tcgcggatca gcatgcc 1307 <210> 89 <211> 1305 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 89 gggagcaatc cccaagtaga gcggcgaacg ggtgagtaac gcgtgggtaa tctgcctccg 60 agtggggaac aacatcggga aactggtgct aataccgcat aacatcgttg ggtcttcgga 120 tctgacgatc aaagccgggg accgcaaggc ctggcgcttg gagaggagcc cgcgtccgat 180 tagctagttg gtggggtaat ggcccaccaa ggcttcgatc ggtagccggc ctgagagggc 240 ggacggccac actgggactg agacacggcc cagactccta cgggaggcag cagtggggaa 300 tttttcgcaa tgggcgaaag cctgacgaag caacgccgcg tggaggatga gggccttcgg 360 gtcgtaaact cctgtcgacc gggacgaaag taggatggcc taatacgccg atctattgac 420 tgtaccggtg gaggaagcca cggctaactc tgtgccagca gccgcggtaa tacagaggtg 480 gcaagcgttg ttcggaatta ctgggcgtaa agggcgcgta ggcggcttgg tcagtcccgt 540 gtgaaatccc tcggctcaac tgaggaactg cacgggaaac tgcctggctt gagttcggga 600 gagggaagtg gaattccggg tgtagcggtg aaatgcgtag atatccggag gaacaccggt 660 ggcgaaggcg gcttcctgga ccgacactga cgctgaggcg cgaaagctag gggagcaaac 720 gggattagat accccggtag tcctagctgt aaacgatgag tgctgggtgt agggggtatc 780 aaccccccct gtgccgaagc taacgcatta agcactccgc ctggggagta cggtcgcaag 840 gctgaaactc aaaggaattg acgggggccc gcacaagcgg tggagcatgt ggttcaattc 900 gacgcaacgc gaagaacctt accggggttt gaactgtacg ggacagctct agagatagag 960 tcttccttcg ggacccgtac agaggtgctg catggctgtc gtcagctcgt gtcgtgagat 1020 gttgggttaa gtcccgcaac gagcgcaacc cttgcctcct gttgccatca ggtaaagctg 1080 ggcactctgg agagactgcc ggtgataaac cggaggaagg tggggatgac gtcaagtcct 1140 catggccttt atgccccggg ctacacacgt gctacaatgg ccggtacaaa gggtcgcaaa 1200 accgcgaggt ggagctaatc ccaaaaagcc ggtcccagtt cggattgcag tctgcaactc 1260 gactgcatga agttggaatc gctagtaatc gcggatcagc atgcc 1305 <210> 90 <211> 1299 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la sêquence :Organisme du sol <400> 90 gggctttcgg gtcctgagta aagtggcgaa cgggtgagta acgcgtaggt aacctgacct 60 cgagtgtgga ataacctggc gaaagccggg ctaataccgc atgacgtctt cgggtcttcg 120 gacttgagga ccaaaggtgg cgagctttga gcgctgtcgc tcgagaaggg gcctgcgtcc 180 cattagctag ttggtggggt gatggcctac caaggcgacg atgggtagcc gggctgagag 240 gctgtccggc cacactggaa ccgagacacg gtccagactc ctacgggagg cagcagtggg 300 gaatcttgcg caatggggga aaccctgacg caacgacgcc gcgtgggcga tgaaggcctt 360 cgggtcgtaa agccctgtcg agcgggacga accgtgcgag ctctaacata gctcgtgcct 420 gacggtaccg ctagaggaag ccccggctaa ctccgtgcca gcagccgcgg taatacggag 480 ggggctagcg ttattcggaa ttattgggcg taaagggcgt gtaggcggct ctgtgtgtcc 540 catgtgaaag ccctcggctc aaccggggaa ctgcatggga aactgcggag cttgagtccg 600 ggagaggtga gtggaattcc cagtgtagcg gtgaaatgcg tagatattgg gaggaacacc 660 agtggcgaag gcggctcact ggaccggtac tgacgctgag acgcgaaagc caggggagca 720 aacgggatta gataccccgg tagtcctggc tgtaaacgat gagcacttgg tgtggcgggt 780 atcgacccct gccgtgctga agctaacgca ttaagtgctc cgcctgggga gtacggccgc 840 aaggctgaaa ctcaaaggaa ttgacggggg cccgcacaag cggtggagca tgtggttcaa 900 ttcgacgcaa cgcgaagaac cttacctggg tttgaactgc aggtgacagc ccctgaaagg 960 gggtcttcct tcgggacacc tgtagaggtg ccgcatggct gtcgtcagct cgtgtcgtga 1020 gatgttgggt taagtcccgc aacgagcgca acccctactc ctagttgcca gcggctcggc 1080 cgggaactct agggggaccg ccggtgataa accggaggaa ggtggggatg acgtcaagtc 1140 ctcatggcct ttatgtccag ggctacacac gtgctacaac ggacggtaca aagggctgcg 1200 aaggcgcgag ccggagccaa tcccaaaaag ccgttctcca gtgcggattg cagtctgcaa 1260 ctcgactgca tgaaggtgga atcgctagta atcgcggat 1299 <210> 91 <211> 1296 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 91 atgtctggta gcaataccag atgatggcaa gtggcggacg ggtgagtaat acgtagggat 60 ctgcccagaa gagggggaca acccggggaa actcgggcta ataccgcata ctattctgag 120 gaagaaagct tggcgcaagc caggcgcttt tggaggaacc tacgtccgat tagctagttg 180 gtgaggtaaa ggctcaccaa ggcagagatc ggtagctggt ctgagaggat gaccagccac 240 actgggactg agacacggcc cagactccta cgggaggcag cagtggggaa tattggacaa 300 tgggggcaac cctgatccag cgatgccgcg tgtgtgaaga aggccttcgg gttgtaaagc 360 actttagttg gggaagaagt aatgtttttt aatagagagc attgttgacg gtacccaaag 420 aataagcacc ggctaactct gtgccagcag ccgcggtaat acagagggtg caagcgttaa 480 tcggagttac tgggcgtaaa gggcgcgtag gcggtgttgc aagtgagatg tgaaatccct 540 gggcttaacc taggaaccgc attttagact gcaatgctag agtacagtag agggtagtgg 600 aatttccggt gtagcggtga aatgcgtaga gatcggaagg aacaccagtg gcgaaggcga 660 ctacctggac tgacactgac gctgaggcgc gagagcgtgg ggagcaaaca ggattagata 720 ccctggtagt ccacgctgta aacgatgaga actagatgtt ggtgcgcgcg agcgcacaag 780 tatcgaagct aacgcgataa gttctccgcc tggggagtac ggccgcaagg ttaaaactca 840 aaggaattga cgggggcccg cacaagcggt ggagcatgtg gtttaattcg atgcaacgcg 900 aggaacctta cctacccttg acatccacag aatttgatag agatatcgaa gtgccgaaag 960 gaactgtgag acaggtgctg catggctgtc gtcagctcgt gttgtgagat gttgggttaa 1020 gtcccgtaac gagcgcaacc cttatcctta gttgccaaca cgtaatggtg gggactctaa 1080 ggagactgcc ggtgaagaac cggaggaagg tggggacgac gtcaagtcat catggccttt 1140 atgggtaggg ctacacacgt gctacaatgg ggcgtacaga gggttgccaa cctgcgaagg 1200 ggagccaatc ccggaaagcg cctcgtagtc cagattgaag tctgcaactc gacttcatga 1260 agtcggaatc gctagtaatc gcgaatcaga acgtcc 1296 <210> 92 <211> 1250 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 92 gtctggtagc aataccagat gatggcaagt ggcggacggg tgagtaatac gtagggatct 60 gcccagaaga gggggacaac ccggggaaac tcgggctaat accgcatact attctgagga 120 aaaaagcttg gcgcaagcca ggcgcttttg gaggaaccta cgtccgatta gctagttggt 180 gaggtaaagg ctcaccaagg cagagatcgg tagctggtct gagaggatga ccagccacac 240 tgggactgag acacggccca gactcctacg ggaggcagca gtggggaata ttggacaatg 300 ggggcaaccc tgatccagcg atgccgcgtg tgtgaagaag gccttcgggt tgtaaagcac 360 tttagttggg gaagaagtaa tgttttttaa tagagagcat tgttgacggt acccaaagaa 420 taagcaccgg ctaactctgt gccagcagcc gcggtaatac agagggtgca agcgttaatc 480 ggagttactg ggcgtaaagg gcgcgtaggc ggtgttgcaa gtgagatgtg aaatccctgg 540 gcttaaccta ggaaccgcat tttagactgc aatgctagag tacagtagag ggtagtggaa 600 tttccggtgt agcggtgaaa tgcgtagaga tcggaaggaa caccagtggc gaaggcgact 660 acctggactg acactgacgc tgaggcgcga gagcgtgggg agcaaacagg attagatacc 720 ctggtagtcc acgctgtaaa cgatgagaac tagatgttgg tgcgcgcgag cgcacaagta 780 tcgaagctaa cgcgataagt tctccgcctg gggagtacgg ccgcaaggtt aaaactcaaa 840 ggaattgacg ggggcccgca caagcggtgg agcatgtggt ttaattcgat gcaacgcgaa 900 gaaccttacc tacccttgac atccacagaa tttgatagag atatcgaagt gccgaaagga 960 actgtgagac aggtgctgca tggctgtcgt cagctcgtgt tgtgagatgt tgggttaagt 1020 cccgtaacgg gcgcaaccct tatccttagt tgccaacacg taatggtggg gactctaagg 1080 agactgccgg tgaagaaccg gaggaaggtg gggacgacgt caagtcatca tggcctttat 1140 gggtagggct acacacgtgc tacaatgggg cgtacagagg gttgccaacc tgcgaagggg 1200 agccaatccc ggaaagcgcc tcgtagtcca gattgaagtc tgcaactcga 1250 <210> 93 <211> 1545 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 93 ccaggaaaca gctatgacca tgattacgcc aagcttggta ccgagctcgg atccactagt 60 aacggccgcc agtgtgctgg aattcgccct tcaggcctaa cacatgcaag tcgaacggca 120 gcacagggga gcttgctccc tgggtggcga gtggcggacg ggtgaggaat acatcggaat 180 ctgcccagtc gtgggggata acctcgggaa accgggacta ataccgcata cgaccttagg 240 gtgaaagcgg aggaccgcaa ggcttcgcgc gattggatga gccgatgtcg gattagcttg 300 ttggcggggt aacggcccac caaggcgacg atccgtagct ggtctgagag gatgatcagc 360 cacactggaa ctgagacacg gtccagactc ctacgggagg cagcagtggg gaatattgga 420 caatgggcgc aagcctgatc cagccatgcc gcgtgagtga agaaggcctt cgggttgtaa 480 agctcttttg tccggaaaga aaagctttcg gttaataccc ggaagtcctg acggtaccgg 540 aagaataagc accggctaac ttcgtgccag cagccgcggt aatacgaagg gtgcaagcgt 600 tactcggaat tactgggcgt aaagcgtgcg taggtggttt gttaagtctg atgtgaaagc 660 cctgggctca acctgggaat tgcactggat actggcaggc tagagtgcgg tagaggatgg 720 cggaattccc ggtgtagcag tgaaatgcgt agagatcggg aggaacatct gtggcgaagg 780 cggccatctg gaccagcact gacactgagg cacgaaagcg tggggagcaa acaggattag 840 ataccctggt agtccacgcc ctaaacgatg cgaactggat gttgggagca actaggctct 900 cagtatcgaa gctaacgcgt taagttcgcc gcctggggag tacggtcgca agactgaaac 960 tcaaaggaat tgacgggggc ccgcacaagc ggtggagtat gtggtttaat tcgatgcaac 1020 gcgaagaacc ttacctggcc ttgacatcca cggaacttac cagagatggt ttggtgcctt 1080 cggnaaccgt gagacaggtg ctgcatggct gtcgtcagct cgtgtcgtga gatgttgggt 1140 taagtcccgc aacgagcgca acccttgtcc ttagttgcca gcacgtaatg gtgggaactc 1200 taaggagact gccggtgaca aaccggagga aggtggggat gacgtcaagt catcatggcc 1260 cttacggcca gggctacaca cgtactacaa tggtcggtac agagggttgc aaagccgcga 1320 ggtagagcca atcccagaaa accgatccca gtccggatcg aagtctgcaa ctcgacttcg 1380 tgaagtcgga atcgctagta atcgcggatc a~gaatgccgc ggtgaatacg ttcccgggcc 1440 ttgtacacac cgcccaaggg cgaattctgc agatatccat cacactggcg gccgctcgag 1500 catgcatcta gagggcccaa ttcgccctat agtgagtcgt attac 1545 <210> 94 <211> 1549 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 94 ttttaaaccg acggccagtg aattgtaata cgactcacta tagggcgaat tgggccctct 60 agatgcatgc tcgagcggcc gccagtgtga tggatatctg cagaattcgc ccttcaggcc 120 taacacatgc aagtcgagcg gcagcgcggg gcaacctggc ggcgagcggc ggacgggtga 180 ggaatgcatc ggaatctacc ctgtcgtggg ggataacgta gggaaactta cgctaatacc 240 gcatacgacc gagaggtgaa agtgggggac cgcaaggcct cacgcgatag gatgagccga 300 tgccggatta gctagttggt gaggtaaagg ctcaccaagg cgacgatccg tagctggtct 360 gagaggatga tcagccacat tgggactgag acacggccca aactcctacg ggaggcagca 420 gtggggaata ttggacaatg ggcgcaagcc tgatccagcc atgccgcgtg tgtgaagaag 480 gccttcgggt tgtaaagcac ttttgttcgg gaagaaatcg tgcgggttaa tacccagtac 540 ggatgacggt accgaaagaa taagcaccgg ctaacttcgt gccagcagcc gcggtaatac 600 gaagggtgca agcgttactc ggaatcactg ggcgtaaagc gtgcgtaggc ggttggttaa 660 gtctgctgtg aaagccctgg gctcaacctg ggaactgcag tggatactgg ccagctagag 720 tgtgatagag gatggtggaa ttcccggtgt agcggtgaaa tgcgtagaga tcgggaggaa 780 caccagtggc gaaggcggcc atctggatca acactgacgc tgaggcacga aagcgtgggg 840 agcaaacagg attagatacc ctggtagtcc acgccctaaa cgatgcgaac tggacgttgg 900 gagcaacttg gctctcagtg tcgaagctaa cgcgctaagt tcgccgcctg gggagtacgg 960 tcgcaagact gaaactcaaa ggaattgacg ggggcccgca caagcggtgg agtatgtggt 1020 ttaattcgat gcaacgcgaa gaaccttacc tggccttgac atccacggaa cttaccagag 1080 atggtttggt gccttcggaa ccgtgagaca ggtgctgcat ggctgtcgtc agctcgtgtc 1140 gtgagatgtt gggttaagtc ccgcaacgag cgcaaccctt gtccttagtt gccagcacgt 1200 aatggtggga actctaagga gactgccggt gacaaaccgg aggaaggtgg ggatgacgtc 1260 aagtcatcat ggcccttacg gccagggcta cacacgtact acaatggtcg gtacaagagg 1320 gttgcaaagc ccgcgaggta gagccaatcc cagaaaaccc gatcccagtc ccggatcgaa 1380 gtctgcaact cgacttcgtg aagtcggaat cgctagtaat cgcggatcag aatgccgcgg 1440 tgaatacgtt cccgggcctt gtacacaccg cccaagggcg aattccagca cactggcggc 1500 cgttactagt ggatccgagc tcggtaccaa gcttggcgta atcatggtc 1549 <210> 95 <211> 1276 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 95 ctggcggcga gcggcggacg ggtgaggaat acatcggaat ctacccagtc gtgggggata 60 acgtagggaa acttacgcta ataccgcata cgacctgagg gtgaaagcag gggatcgcaa 120 gaccttgcgc gattggatga gccgatgtcc gattagctag ttggtgaggt aaaggctcac 180 caaggcgacg atcggtagct ggtctgagag ggtgatcagc cacactggaa ctgagacacg 240 gtccagactc ctacgggagg cagcagtggg gaatattgga caatgggcgc aagcctgatc 300 cagccatgcc gcgtgtgtga agaaggcctt cgggttgtaa agcacttttg ttcgggaaga 360 aatcttccga gttaatacct cgggaggatg acggtaccgg aagaataagc accggctaac 420 ttcgtgccag cagccgcggt aatacgaagg gtgcaagcgt tactcggaat tactgggcgt 480 aaagcgtgcg taggtggttc gttaagtctg ccgtgaaagc cccgggctca acctgggaat 540 tgcggtggat actggcggac tagagtgcgg tagagggtgg tggaattccc ggtgtagcag 600 tgaaatgcgt agagatcggg aggaacatct gtggcgaagc ggccacctgg accagcactg 660 acactgaggc acgaaagcgt ggggagcaaa caggattaga taccctggta gtccacgccc 720 taaacgatgc gaactggacg ttgggagcaa ctaggctctc agtgtcgaag ctaacgcgtt 780 aagttcgccg cctggggagt acggtcgcaa gactgaaact caaaggaatt gacgggggcc 840 cgcacaagcg gtggagtgtg tggtttaatt cgatgcaacg cgaagaacct tacctggcct 900 tgacatccac ggaatccttt agagatagag gagtgccttc gggaaccgtg agacaggtgc 960 tgcatggctg tcgtcagctc gtgtcgtgag atgttgggtt aagtcccgca acgagcgcaa 1020 cccttgtcct tagttgccag cgcgtaatgg cgggaactct aaggagactg ccggtgacaa 1080 accggaggaa ggtggggatg acgtcaagtc atcatggccc ttacggccag ggctacacac 1140 gtactacaat ggtggggaca gagggtcgcg aagccgcgag gtggagccaa tcccagaaac 1200 cccatcctag tccggatcgg agtctgcaac tcgactccgt gaagtcggaa tcgctagtaa 1260 tcgcggtcag catgcc 1276 <210> 96 <211> 1306 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 96 cagggatcag tagagtggca aacgggtgag taacgcgtgg gcgacctacc ttcgagtggg 60 ggataacctt ccgaaaggag ggctaatacc gcatgacatc ccgtgtttgg atacacggac 120 atcaaagccg gggatcgcaa gacctggcgc ttggagaggg gcccgcgtcc gattagctag 180 ttggtgaggt cacggctcac caaggctccg atcggtatcc ggcctgagag ggcggacgga 240 cacactggga ctgagacacg gcccagactc ctacgggagg cagcagtggg gaattgttcg 300 caatgggcgc aagcctgacg acgcaacgcc gcgtggagga tgaagacctt cgggtcgtaa 360 actcctttcg accgagatga agacccgccg gcctaatacg ccggcggatt gacagtatcg 420 agggaagaag ccccggctaa ctccgtgcca gcagccgcgg taatacgggg ggggcaagcg 480 ttgttcggaa ttactgggcg taaagggttc gtaggtggct cgctaagtca gacgtgaaat 540 ccctcagctc aactggggaa ctgcgtctga gactggcaag cttgagtgca ggagaggaac 600 gcggaattcc aggtgtagcg gtgaaatgcg tagatatctg gaggaacacc ggtggcgaag 660 gcggcgttct ggactgcaac tgacactgag gaacgaaagc taggggagca aacgggatta 720 gataccccgg tagtcctagc cctaaacgat gaatgcttgg tgtggcgggt atcgatccct 780 gccgtgccgc agttaacgcg ataagcattc cgcctgggga gtacggtcgc aaggctgaaa 840 ctcaaaggaa ttgacggggg cccgcacaag cggtggagca tgtggttcaa ttcgacgcaa 900 cgcgaagaac cttacctagg ctcgaagtgc agatgaccat cggtgaaagc cgactttcgc 960 aagaacatct gtagaggtgc tgcatggctg tcgtcagctc gtgtcgtgag atgttgggtt 1020 aagtcccgca acgagcgcaa cccttgtttc ctgttgccat caggttaagc tgggcactct 1080 ggagagactg ccggtgacaa accggaggaa ggtggggatg acgtcaagtc agcatggcct 1140 ttatgtctag ggctacacac gtgctacaat ggccggtaca aagcgctgca aacccgcgag 1200 ggtgagccaa tcgcagaaag ccggtctcag ttcggatagc aggctgcaac tcgcctgctt 1260 gaagttggaa tcgctagtaa tcgcggatca gcatgccgcg gtgaat 1306 <210> 97 <211> 1300 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 97 cccgcagggt gagtagatgg caaacgggtg agtaacacgt gggtgacctg cctcagagtg 60 ggggataacg acccgaaagg gtcgctaata ccgcataaca tcctgtcttt ggatagacgg 120 agatcaaagc cggggatcgc aagacctggc gcttagagag gggcccgcgg ccgattagct 180 agttggtgag gtaacggctc accaaggcaa cgatcggtat ccggcctgag agggcggacg 240 gacacactgg gactgagaca cggcccagac tcctacggga ggcagcagtg gggaattgtt 300 cgcaatgggc gcaagcctga cgacgcaacg ccgcgtggag gatgaagatc.ttcgggtcgt 360 aaactccttt cgatcgggaa gaacgcctct ggtgtgaaca ccatcagagg gtgacggtac 420 cgagagaaga agccccggct aactctgtgc cagcagccgc ggtaatacag ggggggcaag 480 cgttgttcgg aattactggg cgtaaagggc tcgtaggcgg ccggctaagt ccgacgtgaa 540 atccccaggc ttaacctggg aactgcgtcg gatactggcg ggcttgaatc cgggagaggg 600 atgcggaatt ccaggtgtag cggtgaaatg cgtagatatc tggaggaaca ccggtggcga 660 aggcggcatc ctggaccggt attgacgctg aatagcgaaa gccaggggag caaacgggat 720 tagatacccc ggtagtcctg gccctaaacg atgaatgttt ggtgtggcgg gtatcgatcc 780 ctgccgtgcc gaagctaacg cattaaacat tccgcctggg gagtacggtc gcaaggctga 840 aactcaaagg aattgacggg ggcccgcaca agcggtggag catgtggttc aattcgacgc 900 aacgcgaaga accttaccca ggctcgaacg gcattggaca tccggcgaaa gccggctccc 960 gcaagggccg atgtcgaggt gctgcatggc tgtcgtcagc tcgtgtcgtg agatgttggg 1020 ttaagtcccg caacgagcgc aacccttgtc cgctgttgcc atcacgttat ggtgggcact 1080 ctgcggagac tgccggtgat aaaccggagg aaggtgggga tgacgtcaag tcagcatggc 1140 ctttatgtct ggggctacac acgtgctaca atggccggta caaaccgttg cgatctcgca 1200 agagtgagct aatcggagaa agccggtctc agttcggatt gcaggctgca actcgcctgc 1260 atgaagttgg aatcgctagt aatcgcggat cagcacgccg 1300 <210> 98 <211> 1233 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 98 acggagcggc agacgggaga gtaacacgtg ggaacgtgçc ctttggttcg gaacaacaca 60 gggaaacttg tgctaatacc ggataagccc ttacggggaa agatttatcg ccaaaggatc 120 ggcccgcgtc tgattagcta gttggtgagg taacggctca ccaaggcgac gatcagtagc 180 tggtctgaga ggatgatcag cctcactggg actgagacac ggcccagact cctacgggag 240 gcagcagtgg ggaatattgg acaatgggcg caagcctgat ccagccatgc cgcgtggatg 300 atgaaggccc tagggttgta aagtcctttc ggcggggaag ataatgacgg tacccgcaga 360 agaagccccg gctaacttcg tgccagcagc cgcggtaata cgaagggggc tagcgttgct 420 cggaatcact gggcngtaaa gcgcacgtag gcggcttttt aagtcagggg tgaaatcctg 480 gagctcaact ccagaactgc ctttgatact gagaagcttg agtccgggag aggtgagtgg 540 aactgcgagt gtagaggtga aattcgtaga tattcgcaag aacaccagtg gcgaaggcgg 600 ctcactggcc cggtactgac gctgaggtgc gaaagcgtgg ggagcaaaca ggattagata 660 ccctggtagt ccacgctgta aacgatggat gctagccgtt gtcgggttta ctcgtcagtg 720 gcgcagctaa cgcattaagc atcccgcctg gggagtacgg tcgcaagatt aaaactcaaa 780 ggaattgacg ggggcccgca caagcggtgg agcatgtggt tcaattcgaa gcaacgcgca 840 gaaccttacc agcccttgac atgtcccgta tgagtaccag agatggaact cttcagttcg 900 gctggcggga acacaggtgc tgcatggctg tcgtcagctc gtgtcgtgag atgttgggtt 960 aagtcccgca acgagcgcaa ccctcgccct tagttgccat catttagttg ggcactctaa 1020 ggggactgcc ggtgataagc cgcgaggaag gtggggatga cgtcaagtcc tcatggccct 1080 tacgggctgg gctacacacg tgctacaatg gcggtgacag tgggatgcag aggggtaacc 1140 ccgagcaaat ctcaaaaagc cgtctcagtt cggattgtgc tctgcaactc gagcacatga 1200 agttggaatc gctagtaatc gcagatcagc acg 1233 <210> 99 <211> 1304 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 99 cgaaatcccg cagggatcag tagagtggca aacgggtgag taacacgtgg gtgacctgcc 60 ttcgagtggg ggataacgtc ccgaaaggga cgctaatacc gcatgacatc ctgctcttga 120 acgagtggag atcaaagctg gggatcgcaa gacctagcgc tcaaagaggg gcccgcgcct 180 gattagctag ttggtggggt aacggctcac caaggcgacg atcagtatcc ggcctgagag 240 ggcggacgga cacactggga ctgagacacg gcccagactc ctacgggagg cagcagtggg 300 gaattgttcg caatgggcgc aagcctgacg acgcaacgcc gcgtggagga tgaagatctt 360 cgggtcgtaa actcctttcg atcgagacga acggcctccg ggtgaacaat ccggaggagt 420 gacggtaccg agagaagaag ccccggctaa ctccgtgcca gcagccgcgg taatacgggg 480 ggggcaagcg ttgttcggaa ttactgggcg taaagggctc gtaggcggcc aactaagtca 540 gacgtgaaat ccctcggctt aaccggggaa ctgcgtctga tactggatgg ctagaggttg 600 ggagagggat gcggaattcc aggtgtagcg gtgaaatgcg tagatatctg gaggaacacc 660 ggtggcgaag gcggcatcct ggaccaattc tgacgctgag gagcgaaagc caggggagca 720 aacgggatta gataccccgg tagtcctggc cctaaacgat gaatgcttgg tgtggcgggt 780 atcgatccct gccgtgccga agctaacgca ttaagcattc cgcctgggga gtacggtcgc 840 aaggctgaaa ctcaaaggaa ttgacggggg cccgcacaag cggtggagca tgtggttcaa 900 ttcgacgcaa cgcgaagaac cttacccagg cttgaacagc gagtgaccac tcctgaaaag 960 gagcttccgc aaggacactc gtagaggtgc tgcatggctg tcgtcagctc gtgtcgtgag 1020 atgttgggtt aagtcccgca acgagcgcaa cccttgtttg ctgttgccat cacgttatgg 1080 tgggcactct gcaaagactg ccggtgataa accggaggaa ggtggggatg acgtcaagtc 1140 agcatggcct ttatgtctgg ggctacacac gtgctacaat ggccggtaca aaccgtcgca 1200 aaaccgtaag gtcgagctaa tcggagaaag ccggtctcag ttcggatcgt cggctgcaac 1260 tcgccggcgt gaagttggaa tcgctagtaa tcgcggatca gcac 1304 <210> 100 <211> 1197 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 100 tctagtggcg cacgggtgcg taacgcgtgg gaatctgccc ttgggttcgg gataacagtt 60 ggaaacgact gctaataccg gatgatgtct tcggaccaaa gatttatcgc ccagggatga 120 gcccgcgtcg gattagctag ttggtgaggt aaaggctcac caaggcgacg atccgtagct 180 ggtctgagag gatgatcagc cacactggga ctgagacacg gcccagactc ctacgggagg 240 cagcagtggg gaatattgga caatgggcga aagcctgatc cagcaatgcc gcgtgagtga 300 tgaaggcctt agggttgtaa agctcttttg cccgggatga taatgacagt accgggagaa 360 taagccccgg ctaactccgt gccagcagcc gcggtaatac ggagggggct agcgttgttc 420 ggaattactg ggcgtaaagc gcacgtaggc ggctttgtaa gttagaggtg aaagcccgga 480 gctcaactcc ggaactgcct ttaagactgc atcgcttgaa cgtcggagag gtaagtggaa 540 ttccgagtgt agaggtgaaa ttcgtagata ttcggaagaa caccagtggc gaaggcgact 600 tactggacga ctgttgacgc tgaggtgcga aagcgtgggg agcaaacagg attagatacc 660 ctggtagtcc acgccgtaaa cgatgatgac tagctgtcgg ggctcatgga gtttcggtgg 720 cgcagctaac gcgttaagtc atccgcctgg ggagtacggc cgcaaggtta aaactcaaag 780 aaattgacgg gggcctgcac aagcggtgga gcatgtggtt taattcgaag caacgcgcag 840 aaccttacca gcgtttgaca tggtaggacg gtttccagag atggattcct tcccttacgg 900 gacctacaca caggtgctgc atggctgtcg tcagctcgtg tcgtgagatg ttgggttaag 960 tcccgcaacg agcgcaaccc tcgtctttag ttgctaccat ttagttgggc actctaaaga 1020 aactgccggt gataagccgg aggaaggtgg ggatgacgtc aagtcctcat ggcccttacg 1080 cgctgggcta cacacgtgct acaatggcgg tgacagtggg cagcaaactc gcgagagtga 1140 gcaaatcccc aaaaaccgtc tcagttcgga ttgttctctg caactcgaga gcatgaa 1197 <210> 101 <211> 1352 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la sêquence :Organisme du sol <400> 101 cgacggccag tgaattgtaa tacgactcac tatagggcga attgggccct ctagatgcat 60 gctcgagcgg ccgccagtgt gatggatatc tgcagaattc gcccttcagg cctaacacat 120 gcaagtcgca cgagaaaggg cttcggcccc ggtacagtgg cgcacgggtg agtaacacgt 180 aggcaatctc ccctcgagtg gtggataacc ttccgaaagg agggctaata cagcatgaga 240 ccacgagctc gcagagcttg tggccaaagc ggacctcttc ttgaaagttc gcgcttgagg 300 atgagcctgc ggcccatcag ctagttggta gggtaatggc ctaccaaggc taagacgggt 360 agctggtctg agaggacgga cagccacact ggaactgaga cacggtccag actcctacgg 420 gaggcagcag tggggaatct tgcgcaatgg acgaaagtct gacgcagcga cgccgcgtga 480 gcgatgaagg ccttcgggtt gtaaagctct gtggggagag acgaataagg tgcagctaat 540 acctgcatcg atgacggtat ctccttagca agcaccggct aactctgtgc cagcagccgc 600 ggtaagacag agggtgcaaa cgttgttcgg aattactggg cgtaaagcgc gtgtaggcgg 660 ctgtgtaagt cgggcgtgaa atcccatggc tcaaccatgg aagtgcaccc gaaactgcgt 720 agctagagtc ctggagagga aggtggaatg cttggtgtag aggtgaaatt cgtagatatc 780 aagcggaaca ccggtggcga agcggccttc tggacagtga ctgacgctga gacgcgaaag 840 cgtggggagc aaacaggatt agataccctg gtagtccacg ccgtaaacga tgaatgctag 900 acgctggggt gcatgcactt cggtgtcgcc gctaacgcat taagcattcc gcctggggag 960 tacggccgca aggttaaaac tcaaaggaat tgacgggggc ccgcacaagc ggtggagcat 1020 gtggtttaat tcgaagcaac gcgcaaacct taccaaccct tgacatgtcc attgccggtc 1080 cgagagattg gaccttcagt tcggctggat ggaacacagg tgctgcatgg ctgtcgtcag 1140 ctcgtgtcgt gagatgttgg gttaagtccc gcaacgagcg caacccctac cgccagttgc 1200 catcattcag ttgggcactc tggtggaact gccggtgaca agccggagga agcggggatg 1260 acgtcaagtc ctcatggccc ttatgggttg ggctacacac gtgctacaat ggcggtgaca 1320 gtgggacgcg aagtccaaga tggacaaatc cc 1352 <210> 102 <211> 1361 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 102 aacagctatg accatgatta cgccaagctt ggtaccgagc tcggatccac tagtaacggc 60 cgccagtgtg ctggaattcg cccttcaggc ctaacacatg caagtcgaac ggatccttcg 120 ggattagtgg cggacgggtg agtaacacgt gggaacgtgc cctttggttc ggaacaactc 180 agggaaactt gagctaatac cggataagcc tttcgaggga aagatttatc gccattggag 240 cggcccgcgt aggattagct agttggtgag gtaaaagctc accaaggcga cgatccttag 300 ctggtctgag aggatgatca gccacattgg gactgagaca cggcccaaac tcctacggga 360 ggcagcagtg gggaatcttg cgcaatgggc gcaagcctga tccagccatg ccgcgtgagt 420 gatgaaggcc ttagggttgt aaagctcttt caccggagaa gataatgacg gtatccggag 480 aagaagcccc ggctaacttc gtgccagcag ccgcggtaat acgaaggggg ctagcgttgt 540 tcggaattac tgggcgtaaa gcgcacgtag gcggatattt aagtcagggg tgaaatccca 600 gagctcaact ctggaactgc ctttgatact gggtatcttg agtatggaag aggtaagtgg 660 aattccgagt gtagaggtga aattcgtaga tattcggagg aacaccagtg gcgaaggcgg 720 cttactggtc cattactgac gctgaggtgc gaaagcgtgg ggagcaaaca ggattagata 780 ccctggtagt ccacgccgta aacgatgaat gttagccgtc gggcagtata ctgttcggtg 840 gcgcagctaa cgcattaaac attccgcctg gggagtacgg tcgcaagatt aaaactcaaa 900 ggaattgacg ggggcccgca caagcggtgg agcatgtggt ttaattcgaa gcaacgcgca 960 gaaccttacc agctcttgac attcggggtt tgggcagtgg agacattgtc cttcagttag 1020 gctggcccca gaacaggtgc tgcatggctg tcgtcagctc gtgtcgtgag atgttgggtt 1080 aagtcccgca acgagcgcaa ccctcgccct tagttgccag catttagttg ggcactctaa 1140 ggggactgcc ggtgataagc cgagaggaag gtggggatga cgtcaagtcc tcatggccct 1200 tacgggctgg gctacacacg tgctacaatg gtggtgacag tgggcagcga gacagcgatg 1260 tcgagctaat ctccaaaagc catctcagtt cggattgcat ctgcaactcg agtgcatgaa 1320 gttggaatcg ctagtaatcg cagatcagca tgctgcggtg a 1361 <210> 103 <211> 1300 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 103 catgtttagt agcaatacta aatgatgacg agcggcggac gggtgaggaa cacgtaggaa 60 cctgcccaag agagggggac aaccaaggga aactttggct aataccgcat aatctctacg 120 gagaaaagtt gcccgtaagg gtggcgcttt tggaggggcc tgcgtccgat tagttagttg 180 gtgaggtaat agctcaccaa gactgtgatc ggtaactggt ctgagaggac gaccagtcac 240 actgggactg agacacggcc cagactccta cgggaggcag cagtggggaa tcttggacaa 300 tgggggcaac cctgatccag cgatgccgcg tgggtgaaga aggccttcgg gttgtaaagc 360 cctttaggcg gggaagaagg atatgggatg aataagcctg tattttgacg gtacccgcag 420 aataagcacc ggcaaactct gtgccagcag ccgcggtaat acagagggtg cgagcgttaa 480 tcggatttac tgggcgtaaa gggcgcgtag gcggttgtgt gagtgtgatg tgaaagcccc 540 gggctcaacc tgggaagtgc atcgcaaacg acacaactgg agtatatgag agggtggcgg 600 aatttccggt gtagcggtga aatgcgtaga gatcggaagg aacgtcgatg gcgaaggcag 660 ccacctggca taatactgac gctgaggcgc gaaagcgtgg ggagcgaaca ggattagata 720 ccctggtagt ccacgccgta aacgatgaga actagatgtt ggagggggaa cccttcagta 780 tcgaagctaa cgcgataagt tctccgcctg ggaagtacag tcgcaagact gaaactcaaa 840 agaattgacg ggggcccgca caagcggtgg agcatgtggt ttaattcgat gcaacgcgaa 900 gaaccttacc tacccttgac atcctgcgaa tcttgccgag aggtgagagt gccgcaagga 960 gcgcagagac aggtgctgca tggctgtcgt cagctcgtgt tgtgagatgt tgggttaagt 1020 cccgtaacga gcgcaaccct tgtccttagt tgccatcatt tagttgggga ctctaaggag 1080 accgccggtg atgaaccgga ggaaggcggg gacgacgtca agtcatcatg gcctttatgg 1140 gtagggctac acacgtgcta caatggggcg tacagagggt cgccaacccg cgagggggag 1200 ccaatctctt aaagcgtctc gtagtccgga ttggagtctg caactcgact ccatgaagtc 1260 ggaatcgcta gtaatcgcgg atcagcagtg ccgcggtgaa 1300 <210> 104 <211> 1250 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 104 tgtagcaata catcagtggc agacgggtga gtaacacgtg ggaaccttcc tcgttgtacg 60 ggacaactca gggaaacttg agctaatacc gtatacgtcc gagaggagaa agatttatcg 120 caatgagacg ggcccgcgtc ggattagcta gttggtaagg taacggctta ccaaggcgac 180 gatccgtagc tgatctgaga ggatgatcag ccacactggg actgagacac ggcccagact 240 cctacgggag gcagcagtgg ggaatcttgg acaatgggcg caagcctgat ccagccatgc 300 cgcgtgagtg aagaaggcct tagggttgta aagctctttt gccagggacg ataatgacgg 360 tacctgagaa taagccccgg caaacttcgt gccagcagcc gcggtaatac gaagggggct 420 agcgttgttc ggatttactg ggcgtaaagc gcacgtaggc gggtcgttaa gtcaggggtg 480 aaatcccgga gctcaactcc ggaactgcct ttgatactgg cgaccttgag gctggaagag 540 gttagtggaa ttcccagtgt agaggtgaaa ttcgtagata ttgggaagaa caccagtggc 600 gaaggcggct aactggtcca gatctgacgc tgaggtgcga aagcgtgggg agcaaacagg 660 attagatacc ctggtagtcc acgccgtaaa ctatgggtgc tagctgtcag cgggcttgct 720 cgttggtggc gcagctaacg cattaagcac cccgcctggg gagtacggtc gcaagattaa 780 aacttaaagg aattgacggg ggcccgcaca agcggtggag catgtggttt aattcgaagc 840 aacgcgcaga accttaccaa cccttgacat cccgatcgcg gacaccagag atggagtcct 900 tcagttcggc tggatcggag acaggtgctg catggctgtc gtcagctcgt gtcgtgagat 960 gttgggttaa gtcccgcaac gagcgcaacc ctcgccttta gttgccatca tttagttggg 1020 cactctaaag ggactgccgg tgataagccg gaggaaggtg gggatgacgt caagtcctca 1080 tggcccttac gggttgggct acacacgtgc tacaatggcg gtgacaatgg gcagctactt 1140 cgcaaggaga agctaatccc aaaaagccgt ctcagttcag attgcactct gcaactcggg 1200 tgcatgaagt tggaatcgct agtaatcgct aatcagcagg tagcggtgaa 1250 <210> 105 <211> 1302 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 105 ggcttcggct ccccggtaga gtggcggacg ggtgagtaac acgtgggtaa tctgcctttg 60 ggtggggaat aacccttcga aagaggggct aataccgcat aacgcagcgg caccgaatgg 120 tgacagttgt taaagtgggg gatcgcaaga cctcacgcct gaagaggagc ccgcgcccga 180 ttagctagtt ggtgcggtaa tggcgtacca aggcggcgat cggtagccgg cctgagaggg 240 cggacggcca cactggcact gagagacggg ccagactcct acgggaggca gcagtgggga 300 attttgggca atgggcgcaa gcctgaccca gcaacgccgc gtgaaggacg aaatccctct 360 gggatgtaaa cttcgaaagt tggggaagaa atccgtgtga ggataatgca cacgggatga 420 cggtacccaa cgtaagcccc ggctaactac gtgccagcag ccgcggtaat acgtaggggg 480 caagcgttgt tcggaattac tgggcgtaaa gggcgcgtag gcggtacgac aagtctggag 540 tgaaagcccg gggctcaacc ccggaatgtc tttggaaact gtcgaacttg agtgcggaag 600 aggcatctgg aattcccagt gtagcggtga aatgcgtaga tattgggaag aacacctgag 660 gcgaaggcgg gatgctgggc cgacactgac gctgaggcgc gaaagccagg ggagcgaacg 720 ggattagata ccccggtagt cctggcccta aacgatggat acttggtgtg tggggttctc 780 gaagtccccg cgtgccggag ctaacgcggt aagtatcccg cctggggagt acggtcgcaa 840 ggctgaaact caaaggaatt gacggggacc cgcacaagcg gtggagcatg tggttcaatt 900 cgacgcaacg cgaagaacct tacctgggtt aaatcctacc tcgtcgcctc agagatgagg 960 tttcccttcg ggggaggtag gacggtgctg catggctgtc gtcagctcgt gccgtgaggt 1020 gttgggttaa gtcccgcaac gagcgcaacc cttaccacta gttgccagcg gttcggccgg 1080 gcactctatt gggactgccg gtgacaaacc ggaggaaggt ggggatgacg tcaagtcatc 1140 atggccttta tgtccagggc tacacacgtg ctacaatggc cggaacaaag cgcagcaaac 1200 ccgcgagggg gagccaatcg caaaaatccg gtctcagttc ggattggagt ctgcaactcg 1260 actccatgaa gttggaatcg ctagtaatcg cggatcagca tg 1302 <210> 106 <211> 1281 <212> ADN
<213> Organime Inconnu <220>
<223> Origine de la séquence :Organisme du sol <400> 106 tgcttctctt gagagcggcg gacgggtgag taatgcctag gaatctgcct ggtagtgggg 60 gataacgttc ggaaacggac gctaataccg catacgtcct acgggagaaa gcaggggacc 120 ttcgggcctt gcgctatcag atgagcctag gtcggattag ctagttggtg aggtaatggc 180 tcaccaaggc gacgatccgt aactggtctg agaggatgat cagtcacact ggaactgaga 240 cacggtccag actcctacgg gaggcagcag tggggaatat tggacaatgg gcgaaagcct 300 gatccagcca tgccgcgtgt gtgaagaagg tcttcggatt gtaaagcact ttaagttgga 360 aggaagggca gtaaattaat actttgctgt tttgacgtta ccgacagaat aagcaccggc 420 taactctgtg ccagcagccg cggtaataca gagggtgcaa gcgttaatcg gaattactgg 480 gcgtaaagcg cgcgtaggtg gtttgttaag ttggatgtga aatccccggg ctcaacctgg 540 gaactgcatt caaaactgac tgactagagt atggtagagg gtggtggaat ttcctgtgta 600 gcggtgaaat gcgtagatat aggaaggaac accagtggcg aaggcgacca cctggactaa 660 tactgacact gaggtgcgaa agcgtgggga gcaaacagga ttagataccc tggtagtcca 720 cgccgtaaac gatgtcaact agccgttgga agccttgagc ttttagtggc gcagctaacg 780 cattaagttg accgcctggg gagtacggcc gcaaggttaa aactcaaatg aattgagggg 840 ggcccgcaca agcggtggag catgtggttt aattcgaagc aacgcgaaga accttaccag 900 gccttgacat ccaatgaact ttctagagat agattggtgc cttcgggaac attgagacag 960 gtgctgcatg gctgtcgtca gctcgtgtcg tgagatgttg ggttaagtcc cgtaacgagc 1020 gcaacccttg tccttagtta ccagcacgac atggtgggca ctctaaggag actgccggtg 1080 acaaaccgga ggaaggtggg gatgacgtca agtcatcatg gcccttacgg cctgggctac 1140 acacgtgcta caatggtcgg tacagagggt tgccaagccg cgaggtggag ctaatcccac 1200 aaaaccgatc gtagtccgga tcgcagtctg caactcgact gcgtgaagtc ggaatcgcta 1260 gtaatcgcga atcagaaatg t 1281 <210> 107 <211> 43 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: amorce <400> 107 cgctgcagat ttaaatatgc aacgcgtaag tcgatggcgt tcg 43 <210> 108 <211> 51 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: amorce <400> 108 cggtcaactt aattaagata tctcgagaga tctattaata cgatacctgc g 51 <210> 109 <211> 29 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: amorce <400> 109 aaaaagatat ctgacgtccc gaaggcgtg 29 <210> 110 <211> 32 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: amorce <400> 110 aaaaaagatc tggctaacta actaaaccga ga 32 <210> 111 <211> 36 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: amorce <400> 111 gtgccgttaa ttaagctccg cgaagtcgct cttctt 36 <210> 112 <211> 36 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: amorce <400> 112 gtgccgttaa ttaaccgctg cataaccctg cttcgg 36 <210> 113 <211> 42717 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle:cosmide a26g1 brin non codant <400> 113 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaacc gggccctgac 60 gttcagaact ccccgcgaga atctctcggc agagcgcctg cacctcgact tcaccggcag 120 tgtcgagatc gatgcaggtg caagcgaact cgggatgctc ggccgcgatg gtacgtccca 180 gaccccacac cggtgcccgc gcgggcacca ccggcatctg cagatgctcc gcatgaacgc 240 ccgccgtaat cagccagatt cgcggatgct gcgattcggc gtcggacgct tgtttcgtca 300 gctgtatgcg tcccactccg aattcttgaa cgatgcgcaa aatgtcttcg caggcggttc 360 cccccgcagc cgacggatcg gtctcatcct cggtctcatc caggctcccg cagtgaatga 420 cgccccggta aggctgatcc ggtatctcgg catcgcgacc cgaaatcaca accgtgtttg 480 tgcccagccc tcgcgccacc gcggctgcga tgccgccggc atcggcaatg accagccatg 540 cacccgacac cgttgccgtt ggactctcgg ccagcagctg cggctcccat tccatagcgt 600 ggaaccattc ggattggcgc tccagttcct gggcacgcag gccttggacc tcgaggatga 660 cgtggccttc cgcatcacac agggtgacat cgccctcgag ccgccccgtc agccgcgcat 720 gcaccctaag atcgccggcg ggtctgccga aacagtgcaa ccgttcgatg gcgacaggca 780 cgcaaggacc ggcgctgcct tcgccgccaa gcgtcgcgcc cagcacctgc aaacaggcat 840 cgagcaaggc aggatgaagc gtgtaaccgg actctgcttc gcgaacggca tccggcacgc 900 tcagtcgcgc cactgcctcg ccgtcgcgcc gccacacttc cgcgatgccg cggaaggtgt 960 cgccgtaatg catcccctgc gatgcgaagg ccgcatagaa gtcatcgccc tcgatgcgat 1020 ccccaagtgt gggcaggctc accgtgggcg cgaccttgtc cggcgccgca gccatggtgc 1080 cgcgcgcgtg ctcggtccaa tcggaaccgc cttcggccag actggagatg cggaatgcgt 1140 gtccctcgag tatgacctgc actcgcgagg cgcccgcgga aggaacaacc agcatttgtt 1200 caaaccggat ctcttccagg ctgcagccac ccgcgaacac ttccttggct gcggccagcg 1260 ccatctccac ataagcggca ccgggaagca ccacaagctc gttgagccgg tgatcggcga 1320 gaaacggcag cgcatccaga gagagcacgg actcccagac gtgtgtgtcc ggcgccagcg 1380 caatctcgac cttgcgaccg agcagcggat gaccgccaac tgccggcaaa cttcgccgcg 1440 tcgaggtcgc gaaccagaag cgctcgcgct gccagggata cgtcggcaga tccaggcgcg 1500 tgtcgggaga cgaagcgagc gcgcgccagt ccggacgctg cccattcacg tagagcgcgg 1560 cgagcaactc gagcagctca cgccgctccg gttcgtcgcg gcgcagtacg gggcgaacca 1620 gtccgtttat gccgagcgtc cgcagactat cctcgatcga cggcgtcagc acaggatgcg 1680 gactgatctc caggaactgc gtgaactcat caccagccat cgcctgcaac gactcccaga 1740 aacggactgg ctgtcgcaga ttggctaccc agtacgacgc gtcgcacgcc tcgcccgtgc 1800 tcaactgtcc ttcaaccgtg gagaagaacg gcacggcgga acgttttgca ataacgcggc 1860 cgagttcctg gcgcaattcg ttctcgagcg ggtccacctg cgagctgtgt gaagcgacat 1920 ccacctgaat cagccggcag aagacgccgç gcctctcgaa gtcgtccttc aaatgctcga 1980 gagccacacg gtctcccgag aacaccgtgc tgcgtggtcc gttgctggcc gcgacagaaa 2040 cagtagtgag accgcgttca gcgagcacgg ccttcgcccg atcgagcggc agttcgacca 2100 gagccatcgc tccccggccg cgaagtccga gcaacagccg gctgcggcga cagatgatgc 2160 gggccgcgtc ctccagggtg agaatgcctg cgacatgggc cgccgccact tctcccatgc 2220 tgtgtccggc cacgccgtcc gggcgaattc cccaggattg cagcagttcg accagcgcga 2280 tttgaacggc gaacagcgca ggctgcacgc gatcgatctg gctcagccat gctcccgact 2340 cgtcggcgag caggtccgca agccgccatt ccacgaagct gcggaaggcg gcgtcgcaac 2400 gttcgatcgc cgatcggaag acaggctcgt cggaatacag gcgatacgcc atgcgcgggt 2460 actgtccgcc ctggccggaa aagatgaagg cgagtttcgg acgaactccg ggatcggcga 2520 aaccggtggc gacgccgcga ttggtttcat tgcgccggaa ggcctcgagc aattgattga 2580 actcgggcag ggatgaggcc acaaacgctg cgcgatgttc gtagtgactg cgcgtcaggc 2640 tggcggcgga acàcagcgcg gagagcggag cgtgaaagcg cccatcgcga taggcgccgg 2700 cgagatcgcg cagagcctgc ggatggcgcg ccgaaagcgg taggaggtat tcgcggccgt 2760 cttcggcatg gagttgatcc gggaccggca cttcctcgcg gctgggcggc cggcccgacc 2820 ccccgccgcc gcttcgcggg cggctgtccc cctcgaggag ggggacacta gcactagcct 2880 tagcctccac attccctttg gcctctacac tcgccttgac ctcttcactc gtcttcgcct 2940 ctacattcgt cttcgcctct acattcgtct tcgcttctac attcgtcttc gcttctgcga 3000 ggacgacgtg cgaattggtg ccactgattc cgaacgagct caccccggca actcgggggc 3060 ggccgttgga gggccatggc gaacatgcgg tggctatctt tagcggcagc tcattccaga 3120 gtacgtgcgg gttgggcgcg ttgaaatgca gatggggcgg aatctctcgg tgctgcaggg 3180 cgagaatggt cttgatcagg ccggcgatac ctgccgccgc ctccaggtgg ccgaagttgg 3240 ttttcaccga cccgacgatc aacggagaat cgacggcacg cccctcgccc agcaccgctg 3300 ccatcgcccg cagttcgatg ggatctccca gcggcgtccc ggttccgtgg gcttccacgt 3360 aatcgacatc ggcgggggcc atgccggcgt tcttgagcgc cgcccgaatc acggcttcct 3420 gcgccggacc gttcggcgcc gtgaggccgt tgctgcggcc gccgtggttg acggccgatc 3480 cgcgaatcag cgccagaata cgatcgccgt cacgcgtcgc atcggacagc cgcttcagca 3540 ccagcattcc gcatccctcg ccgcggccgt aaccgtcggc ggaggcagcg aaacttttgc 3600 aacggccatc ggccgccatg gcccgcaggc ggcagaagta gatcgtgctt tccggcgcca 3660 gaatcaggtt cacgccgccg gccagcgcca tgctgcactc tcgcgactgc aagctgcggc 3720 acgccagatg aaccgccacg agtgaggaag agcacgccgt gtcgacgggg aagttcggtc 3780 cctgcaaccc cagcagatag gagatccgtc cggcggcagt gctgaacgcg gttccggtac 3840 cggtataggc gtcaatgagc gccggatcgg taggtttcag ccggctgtag tcgtcggtgc 3900 tgatcccgat gaacactccg gtgtcgctgc ccgcgagact gtcgggcggc cgacccgcac 3960 gctccaaagc ttcccatgcc acctcgagca gcaggcgctg ctgcggatcc agaccggcga 4020 cctcgcgcgg cgtgattccg aagaagccgg cgtcgaagcc gtcgacggca ccatcgagga 4080 atccgcccag acgcgtgtac atctttcccg gcgcgttggg atcgggatcg taaaacgcat 4140 cggcatccca acggcccgca ggaatttcgc ggatggcatc gatgccatcg tgcaggagct 4200 gccaaaatgc ttccggcgag tccgcgccgg gaaagcggca agccatgccg acgatcgcga 4260 tgggttcgtt gtggacgctc tccagttcgt cgagacgcgc tcgcgtgcgc ttgagcgcca 4320 ggaccgcctg ttgaagagga gtgagatcgc tcatcgttcc tctcccagat ggtgcaaggt 4380 ttccgtgatg aacgccgcca tctcctgctc ggacagctgc cgcacttcat cgacgaggga 4440 atcgctgggg acgtcgagtc cgagttcgcg gaggacatgg ccggccaatt tctcgacggt 4500 cggatggtcg tatagcaatg tcgcgggaag gctcttgcgc accagctctc cgatggcgcg 4560 cgccagatcc agcgccatca gcgaatcgag tccgtattcc ttgagcggcc ggcgcgggtc 4620 gagcgtcttg gacgcatcga gcgccagcac gccgccggcc tgcttgcgga tgcgcatctg 4680 cagcagttcc tgccgccgct ccggcgcagc ttcggtgagt tgctggatga agccgggatc 4740 gctcgccggg ctccgccttt tttcggcgga gacttggaac accgcgatct gagcggcagt 4800 ctcgcccagc agatcgccga agatgcgcgc acccacttcc ggcggcagca gcggtacccc 4860 cggcaggcct tgccgcgcga tgcgcgcggc catgccttcg cccgcccatg gtccccaatt 4920 gatgctcagc gccggtagtc cttgcgcgcg gcgcatgtgg gcaaggctgt cgagaaatgc 4980 gttggccgcc gagtaattgc tctgtccggc ggaaccgagc agcgaagcgg cggaagagaa 5040 gagtacgaaa aagtcgagcg catggtggcg agtgagctgg tgaagattcc aggcaccctg 5100 cagcttcggc gccagcacct tctcgaaacg agcccacgtc tgttctgtaa ctaccccgtc 5160 atcgagcacg cctgcggcat gcacgactcc acgcagcggc tgggtgcgcg ggtccgccag 5220 cagcgccgcc agctgttgct cggaactcac atcgcaagca gcaaccatga ctgcagcccc 5280 gagttgctcg agatcggcaa ctgcctccgt atgccggccg accagtacca gacggcgcgc 5340 gccttgctcg atcaagcggc gtgccaccct tcgtcctaat gcgccgagac cgccggtgat 5400 cagatagacg ccgtcggctg aaatggcagg cggccgcttc gacgtttcct tgtgccgcac 5460 cagccggcga acgtagcggc gtccgttgcg caatgcgatc gctttgtcgt cgccggcata 5520 acggatttca tccagcagca tggcggcggc gatgtcggca ttgtcgcaac cgaggtcgat 5580 caggccgccc cacagctcgg gatgctcgcg cgcgatcgcc tgcccgagtc cccacagtgg 5640 agcctggaaa ggatcgacgg gagtcgcatc gtcatcactg atgcgatgca cgccgcgcgt 5700 gatcagccag agccgcgccg ggcggccgac caaagtctgg gtctgttcca gcgcctggcg 5760 gagagtgacg ccggacacga cgcgcagctc ttgcggcatc aaaccggcga catcgtctgc 5820 gccggcacac agcaaccagt cctccggctt gccagggccg tcggacttca acgttgtcga 5880 tcgctcgcac tcctgccact gcacatcctg cagccacgac tgtgcggatt gcagcgtacc 5940 ggcatgcatt acagccagtc cggaaaactc ggcgatgacc gcgccggtct cttcaaccag 6000 cgtcagatca ccgacgaacg ggccgctcga gctcgggcgc agacgcgcat gacagcgcag 6060 agaacctgcc ggcggacggt agaagcgcac cgcttcgatc ccgaccggca cgtatgcgcc 6120 gggctggcaa cgctccgcgg gccaagtcgc tccgaatact tgaaaacaag aatcgatcag 6180 gccggggtgc agccggtaag cgttcgcgcc atcctcagcc accggcagac gcattcgccc 6240 cagcgcctcg ccatcgcgac gccagacttc ttccacccaa ctgaaggcgg ggccaagatc 6300 gacgccgcgt gcgttcatcg cgccgtagaa cgcatcgccg gaaatgactt cggaaggctg 6360 cgccggcagc tcgaaatgaa cggcgccggc agtcgccgcg cgcagactgg ctgccgtgtg 6420 gagcttccac gaatcgccat cctggctgaa gacctgcacc tttgcttcgc cgtcctcgcc 6480 gggtgtgaca atcgcttgca ccgtgaccgg cgtatccggc gggatggcca gtgcctgccg 6540 catcatgaca tcggagacgg cgcagggaac cggaccgaag acttcctgtg ccgcttcgag 6600 aaatgccgac acgtgccagg cgccgggcac aatgaccgcg tcgtagatca cgtgctcatg 6660 gagcagaggc gtctccgtgg ttagcgaatt ttcgaagatg acatcgccca acgcgctgtt 6720 gaggcgcgct cccaacatgc cgccgcgcgc cggctctctc gcgggtacgc gtctcaggct 6780 gaaggtgtca cgctgaaacg gatacgtcgg cagcgcgacg cggctgggtg attccccggc 6840 atagagaccg cgccagtcgg gattcacgcc cgcggtaaac aggccgccaa gactttccag 6900 cagcacggac caatccgatc gtcccttaga tagggagtgc agccagaccg cgccgtcatc 6960 gggcagacaa tatcgcccca gcgtggtgag cgtgggatgc gggccgattt ccagaaacag 7020 cttgcactcg cggtccgcca gggttcgcat cgcgctttca aactgcacgg tttcgcgcaa 7080 ctgtcgccgc cagtagcggg cgtcgagtgt cgtgcctttc ggcaatacgg ctccgctgac 7140 gttcgacacc agcgggatcg ccagcggctg atacgcgatc gcacctgcaa gcgcttcgaa 7200 cttgtccaaa atcggatcca tcagcggcga atggaacgca tgcgatacgt tcagctctcg 7260 cgtttccacg ccggcgcgat gcaggtcatc ttgcgcttcc gcgatttctg cagccgtgcc 7320 ggagatcacg gtgcggtccg gcgcattcga tgcggcgact gccaccttgg cggcgagcgc 7380 cgcgatgcgg ctcggattgg cgtgaacgat gaccgctttg ccgcggggaa gcgcattgac 7440 cagccgcccc ctggcggtca ccagccgcag gccgtcctcc acgctaaagg cgccggccac 7500 acacgccgca acatactcgc cgagactgtg gcccagcacg tagtccggcc ggacgccgag 7560 cgacagccag aactgagcca gagcccattc cagggcaaac attgccggct gggtatacgc 7620 cgtctcgtgc aacggcgaaa ccgactcgaa caagagaacg gtcagcggaa catcgagctg 7680 gggacggagc caatcggcgc aacgatcgag cgcgtcgcga aaaacaggct gcgttttata 7740 aagctctgcg cccatgccgg cgtactgcgc gccctggccg gtgaagagaa aagcgattgc 7800 cggccgccgg cgcaacgata cttcgcgccg cggcgccgcg gccaatgccg ctacagcctc 7860 tgccgcatct gcggcggtga tcgccaagcg gtgactatat gcgtcgcgcc caacctgact 7920 ggtgaagcaa acgtcggaca gcaacgcatt cgggtgcgac tgcaggaact ccgcgaagtg 7980 gccggccagt tcgccgagcg cttcgtcggt gcgcgccgac agagtgagaa gctgcgggcg 8040 tgtgaccggc ttcggcaaag ggagtgcagg cgcctcttcg aggatgacgt gcgcgttgct 8100 ccctccaaaa ccgaacgagc tgacgccggc cagacgcggc cgtccttccg acgtccacgg 8160 cgacgattcc gtggcgatgc gaaaccggct gccgtccagt gagatgttcg gattcagccg 8220 gcgaaaatgc aggtgcggag gaatggtgcg atgctgcagg gcgagtacgg ctttgatcag 8280 cccggcgatt cccgccgcgc cctccagatg cccgatgttg gtctttacgg aacccagcag 8340 acaaggcgca gagtccggcg cgtcgtagac cgactgcagg gcctcgatct cgataggatc 8400 gcccagcgac gtgcccgtgc catgcgcctc gatcaacgat acgtgggatg gatcgatgtg 8460 cgcgttggcc accgcctctt gcaggaccgc cttctgcgcc tgcagattcg gcgccgtgat 8520 gccattgctc cgtccgtcct gattgattgc cgagccgcgg atgactgcac ggatggcatc 8580 gccatcggcc agcgcatcgg agagccgctt cagcagcacg atgccgcagc cctcgccgcg 8640 cacataaccg tcggctgcgg cgtcgaacgt cttgcagcgt ccgtcgggcg ccaacatgcg 8700 agccttcgac aaagcgatca tgccctcggg agtcaggatc aagttcactc cgccggcgaa 8760 tgccgcatcg cattcgcgcc ggcgcaggct ttggcaagcc agatggacgg cgacgagcgc 8820 ggaggagcag gccgtatcga ccgccatgct cggaccgcgc aggtcgagca gataggagat 8880 gcgattggcc aacatgctat gcgccacgcc ggaacccgac caagctccga tgcgggcagg 8940 gtcggcgtac tgaaacagtc cgaagtcctg ggcgcaggag ccggcaaaga cgccggtcgc 9000 gctgcccgcc agagggccgg gagagatgcc ggcgtcctct gccgcttccc agcacacttc 9060 cagcagcagc cgctgctgcg gatccatgtt cagagcttcg cggggggaga tgccgaagaa 9120 ttccgcatcg aaaccgtcaa tgcgttcgag gaaggcggca tatcgcgcat acgccttgcc 9180 cggagcatcg ggatcggagg agtagtactg gtccgagttc cagcggtctg gcggcacctc 9240 ggtgacaccg tcgacaccgt tcttcaacag cgtccagaag gcgtccggat tcttcgcgcc 9300 gcccggaaaa cgacacgcca tgccgacgat ggcgatgggt tcggcgtgaa ccaggtcgaa 9360 gcctgcgatg ttttgccgca tgttccgcgc caatagcgcg agtttgaccg acgacatggg 9420 cgcaattttt tccctcacga ccttgctcct cggagcgcag ccacggctgc ttcttccgac 9480 atgtcgtcca acccgctgag tgcagttttc atggcgcggc tgtctccttc cgcagcagcc 9540 gcggcctgcg cttcgaccag cggcagtccc atttgcgacg ccaggtgcgg ggcaagaccg 9600 gccagcgtgg gatgacccca aatcagggtc gcggggagcg tgagacccag tgtgagttcg 9660 agacggttgc gaaactccag ggccatgagg gaatcgaagc cgagttcctt cagcgggcgc 9720 aggggatcga tagtttgaga gtcgatgcgc agcacgcgcg ccagctgctg ctgtagatgt 9780 tcttcgagca atgtcctgcg ggtctgaggc tcggccgatt gcagccgcgc gcgcaacgcg 9840 tttggcgcat cggcttcgct cgccgcgtcg tcatgcaaaa gctcgaacag tgcagactgc 9900 gccgccttgg gatagaactg ccgccactgg cggacattga tgggcatcgc ggcgacgtgg 9960 caagccgagc tgttcagcag ctgttccaga atagcgaggc cgtgttgcgg cgtcaggttt 10020 tccatgccgc gcaaagccag ccgcgatccg cgattgtcct~gcgcggcagc cagcccgacc 10080 tccgaccacg caccccaacc gatgctcagc gccggcaggc cttgggcctt ccggtagtag 10140 gccagcgcgt caagaaaggc gttcgcggcc gcgtagtttc cctgggcggg cgcgcccagc 10200 agtcctgcag cggaggagaa gagcacgaaa tgatcgagçg ggcagtcgcg ggtgagcaag 10260 tgcaggttcc aggcaccgtc gattttcgcg gccatcacgt tgcggaaatg cgcttccgtc 10320 tggttcagta gcagcgcatc gtcgagaacg gctgcggcat gaatcacgcc gcgcaatcga 10380 tcgatggaag agatcacgcg ctcgagttca tcgcgctgag aaacatcggc ctgcaccgtc 10440 cggacatctg cgtccatgac ggcgatggct tgctggacct cgggtgaagg cgcgcggcgg 10500 ctcagcagca ccagccgccg ggcgccgcgt ccgatcatcc agcgtgcgac ggtaagaccg 10560 agcccgccaa gtccgccggt aatcaagtag gttccctcgc tatcgaacgc cgagcgtagg 10620 ggtgcgatgg gcgcattggc gcaatctcgc atcgccatga cgattttgcc gatgtgccgc 10680 gcctgcgcca tggtgcgaaa cgcctccacc gattcggtga tggtcgtcac tcgcgtttcc 10740 aggggccgcc aggtttccga ttcgaatttt gcgaccatct cctgcagcag ctcccgggtc 10800 aatgccgggc gcttcaggga catgccgagc aaatcgacca gcgtgtacga gaggttcttc 10860 aggaacgggc gaagccccag cttgcggccg gcatagtaat cgcgcttgcc gatctcgatg 10920 aaccgtccat gatcgcgcag cagatcgaag ctcgcctcca gcagatcgcc ggaaagcgaa 10980 ttcaggacga cgtctactcc ttcttgattc gtccaattgc ggatgtcgtc cacgaaagcc 11040 atcgagcgcg aatccgaaac atgcgcgatg cccagcgagc gcagatacgc tcgtttttcc 11100 ggactcccgg cagtagcgaa~gatctccgcg cccgcacgct gtgcgatctg gattgccgcc 11160 aatcccacac cgccggtggc agcgtgaatc aggactcgtt cgccgggcgc cagccgcgcc 11220 gctcgcgaga gcgcgtaatc ggcggtgaga aacgcgatag gcagggcggc ggcctgttcg 11280 gcgggaatgt tggccggctt caaggcaacg cggaaggcgg gcgtggtgac gaagcgaccg 11340 aaactgcaag gcgcaagggc cacgacttca tctccgatgc gaaagtcggt gacgcctttc 11400 cccatggcca cgatacggcc cgagcattcg ccgcccaggc gcgggctgcc ggcaatcgcg 11460 ccgggcgcat cgtcgggcat aacgccgagg gcgagcagaa cgtcgaggaa gttcaggccc 11520 gcggcgcaga cttcaatctc cacttcaccg gcttgcgggg ggcggcgcga tgtggcccgc 11580 aagcgcagcc ggtcgaggac tccgggggca tcgatctcga gccggaacgg ccgatcgccg 11640 gccttgaaca tggcgggttg catatccgct tcgtgccgag ccacgcgcgc gacgtaacgc 11700 gcgccgccgc gaaaggcgat ttgattctcg ccgttgttcg tcagcagttc gtgcaggagt 11760 tcctcttcgc cgccggcggg atcgagatcg atcagcgtgc agttcagttc cggatgttcg 11820 taatgcacgg tccggcccaa accccagaaa ggcgcctgag cgataccggc ttgcaggatc 11880 tgtccatcga ccggctgcgc gccgcgcgtg accagccata ggcgcggtgc ttgacgccag 11940 ggcgtgcgcc ccagggtctg gaggagatgc agaatgcggt cgcatgaggg ttcgtgctcg 12000 agcaaaaaca cgatttcctc gagcggcggc tggagttcat cgagcttttc cggcgaggtc 12060 tgcgtcacgc ggttgccggt agcgcgcagc catgcggtga gcgcgctatc cacagcgccg 12120 acaatgagcc atgaccgcgc cgctcgcgcc gccggcggct ctgcagcggc gtgcggctga 12180 gcgacccagc gcagttcgtg caaccagccg cgcatgtcga tgcgctccga cgcatccagg 12240 cgctgcagcc gcagaccctc gatgcgggcg accagttgtc cctctccgtc cagcagcgac 12300 agatcggcga taggtccttc cagccgcgca tgcgtccaca ccacggaacg tgcgggatgc 12360 agccagcgca tccggtcgat gccggcgggc agccaggttc caccggcggg accaaacgcc 12420 gcggcgatga tctgcagaca tgcatcgagg aacgccggcg cagtggaacg cgtttccgag 12480 ctacgcagac gcccgatcgc ctcacctgga caactccaga tctgctcgag cgcgcggaaa 12540 gccggaccat actcgacgcc gtgctccgcc atctgacgcc acagctccgc cgccggcacc 12600 actgtggggc agcgggcctg caccgtctcc gcagaatccg gcgggacggt cgatgcatcc 12660 gcaggcgtct gacgaatgtc cccggaagca tgcaggaccc atgtcgatgc ctgccggctg 12720 gaaatccgaa acgacgccat cccgggtcta tcgaccgcga tggccagctg caacgtcatg 12780 ctgccgtcgc gcggcacaat gagcatctgt gtgaaagtca catgctccag cacgcacgga 12840 ctttcaccga aggtctcgga agttccggcc agagccatat cgagatacgc agtagccggc 12900 aagacgactt cgccctgcac gcgatggtct gccagccaag gcacggaagc gagactgagt 12960 tccgtctccc agaagaaagt gccgggttgc gtcgaggctt cgacgcgttt tcccaacagc 13020 ggattgccca acgtgatcgc gtgtcgcgcg ggggaagcgt cgagccagaa acgacgacgc 13080 tgccagggat accggggcag gcgcacgcaa ttgccggaag ggtacacggt ccgccatgcg 13140 acagtgtgcc cagcctcata gagggcgccc agcgacgtga gcatggaacc gcgttcgtcc 13200 tggtcgcggc gcagagacgg aaccagcgcc gcattgccgc.cgatggcggg cagcaggatg 13260 ggatgagggc tgatctcgag aaagacatcg tgcccgctgt cggcaagatg gcggatgccc 13320 tgccagaaca gaaccggcga tcgcagattg cgagcccagt acgtgctgtc gaggctggtg 13380 gtctccagcg tcgcgccggt caccgtggag taaaaaggta tggtcgcggg ccgcggttga 13440 atcccgtcga gcgactgcag gagttcgtcg cacaatgggt ccacttgcgg gctatgcgcg 13500 gcgaagtcca ctttcaccgg ccggcaagac acgcctcgcc gctccagcgt cgcgacgacc 13560 tcggccaggg cttcgacttc accggagatg acggtggagt tgggtccgtt cgacaccgcg 13620 ggcgatagtc gttccgtgta agtcgacagc acggcctcac attccgcgag cggcagctcc 13680 accatcgcca tcccgcccag gccgctgatc cggctcaaca gccggctgcg gctgcaaatg 13740 atccgcgccg catcctgcag cgtcagcgca cccgcgacat gagcggcggc gacctctccc 13800 atgctgtgcc cgatgacggc atccggctcg attccccagg aacgccacaa tgcggcgatg 13860 gcgacctgca gcgcgaagag cgcaggctga atgacctcga cgcggtcgag cttcgccagt 13920 tcttctttca gcgaccagtc cacataaggc cgcatggcgg cctcgcagcg ttccaacgcc 13980 tcgcgaataa cgggttcgcg gtccatccag ctgcgcccca ttccgatcca ttgcgatccc 14040 tgtcccgaga agacgaatac cgtcttccgt cgctgggaag ggatcgtgat cccctggagc 14100 tgcgccgcca gttcttcagc cgttctgccg gaaacagcga gccggcatcg gtgatgcgtg 14160 cggcggactg cggccgtgta gcaaagatca cgcaggctcg gtgcgtgcga cgctgtcagc 14220 aattccccgt atgcccgcgc cacccgacgc agttcgtccg caccatgcgc ggacagcgga 14280 agcacataca tcgcgtctgc aatgcccgta gttgccgcag tgcctgcagt ccctgcaatg 14340 tcgggagtgt ctgcagtgtc gggagtgtct gcagtgtcgg gagtgcctgc aatgtcggga 14400 gtgcccccag tgtccccctc cgcgaggggg acagccgccc gcgcagcggc ggcggggggt 14460 cgggaatgga acccgctcgc agcttcgcct ctaccagtcg gcgccgcttc ttcaagaacg 14520 acatgcgcgt tcgtgccgga ccaaccaaac gcgctgacgc ccgcaaacct tcgtctcgaa 14580 cccgcgggcc acggccggac ttccttcaca atgtcgagcg acgttccctc caaccggata 14640 ttcgggttca gctgtctcac gtgtaagctc ggcggtatcg tctcgtgact caatgcgagc 14700 accgctttaa tcaatcccgc tatgcctgcc gctccctcca ggtggccgat gttcgatttc 14760 agggacccga ccgcgcacac atcgccgaca ggtcgcggga ggccgacggt ttccgccagc 14820 gcctcgatct cgatgggatc gccgagcgga gtccccgtgc catgggcttc gatgtaaccg 14880 atctgctgcg ccgcgacgcc cgcattggcc aatgccgacc ggatgacgac ctgctgagac 14940 acgacattgg gagcggtgag cccggccgag cggccatcct gattgaccgc ggagccgcgc 15000 accacggccc acacccggtc tccggccgcg agtgcatcgg acaggcgctt cagcaccacc 15060 acgccgcagc cttctccgaa cacgatgccg tccgccgccg cgtcgaaggc gcggcagcga 15120 ccgctgggcg aggcggttcc catcttcgag gtggcgtaca taaactccgg cgagaagcgc 15180 agattcactc cgccggccac ggccagcgta cactcgccgc tgcgcaggct ctggcacgcc 15240 agatgaaccg ccgccagcga agacgagcag gccgtgtcga gcgcgatgct gggtccttgc 15300 aagttcagca aataggaaag tcggccggcg atcacgctat gcgccgtgcc ggtggcggta 15360 tacggatcga tgcgcgcgcc atcggcggtc tgcatccaga aatagtcgct gctttggctg 15420 tggatcccga cgaagacgcc cgtgcggctg ccggagagcc cttccatcgt ctgccccgca 15480 tcctccagtg cctcccacgc cacttccaac agcagccgct gctgcggatc aatgctgacg 15540 gcctcgcgtg gcgaaatgcc gaaaaaatcg ttgtcgaaac catcgatgga atcgagaaat 15600 ccggcttgaa tcttcaccgg cgtggcgggg ttcaacgatt tcaggatgcg ccggaccgac 15660 tcctcgtccc atcgtccagg cggtacctca cgaatagcat cgactccact gcgcaacatc 15720 tgccagaact catcgggccc atcgccgccc ggaaaccggc agcccagacc cacgatcgcg 15780 atgggttcgc gcgcgtcgcg ttcggccgca tcgagacgtc gctgcatgtg ctccagcgtc 15840 aggtacgcct gctgcaacgg cgtaaggttg gggaatcgct cggatatcga actcactcgg 15900 aggctcctga aaaatgagcg aacttctgtt tcaacaaagc ttcgatttct ttgtccccca 15960 acccggcgat ctggtttgcg acggcgtcga gatcgtctgc agcggcggga ctccggtcct 16020 cgcccgcggc ggtgccaacg gtagcaaggg tagcaacggc agcaacggtc gaaggttcag 16080 cattgccggc catgctttcc agcggcaggc cgagcttgtc ggcgagatgc tgcgccaggg 16140 cggagaatgt cgggtaacgc cagatcaggg tggcagaaag cttgacgcgc agcccggctt 16200 ccagacggtt gcgaaactcg agggccatca acgaatcgaa tccgagatca cccagcgtcg 16260 ctctgccgtc gagtttcgct ggatcgaagc gcagcacgtg tccggcttcg tgcatcagca 16320 gcgtttccag ccgcgcgcgg cgctgccgcc cggctggaac tgccaggagc tcgctgcgca 16380 tgtcggccgc cggtttggtg tccgcggccg cgggtgcgat gccggccagc agggacatcg 16440 atgcggccga cggatagtaa cggagccact gcgcgatatc gaagttcatg acagcgacgt 16500 gcggccgaat ctgcgtcaat gctttgtaga gcgcgcgcaa tccctgttgc ggttgaataa 16560 ccgagatgcc gcgcgcggcc agacggtctc cgcggttcgc ctgtgcggcc aaaccaacct 16620 gtgtccacgg tccccacgcg atgctgacgg cgggaagacc ctgggcgcgg cgcagatgag 16680 ccagcgcgtc gagaaatgaa ttgccggcgg cgtagttgcc ctggccggga gatcccactg 16740 tcgcgctggc ggaagagaag agaacaaaat gatccagcgg ccggccggcg gtgagttcgt 16800 gcaggttcca cgcgccggct actttcggag ccatggcggc ttcgaagcgt tcggtcgtga 16860 gattgagcag catgccgtcg gccagcgtgc ctgccagatg gaacacgccc cgcaacggcg 16920 gcatgtcgcg atcgatgatc gcgagcgcat ccgatagctg ctgccggtcc gccacgtccg 16980 catggatgat cttgacgttg acaccttcca gttgtggccg aggacgctcg ctgcgtccca 17040 gcagaacgag atggcgcgct ccggcggcgg cgagccatcc cgccacctgc agtccgagtc 17100 cgccgagccc gcccgtgatc agataggttg cgtcggcacg gaacgccaca tcgggtgcgg 17160 atgggatctt gtgaagactg aggcgcggcg cccataccgt gccttgccgg atcgcaactt 17220 gatcctctgc gatattcgac agcatcagcg tcgcgagatg cccgcagtcg ttgctgtgcg 17280 catcgagatc gacgagcgtg cagcgcagct cgggatgctc ataggcaatc gtccgcccaa 17340 ttccgtgcag ccaggcttgt cgaatatcaa tatctttgtc ggagttgaga accgcggcag 17400 atccgcgcgt cagcagccac aggcgcggcg gctcaggcca gcccgcttgc acgatgctgc 17460 gcaatacgga aagcaggtcg tcgatgcgcg gcgagggaca gtacacaatt tgacggcacg 17520 gcggacccga gcacgtatcg gccgtgcggc aggtttggcc gcgcttttgc agagtctcgg 17580 caatcgccgg ctcgccgatg acgagccaag gtccgccagc attgccggca ttggcatcgc 17640 cgcggcgaac cgacgcggtc cattgcaccg tccaggtggg aatctccgat tcgccgagct 17700 ggccgctatg ggcgactctc gactgcagcc ccaccaattc cgccaccacg ctgccggtgc 17760 cggtgacgag acggacatcc accgtggaat ccggccgcaa gaccgcgtat ccccagaccg 17820 ggccagtggg cacttcagcg agcgagaatc ggtccagacc taccggcaca tgcacatctt 17880 tcaaatcgtc gtgatggacg agggccgcgg gcaactgcag acagcagtcg atcgtctgca 17940 tttccgtcag cggaatgtcc acgcgacaaa gcacctcacc gttgccgcgc cagatggggc 18000 cgatggttcg gaaggtggga ccgaagtgat agccgcgatc ccacagtcgc gaatagaagg 18060 catcggctgt gagctccgcc gtgcagcggg cgcgaatcgc atccagatcg atggatgccg 18120 tggaatcgcc cgcctgcagc atgccttcgc tgtgcagctt ccaggaatcc tcgcggctgt 18180 agatgcggaa ggaagctccg ccgccctctt catgacggag taccagttga acctgcctgg 18240 cagcatcgtt ttccggcagc gtcagcgcgc ccgtcaatga cacgtgttcg acatggtgag 18300 gcccggcgcc gagaccttgg cgcgcagcgg cgagcgccat tgccaggtgc cacgctcccg 18360 gagtcacgat cacatcgtgc agccggtgat ccgcgaaatc tttcgcctcc acagtggact 18420 cgaactgcat ctccggcagc ggcgacggga tccgccggcc aggcaaagcc tgagactcga 18480 cctgcggcgg acggatatcg atccaataac gctcacgctg ccagggatag ttgggcagcc 18540 ggcgagtttg gccgccgttg ggataaatac gagaccagtc cggagtgact ccgttagtca 18600 gcagcgctcc cagcgtccgg cgcagtgcga ggtttccgtc ttcatcgcgc cgcaacgagg 18660 cagcggcaat cgctgcccga tctccgagcg tttcctggat cggctggacc aacaacgggt 18720 ggggactcag ttccagaaac acatcatgac cacccgccgc ggctgcggcg acggccgtcg 18780 acagcatcac gggttggcga agattacgag cccagtacgc agaaaccagc tcttcaccgc 18840 taatcgctgc gccggtgacg gtggagtaca tgccaagggc ggccggccgc ggctgaagcg 18900 ctcccaccac gcccggcaac gccgcgcaca cggagtccat cagatggctg tgcgaggcaa 18960 tgtccacttt cacgcgacgg cagaagacgt ctttcgcctc cagttcccgc agcagttcgc 19020 ccagagctgc gctgtcgccc gacaggacgg tgctgcgcgg gctgttgctg gcggcaatcg 19080 agacccgatc cgagcgcccg gcgatggcag cgatggcctc gtccagcgct aattccacga 19140 cagccatttc tccctggccg cgtactccgg cgagcatccg gctgcgcagg caaatcaccc 19200 gagcggcttc atcgagagtc agcgcacctg caatgtgcgc tgccgcgact tcgcccatgc 19260 tgtggccgat cacggcgtcc ggctcgattc cccaatggcg ccacagtccg gccaaggcga 19320 ccccgactgc gaacagggcc ggttgaatca cgtcgatgcg gtcgagcggc ccctgcaact 19380 cttgcgtcag cgaccagtcg acgtaaggct gcatggcgcg gccgcactct tcgatggcgg 19440 cacggaacac cggttcagaa gccatcaggt cgcggcccat gccgggccac tgcgatcctt 19500 gtcccggcaa aacgaaaacg acttttcgct tctggccgcg cggcacaaaa cctgtggcgg 19560 tatcgcggtt cgggttgccc gccagaaaac tgtccagccc ggccatcaag tcctgcgcgt 19620 tcgtcccggt gaatgccgcg cggtgttcgt atgaagtgcg gcgagcgcac gccgtgtagc 19680 aggtgtcggc ggggttgtcg ttcaccacgt cgcggtatgc gcgcgccaga tcacgcagcg 19740 cctccggact gcgcgccgat agcggaagca ggtacggtgc gggcgtactg gacgcggcct 19800 gttgcggcgc ctgctcgatg agcacgtgcg cattcgtacc gctcaagccg aacgagttga 19860 tgccggcgac gcgccgcccg ccgggtgcaa ccggccaggg ggtgagccgt gccgggattt 19920 cgaggggaag cgtgttccaa tcgatgtgcg ggctgggcgt ggtcagattc agatggggcg 19980 gaatggcttc gttctgcagc atcagcgcca ccttgatcag tgcggccacg cccgctgccg 20040 cctcgaggtg gccgaagttg gtcttcaccg acccgagctt cagcttgttg ccgttggtgc 20100 gccccgctcc cagcgcggcc gcaagggctc cggcttcgat gggatcgccc agcggcgtgc 20160 cggttccgtg cgcctcgaca tagctcacat ccagcgtctg caagcgcgcg tctcccacag 20220 cctggcggat cacggcttcc tgtgcgggcc cgttcggcgc cgtcagtcca ttgctgcgtc 20280 cgtcctggtt gattgccgtg ccgcgaatca ccgccatcac cggatcgcga tcgcgcagcg 20340 cgtcggagag tcgcttcagc acaaccacac cgcagccctc accgcggacg tagccgtctg 20400 ctgcggcatc gaatgcctta cagcgaccgt cggctgccat cgccttcagc ttgcagaagt 20460 agatcgtccg atccggcgag agaatcagat tgacgccgcc cgccagcgcg aggtcgcttt 20520 cacctgagcg caggctctga caggcaaggt gcaccgcgac cagcgatgac gagcatgccg 20580 tgtcgatcgc catgttcggg ccctgcagcc cgaggatgta cgagagacgc ccggcggcaa 20640 cgctggccgt attgcccgtg ccggtgtacg cgtcgatatg cgcatccccg ccgcgcattt 20700 gcaggttgta ataatcgttg gaaaagatcc ccatgaagac gccggtccgg ctccccgcca 20760 gccggtcggg tggaagcccg gcgttctcga tcgcctccca ggtgacttcc agaagcagcc 20820 gctgctgtgg atccaggctg atcgcctcgc gcggagcgat gccgaagaac cgggcgtcaa 20880 aacggtcaac ctgatcgatg aagccgccgt accgcgtgta cattcggccc gtcgcgccgg 20940 gatccggatc gtagtaggca tcgatgtccc agcggtcggg tggaacttca cgtaccgcgc 21000 tgcggccctc gcgcagcaac gaccaatagg catcgagatt ggatgcgccg gggaagcggc 21060 agcccgcgcc gatgagggcg atgggctcgc tgcgcgcgct ctccagctgg tcgatgcgtt 21120 tctgcacctt gtcgagcgca atcacggcgc ggcgaagctt gctgagatcg tctgacccgc 21180 tcatgtttat tgcgtctcca accactggtc gacctgcgcc agccgcgaat cgagcagcgc 21240 ttccagttct tcgcgggcga ggttctcaaa ctccggcgct tccaccggtg atgcttcggg 21300 tggaaatacc gcatggagca cgtaactgac gatcgcatcg agcgacggat agtcgaacag 21360 cagactcgcg ggcaaaggct gccccagtga ttgggagagc gagttgcgaa gttctatggc 21420 cattagcgaa tcgagtccca gttcacccaa aggctgctgt ggatcgagcg gtgtggaagt 21480 cgcgatgccg acaaagcgcg ccagtgactc cctgatgtgc gcaatgagga tggcttcgcg 21540 ctgccggggt gtggcttcgt tcaagcgggt gcgcagttga ggtgaaggca gcgcggcggg 21600 acgcagcaac tcgccggtaa tcgagcccgc cggtagcgcg gcaatctgaa tggggcattc 21660 atgcaggacg gcctcgagaa tgtgtagacc ctcgtccacg gagaggctcg ccacgccggc 21720 catcgactgg ctggtgcgcg cggccattcc ggctcccgac cagcgccccc agttaatgct 21780 ggtcgccggc aaacccagtc cgcgccggtg atgcgccagc gcatcgagaa cggcgttggc 21840 cgcggcgtag cctgcctgcc cggcaggacc taagagcgag gatgccgatg aaaagagcac 21900 gaagaagtcg agcggcagat cgcgggtgtg atgatggagg tgtacagcgc cttccgcctt 21960 cggcgccatg acgcttgcga tccgcgtcca gtcctgattc agcagtacgc cgtcgtccag 22020 cacacccgcg gcatggataa cgccgcgcag cggtgacgtt tcggtgtgga tgcggcgaat 22080 gagatccgcg acctcttctt cccggctgac gtcgaccgtc tctgccgtcg caccaatctg 22140 ttgcagcacg cgctgctgct cctcgtttgg aggccggcgc ccggccagca cgacgcgagt 22200 ggcgccgtgc tccaccatcc atttcgcgac tgtaagtccc agggctccga gcccgccggt 22260 gatcaaataa gtcgcgcccg aaaccagacg gactgccgct cgcgcgctgg gtcggcgggt 22320 cagtcgcggc acgtagcgcc ggttgcttct ccacgccgac tgatcttcgc cgtcgaaatc 22380 acgcatctgc gcggccgcgc cggccgccga agcatgcgca tcgtcgggat ccagatcgat 22440 gagcccgccc cacagatccg ggtgctcgcg cgcgatcacc cggccgaagc cccagagcgc 22500 ggcctgcatg ggattgtgca ccgcactggt cgcctgcgcg ccggccgtta ccagccatag 22560 ccgcggaccg gacttcaggg acttcaccag ggccagagtg ctgcggcagc cgagctcata 22620 atcatcgaga ctgtacaggt tgacgatccc gcgccagtca cgctcaccga ctagggacat 22680 gtactcgccg gctggcggca cggtaacgca catctcgccc tgagctgtga gcgcatctgc 227.40 cagagcgcgg gccgcgccgc cactgtcggc caggatcagc catgccccag gctgtagcgt 22800 tcgcgaaggc tggcggagcg gttcgggccg ccactcgacc tcatacaatt cgggcttccg 22860 ttccgagcgc tgcgcccatg cgcgagtgac gcgccggaaa ctcacgccct gaagttcccc 22920 gagaacgcag ccctccgagt ccagcaactg cgcctcgccg gtaaagccgt ccggcgaatg 22980 ccggagaatt tgcgcggccc cccatacggc gccctccagg ctgccgtaaa aacaaacgcg 23040 atcgataccg agcggagcga atatcggatg ttcggcgcca tccgcaagcg cgggactcgc 23100 cgcggcgcta agcaattgca ggccggcttc cgccaattca caacggggat tgagcggcgt 23160 tgcggaatca atcgcggcca gcgcttcctg ttcaccgaaa tgaatgcgct gtatgcggcg 23220 gtagctcggc cccagttcta tctcgaggtg gcgcagcagc gaatagtacg tgtctccatc 23280 caccgcaggc cggcgttcat cgaccagtcg gggcacggga gcgacaccag cgtgggcggc 23340 aatattgccg gcagcatgta agttccacga gccgtcggac aagctgagta tgcggaacga 23400 ggcatgccgg tcatcgctct gtgaaagcac gagctgaaca gccgtgtcgc gctccgctga 23460 aaggatcaga gggtgcgcga agttcacgtt ttccagcgtg tgccggccgg cgccaaacac 23520 ctccgccgac gcctcgagcg ccatggccag gaagtacacg gccggggcca ccaccgaacc 23580 gtaatatcgg tggtctgaga gtagaggcga agccgtcgat agtttcgact cgaagataac 23640 gtctgccacc ggtagcgaca gccggcaccc gacgagacca ctcgcaaccg ctacaggttc 23700 cggtctggaa ctccgctcga tccaatggcg gcgtctctcg aaaggatagg ccggcagggc 23760 gacacgcctt cgcgaatacg gacggtcgaa ctcctgccaa tcgatgtcga acccaccctg 23820 atatagcgtc gccacactgc tgagaatcgt ctcccactca tcgcggcctt tacgcagcga 23880 cggcagccac tgcttggcgt cgtcgggcag gcacttttgg cccatgccga gtagaaccgg 23940 cttaggaccg atctcgagaa acacgtcgca gccttcgtcc ttgagcgttt ggataccgtc 24000 ggcgaaacgg acagggtttc gagcgtgatc tcgccagtac agcggattcg ccagctgtcc 24060 ctcgccggcc agtttgcccg tgaggttcga aaccaagccg atcgaaggat tgcgccacgc 24120 gatcgccgcc gcccggcgtt gcaggtccgc cagaatcgga tccatgctcg agctgtgaaa 24180 ggcgcgcgca acggccagca tctgcgtttt gatgccctcc gcacgtagag ttgccagcgc 24240 gctctcaata tcctgcggcg cacccgaaat cacgacctca gcgggtccgt tgatggccgc 24300 aatggagacg cgcgaggtga tcgctgcggc acagcgctgc tcgccggcgc'tgaccgcagc 24360 catcgcacct tccggcaggt tctgcatgag ccggccgcgt tcggcaacta agccgagcgc 24420 atccggcagg ctgacggcgc cggcaataca cgccgccgcg tattcgccga cgctgtgtcc 24480 catcaccagg tcgggcgtca caccccagga cttccacaac tgcgccaagg cccactgcaa 24540 agcaaacagc gcgggctgcg cgccggcggt cgcgtcgagc aacgcgtcat cggccaacag 24600 cgccggcaga tcgagccgtc cattcagcag agctgcgcat tcatccatgg cggcgcgaaa 24660 caccggctgc gactcgtaga actggcggcc catgcccgcg tattgcgcac cttgcccggt 24720 gaaaagaaac gcaatcttgg ggcgcgtctg ggcgatgcga acccgtcgtg cctccgtcag 24780 tcgttggcga gcctcgtcgc tcgaccgggc cacaatgcag atacggtgcg ggaagtgcac 24840 gcgccctgca ttggccgtga atgcgacatc gccgaacgac aaaccgggct ggttgtccat 24900 atggccgcga tacgagcgca ccagttcttc gagggccgcg tctgtattgg cggacaggca 24960 aagcacatgt gcggatcgtt cgggcgcagc tgcggccggc gtcaccggcg gcgcttgctc 25020 cagaatcacg tgagcgttgg tgccgccgat cccgaacgaa ctgactgccg ctcgtctcgg 25080 ggtctttccg gcgggccagt cgagcagccg cgtactcaca cgaaacggag tgtttgcgaa 25140 atcaattcgc ggattcggac gctggaaatt caggctggga ggaatctggc cgcgatggac 25200 ggcaagcacc gtcttgatca gcccggccac accggccgcg acgtctagat gaccgatgtt 25260 ggtcttgacg gatccgatat acacatcgcc gcttccgttt ttcggaaagt tggcagcgat 25320 ggcggcgatc tccaccggat cgccgagcgg cgtggctgtt ccgtgggcct cgatgtagcc 25380 gatggactcc ggcttcacgc ccgccatctc ttgagtgcgc cgaatcaatc gcgtctgacc 25440 gtccacacct ggagcggtaa accccatgcg ctcggcgcca tcattattaa tagccgctcc 25500 gcgaatgacg gcgtagatcg tgtcgccatc ggccagagcg cggctcaagc gcttgaggac 25560 gaccacaccc gcgccgttgc ccggcaccgt gccttgagcg gactcatcga aggcgcggca 25620 gcgcccgtcg ggcgacagga tcatgcccgg ctggtgcagg taccccacgg actgcggaac 25680 attgatggca actcccccgg ccaaggcaat gtccgaggcg ccgcgctgca agctctcgca 25740 tgccatcacc accgacacca gcgaggtgga gcacgccgtc tgaaccgtca ggctgggccc 25800 gcggaggttc agcttgtaag agacacgcgt ggccaggaaa tccttgtcgt tggccgtcag 25860 cagctggtac gcggaggggc gtgagaaatc gaacggctcc gcggtggcga ggttgttcag 25920 caggtaggta ttgacgccgc atcccgcgaa aacgccgatc gaacccttat agcttcgcgc 25980 cgcatatccc gcgttctcca tcgcttccca cgcgcactcg agaaacacgc gatgctgcgg 26040 gtccatgatc tccgcttcgc gcggactgta gccgaagaac gcggcatcga aaaactcgat 26100 gccgtccagc agacccttgg ccggcacgta gctcgggtcc tggaagacct ccgggctgat 26160 gccgcccgcc agcagatctt ccggcgaaag cctggcgatg gaatccacac cgtcgcgcag 26220 attgcgccag aactcctcca cattgcgcgc ccccgggaac cggccggcca tcccgataac 26280 tgcgatccga tcttctgcga ccgcagccgc aggttccgca gcggcgggtt cggatttttc 26340 tgccaggccg gcaagcgact cgatcgtcgt atgccggaac agatcgacga cggagagcgt 26400 caaccccagg cgctcctcga gcagtccgcg cacccgtgtg agcattagcg agtgcccgcc 26460 gacatcaaag aagttctgcc gatagtcgac gtgctccacg cgcagaactt cacgccagat 26520 ggacgcaatc gtctccacca catcgccgcg catcggctcg cgagcagcaa ccggcgttgt 26580 gggcaaaccg ggaagcgcgt tcgcgtcgat tttgccgttg ggcgtcagcg gaagggagga 26640 caggctgaca aacgccgagg ggatcatgta atcgggaagg cgcgttgcca gccacgaccg 26700 caaatcgctc tgcagatcgc gcacgtcgcc cgttgccgga acgagatagg cgatcagccg 26760 atcgtccttc acgaccgtaa tcgcctgctt cacggcaatg tgcgtctcga tcgcggcctc 26820 aatctcggcc ggttcgatgc gaaacccgcg cagcttgatc tggcgatcga ctcgtcccag 26880 gcactcgact gcgccgtcgg aacggtagcg agccagatcg ccggtagagt aaatgcgtcc 26940 tcgatcacgc cactcgcgga atttctcacg cgtgagctcg gggttgcgat gatagccccg 27000 cgccagtccc gctcctccga tgtacagctc tcccggaact ccggggggaa ccggctccat 27060 gcgcgaatcc aggatgtata actgcgtgtt gtcgatggga tggccgatcg gcacgatgct 27120 atcggaggca cccagtcttt gtgtcttgtg cacggccgac catatggtgg tctccgtcgg 27180 tccgtaaaga ttccacagct ctacgccact atcgagaatg cggcgcgcca gttccggcgg 27240 cagagcttca ccgccgcaga aaacacggaa gcctttaccc ggcttccagc ccgaatccag 27300 caattgccgc caaccgctcg gggtcgcctg catgaccgta gcgcccgact tatccagcag 27360 ggtggtgagc cgctcgccgt caaccacgat ctcgcgggtg gcgacgatga cgcgggcgcc 27420 ggtgatcaac ggcagccaga tctccagtcc ggcaatatcg aatgacacgg tggtgacggc 27480 gaccagccca tcggcggctg tcagacccgg ctcgcgctgc atggagcgca gcagattgac 27540 tagcgacgag tggcggatct ccacgccctt cggtcgcccc gtcgatccgg aggtatatat 27600 gatgtaggcg agatcgtcgg gcttgctgcc gctgacgaga ttcgcagctt ctggttcgac 27660 ggcgaccgcc atcatcgcca tcatcgccat catctcagcc accgcctcct gcgtgaggac 27720 cgcgtgcggt tgcacttcat cgagaatccg ggcgagacga tccttggggt gcgcgggatc 27780 gagaggcagg tacgcgctgc cggacttcag aatcgcaagc agcgcaatca ccatctccag 27840 cgagcgctcc atcgccagag cgatgatctt tcccgggccc gcgccggatg cgctcagacg 27900 atgagccagg cggttggccc gcgcattcag ctcggcgtag gtcaactgat ggtcttcgaa 27960 gacaacggcg acggcgtgcg gagtgcgttc cgcctgagct tcgaccagtt catgcgcaca 28020 cccgttcgga ccggcatcgc gccgtgtcgc attgtgctgc tcgagcatcc ggcttcggac 28080 cgcgggggac aacagcgcag cggttgaaat gcggacgtcg ggatccgtca ccacgctcgc 28140 cagcagggtt cggtacgcat cgagcaggga ggcgatggtt gccgcatcga acaaatcggt 28200 gttgtattcg gcggacgcca tcagtccatc gccggatggc tcgagggtca cgccgaggtc 28260 gagtttggat ccgccgttgt gcatgtactc gcgcgagatg gtgagcccag gcatgacggt 28320 gatggccggc gcatcgggca gcagcgcgaa ggagacctga aatacaggcg accggctcag 28380 gtcccgcgga ggatgcagtt cctcaaccag gcgttcgaaa ggaaagtcct gatgagagag 28440 ggcgctcaaa gcggtgtcgc gggtgcgggc gagaagactg cgaaacgacg gatcgtcgcg 28500 cagatcgccg cgcaggacga tcatgttggc gaaacaaccg acgagacctt ccgtttctcg 28560 ttgtgtacgg cccgcgactg gaaccccgat aaggatgtct tcctgcgcgg tatagcgatg 28620 cagcagcacc tgaaacgccg cgattgccgt catgaacacc gtcgctcctt cacgcaaggc 28680 aaacgcgtgg agtccatcgg tcaaatcacg gccgagggct gtggtctcca cggcgccccg 28740 ccaggtctgc tgcgcgggcc gggggcgatc ggtaggaagg tcgaggaaag gcaaggtgcc 28800 cgacagctgt ttcttccagt actgctgcgc ggtttggttc agcgacgtct gctgatggac 28860 ggcccagtcg ccatactgaa tcggcagttc catgagcggc gatggccgcc cctgcacgaa 28920 cgcttcgtac gatcgcgtca ggtcgcggac gaacgtctcg accgaccacg catccgcgat 28980 gatgtggctc aacgtcagca ggagaatctg ctgcttgtca tcgaggcaga tcagcttggt 29040 ccgcagaagc gggggttttc gcaggtcgaa cgggatctgg gcatcacgca aggccatttg 29100 ccgcgcttct gcgattccgt cagcctgaac aaccggaagt tccagtgtca ctcgcgccag 29160 gaggctctgg cgcgcctctc catccacacc gccaatgcag ctgcgcaggc tctcgtgccg 29220 ctgcaccacg gcctccagac tccgcaggag gacgcgaata tccagcggac ctcggatatg 29280 cagcgctatg ggaatgttgt aggcgggaga atccgggtcg agctgatgga gaaaccaaag 29340 ccgctgctgg gccagcgaca agggtgcggc atcccggttt tcacgccgcg ggatgcgatg 29400 ttcggggctg ttttcctgca gcagacggtc gagcaattgg cggcgggcga gcgagaggtc 29460 tatggtattt ggcgacgaat tctgcattac aacccgctgt gttcctagtc ttgggcggcg 29520 ctcatcatac gctcgatttg aacatctgac atttgggaaa cagcgatcag caaatcggcg 29580 gctcgccttg cccatcctgg gtctacgccg tcctgaatag cgacggcgaa gcctcgaacc 29640 gtgggggcgt taaacacggt tcgaaagggc acttccacgt ggagcatgtc gcgcacgcgg 29700 gcgatcatct gcgtgaccag cagcgaatgt cctccagagt cgaagaagtg atcatggacg 29760 ccgatgccat ccatgccgag cacctcgccc caaatgtggg cgagtacctg ttccaccgga 29820 gtttccggag gcgtgaatgc ttcggcgtgg gctcgccggc tgggctcggg atcgggcagg 29880 gcgttacggt cgatttttcc gttgggcgtc agcggcattt cgtggagcac gacccacgcg 29940 gtcgggatca tgtagtcggg cagcttctcc ttcagatgag tacgcaactg cggcacaacc 30000 gtgcgcgtat agacggctcg cagcggatcg ttcgtatacg ggccggccag gcggcgtcgc 30060 ggacgggaag ccggcggacc ggccgccgca cggcagaagg tcgcgtcgaa gcgtccgtgt 30120 ggcccatgac tgctccagtc gattgccacg cggtacggca ggtcttcgtc catacgccat 30180 agatcggcgg gatcgacgcc ggaaggcgac gtctggcgca gccggtcccg caactccccg 30240 agtgtctctg gagcttcgtc accgttcatc caggtcacaa tggcgctttc ggcggtcaac 30300 cgtgcgttcg gaatctcggt aaatgcggcc aactccggct gagcgtccgt cagtactctg 30360 cgtatttcgg ccgcggtctg gcaacgcctg cgatccgatt ccggctcctc cgcttcccgc 30420 gatccgatat gcaggatcgc ctggtagcgg aagcgggtca gctcgttatg cgaccggccg 30480 cgacgcggca ggatttcaat ccggccgatc tccggaatct gttcgcggag agcaaagaag 30540 aacgcgggat cgaccacgag ttcctcttcc tgcgacgcga gcgaacgcac gcgttgccga 30600 aactcattcc gggtcaacga cgcgggtgcg cgctgaactt ctaaagaagc gtaaaacgtc 30660 tccagcagcg ggagactgcg gacatcgccg acaaatacga tgccgcccgg tttgaccaca 30720 cgcaccgcct cggccagcac gcgccgcaga tacgcttcgc cggggaagta ctggataacg 30780 gagttcagaa caaccgcatc gcacgagcga ctgtcgatct cgcacgcgtc gtcggccgcc 30840 tgccggaacg tgcggacatt tgccaggccg gtgcggtccg cgtgagcggc gatgtagtcc 30900 agcgccttct gcgaaaagtc cgtggcccag tactccgaac agtggggagc gacgcggaag 30960 agcagcagtc ccgtaccaca gccaatctcg agcacgcgac gcggccgcga ggccaggatg 31020 cgatcgacgg aatcctgcac ccactcccgc atctcggcag ctggaatcgg ctctccggta 31080 acactgcttc tccagccgac gatgttgaac tccggatccg cgttcggcgc attctgttca 31140 tatgtggtgt cccagacgga ttgccactgc gtcacgtgct cggactcgac tcggtcgtgg 31200 aatgtgtcgg cggctgccgt cgcgcgatgc ccgtcagcaa gggggacaat gtaggccgcc 31260 agatacttac cggccgcgtc attttctctg gcggtgacca cagcatgtcg gaccgccggg 31320 tgactgcgga ccgcggcctc gatctcgccg gtttcgatgc ggaacccgcg tatcttcacc 31380 tggtggtcga tccggccgag atactcgagc gcgccgtcgc gttggcggcg ggcgagatct 31440 cccgtgcgat acagccgagt gccatgaggg tcgaacgaat tggcgacgaa cttgtccgcg 31500 ctgagttccg gacgattcag gtatccacgg gcgagcccgg cgccgccgat gtacagttcg 31560 cccgcaacac cgatgggtgc gggctgcatc cgatcgtcaa gcacatagag ctgagtgttt 31620 gcgatggggc ggccaatcga aaccggtccg tcacctgtcg tcacccgttg gatggcggac 31680 caaattgtcg tttcggtagg tccgtaaaga ttccatagcg ccgcggttcg ttgcaggagc 31740 cggtcggcaa gatcgcgagg aagggcttca ccgccgcaga gcgccgtcag gcggcggtcg 31800 ccgggccagc cggatgcgag cagcagacgc caggtggcgg gagttgcctg catcattgtc 31860 gctttgctgc gcgcgagttc cctcgccagc ctctcaccat cgacggccgt ctcctggttc 31920 gccaccacga cgcgcgcgcc ggcgctcaag ggcaaaaaga tctcgagcgc ggaaatgtcg 31980 aacatgaacg tcgtgagggc gagcagcgta tcgcggtcgc tgatgcccgg ctcatgccgc 32040 atcgacgaaa gaaaattgac gacggcctgg tgtgtgattt gcacgccttt cggccggccg 32100 gtcgaaccgg aggtgtacag gacataggcg agatcggcgg gagtcgcgag cgggttcgga 32160 ttggtgtcgg gctgcgtcca tacttccgat tccgtgacat tcagcacaac gaccggcctg 32220 gtctcttcca gcatcagccg aagacgttgc gccggatatt ccggttccag cggaacgtag 32280 gccgcgccgg ccttcaggac gcccaacagc cctgcgacgg tttcgagcga ccgcgtgaca 32340 tggatgccaa ccatttcgcc gggtccagcg ccgcgcgagc ggagatagtg cgcgatccgg 32400 ttggcgctcc cgttgagttc gcgatatgtc agattctgct caccgaagct caacgcgatg 32460 gcgtcgggcg tcaactccac ctgagcttcg aacagctcgt gcacgcattg ggacgggaat 32520 tccgcggcgg tcgcattcca ctcttcgagc agctggatgc gttcccgggt tgtcagcagc 32580 ggtagatcga caactggaca ggcgggattc tccgcgattc cttccagcag cacggcgaag 32640 tgcaaggaga gacgttcaat cgtggcagca tcaaaaatgt ccgtgttgta ttgcagaaag 32700 gcggagaggc ctccatcggt ttcgaccatc atcagatcca ggtcaaaccg gctctgtcgc 32760 agcggcatcg ccagggactc cagtgtgagg ctgccccagg ccatgcgacc gccggactga 32820 cccaacatga acggcacgga ttcgggaatg cgatgaggct gctggagcac gaatagaacc 32880 cgcagtccgg gacccaaccg ctccacgatc cgggcatacg ggtactcctg gtgctcgatc 32940 gcgccgagaa gcgtttgccg aatccgggcg agcaccgtat tgaaatccgg atcgcctgaa 33000 agttctcctc gcaggattac gggattcacg aagtatccga cgagatcggc gaattccggt 33060 tgcgtccgac cgttggtgag ggtgccggtc aggatctctt cttgtgaggt ccaacgggag 33120 agaagcactt gaaacgccgc catcagcgtc gcatgcagcg tcgcgttctg ccgccgcgcg 33180 agcgccttca gtttcgcagt cagcgcgggt tcgattcgga acgagtgaga gtttccccgg 33240 aaactctgca ccggcggact gggacgatcc gacgggagat tcagaaccgg aagctggccg 33300 gaaagctgcg aggaccagta gttccaaagc cgctcgccct cggttccggc caacagttcg 33360 ttctgccagc ggacgaaagc ggcgaagctc gcgaccggcg gcgcgacagg cggaccgcca 33420 gctgtcctcg cgaggtagat actgcggagt tcatccacca tcaccagcag tgaccagaag 33480 tcggcgagga tgtgatgcac cacgatggcc agaacctgat ccttccccga ctgcaccagg 33540 agacgcgagc ggaaacagtt ttcgccgaga ttgaagggcg cgtggaagac gccgtcgatc 33600 agcaccgcct catcgtccgg cgaacacggg atcacttcga aatccaccgg gacgctgctg 33660 tggaccgttt gaacgggtgc gccgccactc tccgcaatcg tcgttcgcag cgccggatga 33720 cgatccacca ggtcctgcag cgaacggcgc aacgcctgcg gatcgaaagc gcctctcgcg 33780 cgcgcgatcc acgcgatgtt gtatgcggga ctttccggcg cgcttcggta aataaaccaa 33840 agcgcctgct ggccggcgct gagagggtag gagagggcag gaaccgaggc ctgcgccgca 33900 ggttccggcg ccaccgtcgt gcgttcgctg aggccgctta gatcgcttag atccctggcc 33960 agttccgcaa cgctggggcc gtctagaaat cggaccatgg gcagcaagac gcgcagatcc 34020 gtatcgatcc ggttgcgtaa ttgcaccgcc atgagcgagt ccaatcccat acgcaccagc 34080 ggctgctgta agtccaccgc cgattccggg cactgcagtt tttttttttt tttttttttt 34140 tttttttttt tttttttttt tttttttttt tttttttttt ttttaatgcg gtagtttatc 34200 acagttaaat tgctaacgca gtcaggcacc gtgtatgaaa tctaacaatg cgctcatcgt 34260 catcctcggc accgtcaccc tggatgctgt aggcataggc ttggttatgc cggtactgcc 34320 gggcctcttg cgggatgatc cctgtcagtc atgcgggcaa cttagccgag ccctacgaca 34380 ccgcccgtgg gaaggtgagt gtctaactgc gtgacaacgc cagcgcacag cggcggacaa 34440 ccgcgagcac ccatggactg gcgccgcagg tgagaagcac actggcccaa ggtcgagcgc 34500 ccacccaagt tgcttcggga cgaagaggtc gtgggttcaa atcccgccac cccgacagag 34560 aaacaccagg tgaggcagac cgtaacgtta cggtctgcct cacctgtttt ctgtgcgtgt 34620 ctatctgcgt gactatcgcg ccggaccccg cttgaagatg ccgtccatga ccacagcgcc 34680 ggtctggatg acgggccgga tctgcttccg gtagacctcc tcagtcacgg ccgtaccgga 34740 gtgtccgacg agccgggaga tctcctccag cgggacgccg cggtcggaca gcagggacac 34800 gaagctgtgc ctcagctccc tcggtgtcca ctcgtcggcg ttgatcccgt tggcatcctt 34860 gagcgcctgg cggaaggcgc gccggacgtt agtcgcgtcg agcggcttgc caacggccga 34920 cgagaagacc aggccgtgtt cctcccactt gtcaccggcg gcgagccgtt cccagccctg 34980 gtcctcaaag tgctgccaga ggacctccac gcaacgcgcc ggcagggcga gcgttcgccg 35040 agacttccgg gttttcgtgt ccccaccgcg ccggaccgag cgccagacgg cgatgtgcgg 35100 aggctgcggc ggctcaacgt ccggacttcc cttgaggaag acgtggtccc aggtcagcgc 35160 ccgcagctcc tcggtgcgcg caccggtcag cagggcgacg acgatgtagg cgtgcatcga 35220 cgtgccctcg gcagcattca gcaccgcctc ggcctgggcg aaggtgagcg ccttggacgg 35280 ccggccaggc tggccctggg gcacagagca cagctccacc acgttgcgct tcaccttgtc 35340 acgcgccatg gcccgcttga ccgcccggtt caggcaggag tggaccgcct gaaggctgcg 35400 cgtgctcaga gtctgagcct tggcggccag ccagcggtcg acgtcctctg cgctgaggtc 35460 acgcagcttc cgggcaccca aacccggtat gacgtgcttc tggcttaggt gggtgcagtt 35520 ctcgacggtg cgctggtcac ggccagcgag accgtaggca agccagtcgt tcaccgcgtc 35580 ggcgacggtg taccccgtgg gtgcgatcgc gagaccgtct tcgtggtcac gcagaacctc 35640 tttgagcttg ttcttagcct ccgtcttggt cttgccactc ccccgcttga cgatccgctt 35700 accgctcgga tcgaagccga ggttcgccgt ggcgatccag cgctgtctct tctcgtccca 35760 gtggaggccg ccgtcacccc ggctacgtcg cttggccatg gatcgatccc ctgcccggca 35820 aaatagagtg ttcctctgcc ctctttagca ttcagtgtat ccattaccgt catcaattgc 35880 tcactcccgg ggcgcggtgc gttgtcatcg aataaattga gctgcgcgac tccctgactg 35940 aagaaatccc ccagcatcac gcccgctttt tggtaacgat ggcccgcttg ccagatggca 36000 tccagagatc gcgtagcagc gttaatgata tccctgctgt cctgagtggg cgtcagcagt 36060 tttaccgacg cgctattgcc gtaataaggt tcattgagcg caaatggtga cgtcttaata 36120 aacgtggaga taaaccgaca atattgatgc tcgctgcgaa gtttttccgc cgcccgggca 36180 gcgtaactac aaatggcctg ccgcatcgac ggataatccg tgatgcgttc accaaacgag 36240 cgggaacaga taatttcctg cttcgtcggt gcaaactctt ccagttgcaa acagggttcg 36300 ccgcgcagtt cacgcaccgt tctttcgagc acgacattaa aatgtttacg gataaaccgg 36360 atatctgtat ccgccaaatc gagaacggtt ttgatcccca tcgcgtccag ttttttgctg 36420 atccgccgtc caatccccca gacgtcatcc acggggagag cagacattaa tttacgctgg 36480 cgttccagat ttgataaatc caccacccca cccgtctgcc gctgccattt ttttgccgca 36540 tgattggcaa gctagcttta tgcttgtaaa ccgttttgtg aaaaaatttt taaaataaaa 36600 aaggggacct ctagggtccc caattaatta gtaatataat ctattaaagg tcattcaaaa 36660 ggtcatccac cggatcagct tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat 36720 tacttcgcca actattgcga taacaagaaa aagccagcct ttcatgatat atctcccaat 36780 ttgtgtaggg cttattatgc acgcttaaaa ataataaaag cagacttgac ctgatagttt 36840 ggctgtgagc aattatgtgc ttagtgcatc taacgcttga gttaagccgc gccgcgaagc 36900 ggcgtcggct tgaacgaatt gttagacatt atttgccgac taccttggtg atctcgcctt 36960 tcacgtagtg gacaaattct tccaactgat ctgcgcggat cgatccttgc cgagctggga 37020 tggaagcccg gccgacccac cctggaggag atgatcgagg atgccagggc ctttcacgcc 37080 cgccgctgct gagcgtccgc cgccgggccc gcaccgccgt cggccggccc gctccgggct 37140 cgcagcagcg ggcttcggcg cgggcccggg gctcccgggc cgccgggcgg ggctccgccc 37200 ggcggccgcc gggggccggg ggcggcgccg ggcggcccgg ggcgtcaggc gccgggggcg 37260 gtgtccggcg gcccccagag gaactgcgcc agttcctccg gatcggtgaa gccggagaga 37320 tccagcgggg tctcctcgaa cacctcgaag tcgtgcagga aggtgaaggc gagcagttcg 37380 cgggcgaagt nctcggtccg cttccactgc gccccgtcga gcagcgcggc caggatctcg 37440 cggtcgcccc ggaaggcgtt gagatgcagt tgcaccaggc tgtagcggga gtctcccgca 37500 tagacgtcgg tgaagtcgac gatcccggtg acctcggtcg cggccaggtc cacgaagatg 37560 ttggtcccgt gcaggtcgcc gtggacgaac cggggttcgc ggccggccag cagcgtgtcc 37620 acgtccggca gccagtçctc caggcggtcc agcagccggg gcgagaggta gccccacccg 37680 cggtggtcct cgacggtcgc cgcgcggcgt tcccgcagca gttccgggaa gacctcggaa 37740 tggggggtga gcacggtgtt cccggtcagc ggcaccctgt gcagccggcc gagcacccgg 37800 ccgagttcgc gggccagggc gagcagcgcg ttccggtcgg tcgtgccgtc catcgcggac 37860 cgccaggtgg tgccggtcat ccggctcatc accaggtagg gccacggcca ggctccggtg 37920 ccgggccgca gctcgccgcg gccgaggagg cggggcaccg gcaccggggc gtccgccagg 37980 accgcgtacg cctccgactc cgacgcgagg ctctccggac cgcaccagtg ctcgccgaac 38040 agcttgatca ccgggccggg ctcgccgacc agtacggggt tggtgctctc gccgggcacc 38100 cgcagcaccg gcggcaccgg cagcccgagc tcctccaggg ctcggcgggc cagcggctcc 38160 cagaattcct ggtcgttccg caggctcgcg taggaatcat ccgaatcaat acggtcgaga 38220 agtaacaggg attcttgtgt cacagcggac ctctattcac agggtacggg ccggcttaat 38280 tccgcacggc cggtcgcgac acggcctgtc cgcaccgcgg atcaggcgtt gacgatgacg 38340 ggctggtcgg ccacgtcggg gacgttctcg gtggtgctgc ggtcgggatc gccaatctct 38400 acgggccgac cgaggcgacg gtgtacgcca cagcttggcg taatcatggt catagctgtt 38460 tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa 38520 gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttacggatca gtgagggttt 38580 gcaactgcgg gtcaaggatc tggatttcga tcacggcacg atcatcgtgc gggagggcaa 38640 gggctccaag gatcgggcct tgatgttacc cgagagcttg gcacccagcc tgcgcgagca 38700 ggggaattga tccggtggat gaccttttga atgaccttta atagattata ttactaatta 38760 attggggacc ctagaggtcc ccttttttat tttaaaaatt ttttcacaaa acggtttaca 38820 agcataaagc tatcgtccat tccgacagca tcgccagtca ctatggcgtg ctgctagcgc 38880 tatatgcgtt gatgcaattt ctatgcgcac ccgttctcgg agcactgtcc gaccgctttg 38940 gccgccgccc agtcctgctc gcttcgctac ttggagccac tatcgactac gcgatcatgg 39000 cgaccacacc cgtcctgtgg atctgcctcg ctggcctgcc gcagttcttc aacctcccgg 39060 cgcagctttt cgttctcaat ttcagcatcc ctttcggcat accattttat gacggcggca 39120 gagtcataaa gcacctcatt acccttgcca ccgcctcgca gaacgggcat tccctgttcc 39180 tgccagttct gaatggtacg gatactcgca ccgaaaatgt cagccagctg ctttttgttg 39240 acttccattg ttcattccac ggacaaaaac agagaaagga aacgacagag gccaaaaagc 39300 tcgctttcag cacctgtcgt ttcctttctt ttcagagggt attttaaata aaaacattaa 39360 gttatgacga agaagaacgg aaacgcctta aaccggaaaa ttttcataaa tagcgaaaac 39420 ccgcgaggtc gccgccccgt aacaaggcgg atcgccggaa aggacccgca aatgataata 39480 attatcaatt gcatactatc gacggcactg ctgccagata acaccaccgg ggaaacattc 39540 catcatgatg gccgtgcgga cataggaagc cagttcatcc atcgctttct tgtctgctgc 39600 catttgcttt gtgacatcca gcgccgcaca ttcagcagcg tttttcagcg cgttttcgat 39660 caacgtttca atgttggtat caacaccagg tttaactttg aacttatcgg cactgacggt 39720 taccttgttc tgcgctggct catcacgctg gataccaagg ctgatgttgt agatattggt 39780 caccggctga ggtgtttcga ttgccgctgc gtggatagca ccatttgcga tagcggcgtc 39840 cttgatgaat gacactccat tgcgaataag ttcgaaggag acggtgtcac gaatgcgctg 39900 gtccagctcg tcgattgcct tttgtgcagc agaggtatca atctcaacgc caagcgtcat 39960 cgaagcgcaa tattgctgct caccaaaacg cgtattgacc aggtgttcaa cggcaaattt 40020 ctgcccttct gatgtcagaa aggtaaagtg attttctttc tggtattcag ttgctgtgtg 40080 tctggtttca gcaaaaccaa gctcgcgcaa ttcggctgtg ccagatttag aaggcagatc 40140 accagacagc aacgcgccac ggaaaaacag cgcatacaga acatccgtcg ccgcgccgga 40200 caacgtgata attttatgac ccatgattta tttcctttta gacgtgagcc tgtcgcacag 40260 caaagccgcc gaaagttaac ttgtttattg cagcttataa tggttacaaa taaagcaata 40320 gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 40380 aactcatcaa tgtatcttat catgtctgga tctgacgggt gcgcatgatc gtgctcctgt 40440 cgttgaggac ccggctaggc tggcggggtt gccttactgg ttagcagaat gaatcaccga 40500 tacgcgagcg aacgtgaagc gactgctgct gcaaaacgtc tgcgacctga gcaacaacat 40560 gaatggtctt cggtttccgt gtttcgtaaa gtctggaaac gcggaagtca gcgctcttcc 40620 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 40680 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 40740 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 40800 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 40860 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 40920 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 40980 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 41040 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 41100 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 41160 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 41220 tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 41280 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 41340 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 41400 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 41460 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 41520 atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 41580 cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 41640 ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 41700 ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 41760 agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 41820 agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tgcaggcatc 41880 gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 41940 cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 42000 gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 42060 tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 42120 tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aacacgggat 42180 aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg 42240 cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca 42300 cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga 42360 aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc 42420 ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 42480 tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 42540 ccacctgacg tctaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc 42600 acgaggccct ttcgtcttca agaattcgcg gccgcaatta accctcacta aagggatccc 42660 tatagtgagt cgtattatgc ggccgcgaat tctcatgttt gaccgcttat catcgat 42717 <210> 114 <211> 34071 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: insert d'ADN du cosmide a26G1 - brin codant <400> 114 actgcagtgc ccggaatcgg cggtggactt acagcagccg ctggtgcgta tgggattgga 60 ctcgctcatg gcggtgcaat tacgcaaccg gatcgatacg gatctgcgcg tcttgctgcc 120 catggtccga tttctagacg gccccagcgt tgcggaactg gccagggatc taagcgatct 180 aagcggcctc agcgaaçgca cgacggtggc gccggaacct gcggcgcagg cctcggttcc 240 tgccctctcc taccctctca gcgccggcca gcaggcgctt tggtttattt accgaagcgc 300 gccggaaagt cccgcataca acatcgcgtg gatcgcgcgc gcgagaggcg ctttcgatcc 360 gcaggcgttg cgccgttcgc tgcaggacct ggtggatcgt catccggcgc tgcgaacgac 420 gattgcggag agtggcggcg cacccgttca aacggtccac agcagcgtcc cggtggattt 480 cgaagtgatc ccgtgttCgc cggacgatga ggcggtgctg atcgacggcg tcttccacgc 540 gcccttcaat ctcggcgaaa actgtttccg ctcgcgtctc ctggtgcagt cggggaagga 600 tcaggttctg gccatcgtgg tgcatcacat cctcgccgac ttctggtcac tgctggtgat 660 ggtggatgaa ctccgcagta tctacctcgc gaggacagct ggcggtccgc ctgtcgcgcc 720 gccggtcgcg agcttcgccg ctttcgtccg ctggcagaac gaactgttgg ccggaaccga 780 gggcgagcgg ctttggaact actggtcctc gcagctttcc ggccagcttc cggttctgaa 840 tctcccgtcg gatcgtccca gtccgccggt gcagagtttc cggggaaact ctcactcgtt 900 ccgaatcgaa cccgcgctga ctgcgaaact gaaggcgctc gcgcggcggc agaacgcgac 960 gctgcatgcg acgctgatgg cggcgtttca agtgcttctc tcccgttgga cctcacaaga 1020 agagatcctg accggcaccc tcaccaacgg tcggacgcaa ccggaattcg ccgatctcgt 1080 cggatacttc gtgaatcccg taatcctgcg aggagaactt tcaggcgatc cggatttcaa 1140 tacggtgctc gcccggattc ggcaaacgct tctcggcgcg atcgagcacc aggagtaccc 1200 gtatgcccgg atcgtggagc ggttgggtcc cggactgcgg gttctattcg tgctccagca 1260 gcctcatcgc attcccgaat ccgtgccgtt catgttgggt cagtccggcg gtcgcatggc 1320 ctggggcagc ctcacactgg agtccctggc gatgccgctg cgacagagcc ggtttgacct 1380 ggatctgatg atggtcgaaa ccgatggagg cctctccgcc tttctgcaat acaacacgga 1440 catttttgat gctgccacga ttgaacgtct ctccttgcac ttcgccgtgc tgctggaagg 1500 aatcgcggag aatcccgcct gtccagttgt cgatctaccg ctgctgacaa cccgggaacg 1560 catccagctg ctcgaagagt ggaatgcgac cgccgcggaa ttcccgtccc aatgcgtgca 1620 cgagctgttc gaagctcagg tggagttgac gcccgacgcc atcgcgttga gcttcggtga 1680 gcagaatctg acatatcgcg aactcaacgg gagcgccaac cggatcgcgc actatctccg 1740 ctcgcgcggc gctggacccg gcgaaatggt tggcatccat gtcacgcggt cgctcgaaac 1800 cgtcgcaggg ctgttgggcg tcctgaaggc cggcgcggcc tacgttccgc tggaaccgga 1860 atatccggcg caacgtcttc ggctgatgct ggaagagacc aggccggtcg ttgtgctgaa 1920 tgtcacggaa tcggaagtat ggacgcagcc cgacaccaat ccgaacccgc tcgcgactcc 1980 cgccgatctc gcctatgtcc tgtacacctc cggttcgacc ggccggccga aaggcgtgca 2040 aatcacacac caggccgtcg tcaattttct ttcgtcgatg cggcatgagc cgggcatcag 2100 cgaccgcgat acgctgctcg ccctcacgac gttcatgttc gacatttccg cgctcgagat 2160 ctttttgccc ttgagcgccg gcgcgcgcgt cgtggtggcg aaccaggaga cggccgtcga 2220 tggtgagagg ctggcgaggg aactcgcgcg cagcaaagcg acaatgatgc aggcaactcc 2280 cgccacctgg cgtctgctgc tcgcatccgg ctggcccggc gaccgccgcc tgacggcgct 2340 ctgcggcggt gaagcccttc ctcgcgatct tgccgaccgg ctcctgcaac gaaccgcggc 2400 gctatggaat ctttacggac ctaccgaaac gacaatttgg tccgccatcc aacgggtgac 2460 gacaggtgac ggaccggttt cgattggccg ccccatcgca aacactcagc tctatgtgct 2520 tgacgatcgg atgcagcccg cacccatcgg tgttgcgggc gaactgtaca tcggcggcgc 2580 cgggctcgcc cgtggatacc tgaatcgtcc ggaactcagc gcggacaagt tcgtcgccaa 2640 ttcgttcgac cctcatggca ctcggctgta tcgcacggga gatctcgccc gccgccaacg 2700 cgacggcgcg ctcgagtatc tcggccggat cgaccaccag gtgaagatac gcgggttccg 2760 catcgaaacc ggcgagatcg aggccgcggt ccgcagtcac ccggcggtcc gacatgctgt 2820 ggtcaccgcc agagaaaatg acgcggccgg taagtatctg gcggcctaca ttgtccccct 2880 tgctgacggg catcgcgcga cggcagccgc cgacacattc cacgaccgag tcgagtccga 2940 gcacgtgacg cagtggcaat ccgtctggga caccacatat gaacagaatg cgccgaacgc 3000 ggatccggag ttcaacatcg tcggctggag aagcagtgtt accggagagc cgattccagc 3060 tgccgagatg cgggagtggg tgcaggattc cgtcgatcgc atcctggcct cgcggccgcg 3120 tcgcgtgctc gagattggct gtggtacggg actgctgctc ttccgcgtcg ctccccactg 3180 ttcggagtac tgggccacgg acttttcgca gaaggcgctg gactacatcg ccgctcacgc 3240 ggaccgcacc ggcctggcaa atgtccgcac gttccggcag gcggccgacg acgcgtgcga 3300 gatcgacagt cgctcgtgcg atgcggttgt tctgaactcc gttatccagt acttccccgg 3360 cgaagcgtat ctgcggcgcg tgctggccga ggcggtgcgt gtggtcaaac cgggcggcat 3420 cgtatttgtc ggcgatgtcc gcagtctccc gctgctggag acgttttacg cttctttaga 3480 agttcagcgc gcacccgcgt cgttgacccg gaatgagttt cggcaacgcg tgcgttcgct 3540 cgcgtcgcag gaagaggaac tcgtggtcga tcccgcgttc ttctttgctc tccgcgaaca 3600 gattccggag atcggccgga ttgaaatcct gccgcgtcgc ggccggtcgc ataacgagct 3660 gacccgcttc cgctaccagg cgatcctgca tatcggatcg cgggaagcgg aggagccgga 3720 atcggatcgc aggcgttgcc agaccgcggc cgaaatacgc agagtactga cggacgctca 3780 gccggagttg gccgcattta ccgagattcc gaacgcacgg ttgaccgccg aaagcgccat 3840 tgtgacctgg atgaacggtg acgaagctcc agagacactc ggggagttgc gggaccggct 3900 gcgccagacg tcgccttccg gcgtcgatcc cgccgatcta tggcgtatgg acgaagacct 3960 gccgtaccgc gtggcaatcg actggagcag tcatgggcca cacggacgct tcgacgcgac 4020 cttctgccgt gcggcggccg gtccgccggc ttcccgtccg cgacgccgcc tggccggccc 4080 gtatacgaac gatccgctgc gagccgtcta tacgcgcacg gttgtgccgc agttgcgtac 4140 tcatctgaag gagaagctgc ccgactacat gatcccgacc gcgtgggtcg tgctccacga 4200 aatgccgctg acgcccaacg gaaaaatcga ccgtaacgcc ctgcccgatc ccgagcccag 4260 ccggcgagcc cacgccgaag cattcacgcc tccggaaact ccggtggaac aggtactcgc 4320 ccacatttgg ggcgaggtgc tcggcatgga tggcatcggc gtccatgatc acttcttcga 4380 ctctggagga cattcgctgc tggtcacgca gatgatcgcc cgcgtgcgcg acatgctcca 4440 cgtggaagtg ccctttcgaa ccgtgtttaa cgcccccacg gttcgaggct tcgccgtcgc 4500 tattcaggac ggcgtagacc caggatgggc aaggcgagcc gccgatttgc tgatcgctgt 4560 ttcccaaatg tcagatgttc aaatcgagcg tatgatgagc gccgcccaag actaggaaca 4620 cagcgggttg taatgcagaa ttcgtcgcca aataccatag acctctcgct cgcccgccgc 4680 caattgctcg accgtctgct gcaggaaaac agccccgaac atcgcatccc gcggcgtgaa 4740 aaccgggatg ccgcaccctt gtcgctggcc cagcagcggc tttggtttct ccatcagctc 4800 gacccggatt ctcccgccta caacattccc atagcgctgc atatccgagg tccgctggat 4860 attcgcgtcc tcctgcggag tctggaggcc gtggtgcagc ggcacgagag cctgcgcagc 4920 tgcattggcg gtgtggatgg agaggcgcgc cagagcctcc tggcgcgagt gacactggaa 4980 cttccggttg ttcaggctga cggaatcgca gaagcgcggc aaatggcctt gcgtgatgcc 5040 cagatcccgt tcgacctgcg aaaacccccg cttctgcgga ccaagctgat ctgcctcgat 5100 gacaagcagc agattctcct gctgacgttg agccacatca tcgcggatgc gtggtcggtc 5160 gagacgttcg tccgcgacct gacgcgatcg tacgaagcgt tcgtgcaggg gcggccatcg 5220 ccgctcatgg aactgccgat tcagtatggc gactgggccg tccatcagca gacgtcgctg 5280 aaccaaaccg cgcagcagta ctggaagaaa cagctgtcgg gcaccttgcc tttcctcgac 5340 cttcctaccg atcgcccccg gcccgcgcag cagacctggc ggggcgccgt ggagaccaca 5400 gccctcggcc gtgatttgac cgatggactc cacgcgtttg ccttgcgtga aggagcgacg 5460 gtgttcatga cggcaatcgc ggcgtttcag gtgctgctgc atcgctatac cgcgcaggaa 5520 gacatcctta tcggggttcc agtcgcgggc cgtacacaac gagaaacgga aggtctcgtc 5580 ggttgtttcg ccaacatgat cgtcctgcgc ggcgatctgc gcgacgatcc gtcgtttcgc 5640 8l agtcttctcg cccgcacccg cgacaccgct ttgagcgccc tctctcatca ggactttcct 5700 ttcgaacgcc tggttgagga actgcatcct ccgcgggacc tgagccggtc gcctgtattt 5760 caggtctcct tcgcgctgct gcccgatgcg ccggccatca ccgtcatgcc tgggctcacc 5820 atctcgcgcg agtacatgca caacggcgga tccaaactcg acctcggcgt gaccctcgag 5880 ccatccggcg atggactgat ggcgtccgcc gaatacaaca ccgatttgtt cgatgcggca 5940 accatcgcct ccctgctcga tgcgtaccga accctgctgg cgagcgtggt gacggatccc 6000 gacgtccgca tttcaaccgc tgcgctgttg tcccccgcgg tccgaagccg gatgctcgag 6060 cagcacaatg cgacacggcg cgatgccggt ccgaacgggt gtgcgcatga actggtcgaa 6120 gctcaggcgg aacgcactcc gcacgccgtc gccgttgtct tcgaagacca tcagttgacc 6180 tacgccgagc tgaatgçgcg ggccaaccgc ctggctcatc gtctgagcgc atccggcgcg 6240 ggcccgggaa agatcatcgc tctggcgatg gagcgctcgc tggagatggt gattgcgctg 6300 cttgcgattc tgaagtccgg cagcgcgtac ctgcctctcg atcccgcgca ccccaaggat 6360 cgtctcgccc ggattctcga tgaagtgcaa ccgcacgcgg tcctcacgca ggaggcggtg 6420 gctgagatga tggcgatgat ggcgatgatg gcggtcgccg tcgaaccaga agctgcgaat 6480 ctcgtcagcg gcagcaagcc cgacgatctc gcctacatca tatatacctc cggatcgacg 6540 gggcgaccga agggcgtgga gatccgccac tcgtcgctag tcaatctgct gcgctccatg 6600 cagcgcgagc cgggtctgac agccgccgat gggctggtcg ccgtcaccac cgtgtcattc 6660 gatattgccg gactggagat ctggctgccg ttgatcaccg gcgcccgcgt catcgtcgcc 6720 acccgcgaga tcgtggttga cggcgagcgg ctcaccaccc tgctggataa gtcgggcgct 6780 acggtcatgc aggcgacccc gagcggttgg cggcaattgc tggattcggg ctggaagccg 6840 ggtaaaggct tccgtgtttt ctgcggcggt gaagctctgc cgccggaact ggcgcgccgc 6900 attctcgata gtggcgtaga gctgtggaat ctttacggac cgacggagac caccatatgg 6960 tcggccgtgc acaagacaca aagactgggt gcctccgata gcatcgtgcc gatcggccat 7020 cccatcgaca acacgcagtt atacatcctg gattcgcgca tggagccggt tccccccgga 7080 gttccgggag agctgtacat cggaggagcg ggactggcgc ggggctatca tcgcaacccc 7140 gagctcacgc gtgagaaatt ccgcgagtgg cgtgatcgag gacgcattta ctctaccggc 7200 gatctggctc gctaccgttc cgacggcgca gtcgagtgcc tgggacgagt cgatcgccag 7260 atcaagctgc gcgggtttcg catcgaaccg gccgagattg aggccgcgat cgagacgcac 7320 attgccgtga agcaggcgat tacggtcgtg aaggacgatc ggctgatcgc ctatctcgtt 7380 ccggcaacgg gcgacgtgcg cgatctgcag agcgatttgc ggtcgtggct ggcaacgcgc 7440 cttcccgatt acatgatccc ctcggcgttt gtcagcctgt cctcccttcc gctgacgccc 7500 aacggcaaaa tcgacgcgaa cgcgcttccc ggtttgccca caacgccggt tgctgctcgc 7560 gagccgatgc gcggcgatgt ggtggagacg attgcgtcca tctggcgtga agttctgcgc 7620 gtggagcacg tcgactatcg gcagaacttc tttgatgtcg gcgggcactc gctaatgctc 7680 acacgggtgc gcggactgct cgaggagcgc ctggggttga cgctctccgt cgtcgatctg 7740 ttccggcata cgacgatcga gtcgcttgcc ggcctggcag aaaaatccga acccgccgct 7800 gcggaacctg cggctgcggt cgcagaagat cggatcgcag ttatcgggat ggccggccgg 7860 ttcccggggg cgcgcaatgt ggaggagttc tggcgcaatc tgcgcgacgg tgtggattcc 7920 atcgccaggc tttcgccgga agatctgctg gcgggcggca tcagcccgga ggtcttccag 7980 gacccgagct acgtgccggc caagggtctg ctggacggca tcgagttttt cgatgccgcg 8040 ttcttcggct acagtccgcg cgaagcggag atcatggacc cgcagcatcg cgtgtttctc 8100 gagtgcgcgt gggaagcgat ggagaacgcg ggatatgcgg cgcgaagcta taagggttcg 8160 atcggcgttt tcgcgggatg cggcgtcaat acctacctgc tgaacaacct cgccaccgcg 8220 gagccgttcg atttctcacg cccctccgcg taccagctgc tgacggccaa cgacaaggat 8280 ttcctggcca cgcgtgtctc ttacaagctg aacctccgcg ggcccagcct gacggttcag 8340 acggcgtgct ccacctcgct ggtgtcggtg gtgatggcat gcgagagctt gcagcgcggc 8400 gcctcggaca ttgccttggc cgggggagtt gccatcaatg ttccgcagtc cgtggggtac 8460 ctgcaccagc cgggcatgat cctgtcgccc gacgggcgct gccgcgcctt cgatgagtcc 8520 gctcaaggca cggtgccggg caacggcgcg ggtgtggtcg tcctcaagcg cttgagccgc 8580 gctctggccg atggcgacac gatctacgcc gtcattcgcg gagcggctat taataatgat 8640 ggcgccgagc gcatggggtt taccgctcca ggtgtggacg gtcagacgcg attgattcgg 8700 cgcactcaag agatggcggg cgtgaagccg gagtccatcg gctacatcga ggcccacgga 8760 acagccacgc cgctcggcga tccggtggag atcgccgcca tcgctgccaa ctttccgaaa 8820 aacggaagcg gcgatgtgta tatcggatcc gtcaagacca acatcggtca tctagacgtc 8880 gcggccggtg tggccgggct gatcaagacg gtgcttgccg tccatcgcgg ccagattcct 8940 cccagcctga atttccagcg tccgaatccg cgaattgatt tcgcaaacac tccgtttcgt 9000 gtgagtacgc ggctgctcga ctggcccgcc ggaaagaccc cgagacgagc ggcagtcagt 9060 tcgttcggga tcggcggcac caacgctcac gtgattctgg agcaagcgcc gccggtgacg 9120 ccggccgcag ctgcgcccga acgatccgca catgtgcttt gcctgtccgc caatacagac 9180 gcggccctcg aagaactggt gcgctcgtat cgcggccata tggacaacca gcccggtttg 9240 tcgttcggcg atgtcgcatt cacggccaat gcagggcgcg tgcacttccc gcaccgtatc 9300 tgcattgtgg cccggtcgag cgacgaggct cgccaacgac tgacggaggc acgacgggtt 9360 cgcatcgccc agacgcgccc caagattgcg tttcttttca ccgggcaagg tgcgcaatac 9420 gcgggcatgg gccgccagtt ctacgagtcg cagccggtgt ttcgcgccgc catggatgaa 9480 tgcgcagctc tgctgaatgg acggctcgat ctgccggcgc tgttggccga tgacgcgttg 9540 ctcgacgcga ccgccggcgc gcagcccgcg ctgtttgctt tgcagtgggc cttggcgcag 9600 ttgtggaagt cctggggtgt gacgcccgac ctggtgatgg gacacagcgt cggcgaatac 9660 gcggcggcgt gtattgccgg cgccgtcagc ctgccggatg cgctcggctt agttgccgaa 9720 cgcggccggc tcatgcagaa cctgccggaa ggtgcgatgg ctgcggtcag cgccggcgag 9780 cagcgctgtg ccgcagcgat cacctcgcgc gtctccattg cggccatcaa cggacccgct 9840 gaggtcgtga tttcgggtgc gccgcaggat attgagagcg cgctggcaac tctacgtgcg 9900 gagggcatca aaacgcagat gctggccgtt gcgcgcgcct ttcacagctc gagcatggat 9960 ccgattctgg cggacctgca acgccgggcg gcggcgatcg cgtggcgcaa tccttcgatc 10020 ggcttggttt cgaacctcac gggcaaactg gccggcgagg gacagctggc gaatccgctg 10080 tactggcgag atcacgctcg aaaccctgtc cgtttcgccg acggtatcca aacgctcaag 10140 gacgaaggct gcgacgtgtt tctcgagatc ggtcctaagc cggttctact cggcatgggc 10200 caaaagtgcc tgcccgacga cgccaagcag tggctgccgt cgctgcgtaa aggccgcgat 10260 gagtgggaga cgattctcag cagtgtggcg acgctatatc agggtgggtt cgacatcgat 10320 tggcaggagt tcgaccgtcc gtattcgcga aggcgtgtcg ccctgccggc ctatcctttc 10380 gagagacgcc gccattggat cgagcggagt tccagaccgg aacctgtagc ggttgcgagt 10440 ggtctcgtcg ggtgccggct gtcgctaccg gtggcagacg ttatcttcga gtcgaaacta 10500 tcgacggctt cgcctctact ctcagaccac cgatattacg gttcggtggt ggccccggcc 10560 gtgtacttcc tggccatggc gctcgaggcg tcggcggagg tgtttggcgc cggccggcac 10620 acgctggaaa acgtgaactt cgcgcaccct ctgatccttt cagcggagcg cgacacggct 10680 gttcagctcg tgctttcaca gagcgatgac cggcatgcct cgttccgcat actcagcttg 10740 tccgacggct cgtggaactt acatgctgcc ggcaatattg ccgcccacgc tggtgtcgct 10800 cccgtgcccc gactggtcga tgaacgccgg cctgcggtgg atggagacac gtactattcg 10860 ctgctgcgcc acctcgagat agaactgggg ccgagctacc gccgcataca gcgcattcat 10920 ttcggtgaac aggaagcgct ggccgcgatt gattccgcaa cgccgctcaa tccccgttgt 10980 gaattggcgg aagccggcct gcaattgctt agcgccgcgg cgagtcccgc gcttgcggat 11040 ggcgccgaac atccgatatt cgctccgctc ggtatcgatc gcgtttgttt ttacggcagc 11100 ctggagggcg ccgtatgggg ggccgcgcaa attctccggc attcgccgga cggctttacc 11160 ggcgaggcgc agttgctgga ctcggagggc tgcgttctcg gggaacttca gggcgtgagt 11220 ttccggcgcg tcactcgcgc atgggcgcag cgctcggaac ggaagcccga attgtatgag 11280 gtcgagtggc ggcccgaacc gctccgccag ccttcgcgaa cgctacagcc tggggcatgg 11340 ctgatcctgg ccgacagtgg cggcgcggcc cgcgctctgg cagatgcgct cacagctcag 11400 ggcgagatgt gcgttaccgt gccgccagcc ggcgagtaca tgtccctagt cggtgagcgt 11460 gactggcgcg ggatcgtcaa cctgtacagt ctcgatgatt atgagctcgg ctgccgcagc 11520 actctggccc tggtgaagtc cctgaagtcc ggtccgcggc tatggctggt aacggccggc 11580 gcgcaggcga ccagtgcggt gcacaatccc atgcaggccg cgctctgggg cttcggccgg 11640 gtgatcgcgc gcgagcaccc ggatctgtgg ggcgggctca tcgatctgga tcccgacgat 11700 gcgcatgctt cggcggccgg cgcggccgcg cagatgcgtg atttcgacgg cgaagatcag 11760 tcggcgtgga gaagcaaccg gcgctacgtg ccgcgactga cccgccgacc cagcgcgcga 11820 gcggcagtcc gtctggtttc gggcgcgact tatttgatca ccggcgggct cggagccctg 11880 ggacttacag tcgcgaaatg gatggtggag cacggcgcca ctcgcgtcgt gctggccggg 11940 cgccggcctc caaacgagga gcagcagcgc gtgctgcaac agattggtgc gacggcagag 12000 acggtcgacg tcagccggga agaagaggtc gcggatctca ttcgccgcat ccacaccgaa 12060 acgtcaccgc tgcgcggcgt tatccatgcc gcgggtgtgc tggacgacgg cgtactgctg 12120 aatcaggact ggacgcggat cgcaagcgtc atggcgccga aggcggaagg cgctgtacac 12180 ctccatcatc acacccgcga tctgccgctc gacttcttcg tgctcttttc atcggcatcc 12240 tcgctcttag gtcctgccgg gcaggcaggc tacgccgcgg ccaacgccgt tctcgatgcg 12300 ctggcgcatc accggcgcgg actgggtttg ccggcgacca gcattaactg ggggcgctgg 12360 tcgggagccg gaatggccgc gcgcaccagc cagtcgatgg ccggcgtggc gagcctctcc 12420 gtggacgagg gtctacacat tctcgaggcc gtcctgcatg aatgccccat tcagattgcc 12480 gcgctaccgg cgggctcgat taccggcgag ttgctgcgtc ccgccgcgct gccttcacct 12540 caactgcgca cccgcttgaa cgaagccaca ccccggcagc gcgaagccat cctcattgcg 12600 cacatcaggg agtcactggc gcgctttgtc ggcatcgcga cttccacacc gctcgatcca 12660 cagcagcctt tgggtgaact gggactcgat tcgctaatgg ccatagaact tcgcaactcg 12720 ctctcccaat cactggggca gcctttgccc gcgagtctgc tgttcgacta tccgtcgctc 12780 gatgcgatcg tcagttacgt gctccatgcg gtatttccac ccgaagcatc accggtggaa 12840 gcgccggagt ttgagaacct cgcccgcgaa gaactggaag cgctgctcga ttcgcggctg 12900 gcgcaggtcg accagtggtt ggagacgcaa taaacatgag cgggtcagac gatctcagca 12960 agcttcgccg cgccgtgatt gcgctcgaca aggtgcagaa acgcatcgac cagctggaga 13020 gcgcgcgcag cgagcccatc gccctcatcg gcgcgggctg ccgcttcccc ggcgcatcca 13080 atctcgatgc ctattggtcg ttgctgcgcg agggccgcag cgcggtacgt gaagttccac 13140 ccgaccgctg ggacatcgat gcctactacg atccggatcc cggcgcgacg ggccgaatgt 13200 acacgcggta cggcggcttc atcgatcagg ttgaccgttt tgacgcccgg ttcttcggca 13260 tcgctccgcg cgaggcgatc agcctggatc cacagcagcg gctgcttctg gaagtcacct 13320 gggaggcgat cgagaacgcc gggcttccac ccgaccggct ggcggggagc cggaccggcg 13380 tcttcatggg gatcttttcc aacgattatt acaacctgca aatgcgcggc ggggatgcgc 13440 atatcgacgc gtacaccggc acgggcaata cggccagcgt tgccgccggg cgtctctcgt 13500 acatcctcgg gctgcagggc ccgaacatgg cgatcgacac ggcatgctcg tcatcgctgg 13560 tcgcggtgca ccttgcctgt cagagcctgc gctcaggtga aagcgacctc gcgctggcgg 13620 gcggcgtcaa tctgattctc tcgccggatc ggacgatcta cttctgcaag ctgaaggcga 13680 tggcagccga cggtcgctgt aaggcattcg atgccgcagc agacggctac gtccgcggtg 13740 agggctgcgg tgtggttgtg ctgaagcgac tctccgacgc gctgcgcgat cgcgatccgg 13800 tgatggcggt gattcgcggc acggcaatca accaggacgg acgcagcaat ggactgacgg 13860 cgccgaacgg gcccgcacag gaagccgtga tccgccaggc tgtgggagac gcgcgcttgc 13920 agacgctgga tgtgagctat gtcgaggcgc acggaaccgg cacgccgctg ggcgatccca 13980 tcgaagccgg agcccttgcg gccgcgctgg gagcggggcg caccaacggc aacaagctga 14040 agctcgggtc ggtgaagacc aacttcggcc acctcgaggc ggcagcgggc gtggccgcac 14100 tgatcaaggt ggcgctgatg ctgcagaacg aagccattcc gccccatctg aatctgacca 14160 cgcccagccc gcacatcgat tggaacacgc ttcccctcga aatcccggca cggctcaccc 14220 cctggccggt tgcacccggc gggcggcgcg tcgccggcat caactcgttc ggcttgagcg 14280 gtacgaatgc gcacgtgctc atcgagcagg cgccgcaaca ggccgcgtcc agtacgcccg 14340 caccgtacct gcttccgcta tcggcgcgca gtccggaggc gctgcgtgat ctggcgcgcg 14400 cataccgcga cgtggtgaac gacaaccccg ccgacacctg ctacacggcg tgcgctcgcc 14460 gcacttcata cgaacaccgc gcggcattca ccgggacgaa cgcgcaggac ttgatggccg 14520 ggctggacag ttttctggcg ggcaacccga accgcgatac cgccacaggt tttgtgccgc 14580 gcggccagaa gcgaaaagtc gttttcgttt tgccgggaca aggatcgcag tggcccggca 14640 tgggccgcga cctgatggct tctgaaccgg tgttccgtgc cgccatcgaa gagtgcggcc 14700 gcgccatgca gccttacgtc gactggtcgc tgacgcaaga gttgcagggg ccgctcgacc 14760 gcatcgacgt gattcaaccg gccctgttcg cagtcggggt cgccttggcc ggactgtggc 14820 gccattgggg aatcgagccg gacgccgtga tcggccacag catgggcgaa gtcgcggcag 14880 cgcacattgc aggtgcgctg actctcgatg aagccgctcg ggtgatttgc ctgcgcagcc 14940 ggatgctcgc cggagtacgc ggccagggag aaatggctgt cgtggaatta gcgctggacg 15000 aggccatcgc tgccatcgcc gggcgctcgg atcgggtctc gattgccgcc agcaacagcc 15060 cgcgcagcac cgtcctgtcg ggcgacagcg cagctctggg cgaactgctg cgggaactgg 15120 aggcgaaaga cgtcttctgc cgtcgcgtga aagtggacat tgcctcgcac agccatctga 15180 tggactccgt gtgcgcggcg ttgccgggcg tggtgggagc gcttcagccg cggccggccg 15240 cccttggcat gtactccacc gtcaccggcg cagcgattag cggtgaagag ctggtttctg 15300 cgtactgggc tcgtaatctt cgccaacccg tgatgctgtc gacggccgtc gccgcagccg 15360 cggcgggtgg tcatgatgtg tttctggaac tgagtcccca cccgttgttg gtccagccga 15420 tccaggaaac gctcggagat cgggcagcga ttgccgctgc ctcgttgcgg cgcgatgaag 15480 acggaaacct cgcactgcgc cggacgctgg gagcgctgct gactaacgga gtcactccgg 15540 actggtctcg tatttatccc aacggcggcc aaactcgccg gctgcccaac tatccctggc 15600 agcgtgagcg ttattggatc gatatccgtc cgccgcaggt cgagtctcag gctttgcctg 15660 gccggcggat cccgtcgccg ctgccggaga tgcagttcga gtccactgtg gaggcgaaag 15720 atttcgcgga tcaccggctg cacgatgtga tcgtgactcc gggagcgtgg cacctggcaa 15780 tggcgctcgc cgctgcgcgc caaggtctcg gcgccgggcc tcaccatgtc gaacacgtgt 15840 cattgacggg cgcgctgacg ctgccggaaa acgatgctgc caggcaggtt caactggtac 15900 tccgtcatga agagggcggc ggagcttcct tccgcatcta cagccgcgag gattcctgga 15960 agctgcacag cgaaggcatg ctgcaggcgg gcgattccac ggcatccatc gatctggatg 16020 cgattcgcgc ccgctgcacg gcggagctca cagccgatgc cttctattcg cgactgtggg 16080 atcgcggcta tcacttcggt cccaccttcc gaaccatcgg ccccatctgg cgcggcaacg 16140 gtgaggtgct ttgtcgcgtg gacattccgc tgacggaaat gcagacgatc gactgctgtc 16200 tgcagttgcc cgcggccctc gtccatcacg acgatttgaa agatgtgcat gtgccggtag 16260 gtctggaccg attctcgctc gctgaagtgc ccactggccc ggtctgggga tacgcggtct 16320 tgcggccgga ttccacggtg gatgtccgtc tcgtcaccgg caccggcagc gtggtggcgg 16380 aattggtggg gctgcagtcg agagtcgccc atagcggcca gctcggcgaa tcggagattc 16440 ccacctggac ggtgcaatgg accgcgtcgg ttcgccgcgg cgatgccaat gccggcaatg 16500 ctggcggacc ttggctcgtc atcggcgagc cggcgattgc cgagactctg caaaagcgcg 16560 gccaaacctg ccgcacggcc gatacgtgct cgggtccgcc gtgccgtcaa attgtgtact 16620 gtccctcgcc gcgcatcgac gacctgcttt ccgtattgcg cagcatcgtg caagcgggct 16680 ggcctgagcc gccgcgcctg tggctgctga cgcgcggatc tgccgcggtt ctcaactccg 16740 acaaagatat tgatattcga caagcctggc tgcacggaat tgggcggacg attgcctatg 16800 agcatcccga gctgcgctgc acgctcgtcg atctcgatgc gcacagcaac gactgcgggc 16860 atctcgcgac gctgatgctg tcgaatatcg cagaggatca agttgcgatc cggcaaggca 16920 cggtatgggc gccgcgcctc agtcttcaca agatcccatc cgcacccgat gtggcgttcc 16980 gtgccgacgc aacctatctg atcacgggcg ggctcggcgg actcggactg caggtggcgg 17040 gatggctcgc cgccgccgga gcgcgccatc tcgttctgct gggacgcagc gagcgtcctc 17100 ggccacaact ggaaggtgtc aacgtcaaga tcatccatgc ggacgtggcg gaccggcagc 17160 agctatcgga.tgcgctcgcg atcatcgatc gcgacatgcc gccgttgcgg ggcgtgttcc 17220 atctggcagg cacgctggcc gacggcatgc tgctcaatct cacgaccgaa cgcttcgaag 17280 ccgccatggc tccgaaagta gccggcgcgt ggaacctgca cgaactcacc gccggccggc 17340 cgctggatca ttttgttctc ttctcttccg ccagcgcgac agtgggatct cccggccagg 17400 gcaactacgc cgccggcaat tcatttctcg acgcgctggc tcatctgcgc cgcgcccagg 17460 gtcttcccgc cgtcagcatc gcgtggggac cgtggacaca ggttggtttg gccgcacagg 17520 cgaaccgcgg agaccgtctg gccgcgcgcg gcatctcggt tattcaaccg caacagggat 17580 tgcgcgcgct ctacaaagca ttgacgcaga ttcggccgca cgtcgctgtc atgaacttcg 17640 atatcgcgca gtggctccgt tactatccgt cggccgcatc gatgtccctg ctggccggca 17700 tcgcacccgc ggccgcggac accaaaccgg cggccgacat gcgcagcgag ctcctggcag 17760 ttccagccgg gcggcagcgc cgcgcgcggc tggaaacgct gctgatgcac gaagccggac 17820 acgtgctgcg cttcgatcca gcgaaactcg acggcagagc gacgctgggt gatctcggat 17880 tcgattcgtt gatggccctc gagtttcgca accgtctgga agccgggctg cgcgtcaagc 17940 tttctgccac cctgatctgg cgttacccga cattctccgc cctggcgcag catctcgccg 18000 acaagctcgg cctgccgctg gaaagcatgg ccggcaatgc tgaaccttcg accgttgctg 18060 ccgttgctac ccttgctacc gttggcaccg ccgcgggcga ggaccggagt cccgccgctg 18120 cagacgatct cgacgccgtc gcaaaccaga tcgccgggtt gggggacaaa gaaatcgaag 18180 ctttgttgaa acagaagttc gctcattttt caggagcctc cgagtgagtt cgatatccga 18240 gcgattcccc aaccttacgc cgttgcagca ggcgtacctg acgctggagc acatgcagcg 18300 acgtctçgat gcggccgaac gcgacgcgcg cgaacccatc gcgatcgtgg gtctgggctg 18360 ccggtttccg ggcggcgatg ggcccgatga gttctggcag atgttgcgca gtggagtcga 18420 tgctattcgt gaggtaccgc ctggacgatg ggacgaggag tcggtccggc gcatcctgaa 18480 atcgttgaac cccgccacgc cggtgaagat tcaagccgga tttctcgatt ccatcgatgg 18540 tttcgacaac gattttttcg gcatttcgcc acgcgaggcc gtcagcattg atccgcagca 18600 gcggctgctg ttggaagtgg cgtgggaggc actggaggat gcggggcaga cgatggaagg 18660 gctctccggc agccgcacgg gcgtcttcgt cgggatccac agccaaagca gcgactattt 18720 ctggatgcag accgccgatg gcgcgcgcat cgatccgtat accgccaccg gcacggcgca 18780 tagcgtgatc gccggccgac tttcctattt gctgaacttg caaggaccca gcatcgcgct 18840 cgacacggcc tgctcgtctt cgctggcggc ggttcatctg gcgtgccaga gcctgcgcag 18900 cggcgagtgt acgctggccg tggccggcgg agtgaatctg cgcttctcgc cggagtttat 18960 gtacgccacc tcgaagatgg gaaccgcctc gcccagcggt cgctgccgcg ccttcgacgc 19020 ggcggcggac ggcatcgtgt tcggagaagg ctgcggcgtg gtggtgctga agcgcctgtc 19080 cgatgcactc gcggccggag accgggtgtg ggccgtggtg cgcggctccg cggtcaatca 19140 ggatggccgc tcggccgggc tcaccgctcc caatgtcgtg tctcagcagg tcgtcatccg 19200 gtcggcattg gccaatgcgg gcgtcgcggc gcagcagatc ggttacatcg aagcccatgg 19260 cacggggact ccgctcggcg atcccatcga gatcgaggcg ctggcggaaa ccgtcggcct 19320 cccgcgacct gtcggcgatg tgtgcgcggt cgggtccctg aaatcgaaca tcggccacct 19380 ggagggagcg gcaggcatag cgggattgat taaagcggtg ctcgcattga gtcacgagac 19440 gataccgccg agcttacacg tgagacagct gaacccgaat atccggttgg agggaacgtc 19500 gctcgacatt gtgaaggaag tccggccgtg gcccgcgggt tcgagacgaa ggtttgcggg 19560 cgtcagcgcg tttggttggt ccggcacgaa cgcgcatgtc gttcttgaag aagcggcgcc 19620 gactggtaga ggcgaagctg cgagcgggtt ccattcccga ccccccgccg ccgctgcgcg 19680 ggcggctgtc cccctcgcgg agggggacac tgggggcact cccgacattg caggcactcc 19740 cgacactgca gacactcccg acactgcaga cactcccgac attgcaggga ctgcaggcac 19800 tgcggcaact acgggcattg cagacgcgat gtatgtgctt ccgctgtccg cgcatggtgc 19860 ggacgaactg cgtcgggtgg cgcgggcata cggggaattg ctgacagcgt cgcacgcacc 19920 gagcctgcgt gatctttgct acacggccgc agtccgccgc acgcatcacc gatgccggct 19980 cgctgtttcc ggcagaacgg ctgaagaact ggcggcgcag ctccagggga tcacgatccc 20040 ttcccagcga cggaagacgg tattcgtctt ctcgggacag ggatcgcaat ggatcggaat 20100 ggggcgcagc tggatggacc gcgaacccgt tattcgcgag gcgttggaac gctgcgaggc 20160 cgccatgcgg ccttatgtgg actggtcgct gaaagaagaa ctggcgaagc tcgaccgcgt 20220 cgaggtcatt cagcctgcgc tcttcgcgct gcaggtcgcc atcgccgcat tgtggcgttc 20280 ctggggaatc gagccggatg ccgtcatcgg gcacagcatg ggagaggtcg ccgccgctca 20340 tgtcgcgggt gcgctgacgc tgcaggatgc ggcgcggatc atttgcagcc gcagccggct 20400 gttgagccgg atcagcggcc tgggcgggat ggcgatggtg gagctgccgc tcgcggaatg 20460 tgaggccgtg ctgtcgactt acacggaacg actatcgccc gcggtgtcga acggacccaa 20520 ctccaccgtc atctccggtg aagtcgaagc cctggccgag gtcgtcgcga cgctggagcg 20580.
gcgaggcgtg tcttgccggc cggtgaaagt ggacttcgcc gcgcatagcc cgcaagtgga 20640 cccattgtgc gacgaactcc tgcagtcgct cgacgggatt caaccgcggc ccgcgaccat 20700 acctttttac tccacggtga ccggcgcgac gctggagacc accagcctcg acagcacgta 20760 ctgggctcgc aatctgcgat cgccggttct gttctggcag ggcatccgcc atcttgccga 20820 cagcgggcac gatgtctttc tcgagatcag ccctcatccc atcctgctgc ccgccatcgg 20880 cggcaatgcg gcgctggttc cgtctctgcg ccgcgaccag gacgaacgcg gttccatgct 20940 cacgtcgctg ggcgccctct atgaggctgg gcacactgtc gcatggcgga ccgtgtaccc 21000 ttccggcaat tgcgtgcgcc tgccccggta tccctggcag cgtcgtcgtt tctggctcga 21060 cgcttccccc gcgcgacacg cgatcacgtt gggcaatccg ctgttgggaa aacgcgtcga 21120 agcctcgacg caacccggca ctttcttctg ggagacggaa ctcagtctcg cttccgtgcc 21180 ttggctggca gaccatcgcg tgcagggcga agtcgtcttg ccggctactg cgtatctcga 21240 tatggctctg gccggaactt ccgagacctt cggtgaaagt ccgtgcgtgc tggagcatgt 21300 gactttcaca cagatgctca ttgtgccgcg cgacggcagc atgacgttgc agctggccat 21360 cgcggtcgat agacccggga tggcgtcgtt tcggatttcc agccggcagg catcgacatg 21420 ggtcctgcat gcttccgggg acattcgtca gacgcctgcg gatgcatcga ccgtcccgcc 21480 ggattctgcg gagacggtgc aggcccgctg ccccacagtg gtgccggcgg cggagctgtg 21540 gcgtcagatg gcggagcacg gcgtcgagta tggtccggct ttccgcgcgc tcgagcagat 21600 ctggagttgt ccaggtgagg cgatcgggcg tctgcgtagc tcggaaacgc gttccactgc 21660 gccggcgttc ctcgatgcat gtctgcagat catcgccgcg gcgtttggtc ccgccggtgg 21720 aacctggctg cccgccggca tcgaccggat gcgctggctg catcccgcac gttccgtggt 21780 gtggacgcat gcgcggctgg aaggacctat cgccgatctg tcgctgctgg acggagaggg 21840 acaactggtc gcccgcatcg agggtctgcg gctgcagcgc ctggatgcgt cggagcgcat 21900 cgacatgcgc ggctggttgc acgaactgcg ctgggtcgct cagccgcacg ccgctgcaga 21960 gccgccggcg gcgcgagcgg cgcggtcatg gctcattgtc ggcgctgtgg atagcgcgct 22020 caccgcatgg ctgcgcgcta ccggcaaccg cgtgacgcag acctcgccgg aaaagctcga 22080 tgaactccag ccgccgctcg aggaaatcgt gtttttgctc gagcacgaac cctcatgcga 22140 ccgcattctg catctcctcc agaccctggg gcgcacgccc tggcgtcaag caccgcgcct 22200 atggctggtc acgcgcggcg cgcagccggt cgatggacag atcctgcaag ccggtatcgc 22260 tcaggcgcct ttctggggtt tgggccggac cgtgcattac gaacatccgg aactgaactg 22320 cacgctgatc gatctcgatc ccgccggcgg cgaagaggaa ctcctgcacg aactgctgac 22380 gaacaacggc gagaatcaaa tcgcctttcg cggcggcgcg cgttacgtcg cgcgcgtggc 22440 tcggcacgaa gcggatatgc aacccgccat gttcaaggcc ggcgatcggc cgttccggct 22500 cgagatcgat gcccccggag tcctcgaccg gctgcgcttg cgggccacat cgcgccgccc 22560 cccgcaagcc ggtgaagtgg agattgaagt ctgcgccgcg ggcctgaact tcctcgacgt 22620 tctgctcgcc ctcgg.cgtta tgcccgacga tgcgcccggc gcgattgccg gcagcccgcg 22680 cctgggcggc gaatgctcgg gccgtatcgt ggccatgggg aaaggcgtca ccgactttcg 22740 catcggagat gaagtcgtgg cccttgcgcc ttgcagtttc ggtcgcttcg tcaccacgcc 22800 cgccttccgc gttgccttga agccggccaa cattcccgcc gaacaggccg ccgccctgcc 22860 tatcgcgttt ctcaccgccg attacgcgct ctcgcgagcg gcgcggctgg cgcccggcga 22920 acgagtcctg attcacgctg ccaccggcgg tgtgggattg gcggcaatcc agatcgcaca 22980 gcgtgcgggc gcggagatct tcgctactgc cgggagtccg gaaaaacgag cgtatctgcg 23040 ctcgctgggc atcgcgcatg tttcggattc gcgctcgatg gctttcgtgg acgacatccg 23100 caattggacg aatcaagaag gagtagacgt cgtcctgaat tcgctttccg gcgatctgct 23160 ggaggcgagc ttcgatctgc tgcgcgatca tggacggttc atcgagatcg gcaagcgcga 23220 ttactatgcc ggccgcaagc tggggcttcg cccgttcctg aagaacctct cgtacacgct 23280 ggtcgatttg ctcggcatgt ccctgaagcg cccggcattg acccgggagc tgctgcagga 23340 gatggtcgca aaattcgaat cggaaacctg gcggcccctg gaaacgcgag tgacgaccat 23400 caccgaatcg gtggaggcgt ttcgcaccat ggcgcaggcg cggcacatcg gcaaaatcgt 23460 catggcgatg cgagattgcg ccaatgcgcc catcgcaccc ctacgctcgg cgttcgatag 23520 cgagggaacc tacttgatta ccggcggact tggcgggctc ggtcttaccg tcgcacgctg 23580 gatgatcgga cgcggcgccc ggcggctggt gctgctgagc cgccgcgcgc cttcacccga 23640 ggtccagcaa gccatcgccg tcatggacgc agatgtccgg acggtgcagg ccgatgtttc 23700 tcagcgcgat gaactcgagc gcgtgatctc ttccatcgat cgattgcgcg gcgtgattca 23760 tgccgcagcc gttctcgacg atgcgctgct actgaaccag acggaagcgc atttccgcaa 23820 cgtgatggcc gcgaaaatcg acggtgcctg gaacctgcac ttgctcaccc gcgactgccc 23880 gctcgatcat ttcgtgctct tctcctccgc tgcaggactg ctgggcgcgc ccgcccaggg 23940 aaactacgcg gccgcgaacg cctttcttga cgcgctggcc tactaccgga aggcccaagg 24000 cctgccggcg ctgagcatcg gttggggtgc gtggtcggag gtcgggctgg ctgccgcgca 24060 ggacaatcgc ggatcgcggc tggctttgcg cggcatggaa aacctgacgc cgcaacacgg 24120 cctcgctatt ctggaacagc tgctgaacag ctcggcttgc cacgtcgccg cgatgcccat 24180 caatgtccgc cagtggcggc agttctatcc caaggcggcg cagtctgcac tgttcgagct 24240 tttgcatgac gacgcggcga gcgaagccga tgcgccaaac gcgttgcgcg cgcggctgca 24300 atcggccgag cctcagaccc gcaggacatt gctcgaagaa catctacagc agcagctggc 24360 gcgcgtgctg cgcatcgact ctcaaactat cgatcccctg cgcccgctga aggaactcgg 24420 cttcgattcc ctcatggccc tggagtttcg caaccgtctc gaactcacac tgggtctcac 24480 gctccccgcg accctgattt ggggtcatcc cacgctggcc ggtcttgccc cgcacctggc 24540 gtcgcaaatg ggactgccgc tggtcgaagc gcaggccgcg gctgctgcgg aaggagacag 24600 ccgcgccatg aaaactgcac tcagcgggtt ggacgacatg tcggaagaag cagccgtggc 24660 tgcgctccga ggagcaaggt cgtgagggaa aaaattgcgc ccatgtcgtc~ggtcaaactc 24720 gcgctattgg cgcggaacat gcggcaaaac atcgcaggct tcgacctggt tcacgccgaa 24780 cccatcgcca tcgtcggcat ggcgtgtcgt tttccgggcg gcgcgaagaa tccggacgcc 24840 ttctggacgc tgttgaagaa cggtgtcgac ggtgtcaccg aggtgccgcc agaccgctgg 24900 aactcggacc agtactactc ctccgatccc gatgctccgg gcaaggcgta tgcgcgatat 24960 gccgccttcc tcgaacgcat tgacggtttc gatgcggaat tcttcggcat ctccccccgc 25020 gaagctctga acatggatcc gcagcagcgg ctgctgctgg aagtgtgctg ggaagcggca 25080 gaggacgccg gcatctctcc cggccctctg gcgggcagcg cgaccggcgt ctttgccggc 25140 tcctgcgccc aggacttcgg actgtttcag tacgccgacc ctgcccgcat cggagcttgg 25200 tcgggttccg gcgtggcgca tagcatgttg gccaatcgca tctcctatct gctcgacctg 25260 cgcggtccga gcatggcggt cgatacggcc tgctcctccg cgctcgtcgc cgtccatctg 25320 gcttgccaaa gcctgcgccg gcgcgaatgc gatgcggcat tcgccggcgg agtgaacttg 25380 atcctgactc ccgagggcat gatcgctttg tcgaaggctc gcatgttggc gcccgacgga 25440 cgctgcaaga cgttcgacgc cgcagccgac ggttatgtgc gcggcgaggg ctgcggcatc 25500 gtgctgctga agcggctctc cgatgcgctg gccgatggcg atgccatccg tgcagtcatc 25560 cgcggctcgg caatcaatca ggacggacgg agcaatggca tcacggcgcc gaatctgcag 25620 gcgcagaagg cggtcctgca agaggcggtg gccaacgcgc acatcgatcc atcccacgta 25680 tcgttgatcg aggcgcatgg cacgggcacg tcgctgggcg atcctatcga gatcgaggcc 25740 ctgcagtcgg tctacgacgc gccggactct gcgccttgtc tgctgggttc cgtaaagacc 25800 aacatcgggc atctggaggg cgcggcggga atcgccgggc tgatcaaagc cgtactcgcc 25860 ctgcagcatc gcaccattcc tccgcacctg cattttcgcc ggctgaatcc gaacatctca 25920 ctggacggca gccggtttcg catcgccacg gaatcgtcgc cgtggacgtc ggaaggacgg 25980 ccgcgtctgg ccggcgtcag ctcgttcggt tttggaggga gcaacgcgca cgtcatcctc 26040 gaagaggcgc ctgcactccc tttgccgaag ccggtcacac gcccgcagct tctcactctg 26100 tcggcgcgca ccgacgaagc gctcggcgaa ctggccggcc acttcgcgga gttcctgcag 26160 tcgcacccga atgcgttgct gtccgacgtt tgcttcacca gtcaggttgg gcgcgacgca 26220 tatagtcacc gcttggcgat caccgccgca gatgcggcag aggctgtagc ggcattggcc 26280 gcggcgccgc ggcgcgaagt atcgttgcgc cggcggccgg caatcgcttt tctcttcacc 26340 ggccagggcg cgcagtacgc cggcatgggc gcagagcttt ataaaacgca gcctgttttt 26400 cgcgacgcgc tcgatcgttg cgccgattgg ctccgtcccc agctcgatgt tccgctgacc 26460 gttctcttgt tcgagtcggt ttcgccgttg cacgagacgg cgtataccca gccggcaatg 26520 tttgccctgg aatgggctct ggctcagttc tggctgtcgc tcggcgtccg gccggactac 26580 gtgctgggcc acagtctcgg cgagtatgtt gcggcgtgtg tggccggcgc ctttagcgtg 26640 gaggacggcc tgcggctggt gaccgccagg gggcggctgg tcaatgcgct tccccgcggc 26700 aaagcggtca tcgttcacgc caatccgagc cgcatcgcgg cgctcgccgc caaggtggca 26760 gtcgccgcat cgaatgcgcc ggaccgcacc gtgatctccg gcacggctgc agaaatcgcg 26820 gaagcgcaag atgacctgca tcgcgccggc gtggaaacgc gagagctgaa cgtatcgcat 26880 gcgttccatt cgccgctgat ggatccgatt ttggacaagt tcgaagcgct tgcaggtgcg 26940 atcgcgtatc agccgctggc gatcccgctg gtgtcgaacg tcagcggagc cgtattgccg 27000 aaaggcacga cactcgacgc ccgctactgg cggcgacagt tgcgcgaaac cgtgcagttt 27060 gaaagcgcga tgcgaaccct ggcggaccgc gagtgcaagc tgtttctgga aatcggcccg 27120 catcccacgc tcaccacgct ggggcgatat tgtctgcccg atgacggcgc ggtctggctg 27180 cactccctat ctaagggacg atcggattgg tccgtgctgc tggaaagtct tggcggcctg 27240 tttaccgcgg gcgtgaatcc cgactggcgc ggtctctatg ccggggaatc acccagccgc 27300 gtcgcgctgc cgacgtatcc gtttcagcgt gacaccttca gcctgagacg cgtacccgcg 27360 agagagccgg cgcgcggcgg catgttggga gcgcgcctca acagcgcgtt gggcgatgtc 27420 atcttcgaaa attcgctaac cacggagacg cctctgctcc atgagcacgt gatctacgac 27480 gcggtcattg tgcccggcgc ctggçacgtg tcggcatttc tcgaagcggc acaggaagtc 27540 ttcggtccgg ttccctgcgc cgtctccgat gtcatgatgc ggcaggcact ggccatcccg 27600 ccggatacgc cggtcacggt gcaagcgatt gtcacaccc,g gcgaggacgg cgaagcaaag 27660 gtgcaggtct tcagccagga tggcgattcg tggaagctcc acacggcagc cagtctgcgc 27720 gcggcgactg ccggcgccgt tcatttcgag ctgccggcgc agccttccga agtcatttcc 27780 ggcgatgcgt tctacggcgc gatgaacgca cgcggcgtcg atcttggccc cgccttcagt 27840 tgggtggaag aagtctggcg tcgcgatggc gaggcgctgg ggcgaatgcg tctgccggtg 27900 gctgaggatg gcgcgaacgc ttaccggctg caccccggcc tgatcgattc ttgttttcaa 27960 gtattcggag cgacttggcc cgcggagcgt tgccagcccg gcgcatacgt gccggtcggg 28020 atcgaagcgg tgcgcttcta ccgtccgccg gcaggttctc tgcgctgtca tgcgcgtctg 28080 cgcccgagct cgagcggccc gttcgtcggt gatctgacgc tggttgaaga gaccggcgcg 28140 gtcatcgccg agttttccgg actggctgta atgcatgccg gtacgctgca atccgcacag 28200 tcgtggctgc aggatgtgca gtggcaggag tgcgagcgat cgacaacgtt gaagtccgac 28260 ggccctggca agccggagga ctggttgctg tgtgccggcg cagacgatgt cgccggtttg 28320 atgccgcaag agctgcgcgt cgtgtccggc gtcactctcc gccaggcgct ggaacagacc 28380 cagactttgg tcggccgccc ggcgcggctc tggctgatca cgcgcggcgt gcatcgcatc 28440 agtgatgacg atgcgactcc cgtcgatcct ttccaggctc cactgtgggg actcgggcag 28500 gcgatcgcgc gcgagcatcc cgagctgtgg ggcggcctga tcgacctcgg ttgcgacaat 28560 gccgacatcg ccgccgccat gctgctggat gaaatccgtt atgccggcga cgacaaagcg 28620 atcgcattgc gcaacggacg ccgctacgtt cgccggctgg tgcggcacaa ggaaacgtcg 28680 aagcggccgc ctgccatttc agccgacggc gtctatctga tcaccggcgg tctcggcgca 28740 ttaggacgaa gggtggcacg ccgcttgatc gagcaaggcg cgcgccgtct ggtactggtc 28800 ggccggcata cggaggcagt tgccgatctc gagcaactcg gggctgcagt catggttgct 28860 gcttgcgatg tgagttccga gcaacagctg gcggcgctgc tggcggaccc gcgcacccag 28920 ccgctgcgtg gagtcgtgca tgccgcaggc gtgctcgatg acggggtagt tacagaacag 28980 acgtgggctc gtttcgagaa ggtgctggcg ccgaagctgc agggtgcctg gaatcttcac 29040 cagctcactc gccaccatgc gctcgacttt ttcgtactct tctcttccgc cgcttcgctg 29100 ctcggttccg ccggacagag caattactcg gcggccaacg catttctcga cagccttgcc 29160 cacatgcgcc gcgcgcaagg actaccggcg ctgagcatca attggggacc atgggcgggc 29220 gaaggcatgg ccgcgcgcat cgcgcggcaa ggcctgccgg gggtaccgct gctgccgccg 29280 gaagtgggtg cgcgcatctt cggcgatctg ctgggcgaga ctgccgctca gatcgcggtg 29340 ttccaagtct ccgccgaaaa aaggcggagc ccggcgagcg atcccggctt catccagcaa 29400 ctcaccgaag ctgcgccgga gcggcggcag gaactgctgc agatgcgcat ccgcaagcag 29460 gccggcggcg tgctggcgct cgatgcgtcc aagacgctcg acccgcgccg gccgctcaag 29520 gaatacggac tcgattcgct gatggcgctg gatctggcgc gcgccatcgg agagctggtg 29580 cgcaagagcc ttcccgcgac attgctatac gaccatccga ccgtcgagaa attggccggc 29640 catgtcctcc gcgaactcgg actcgacgtc cccagcgatt ccctcgtcga tgaagtgcgg 29700 cagctgtccg agcaggagat ggcggcgttc atcacggaaa ccttgcacca tctgggagag 29760 gaacgatgag cgatctcact cctcttcaac aggcggtcct ggcgctcaag cgcacgcgag 29820 cgcgtctcga cgaactggag agcgtccaca acgaacccat cgcgatcgtc ggcatggctt 29880 gccgctttcc cggcgcggac tcgccggaag cattttggca gctcctgcac gatggcatcg 29940 atgccatccg cgaaattcct gcgggccgtt gggatgccga tgcgttttac gatcccgatc 30000 ccaacgcgcc gggaaagatg tacacgcgtc tgggcggatt cctcgatggt gccgtcgacg 30060 gcttcgacgc cggcttcttc ggaatcacgc cgcgcgaggt cgccggtctg gatccgcagc 30120 agcgcctgct gctcgaggtg gcatgggaag ctttggagcg tgcgggtcgg ccgcccgaca 30180 gtctcgcggg cagcgaçacc ggagtgttca tcgggatcag caccgacgac tacagccggc 30240 tgaaacctac cgatccggcg ctcattgacg cctataccgg taccggaacc gcgttcagca 30300 ctgccgccgg acggatctcc tatctgctgg ggttgcaggg accgaacttc cccgtcgaca 30360 cggcgtgctc ttcctcactc gtggcggttc atctggcgtg ccgcagcttg cagtcgcgag 30420 agtgcagcat ggcgctggcc ggcggcgtga acctgattct ggcgccggaa agcacgatct 30480 acttctgccg cctgcgggcc atggcggccg atggccgttg caaaagtttc gctgcctccg 30540 ccgacggtta cggccgcggc gagggatgcg gaatgctggt gctgaagcgg ctgtccgatg 30600 cgacgcgtga cggcgatcgt attctggcgc tgattcgcgg atcggccgtc aaccacggcg 30660 gccgcagcaa cggcctcacg gcgccgaacg gtccggcgca ggaagccgtg attcgggcgg 30720 cgctcaagaa cgccggcatg gcccccgccg atgtcgatta cgtggaagcc cacggaaccg 30780 ggacgccgct gggagatccc atcgaactgc gggcgatggc agcggtgctg ggcgaggggc 30840 gtgccgtcga ttctccgttg atcgtcgggt cggtgaaaac caacttcggc cacctggagg 30900 cggcggcagg tatcgccggc ctgatcaaga ccattctcgc cctgcagcac cgagagattc 30960 cgccccatct gcatttcaac gcgcccaacc cgcacgtact ctggaatgag ctgccgctaa 31020 agatagccac cgcatgttcg ccatggccct ccaacggccg cccccgagtt gccggggtga 31080 gctcgttcgg aatcagtggc accaattcgc acgtcgtcct cgcagaagcg aagacgaatg 31140 tagaagcgaa gacgaatgta gaggcgaaga cgaatgtaga ggcgaagacg agtgaagagg 31200 tcaaggcgag tgtagaggcc aaagggaatg tggaggctaa ggctagtgct agtgtccccc 31260 tcctcgaggg ggacagccgc ccgcgaagcg gcggcggggg gtcgggccgg ccgcccagcc 31320 gcgaggaagt gccggtcccg gatcaactcc atgccgaaga cggccgcgaa tacctcctac 31380 cgctttcggc gcgccatccg caggctctgc gcgatctcgc cggcgcctat cgcgatgggc 31440 gctttcacgc tccgctctcc gcgctgtgtt ccgccgccag cctgacgcgc agtcactacg 31500 aacatcgcgc agcgtttgtg gcctcatccc tgcccgagtt caatcaattg ctcgaggcct 31560 tccggcgcaa tgaaaccaat cgcggcgtcg ccaccggttt cgccgatccc ggagttcgtc 31620 cgaaactcgc cttcatcttt tccggccagg gcggacagta cccgcgcatg gcgtatcgcc 31680 tgtattccga cgagcctgtc ttccgatcgg cgatcgaacg ttgcgacgcc gccttccgca 31740 gcttcgtgga atggcggctt gcggacctgc tcgccgacga gtcgggagca tggctgagcc 31800 agatcgatcg cgtgcagcct gcgctgttcg ccgttcaaat cgcgctggtc gaactgctgc 31860 aatcctgggg aattcgcccg gacggcgtgg ccggacacag catgggagaâ gtggcggcgg 31920 cccatgtcgc aggcattctc accctggagg acgcggcccg catcatctgt cgccgcagcc 31980 ggctgttgct cggacttcgc ggccggggag cgatggctct ggtcgaactg ccgctcgatc 32040 gggcgaaggc cgtgctcgct gaacgcggtc tcactactgt ttctgtcgcg gccagcaacg 32100 gaccacgcag cacggtgttc tcgggagacc gtgtggctct cgagcatttg aaggacgact 32160 tcgagaggcg cggcgtcttc tgccggctga ttcaggtgga tgtcgcttca cacagctcgc 32220 aggtggaccc gctcgagaac gaattgcgcc aggaactcgg ccgcgttatt gcaaaacgtt 32280 ccgccgtgcc gttcttctcc acggttgaag gacagttgag cacgggcgag gcgtgcgacg 32340 cgtcgtactg ggtagccaat ctgcgacagc cagtccgttt ctgggagtcg ttgcaggcga 32400 tggctggtga tgagttcacg cagttcctgg agatcagtcc gcatcctgtg ctgacgccgt 32460 cgatcgagga tagtctgcgg acgctcggca taaacggact ggttcgcccc gtactgcgcc 32520 gcgacgaacc ggagcggcgt gagctgctcg agttgctcgc cgcgctctac gtgaatgggc 32580 agcgtccgga ctggcgcgcg ctcgcttcgt ctçccgacac gcgcctggat ctgccgacgt 32640 atccctggca gcgcgagcgc ttctggttcg cgacctcgac gcggcgaagt ttgccggcag 32700 ttggcggtca tccgctgctc ggtcgcaagg tcgagattgc gctggcgccg gacacacacg 32760 tctgggagtc cgtgctctct ctggatgcgc tgccgtttct cgccgatcac cggctcaacg 32820 agcttgtggt gcttcccggt gccgcttatg tggagatggc gctggccgca gccaaggaag 32880 tgttcgcggg tggctgcagc ctggaagaga tccggtttga acaaatgctg gttgttcctt 32940 ccgcgggcgc ctcgcgagtg caggtcatac tcgagggaca cgcattccgc atctccagtc 33000 tggccgaagg cggttccgat tggaccgagc acgcgcgcgg caccatggct gcggcgccgg 33060 acaaggtcgc gcccacggtg agcctgccca cacttgggga tcgcatcgag ggcgatgact 33120 tctatgcggc cttcgcatcg caggggatgc attacggcga caccttccgc ggcatcgcgg 33180 aagtgtggcg gcgcgaçggc gaggcagtgg cgcgactgag cgtgccggat gccgttcgcg 33240 aagcagagtc cggttacacg cttcatcctg ccttgctcga tgcctgtttg caggtgctgg 33300 gcgcgacgct tggcggcgaa ggcagcgccg gtccttgcgt gcctgtcgcc atcgaacggt 33360 tgcactgttt cggcagaccc gccggcgatc ttagggtgca tgcgcggctg acggggcggc 33420 tcgagggcga tgtcaccctg tgtgatgcgg aaggccacgt catcctcgag gtccaaggcc 33480 tgcgtgccca ggaactggag cgccaatccg aatggttcca cgctatggaa tgggagccgc 33540 agctgctggc cgagagtcca acggcaacgg tgtcgggtgc atggctggtc attgccgatg 33600 ccggcggcat cgcagccgcg gtggcgcgag ggctgggcac aaacacggtt gtgatttcgg 33660 gtcgcgatgc cgagataccg gatcagcctt accggggcgt cattcactgc gggagcctgg 33720 atgagaccga ggatgagacc gatccgtcgg ctgcgggggg aaccgcctgc gaagacattt 33780 tgcgcatcgt tcaagaattc ggagtgggac gcatacagct gacgaaacaa gcgtccgacg 33840 ccgaatcgca gcatccgcga atctggctga ttacggcggg cgttcatgcg gagcatctgc 33900 agatgccggt ggtgcccgcg cgggcaccgg tgtggggtct gggacgtacc atcgcggccg 33960 agcatcccga gttcgcttgc acctgcatcg atctcgacac tgccggtgaa gtcgaggtgc 34020 aggcgctctg ccgagagatt ctcgcgggga gttctgaacg tcagggcccg g 34071 <210> 115 <211> 4615 <212> ADN .
<213> bacterie <400> 115 actgcagtgc ccggaatcgg cggtggactt acagcagccg ctggtgcgta tgggattgga 60 ctcgctcatg gcggtgcaat tacgcaaccg gatcgatacg gatctgcgcg tcttgctgcc 120 catggtccga tttctagacg gccccagcgt tgcggaactg gccagggatc taagcgatct 180 aagcggcctc agcgaacgca cgacggtggc gccggaacct gcggcgcagg cctcggttcc 240 tgccctctcc taccctctca gcgccggcca gcaggcgctt tggtttattt accgaagcgc 300 gccggaaagt cccgcataca acatcgcgtg gatçgcgcgc gcgagaggcg ctttcgatcc 360 gcaggcgttg cgccgttcgc tgcaggacct ggtggatcgt catccggcgc tgcgaacgac 420 gattgcggag agtggcggcg cacccgttca aacggtccac agcagcgtcc cggtggattt 480 cgaagtgatc ccgtgttcgc cggacgatga ggcggtgctg atcgacggcg tcttccacgc 540 gcccttcaat ctcggcgaaa actgtttccg ctcgcgtctc ctggtgcagt cggggaagga 600 tcaggttctg gccatcgtgg tgcatcacat cctcgccgac ttctggtcac tgctggtgat 660 ggtggatgaa ctccgcagta tctacctcgc gaggacagct ggcggtccgc ctgtcgcgcc 720 gccggtcgcg agcttcgccg ctttcgtccg ctggcagaac gaactgttgg ccggaaccga 780 gggcgagcgg ctttggaact actggtcctc gcagctttcc ggccagcttc cggttctgaa 840 tctcccgtcg gatcgtccca gtccgccggt gcagagtttc cggggaaact ctcactcgtt 900 ccgaatcgaa cccgcgctga ctgcgaaact gaaggcgctc gcgcggcggc agaacgcgac 960 gctgcatgcg acgctgatgg cggcgtttca agtgcttctc tcccgttgga cctcacaaga 1020 agagatcctg accggcaccc tcaccaacgg tcggacgcaa ccggaattcg ccgatctcgt 1080 cggatacttc gtgaatcccg taatcctgcg aggagaactt tcaggcgatc cggatttcaa 1140 tacggtgctc gcccggattc ggcaaacgct tctcggcgcg atcgagcacc aggagtaccc 1200 gtatgcccgg atcgtggagc ggttgggtcc cggactgcgg gttctattcg tgctccagca 1260 gcctcatcgc attcccgaat ccgtgccgtt catgttgggt cagtccggcg gtcgcatggc 1320 ctggggcagc ctcacactgg agtccctggc gatgccgctg cgacagagcc ggtttgacct 1380 ggatctgatg atggtcgaaa ccgatggagg cctctccgcc tttctgcaat acaacacgga 1440 catttttgat gctgccacga ttgaacgtct ctccttgcac ttcgccgtgc tgctggaagg 1500 aatcgcggag aatcccgcct gtccagttgt cgatctaccg ctgctgacaa cccgggaacg 1560 catccagctg ctcgaagagt ggaatgcgac cgccgcggaa ttcccgtccc aatgcgtgca 1620 cgagctgttc gaagctçagg tggagttgac gcccgacgcc atcgcgttga gcttcggtga 1680 gcagaatctg acatatcgcg aactcaacgg gagcgccaac cggatcgcgc actatctccg 1740 ctcgcgcggc gctggacccg gcgaaatggt tggcatccat gtcacgcggt cgctcgaaac 1800 cgtcgcaggg ctgttgggcg tcctgaaggc cggcgcggcc tacgttccgc tggaaccgga 1860 atatccggcg caacgtcttc ggctgatgct ggaagagacc aggccggtcg ttgtgctgaa 1920 tgtcacggaa tcggaagtat ggacgcagcc cgacaccaat ccgaacccgc tcgcgactcc 1980 cgccgatctc gcctatgtcc tgtacacctc cggttcgacc ggccggccga aaggcgtgca 2040 aatcacacac caggccgtcg tcaattttct ttcgtcgatg cggcatgagc cgggcatcag 2100 cgaccgcgat acgctgctcg ccctcacgac gttcatgttc gacatttccg cgctcgagat 2160 ctttttgccc ttgagcgccg gcgcgcgcgt cgtggtggcg aaccaggaga cggccgtcga 2220 tggtgagagg ctggcgaggg aactcgcgcg cagcaaagcg acaatgatgc aggcaactcc 2280 cgccacctgg cgtctgctgc tcgcatccgg ctggcccggc gaccgccgcc tgacggcgct 2340 ctgcggcggt gaagcccttc ctcgcgatct tgccgaccgg ctcctgcaac gaaccgcggc 2400 gctatggaat ctttacggac ctaccgaaac gacaatttgg tccgccatcc aacgggtgac 2460 gacaggtgac ggaccggttt cgattggccg ccccatcgca aacactcagc tctatgtgct 2520 tgacgatcgg atgcagcccg cacccatcgg tgttgcgggc gaactgtaca tcggcggcgc 2580 cgggctcgcc cgtggatacc tgaatcgtcc ggaactcagc gcggacaagt tcgtcgccaa 2640 ttcgttcgac cctcatggca ctcggctgta tcgcacggga gatctcgccc gccgccaacg 2700 cgacggcgcg ctcgagtatc tcggccggat cgaccaccag gtgaagatac gcgggttccg 2760 catcgaaacc ggcgagatcg aggccgcggt ccgcagtcac ccggcggtcc gacatgctgt 2820 ggtcaccgcc agagaaaatg acgcggccgg taagtatctg gcggcctaca ttgtccccct 2880 tgctgacggg catcgcgcga cggcagccgc cgacacattc cacgaccgag tcgagtccga 2940 gcacgtgacg cagtggcaat ccgtctggga caccacatat gaacagaatg cgccgaacgc 3000 ggatccggag ttcaacatcg tcggctggag aagcagtgtt accggagagc cgattccagc 3060 tgccgagatg cgggagtggg tgcaggattc cgtcgatcgc atcctggcct cgcggccgcg 3120 tcgcgtgctc gagattggct gtggtacggg actgctgctc ttccgcgtcg ctccccactg 3180 ttcggagtac tgggccacgg acttttcgca gaaggcgctg gactacatcg ccgctcacgc 3240 ggaccgcacc ggcctggcaa atgtccgcac gttccggcag gcggccgacg acgcgtgcga 3300 gatcgacagt cgctcgtgcg atgcggttgt tctgaactcc gttatccagt acttccccgg 3360 cgaagcgtat ctgcggcgcg tgctggccga ggcggtgcgt gtggtcaaac cgggcggcat 3420 cgtatttgtc ggcgatgtcc gcagtctccc gctgctggag acgttttacg cttctttaga 3480 agttcagcgc gcacccgcgt cgttgacccg gaatgagttt cggcaacgcg tgcgttcgct 3540 cgcgtcgcag gaagaggaac tcgtggtcga tcccgcgttc ttctttgctc tccgcgaaca 3600 gattccggag atcggccgga ttgaaatcct gccgcgtcgc ggccggtcgc ataacgagct 3660 gacccgcttc cgctaccagg cgatcctgca tatcggatcg cgggaagcgg aggagccgga 3720 atcggatcgc aggcgttgcc agaccgcggc cgaaatacgc agagtactga cggacgctca 3780 gccggagttg gccgcattta ccgagattcc gaacgcacgg ttgaccgccg aaagcgccat 3840 tgtgacctgg atgaacggtg acgaagctcc agagacactc ggggagttgc gggaccggct 3900 gcgccagacg tcgccttccg gcgtcgatcc cgccgatcta tggcgtatgg acgaagacct 3960 gccgtaccgc gtggcaatcg actggagcag tcatgggcca cacggacgct tcgacgcgac 4020 cttctgccgt gcggcggccg gtccgccggc ttcccgtccg cgacgccgcc tggccggccc 4080 gtatacgaac gatccgctgc gagccgtcta tacgcgcacg gttgtgccgc agttgcgtac 4140 tcatctgaag gagaagctgc ccgactacat gatcccgacc gcgtgggtcg tgctccacga 4200 aatgccgctg acgcccaacg gaaaaatcga ccgtaacgcc ctgcccgatc ccgagcccag 4260 ccggcgagcc cacgccgaag cattcacgcc tccggaaact ccggtggaac aggtactcgc 4320 ccacatttgg ggcgaggtgc tcggcatgga tggcatcggc gtccatgatc acttcttcga 4380 ctctggagga cattcgctgc tggtcacgca gatgatcgcc cgcgtgcgcg acatgctcca 4440 cgtggaagtg ccctttcgaa ccgtgtttaa cgcccccacg gttcgaggct tcgccgtcgc 4500 tattcaggac ggcgtagacc caggatgggc aaggcgagcc gccgatttgc tgatcgctgt 4560 ttcccaaatg tcagatgttc aaatcgagcg tatgatgagc gccgcccaag actag 4615 <210> 116 <211> 8301 <212> ADN
<213> bacterie <400> 116 atgcagaatt cgtcgccaaa taccatagac ctctcgctcg cccgccgcca attgctcgac 60 cgtctgctgc aggaaaacag ccccgaacat cgcatcccgc ggcgtgaaaa ccgggatgcc 120 gcacccttgt cgctggccca gcagcggctt tggtttctcc atcagctcga cccggattct 180 cccgcctaca acattcccat agcgctgcat atccgaggtc cgctggatat tcgcgtcctc 240 ctgcggagtc tggaggccgt ggtgcagcgg cacgagagcc tgcgcagctg cattggcggt 300 gtggatggag aggcgcgcca gagcctcctg gcgcgagtga cactggaact tccggttgtt 360 caggctgacg gaatcgcaga agcgcggcaa atggccttgc gtgatgccca gatcccgttc 420 gacctgcgaa aacccccgct tctgcggacc aagctgatct gcctcgatga caagcagcag 480 attctcctgc tgacgttgag ccacatcatc gcggatgcgt ggtcggtcga gacgttcgtc 540 cgcgacctga cgcgatcgta cgaagcgttc gtgcaggggc ggccatcgcc gctcatggaa 600 ctgccgattc agtatggcga ctgggccgtc catcagcaga cgtcgctgaa ccaaaccgcg 660 cagcagtact ggaagaaaca gctgtcgggc accttgcctt tcctcgacct tcctaccgat 720 cgcccccggc ccgcgcagca gacctggcgg ggcgccgtgg agaccacagc cctcggccgt 780 gatttgaccg atggactcca cgcgtttgcc ttgcgtgaag gagcgacggt gttcatgacg 840 gcaatcgcgg cgtttcaggt gctgctgcat cgctataccg cgcaggaaga catccttatc 900 ggggttccag tcgcgggccg tacacaacga gaaacggaag gtctcgtcgg ttgtttcgcc 960 aacatgatcg tcctgcgcgg cgatctgcgc gacgatccgt cgtttcgcag tcttctcgcc 1020 cgcacccgcg acaccgcttt gagcgccctc tctcatcagg actttccttt cgaacgcctg 1080 gttgaggaac tgcatcctcc gcgggacctg agccggtcgc ctgtatttca ggtctccttc 1140 gcgctgctgc ccgatgcgcc ggccatcacc gtcatgcctg ggctcaccat ctcgcgcgag 1200 tacatgcaca acggcggatc caaactcgac ctcggcgtga ccctcgagcc atccggcgat 1260 ggactgatgg cgtccgccga atacaacacc gatttgttcg atgcggcaac catcgcctcc 1320 ctgctcgatg cgtaccgaac cctgctggcg agcgtggtga cggatcccga cgtccgcatt 1380 tcaaccgctg cgctgttgtc ccccgcggtc cgaagccgga tgctcgagca gcacaatgcg 1440 acacggcgcg atgccggtcc gaacgggtgt gcgcatgaac tggtcgaagc tcaggcggaa 1500 cgcactccgc acgccgtcgc cgttgtcttc gaagaccatc agttgaccta cgccgagctg 1560 aatgcgcggg ccaaccgcct ggctcatcgt ctgagcgcat ccggcgcggg cccgggaaag 1620 atcatcgctc tggcgatgga gcgctcgctg gagatggtga ttgcgctgct tgcgattctg 1680 aagtccggca gcgcgtacct gcctctcgat cccgcgcacc ccaaggatcg tctcgcccgg 1740 attctcgatg aagtgcaacc gcacgcggtc ctcacgcagg aggcggtggc tgagatgatg 1800 gcgatgatgg cgatgatggc ggtcgccgtc gaaccagaag ctgcgaatct cgtcagcggc 1860 agcaagcccg acgatctcgc ctacatcata tatacctccg gatcgacggg gcgaccgaag 1920 ggcgtggaga tccgccactc gtcgctagtc aatctgctgc gctccatgca gcgcgagccg 1980 ggtctgacag ccgccgatgg gctggtcgcc gtcaccaccg tgtcattcga tattgccgga 2040 ctggagatct ggctgccgtt gatcaccggc gcccgcgtca tcgtcgccac ccgcgagatc 2100 gtggttgacg gcgagcggct caccaccctg ctggataagt cgggcgctac ggtcatgcag 2160 gcgaccccga gcggttggcg gcaattgctg gattcgggct ggaagccggg taaaggcttc 2220 cgtgttttct gcggcggtga agctctgccg ccggaactgg cgcgccgcat tctcgatagt 2280 ggcgtagagc tgtggaatct ttacggaccg acggagacca ccatatggtc ggccgtgcac 2340 aagacacaaa gactgggtgc ctccgatagc atcgtgccga tcggccatcc catcgacaac 2400 acgcagttat acatcctgga ttcgcgcatg gagccggttc cccccggagt tccgggagag 2460 ctgtacatcg gaggagcggg actggcgcgg ggctatcatc gcaaccccga gctcacgcgt 2520 gagaaattcc gcgagtggcg tgatcgagga cgcatttact ctaccggcga tctggctcgc 2580 taccgttccg acggcgcagt cgagtgcctg ggacgagtcg atcgccagat caagctgcgc 2640 gggtttcgca tcgaaccggc cgagattgag gccgcgatcg agacgcacat tgccgtgaag 2700 caggcgatta cggtcgtgaa ggacgatcgg ctgatcgcct atctcgttcc ggcaacgggc 2760 gacgtgcgcg atctgcagag cgatttgcgg tcgtggctgg caacgcgcct tcccgattac 2820 atgatcccct cggcgtttgt cagcctgtcc tcccttccgc tgacgcccaa cggcaaaatc 2880 gacgcgaacg cgcttcccgg tttgcccaca acgccggttg ctgctcgcga gccgatgcgc 2940 ggcgatgtgg tggagacgat tgcgtccatc tggcgtgaag ttctgcgcgt ggagcacgtc 3000 gactatcggc agaacttctt tgatgtcggc gggcactcgc taatgctcac acgggtgcgc 3060 ggactgctcg aggagcgcct ggggttgacg ctctccgtcg tcgatctgtt ccggcatacg 3120 acgatcgagt cgcttgccgg cctggcagaa aaatccgaac ccgccgctgc ggaacctgcg 3180 gctgcggtcg cagaagatcg gatcgcagtt atcgggatgg ccggccggtt cccgggggcg 3240 cgcaatgtgg aggagttctg gcgcaatctg cgcgacggtg tggattccat cgccaggctt 3300 tcgccggaag atctgctggc gggcggcatc agcccggagg tcttccagga cccgagctac 3360 gtgccggcca agggtctgct ggacggcatc gagtttttcg atgccgcgtt cttcggctac 3420 agtccgcgcg aagcggagat catggacccg cagcatcgcg tgtttctcga gtgcgcgtgg 3480 gaagcgatgg agaacgcggg atatgcggcg cgaagctata agggttcgat cggcgttttc 3540 gcgggatgcg gcgtcaatac ctacctgctg aacaacctcg ccaccgcgga gccgttcgat 3600 ttctcacgcc cctccgcgta ccagctgctg acggccaacg acaaggattt cctggccacg 3660 cgtgtctctt acaagctgaa cctccgcggg cccagcctga cggttcagac ggcgtgctcc 3720 acctcgctgg tgtcggtggt gatggcatgc gagagcttgc agcgcggcgc ctcggacatt 3780 gccttggccg ggggagttgc catcaatgtt ccgcagtccg tggggtacct gcaccagccg 3840 ggcatgatcc tgtcgcccga cgggcgctgc cgcgccttcg atgagtccgc tcaaggcacg 3900 gtgccgggca acggcgcggg tgtggtcgtc ctcaagcgct tgagccgcgc tctggccgat 3960 ggcgacacga tctacgccgt cattcgcgga gcggctatta ataatgatgg cgccgagcgc 4020 atggggttta ccgctccagg tgtggacggt cagacgcgat tgattcggcg cactcaagag 4080 atggcgggcg tgaagccgga gtccatcggc tacatcgagg cccacggaac agccacgccg 4140 ctcggcgatc cggtggagat cgccgccatc gctgccaact ttccgaaaaa cggaagcggc 4200 gatgtgtata tcggatccgt caagaccaac atcggtcatc tagacgtcgc ggccggtgtg 4260 gccgggctga tcaagacggt gcttgccgtc catcgcggcc agattcctcc cagcctgaat 4320 ttccagcgtc cgaatccgcg aattgatttc gcaaacactc cgtttcgtgt gagtacgcgg 4380 ctgctcgact ggcccgccgg aaagaccccg agacgagcgg cagtcagttc gttcgggatc 4440 ggcggcacca acgctcacgt gattctggag caagcgccgc cggtgacgcc ggccgcagct 4500 gcgcccgaac gatccgcaca tgtgctttgc ctgtccgcca atacagacgc ggccctcgaa 4560 gaactggtgc gctcgtatcg cggccatatg gacaaccagc ccggtttgtc gttcggcgat 4620 gtcgcattca cggccaatgc agggcgcgtg cacttcccgc accgtatctg cattgtggcc 4680 cggtcgagcg acgaggctcg ccaacgactg acggaggcac gacgggttcg catcgcccag 4740 acgcgcccca agattgcgtt tcttttcacc gggcaaggtg cgcaatacgc gggcatgggc 4800 cgccagttct acgagtcgca gccggtgttt cgcgccgcca tggatgaatg cgcagctctg 4860 ctgaatggac ggctcgatct gccggcgctg ttggccgatg acgcgttgct cgacgcgacc 4920 gccggcgcgc agcccgcgct gtttgctttg cagtgggcct tggcgcagtt gtggaagtcc 4980 tggggtgtga cgcccgacct ggtgatggga cacagcgtcg gcgaatacgc ggcggcgtgt 5040 attgccggcg ccgtcagcct gccggatgcg ctcggcttag ttgccgaacg cggccggctc 5100 atgcagaacc tgccggaagg tgcgatggct gcggtcagcg ccggcgagca gcgctgtgcc 5160 gcagcgatca cctcgcgcgt ctccattgcg gccatcaacg gacccgctga ggtcgtgatt 5220 tcgggtgcgc cgcaggatat tgagagcgcg ctggcaactc tacgtgcgga gggcatcaaa 5280 acgcagatgc tggccgttgc gcgcgccttt cacagctcga gcatggatcc gattctggcg 5340 gacctgcaac gccgggcggc ggcgatcgcg tggcgcaatc cttcgatcgg cttggtttcg 5400 aacctcacgg gcaaactggc cggcgaggga cagctggcga atccgctgta ctggcgagat 5460 cacgctcgaa accctgtccg tttcgccgac ggtatccaaa cgctcaagga cgaaggctgc 5520 gacgtgtttc tcgagatcgg tcctaagccg gttctactcg gcatgggcca aaagtgcctg 5580 cccgacgacg ccaagcagtg gctgccgtcg ctgcgtaaag gccgcgatga gtgggagacg 5640 attctcagca gtgtggcgac gctatatcag ggtgggttcg acatcgattg gcaggagttc 5700 gaccgtccgt attcgcgaag gcgtgtcgcc ctgccggcct atcctttcga gagacgccgc 5760 cattggatcg agcggagttc cagaccggaa cctgtagcgg ttgcgagtgg tctcgtcggg 5820 tgccggctgt cgctaccggt ggcagacgtt atcttcgagt cgaaactatc gacggcttcg 5880 cctctactct cagaccaccg atattacggt tcggtggtgg ccccggccgt gtacttcctg 5940 gccatggcgc tcgaggcgtc ggcggaggtg tttggcgccg gccggcacac gctggaaaac 6000 gtgaacttcg cgcaccctct gatcctttca gcggagcgcg acacggctgt tcagctcgtg 6060 ctttcacaga gcgatgaccg gcatgcctcg ttccgcatac tcagcttgtc cgacggctcg 6120 tggaacttac atgctgccgg caatattgcc gcccacgctg gtgtcgctcc cgtgccccga 6180 ctggtcgatg aacgccggcc tgcggtggat ggagacacgt actattcgct gctgcgccac 6240 ctcgagatag aactggggcc gagctaccgc cgcatacagc gcattcattt cggtgaacag 6300 gaagcgctgg ccgcgattga ttccgcaacg ccgctcaatc cccgttgtga attggcggaa 6360 gccggcctgc aattgcttag cgccgcggcg agtcccgcgc ttgcggatgg cgccgaacat 6420 ccgatattcg ctccgctcgg tatcgatcgc gtttgttttt acggcagcct ggagggcgcc 6480 gtatgggggg ccgcgcaaat tctccggcat tcgccggacg gctttaccgg cgaggcgcag 6540 ttgctggact cggagggctg cgttctcggg gaacttcagg gcgtgagttt ccggcgcgtc 6600 actcgcgcat gggcgcagcg ctcggaacgg aagcccgaat tgtatgaggt cgagtggcgg 6660 cccgaaccgc tccgccagcc ttcgcgaacg ctacagcctg gggcatggct gatcctggcc 6720 gacagtggcg gcgcggcccg cgctctggca gatgcgctca cagctcaggg cgagatgtgc 6780 gttaccgtgc cgccagccgg cgagtacatg tccctagtcg gtgagcgtga ctggcgcggg 6840 atcgtcaacc tgtacagtct cgatgattat gagctcggct gccgcagcac tctggccctg 6900 gtgaagtccc tgaagtccgg tccgcggcta tggctggtaa cggccggcgc gcaggcgacc 6960 agtgcggtgc acaatcccat gcaggccgcg ctctggggct tcggccgggt gatcgcgcgc 7020 gagcacccgg atctgtgggg cgggctcatc gatctggatc ccgacgatgc gcatgcttcg 7080 gcggccggcg cggccgcgca gatgcgtgat ttcgacggcg aagatcagtc ggcgtggaga 7140 agcaaccggc gctacgtgcc gcgactgacc cgccgaccca gcgcgcgagc ggcagtccgt 7200 ctggtttcgg gcgcgactta tttgatcacc ggcgggctcg gagccctggg acttacagtc 7260 gcgaaatgga tggtggagca cggcgccact cgcgtcgtgc tggccgggcg ccggcctcca 7320 aacgaggagc agcagcgcgt gctgcaacag attggtgcga cggcagagac ggtcgacgtc 7380 agccgggaag aagaggtcgc ggatctcatt cgccgcatcc acaccgaaac gtcaccgctg 7440 cgcggcgtta tccatgccgc gggtgtgctg gacgacggcg tactgctgaa tcaggactgg 7500 acgcggatcg caagcgtcat ggcgccgaag gcggaaggcg ctgtacacct ccatcatcac 7560 acccgcgatc tgccgctcga cttcttcgtg ctcttttcat cggcatcctc gctcttaggt 7620 cctgccgggc aggcaggcta cgccgcggcc aacgccgttc tcgatgcgct ggcgcatcac 7680 cggcgcggac tgggtttgcc ggcgaccagc attaactggg ggcgctggtc gggagccgga 7740 atggccgcgc gcaccagcca gtcgatggcc ggcgtggcga gcctctccgt ggacgagggt 7800 ctacacattc tcgaggccgt cctgcatgaa tgccccattc agattgccgc gctaccggcg 7860 ggctcgatta ccggcgagtt gctgcgtccc gccgcgctgc cttcacctca actgcgcacc 7920 cgcttgaacg aagccacacc ccggcagcgc gaagccatcc tcattgcgca catcagggag 7980 tcactggcgc gctttgtcgg catcgcgact tccacaccgc tcgatccaca gcagcctttg 8040 ggtgaactgg gactcgattc gctaatggcc atagaacttc gcaactcgct ctcccaatca 8100 ctggggcagc ctttgcccgc gagtctgctg ttcgactatc cgtcgctcga tgcgatcgtc 8160 agttacgtgc tccatgcggt atttccaccc gaagcatcac cggtggaagc gccggagttt 8220 gagaacctcg cccgcgaaga actggaagcg ctgctcgatt cgcggctggc gcaggtcgac 8280 cagtggttgg agacgcaata a 8301 <210> 117 <211> 5292 <212> ADN
<213> bacterie <400> 117 atgagcgggt cagacgatct cagcaagctt cgccgcgccg tgattgcgct cgacaaggtg 60 cagaaacgca tcgaccagct ggagagcgcg cgcagcgagc ccatcgccct catcggcgcg 120 ggctgccgct tccccggcgc atccaatctc gatgcctatt ggtcgttgct gcgcgagggc 180 cgcagcgcgg tacgtgaagt tccacccgac cgctgggaca tcgatgccta ctacgatccg 240 gatcccggcg cgacgggccg aatgtacacg cggtacggcg gcttcatcga tcaggttgac 300 cgttttgacg cccggttctt cggcatcgct ccgcgcgagg cgatcagcct ggatccacag 360 cagcggctgc ttctggaagt cacctgggag gcgatcgaga acgccgggct tccacccgac 420 cggctggcgg ggagccggac cggcgtcttc atggggatct tttccaacga ttattacaac 480 ctgcaaatgc gcggcgggga tgcgcatatc gacgcgtaca ccggcacggg caatacggcc 540 agcgttgccg ccgggcgtct ctcgtacatc ctcgggctgc agggcccgaa catggcgatc 600 gacacggcat gctcgtcatc gctggtcgcg gtgcaccttg cctgtcagag cctgcgctca 660 ggtgaaagcg acctcgcgct ggcgggcggc gtcaatctga ttctctcgcc ggatcggacg 720 atctacttct gcaagctgaa ggcgatggca gccgacggtc gctgtaaggc attcgatgcc 780 gcagcagacg gctacgtccg cggtgagggc tgcggtgtgg ttgtgctgaa gcgactctcc 840 gacgcgctgc gcgatcgcga tccggtgatg gcggtgattc gcggcacggc aatcaaccag 900 gacggacgca gcaatggact gacggcgccg aacgggcccg cacaggaagc cgtgatccgc 960 caggctgtgg gagacgcgcg cttgcagacg ctggatgtga gctatgtcga ggcgcacgga 1020 accggcacgc cgctgggcga tcccatcgaa gccggagccc ttgcggccgc gctgggagcg 1080 gggcgcacca acggcaacaa gctgaagctc gggtcggtga agaccaactt cggccacctc 1140 gaggcggcag cgggcgtggc cgcactgatc aaggtggcgc tgatgctgca gaacgaagcc 1200 attccgcccc atctgaatct gaccacgccc agcccgcaca tcgattggaa cacgcttccc 1260 ctcgaaatcc cggcacggct caccccctgg ccggttgcac ccggcgggcg gcgcgtcgcc 1320 ggcatcaact cgttcggctt gagcggtacg aatgcgcacg tgctcatcga gcaggcgccg 1380 caacaggccg cgtccagtac gcccgcaccg tacctgcttc cgctatcggc gcgcagtccg 1440 gaggcgctgc gtgatctggc gcgcgcatac cgcgacgtgg tgaacgacaa ccccgccgac 1500 acctgctaca cggcgtgcgc tcgccgcact tcatacgaac accgcgcggc attcaccggg 1560 acgaacgcgc aggacttgat ggccgggctg gacagttttc tggcgggcaa cccgaaccgc 1620 gataccgcca caggttttgt gccgcgcggc cagaagcgaa aagtcgtttt cgttttgccg 1680 ggacaaggat cgcagtggcc cggcatgggc cgcgacctga tggcttctga accggtgttc 1740 cgtgccgcca tcgaagagtg cggccgcgcc atgcagcctt acgtcgactg gtcgctgacg 1800 caagagttgc aggggccgct cgaccgcatc gacgtgattc aaccggccct gttcgcagtc 1860 ggggtcgcct tggccggact gtggcgccat tggggaatcg agccggacgc cgtgatcggc 1920 cacagcatgg gcgaagtcgc ggcagcgcac attgcaggtg cgctgactct cgatgaagcc 1980 gctcgggtga tttgcctgcg cagccggatg ctcgccggag tacgcggcca gggagaaatg 2040 gctgtcgtgg aattagcgct ggacgaggcc atcgctgcca tcgccgggcg ctcggatcgg 2100 gtctcgattg ccgccagcaa cagcccgcgc agcaccgtcc tgtcgggcga cagcgcagct 2160 ctgggcgaac tgctgcggga actggaggcg aaagacgtct tctgccgtcg cgtgaaagtg 2220 gacattgcct cgcacagcca tctgatggac tccgtgtgcg cggcgttgcc gggcgtggtg 2280 ggagcgcttc agccgcggcc ggccgccctt ggcatgtact ccaccgtcac cggcgcagcg 2340 attagcggtg aagagctggt ttctgcgtac tgggctcgta atcttcgcca acccgtgatg 2400 ctgtcgacgg ccgtcgccgc agccgcggcg ggtggtcatg atgtgtttct ggaactgagt 2460 ccccacccgt tgttggtcca gccgatccag gaaacgctcg gagatcgggc agcgattgcc 2520 gctgcctcgt tgcggcgcga tgaagacgga aacctcgcac tgcgccggac gctgggagcg 2580 ctgctgacta acggagtcac tccggactgg tctcgtattt atcccaacgg cggccaaact 2640 cgccggctgc ccaactatcc ctggcagcgt gagcgttatt ggatcgatat ccgtccgccg 2700 caggtcgagt ctcaggçttt gcctggccgg cggatcccgt cgccgctgcc ggagatgcag 2760 ttcgagtcca ctgtggaggc gaaagatttc gcggatcacc ggctgcacga tgtgatcgtg 2820 actccgggag cgtggcacct ggcaatggcg ctcgccgctg cgcgccaagg tctcggcgcc 2880 gggcctcacc atgtcgaaca cgtgtcattg acgggcgcgc tgacgctgcc ggaaaacgat 2940 gctgccaggc aggttcaact ggtactccgt catgaagagg gcggcggagc ttccttccgc 3000 atctacagcc gcgaggattc ctggaagctg cacagcgaag gcatgctgca ggcgggcgat 3060 tccacggcat ccatcgatct ggatgcgatt cgcgcccgct gcacggcgga gctcacagcc 3120 gatgccttct attcgcgact gtgggatcgc ggctatcact tcggtcccac cttccgaacc 3180 atcggcccca tctggcgcgg caacggtgag gtgctttgtc gcgtggacat tccgctgacg 3240 gaaatgcaga cgatcgactg ctgtctgcag ttgcccgcgg ccctcgtcca tcacgacgat 3300 ttgaaagatg tgcatgtgcc ggtaggtctg gaccgattct cgctcgctga agtgcccact 3360 ggcccggtct ggggatacgc ggtcttgcgg ccggattcca cggtggatgt ccgtctcgtc 3420 accggcaccg gcagcgtggt ggcggaattg gtggggctgc agtcgagagt cgcccatagc 3480 ggccagctcg gcgaatcgga gattcccacc tggacggtgc aatggaccgc gtcggttcgc 3540 cgcggcgatg ccaatgccgg caatgctggc ggaccttggc tcgtcatcgg cgagccggcg 3600 attgccgaga ctctgcaaaa gcgcggccaa acctgccgca cggccgatac gtgctcgggt 3660 ccgccgtgcc gtcaaattgt gtactgtccc tcgccgcgca tcgacgacct gctttccgta 3720 ttgcgcagca tcgtgcaagc gggctggcct gagccgccgc gcctgtggct gctgacgcgc 3780 ggatctgccg cggttctcaa ctccgacaaa gatattgata ttcgacaagc ctggctgcac 3840 ggaattgggc ggacgattgc ctatgagcat cccgagctgc gctgcacgct cgtcgatctc 3900 gatgcgcaca gcaacgactg cgggcatctc gcgacgctga tgctgtcgaa tatcgcagag 3960 gatcaagttg cgatccggca aggcacggta tgggcgccgc gcctcagtct tcacaagatc 4020 ccatccgcac ccgatgtggc gttccgtgcc gacgcaacct atctgatcac gggcgggctc 4080 ggcggactcg gactgcaggt ggcgggatgg ctcgccgccg ccggagcgcg ccatctcgtt 4140 ctgctgggac gcagcgagcg tcctcggcca caactggaag gtgtcaacgt caagatcatc 4200 catgcggacg tggcggaccg gcagcagcta tcggatgcgc tcgcgatcat cgatcgcgac 4260 atgccgccgt tgcggggcgt gttccatctg gcaggcacgc tggccgacgg catgctgctc 4320 aatctcacga ccgaacgctt cgaagccgcc atggctccga aagtagccgg cgcgtggaac 4380 ctgcacgaac tcaccgccgg ccggccgctg gatcattttg ttctcttctc ttccgccagc 4440 gcgacagtgg gatctcccgg ccagggcaac tacgccgccg gcaattcatt tctcgacgcg 4500 ctggctcatc tgcgccgcgc ccagggtctt cccgccgtca gcatcgcgtg gggaccgtgg 4560 acacaggttg gtttggccgc acaggcgaac cgcggagacc gtctggccgc gcgcggcatc 4620 tcggttattc aaccgcaaca gggattgcgc gcgctctaca aagcattgac gcagattcgg 4680 ccgcacgtcg ctgtcatgaa cttcgatatc gcgcagtggc tccgttacta tccgtcggcc 4740 gcatcgatgt ccctgctggc cggcatcgca cccgcggccg cggacaccaa accggcggcc 4800 gacatgcgca gcgagctcct ggcagttcca gccgggcggc agcgccgcgc gcggctggaa 4860 acgctgctga tgcacgaagc cggacacgtg ctgcgcttcg atccagcgaa actcgacggc 4920 agagcgacgc tgggtgatct cggattcgat tcgttgatgg ccctcgagtt tcgcaaccgt 4980 ctggaagccg ggctgcgcgt caagctttct gccaccctga tctggcgtta cccgacattc 5040 tccgccctgg cgcagcatct cgccgacaag ctcggcctgc cgctggaaag catggccggc 5100 aatgctgaac cttcgaccgt tgctgccgtt gctacccttg ctaccgttgg caccgccgcg 5160 ggcgaggacc ggagtcccgc cgctgcagac gatctcgacg ccgtcgcaaa ccagatcgcc 5220 gggttggggg acaaagaaat cgaagctttg ttgaaacaga agttcgctca tttttcagga 5280 gcctccgagt ga <210>118 <211>6462 <212>ADN

<213>bacterie <400> 118 gtgagttcga tatccgagcg attccccaac cttacgccgt tgcagcaggc gtacctgacg 60 ctggagcaca tgcagcgacg tctcgatgcg gccgaacgcg acgcgcgcga acccatcgcg 120 atcgtgggtc tgggctgccg gtttccgggc ggcgatgggc ccgatgagtt ctggcagatg 180 ttgcgcagtg gagtcgatgc tattcgtgag gtaccgcctg gacgatggga cgaggagtcg.240 gtccggcgca tcctgaaatc gttgaacccc gccacgccgg tgaagattca agccggattt 300 ctcgattcca tcgatggttt cgacaacgat tttttcggca tttcgccacg cgaggccgtc 360 agcattgatc cgcagcagcg gctgctgttg gaagtggcgt gggaggcact ggaggatgcg 420 gggcagacga tggaagggct ctccggcagc cgcacgggcg tcttcgtcgg gatccacagc 480 caaagcagcg actatttctg gatgcagacc gccgatggcg cgcgcatcga tccgtatacc 540 gccaccggca cggcgcatag cgtgatcgcc ggccgacttt cctatttgct gaacttgcaa 600 ggacccagca tcgcgctcga cacggcctgc tcgtcttcgc tggcggcggt tcatctggcg 660 tgccagagcc tgcgcagcgg cgagtgtacg ctggccgtgg ccggcggagt gaatctgcgc 720 ttctcgccgg agtttatgta cgccacctcg aagatgggaa ccgcctcgcc cagcggtcgc 780 tgccgcgcct tcgacgcggc ggcggacggc atcgtgttcg gagaaggctg cggcgtggtg 840 gtgctgaagc gcctgtccga tgcactcgcg gccggagacc gggtgtgggc cgtggtgcgc 900 ggctccgcgg tcaatcagga tggccgctcg gccgggctca ccgctcccaa tgtcgtgtct 960 cagcaggtcg tcatccggtc ggcattggcc aatgcgggcg tcgcggcgca gcagatcggt 1020 tacatcgaag cccatggcac ggggactccg ctcggcgatc ccatcgagat cgaggcgctg 1080 gcggaaaccg tcggcctccc gcgacctgtc ggcgatgtgt gcgcggtcgg gtccctgaaa 1140 tcgaacatcg gccacctgga gggagcggca ggcatagcgg gattgattaa agcggtgctc 1200 gcattgagtc acgagacgat accgccgagc ttacacgtga gacagctgaa cccgaatatc 1260 cggttggagg gaacgtcgct cgacattgtg aaggaagtcc ggccgtggcc cgcgggttcg 1320 agacgaaggt ttgcgggcgt cagcgcgttt ggttggtccg gcacgaacgc gcatgtcgtt 1380 cttgaagaag cggcgccgac tggtagaggc gaagctgcga gcgggttcca ttcccgaccc 1440 cccgccgccg ctgcgcgggc ggctgtcccc ctcgcggagg gggacactgg gggcactccc 1500 gacattgcag gcactcccga cactgcagac actcccgaca ctgcagacac tcccgacatt 1560 gcagggactg caggcactgc ggcaactacg ggcattgcag acgcgatgta tgtgcttccg 1620 ctgtccgcgc atggtgcgga cgaactgcgt cgggtggcgc gggcatacgg ggaattgctg 1680 acagcgtcgc acgcaccgag cctgcgtgat ctttgctaca cggccgcagt ccgccgcacg 1740 catcaccgat gccggctcgc tgtttccggc agaacggctg aagaactggc ggcgcagctc 1800 caggggatca cgatcccttc ccagcgacgg aagacggtat tcgtcttctc gggacaggga 1860 tcgcaatgga tcggaatggg gcgcagctgg atggaccgcg aacccgttat tcgcgaggcg 1920 ttggaacgct gcgaggccgc catgcggcct tatgtggact ggtcgctgâa agaagaactg 1980 gcgaagctcg accgcgtcga ggtcattcag cctgcgctct tcgcgctgca ggtcgccatc 2040 gccgcattgt ggcgttcctg gggaatcgag ccggatgccg tcatcgggca cagcatggga 2100 gaggtcgccg ccgctcatgt cgcgggtgcg ctgacgctgc aggatgcggc gcggatcatt 2160 tgcagccgca gccggctgtt gagccggatc agcggcctgg gcgggatggc gatggtggag 2220 ctgccgctcg cggaatgtga ggccgtgctg tcgacttaca cggaacgact atcgcccgcg 2280 gtgtcgaacg gacccaactc caccgtcatc tccggtgaag tcgaagccct ggccgaggtc 2340 gtcgcgacgc tggagcggcg aggcgtgtct tgccggccgg tgaaagtgga cttcgccgcg 2400 catagcccgc aagtggaccc attgtgcgac gaactcctgc agtcgctcga cgggattcaa 2460 ccgcggcccg cgaccatacc tttttactcc acggtgaccg gcgcgacgct ggagaccacc 2520 agcctcgaca gcacgtactg ggctcgcaat ctgcgatcgc cggttctgtt ctggcagggc 2580 atccgccatc ttgccgacag cgggcacgat gtctttctcg agatcagccc tcatcccatc 2640 ctgctgcccg ccatcggcgg caatgcggcg ctggttccgt ctctgcgccg cgaccaggac 2700 gaacgcggtt ccatgctcac gtcgctgggc gccctctatg aggctgggca cactgtcgca 2760 tggcggaccg tgtacccttc cggcaattgc gtgcgcctgc cccggtatcc ctggcagcgt 2820 cgtcgtttct ggctcgacgc ttcccccgcg cgacacgcga tcacgttggg caatccgctg 2880 ttgggaaaac gcgtcgaagc ctcgacgcaa cccggcactt tcttctggga gacggaactc 2940 agtctcgctt ccgtgccttg gctggcagac catcgcgtgc agggcgaagt cgtcttgccg 3000 gctactgcgt atctcgatat ggctctggcc ggaacttccg agaccttcgg tgaaagtccg 3060 tgcgtgctgg agcatgtgac tttcacacag atgctcattg tgccgcgcga cggcagcatg 3120 acgttgcagc tggccatcgc ggtcgataga cccgggatgg cgtcgtttcg gatttccagc 3180 cggcaggcat cgacatgggt cctgcatgct tccggggaca ttcgtcagac gcctgcggat 3240 gcatcgaccg tcccgccgga ttctgcggag acggtgcagg cccgctgccc cacagtggtg 3300 ccggcggcgg agctgtggcg tcagatggcg gagcacggcg tcgagtatgg tccggctttc 3360 cgcgcgctcg agcagatctg gagttgtcca ggtgaggcga tcgggcgtct gcgtagctcg 3420 gaaacgcgtt ccactgcgcc ggcgttcctc gatgcatgtc tgcagatcat cgccgcggcg 3480 tttggtcccg ccggtggaac ctggctgccc gccggcatcg accggatgcg ctggctgcat 3540 cccgcacgtt ccgtggtgtg gacgcatgcg cggctggaag gacctatcgc cgatctgtcg 3600 ctgctggacg gagagggaca actggtcgcc cgcatcgagg gtctgcggct gcagcgcctg 3660 gatgcgtcgg agcgcatcga catgcgcggc tggttgcacg aactgcgctg ggtcgctcag 3720 ccgcacgccg ctgcagagcc gccggcggcg cgagcggcgc ggtcatggct cattgtcggc 3780 gctgtggata gcgcgctcac cgcatggctg cgcgctaccg gcaaccgcgt gacgcagacc 3840 tcgccggaaa agctcgatga actccagccg ccgctcgagg aaatcgtgtt tttgctcgag,3900 cacgaaccct catgcgaccg cattctgcat ctcctccaga ccctggggcg cacgccctgg 3960 cgtcaagcac cgcgcctatg gctggtcacg cgcggcgcgc agccggtcga tggacagatc 4020 ctgcaagccg gtatcgctca ggcgcctttc tggggtttgg gccggaccgt gcattacgaa 4080 catccggaac tgaactgcac gctgatcgat ctcgatcccg ccggcggcga agaggaactc 4140 ctgcacgaac tgctgacgaa caacggcgag aatcaaatcg cctttcgcgg cggcgcgcgt 4200 tacgtcgcgc gcgtggctcg gcacgaagcg gatatgcaac ccgccatgtt caaggccggc 4260 gatcggccgt tccggctcga gatcgatgcc cccggagtcc tcgaccggct gcgcttgcgg 4320 gccacatcgc gccgcccccc gcaagccggt gaagtggaga ttgaagtctg cgccgcgggc 4380 ctgaacttcc tcgacgttct gctcgccctc ggcgttatgc ccgacgatgc gcccggcgcg 4440 attgccggca gcccgcgcct gggcggcgaa tgctcgggcc gtatcgtggc catggggaaa 4500 ggcgtcaccg actttcgcat cggagatgaa gtcgtggccc ttgcgccttg cagtttcggt 4560 cgcttcgtca ccacgcccgc cttccgcgtt gccttgaagc cggccaacat tcccgccgaa 4620 caggccgccg ccctgcctat cgcgtttctc accgccgatt acgcgctctc gcgagcggcg 4680 cggctggcgc ccggcgaacg agtcctgatt cacgctgcca ccggcggtgt gggattggcg 4740 gcaatccaga tcgcacagcg tgcgggcgcg gagatcttcg ctactgccgg gagtccggaa 4800 aaacgagcgt atctgcgctc gctgggcatc gcgcatgttt cggattcgcg ctcgatggct 4860 ttcgtggacg acatccgcaa ttggacgaat caagaaggag tagacgtcgt cctgaattcg 4920 ctttccggcg atctgctgga ggcgagcttc gatctgctgc gcgatcatgg acggttcatc 4980 gagatcggca agcgcgatta ctatgccggc cgcaagctgg ggcttcgccc gttcctgaag 5040 aacctctcgt acacgctggt cgatttgctc ggcatgtccc tgaagcgccc ggcattgacc 5100 cgggagctgc tgcaggagat ggtcgcaaaa ttcgaatcgg aaacctggcg gcccctggaa 5160 acgcgagtga cgaccatcac cgaatcggtg gaggcgtttc gcaccatggc gcaggcgcgg 5220 cacatcggca aaatcgtcat ggcgatgcga gattgcgcca atgcgcccat cgcaccccta 5280 cgctcggcgt tcgatagcga gggaacctac ttgattaccg gcggacttgg cgggctcggt 5340 cttaccgtcg cacgctggat gatcggacgc ggcgcccggc ggctggtgct gctgagccgc 5400 cgcgcgcctt cacccgaggt ccagcaagcc atcgccgtca tggacgcaga tgtccggacg 5460 gtgcaggccg atgtttctca gcgcgatgaa ctcgagcgcg tgatctcttc catcgatcga 5520 ttgcgcggcg tgattcatgc cgcagccgtt ctcgacgatg cgctgctact gaaccagacg 5580 gaagcgcatt tccgcaacgt gatggccgcg aaaatcgacg gtgcctggaa cctgcacttg 5640 ctcacccgcg actgcccgct cgatcatttc gtgctcttct cctccgctgc aggactgctg 5700 ggcgcgcccg cccagggaaa ctacgcggcc gcgaacgcct ttcttgacgc gctggcctac 5760 taccggaagg cccaaggcct gccggcgctg agcatcggtt ggggtgcgtg gtcggaggtc 5820 gggctggctg ccgcgcagga caatcgcgga tcgcggctgg ctttgcgcgg catggaaaac 5880 ctgacgccgc aacacggcct cgctattctg gaacagctgc tgaacagctc ggcttgccac 5940 gtcgccgcga tgcccatcaa tgtccgccag tggcggcagt tctatcccaa ggcggcgcag 6000 tctgcactgt tcgagctttt gcatgacgac gcggcgagcg aagccgatgc gccaaacgcg 6060 ttgcgcgcgc ggctgcaatc ggccgagcct cagacccgca ggacattgct cgaagaacat 6120 ctacagcagc agctggcgcg cgtgctgcgc atcgactctc aaactatcga tcccctgcgc 6180 ccgctgaagg aactcggctt cgattccctc atggccctgg agtttcgcaa ccgtctcgaa 6240 ctcacactgg gtctcacgct ccccgcgacc ctgatttggg gtcatcccac gctggccggt 6300 cttgccccgc acctggcgtc gcaaatggga ctgccgctgg tcgaagcgca ggccgcggct 6360 gctgcggaag gagacagccg cgccatgaaa actgcactca gcgggttgga cgacatgtcg 6420 gaagaagcag ccgtggctgc gctccgagga gcaaggtcgt ga 6462 <210> 119 <211> 5088 <212> ADN
<213> batterie <400> 119 gtgagggaaa aaattgcgcc catgtcgtcg gtcaaactcg cgctattggc gcggaacatg 60 cggcaaaaca tcgcaggctt cgacctggtt cacgccgaac ccatcgccat cgtcggcatg 120 gcgtgtcgtt ttccgggcgg cgcgaagaat ccggacgcct tctggacgct gttgaagaac 180 ggtgtcgacg gtgtcaccga ggtgccgcca gaccgctgga actcggacca gtactactcc 240 tccgatcccg atgctccggg caaggcgtat gcgcgatatg ccgccttcct cgaacgcatt 300 gacggtttcg atgcggaatt cttcggcatc tccccccgcg aagctctgaa catggatccg 360 cagcagcggc tgctgctgga agtgtgctgg gaagcggcag aggacgccgg catctctccc 420 ggccctctgg cgggcagcgc gaccggcgtc tttgccggct cctgcgccca ggacttcgga 480 ctgtttcagt acgccgaccc tgcccgcatc ggagcttggt cgggttccgg cgtggcgcat 540 agcatgttgg ccaatcgcat ctcctatctg ctcgacctgc gcggtccgag catggcggtc 600 gatacggcct gctcctccgc gctcgtcgcc gtccatctgg cttgccaaag cctgcgccgg 660 cgcgaatgcg atgcggcatt cgccggcgga gtgaacttga tcctgactcc cgagggcatg 720 atcgctttgt cgaaggctcg catgttggcg cccgacggac gctgcaagac gttcgacgcc 780 gcagccgacg gttatgtgcg cggcgagggc tgcggcatcg tgctgctgaa gcggctctcc 840 gatgcgctgg ccgatggcga tgccatccgt gcagtcatcc gcggctcggc aatcaatcag 900 gacggacgga gcaatggcat cacggcgccg aatctgcagg cgcagaaggc ggtcctgcaa 960 gaggcggtgg ccaacgcgca catcgatcca tcccacgtat cgttgatcga ggcgcatggc 1020 acgggcacgt cgctgggcga tcctatcgag atcgaggccc tgcagtcggt ctacgacgcg 1080 ccggactctg cgccttgtct gctgggttcc gtaaagacca acatcgggca tctggagggc 1140 gcggcgggaa tcgccgggct gatcaaagcc gtactcgccc tgcagcatcg caccattcct 1200 ccgcacctgc attttcgccg gctgaatccg aacatctcac tggacggcag ccggtttcgc 1260 atcgccacgg aatcgtcgcc gtggacgtcg gaaggacggc cgcgtctggc cggcgtcagc 1320 tcgttcggtt ttggagggag caacgcgcac gtcatcctcg aagaggcgcc tgcactccct 1380 ttgccgaagc cggtcacacg cccgcagctt ctcactctgt cggcgcgcac cgacgaagcg 1440 ctcggcgaac tggccggcca cttcgcggag ttcctgcagt cgcacccgaa tgcgttgctg 1500 tccgacgttt gcttcaccag tcaggttggg cgcgacgcat atagtcaccg cttggcgatc 1560 accgccgcag atgcggcaga ggctgtagcg gcattggccg cggcgccgcg gcgcgaagta 1620 tcgttgcgcc ggcggccggc aatcgctttt ctcttcaccg gccagggcgc gcagtacgcc 1680 ggcatgggcg cagagcttta taaaacgcag cctgtttttc gcgacgcgct cgatcgttgc 1740 gccgattggc tccgtcccca gctcgatgtt ccgctgaccg ttctcttgtt cgagtcggtt 1800 tcgccgttgc acgagacggc gtatacccag ccggcaatgt ttgccctgga atgggctctg 1860 gctcagttct ggctgtcgct cggcgtccgg ccggactacg tgctgggcca cagtctcggc 1920 gagtatgttg cggcgtgtgt ggccggcgcc tttagcgtgg aggacggcct gcggctggtg 1980 accgccaggg ggcggctggt caatgcgctt ccccgcggca aagcggtcat cgttcacgcc 2040 aatccgagcc gcatcgcggc gctcgccgcc aaggtggcag tcgccgcatc gaatgcgccg 2100 gaccgcaccg tgatctccgg cacggctgca gaaatcgcgg aagcgcaaga tgacctgcat 2160 cgcgccggcg tggaaacgcg agagctgaac gtatcgcatg cgttccattc gccgctgatg 2220 gatccgattt tggacaagtt cgaagcgctt gcaggtgcga tcgcgtatca gccgctggcg 2280 atcccgctgg tgtcgaacgt cagcggagcc gtattgccga aaggcacgac actcgacgcc 2340 cgctactggc ggcgacagtt gcgcgaaacc gtgcagtttg aaagcgcgat gcgaaccctg 2400 gcggaccgcg agtgcaagct gtttctggaa atcggcccgc atcccacgct caccacgctg 2460 gggcgatatt gtctgcccga tgacggcgcg gtctggctgc actccctatc taagggacga 2520 tcggattggt ccgtgctgct ggaaagtctt ggcggcctgt ttaccgcggg cgtgaatccc 2580 gactggcgcg gtctctatgc cggggaatca cccagccgcg tcgcgctgcc gacgtatccg 2640 tttcagcgtg acaccttcag cctgagacgc gtacccgcga gagagccggc gcgcggcggc 2700 atgttgggag cgcgcctcaa cagcgcgttg ggcgatgtca tcttcgaaaa ttcgctaacc 2760 acggagacgc ctctgctcca tgagcacgtg atctacgacg cggtcattgt gcccggcgcc 2820 tggcacgtgt cggcatttct cgaagcggca caggaagtct tcggtccggt tccctgcgcc 2880 gtctccgatg tcatgatgcg gcaggcactg gccatcccgc cggatacgcc ggtcacggtg 2940 caagcgattg tcacacccgg cgaggacggc gaagcaaagg tgcaggtctt cagccaggat 3000 ggcgattcgt ggaagctcca cacggcagcc agtctgcgcg cggcgactgc cggcgccgtt 3060 catttcgagc tgccggcgca gccttccgaa gtcatttccg gcgatgcgtt ctacggcgcg 3120 atgaacgcac gcggcgtcga tcttggcccc gccttcagtt gggtggaaga agtctggcgt 3180 cgcgatggcg aggcgctggg gcgaatgcgt ctgccggtgg ctgaggatgg cgcgaacgct 3240 taccggctgc accccggcct gatcgattct tgttttcaag tattcggagc gacttggccc 3300 gcggagcgtt gccagcccgg cgcatacgtg ccggtcggga tcgaagcggt gcgcttctac 3360 cgtccgccgg caggttctct gcgctgtcat gcgcgtctgc gcccgagctc gagcggcccg 3420 ttcgtcggtg atctgacgct ggttgaagag accggcgcgg tcatcgccga gttttccgga 3480 ctggctgtaa tgcatgccgg tacgctgcaa tccgcacagt cgtggctgca ggatgtgcag 3540 tggcaggagt gcgagcgatc gacaacgttg aagtccgacg gccctggcaa gccggaggac 3600 tggttgctgt gtgccggcgc agacgatgtc gccggtttga tgccgcaaga gctgcgcgtc 3660 gtgtccggcg tcactctccg ccaggcgctg gaacagaccc agactttggt cggccgcccg 3720 gcgcggctct ggctgatcac gcgcggcgtg catcgcatca gtgatgacga tgcgactccc 3780 gtcgatcctt tccaggctcc actgtgggga ctcgggcagg cgatcgcgcg cgagcatccc 3840 gagctgtggg gcggcctgat cgacctcggt tgcgacaatg ccgacatcgc cgccgccatg 3900 ctgctggatg aaatccgtta tgccggcgac gacaaagcga tcgcattgcg caacggacgc 3960 cgctacgttc gccggctggt gcggcacaag gaaacgtcga agcggccgcc tgccatttca 4020 gccgacggcg tctatctgat caccggcggt ctcggcgcat.taggacgaag ggtggcacgc 4080 cgcttgatcg agcaaggcgc gcgccgtctg gtactggtcg gccggcatac ggaggcagtt 4140 gccgatctcg agcaactcgg ggctgcagtc atggttgctg cttgcgatgt gagttccgag 4200 caacagctgg cggcgctgct ggcggacccg cgcacccagc cgctgcgtgg agtcgtgcat 4260 gccgcaggcg tgctcgatga cggggtagtt acagaacaga cgtgggctcg tttcgagaag 4320 gtgctggcgc cgaagctgca gggtgcctgg aatcttcacc agctcactcg ccaccatgcg 4380 ctcgactttt tcgtactctt ctcttccgcc gcttcgctgc tcggttccgc cggacagagc 4440 aattactcgg cggccaacgc atttctcgac agccttgccc acatgcgccg cgcgcaagga 4500 ctaccggcgc tgagcatcaa ttggggacca tgggcgggcg aaggcatggc cgcgcgcatc 4560 gcgcggcaag gcctgccggg ggtaccgctg ctgccgccgg aagtgggtgc gcgcatcttc 4620 ggcgatctgc tgggcgagac tgccgctcag atcgcggtgt tccaagtctc cgccgaaaaa 4680 aggcggagcc cggcgagcga tcccggcttc atccagcaac tcaccgaagc tgcgccggag 4740 cggcggcagg aactgctgca gatgcgcatc cgcaagcagg ccggcggcgt gctggcgctc 4800 gatgcgtcca agacgctcga cccgcgccgg ccgctcaagg aatacggact cgattcgctg 4860 atggcgctgg atctggcgcg cgccatcgga gagctggtgc gcaagagcct tcccgcgaca 4920 ttgctatacg accatccgac cgtcgagaaa ttggccggcc atgtcctccg cgaactcgga 4980 ctcgacgtcc ccagcgattc cctcgtcgat gaagtgcggc agctgtccga gcaggagatg 5040 gcggcgttca tcacggaaac cttgcaccat ctgggagagg aacgatga 5088 <210> 120 <211> 4306 <212> ADN
<213> batterie <400> 120 atgagcgatc tcactcctct tcaacaggcg gtcctggcgc tcaagcgcac gcgagcgcgt 60 ctcgacgaac tggagagcgt ccacaacgaa cccatcgcga tcgtcggcat ggcttgccgc 120 tttcccggcg cggactcgcc ggaagcattt tggcagctcc tgcacgatgg catcgatgcc 180 atccgcgaaa ttcctgcggg ccgttgggat gccgatgcgt tttacgatcc cgatcccaac 240 gcgccgggaa agatgtacac gcgtctgggc ggattcctcg atggtgccgt cgacggcttc 300 gacgccggct tcttcggaat cacgccgcgc gaggtcgccg gtctggatcc gcagcagcgc 360 ctgctgctcg aggtggcatg ggaagctttg gagcgtgcgg gtcggccgcc cgacagtctc 420 gcgggcagcg acaccggagt gttcatcggg atcagcaccg acgactacag ccggctgaaa 480 cctaccgatc cggcgctcat tgacgcctat accggtaccg gaaccgcgtt cagcactgcc 540 gccggacgga tctcctatct gctggggttg cagggaccga acttccccgt cgacacggcg 600 tgctcttcct cactcgtggc ggttcatctg gcgtgccgca gcttgcagtc gcgagagtgc 660 agcatggcgc tggccggcgg cgtgaacctg attctggcgc cggaaagcac gatctacttc 720 tgccgcctgc gggccatggc ggccgatggc cgttgcaaaa gtttcgctgc ctccgccgac 780 ggttacggcc gcggcgaggg atgcggaatg ctggtgctga agcggctgtc cgatgcgacg 840 cgtgacggcg atcgtattct ggcgctgatt cgcggatcgg ccgtcaacca cggcggccgc 900 agcaacggcc tcacggcgcc gaacggtccg gcgcaggaag ccgtgattcg ggcggcgctc 960 aagaacgccg gcatggcccc cgccgatgtc gattacgtgg aagcccacgg aaccgggacg 1020 ccgctgggag atcccatcga actgcgggcg atggcagcgg tgctgggcga ggggcgtgcc 1080 gtcgattctc cgttgatcgt cgggtcggtg aaaaccaact tcggccacct ggaggcggcg 1140 gcaggtatcg ccggcctgat caagaccatt ctcgccctgc agcaccgaga gattccgccc 1200 catctgcatt tcaacgcgcc caacccgcac gtactctgga atgagctgcc gctaaagata 1260 gccaccgcat gttcgccatg gccctccaac ggccgccccc gagttgccgg ggtgagctcg 1320 ttcggaatca gtggcaccaa ttcgcacgtc gtcctcgcag aagcgaagac gaatgtagaa 1380 gcgaagacga atgtagaggc gaagacgaat gtagaggcga agacgagtga agaggtcaag 1440 gcgagtgtag aggccaaagg gaatgtggag gctaaggcta gtgctagtgt ccccctcctc 1500 gagggggaca gccgcccgcg aagcggcggc ggggggtcgg gccggccgcc cagccgcgag 1560 gaagtgccgg tcccggatca actccatgcc gaagacggcc gcgaatacct cctaccgctt 1620 tcggcgcgcc atccgcaggc tctgcgcgat ctcgccggcg cctatcgcga tgggcgcttt 1680 cacgctccgc tctccgcgct gtgttccgcc gccagcctga cgcgcagtca ctacgaacat 1740 cgcgcagcgt ttgtggcctc atccctgccc gagttcaatc aattgctcga ggccttccgg 1800 cgcaatgaaa ccaatcgcgg cgtcgccacc ggtttcgccg atcccggagt tcgtccgaaa 1860 ctcgccttca tcttttccgg ccagggcgga cagtacccgc gcatggcgta tcgcctgtat 1920 tccgacgagc ctgtcttccg atcggcgatc gaacgttgcg acgccgcctt ccgcagcttc 1980 gtggaatggc ggcttgcgga cctgctcgcc gacgagtcgg gagcatggct gagccagatc 2040 gatcgcgtgc agcctgcgct gttcgccgtt caaatcgcgc tggtcgaact gctgcaatcc 2100 tggggaattc gcccggacgg cgtggccgga cacagcatgg gagaagtggc ggcggcccat 2160 gtcgcaggca ttctcaccct ggaggacgcg gcccgcatca tctgtcgccg cagccggctg 2220 ttgctcggac ttcgcggccg gggagcgatg gctctggtcg aactgccgct cgatcgggcg 2280 aaggccgtgc tcgctgaacg cggtctcact actgtttctg tcgcggccag caacggacca 2340 cgcagcacgg tgttctcggg agaccgtgtg gctctcgagc atttgaagga cgacttcgag 2400 aggcgcggcg tcttctgccg gctgattcag gtggatgtcg cttcacacag ctcgcaggtg 2460 gacccgctcg agaacgaatt gcgccaggaa ctcggccgcg ttattgcaaa acgttccgcc 2520 gtgccgttct tctccacggt tgaaggacag ttgagcacgg gcgaggcgtg cgacgcgtcg 2580 tactgggtag ccaatctgcg acagccagtc cgtttctggg agtcgttgca ggcgatggct 2640 ggtgatgagt tcacgcagtt cctggagatc agtccgcatc ctgtgctgac gccgtcgatc 2700 gaggatagtc tgcggacgct cggcataaac ggactggttc gccccgtact gcgccgcgac 2760 gaaccggagc ggcgtgagct gctcgagttg ctcgccgcgc tctacgtgaa tgggcagcgt 2820 ccggactggc gcgcgctcgc ttcgtctccc gacacgcgcc tggatctgcc gacgtatccc 2880 tggcagcgcg agcgcttctg gttcgcgacc tcgacgcggc gaagtttgcc ggcagttggc 2940 ggtcatccgc tgctcggtcg caaggtcgag attgcgctgg cgccggacac acacgtctgg 3000 gagtccgtgc tctctctgga tgcgctgccg tttctcgccg atcaccggct caacgagctt 3060 gtggtgcttc ccggtgccgc ttatgtggag atggcgctgg ccgcagccaa ggaagtgttc 3120 gcgggtggct gcagcctgga agagatccgg tttgaacaaa tgctggttgt tccttccgcg 3180 ggcgcctcgc gagtgcaggt catactcgag ggacacgcat tccgcatctc cagtctggcc 3240 gaaggcggtt ccgattggac cgagcacgcg cgcggcacca tggctgcggc gccggacaag 3300 gtcgcgccca cggtgagcct gcccacactt ggggatcgca tcgagggcga tgacttctat 3360 gcggccttcg catcgcaggg gatgcattac ggcgacacct tccgcggcat cgcggaagtg 3420 tggcggcgcg acggcgaggc agtggcgcga ctgagcgtgc cggatgccgt tcgcgaagca 3480 gagtccggtt acacgcttca tcctgccttg ctcgatgcct gtttgcaggt gctgggcgcg 3540 acgcttggcg gcgaaggcag cgccggtcct tgcgtgcctg tcgccatcga acggttgcac 3600 tgtttcggca gacccgccgg cgatcttagg gtgcatgcgc ggctgacggg gcggctcgag 3660 ggcgatgtca ccctgtgtga tgcggaaggc cacgtcatcc tcgaggtcca aggcctgcgt 3720 gcccaggaac tggagcgcca atccgaatgg ttccacgcta tggaatggga gccgcagctg 3780 ctggccgaga gtccaacggc aacggtgtcg ggtgcatggc tggtcattgc cgatgccggc 3840 ggcatcgcag ccgcggtggc gcgagggctg ggcacaaaca cggttgtgat ttcgggtcgc 3900 gatgccgaga taccggatca gccttaccgg ggcgtcattc actgcgggag cctggatgag 3960 accgaggatg agaccgatcc gtcggctgcg gggggaaccg cctgcgaaga cattttgcgc 4020 atcgttcaag aattcggagt gggacgcata cagctgacga aacaagcgtc cgacgccgaa 4080 tcgcagcatc cgcgaatctg gctgattacg gcgggcgttc atgcggagca tctgcagatg 4140 ccggtggtgc ccgcgcgggc accggtgtgg ggtctgggac gtaccatcgc ggccgagcat 4200 cccgagttcg cttgcacctg catcgatctc gacactgccg gtgaagtcga ggtgcaggcg 4260 ctctgccgag agattctcgc ggggagttct gaacgtcagg gcccgg 4306 <210> 121 <211> 1537 <212> PRT
<213> bacterie <400> 121 Leu Gln Cys Pro Glu Ser Ala Val Asp Leu Gln Gln Pro Leu Val Arg Met Gly Leu Asp Ser Leu Met Ala Val Gln Leu Arg Asn Arg Ile Asp Thr Asp Leu Arg Val Leu Leu Pro Met Val Arg Phe Leu Asp Gly Pro Ser Val Ala Glu Leu Ala Arg Asp Leu Ser Asp Leu Ser Gly Leu Ser Glu Arg Thr Thr Val Ala Pro Glu Pro Ala Ala Gln Ala Ser Val Pro Ala Leu Ser Tyr Pro Leu Ser Ala Gly Gln Gln Ala Leu Trp Phe Ile Tyr Arg Ser Ala Pro Glu Ser Pro Ala Tyr Asn Ile Ala Trp Ile Ala Arg Ala Arg Gly Ala Phe Asp Pro Gln Ala Leu Arg Arg Ser Leu Gln Asp Leu Val Asp Arg His Pro Ala Leu Arg Thr Thr Ile Ala Glu Ser Gly Gly Ala Pro Val Gln Thr Val His Ser Ser Val Pro Val Asp Phe Glu Val Ile Pro Cys Ser Pro Asp Asp Glu Ala Val Leu Ile Asp Gly Val Phe His Ala Pro Phe Asn Leu Gly Glu Asn Cys Phe Arg Ser Arg Leu Leu Val Gln Ser Gly Lys Asp Gln Val Leu Ala Ile Val Val His His Ile Leu Ala Asp Phe Trp Ser Leu Leu Val Met Val Asp Glu Leu Arg Ser Ile Tyr Leu Ala Arg Thr Ala Gly Gly Pro Pro Val Ala Pro Pro Val Ala Ser Phe Ala Ala Phe Val Arg Trp Gln Asn Glu Leu Leu Ala Gly Thr Glu Gly Glu Arg Leu Trp Asn Tyr Trp Ser Ser Gln Leu Ser Gly Gln Leu Pro Val Leu Asn Leu Pro Ser Asp Arg Pro Ser Pro Pro Val Gln Ser Phe Arg Gly Asn Ser His Ser Phe Arg Ile Glu Pro Ala Leu Thr Ala Lys Leu Lys Ala Leu Ala Arg Arg Gln Asn Ala Thr Leu His Ala Thr Leu Met Ala Ala Phe Gln Val Leu Leu Ser Arg Trp Thr Ser Gln Glu Glu Ile Leu Thr Gly Thr Leu Thr Asn Gly Arg Thr Gln Pro Glu Phe Ala Asp Leu Val Gly Tyr Phe Val Asn Pro Val Ile Leu Arg Gly Glu Leu Ser Gly Asp Pro Asp Phe Asn Thr Val Leu Ala Arg Ile Arg Gln Thr Leu Leu Gly Ala Ile Glu His Gln Glu Tyr Pro Tyr Ala Arg Ile Val Glu Arg Leu Gly Pro Gly Leu Arg Val Leu Phe Val Leu Gln Gln Pro His Arg Ile Pro Glu Ser Val Pro Phe Met Leu Gly Gln Ser Gly Gly Arg Met Ala Trp Gly Ser Leu Thr Leu Glu Ser Leu Ala Met Pro Leu Arg Gln Ser Arg Phe Asp Leu Asp Leu Met Met Val Glu Thr Asp Gly Gly Leu Ser Ala Phe Leu Gln Tyr Asn Thr Asp Ile Phe Asp Ala Ala Thr Ile Glu Arg Leu Ser Leu His Phe Ala Val Leu Leu Glu Gly Ile Ala Glu Asn Pro Ala Cys Pro Val Val Asp Leu Pro Leu Leu Thr Thr Arg Glu Arg Ile Gln Leu Leu Glu Glu Trp Asn Ala Thr Ala Ala Glu Phe Pro Ser Gln Cys Val His Glu Leu Phe Glu Ala Gln Val Glu Leu Thr Pro Asp Ala Ile Ala Leu Ser Phe Gly Glu Gln Asn Leu Thr Tyr Arg Glu Leu Asn Gly Ser Ala Asn Arg Ile Ala His Tyr Leu Arg Ser Arg Gly Ala Gly Pro Gly Glu Met Val Gly Ile His Val Thr Arg Ser Leu Glu Thr Val Ala Gly Leu Leu Gly Val Leu Lys Ala Gly Ala Ala Tyr Val Pro Leu Glu Pro Glu Tyr Pro Ala Gln Arg Leu Arg Leu Met Leu Glu Glu Thr Arg Pro Val Val Val Leu Asn Val Thr Glu Ser Glu Val Trp Thr Gln Pro Asp Thr Asn Pro Asn Pro Leu Ala Thr Pro Ala Asp Leu Ala Tyr Val Leu Tyr Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly Val Gln Ile Thr His Gln Ala Val Val Asn Phe Leu Ser Ser Met Arg His Glu Pro Gly Ile Ser Asp Arg Asp Thr Leu Leu Ala Leu Thr Thr Phe Met Phe Asp Ile Ser Ala Leu Glu Ile Phe Leu Pro Leu Ser Ala Gly Ala Arg Val Val Val Ala Asn Gln Glu Thr Ala Val Asp Gly Glu Arg Leu Ala Arg Glu Leu Ala Arg Ser Lys Ala Thr Met Met Gln Ala Thr Pro Ala Thr Trp Arg Leu Leu Leu Ala Ser Gly Trp Pro Gly Asp Arg Arg Leu Thr Ala Leu Cys Gly Gly Glu Ala Leu Pro Arg Asp Leu Ala Asp Arg Leu Leu Gln Arg Thr Ala Ala Leu Trp Asn Leu Tyr Gly Pro Thr Glu Thr Thr Ile Trp Ser Ala Ile Gln Arg Val Thr Thr Gly Asp Gly Pro Val Ser Ile Gly Arg Pro Ile Ala Asn Thr Gln Leu Tyr Val Leu Asp Asp Arg Met Gln Pro Ala Pro Ile Gly Val Ala Gly Glu Leu Tyr Ile Gly Gly Ala Gly Leu Ala Arg Gly Tyr Leu Asn Arg Pro Glu Léu Ser Ala Asp Lys Phe Val Ala Asn Ser Phe Asp Pro His Gly Thr Arg Leu Tyr Arg Thr Gly Asp Leu Ala Arg Arg Gln Arg Asp Gly Ala Leu Glu Tyr Leu Gly Arg Ile Asp His 900 905 , 910 Gln Val Lys Ile Arg Gly Phe Arg Ile Glu Thr Gly Glu Ile Glu Ala Ala Val Arg Ser His Pro Ala Val Arg His Ala Val Val Thr Ala Arg Glu Asn Asp Ala Ala Gly Lys Tyr Leu Ala Ala Tyr Ile Val Pro Leu Ala Asp Gly His Arg Ala Thr Ala Ala Ala Asp Thr Phe His Asp Arg Val Glu Ser Glu His Val Thr Gln Trp Gln Ser Val Trp Asp Thr Thr .

Tyr Glu Gln Asn Ala Pro Asn Ala Asp Pro Glu Phe Asn Ile Val Gly Trp Arg Ser Ser Val Thr Gly Glu Pro Ile Pro Ala Ala Glu Met Arg Glu Trp Val Gln Asp Ser Val Asp Arg Ile Leu Ala Ser Arg Pro Arg Arg Val Leu Glu Ile Gly Cys Gly Thr Gly Leu Leu Leu Phe Arg Val Ala Pro His Cys Ser Glu Tyr Trp Ala Thr Asp Phe Ser Gln Lys Ala Leu Asp Tyr Ile Ala Ala His Ala Asp Arg Thr Gly Leu Ala Asn Val Arg Thr Phe Arg Gln Ala Ala Asp Asp Ala Cys Glu Ile Asp Ser Arg Ser Cys Asp Ala Val Val Leu Asn Ser Val Ile Gln Tyr Phe Pro Gly Glu Ala Tyr Leu Arg Arg Val Leu Ala Glu Ala Val Arg Val Val Lys Pro Gly Gly Ile Val Phe Val Gly Asp Val Arg Ser Leu Pro Leu Leu 1140 . 1145 1150 Glu Thr Phe Tyr Ala Ser Leu Glu Val Gln Arg Ala Pro Ala Ser Leu Thr Arg Asn Glu Phe Arg Gln Arg Val Arg Ser Leu Ala Ser Gln Glu Glu Glu Leu Val Val Asp Pro Ala Phe Phe Phe Ala Leu Arg Glu Gln Ile Pro Glu Ile Gly Arg Ile Glu Ile Leu Pro Arg Arg Gly Arg Ser His Asn Glu Leu Thr Arg Phe Arg Tyr Gln Ala Ile Leu His Ile Gly Ser Arg Glu Ala Glu Glu Pro Glu Ser Asp Arg Arg Arg Cys Gln Thr Ala Ala Glu Ile Arg Arg Val Leu Thr Asp Ala Gln Pro Glu Leu Ala Ala Phe Thr Glu Ile Pro Asn Ala Arg Leu Thr Ala Glu Sér Ala Ile Val Thr Trp Met Asn Gly Asp Glu Ala Pro Glu Thr Leu Gly Glu Leu Arg Asp Arg Leu Arg Gln Thr Ser Pro Ser Gly Val Asp Pro Ala Asp Leu Trp Arg Met Asp Glu Asp Leu Pro Tyr Arg Val Ala Ile Asp Trp Ser Ser His Gly Pro His Gly Arg Phe Asp Ala Thr Phe Cys Arg Ala Ala Ala Gly Pro Pro Ala Ser Arg Pro Arg Arg Arg Leu Ala Gly Pro Tyr Thr Asn Asp Pro Leu Arg Ala Val Tyr Thr Arg Thr Val Val Pro Gln Leu Arg Thr His Leu Lys Glu Lys Leu Pro Asp Tyr Met Ile Pro Thr Ala Trp Val Val Leu His Glu Met Pro Leu Thr Pro Asn Gly Lys Ile Asp, Arg Asn Ala Leu Pro Asp Pro Glu Pro Ser Arg Arg Ala His Ala Glu Ala Phe Thr Pro Pro Glu Thr Pro Val Glu Gln Val Leu Ala His Ile Trp Gly Glu Val Leu Gly Met Asp Gly Ile Gly Val His Asp His Phe Phe Asp Ser Gly Gly His Ser Leu Leu Val Thr Gln Met Ile Ala Arg Val Arg Asp Met Leu His Val Glu Val Pro Phe Arg Thr Val Phe Asn Ala Pro Thr Val Arg Gly Phe Ala Val Ala Ile Gln Asp Gly Val Asp Pro Gly Trp Ala Arg Arg Ala Ala Asp Leu Leu Ile Ala Val Ser Gln Met Ser Asp Val Gln Ile Glu Arg Met Met Ser Ala Ala Gln Asp <210> 122 <211> 2766 <212> PRT
<213> bacterie <400> 122 Met Gln Asn Ser Ser Pro Asn Thr Ile Asp Leu Ser Leu Ala Arg Arg Gln Leu Leu Asp Arg Leu Leu Gln Glu Asn Ser Pro Glu His Arg Ile Pro Arg Arg Glu Asn Arg Asp Ala Ala Pro Leu Ser Leu Ala Gln Gln Arg Leu Trp Phe Leu His Gln Leu Asp Pro Asp Ser Pro Ala Tyr Asn Ile Pro Ile Ala Leu His Ile Arg Gly Pro Leu Asp Ile Arg Val Leu Leu Arg Ser Leu Glu Ala Val Val Gln Arg His Glu Ser Leu Arg Ser Cys Ile Gly Gly Val Asp Gly Glu Ala Arg Gln Ser Leu Leu Ala Arg Val Thr Leu Glu Leu Pro Val Val Gln Ala Asp Gly Ile Ala Glu Ala Arg Gln Met Ala Leu Arg Asp Ala Gln Ile Pro Phe Asp Leu Arg Lys Pro Pro Leu Leu Arg Thr Lys Leu Ile Cys Leu Asp Asp Lys Gln Gln Ile Leu Leu Leu Thr Leu Ser His Ile Ile Ala Asp Ala Trp Ser Val Glu Thr Phe Val Arg Asp Leu Thr Arg Ser Tyr Glu Ala Phe Val Gln Gly Arg Pro Ser Pro Leu Met Glu Leu Pro Ile Gln Tyr Gly Asp Trp Ala Val His Gln Gln Thr Ser Leu Asn Gln Thr Ala Gln Gln Tyr Trp Lys Lys Gln Leu Ser Gly Thr Leu Pro Phe Leu Asp Leu Pro Thr Asp Arg Pro Arg Pro Ala Gln Gln Thr Trp Arg Gly Ala Val Glu Thr Thr Ala Leu Gly Arg Asp Leu Thr Asp Gly Leu His Ala Phe Ala Leu Arg Glu Gly Ala Thr Val Phe Met Thr Ala Ile Ala Ala Phe Gln Val Leu Leu His Arg Tyr Thr Ala Gln Glu Asp Ile Leu Ile Gly Val Pro Val Ala Gly Arg Thr Gln Arg Glu Thr Glu Gly Leu Val Gly Cys Phe Ala Asn Met Ile Val Leu Arg Gly Asp Leu Arg Asp Asp Pro Ser Phe Arg Ser Leu Leu Ala Arg Thr Arg Asp Thr Ala Leu Ser Ala Leu Ser His Gln Asp Phe Pro Phe Glu Arg Leu Val Glu Glu Leu His Pro Pro Arg Asp Leu Ser Arg Ser Pro Val Phe Gln Val Ser Phe Ala Leu Leu Pro Asp Ala Pro Ala Ile Thr Val Met Pro Gly Leu Thr Ile Ser Arg Glu Tyr Met His Asn Gly Gly Ser Lys Leu Asp Leu Gly Val Thr Leu Glu Pro Ser Gly Asp Gly Leu Met Ala Ser Ala Glu Tyr Asn Thr Asp Leu Phe Asp Ala Ala Thr Ile Ala Ser Leu Leu Asp Ala Tyr Arg Thr Leu Leu Ala Ser Val Val Thr Asp Pro Asp Val Arg Ile Ser Thr Ala Ala Leu Leu Ser Pro Ala Val Arg Ser Arg Met Leu Glu Gln His Asn Ala Thr Arg Arg Asp Ala Gly Pro Asn Gly Cys Ala His Glu Leu Val Glu Ala Gln Ala Glu Arg Thr Pro His Ala Val Ala Val Val Phe Glu Asp His Gln Leu Thr Tyr Ala Glu Leu Asn Ala Arg Ala Asn Arg Leu Ala His Arg Leu Ser Ala Ser Gly Ala Gly Pro Gly Lys Ile Ile Ala Leu Ala Met Glu Arg Ser Leu Glu Met Val Ile Ala Leu Leu Ala Ile Leu Lys Ser Gly Ser Ala Tyr Leu Pro Leu Asp Pro Ala His Pro Lys Asp Arg Leu Ala Arg Ile Leu Asp Glu Val Gln Pro His Ala Val Leu Thr Gln Glu Ala Val Ala Glu Met Met Ala Met Met Ala Met Met Ala Val Ala Val Glu Pro Glu Ala Ala Asn Leu Val Ser Gly Ser Lys Pro Asp Asp Leu Ala Tyr Ile Ile Tyr Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly Val Glu Ile Arg His Ser Ser Leu Val Asn Leu Leu Arg Ser Met Gln Arg Glu Pro Gly Leu Thr Ala Ala Asp Gly Leu Val Ala Val Thr Thr Val Ser Phe Asp Ile Ala Gly Leu Glu Ile Trp Leu Pro Leu Ile Thr Gly Ala Arg Val Ile Val Ala Thr Arg Glu Ile Val Val Asp Gly Glu Arg Leu Thr Thr Leu Leu Asp Lys Ser Gly Ala Thr Val Met Gln Ala Thr Pro Ser Gly Trp Arg Gln Leu Leu Asp Ser Gly Trp Lys Pro Gly Lys Gly Phe Arg Val Phe Cys Gly Gly Glu Ala Leu Prô Pro Glu Leu Ala Arg Arg Ile Leu Asp Ser Gly Val Glu Leu Trp Asn Leu Tyr Gly Pro Thr Glu Thr Thr Ile Trp Ser Ala Val His Lys Thr Gln Arg Leu Gly Ala Ser Asp Ser Ile Val Pro Ile Gly His Pro Ile Asp Asn Thr Gln Leu Tyr Ile Leu Asp Ser Arg Met Glu Pro Val Pro Pro Gly Val Pro Gly Glu Leu Tyr Ile Gly Gly Ala Gly Leu Ala Arg Gly Tyr His Arg Asn Pro Glu Leu Thr Arg Glu Lys Phe Arg Glu Trp Arg Asp Arg Gly Arg Ile Tyr Ser Thr Gly Asp Leu Ala Arg Tyr Arg Ser Asp Gly Ala Val Glu Cys Leu Gly Arg Val Asp Arg Gln Ile Lys Leu Arg Gly Phe Arg Ile Glu Pro Ala Glu Ile Glu Ala Ala Ile Glu Thr His Ile Ala Val Lys Gln Ala Ile Thr Val Val Lys Asp Asp Arg Leu Ile Ala Tyr Leu Val Pro Ala Thr Gly Asp Val Arg Asp Leu Gln Ser Asp Leu Arg Ser Trp Leu Ala Thr Arg Leu Pro Asp Tyr Met Ile Pro Ser Ala Phe Val Ser Leu Ser Ser Leu Pro Leu Thr Pro Asn Gly Lys Ile Asp Ala Asn Ala Leu Pro Gly Leu Pro Thr Thr Pro Val Ala Ala Arg Glu Pro Met Arg Gly Asp Val Val Glu Thr Ile Ala Ser Ile Trp Arg Glu Val Leu Arg Val Glu His Val Asp Tyr Arg Gln Asn Phe Phe Asp Val Gly Gly His Ser Leu Met Leu Thr Arg Val Arg Gly Leu Leu Glu Glu Arg Leu Gly Leu Thr Leu Ser Val Val Asp Leu Phe Arg His Thr Thr Ile Glu Ser Leu Ala Gly Leu Ala Glu Lys Ser Glu Pro Ala Ala Ala Glu Pro Ala Ala Ala Val Ala Glu Asp Arg Ile Ala Val Ile Gly Met Ala Gly Arg Phe Pro Gly Ala Arg Asn Val Glu Glu Phe Trp Arg Asn Leu Arg Asp Gly Val Asp Ser Ile Ala Arg Leu Ser Pro Glu Asp Leu Leu Ala Gly Gly Ile Ser Pro Glu Val Phe Gln Asp Pro Ser Tyr Val Pro Ala Lys Gly Leu Leu Asp Gly Ile Glu Phe Phe Asp Ala Ala Phe Phe Gly Tyr Ser Pro Arg Glu Ala Glu Ile Met Asp Pro Gln His Arg Val Phe Leu Glu Cys Ala Trp Glu Ala Met Glu Asn Ala Gly Tyr Ala Ala Arg Ser Tyr Lys Gly Ser Ile Gly Val Phe Ala Gly Cys Gly Val Asn Thr Tyr Leu Leu Asn Asn Leu Ala Thr Ala Glu Pro Phe Asp Phe Ser Arg Pro Ser Ala Tyr Gln Leu Leu Thr Ala Asn Asp Lys Asp Phe Leu Ala Thr Arg Val Ser Tyr Lys Leu Asn Leu Arg Gly Pro Ser Leu Thr Val Gln Thr Ala Cys Ser Thr Ser Leu Val Ser Val Val Met Ala Cys Glu Ser Leu Gln Arg Gly Ala Ser Asp Ile Ala Leu Ala Gly Gly Val Ala Ile Asn Val Pro Gln Ser Val Gly Tyr Leu His Gln Pro Gly Met Ile Leu Ser Pro Asp Gly Arg Cys Arg Ala Phe Asp Glu Ser Ala Gln Gly Thr Val Pro Gly Asn Gly Ala Gly Val Val Val Leu Lys Arg Leu Ser Arg Ala Leu Ala Asp Gly Asp Thr Ile Tyr Ala Val Ile Arg Gly Ala Ala Ile Asn Asn Asp Gly Ala Glu Arg Met Gly Phe Thr Ala Pro Gly Val Asp Gly Gln Thr Arg Leu Ile Arg Arg Thr Gln Glu Met Ala Gly Val Lys Pro Glu Ser Ile Gly Tyr Ile Glu Ala His Gly Thr Ala Thr Pro Leu Gly Asp Pro Val Glu Ile Ala Ala Ile Ala Ala Asn Phe Pro Lys Asn Gly Ser Gly Asp Val Tyr Ile Gly Ser Val Lys Thr Asn Ile Gly His Leu Asp Val Ala Ala Gly Val Ala Gly Leu Ile 1410 ~ 1415 1420 Lys Thr Val Leu Ala Val His Arg Gly Gln Ile Pro Pro Ser Leu Asn Phe Gln Arg Pro Asn Pro Arg Ile Asp Phe Ala Asn Thr Pro Phe Arg Val Ser Thr Arg Leu Leu Asp Trp Pro Ala Gly Lys Thr Pro Arg Arg Ala Ala Val Ser Ser Phe Gly Ile Gly Gly Thr Asn Ala His Val Ile Leu Glu Gln Ala Pro Pro Val Thr Pro Ala Ala Ala Ala Pro Glu Arg Ser Ala His Val Leu Cys Leu Ser Ala Asn Thr Asp Ala Ala Leu Glu Glu Leu Val Arg Ser Tyr Arg Gly His Met Asp Asn Gln Pro Gly Leu Ser Phe Gly Asp Val Ala Phe Thr Ala Asn Ala Gly Arg Val His Phe Pro His Arg Ile Cys Ile Val Ala Arg Ser Ser Asp Glu Ala Arg Gln Arg Leu Thr Glu Ala Arg Arg Val Arg Ile Ala Gln Thr Arg Pro Lys Ile Ala Phe Leu Phe Thr Gly Gln Gly Ala Gln Tyr Ala Gly Met Gly Arg Gln Phe Tyr Glu Ser Gln Pro Val Phe Arg Ala Ala Met Asp Glu Cys Ala Ala Leu Leu Asn Gly Arg Leu Asp Leu Pro Ala Leu Leu Ala Asp Asp Ala Leu Leu Asp Ala Thr Ala Gly Ala Gln Pro Ala Leu Phe Ala Leu Gln Trp Ala Leu Ala Gln Leu Trp Lys Ser Trp Gly Val Thr Pro Asp Leu Val Met Gly His Ser Val Gly Glu Tyr Ala Ala Ala Cys Ile Ala Gly Ala Val Ser Leu Pro Asp Ala Leu Gly Leu Val Ala Glu Arg Gly Arg Leu Met Gln Asn Leu Pro Glu Gly Ala Met Ala Ala Val Ser Ala Gly Glu Gln Arg Cys Ala Ala Ala Ile Thr Ser Arg Val Ser Ile Ala Ala Ile Asn Gly Pro Ala Glu Val Val Ile Ser Gly Ala Pro Gln Asp Ile Glu Ser Ala Leu Ala Thr Leu Arg Ala Glu Gly Ile Lys Thr Gln Met Leu Ala Val Ala Arg Ala Phe His Ser Ser Ser Met Asp Pro Ile Leu Ala Asp Leu Gln Arg Arg Ala Ala Ala Ile Ala Trp Arg Asn Pro Ser Ile Gly Leu Val Ser Asn Leu Thr Gly Lys Leu Ala Gly Glu Gly Gln Leu Ala Asn Pro Leu Tyr Trp Arg Asp His Ala Arg Asn 1810 1815 1820 ' Pro Val Arg Phe Ala Asp Gly Ile Gln Thr Leu Lys Asp Glu Gly Cys Asp Val Phe Leu Glu Ile Gly Pro Lys Pro Val Leu Leu Gly Met Gly Gln Lys Cys Leu Pro Asp Asp Ala Lys Gln Trp Leu Pro Ser Leu Arg Lys Gly Arg Asp Glu Trp Glu Thr Ile Leu Ser Ser Val Ala Thr Leu Tyr Gln Gly Gly Phe Asp Ile Asp Trp Gln Glu Phe Asp Arg Pro Tyr Ser Arg Arg Arg Val Ala Leu Pro Ala Tyr Pro Phe Glu Arg Arg Arg His Trp Ile Glu Arg Ser Ser Arg Pro Glu Pro Val Ala Val Ala Ser Gly Leu Val Gly Cys Arg Leu Ser Leu Pro Val Ala Asp Val Ile Phe Glu Ser Lys Leu Ser Thr Ala Ser Pro Leu Leu Ser Asp His Arg Tyr Tyr Gly Ser Val Val Ala Pro Ala Val Tyr Phe Leu Ala Met Ala Leu Glu Ala Ser Ala Glu Val Phe Gly Ala Gly Arg His Thr Leu Glu Asn Val Asn Phe Ala His Pro Leu Ile Leu Ser Ala Glu Arg Asp Thr Ala Val Gln Leu Val Leu Ser Gln Ser Asp Asp Arg His Ala Ser Phe Arg Ile Leu Ser Leu Ser Asp Gly Ser Trp Asn Leu His Ala Ala Gly Asn Ile Ala Ala His Ala Gly Val Ala Pro Val Pro Arg Leu Val Asp Glu Arg Arg Pro Ala Val Asp Gly Asp Thr Tyr Tyr Ser Leu Leu Arg His Leu Glu Ile Glu Leu Gly Pro Ser Tyr Arg Arg Ile Gln Arg Ile His Phe Gly Glu Gln Glu Ala Leu Ala Ala Ile Asp Ser Ala Thr Pro Leu Asn Pro Arg Cys Glu Leu Ala Glu Ala Gly Leu Gln Leu Leu Ser Ala Ala Ala Ser Pro Ala Leu Ala Asp Gly Ala Glu His Pro Ile Phe Ala 1l7 Pro Leu Gly Ile Asp Arg Val Cys Phe Tyr Gly Ser Leu Glu Gly Ala Val Trp Gly Ala Ala Gln Ile Leu Arg His Ser Pro Asp Gly Phe Thr Gly Glu Ala Gln Leu Leu Asp Ser Glu Gly Cys Val Leu Gly Glu Leu Gln Gly Val Ser Phe Arg Arg Val Thr Arg Ala Trp Ala Gln Arg Ser Glu Arg Lys Pro Glu Leu Tyr Glu Val Glu Trp Arg Pro Glu Pro Leu Arg Gln Pro Ser Arg Thr Leu Gln Pro Gly Ala Trp Leu Ile Leu Ala Asp Ser Gly Gly Ala Ala Arg Ala Leu Ala Asp Ala Leu Thr Ala Gln Gly Glu Met Cys Val Thr Val Pro Pro Ala Gly Glu Tyr Met Ser Leu Val Gly Glu Arg Asp Trp Arg Gly Ile Val Asn Leu Tyr Ser Leu Asp Asp Tyr Glu Leu Gly Cys Arg Ser Thr Leu Ala Leu Val Lys Ser Leu Lys Ser Gly Pro Arg Leu Trp Leu Val Thr Ala Gly Ala Gln Ala Thr Ser Ala Val His Asn Pro Met Gln Ala Ala Leu Trp Gly Phe Gly Arg Val Ile Ala Arg Glu His Pro Asp Leu Trp Gly Gly Leu Ile Asp Leu Asp Pro Asp Asp Ala His Ala Ser Ala Ala Gly Ala Ala Ala Gln Met Arg Asp Phe Asp Gly Glu Asp Gln Ser Ala Trp Arg Ser Asn Arg Arg Tyr Val Pro Arg Leu Thr Arg Arg Pro Ser Ala Arg Ala Ala Val Arg Leu Val Ser Gly Ala Thr Tyr Leu Ile Thr Gly Gly Leu Gly Ala Leu Gly Leu Thr Val Ala Lys Trp Met Val Glu His Gly Ala Thr Arg Val Val Leu Ala Gly Arg Arg Pro Pro Asn Glu Glu Gln Gln Arg Val Leu Gln Gln Ile Gly Ala Thr Ala Glu Thr Val Asp Val Ser Arg Glu Glu Glu Val Ala Asp Leu Ile Arg Arg Ile His Thr Glu Thr Ser Pro Leu Arg Gly Val Ile His Ala Ala Gly Val Leu Asp Asp Gly Val Leu Leu Asn Gln Asp Trp Thr Arg Ile Ala Ser Val Met Ala Pro Lys Ala Glu Gly Ala Val His Leu His His His Thr Arg Asp Leu Pro Leu Asp Phe Phe Val Leu Phe Ser Ser Ala Ser Ser Leu Leu Gly Pro Ala Gly Gln Ala Gly Tyr Ala Ala Ala Asn Ala Val Leu Asp Ala Leu Ala His His Arg Arg Gly Leu Gly Leu Pro Ala Thr Ser Ile Asn Trp Gly Arg Trp Ser Gly Ala Gly Met Ala Ala Arg Thr Ser Gln Ser Met Ala Gly Val Ala Ser Leu Ser Val Asp Glu Gly Leu His Ile Leu Glu Ala Val Leu His Glu Cys Pro Ile Gln Ile Ala Ala Leu Pro Ala Gly Ser Ile Thr Gly Glu Leu Leu Arg Pro Ala Ala Leu Pro Ser Pro Gln Leu Arg Thr Arg Leu Asn Glu Ala Thr Pro Arg Gln Arg Glu Ala Ile Leu Ile Ala His Ile Arg Glu Ser Leu Ala Arg Phe Val Gly Ile Ala Thr Ser Thr Pro Leu Asp Pro Gln Gln Pro Leu Gly Glu Leu Gly Leu Asp Ser Leu Met Ala Ile Glu Leu Arg Asn Ser Leu Ser Gln Ser Leu Gly Gln Pro Leu Pro Ala Ser Leu Leu Phe Asp Tyr Pro Ser Leu Asp Ala Ile Val Ser Tyr Val Leu His Ala Val Phe Pro Pro Glu Ala Ser Pro Val Glu Ala Pro Glu Phe Glu Asn Leu Ala Arg Glu Glu Leu Glu Ala Leu Leu Asp Ser Arg Leu Ala Gln Val Asp Gln Trp Leu Glu Thr Gln <210> 123 <211> 1763 <212> PRT
<213> batterie <400> 123 Met Ser Gly Ser Asp Asp Leu Ser Lys Leu Arg Arg Ala Val Ile Ala Leu Asp Lys Val Gln Lys Arg Ile Asp Gln Leu Glu Ser Ala Arg Ser Glu Pro Ile Ala Leu Ile Gly Ala Gly Cys Arg Phe Pro Gly Ala Ser Asn Leu Asp Ala Tyr Trp Ser Leu Leu Arg Glu Gly Arg Ser Ala Val Arg Glu Val Pro Pro Asp Arg Trp Asp Ile Asp Ala Tyr Tyr Asp Pro Asp Pro Gly Ala Thr Gly Arg Met Tyr Thr Arg Tyr Gly Gly Phe Ile Asp Gln Val Asp Arg Phe Asp Ala Arg Phe Phe Gly Ile Ala Pro Arg Glu Ala Ile Ser Leu Asp Pro Gln Gln Arg Leu Leu Leu Glu Val Thr Trp Glu Ala Ile Glu Asn Ala Gly Leu Pro Pro Asp Arg Leu Ala Gly Ser Arg Thr Gly Val Phe Met Gly Ile Phe Ser Asn Asp Tyr Tyr Asn Leu Gln Met Arg Gly Gly Asp Ala His Ile Asp Ala Tyr Thr Gly Thr Gly Asn Thr Ala Ser Val Ala Ala Gly Arg Leu Ser Tyr Ile Leu Gly Leu Gln Gly Pro Asn Met Ala Ile Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Val His Leu Ala Cys Gln Ser Leu Arg Ser Gly Glu Ser Asp Leu Ala Leu Ala Gly Gly Val Asn Leu Ile Leu Ser Pro Asp Arg Thr Ile Tyr Phe Cys Lys Leu Lys Ala Met Ala Ala Asp Gly Arg Cys Lys Ala Phe Asp Ala Ala Ala Asp Gly Tyr Val Arg Gly Glu Gly Cys Gly Val Val Val Leu Lys Arg Leu Ser Asp Ala Leu Arg Asp Arg Asp Pro Val Met Ala Val Ile Arg Gly Thr Ala Ile Asn Gln Asp Gly Arg Ser Asn Gly Leu Thr Ala Pro Asn Gly Pro Ala Gln Glu Ala Val Ile Arg Gln Ala Val Gly Asp Ala Arg Leu Gln Thr Leu Asp Val Ser Tyr Val Glu Ala His Gly Thr Gly Thr Pro Leu Gly Asp Pro Ile Glu Ala Gly Ala Leu Ala Ala Ala Leu Gly Ala Gly Arg Thr Asn Gly Asn Lys Leu Lys Leu Gly Ser Val Lys Thr Asn Phe Gly His Leu Glu Ala Ala Ala Gly Val Ala Ala Leu Ile Lys Val Ala Leu Met Leu Gln Asn Glu Ala 12l Ile Pro Pro His Leu Asn Leu Thr Thr Pro Ser Pro His Ile Asp Trp Asn Thr Leu Pro Leu Glu Ile Pro Ala Arg Leu Thr Pro Trp Pro Val Ala Pro Gly Gly Arg Arg Val Ala Gly Ile Asn Ser Phe Gly Leu Ser Gly Thr Asn Ala His Val Leu Ile Glu Gln Ala Pro Gln Gln Ala Ala Ser Ser Thr Pro Ala Pro Tyr Leu Leu Pro Leu Ser Ala Arg Ser Pro Glu Ala Leu Arg Asp Leu Ala Arg Ala Tyr Arg Asp Val Val Asn Asp Asn Pro Ala Asp Thr Cys Tyr Thr Ala Cys Ala Arg Arg Thr Ser Tyr Glu His Arg Ala Ala Phe Thr Gly Thr Asn Ala Gln Asp Leu Met Ala Gly Leu Asp Ser Phe Leu Ala Gly Asn Pro Asn Arg Asp Thr Ala Thr Gly Phe Val Pro Arg Gly Gln Lys Arg Lys Val Val Phe Val Leu Pro Gly Gln Gly Ser Gln Trp Pro Gly Met Gly Arg Asp Leu Met Ala Ser Glu Pro Val Phe Arg Ala Ala Ile Glu Glu Cys Gly Arg Ala Met Gln Pro Tyr Val Asp Trp Ser Leu Thr Gln Glu Leu Gln Gly Pro Leu Asp Arg Ile Asp Val Ile Gln Pro Ala Leu Phe Ala Val Gly Val Ala Leu Ala Gly Leu Trp Arg His Trp Gly Ile Glu Pro Asp Ala Val Ile Gly His Ser Met Gly Glu Val Ala Ala Ala His Ile Ala Gly Ala Leu Thr Leu Asp Glu Ala Ala Arg Val Ile Cys Leu Arg Ser Arg Met Leu Ala Gly Val Arg Gly Gln Gly Glu Met Ala Val Val Glu Leu Ala Leu Asp Glu Ala Ile Ala Ala Ile Ala Gly Arg Ser Asp Arg Val Ser Ile Ala Ala Ser Asn Ser Pro Arg Ser Thr Val Leu Ser Gly Asp Ser Ala Ala Leu Gly Glu Leu Leu Arg Glu Leu Glu Ala Lys Asp Val Phe Cys Arg Arg Val Lys Val Asp Ile Ala Ser His Ser His Leu Met Asp Ser Val Cys Ala Ala Leu Pro Gly Val Val Gly Ala Leu Gln Pro Arg Pro Ala Ala Leu Gly Met Tyr Ser Thr Val Thr Gly Ala Ala Ile Ser Gly Glu Glu Leu Val Ser Ala Tyr Trp Ala Arg Asn Leu Arg Gln Pro Val Met Leu Ser Thr Ala Val Ala Ala Ala Ala Ala Gly Gly His Asp Val Phe Leu Glu Leu Ser Pro His Pro Leu Leu Val Gln Pro Ile Gln Glu Thr Leu Gly Asp Arg Ala Ala Ile Ala Ala Ala Ser Leu Arg Arg Asp Glu Asp Gly Asn Leu Ala Leu Arg Arg Thr Leu Gly Ala Leu Leu Thr Asn Gly Val Thr Pro Asp Trp Ser Arg Ile Tyr Prô Asn Gly Gly Gln Thr Arg Arg Leu Pro Asn Tyr Pro Trp Gln Arg Glu Arg Tyr Trp Ile Asp Ile Arg Pro Pro Gln Val Glu Ser Gln Ala Leu Pro Gly Arg Arg Ile Pro Ser Pro Leu Pro Glu Met Gln Phe Glu Ser Thr Val Glu Ala Lys Asp Phe Ala Asp His Arg Leu His Asp Val Ile Val Thr Pro Gly Ala Trp His Leu Ala Met Ala Leu Ala Ala Ala Arg Gln Gly Leu Gly Ala Gly Pro His His Val Glu His Val Ser Leu Thr Gly Ala Leu Thr Leu Pro Glu Asn Asp Ala Ala Arg Gln Val Gln Leu Val Leu Arg His Glu Glu Gly Gly Gly Ala Ser Phe Arg Ile Tyr Ser Arg Glu Asp Ser Trp Lys Leu His Ser Glu Gly Met Leu Gln Ala Gly Asp Ser Thr Ala Ser Ile Asp Leu Asp Ala Ile Arg Ala Arg Cys Thr Ala Glu Leu Thr Ala Asp Ala Phe Tyr Ser Arg Leu Trp Asp Arg Gly Tyr His Phe Gly Pro Thr Phe Arg Thr Ile Gly Pro Ile Trp Arg Gly Asn Gly Glu Val Leu Cys Arg Val Asp Ile Pro Leu Thr Glu Met Gln Thr Ile Asp Cys Cys Leu Gln Leu Pro Ala Ala Leu Val His His Asp Asp Leu Lys Asp Val His Val Pro Val Gly Leu Asp Arg Phe Ser Leu Ala Glu Val Pro Thr Gly Pro Val Trp Gly Tyr Ala Val Leu Arg Pro Asp Ser Thr Val Asp Val Arg Leu Val Thr Gly Thr Gly Ser Val Val Ala Glu Leu Val Gly Leu Gln Ser Arg Val Ala His Ser Gly Gln Leu Gly Glu Ser Glu Ile Pro Thr Trp Thr Val Gln Trp Thr Ala Ser Val Arg Arg Gly Asp Ala Asn Ala Gly Asn Ala Gly Gly Pro Trp Leu Val Ile Gly Glu Pro Ala Ile Ala Glu Thr Leu Gln Lys Arg Gly Gln Thr Cys Arg Thr Ala Asp Thr Cys Ser Gly Pro Pro Cys Arg Gln Ile Val Tyr Cys Pro Ser Pro Arg Ile Asp Asp Leu Leu Ser Val Leu Arg Ser Ile Val Gln Ala Gly Trp Pro Glu Pro Pro Arg Leu Trp Leu Leu Thr Arg Gly Ser Ala Ala Val Leu Asn Ser Asp Lys Asp Ile Asp Ile Arg Gln Ala Trp Leu His 1265 1270 1275 ~ 1280 Gly Ile Gly Arg Thr Ile Ala Tyr Glu His Pro Glu Leu Arg Cys Thr Leu Val Asp Leu Asp Ala His Ser Asn Asp Cys Gly His Leu Ala Thr Leu Met Leu Ser Asn Ile Ala Glu Asp Gln Val Ala Ile Arg Gln Gly Thr Val Trp Ala Pro Arg Leu Ser Leu His Lys Ile Pro Ser Ala Pro Asp Val Ala Phe Arg Ala Asp Ala Thr Tyr Leu Ile Thr Gly Gly Leu Gly Gly Leu Gly Leu Gln Val Ala Gly Trp Leu Ala Ala Ala Gly Ala Arg His Leu Val Leu Leu Gly Arg Ser Glu Arg Pro Arg Pro Gln Leu Glu Gly Val Asn Val Lys Ile Ile His Ala Asp Val Ala Asp Arg Gln Gln Leu Ser Asp Ala Leu Ala Ile Ile Asp Arg Asp Met Pro Pro Leu Arg Gly Val Phe His Leu Ala Gly Thr Leu Ala Asp Gly Met Leu Leu Asn Leu Thr Thr Glu Arg Phe Glu Ala Ala Met Ala Pro Lys Val Ala Gly Ala Trp Asn Leu His Glu Leu Thr Ala Gly Arg Pro Leu Asp His Phe Val Leu Phe Ser Ser Ala Ser Ala Thr Val Gly Ser Pro Gly Gln Gly Asn Tyr Ala Ala Gly Asn Ser Phe Leu Asp Ala Leu Ala His Leu Arg Arg Ala Gln Gly Leu Pro Ala Val Ser Ile Ala Trp Gly Pro Trp Thr Gln Val Gly Leu Ala Ala Gln Ala Asn Arg Gly Asp Arg Leu Ala Ala Arg Gly Ile Ser Val Ile Gln Pro Gln Gln Gly Leu Arg Ala Leu Tyr Lys Ala Leu Thr Gln Ile Arg Pro His Val Ala Val Met Asn Phe Asp Ile Ala Gln Trp Leu Arg Tyr Tyr Pro Ser Ala Ala Ser Met Ser Leu Leu Ala Gly Ile Ala Pro Ala Ala Ala Asp Thr Lys Pro Ala Ala Asp Met Arg Ser Glu Leu Leu Ala Val Pro Ala Gly Arg Gln Arg Arg Ala Arg Leu Glu Thr Leu Leu Met His Glu Ala Gly His Val Leu Arg Phe Asp Pro Ala Lys Leu Asp Gly Arg Ala Thr Leu Gly Asp Leu Gly Phe Asp Ser Leu Met Ala Leu Glu Phe Arg Asn Arg Leu Glu Ala Gly Leu Arg Val Lys Leu Ser Ala Thr Leu Ile Trp Arg Tyr Pro Thr Phe Ser Ala Leu Ala Gln His Leu Ala Asp Lys Leu Gly Leu Pro Leu Glu Ser Met Ala Gly Asn Ala Glu Pro Ser Thr Val Ala Ala Val Ala Thr Leu Ala Thr Val Gly Thr Ala Ala Gly Glu Asp Arg Ser Pro Ala Ala Ala Asp Asp Leu Asp Ala Val Ala Asn Gln Ile Ala Gly Leu Gly Asp Lys Glu Ile Glu Ala Leu Leu Lys Gln Lys Phe Ala His Phe Ser Gly Ala Ser Glu <210>124 <211>2153 <212>PRT

<213>bacterie.

<400> 124 Met Ser Ser Ile Ser Glu Arg Phe Pro Asn Leu Thr Pro Leu Gln Gln Ala Tyr Leu Thr Leu Glu His Met Gln Arg Arg Leu Asp Ala Ala Glu Arg Asp Ala Arg Glu Pro Ile Ala Ile Val Gly Leu Gly Cys Arg Phe Pro Gly Gly Asp Gly Pro Asp Glu Phe Trp Gln Met Leu Arg Ser Gly Val Asp Ala Ile Arg Glu Val Pro Pro Gly Arg Trp Asp Glu Glu Ser Val Arg Arg Ile Leu Lys Ser Leu Asn Pro Ala Thr Pro Val Lys Ile Gln Ala Gly Phe Leu Asp Ser Ile Asp Gly Phe Asp Asn Asp Phe Phe Gly Ile Ser Pro Arg Glu Ala Val Ser Ile Asp Pro Gln Gln Arg Leu Leu Leu Glu Val Ala Trp Glu Ala Leu Glu Asp Ala Gly Gln Thr Met 130 135 ~ 140 Glu Gly Leu Ser Gly Ser Arg Thr Gly Val Phe Val Gly Ile His Ser Gln Ser Ser Asp Tyr Phe Trp Met Gln Thr Ala Asp Gly Ala Arg Ile Asp Pro Tyr Thr Ala Thr Gly Thr Ala His Ser Val Ile Ala Gly Arg Leu Ser Tyr Leu Leu Asn Leu Gln Gly Pro Ser Ile Ala Leu Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Cys Gln Ser Leu Arg Ser Gly Glu Cys Thr Leu Ala Val Ala Gly Gly Val Asn Leu Arg Phe Ser Pro Glu Phe Met Tyr Ala Thr Ser Lys Met Gly Thr Ala Ser Pro Ser Gly Arg Cys Arg Ala Phe Asp Ala Ala Ala Asp Gly Ile Val Phe Gly Glu Gly Cys Gly Val Val Val Leu Lys Arg Leu Ser Asp Ala Leu Ala Ala Gly Asp Arg Val Trp Ala Val Val Arg Gly Ser Ala Val Asn Gln Asp Gly Arg Ser Ala Gly Leu Thr Ala Pro Asn Val Val Ser Gln Gln Val Val Ile Arg Ser Ala Leu Ala Asn Ala Gly Val Ala Ala Gln Gln Ile Gly Tyr Ile Glu Ala His Gly Thr Gly Thr Pro Leu Gly Asp Pro Ile Glu Ile Glu Ala Leu Ala Glu Thr Val Gly Leu Pro Arg Pro Val Gly Asp Val Cys Ala Val Gly Ser Leu Lys Ser Asn Ile Gly His Leu Glu Gly Ala Ala Gly Ile Ala Gly Leu Ile Lys Ala Val Leu Ala Leu Ser His Glu Thr Ile Pro Pro Ser Leu His Val Arg Gln Leu Asn Pro Asn Ile Arg Leu Glu Gly Thr Ser Leu Asp Ile Val Lys Glu Val Arg Pro Trp Pro Ala Gly Ser Arg Arg Arg Phe Ala Gly Val Ser Ala Phe Gly Trp Ser Gly Thr Asn Ala His Val Val Leu Glu Glu Ala Ala Pro Thr Gly Arg Gly Glu Ala Ala Ser Gly Phe His Ser Arg Pro Pro Ala Ala Ala Ala Arg Ala Ala Val Pro Leu Ala Glu Gly Asp Thr Gly Gly Thr Pro Asp Ile Ala Gly Thr Pro Asp Thr Ala Asp Thr Pro Asp Thr Ala Asp Thr Pro Asp Ile Ala Gly Thr Ala Gly Thr Ala Ala Thr Thr Gly Ile Ala Asp Ala Met Tyr Val Leu Pro Leu Ser Ala His Gly Ala Asp Glu Leu Arg Arg.Val Ala Arg Ala Tyr Gly Glu Leu Leu Thr Ala Ser His Ala Pro Ser Leu Arg Asp Leu Cys Tyr Thr Ala Ala Val Arg Arg Thr His His Arg Cys Arg Leu Ala Val Ser Gly Arg Thr Ala Glu Glu Leu Ala Ala Gln Leu Gln Gly Ile Thr Ile Pro Ser Gln Arg Arg Lys Thr Val Phe Val Phe Ser Gly Gln Gly Ser Gln Trp Ile Gly Met Gly Arg Ser Trp Met Asp Arg Glu Pro Val Ile Arg Glu Ala Leu Glu Arg Cys Glu Ala Ala Met Arg Pro Tyr Val Asp Trp Ser Leu Lys Glu Glu Leu Ala Lys Leu Asp Arg Val Glu Val Ile Gln Pro Ala Leu Phe Ala Leu Gln Val Ala Ile Ala Ala Leu Trp Arg Ser Trp Gly Ile Glu Pro Asp Ala Val Ile Gly His Ser Met Gly Glu Val Ala Ala Ala His Val Ala Gly Ala Leu Thr Leu Gln Asp Ala Ala Arg Ile Ile Cys Ser Arg Ser Arg Leu Leu Ser Arg Ile Ser Gly Leu Gly Gly Met Ala Met Val Glu Leu Pro Leu Ala Glu Cys Glu Ala Val Leu Ser Thr Tyr Thr Glu Arg Leu Ser Pro Ala Val Ser Asn Gly Pro Asn Ser Thr Val Ile Ser Gly Glu Val Glu Ala Leu Ala Glu Val Val Ala Thr Leu Glu Arg Arg Gly Val Ser Cys Arg Pro Val Lys Val Asp Phe Ala Ala His Ser Pro Gln Val Asp Pro Leu Cys Asp Glu Leu Leu Gln Ser Leu Asp Gly Ile Gln Pro Arg Pro Ala Thr Ile Pro Phe Tyr Ser Thr Val Thr Gly Ala Thr Leu Glu Thr Thr Ser Leu Asp Ser Thr Tyr Trp Ala Arg Asn Leu Arg Ser Pro Val Leu Phe Trp Gln Gly Ile Arg His Leu Ala Asp Ser Gly His Asp Val Phe Leu Glu Ile Ser Pro His Pro Ile Leu Leu Pro Ala Ile Gly Gly Asn Ala Ala Leu Val Pro Ser Leu Arg Arg Asp Gln Asp Glu Arg Gly Ser Met Leu Thr Ser Leu Gly Ala Leu Tyr Glu Ala Gly His Thr Val Ala Trp Arg Thr Val Tyr Pro Ser Gly Asn Cys Val Arg Leu Pro Arg Tyr Pro Trp Gln Arg Arg Arg Phe Trp Leu Asp Ala Ser Pro Ala Arg His Ala Ile Thr Leu Gly Asn Pro Leu Leu Gly Lys Arg Val Glu Ala Ser Thr Gln Pro Gly Thr Phe Phe Trp Glu Thr Glu Leu Ser Leu Ala Ser Val Pro Trp Leu Ala Asp His Arg 980 985 ~ 990 Val Gln Gly Glu Val Val Leu Pro Ala Thr Ala Tyr Leu Asp Met Ala Leu Ala Gly Thr Ser Glu Thr Phe Gly Glu Ser Pro Cys Val Leu Glu His Val Thr Phe Thr Gln Met Leu Ile Val Pro Arg Asp Gly Ser Met Thr Leu Gln Leu Ala Ile Ala Val Asp Arg Pro Gly Met Ala Ser Phe Arg Ile Ser Ser Arg Gln Ala Ser Thr Trp Val Leu His Ala Ser Gly Asp Ile Arg Gln Thr Pro Ala Asp Ala Ser Thr Val Pro Pro Asp Ser Ala Glu Thr Val Gln Ala Arg Cys Pro Thr Val Val Pro Ala Ala Glu Leu Trp Arg Gln Met Ala Glu His Gly Val Glu Tyr Gly Pro Ala Phe Arg Ala Leu Glu Gln Ile Trp Ser Cys Pro Gly Glu Ala Ile Gly Arg Leu Arg Ser Ser Glu Thr Arg Ser Thr Ala Pro Ala Phe Leu Asp Ala Cys Leu Gln Ile Ile Ala Ala Ala Phe Gly Pro Ala Gly Gly Thr Trp Leu Pro Ala Gly Ile Asp Arg Met Arg Trp Leu His Pro Ala Arg Ser Val Val Trp Thr His Ala Arg Leu Glu Gly Pro Ile Ala Asp Leu Ser Leu Leu Asp Gly Glu Gly Gln Leu Val Ala Arg Ile Glu Gly Leu Arg Leu Gln Arg Leu Asp Ala Ser Glu Arg Ile Asp Met Arg Gly Trp Leu His Glu Leu Arg Trp Val Ala Gln Pro His Ala Ala Ala Glu Pro Pro Ala Ala Arg Ala Ala Arg Ser Trp Leu Ile Val Gly Ala Val Asp Ser Ala Leu Thr Ala Trp Leu Arg Ala Thr Gly Asn Arg Val Thr Gln Thr Ser Pro Glu Lys Leu Asp Glu Leu Gln Pro Pro Leu Glu Glu Ile Val Phe Leu Leu Glu His Glu Pro Ser Cys Asp Arg Ile Leu His Leu Leu Gln Thr Leu Gly Arg Thr Pro Trp Arg Gln Ala Pro Arg Leu Trp Leu 1315 1320 1325 .
Val Thr Arg Gly Ala Gln Pro Val Asp Gly Gln Ile Leu Gln Ala Gly Ile Ala Gln Ala Pro Phe Trp Gly Leu Gly Arg Thr Val His Tyr Glu His Pro Glu Leu Asn Cys Thr Leu Ile Asp Leu Asp Pro Ala Gly Gly 1365 , 1370 1375 Glu Glu Glu Leu Leu His Glu Leu Leu Thr Asn Asn Gly Glu Asn Gln Ile Ala Phe Arg Gly Gly Ala Arg Tyr Val Ala Arg Val Ala Arg His Glu Ala Asp Met Gln Pro Ala Met Phe Lys Ala Gly Asp Arg Pro Phe Arg Leu Glu Ile Asp Ala Pro Gly Val Leu Asp Arg Leu Arg Leu Arg Ala Thr Ser Arg Arg Pro Pro Gln Ala Gly Glu Val Glu Ile Glu Val Cys Ala Ala Gly Leu Asn Phe Leu Asp Val Leu Leu Ala Leu Gly Val Met Pro Asp Asp Ala Pro Gly Ala Ile Ala Gly Ser Pro Arg Leu Gly Gly Glu Cys Ser Gly Arg Ile Val Ala Met Gly Lys Gly Val Thr Asp Phe Arg Ile Gly Asp Glu Val Val Ala Leu Ala Pro Cys Ser Phe Gly Arg Phe Val Thr Thr Pro Ala Phe Arg Val Ala Leu Lys Pro Ala Asn Ile Pro Ala Glu Gln Ala Ala Ala Leu Pro Ile Ala Phe Leu Thr Ala Asp Tyr Ala Leu Ser Arg Ala Ala Arg Leu Ala Pro Gly Glu Arg Val Leu Ile His Ala Ala Thr Gly Gly Val Gly Leu Ala Ala Ile Gln Ile Ala Gln Arg Ala Gly Ala Glu Ile.Phe Ala Thr Ala Gly Ser Pro Glu Lys Arg Ala Tyr Leu Arg Ser Leu Gly Ile Ala His Val Ser Asp Ser Arg Ser Met Ala Phe Val Asp Asp Ile Arg Asn Trp Thr Asn Gln Glu Gly Val Asp Val Val Leu Asn Ser Leu Ser Gly Asp Leu Leu Glu Ala Ser Phe Asp Leu Leu Arg Asp His Gly Arg Phe Ile Glu Ile Gly Lys Arg Asp Tyr Tyr Ala Gly Arg Lys Leu Gly Leu Arg Pro Phe Leu Lys Asn Leu Ser Tyr Thr Leu Val Asp Leu Leu Gly Met Ser Leu Lys Arg Pro Ala Leu Thr Arg Glu Leu Leu Gln Glu Met Val Ala Lys Phe Glu Ser Glu Thr Trp Arg Pro Leu Glu Thr Arg Val Thr Thr Ile Thr Glu Ser Val Glu Ala Phe Arg Thr Met Ala Gln Ala Arg His Ile Gly Lys Ile Val Met Ala Met Arg Asp Cys Ala Asn Ala Pro Ile Ala Pro Leu Arg Ser Ala Phe Asp Ser Glu Gly Thr Tyr Leu Ile Thr Gly Gly Leu Gly Gly Leu Gly Leu Thr Val Ala Arg Trp Met Ile Gly Arg Gly Ala Arg Arg Leu Val Leu Leu Ser Arg Arg Ala Pro Ser Pro Glu Val Gln Gln Ala Ile Ala Val Met Asp Ala Asp Val Arg Thr Val Gln Ala Asp Val Ser Gln Arg Asp Glu Leu Glu Arg Val Ile Ser Ser Ile Asp Arg Leu Arg Gly Val Ile His Ala Ala Ala Val Leu Asp Asp Ala Leu Leu Leu Asn Gln Thr Glu Ala His Phe Arg Asn Val Met Ala Ala Lys Ile Asp Gly Ala Trp Asn Leu His Leu Leu Thr Arg Asp Cys Pro Leu Asp His Phe Val Leu Phe Ser Ser Ala Ala Gly Leu Leu Gly Ala Pro Ala Gln Gly Asn Tyr Ala Ala Ala Asn Ala Phe Leu Asp Ala Leu Ala Tyr Tyr Arg Lys Ala Gln Gly Leu Pro Ala Leu Ser Ile Gly Trp Gly Ala Trp Ser Glu Val Gly Leu Ala Ala Ala Gln Asp Asn Arg Gly Ser Arg Leu Ala Leu Arg Gly Met Glu Asn Leu Thr Pro Gln His Gly Leu Ala Ile Leu Glu Gln Leu Leu Asn Ser Ser Ala Cys His Val Ala Ala Met Pro Ile Asn Val Arg Gln Trp Arg Gln Phe Tyr Pro Lys Ala Ala Gln Ser Ala Leu Phe Glu Leu Leu His Asp Asp Ala Ala Ser Glu Ala Asp Ala Pro Asn Ala Leu Arg Ala Arg Leu Gln Ser Ala Glu Pro Gln Thr Arg Arg Thr Leu Leu Glu Glu His Leu Gln Gln Gln Leu Ala Arg Val Leu Arg Ile Asp Ser Gln Thr Ile Asp Pro Leu Arg Pro Leu Lys Glu Leu Gly Phe Asp Ser Leu Met Ala Leu Glu Phe Arg Asn Arg Leu Glu Leu Thr Leu Gly Leu Thr Leu Pro Ala Thr Leu Ile Trp Gly His Pro Thr Leu Ala Gly Leu Ala Pro His Leu Ala Ser Gln Met Gly Leu Pro Leu Val Glu Ala Gln Ala Ala Ala Ala Ala Glu Gly Asp Ser Arg Ala Met Lys Thr Ala Leu Ser Gly Leu Asp Asp Met Ser Glu Glu Ala Ala Val Ala Ala Leu Arg Gly Ala Arg Ser <210> 125 <211> 1695 <212> PRT
<213> bacterie <400> 125 Met Arg Glu Lys Ile Ala Pro Met Ser Ser Val Lys Leu Ala Leu Leu Ala Arg Asn Met Arg Gln Asn Ile Ala Gly Phe Asp Leu Val His Ala Glu Pro Ile Ala Ile Val Gly Met Ala Cys Arg Phe Pro Gly Gly Ala Lys Asn Pro Asp Ala Phe Trp Thr Leu Leu Lys Asn Gly Val Asp Gly Val Thr Glu Val Pro Pro Asp Arg Trp Asn Ser Asp Gln Tyr Tyr Ser Ser Asp Pro Asp Ala Pro Gly Lys Ala Tyr Ala Arg Tyr Ala Ala Phe Leu Glu Arg Ile Asp Gly Phe Asp Ala Glu Phe Phe Gly Ile Ser Pro Arg Glu Ala Leu Asn Met Asp Pro Gln Gln Arg Leu Leu Leu Glu Val Cys Trp Glu Ala Ala Glu Asp Ala Gly Ile Ser Pro Gly Pro Leu Ala Gly Ser Ala Thr Gly Val Phe Ala Gly Ser Cys Ala Gln Asp Phe Gly Leu Phe Gln Tyr Ala Asp Pro Ala Arg Ile Gly Ala Trp Ser Gly Ser Gly Val Ala His Ser Met Leu Ala Asn Arg Ile Ser Tyr Leu Leu Asp Leu Arg Gly Pro Ser Met Ala Val Asp Thr Ala Cys Ser Ser Ala Leu Val Ala Val His Leu Ala Cys Gln Ser Leu Arg Arg Arg Glu Cys Asp Ala Ala Phe Ala Gly Gly Val Asn Leu Ile Leu Thr Pro Glu Gly Met Ile Ala Leu Ser Lys Ala Arg Met Leu Ala Pro Asp Gly Arg Cys Lys Thr Phe Asp Ala Ala Ala Asp Gly Tyr Val Arg Gly Glu Gly Cys Gly Ile Val Leu Leu Lys Arg Leu Ser Asp Ala Leu Ala Asp Gly Asp Ala Ile Arg Ala Val Ile Arg Gly Ser Ala Ile Asn Gln Asp Gly Arg Ser Asn Gly Ile Thr Ala Pro Asn Leu Gln Ala Gln Lys Ala Val Leu Gln 305 310 ~ 315 320 Glu Ala Val Ala Asn Ala His Ile Asp Pro Ser His Val Ser Leu Ile Glu Ala His Gly Thr Gly Thr Ser Leu Gly Asp Pro Ile Glu Ile Glu Ala Leu Gln Ser Val Tyr Asp Ala Pro Asp Ser Ala Pro Cys Leu Leu Gly Ser Val Lys Thr Asn Ile Gly His Leu Glu Gly Ala Ala Gly Ile Ala Gly Leu Ile Lys Ala Val Leu Ala Leu Gln His Arg Thr Ile Pro Pro His Leu His Phe Arg Arg Leu Asn Pro Asn Ile Ser Leu Asp Gly Ser Arg Phe Arg Ile Ala Thr Glu Ser Ser Pro Trp Thr Ser Glu Gly Arg Pro Arg Leu Ala Gly Val Ser Ser Phe Gly Phe Gly Gly Ser Asn Ala His Val Ile Leu Glu Glu Ala Pro Ala Leu Pro Leu Pro Lys Pro Val Thr Arg Pro Gln Leu Leu Thr Leu Ser Ala Arg Thr Asp Glu Ala Leu Gly Glu Leu Ala Gly His Phe Ala Glu Phe Leu Gln Ser His Pro Asn Ala Leu Leu Ser Asp Val Cys Phe Thr Ser Gln Val Gly Arg Asp Ala Tyr Ser His Arg Leu Ala Ile Thr Ala Ala Asp Ala Ala Glu Ala Val Ala Ala Leu Ala Ala Ala Pro Arg Arg Glu Val Ser Leu Arg Arg Arg Pro Ala Ile Ala Phe Leu Phe Thr Gly Gln Gly Ala Gln Tyr Ala Gly Met Gly Ala Glu Leu Tyr Lys Thr Gln Pro Val Phe Arg Asp Ala Leu Asp Arg Cys Ala Asp Trp Leu Arg Pro Gln Leu Asp Val Pro Leu Thr Val Leu Leu Phe Glu Ser Val Ser Pro Leu His Glu Thr Ala Tyr 595 600 ' 605 Thr Gln Pro Ala Met Phe Ala Leu Glu Trp Ala Leu Ala Gln Phe Trp Leu Ser Leu Gly Val Arg Pro Asp Tyr Val Leu Gly His Ser Leu Gly Glu Tyr Val Ala Ala Cys Val Ala Gly Ala Phe Ser Val Glu Asp Gly Leu Arg Leu Val Thr Ala Arg Gly Arg Leu Val Asn Ala Leu Pro Arg Gly Lys Ala Val Ile Val His Ala Asn Pro Ser Arg Ile Ala Ala Leu Ala Ala Lys Val Ala Val Ala Ala Ser Asn Ala Pro Asp Arg Thr Val Ile Ser Gly Thr Ala Ala Glu Ile Ala Glu Ala Gln Asp Asp Leu His Arg Ala Gly Val Glu Thr Arg Glu Leu Asn Val Ser His Ala Phe His Ser Pro Leu Met Asp Pro Ile Leu Asp Lys Phe Glu Ala Leu Ala Gly Ala Ile Ala Tyr Gln Pro Leu Ala Ile Pro Leu Val Ser Asn Val Ser Gly Ala Val Leu Pro Lys Gly Thr Thr Leu Asp Ala Arg Tyr Trp Arg Arg Gln Leu Arg Glu Thr Val Gln Phe Glu Ser Ala Met Arg Thr Leu Ala Asp Arg Glu Cys Lys Leu Phe Leu Glu Ile Gly Pro His Pro Thr Leu Thr Thr Leu Gly Arg Tyr Cys Leu Pro Asp Asp Gly Ala Val Trp Leu His Ser Leu Ser Lys Gly Arg Ser Asp Trp Ser Val Leu Leu Glu Ser Leu Gly Gly Leu Phe Thr Ala Gly Val Asn Pro Asp Trp Arg Gly Leu Tyr Ala Gly Glu Ser Pro Ser Arg Val Ala Leu Pro Thr Tyr Pro Phe Gln Arg Asp Thr Phe Ser Leu Arg Arg Val Pro Ala Arg Glu Pro Ala Arg Gly Gly Met Leu Gly Ala Arg Leu Asn Ser Ala Leu Gly Asp Val Ile Phe Glu Asn Ser Leu Thr Thr Glu Thr Pro Leu Leu His Glu His Val Ile Tyr Asp Ala Val Ile Val Pro Gly Ala Trp His Val Ser Ala Phe Leu Glu Ala Ala Gln Glu Val Phe Gly Pro Val Pro Cys Ala Val Ser Asp Val Met Met Arg Gln Ala Leu Ala Ile Pro Pro Asp Thr Pro Val Thr Val Gln Ala Ile Val Thr Pro Gly Glu Asp Gly Glu Ala 980 985 . 990 Lys Val Gln Val Phe Ser Gln Asp Gly Asp Ser Trp Lys Leu His Thr Ala Ala Ser Leu Arg Ala Ala Thr Ala Gly Ala Val His Phe Glu Leu Pro Ala Gln Pro Ser Glu Val Ile Ser Gly Asp Ala Phe Tyr Gly Ala Met Asn Ala Arg Gly Val Asp Leu Gly Pro Ala Phe Ser Trp Val Glu Glu Val Trp Arg Arg Asp Gly Glu Ala Leu Gly Arg Met Arg Leu Pro Val Ala Glu Asp Gly Ala Asn Ala Tyr Arg Leu His Pro Gly Leu Ile Asp Ser Cys Phe Gln Val Phe Gly Ala Thr Trp Pro Ala Glu Arg Cys Gln Pro Gly Ala Tyr Val Pro Val Gly Ile Glu Ala Val Arg Phe Tyr Arg Pro Pro Ala Gly Ser Leu Arg Cys His Ala Arg Leu Arg Pro Ser Ser Ser Gly Pro Phe Val Gly Asp Leu Thr Leu Val Glu Glu Thr Gly Ala Val Ile Ala Glu Phe Ser Gly Leu Ala Val Met His Ala Gly Thr Leu Gln Ser Ala Gln Ser Trp Leu Gln Asp Val Gln Trp Gln Glu Cys Glu Arg Ser Thr Thr Leu Lys Ser Asp Gly Pro Gly Lys Pro Glu Asp Trp Leu Leu Cys Ala Gly Ala Asp Asp Val Ala Gly Leu Met Pro Gln Glu Leu Arg Val Val Ser Gly Val Thr Leu Arg Gln Ala Leu Glu Gln Thr Gln Thr Leu Val Gly Arg Pro Ala Arg Leu Trp Leu Ile Thr Arg Gly Val His Arg Ile Ser Asp.Asp Asp Ala Thr Pro Val Asp Pro Phe 1250 1255 1260 .
Gln Ala Pro Leu Trp Gly Leu Gly Gln Ala Ile Ala Arg Glu His Pro Glu Leu Trp Gly Gly Leu Ile Asp Leu Gly Cys Asp Asn Ala Asp Ile Ala Ala Ala Met Leu Leu Asp Glu Ile Arg Tyr Ala Gly Asp Asp Lys Ala Ile Ala Leu Arg Asn Gly Arg Arg Tyr Val Arg Arg Leu Val Arg His Lys Glu Thr Ser Lys Arg Pro Pro Ala Ile Ser Ala Asp Gly Val 1330 1335 ~ 1340 Tyr Leu Ile Thr Gly Gly Leu Gly Ala Leu Gly Arg Arg Val Ala Arg Arg Leu Ile Glu Gln Gly Ala Arg Arg Leu Val Leu Val Gly Arg His Thr Glu Ala Val Ala Asp Leu Glu Gln Léu Gly Ala Ala Val Met Val Ala Ala Cys Asp Val Ser Ser Glu Gln Gln Leu Ala Ala Leu Leu Ala Asp Pro Arg Thr Gln Pro Leu Arg Gly Val Val His Ala Ala Gly Val Leu Asp Asp Gly Val Val Thr Glu Gln Thr Trp Ala Arg Phe Glu Lys Val Leu Ala Pro Lys Leu Gln Gly Ala Trp Asn Leu His Gln Leu Thr Arg His His Ala Leu Asp Phe Phe Val Leu Phe Ser Ser Ala Ala Ser Leu Leu Gly Ser Ala Gly Gln Ser Asn Tyr Ser Ala Ala Asn Ala Phe Leu Asp Ser Leu Ala His Met Arg Arg Ala Gln Gly Leu Pro Ala Leu Ser Ile Asn Trp Gly Pro Trp Ala Gly Glu Gly Met Ala Ala Arg Ile Ala Arg Gln Gly Leu Pro Gly Val Pro Leu Leu Pro Pro Glu Val Gly Ala Arg Ile Phe Gly Asp Leu Leu Gly Glu Thr Ala Ala Gln Ile Ala Val Phe Gln Val Ser Ala Glu Lys Arg Arg Ser Pro Ala Ser Asp Pro Gly Phe Ile Gln Gln Leu Thr Glu Ala Ala Pro Glu Arg Arg Gln Glu Leu Leu Gln Met Arg Ile Arg Lys Gln Ala Gly Gly Val Leu Ala Leu Asp Ala Ser Lys Thr Leu Asp Pro Arg Arg Pro Leu Lys Glu Tyr Gly Leu Asp Ser Leu Met Ala Leu Asp Leu Ala Arg Ala Ile Gly Glu Leu Val Arg Lys Ser Leu Pro Ala Thr Leu Leu Tyr Asp His Pro Thr Val Glu Lys Leu Ala Gly His Val Leu Arg Glu Leu Gly Leu Asp Val Pro Ser Asp Ser Leu Val Asp Glu Val Arg Gln Leu Ser Glu Gln Glu Met Ala Ala Phe Ile Thr Glu Thr Leu His His Leu Gly Glu Glu Arg l41 <210> 126 <211> 1434 <212> PRT
<213> bacterie <400> 126 Met Ser Asp Leu Thr Pro Leu Gln Gln Ala Val Leu Ala Leu Lys Arg Thr Arg Ala Arg Leu Asp Glu Leu Glu Ser Val His Asn Glu Pro Ile Ala Ile Val Gly Met Ala Cys Arg Phe Pro Gly Ala Asp Ser Pro Glu Ala Phe Trp Gln Leu Leu His Asp Gly Ile Asp Ala Ile Arg Glu Ile Pro Ala Gly Arg Trp Asp Ala Asp Ala Phe Tyr Asp Pro Asp Pro Asn 65 70 75 ~ 80 Ala Pro Gly Lys Met Tyr Thr Arg Leu Gly Gly Phe Leu Asp Gly Ala Val Asp Gly Phe Asp Ala Gly Phe Phe Gly Ile Thr Pro Arg Glu Val Ala Gly Leu Asp Pro Gln Gln Arg Leu Leu Leû Glu Val Ala Trp Glu Ala Leu Glu Arg Ala Gly Arg Pro Pro Asp Ser Leu Ala Gly Ser Asp Thr Gly Val Phe Ile Gly Ile Ser Thr Asp Asp Tyr Ser Arg Leu Lys Pro Thr Asp Pro Ala Leu Ile Asp Ala Tyr Thr Gly Thr Gly Thr Ala Phe Ser Thr Ala Ala Gly Arg Ile Ser Tyr Leu Leu Gly Leu Gln Gly Pro Asn Phe Pro Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Val 195 ~ 200 205 His Leu Ala Cys Arg Ser Leu Gln Ser Arg Glu Cys Ser Met Ala Leu 210 215 ' 220 Ala Gly Gly Val Asn Leu Ile Leu Ala Pro Glu Ser Thr Ile Tyr Phe Cys Arg Leu Arg Ala Met Ala Ala Asp Gly Arg Cys Lys Ser Phe Ala Ala Ser Ala Asp Gly Tyr Gly Arg Gly Glu Gly Cys Gly Met Leu Val Leu Lys Arg Leu Ser Asp Ala Thr Arg Asp Gly Asp Arg Ile Leu Ala Leu Ile Arg Gly Ser Ala Val Asn His Gly Gly Arg Ser Asn Gly Leu Thr Ala Pro Asn Gly Pro Ala Gln Glu Ala Val Ile Arg Ala Ala Leu Lys Asn Ala Gly Met Ala Pro Ala Asp Val Asp Tyr Val Glu Ala His Gly Thr Gly Thr Pro Leu Gly Asp Pro Ile Glu Leu Arg Ala Met Ala Ala Val Leu Gly Glu Gly Arg Ala Val Asp Ser Pro Leu Ile Val Gly Ser Val Lys Thr Asn Phe Gly His Leu Glu Ala Ala Ala Gly Ile Ala Gly Leu Ile Lys Thr Ile Leu Ala Leu Gln His Arg Glu Ile Pro Pro His Leu His Phe Asn Ala Pro Asn Pro His Val Leu Trp Asn Glu Leu Pro Leu Lys Ile Ala Thr Ala Cys Ser Pro Trp Pro Ser Asn Gly Arg Pro Arg Val Ala Gly Val Ser Ser Phe Gly Ile Ser Gly Thr Asn Ser His Val Val Leu Ala Glu Ala Lys Thr Asn Val Glu Ala Lys Thr Asn Val Glu Ala Lys Thr Asn Val Glu Ala Lys Thr Ser Glu Glu Val Lys Ala Ser Val Glu Ala Lys Gly Asn Val Glu Ala Lys Ala Ser Ala Ser Val Pro Leu Leu Glu Gly Asp Ser Arg Pro Arg Ser Gly Gly Gly Gly Ser Gly Arg Pro Pro Ser Arg Glu Glu Val Pro Val Pro Asp Gln Leu His Ala Glu Asp Gly Arg Glu Tyr Leu Leu Pro Leu Ser Ala Arg His Pro Gln Ala Leu Arg Asp Leu Ala Gly Ala Tyr Arg Asp Gly Arg Phe His Ala Pro Leu Ser Ala Leu Cys Ser Ala Ala Ser Leu Thr Arg Ser His Tyr Glu His Arg Ala Ala Phe Val Ala Ser Ser Leu Pro Glu Phe Asn Gln Leu Leu Glu Ala Phe Arg Arg Asn Glu Thr Asn Arg Gly Val Ala Thr Gly Phe Ala Asp Pro Gly Val Arg Pro Lys Leu Ala Phe Ile Phe Ser Gly Gln Gly Gly Gln Tyr Pro Arg Met Ala Tyr Arg Leu Tyr Ser Asp Glu Pro Val Phe Arg Ser Ala Ile Glu Arg Cys Asp Ala Ala Phe Arg Ser Phe Val Glu Trp Arg Leu Ala Asp Leu Leu Ala Asp Glu Ser Gly Ala Trp Leu Ser Gln Ile Asp Arg Val Gln Pro Ala Leu Phe Ala Val Gln Ile Ala Leu Val Glu Leu Leu Gln Ser Trp Gly Ile Arg Pro Asp Gly Val Ala Gly His Ser Met Gly Glu Val Ala Ala Ala His Val Ala Gly Ile Leu Thr Leu Glu Asp Ala Ala Arg Ile Ile Cys Arg Arg Ser Arg Leu Leu Leu Gly Leu Arg Gly Arg Gly Ala Met Ala Leu Val Glu Leu Pro Leu Asp Arg Ala Lys Ala Val Leu Ala Glu Arg Gly Leu Thr Thr Val Ser Val Ala Ala Ser Asn Gly Pro Arg Ser Thr Val Phe Ser Gly Asp Arg Val Ala Leu Glu His Leu Lys Asp Asp Phe Glu Arg Arg Gly Val Phe Cys Arg Leu Ile Gln Val Asp Val Ala Ser His Ser Ser Gln Val Asp Pro Leu Glu Asn Glu Leu Arg Gln Glu Leu Gly Arg Val Ile Ala Lys Arg Ser Ala Val Pro Phe Phe Ser Thr Val Glu Gly Gln Leu Ser Thr Gly Glu Ala Cys Asp Ala Ser Tyr Trp Val Ala Asn Leu Arg Gln Pro Val Arg Phe Trp Glu Ser Leu Gln Ala Met Ala Gly Asp Glu Phe Thr Gln Phe Leu Glu Ile Ser Pro His Pro Val Leu Thr Pro Ser Ile Glu Asp Ser Leu Arg Thr Leu Gly Ile Asn Gly Leu Val Arg Pro Val Leu Arg Arg Asp Glu Pro Glu Arg Arg Glu Leu Leu Glu Leu Leu Ala Ala Leu Tyr Val Asn Gly Gln Arg Pro Asp Trp Arg Ala Leu Ala Ser Ser Pro Asp Thr Arg Leu Asp Leu Pro Thr Tyr Pro 945 950 , 955 960 Trp Gln Arg Glu Arg Phe Trp Phe Ala Thr Ser Thr Arg Arg Ser Leu Pro Ala Val Gly Gly His Pro Leu Leu Gly Arg Lys Val Glu Ile Ala Leu Ala Pro Asp Thr His Val Trp Glu Ser Val Leu Ser Leu Asp Ala Leu Pro Phe Leu Ala Asp His Arg Leu Asn Glu Leu Val Val Leu Pro Gly Ala Ala Tyr Val Glu Met Ala Leu Ala Ala Ala Lys Glu Val Phe Ala Gly Gly Cys Ser Leu Glu Glu Ile Arg Phe Glu Gln Met Leu Val Val Pro Ser Ala Gly Ala Ser Arg Val Gln Val Ile Leu Glu Gly His Ala Phe Arg Ile Ser Ser Leu Ala Glu Gly Gly Ser Asp Trp Thr Glu His Ala Arg Gly Thr Met Ala Ala Ala Pro Asp Lys Val Ala Pro Thr Val Ser Leu Pro Thr Leu Gly Asp Arg Ile Glu Gly Asp Asp Phe Tyr Ala Ala Phe Ala Ser Gln Gly Met His Tyr Gly Asp Thr Phe Arg Gly Ile Ala Glu Val Trp Arg Arg Asp Gly Glu Ala Val Ala Arg Leu Ser Val Pro Asp Ala Val Arg Glu Ala Glu Ser Gly Tyr Thr Leu His Pro Ala Leu Leu Asp Ala Cys Leu Gln Val Leu Gly Ala Thr Leu Gly Gly Glu Gly Ser Ala Gly Pro Cys Val Pro Val Ala Ile Glu Arg Leu His Cys Phe Gly Arg Pro Ala Gly Asp Leu Arg Val His Ala Arg Leu Thr Gly Arg Leu Glu Gly Asp Val Thr Leu Cys Asp Ala Glu Gly His Val Ile Leu Glu Val Gln Gly Leu Arg Ala Gln Glu Leu Glu Arg Gln Ser Glu Trp Phe His Ala Met Glu Trp Glu Pro Gln Leu Leu Ala Glu Ser Pro Thr Ala Thr Val Ser Gly Ala Trp Leu Val Ile Ala Asp Ala Gly Gly Ile Ala Ala Ala Val Ala Arg Gly Leu Gly Thr Asn Thr Val Val Ile Ser Gly Arg Asp Ala Glu Ile Pro Asp Gln Pro Tyr Arg Gly Val Ile His Cys Gly Ser Leu Asp Glu Thr Glu Asp Glu Thr Asp Pro Ser Ala Ala Gly Gly Thr Ala Cys Glu Asp Ile Leu Arg Ile Val Gln Glu Phe Gly Val Gly Arg Ile Gln Leu Thr Lys Gln Ala Ser Asp Ala Glu Ser Gln His Pro Arg Ile Trp Leu Ile Thr Ala Gly Val His Ala Glu His Leu Gln Met Pro Val Val Pro Ala Arg Ala Pro Val Trp Gly Leu 1380 ~ 1385 1390 Gly,Arg Thr Ile Ala Ala Glu His Pro Glu Phe Ala Cys Thr Cys Ile Asp Leu Asp Thr Ala Gly Glu Val Glu Val Gln Ala Leu Cys Arg Glu Ile Leu Ala Gly Ser Ser Glu Arg Gln Gly

Claims (81)

REVENDICATIONS
1. Procédé de préparation d'une collection d'acides nucléiques à partir d'un échantillon de sol contenant des organismes, ledit procédé comprenant la succession d'étapes suivante:
- I (a) Obtention de micro-particules par broyage d'un échantillon de sol préalablement séché ou dessiqué , puis mise en suspension des micro-particules dans un milieu tampon liquide ; et (b) extraction des acides nucléiques présents dans les micro-particules ; et (c)- passage de la solution contenant les acides nucléiques sur un tamis moléculaire, puis récupération des fractions d'élution enrichies en acides nucléiques et passage des fractions d'élution enrichies en acides nucléiques sur un support de chromatographie d'échange d'anions, puis récupération des fractions d'élution contenant les acides nucléiques purifiés.
2. Procédé de préparation d'une collection d'acides nucléiques à partir d'un échantillon de l'environnement contenant des organismes, ledit procédé
comprenant la succession d'étapes suivante:
- II (i) Obtention d'une suspension par dispersion de l'échantillon de l'environnement en milieu liquide puis homogénisation de la suspension par agitation douce; et (ii) séparation des organismes et des autres constituants minéraux et/ou organiques de la suspension homogène obtenue à l'étape (i) par centrifugation sur un gradient de densité ; et (iii) lyse des organismes séparés à l'étape (ii) et extraction des acides nucléiques; et (iv) purification des acides nucléiques sur un gradient de chlorure de césium.
3. Procédé selon la revendication 1, caractérisé en ce que l'étape I-(a) est suivie d'une étape complémentaire de:
- traitement des micro-particules en suspension dans un milieu tampon liquide par sonication ;
4. Procédé selon la revendication 1, caractérisé en ce que l'étape I-(a) est suivie des étapes complémentaires suivantes:
- traitement des micro-particules en suspension dans un milieu tampon liquide par sonication;
- incubation de la suspension à 37°C après sonication en présence de lysozyme et d'achromopeptidase;
- addition de SDS
- récupération des acides nucléiques.
5. Procédé selon la revendication 1, caractérisé en ce que l'étape I-(a) est suivie des étapes complémentaires suivantes:
- homogénéisation des micro-particules à l'aide d'une étape de mixage violent (vortex) suivie d'une étape de simple agitation;
- congélation de la suspension homogène suivie d'une décongélation ;
- traitement par sonication de la suspension après décongélation;
- incubation de la suspension à 37°C après sonication en présence de lysozyme et d'achromopeptidase;
- addition de SDS;
6. Procédé selon l'une des revendications 1 à 5 caractérisé en ce que les acides nucléiques sont des molécules d'ADN.
7. Procédé de préparation d'une collection de vecteurs recombinants, caractérisé en ce que les acides nucléiques obtenus par le procédé selon l'une des revendications 1 à 6 sont insérés dans un vecteur de clonage et/ou d'expression.
8. Procédé selon la revendication 7, caractérisé en ce que les acides nucléiques sont séparés en fonction de leur taille préalablement à
leur insertion dans le vecteur de clonage et/ou d'expression.
9. Procédé selon la revendication 7, caractérisé en ce que la taille moyenne des acides nucléiques est rendue sensiblement uniforme par rupture physique, préalablement à leur insertion dans le vecteur de clonage et/ou d'expression.
10. Procédé selon la revendication 7, caractérisé en ce que le vecteur de clonage et/ou d'expression est du type plasmide.
11. Procédé selon la revendication 7, caractérisé en ce que le vecteur de clonage et/ou d'expression est du type cosmide.
12. Procédé selon la revendication 11, caractérisé en ce qu'il s'agit d'un cosmide réplicatif chez E. coli et intégratif chez Streptomyces.
13. Procédé selon la revendication 12, caractérisé en ce qu'il s'agit du cosmide pOS7001.
14. Procédé selon la revendication 11, caractérisé en ce qu'il s'agit d'un cosmide conjugatif et intégratif chez Streptomyces.
15. Procédé selon la revendication 14, caractérisé en ce que le cosmide est choisi parmi les cosmides pOSV303, pOSV306 et pOSV307.
16. Procédé selon la revendication 11, caractérisé en ce qu'il s'agit d'un cosmide réplicatif à la fois chez E. coli et chez Streptomyces.
17. Procédé selon la revendication 16, caractérisé en ce qu'il s'agit du cosmide pOS 700R.
18. Procédé selon la revendication 11, caractérisé en ce qu'il s'agit d'un cosmide réplicatif chez E. coli et Streptomyces et conjugatif chez Streptomyces.
19. Procédé selon la revendication 7, caractérisé en ce que le vecteur de clonage et/ou d'expression est du type BAC.
20. Procédé selon la revendication 19, caractérisé en ce qu'il s'agit d'un vecteur BAC intégratif et conjugatif chez Streptomyces.
21. Procédé selon la revendication 20, caractérisé en ce que le vecteur est choisi parmi les vecteurs BAC pOSV403, pMBD-1, pMBD-2, pMBD-3, pMBD-4, pMBD-5 et pMBD-6.
22. Procédé de préparation d'un vecteur recombinant de clonage et/ou d'expression, caractérisé en ce que l'étape d'insertion d'un acide nucléique dans le vecteur de clonage et/ou d'expression comprend les étapes suivantes:
- ouvrir le vecteur de clonage et/ou d'expression à un site de clonage choisi, à l'aide d'une endonucléase de restriction appropriée;
- ajouter un premier acide nucléique homopolymérique à l'extrémité 3' libre du vecteur ouvert;
- ajouter un second acide nucléique homopolymérique, de séquence complémentaire au premier acide nucléique homopolymérique, à
l'extrémité 3' libre de l'acide nucléique de la collection à insérer dans le vecteur;
- assembler l'acide nucléique du vecteur et l'acide nucléique de la collection par hybridation du premier et du second acide nucléique homopolymérique de séquences complémentaires l'une de l'autre;
- refermer le vecteur par ligation.
23. Procédé selon la revendication 22, caractérisé en ce que - le premier acide nucléique homopolymérique est de séquence poly(A) ou poly(T); et - le second acide nucléique homopolymérique est de séquence poly(T) ou poly(A).
24. Procédé de préparation d'un vecteur recombinant selon l'une des revendications 22 ou 23, caractérisé en ce que la taille de l'acide nucléique à insérer est d'au moins 100 kilobases, préférentiellement d'au moins 200 kilobases.
25. Procédé de préparation d'un vecteur recombinant selon l'une des revendications 22 à 24, caractérisé en ce que l'acide nucléique à insérer est contenu dans la collection d'acides nucléiques obtenus par le procédé
selon l'une des revendications 1 à 6 .
26. Procédé de préparation d'un vecteur recombinant de clonage et/ou' d'expression, caractérisé en ce que l'étape d'insertion d'un d'acide nucléique dans le vecteur de clonage et/ou d'expression comprend les étapes suivantes:

- création de bouts francs sur les extrémités de l'acide nucléique de la collection par élimination des séquences 3' sortantes et remplissage des séquences 5' sortantes ;

- ouverture du vecteur de clonage et/ou d'expression à un site de clonage choisi, à l'aide d'une endonucléase de restriction appropriée ;

- création de bouts francs aux extrémités de l'acide nucléique du vecteur par élimination des séquences 3' sortantes et remplissage des séquences 5' sortantes, puis déphosphorylation des extrémités 5' ;

- Addition d'adaptateurs oligonucléotidiques complémentaires ;
insertion de l'acide nucléique de la collection dans le vecteur par ligation.
27. Procédé de préparation d'un vecteur recombinant selon la revendication 26, caractérisé en ce que la taille de l'acide nucléique à
insérer est d'au moins 100 kilobases, préférentiellement d'au moins 200 kilobases.
28. Procédé de préparation d'un vecteur recombinant selon l'une des revendications 26 ou 27, caractérisé en ce que l'acide nucléique à
insérer est contenu dans la collection d'acides nucléiques obtenus par le procédé selon l'une des revendications 1 à 6.
29. Procédé selon l'une des revendications 22 à 28, caractérisé en ce que les acides nucléiques sont insérés tels quels, sans traitement par une ou plusieurs endonucléases de restriction préalablement à leur insertion dans le vecteur de clonage et/ou d'expression.
30. Collection d'acides nucléiques constituée des acides nucléiques obtenus par le procédé selon l'une des revendications 1 à 6.
31. Acide nucléique caractérisé en ce qu'il est contenu dans la collection d'acides nucléiques selon le revendication 30.
32. Acide nucléique selon le revendication 31, caractérisé en ce qu'il comprend une séquence nucléotidique codant au moins un opéron, ou une partie d'un opéron.
33. Acide nucléique selon la revendication 32, caractérisé en ce que l'opéron code pour la totalité ou une partie d'une voie métabolique.
34. Acide nucléique selon la revendication 33, caractérisé en ce que la voie métabolique est la voie de synthèse des polykétides.
35 Acide nucléique selon la revendication 34, caractérisé en ce qu'il est choisi parmi les polynucléotides comprenant les séquences SEQ ID No 30 à 44 et SEQ ID No 115 à 120.
36. Acide nucléique selon la revendication 31, caractérisé en ce qu'il comprend la totalité d'une séquence nucléotidique codant pour un polypeptide
37. Acide nucléique selon l'une des revendications 31 à 36, caractérisé en ce qu'il est d'origine procaryote.
38. Acide nucléique selon la revendication 37, caractérisé en ce qu'il provient d'une bactérie ou d'un virus.
39. Acide nucléique selon l'une des revendications 31 à 33 et 36, caractérisé en ce qu'il est d'origine eucaryote.
40. Acide nucléique selon la revendication 39, caractérisé en ce qu'il provient d'un champignon, d'une levure, d'une plante ou d'un animal.
41. Vecteur recombinant caractérisé en ce qu'il est choisi parmi les vecteurs recombinants suivants:
a) un vecteur comprenant un acide nucléique selon l'une des revendications 35 à 40;
b) un vecteur obtenu selon le procédé de l'une des revendications 22 à
25 et 29;
c) un vecteur obtenu selon le procédé de l'une des revendications 26 à
29.
42 Vecteur caractérisé en ce qu'il s'agit du cosmide pOS 7001.
43. Vecteur caractérisé en ce qu'il s'agit du cosmide pOSV303.
44. Vecteur caractérisé en ce qu'il s'agit du cosmide pOSV306.
45. Vecteur caractérisé en ce qu'il s'agit du cosmide pOSV307.
46. Vecteur caractérisé en ce qu'il s'agit du cosmide pOS 700R.
47. Vecteur caractérisé en ce qu'il s'agit du vecteur BAC pOSV403.
48. Vecteur caractérisé en ce qu'il s'agit du vecteur pMBD-1.
49. Vecteur caractérisé en ce qu'il s'agit du vecteur pMBD-2
50. Vecteur caractérisé en ce qu'il s'agit du vecteur pMBD-3.
51. Vecteur caractérisé en ce qu'il s'agit du vecteur pMBD-4.
52. Vecteur caractérisé en ce qu'il s'agit du vecteur pMBD-5.
53. Vecteur caractérisé en ce qu'il s'agit du vecteur pMBD-6.
54. Collection de vecteurs recombinants tels qu'obtenus selon le procédé de l'une des revendications 7 à 21, 25 et 28.
55. Vecteur recombinant de clonage et/ou d'expression caractérisé
en ce qu'il est contenu dans la collection de vecteurs recombinants selon la revendication 54.
56 Cellule hôte recombinante comprenant un acide nucléique selon l'une des revendications 31 à 40 ou un vecteur recombinant selon la revendication 55.
57. Cellule hôte recombinante selon la revendication 56, caractérisée en ce qu'il s'agit d'une cellule procaryote ou eucaryote.
58. Cellule hôte recombinante selon la revendication 57, caractérisée en ce qu'il s'agit d'une bactérie.
59. Cellule hôte recombinante selon la revendication 58, caractérisée en ce qu'il s'agit d'une bactérie choisie parmi E. coli et Streptomyces.
60. Cellule hôte recombinante selon la revendication 58, caractérisée en ce qu'il s'agit d'une levure ou d'un champignon filamenteux.
61. Collection de cellules hôtes recombinantes, chacune des cellules hôtes constitutives de la collection comprenant un acide nucléique de la collection d'acides nucléiques selon la revendication 30.
62. Collection de cellules hôtes recombinantes, chacune des cellules hôtes constitutives de la collection comprenant un vecteur recombinant selon l'une des revendications 41 ou 55.
63. Procédé de détection d'un acide nucléique de séquence nucléotidique déterminée, ou de séquence nucléotidique structurellement apparentée à une séquence nucléotidique déterminée, dans une collection de cellules hôtes recombinantes selon l'une des revendications 61 ou 62, caractérisé en ce qu'il comprend les étapes suivantes:
- mettre en contact la collection de cellules hôtes recombinantes avec un couple d'amorces hybridant avec la séquence nucléotidique déterminée ou hybridant avec la séquence nucléotidique structurellement apparentée à une séquence nucléotidique déterminée ;
- réaliser au moins trois cycles d'amplification ;
- détecter l'acide nucléique éventuellement amplifié..
64. Procédé de détection d'un acide nucléique de séquence nucléotidique déterminée, ou de séquence nucléotidique structurellement apparentée à une séquence nucléotidique déterminée, dans une collection de cellules hôtes recombinantes selon l'une des revendications 61 ou 62, caractérisé en ce qu'il comprend les étapes suivantes:
- mettre en contact la collection de cellules hôtes recombinantes avec une sonde hybridant avec la séquence nucléotidique déterminée ou hybridant avec une séquence nucléotidique structurellement apparentée à la séquence nucléotidique déterminée ;
- détecter l'hybride éventuellement formé entre la sonde et les acides nucléiques compris dans les vecteurs de la collection.
65. Procédé pour identifier la production d'un composé d'intérêt par une ou plusieurs cellules hôtes recombinantes dans une collection de cellules hôtes recombinantes selon l'une des revendications 61 ou 62, caractérisé en ce qu'il comprend les étapes suivantes:
- culture des cellules hôtes recombinantes de la collection dans un milieu de culture approprié ;
- détection du composé d'intérêt dans le surnageant de culture ou dans le lysat cellulaire d'une ou plusieurs des cellules hôtes recombinantes cultivées.
66 Procédé pour sélectionner une cellule hôte recombinante produisant un composé d'intérêt dans une collection de cellules hôtes recombinantes selon l'une des revendications 61 ou 62, caractérisé en ce qu'il comprend les étapes suivantes :
- culture des cellules hôtes recombinantes de la collection dans un milieu de culture approprié ;
- détection du composé d'intérêt dans le surnageant de culture ou dans le lysat cellulaire d'une ou plusieurs des cellules hôtes recombinantes cultivées.
- sélection des cellules hôtes recombinantes produisant le composé
d'intérêt.
67. Procédé pour la production d'un composé d'intérêt caractérisé
en ce qu'il comprend les étapes suivantes :
- cultiver d'une cellule hôte recombinante sélectionnée selon le procédé
de la revendication 66;
récupérer et, le cas échéant, purifier, le composé produit par ladite cellule hôte recombinante.
68. Composé d'intérêt caractérisé en ce qu'il est obtenu selon le procédé de la revendication 67.
69. Composé selon la revendication 68, caractérisé en ce qu'il s'agit d'un polykétide.
70. Polykétide caractérisé en ce qu'il est produit grâce à
l'expression d'au moins une séquence nucléotidique comprenant une séquence choisie parmi les séquences SEQ ID N°30 à 44 et SEQ ID
N°115 à 120.
71. Composition comprenant un polykétide selon la revendication 69 ou 70.
72. Composition pharmaceutique comprenant une quantité
pharmacologiquement active d'un polykétide selon la revendication 69 ou 70, en association avec un véhicule pharmaceutiquement compatible.
73. Procédé de détermination de la diversité des acides nucléiques contenus dans une collection d'acides nucléiques et tout particulièrement d'une collection d'acides nucléiques provenant d'un échantillon de l'environnement, préférentiellement d'un échantillon du sol, ledit procédé
comprenant les étapes suivantes:
- mise en contact des acides nucléiques de la collection d'acides nucléiques à tester avec un couple d'amorces oligonucléotidiques hybridant à toute séquence d'ADN ribosomal 16 S bactérien;
- réalisation d'au moins trois cycles d'amplification;
- détection des acides nucléiques amplifiés à l'aide d'une sonde oligonucléotidique ou d'une pluralité de sondes oligonucléotidiques, chaque sonde hybridant spécifiquement avec une séquence d'ADN ribosomal 16 S
commune à un règne, un ordre, une sous-classe ou un genre bactérien;
- le cas échéant, comparer les résultats de l'étape de détection précédente avec les résultats de détection, à l'aide de la sonde ou de la pluralité de sondes, d'acides nucléiques de séquence connue constituant une gamme étalon.
74. Procédé selon la revendication 73, caractérisé en ce que le couple d'amorces hybridant à toute séquence d'ADN ribosomal 16 S
bactérien est constitué de l'amorce FGPS 612 (SEQ ID N°12) et de l'amorce FGPS 669 (SEQ ID N°13).
75. Procédé selon la revendication 73, caractérisé en ce que le couple d'amorces hybridant à toute séquence d'ADN ribosomal 16 S
bactérien est constitué de l'amorce 63 f (SEQ ISD N°22) et de l'amorce (SEQ ID N°23).
76. Acide nucléique comprenant une séquence nucléotidique d'ADNr 16S choisie parmi les séquences possédant au moins 99% d'identité
en nucléotides avec les séquences SEQ ID N° 60 à SEQ ID N° 106.
77. Procédé de production d'une polykétide synthase de type I, ledit procédé de production comprenant les étapes suivantes:
- obtention d'une cellule hôte recombinante comprenant un acide nucléique codant pour une polykétide synthase de type I comprenant une séquence nucléotidique choisie parmi les séquences SEQ ID N°33 à SEQ ID
N°44, SEQ ID N°30 à SEQ ID N°32 et SEQ ID N° 115 à
SEQ ID N°120.

- culture des cellules hôtes recombinantes dans un milieu de culture approprié;
- récupération et, le cas échéant, purification de la polykétide synthase de type I à partir du surnageant de culture ou du lysat cellulaire.
78. Polykétide synthase comprenant une séquence d'acides aminés choisie parmi les séquences SEQ ID N°45 à 59 et SEQ ID N°
121 à
SEQ ID N°126.
79. Anticorps dirigé contre une polykétide synthase selon la revendication 78.
80. Procédé de détection d'une polykétide synthase de type I ou d'un fragment peptidique de cette enzyme, dans un échantillon, ledit procédé
comprenant les étapes de:

a) mettre en contact un anticorps selon la revendication 79 avec l'échantillon à tester;

b) détecter le complexe antigène/anticorps éventuellement formé.
81. Nécessaire de détection d'une polykétide synthase de type I
dans un échantillon comprenant:

a) un anticorps selon la revendication 79;

b) le cas échéant, des réactifs nécessaires à la détection du complexe antigène/anticorps éventuellement formé.
CA002393041A 1999-11-29 2000-11-27 Procede d'obtention d'acides nucleiques a partir d'un echantillon de l'environnement, acides nucleiques ainsi obtenus et leur application a la synthese de nouveaux composes Abandoned CA2393041A1 (fr)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
FR9915032A FR2801609B1 (fr) 1999-11-29 1999-11-29 Procede d'obtention d'acides nucleiques a partir d'un echantillon de l'environnement, acides nucleiques ainsi obtenus et leur application a la synthese de nouveaux composes
FR99/15032 1999-11-29
US20980000P 2000-06-07 2000-06-07
US60/209,800 2000-06-07
PCT/FR2000/003311 WO2001040497A2 (fr) 1999-11-29 2000-11-27 Procede d'obtention d'acides nucleiques a partir d'un echantillon de l'environnement

Publications (1)

Publication Number Publication Date
CA2393041A1 true CA2393041A1 (fr) 2001-06-07

Family

ID=26235170

Family Applications (1)

Application Number Title Priority Date Filing Date
CA002393041A Abandoned CA2393041A1 (fr) 1999-11-29 2000-11-27 Procede d'obtention d'acides nucleiques a partir d'un echantillon de l'environnement, acides nucleiques ainsi obtenus et leur application a la synthese de nouveaux composes

Country Status (9)

Country Link
EP (1) EP1268764A2 (fr)
JP (1) JP2003520578A (fr)
KR (1) KR20020060242A (fr)
AU (2) AU781961B2 (fr)
BR (1) BR0015993A (fr)
CA (1) CA2393041A1 (fr)
IL (1) IL149846A0 (fr)
NO (1) NO20022532L (fr)
WO (1) WO2001040497A2 (fr)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010047029A1 (en) * 2000-04-26 2001-11-29 Handelsman Jo E. Triaryl cation antibiotics from environmental DNA
US7226739B2 (en) 2001-03-02 2007-06-05 Isis Pharmaceuticals, Inc Methods for rapid detection and identification of bioagents in epidemiological and forensic investigations
US20030027135A1 (en) 2001-03-02 2003-02-06 Ecker David J. Method for rapid detection and identification of bioagents
US20040121311A1 (en) 2002-12-06 2004-06-24 Ecker David J. Methods for rapid detection and identification of bioagents in livestock
US7666588B2 (en) 2001-03-02 2010-02-23 Ibis Biosciences, Inc. Methods for rapid forensic analysis of mitochondrial DNA and characterization of mitochondrial DNA heteroplasmy
US8073627B2 (en) 2001-06-26 2011-12-06 Ibis Biosciences, Inc. System for indentification of pathogens
US7217510B2 (en) 2001-06-26 2007-05-15 Isis Pharmaceuticals, Inc. Methods for providing bacterial bioagent characterizing information
FR2834997B1 (fr) * 2002-01-21 2004-03-19 Evialis Procede de detection de champignons producteurs d'ochratoxine a ou de citrinine
EP1386966A1 (fr) 2002-07-24 2004-02-04 Libragen Méthode pour l'expresssion de l'ADN environmental dans des cellules hôtes
WO2004018673A2 (fr) * 2002-08-20 2004-03-04 B.R.A.I.N. Biotechnology Research And Information Network Ag Isolement et clonage de l'adn d'organismes non cultives
EP1905833B1 (fr) 2002-10-08 2015-08-12 Aventis Pharma S.A. Polypeptides impliqués dans la biosynthèse des spiramycines, séquences nucléotidiques codant ces polypeptides et leurs applications
JP2006516193A (ja) 2002-12-06 2006-06-29 アイシス・ファーマシューティカルス・インコーポレーテッド ヒトおよび動物における病原体の迅速な同定方法
US8057993B2 (en) 2003-04-26 2011-11-15 Ibis Biosciences, Inc. Methods for identification of coronaviruses
US8158354B2 (en) 2003-05-13 2012-04-17 Ibis Biosciences, Inc. Methods for rapid purification of nucleic acids for subsequent analysis by mass spectrometry by solution capture
US7964343B2 (en) 2003-05-13 2011-06-21 Ibis Biosciences, Inc. Method for rapid purification of nucleic acids for subsequent analysis by mass spectrometry by solution capture
US8546082B2 (en) 2003-09-11 2013-10-01 Ibis Biosciences, Inc. Methods for identification of sepsis-causing bacteria
US8394945B2 (en) 2003-09-11 2013-03-12 Ibis Biosciences, Inc. Compositions for use in identification of bacteria
US8097416B2 (en) 2003-09-11 2012-01-17 Ibis Biosciences, Inc. Methods for identification of sepsis-causing bacteria
WO2005073377A1 (fr) * 2004-01-28 2005-08-11 Toudai Tlo, Ltd. Methode d’extraction de l’adn depuis un echantillon environnemental
US7666592B2 (en) 2004-02-18 2010-02-23 Ibis Biosciences, Inc. Methods for concurrent identification and quantification of an unknown bioagent
EP1766659A4 (fr) 2004-05-24 2009-09-30 Ibis Biosciences Inc Spectrometrie de masse a filtration ionique selective par seuillage numerique
US20050266411A1 (en) 2004-05-25 2005-12-01 Hofstadler Steven A Methods for rapid forensic analysis of mitochondrial DNA
WO2005121336A1 (fr) * 2004-06-08 2005-12-22 Toagosei Co., Ltd. Procédé de purification de l'adn environnemental et procédé de dépistage efficace du gène codant la protéine appartenant à l'adn environnemental
US7811753B2 (en) 2004-07-14 2010-10-12 Ibis Biosciences, Inc. Methods for repairing degraded DNA
WO2006135400A2 (fr) 2004-08-24 2006-12-21 Isis Pharmaceuticals, Inc. Procedes pour l'identification rapide d'organismes recombinants
WO2006094238A2 (fr) 2005-03-03 2006-09-08 Isis Pharmaceuticals, Inc. Compositions utilisees pour identifier des virus secondaires
US8084207B2 (en) 2005-03-03 2011-12-27 Ibis Bioscience, Inc. Compositions for use in identification of papillomavirus
WO2007014045A2 (fr) 2005-07-21 2007-02-01 Isis Pharmaceuticals, Inc. Procede pour l'identification et la quantification rapide de variants d'acide nucleique
CA2663029C (fr) 2006-09-14 2016-07-19 Ibis Biosciences, Inc. Procede d'amplification ciblee de genome entier pour l'identification d'agents pathogenes
JP5680304B2 (ja) 2007-02-23 2015-03-04 アイビス バイオサイエンシズ インコーポレイティッド 迅速な法医学的dna分析法
US9598724B2 (en) 2007-06-01 2017-03-21 Ibis Biosciences, Inc. Methods and compositions for multiple displacement amplification of nucleic acids
WO2010033599A2 (fr) 2008-09-16 2010-03-25 Ibis Biosciences, Inc. Cartouches de mélange, postes de mélange et kits, systèmes et procédés associés
US8534447B2 (en) 2008-09-16 2013-09-17 Ibis Biosciences, Inc. Microplate handling systems and related computer program products and methods
US8148163B2 (en) 2008-09-16 2012-04-03 Ibis Biosciences, Inc. Sample processing units, systems, and related methods
EP2358908B1 (fr) 2008-11-14 2014-01-08 Gen-Probe Incorporated Compositions et procédés pour la détection d'acide nucléique de campylobacter
EP2396803A4 (fr) 2009-02-12 2016-10-26 Ibis Biosciences Inc Ensembles sonde d'ionisation
US9194877B2 (en) 2009-07-17 2015-11-24 Ibis Biosciences, Inc. Systems for bioagent indentification
US8950604B2 (en) 2009-07-17 2015-02-10 Ibis Biosciences, Inc. Lift and mount apparatus
EP3225695A1 (fr) 2009-10-15 2017-10-04 Ibis Biosciences, Inc. Amplification de déplacement multiple
EP2325312A1 (fr) * 2009-11-19 2011-05-25 Qiagen GmbH Procédé d'enrichissement sélectif et d'isolement de microbes et en outre, optionellement, d'acides nucléiques viraux

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4900677A (en) * 1986-09-26 1990-02-13 E. I. Du Pont De Nemours And Company Process for rapid isolation of high molecular weight DNA
CA2219136A1 (fr) * 1995-04-24 1996-10-31 Chromaxome Corp. Procedes de generation et de criblage de nouvelles voies metaboliques
US6261842B1 (en) * 1997-10-23 2001-07-17 Wisconsin Alumni Research Foundation Microorganism genomics, compositions and methods related thereto
EP1090113A1 (fr) * 1998-06-23 2001-04-11 Biosearch Italia S.p.A. Procedes de transfert de la capacite de production d'un produit naturel dans un hote de production approprie

Also Published As

Publication number Publication date
IL149846A0 (en) 2002-11-10
WO2001040497A3 (fr) 2002-10-17
AU781961B2 (en) 2005-06-23
EP1268764A2 (fr) 2003-01-02
KR20020060242A (ko) 2002-07-16
NO20022532D0 (no) 2002-05-28
BR0015993A (pt) 2002-08-06
WO2001040497A2 (fr) 2001-06-07
AU2005211587A1 (en) 2005-10-13
NO20022532L (no) 2002-06-26
JP2003520578A (ja) 2003-07-08
AU2179101A (en) 2001-06-12

Similar Documents

Publication Publication Date Title
CA2393041A1 (fr) Procede d&#39;obtention d&#39;acides nucleiques a partir d&#39;un echantillon de l&#39;environnement, acides nucleiques ainsi obtenus et leur application a la synthese de nouveaux composes
CN113614055B (zh) 用于固氮微生物产品的具有提高的稳定性的聚合物组合物
CN108368517B (zh) 用于快速植物转化的方法和组合物
Gray et al. Phylogenetic analysis of the bacterial communities in marine sediments
Gebhard et al. Monitoring field releases of genetically modified sugar beets for persistence of transgenic plant DNA and horizontal gene transfer
KR20190017751A (ko) 피부 장애의 치료를 위한 조성물 및 방법
Goel et al. Genetic locus encoding functions involved in biosynthesis and outer membrane localization of xanthomonadin in Xanthomonas oryzae pv. oryzae
JP2000507444A (ja) 細胞工学および代謝工学のための方法および組成物
AU2017233862B2 (en) Methods and compositions for increased double stranded RNA production
CN109843909A (zh) 利用替代的葡萄糖转运蛋白产生鼠李糖脂的细胞和方法
US7255989B1 (en) Method for obtaining nucleic acids from an environment sample, resulting nucleic acids and use in synthesis of novel compounds
Smalla et al. Isolation and characterisation of plasmids from bacteria
Monier et al. Detection of potential transgenic plant DNA recipients among soil bacteria
WO2002059322A2 (fr) Compositions et methodes liees a la famille de genes biosynthetiques de la daptomycine
KR20100034055A (ko) 유전자 클러스터 또는 그의 일부를 클로닝하기 위한 벡터 및 방법
Sarovich et al. pPSX: A novel vector for the cloning and heterologous expression of antitumor antibiotic gene clusters
NZ519883A (en) Extraction of DNA from microorganisms in dry soil samples thereby identifying the diversity of the organisms present
MXPA02003819A (es) Procedimiento de obtencion de acidos nucleicos a partir de una muestra del medio ambiente, acidos nucleicos asi obtenidos y su aplicacion en la sintesis de compuestos.
WO2004027080A2 (fr) Procede d&#39;extraction d&#39;acides nucleiques a partir d&#39;echantillons microbiens
KR100952754B1 (ko) 토양 메타게놈에서 유래한 항생 활성을 암호화하는유전자군
Franche et al. Characterization of several tropical strains of Anabaena and Nostoc: morphological and physiological properties, and plasmid content
US10801031B2 (en) Shuttle vector, prokaryotic host cells, kit, and method for producing proteins
CN101142313A (zh) 编码产生地索拉唑类的合成途径的基因
Öztürk School of Engineering and Science
Añorga García et al. Multiple relaxases contribute to the horizontal transfer of the virulence plasmids from the tumorigenic bacterium Pseudomonas syringae pv. savastanoi NCPPB 3335

Legal Events

Date Code Title Description
EEER Examination request
FZDE Discontinued