WO2008047006A2 - Polynucleotides et polypeptides codes par lesdits polynucleotides impliques dans la voie de biosynthese de la congocidine et ses derives - Google Patents

Polynucleotides et polypeptides codes par lesdits polynucleotides impliques dans la voie de biosynthese de la congocidine et ses derives Download PDF

Info

Publication number
WO2008047006A2
WO2008047006A2 PCT/FR2007/001721 FR2007001721W WO2008047006A2 WO 2008047006 A2 WO2008047006 A2 WO 2008047006A2 FR 2007001721 W FR2007001721 W FR 2007001721W WO 2008047006 A2 WO2008047006 A2 WO 2008047006A2
Authority
WO
WIPO (PCT)
Prior art keywords
seq
orf
congocidin
polynucleotide
identity
Prior art date
Application number
PCT/FR2007/001721
Other languages
English (en)
Other versions
WO2008047006A8 (fr
WO2008047006A3 (fr
WO2008047006A9 (fr
Inventor
Maud Juguet
Sylvie Lautru
François-Xavier FRANCOU
Muriel Gondry
Jean-Luc Pernodet
Original Assignee
Commissariat A L'energie Atomique
Centre National De La Recherche Scientifique
Universite Paris Sud 11
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Commissariat A L'energie Atomique, Centre National De La Recherche Scientifique, Universite Paris Sud 11 filed Critical Commissariat A L'energie Atomique
Publication of WO2008047006A2 publication Critical patent/WO2008047006A2/fr
Publication of WO2008047006A3 publication Critical patent/WO2008047006A3/fr
Publication of WO2008047006A8 publication Critical patent/WO2008047006A8/fr
Publication of WO2008047006A9 publication Critical patent/WO2008047006A9/fr

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/36Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Definitions

  • the present invention relates to novel polynucleotides, and polypeptides encoded by said polynucleotides, involved in the biosynthetic pathway of an antibiotic of the family of pyrrolamides, to vectors comprising said polynucleotides, to microorganisms transformed by said polynucleotides, to applications of said polynucleotides and polypeptides.
  • Congocidin (Figure 1) was isolated in 1952 by Cosar et al. in Streptomyces ambofaciens (Cosar et al., 1952). This molecule, whose structure was determined in 1967 (Julia & Preau-Joseph, 1967), is identical to another molecule, isolated a year previously in Streptomyces netropsis, the netropsin (Finlay et al, 1951). Both names are still used today. Sometimes this molecule is also called sinanomycin. Congocidine is a pyrrolamide (also called oligopyrrole or oligopeptide).
  • This family of secondary metabolites produced by bacteria of the genus Streptomyces or other related actinobacteria, groups together molecules characterized by the presence in their structure of 2-carbonyl-4-aminopyrrole groups (FIG. 1A). There are also some molecules related to this family, such as amidinomycin, noformycin or proximicins ( Figure 1B).
  • Pyrrolamides and related molecules have a variety of biological activities (see Table I below).
  • pyrrolamides (congocidin, distamycin, TAN 868A and kikumycins) have antiviral and antimicrobial activities.
  • Noformycin is an inhibitor of the inducible nitric oxide synthase, an enzyme involved in inflammatory diseases such as arthritis (Gordon Green et al, 1996).
  • pyrronamycins A and B showed antitumor activity against sarcoma 180 in murine tumor models in vivo (Asai et al, 2000).
  • Another biological activity of these molecules of interest is their ability to bind, at least for a number of inputs (congocidin, distamycin and pyrronamycins), to the DNA, in the small groove of the double helix , with some sequence specificity (three to four consecutive A / T bases, strong G / C pair discrimination) (Neidle, 2001).
  • distamycin and congocidin have been used and still serve as models for the study of small ligand binding in the small groove of DNA (Aleman et al, 1996, Van Hecke et al, 2005).
  • These molecules have been shown to bind to DNA reversibly, non-covalently, through hydrogen bonds, Van der Waals contacts, and electrostatic interactions (Dolenc et al, 2005).
  • Congocidin and distamycin are not among the best anticancer agents binding in the small groove of DNA because their binding is not covalent. Nevertheless, over the last fifteen years, many analogs or hybrids of congocidin and distamycin have been synthesized to modify and increase the specificity of DNA binding and to create molecules capable of binding specifically and covalently to DNA (Dyatkina et al, 2002, Khalaf et al, 2004).
  • Such molecules could indeed be used to reduce the expression of specific genes in diseases such as cancer, or be coupled to monoclonal antibodies, as is already the case for another molecule binding in the small groove of the DNA, calichéamicine bound to monoclonal anti-CD33 antibody gemtuzumab ozogamicin (Mylotarg®) (Harris, 2004).
  • Congocidin and distamycin have thus already been used as sequence-specific transporters of DNA alkylating agents, as in the case of tallimustine, which has been studied in Phase I and II clinical trials as an agent.
  • anticancer drugs (Denny, 2001). Analogs of these molecules have also been coupled with known anti-cancer agents such as anthramycin (specific for G / C-rich regions), and the hybrid molecules have antitumor properties (Baraldi et al., 2003).
  • cgc gene cluster comprises 22 open reading frames, or ORFs, ORF22, coding for polypeptides of the biosynthetic pathway of congocidin in S. ambofaciens.
  • genes corresponding to these 22 ORFs are respectively called cgc3 *, cgc2 *, cgc1 *, cgc1, cgc2, cgc3, cgc4, cgc5, cgc ⁇ , cgc7, cgc8, cgc9, cgc10, cgcl1, cgc12, cgc13, cgc12, cgc1. 5, cgcl 6, cgcl 7, cgcl 8 and cgcl 9. They were sequenced and the corresponding polypeptide sequences were deduced from the nucleotide sequences.
  • Table II shows the correspondence between these ORFs 1 to 22, the names of the genes (cgc 3 * to cgc1 * and cgc1 to cg1c), the names of the corresponding polypeptides (Cgc3 * to Cgc1 * and Cgc1 to Cgc19) as well as the corresponding nucleotide and polypeptide sequence numbers of the attached sequence listing.
  • the cgc gene cluster is represented by the sequence SEQ ID NO: 49.
  • Table III indicates, for each of said genes, the characteristics relating to the location on said sequence SEQ ID NO: 49, to the putative activity of the translation product (predictions based on BLAST results (Altschul et al., 1997), PSI-BLAST (Schäffer et al., 2001) and CD SEARCH (Marchler-Bauer and Bryant, 2004)), as well as the comparison, in terms of percent identity and similarity, of the corresponding polypeptide sequence with the sequence of the Genbank® database polypeptide with the highest BLAST score (Altschul et al, 1997), using the default parameters.
  • % id corresponds to the percentage of identity
  • % sim corresponds to the percentage of similarity provided by BLAST between the sequence of the analyzed protein and the sequence of the protein identified by BLAST as the most similar.
  • the cgc3 * (ORF1) gene codes for a polypeptide having sequence homology with an acyl-CoA synthetase, suggesting that it could activate the carboxyl group of the putative guanidino-acetate precursor ( Figure 2); the four genes cgc2, cgcl ⁇ , cgcl ⁇ and cgcl9 (ORFs 5, 19, 21 and 22) encode proteins with homologies with NRPS ("No
  • the cgc4 gene when the cgc4 gene is deleted, the amount of synthesized congocidin is greatly decreased and a biosynthesis intermediate accumulates in the culture medium; a level of congocidine production comparable to that observed with the complete cgc cluster is restored with the addition of cytosine in the culture medium; in this case, the intermediary of biosynthesis no longer accumulates;
  • the cgc1 gene (ORF18) encodes a polypeptide having sequence homology with a methyltransferase, suggesting the involvement of the Cgc1 polypeptide in the methylation of the nitrogen atom of the two pyrrole moieties of congocidin; the inventors have shown that the deletion of the cgc1 gene blocks the biosynthesis of congocidin and allows the biosynthesis of a derivative of congocidine, N, N-demethylcongocidine; the genes cgcl * and cgc2 * (ORF3 and ORP2) encode polypeptides
  • Binding Cassette "). These polypeptides have homologies with the NetP2 and NetPl polypeptides, involved in the resistance to congocidin in Streptomyces netropsis.
  • the cgc1 (ORF4) gene encodes a polypeptide having sequence homologies with a helical-Loop-Helix LuxR family regulator, suggesting that it could regulate the biosynthesis of congocidin at the transcriptional level. It should be noted that this gene is the only one of the cgc group to contain a UUA codon, a rare codon in Streptomyces.
  • the inventors have experimentally demonstrated that the deletion of one of the genes cgc3 *, cgc2,, cgc1, cgc10, cgc15, cgc12, cgc18 and cgc13 blocks the biosynthesis of congocidin in S. anibofaciens or in a heterologous expression system. in S. lividans, which confirms their involvement in this pathway of biosynthesis.
  • the deletion of cgc4 the amount of synthesized congocidin is greatly decreased and a biosynthesis intermediate accumulates in the culture medium.
  • the inventors have further experimentally shown that the genes cgc2 * and cgc1 * are indeed involved in congocidin resistance.
  • the inventors hypothesized that the genes cgc4, cgc5 and cgc ⁇ are involved in the biosynthesis of the amidinium precursor and have experimentally validated this hypothesis for cgc4.
  • sequence analysis of the cgc gene cluster suggests an original biosynthetic pathway for congocidin, a molecule whose origin of putative, unusual precursors can not be predicted.
  • the cgc2 *, cgcl * and cgi genes are not essential for the synthesis of congocidine or its derivatives: the cgi gene makes it possible to improve the level of expression of the other cgc genes; cgc2 * and cgc1 * genes are useful for conferring resistance to congocidin or a derivative of congocidin by excreting these molecules into the culture medium.
  • the isolation of the cgc gene cluster may give access to new groups of genes involved in the biosynthesis of pyrrolamides.
  • the search, in actinobacteria, for sequences homologous to the ORF sequences of the cgc group could indeed allow the isolation and characterization of other genes and / or groups of genes involved in the biosynthetic pathway of other pyrrolamides than congocidin. or molecules derived from congocidin, such as nontoxic derivatives.
  • the inventors have succeeded in synthesizing several derivatives of congocidine, such as 17-methylcongocidine, 17-fluorocongocidine or N, N-demethylcongocidine.
  • the subject of the present invention is thus the use of a polynucleotide for the production of congocidine or of a congocidin derivative, said polynucleotide being selected from the group consisting of: a) a polynucleotide comprising all the open reading phases ORF 1 and ORF 5 to ORF 22, coding respectively for the polypeptides of the congocidine biosynthetic pathway Cgc3 * (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO : 24), CgClO (SEQ ID NO: 26), CgCl1 (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30
  • hybridization is known to those skilled in the art, and refers to the coupling mechanism of nucleic acids, in particular according to their respective sequences. Hybridization can be total or partial.
  • the nucleic acid hybridizing to the polynucleotide according to the invention is therefore usable to replace one of the nucleic acid sequences as defined above, as well as also according to its length, as RNA or DNA probes in analyzes.
  • Northern blot or Southern blot type It can also be used as a primer in PCR type analyzes (polymerase chain reaction). In the latter case, the primer preferably comprises at least 15 nucleotides.
  • the expression "under stringent conditions” refers, for example, to an incubation overnight at 60 ° C. in a solution comprising 6 ⁇ SSC (900 mM NaCl, 90 ⁇ M sodium citrate), 5 ⁇ Denhart's solution, 0.5 ⁇ % (w / v) of SDS, 100 ⁇ g / ml of sheared and denatured salmon sperm DNA, followed for example by washing in a solution of 0.2 x SSC at 65 ° C. - According to the According to the present invention, the expression “derivative of congocidine” is used to designate any bioactive molecule that can be synthesized by the polynucleotides according to the invention, said bioactive molecule.
  • an antibiotic of the pyrrolamide family other than congocidin can also be any molecule structurally and / or functionally close to the congocidine.
  • it is a non-toxic derivative of congocidin.
  • structurally close derivatives of congocidin are the molecules shown in FIG. 1.
  • Other examples of structurally close derivatives are fluorinated, methylated, demethylated, distamycin bromine derivatives, 17-methylcongocidin, 17-fluorinated congocidin, or N, N-demethylcongocidine.
  • Examples of functionally close derivatives are molecules capable of binding to DNA in the small groove of the double helix, with some sequence specificity as described above for congocidin, distamycin and pyrronamycins.
  • biosynthetic pathway of congocidine or a derivative of congocidin is used to designate all the proteins encoded by the cgc gene cluster and leading to the synthesis of congocidin or a derivative of congocidin.
  • the biosynthetic pathway includes in particular: the actual biosynthesis of the congocidine or of a derivative, that is to say the assembly of the various constituents of this molecule.
  • This category includes, in particular, the Cgc4, Cgc5 and Cgc6 proteins involved in the biosynthesis of the amidinium precursor or the Cgc3, Cgc8, Cgc9, Cgcl1, Cgc12, Cgc14 and Cgc17 proteins, which could be involved in the biosynthesis of pyrrole groups, and especially the 4-amino-2-carboxypyrrole group.
  • This synthesis can occur in a microorganism endogenously comprising the cgc gene cluster (eg Streptomyces ambofaciens), as well as in a suitable heterologous expression system, such as a recombinant cell (e.g.
  • the culture medium comprises suitable precursors, chosen as a function of the polynucleotide used and / or depending on the derivative that it is desired to obtain.
  • suitable precursors chosen as a function of the polynucleotide used and / or depending on the derivative that it is desired to obtain.
  • a culture medium comprising 5-methylcytosine or 5-fluorocongocidin.
  • This synthesis can also take place, partially or totally, in a cell-free system implementing the Cgc proteins chosen according to the molecule to be synthesized (congocidin or derived from congocidin); the regulating elements of said biosynthesis.
  • the regulation can in particular take place at the transcriptional, translational or enzymatic activity level. It can be an inhibition or an increase of the transcription, the translation or the enzymatic activity; the Cgc 1 protein, for example, would intervene in the transcriptional regulation of the biosynthesis of congocidin; and
  • Cgc2 * and Cgcl * proteins fall into this category. Indeed, in a heterologous expression system of one or more gene (s) of the cgc gene cluster, it may be necessary to confer on the host the character of resistance to congocidin, without which the biosynthesis of congocidin could do not take place satisfactorily. This could be the case for a host naturally sensitive to congocidin.
  • a polynucleotide hybridizing under stringent conditions to a nucleic acid involved in the biosynthesis of congocidin or a derivative of congocidin and capable of replacing it to direct said biosynthesis means that the polypeptide (s) for which it encodes has a function identical or equivalent to the function of the polypeptide or polypeptides encoded by said nucleic acid.
  • polypeptide (s) and “protein (s)” are interchangeable and may be used interchangeably to designate translation products of ORFs.
  • analogue refers to a polypeptide that is stratigraphically close to a polypeptide encoded by a cgc gene and that may participate in the biosynthesis pathway for congocidin or a derivative of congocidin such as described above, for example a non-toxic derivative of congocidin.
  • an analogue of the Cgc3 * polypeptide has at least 53% identity and at least 60% similarity, preferably at least 60% identity and at least 65% similarity, more preferably at least 65% identity and at least 70% similarity, even more preferably at least 70% identity and at least 75% similarity, more preferably at least 75% identity, and less than 80% similarity, even more preferably at least 80% identity and at least 85% similarity, more preferably at least 85% identity and at least 90% similarity, more preferably at least 90% at least 95% identity and at least 99% similarity to the sequence SEQ ID NO: 2.
  • an analogue of the Cgc2 * polypeptide (SEQ ID NO: 4) has at least 76% identity and at least 84% similarity, preferably at least 80% identity and at least 84% similarity, still preferred at least 85% identity and at least 90% similarity, even more preferably at least 90% identity and at least 95% similarity, and still more preferably at least 95% identity and at least 99% similarity with the sequence SEQ ID NO: 4.
  • an analogue of the Cgcl * polypeptide (SEQ ID NO: 6) has at least 80% identity and at least 85% similarity, more preferably at least
  • an analogue of the Cgcl polypeptide has at least 62% identity and at least 71% similarity, preferably at least 65% identity and at least 71% similarity, more preferably at least 70% identity and at least 75% similarity, preferably at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% identity. similarity, more preferably at least 85% identity and at least 90% similarity, more preferably at least 90% identity and at least 95% similarity, and even more preferably, at least 95% identity and at least 99% similarity with the sequence SEQ ID NO: 8.
  • an analogue of the Cgc2 polypeptide has at least 36% identity and at least 48% similarity, preferably at least 40% identity and at least 48% similarity, preferably at least minus 45% identity and at least 48% similarity, more preferably at least 50% identity and at least 55% similarity, more preferably at least 55% identity and at least 60% similarity, more preferably at least 60% identity and at least 65% similarity, more preferably still at least 65% identity and at least 70% similarity, more preferably at least 70% identity and at least 75% similarity, preferably at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% similarity, more preferably at least 85% identity and at least 90% similarity, preferably to the ego ns 90% identity and at least 95% similarity, and even more preferably, at least 95% identity and at least 99% similarity with the sequence SEQ ID NO: 10.
  • an analogue of the Cgc3 polypeptide has at least 49% identity and at least 62% similarity, preferably at least 55% identity and at least 62% similarity, more preferably at least at least 60% identity and at least 62% similarity, more preferably at least 65% identity and at least 70% similarity, more preferably at least 70% identity and at least 75% similarity , still preferably at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% similarity, more preferably at least 85% identity and at least 90% similarity, more preferably at least 90% identity and at least 95% similarity, and still more preferably at least 95% identity and at least 99% similarity to SEQ ID NO : 12.
  • an analogue of the Cgc4 polypeptide has at least 55% identity and at least 71% similarity, preferably at least 60% identity and at least 71% similarity, preferably at least at least 65% identity and at least 71% similarity, more preferably at least 70% identity and at least 75% similarity, more preferably at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% similarity, more preferably at least 85% identity and at least 90% similarity, more preferably at least 90% identity and at least 95% similarity, and even more preferably, at least 95% identity and at least 99% similarity to the sequence SEQ ID NO: 14.
  • an analogue of the Cgc5 polypeptide has at least 51% identity and at least 67% similarity, preferably at least 55% identity and at least 67% similarity, more preferably at least minus 60% identity and at least 67% similarity, more preferably at least 65% identity and at least 67% similarity, more preferably still at least 70% identity and at least 75% similarity, preferably still at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% similarity, more preferably at least 85% identity and at least 90% similarity, more preferably at least 90% identity and at least 95% similarity, and even more preferably, at least 95% identity and at least 99% similarity to the SEQ sequence ID NO: 16
  • an analogue of the Cgc6 polypeptide has at least 56% identity and at least 72% similarity, preferably at least 60% identity and at least 72% similarity, more preferably at least at least 65% identity and at least 72% similarity, more preferably at least 70% identity and at least 75% similarity, more preferably at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% similarity, more preferably at least 85% identity and at least 90% similarity, preferably still at least 90% identity and at least 95% similarity, and even more preferably, at least 95% identity and at least 99% similarity to the sequence SEQ ID NO: 18.
  • an analogue of the Cgc7 polypeptide has at least 32% identity and at least 46% similarity, preferably at least 40% identity and at least 46% similarity, more preferably at least minus 45% identity and at least 50% similarity, more preferably at least 50% identity and at least 55% similarity, more preferably at least 55% identity and at least 60% similarity, more preferably at least 60% identity and at least 65% similarity, more preferably still at least 65% identity and at least 70% similarity, more preferably at least 70% identity and at least 75% similarity, preferably at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% similarity, more preferably at least 85% identity and at least 90% similarity, preferably to the ego ns 90% identity and at least 95% similarity, and even more preferably, at least 95% identity and at least 99% similarity with the sequence SEQ ID NO: 20.
  • an analogue of the Cgc8 polypeptide has at least 39% identity and at least 56% similarity, preferably at least 40% identity and at least 56% similarity, more preferably at least 45% identity. and at least 56% similarity, more preferably at least 50% identity and at least 56% similarity, more preferably at least 55% identity and at least 60% similarity, more preferably at least at least 60% identity and at least 65% similarity, more preferably at least 65% identity and at least 70% similarity, more preferably at least 70% identity and at least 75% similarity , preferably still at least 75% identity and at least 80% similarity, even more p referenced at least 80% identity and at least 85% similarity, more preferably at least 85% identity and at least 90% similarity, more preferably at least 90% identity and at least 95% similarity , and even more preferably, at least 95% identity and at least 99% similarity with the sequence SEQ ID NO: 22.
  • an analogue of the Cgc9 polypeptide has at least 45% identity and at least 58% similarity, preferably at least 50% identity and at least 58% similarity, more preferably at least less 55% identity and at least 58% similarity, more preferably at least 60% identity and at least 65% similarity, more preferably still at least 65% identity and at least 70% similarity, more preferably at least 70% identity and at least 75% similarity, preferentially at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% similarity, more preferably at least 85% identity and at least 90% identity. similarity, more preferably at least 90% identity and at least 95% similarity, and even more preferably, at least 95% identity and at least 99% similarity to the sequence SEQ ID NO: 24.
  • an analogue of the CgclO polypeptide has at least 34% identity and at least 47% similarity, preferably at least 35% identity and at least 47% similarity, preferably at least 40% identity; % identity and at least 47% similarity, more preferably at least 45% identity and at least 50% similarity, more preferably at least 50% identity and at least 55% similarity, more preferably still at least 55% identity and at least 60% similarity, more preferably at least 60% identity and at least 65% similarity, more preferably still at least 65% identity and at least 70% identity. % similarity, more preferably at least 70% identity and at least 75% similarity, preferably at least 75% identity and at least 80% similarity, even more preferably at least 80% identity.
  • identity and at least 85% similarity more preferably at least 85% identity and at least 90% similarity, more preferably at least 90% identity and at least 95% similarity, and even more preferably at least 95% identity and at least 99% identity.
  • an analogue of the Cgcl 1 polypeptide has at least 44% identity and at least 65% similarity, preferably at least 50% identity and at least 65% similarity, preferably at least 55% identity and at least 65% similarity, more preferably at least 60% identity and at least 65% similarity, more preferably at least 65% identity and at least 70% identity.
  • an analogue of the Cgcl 2 polypeptide has at least 47% identity and at least 60% similarity, preferably at least 50% identity and at least 60% similarity, more preferably at least 55% identity and at least 60% similarity, more preferably at least 60% identity and at least 65% similarity, more preferably at least at least 65% identity and at least 70% similarity, more preferably at least 70% identity and at least 75% similarity, more preferably at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% similarity, more preferably at least 85% identity and at least 90% similarity, more preferably at least 90% identity and at least 95% similarity, and even more preferably, at least 95% identity and at least 99% similarity to the sequence SEQ ID NO: 30.
  • an analogue of the Cgcl3 polypeptide has at least 26% identity and at least 44% similarity, preferably at least 30% identity and at least 44% similarity, preferably at least 35% identity and at least 44% similarity, more preferably at least 40% identity and at least 44% similarity, more preferably at least 45% identity and at least 50% similarity, more preferably at least 50% identity and at least 55% similarity, more preferably at least 55% identity and at least 60% similarity, more preferably at least 60% identity, and at least 65% of similarity, more preferably at least 65% of identity and at least 70% of similarity, more preferably at least 70% of identity and at least 75% of similarity, preferentially at least 75% of identity.
  • identity and at least 80% similarity even more preferred at least 80% identity and at least 85% similarity, more preferably at least 85% identity and at least 90% similarity, more preferably at least 90% identity and at least 95% similarity. , and even more preferably, at least 95% identity and at least 99% similarity with the sequence SEQ ID NO: 32.
  • an analogue of the Cgcl4 polypeptide has at least 31% identity and at least 48% similarity, preferably at least 35% identity and at least 48% similarity, preferably at least 40% identity and at least 48% similarity, more preferably at least 45% identity and at least 48% similarity, more preferably at least 50% identity and at least 55% similarity, more preferably still at least 55% identity and at least 60% similarity, more preferably at least 60% identity and at least 65% similarity, more preferably still at least 65% identity and at least 70% similarity, more preferably at least 70% identity and at least 75% similarity, more preferably at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% similarity, more preferably at least 85% identity and at least 90% similarity, more preferably at least 90% identity and at least 95% similarity, and even more preferably, at least 95% identity and at least 99% similarity to the sequence SEQ ID NO: 34.
  • an analog of the Cgcl5 polypeptide has at least 33% identity and at least 46% similarity, preferably at least 35% identity and at least 46% similarity, preferably at least 40% identity and at least 46% similarity, more preferably at least 45% identity and at least 50% similarity, more preferably at least 50% identity and at least 55% similarity, more preferably at least 55% identity and at least 60% similarity, more preferably at least minus 60% identity and at least 65% similarity, more preferably still at least 65% of i and at least 70% similarity, more preferably at least 70% identity and at least 75% similarity, more preferably at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% similarity, more preferably at least 85% identity and at least 90% similarity, more preferably at least 90% identity and at least 95% similarity, and even more preferably, at least 95% identity and at least 99% similarity to the sequence SEQ ID NO: 36.
  • an analog of the Cgcl6 polypeptide (SEQ ID NO: 38) has at least 38% of identity and at least 55% similarity, preferably at least 40% identity and at least 55% similarity, more preferably at least 45% identity and at least 55% similarity, more preferably at least 50% identity and at least 55% similarity, more preferably still at least 55% identity and at least 60% similarity, more preferably at least 60% identity and at least 65% similarity, more preferably at least 65% identity and at least 70% similarity, so still preferred at least 70% identity and at least 75% similarity, more preferably at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% identity. % similarity, more preferably at least 85% identity and at least 90% similarity, more preferably at least 90% identity and at least 95% similarity, and still more preferably, at least 95% identity and at least 99% similarity to the sequence SEQ ID NO: 38.
  • an analogue of the Cgcl7 polypeptide has at least 39% identity and at least 50% similarity, preferably at least 45% identity and at least 50% similarity, so more preferred at least 50% identity and at least 55% similarity, more preferably still at least 55% identity and at least 60% similarity, more preferably at least 60% identity and at least 65% similarity, more preferably at least 65% identity and at least 70% similarity, so still preferred at least 70% identity and at least 75% similarity, more preferably at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% identity.
  • an analogue of the Cgcl8 polypeptide has at least 40% identity and at least 54% similarity, preferably at least 45% identity and at least 54% similarity, preferably at least s 50% identity and at least 54% similarity, more preferably still at least 55% identity and at least 60% similarity, more preferably at least 60% identity and at least 65% similarity , more preferably still at least 65% identity and at least 70% similarity, more preferably at least 70% identity and at least 75% similarity, more preferably at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% similarity, more preferably at least 85% identity and at least 90% similarity, more preferably at least 90% identity. identity and at least 95% similarity
  • an analogue of the Cgcl9 polypeptide has at least 51% identity and at least 55% similarity, more preferably at least 55% identity and at least 60% similarity, plus preferably at least 60% identity and at least 65% similarity, more preferably still at least 65% identity and at least 70% similarity, more preferably at least 70% identity and at least 75% similarity, preferably still at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% similarity, more preferably at least 85% identity and at least 90% similarity, preferably at least 51% identity and at least 55% similarity, more preferably at least 55% identity and at least 60% similarity, plus preferably at least 60% identity and at least 65% similarity, more preferably still at least 65% identity and at least 70% similarity, more preferably at least 70% identity and at least 75% similarity, preferably still at least 75% identity and at least 80% similarity, even more preferably at least 80% identity and at least 85% similarity, more preferably at least 85% identity
  • x% identity between a P polypeptide and a reference sequence is meant that when the two sequences are aligned, x% of the amino acids of P are identical to the corresponding amino acid of said reference sequence.
  • x% similarity between a P polypeptide and a reference sequence is meant that when the two polypeptides are aligned, x% of the amino acids of P are identical to the corresponding amino acid of said reference sequence or are replaced by a amino acid of the same group.
  • amino acid of the same group is meant an amino acid having substantially identical chemical properties.
  • this term is understood to mean amino acids having substantially the same charge and / or the same size, and / or the same hydrophilicity or hydrophobicity and / or the same aromaticity.
  • Such groups of amino acids include; (i) glycine, alanine
  • substitutions can be envisaged, in which an amino acid is replaced by another comparable but non-natural amino acid (hydroxyproline, norleucine, ornithine, citrulline, cyclohexylalanine, dextrorotatory amino acids, .).
  • the subject of the present invention is also the use of a polynucleotide for the production of a congocidin derivative, said polynucleotide being selected from the group consisting of: a1) a polynucleotide comprising all the open ORF reading phases 1, ORF 5, ORF 6 and ORF 8 to ORF 22, coding respectively for the polypeptides Cgc3 * (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO:
  • said derivative of congocidine is selected from the group consisting of 17-methylcongocidine and 17-fluorocongocidine.
  • the subject of the present invention is also the use of a polynucleotide for the production of a derivative of congocidin, said polynucleotide being selected from the group consisting of: a2) a polynucleotide comprising all the open ORF reading phases 1 , ORF 5 to ORF 17 and ORF 19 to ORF 22, respectively encoding the polypeptides of the Cgc3 * congocidine biosynthesis pathway (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO.
  • b2) a polynucleotide encoding all the polypeptides encoded by said open reading frames ORF 1, ORF 5 to ORF 17 and ORF 19 to ORF 22; and c2) a polynucleotide encoding an analogue of each of the polypeptides encoded by said open reading ORF 1, ORF 5 to ORF 17 and ORF 19 to ORF 22; and d2) a polynucleotide hybridizing under stringent conditions to the polynucleotide defined in a2) and being able to replace the nucleic acid to which it specifically hybridizes to direct the biosynthesis of said congocidin derivative.
  • the present invention also relates to the use of a polynucleotide for the production of a derivative of congocidin, said polynucleotide being selected from the group consisting of: a3) a polynucleotide comprising all the open reading ORF 1, ORF 5, ORF 6, ORF 8 to ORF 17 and ORF 19 to ORF 22, respectively coding for the polypeptides of the congocidin biosynthetic pathway
  • Cgc3 * (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22),
  • said open reading frames being optionally replaced by the corresponding complementary sequence (s); b3) a polynucleotide encoding all of the polypeptides encoded by said open reading frames ORF 1, ORF 5, ORF 6, ORF 8 to ORF 17 and ORF 19 to ORF 22; and c3) a polynucleotide encoding an analogue of each of the polypeptides encoded by said open reading frames ORF 1, ORF 5, ORF 6, ORF 8 to ORF 17 and ORF 19 to ORF 22; and d3) a polynucleotide hybridizing under stringent conditions to the polynucleotide defined in a3) and being able to replace the nucleic acid to which it hybridizes specifically to direct the biosynthesis of said congocidin derivative.
  • said derivative of congocidine is 17-fluoro-demethylcongocidine.
  • said derivative of congocidine is N, N-demethylcongocidine.
  • the polynucleotide defined in a), a1), a2) or a3) further comprises the open ORF reading phase 4 coding for the Cgcl polypeptide (SEQ ID NO: 8); b4) the polynucleotide defined in b), b1), b2) or b3) further encodes the polypeptide encoded by said open ORF reading phase 4; c4) the polynucleotide defined in c), cl), c2) or c3) further codes for a Cgcl analogue; and d4) the polynucleotide defined in d), d1, d2) or d3) hybridizes under stringent conditions to the polynucleotide defined in a4) and may be substituted for regulating the biosynthesis of congocidin or congocidin derivative.
  • the open reading phases useful for the biosynthesis as well as the open reading phases useful for the regulation is able to regulate the biosynthesis of congocidin or a derivative of congocidin in a microorganism having the ability to synthesize congocidin or said congocidin derivative.
  • a polynucleotide makes it possible to increase the biosynthesis of congocidin or of said derivative. It can also be used to confer on a host microorganism the capacity to produce congocidin or a derivative of congocidin, in particular in the case where the host does not initially possess the endogenous cgcl gene, or when this endogenous gene is initially inactivated.
  • said polynucleotide may further optionally comprise the ORF 2 and ORF 3 open reading phases involved in congocidin resistance.
  • the polynucleotide defined in a), a1), a2), a3) or a4) further comprises the open reading stages ORF 2 and ORF 3 coding for the polypeptides Cgc2 * (SEQ ID NO: 4) and Cgcl * (SEQ ID NO: 6); b5) the polynucleotide defined in b), b1), b2), b3) or b4) further codes for the polypeptides encoded by said open reading frames ORF 2 and ORF 3; c5) the polynucleotide defined in c), cl), c2), c3) or c4) further codes for a Cgc2 * analogue and a Cgcl * analogue; and d5) the polynucleot
  • Such a polynucleotide confers on a host microorganism the character of resistance to congocidin.
  • said polynucleotide comprises all of the open ORF 1 to ORF 22 reading phases.
  • said polynucleotide is defined by the sequence SEQ ID NO: 49 or the sequence SEQ ID NO.
  • the polynucleotide, comprising the entire cgc gene cluster, regardless of their orientations, confers on one host both the ability to produce congocidin or a congocidin derivative and the congocidin resistance trait.
  • Such a polynucleotide is particularly useful when the microorganism chosen for the production of congocidine or a derivative is not initially resistant to congocidine.
  • PPTases phosphopantethinyl transferases
  • the microorganism may, for example, naturally express said PPTases. If it does not naturally express said PPTases, said microorganism may be modified to express said PPTases.
  • PPTases capable of modifying a large number of proteins containing PCP domains, and which can be expressed in heterologous hosts (Suo et al, 2001).
  • said uses according to the invention implement said polynucleotide in a vector.
  • said vector is a plasmid, a cosmid, a bacterial artificial chromosome (BAC), a vector derived from an integrative actinobacterium element, a virus or a bacteriophage.
  • BAC bacterial artificial chromosome
  • the uses according to the invention implement a recombinant cell transformed with a vector as defined above.
  • said recombinant cell is an actinobacterium.
  • it is an actinobacterium of the genus Streptomyces, such as Streptomyces lividans.
  • the subject of the present invention is also an isolated polynucleotide, characterized in that it comprises at least one nucleic acid sequence selected from the group consisting of: a6) any of the open ORF 1 to ORF 22 coding reading phases for the polypeptides of the Cgc3 * congocidine biosynthesis pathway (SEQ ID NO: 2), Cgc2 * (SEQ ID NO: 4), Cgcl * (SEQ ID NO: 6), Cgc1 (SEQ ID NO: 8), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO : 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgClO (SEQ ID NO: 26), Cgcl I (SEQ ID NO: 28), Cgcl2 (S
  • this polynucleotide comprises a nucleic acid sequence selected from the group consisting of: a7) a sequence comprising the two open reading phases
  • ORF 2 and ORF 3 encoding the polypeptides involved in the resistance to congocidine, Cgc2 * (SEQ ID NO: 4) and Cgcl * (SEQ ID NO: 6), one and / or the other of said open phases of reading being optionally replaced by the corresponding complementary sequence (s); b7) a coding sequence for the polypeptides encoded by said open ORF reading phases 2 and 3; c7) a sequence encoding the analogs of said polypeptides encoded by said ORF open reading frames 2 and 3, said analogs being as defined in claim 1; and d7) a sequence hybridizing under stringent conditions to the nucleic acid defined in a7) and being able to replace the nucleic acid to which it hybridizes specifically to confer resistance to congocidin.
  • Such a polynucleotide codes only for the polypeptides involved in congocidin resistance.
  • the latter is selected from the group consisting of: a8) a polynucleotide comprising the open reading phase ORF 4 coding for the polypeptide involved in the regulation of the biosynthesis of the conocidin Cgcl (SEQ ID NO: 8), said open reading phase optionally being replaced by the corresponding complementary sequence; b8) a coding sequence for the polypeptide encoded by said open ORF reading phase 4; c8) a coding sequence for a Cgcl analogue having at least 62% identity and at least 71% similarity with the sequence SEQ ID NO: 8; and d8) a sequence hybridizing under stringent conditions to the ORF open reading phase 4 and being able to replace it to regulate the biosynthesis of congocidin or a derivative of congocidin.
  • Such a polynucleotide encodes only for the transcriptional regulatory polypeptide of the biosynthesis of congocidin.
  • the present invention also relates to an isolated polynucleotide as defined above and used in the uses according to the invention.
  • the invention further relates to the use of a polynucleotide comprising a nucleic acid sequence selected from the group consisting of the sequences defined in a7), b7), c7) and d7) above, to confer a microorganism the character of resistance to congocidin.
  • the invention also relates to the use of a polynucleotide comprising a nucleic acid sequence selected from the group consisting of the sequences defined in a8), b8), c8) and d8) above, to increase the biosynthesis congocidine or a derivative of congocidin.
  • said microorganism is an actinobacterium.
  • said microorganism is Streptomyces lividans.
  • the subject of the invention is also a group of genes comprising the open reading phases coding for the Cgc3 * polypeptides (SEQ ID NO: 2),
  • Cgc16 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgc18 (SEQ ID NO: 42) and Cgcl9 (SEQ ID NO: 44).
  • Another object of the present invention is a vector comprising a polynucleotide according to the invention.
  • said vector is a plasmid, a cosmid, a bacterial artificial chromosome (BAC), a vector derived from an integrative actinobacterium element, a virus or a bacteriophage.
  • BAC bacterial artificial chromosome
  • the subject of the present invention is also a recombinant cell expressing phosphopantethinyl transferases (PPTases) characterized in that it is transformed by a vector according to the invention.
  • PPTases phosphopantethinyl transferases
  • said recombinant cell is an actinobacterium. Even more preferably, it is an actinobacterium of the genus Streptomyces, such as Streptomyces lividans.
  • the latter is able to synthesize congocidin
  • said vector is an expression vector comprising at least one polynucleotide comprising the ORFs of the biosynthesis of congocidin as described upper.
  • the latter is able to synthesize a derivative of congocidin
  • said vector is an expression vector comprising at least one polynucleotide comprising the ORFs of the biosynthesis of a congocidin derivative as described above.
  • said recombinant cell is resistant to congocidin
  • said vector is an expression vector comprising at least one of the polynucleotides comprising the ORFs involved in the resistance to congocidin, as described above.
  • the invention also relates to a fragment of at least 15 nucleotides, and in order preferably increasing, at least 20 nucleotides, at least 25 nucleotides, at least 30 nucleotides, at least 35 nucleotides at least 40 nucleotides, at least 45 nucleotides or at least 50 nucleotides, at least 55 nucleotides, at least 60 nucleotides of a polynucleotide according to the invention, said fragment being usable as a probe or primer.
  • said fragment comprises at most 100 nucleotides. Even more preferably, it comprises at most 60 nucleotides.
  • said fragment comprises a sequence selected from the group consisting of the sequences SEQ ID NO: 52, 53 and 56 to 59.
  • the present invention further relates to an isolated polypeptide, involved in the biosynthesis pathway for congocidin or a derivative of congocidin, characterized in that it is selected from the group consisting of: - Cgc3 polypeptides (SEQ ID NO: 2), Cgc2 * (SEQ ID NO:
  • the present invention further relates to the use of the polypeptides Cgc3 * (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgClO (SEQ ID NO.
  • the subject of the invention is also the use of the polypeptides Cgc3 * (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgClO (SEQ ID NO: 26), Cgcl I (SEQ ID NO : 28), Cgc12 (SEQ ID NO: 30), Cgc13 (SEQ ID NO: 32), Cgc14 (SEQ ID NO: 34), Cgc15 (SEQ ID NO: 36), Cgc16 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgc18 (SEQ ID NO: 42) and Cgc 19 (SEQ ID NO: 44), each polypeptide being optionally replaced by a corresponding analog, for the
  • the subject of the invention is also the use of the polypeptides Cgc3 * (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgClO (SEQ ID NO: 26), Cgcl I (SEQ ID NO : 28), Cgc12 (SEQ ID NO: 30), Cgc13 (SEQ ID NO: 32), Cgc14 (SEQ ID NO: 34), Cgc16 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), CgclS (SEQ ID NO: 42) and Cgcl9 (SEQ ID NO: 44), each polypeptide optionally being replaced by a corresponding analog, for the production of a derivative of congocidin
  • the present invention also relates to a method for producing congocidine or a derivative of congocidin, characterized in that it comprises a step of culturing a recombinant cell capable of producing congocidin or a derivative of congocidin , as defined above, under conditions permitting the synthesis of congocidin or said congocidin derivative.
  • the expression "under conditions permitting the production of congocidine or a derivative of congocidine” means that: when the cgc2 * and cgc1 * genes are absent from the polynucleotide used, the method implements a naturally resistant cell , according to case, to the congocidine or the derivative of congocidin, if said derivative has an antibacterial activity.
  • This resistance is for example due to the presence of genes cgc2 * and cgcl * endogenous or genes whose products allow the excretion of congocidine or said derivative in the culture medium.
  • MP5 medium yeast extract: 7 g / l, NaCl: 5 g / l, NaNO 3 : 1 g / l, glycerol: 40 g / l; MOPS: 100 ⁇ M, pH 7.5
  • MP5 medium is particularly suitable for the production of congocidine or dimethylcongocidine by a strain of Streptomyces.
  • Said culture medium may optionally be supplemented with one or more particular precursor (s).
  • a culture medium comprising 5-methylcytosine is particularly suitable for the production of 17-methylcongocidin; a culture medium comprising 5-fluorocytosine is particularly suitable for the production of 17-fluorocongocidin.
  • the recombinant cell used in said process expresses phosphopantethinyl transferases (PPTases).
  • said derivative of congocidine is 17-methylcongocidine and said recombinant cell comprises a polynucleotide usable for the production of 17-methylcongocidine as defined above and is cultured. in the presence of 5-methylcytosine.
  • said derivative of the congocidine is 17-fluorocongocidine and said recombinant cell comprises a polynucleotide usable for the production of 17-fluorocongocidine as defined above and is implemented. culture in the presence of 5-fluorocytosine.
  • said derivative of congocidine is N, N-demethylcongocidine and said recombinant cell comprises a polynucleotide that can be used for the production of N, N-demethylcongocidine as defined above.
  • said derivative of congocidine is 17-fluoro-demethylcongocidine and said recombinant cell comprises a polynucleotide that can be used for the production of 17-fluoro-demethylcongocidine as defined above. and is cultured in the presence of 5-fluorocytosine.
  • the present invention also relates to a derivative of congocidin selected from the group consisting of 17-methylcongocidine, 17-fluorocongocidine and N, N-dimethylcongocidine.
  • the invention also comprises other arrangements, which will emerge from the description which follows, which refers to examples of implementation of the method which is the subject of the present invention and to the appended drawings, in which which: Figure 1 shows the structure of the molecules of the family of pyrrolamides (A) and related molecules (B).
  • Figure 2 shows the putative precursors that are fused to form the congocidin molecule.
  • FIG 3 is a schematic representation of the cgc gene cluster ("cgc cluster") involved in the biosynthetic pathway of congocidin.
  • Figure 4 illustrates HPLC analysis of Streptomyces strains (297 nm chromatograms of culture supernatants).
  • Figure 5 is a schematic representation of the different genes present in the BAC insert pCGCOO1 (A), pCGC017 (B) and pCGC019 (C).
  • the genes belonging to the cgc group are represented by black arrows while the genes outside the group are symbolized by white arrows.
  • the genes represented by rectangles are incomplete. All genes in the cgc group are not represented, the diagram is not drawn to scale.
  • Figure 6 is an HPLC analysis of Streptomyces strains CGCL006, CGCL026, CGCL027 and CGCL028. The chromatograms are recorded at 297 nm. Congocidine is identified by its retention time, identical to that of standard congocidine, and by its mass.
  • Figure 7 illustrates the proposed biosynthetic pathway for the biosynthesis of the amidinium precursor of congocidin.
  • Figure 8 corresponds to the analysis of strain CGCL022.
  • Figure 9 illustrates the proposed biosynthetic pathway for the synthesis of 4-amino-2-carboxypyrrole precursors of congocidin.
  • Figure 10 illustrates the structure of congocidin with different carbon atoms numbered (A) and 13C NMR spectra of carbon Cp, Cj 5 , C 6 and C 13 of the purified congocidine after addition of 13 C-3-glycerol in the culture medium (B).
  • Figure 12 illustrates the biosynthesis of 17-fluorocongocidin
  • B) 1. Peak mass spectrum corresponding to 17-fluorocongocidin and 2. Fragmentation of the peak of m / z 224.9 corresponding to 17-fluorocongocidin.
  • Figure 13 illustrates the structure of N, N-demethylcongocidine
  • Figure 14 corresponds to the schematic representation of plasmids pCGC041 and pCGC045.
  • strains and vectors used in this study are shown in Table IV and the oligonucleotides in Table V.
  • E. coli DH5 ⁇ Strain used as a host for cloning
  • Plasmid vector pSET152 carrying the genes cgd * and Request in pCGC502 cgc2 *, replicative in E. coli, integrative in Streptomyces. instance
  • Streptomyces strains are cultured for genetic manipulation and spore stock preparation in HT medium (Kieser et al.
  • congocidine is carried out in MP5 liquid medium (yeast extract: 7 g / l, NaCl: 5 g / l, NaNO 3 : 1 g / l, Glycerol: 40 g / l, MOPS: 100 mM, pH 7.5) (Pernodet et al, 1993) at 30 ° C for 4 days.
  • MP5 liquid medium yeast extract: 7 g / l, NaCl: 5 g / l, NaNO 3 : 1 g / l, Glycerol: 40 g / l, MOPS: 100 mM, pH 7.5
  • Acetonitrile Lichrosolv and formic acid are purchased from Merck®, L-arabinose from Aldrich®, apramycin and chloramphenicol from Sigma®, hygromycin from Euromedex®, ampicillin and PIPTG (isopropyl-beta). D-thiogalactopyranoside) in Q-biogene®.
  • E. coli cells coli Methods for obtaining and manipulating plasmid and BAC DNA (extractions, purifications, digestions, ligations, etc.) from E. coli cells coli are described by Sambrook and Russell (Sambrook and Russell, 2001).
  • the transformations of E. coli strains coli are performed by electroporation at 2500V, 600 ⁇ and 10 ⁇ F using the ⁇ ppendorf® "electroporator" device.
  • the preparation of electrocompetent cells of E. coli DH5 ⁇ or E. coli DY330 is carried out as follows: the cells are cultured at 37 ° C. for E. coli DH5 ⁇ in LB medium or at 30 ° C. for E.
  • the cells are then centrifuged at 4 ° C., 4000 rpm for 10 minutes and then washed a first time in a half volume of glycerol 10% and then in a quarter of glycerol volume 10%. Finally the cells are stored at -70 ° C in 10% glycerol.
  • the reaction mixtures consist of 1 .mu.l of template DNA with a concentration of approximately 10 to 50 ng / .mu.L, 1 .mu.l of each of the oligonucleotides at 30 .mu.M, 1 ⁇ L of dNTP at 10 mM each, 5 ⁇ L of Taq Polymerase 10X buffer (Qiagen), 10 ⁇ L of Q solution (Qiagen) and 0.25 ⁇ L of Taq Polymerase (Qiagen) in a final volume of 50 ⁇ L.
  • DNA purifications are done using GE Healthcare's "GFX-PCR & Gel Band Purification Kit” according to the supplier's protocol. 5) PCR protocol for the amplification of att2aac, att3aac, ⁇ aac and ⁇ hyg cassettes a) Preparation of attlaac and att3aac cassettes for gene inactivation by PCR targeting
  • the amplifications of the attlaac and attSaac cassettes used to delete genes are carried out using the Qiagen Taq Polymerase and the following program: 4 minutes at 97 ° C., 1 minute at 80 ° C., ten cycles of 30 seconds at 97 ° C. 30 seconds at 58 ° C and 2 minutes at 72 ° C then 20 cycles of 30 seconds at 97 ° C, 30 seconds at 68 ° C and 2 minutes at 72 ° C and ten minutes at 72 ° C.
  • the matrices used are pOSV232 for attlaac and pOSV234 for attSaac (Karray et al, 2005), plasmids consisting of the vector pGP704 / iVot / described by Miller and Mekalanos (Miller & Mekalanos, 1988) in which the excisable cassettes were cloned. These cassettes that confer resistance to apramycin are similar to those described by Raynal et al. (Raynal et al, 2006). att3aac is in particular similar to at ⁇ aac (SEQ ID NO: 67), but lacks T4 phage terminator sequences.
  • Att2aac differs from attSaac only by a nucleotide in att sequences, with att3 sequences being replaced by att2 sequences (Raynal et al., 2006)
  • Verification of transformed clones amplification of ⁇ aac and ⁇ hyg cassettes
  • the primers OMEGA A1 (SEQ ID NO: 60) and OMEGA A2 (SEQ ID NO: 61) are used for the amplification of the ⁇ aac cassette and the primers OMEGA A1 (SEQ ID NO: 60) and OMEGA HYG2 (SEQ ID NO: 62) are used for amplification of the ⁇ hyg cassette.
  • PCRs made from a Streptomyces mycelium suspension, require the following preliminary thermocycle: 30 seconds at 65 ° C, 30 seconds at 8 ° C, 90 seconds at 65 ° C, 180 seconds at 97 ° C, 60 seconds. seconds at 8 ° C, 180 seconds at 65 ° C, 60 seconds at 97 ° C, 60 seconds at 65 ° C, 4 minutes at 80 ° C.
  • the amplification of the cassettes is then carried out from a microliter of the supernatant of this suspension according to the program: 4 cycles of 1 minute at 97 ° C., 1 minute at 60 ° C. and 1 minute at 72 ° C. followed by cycles of 1 minute at 97 ° C., 1 minute at 52 ° C. and 1 minute at 72 ° C. and finally 25 cycles of 1 minute at 97 ° C., 1 minute at 55 ° C. and 1 minute at 72 ° C.
  • the biological tests are carried out after 5 days of growth at 30 ° C. of a colony of the Streptomyces strain to be analyzed on solid HT medium by adding an overlay of medium containing the indicator microorganisms: E. coli or Bacittus subtilis.
  • the growth inhibition halo is observed after overnight incubation at 37 ° C.
  • the different strains analyzed are cultured in MP5 medium, 4 days at 30 ° C. After centrifugation, a fraction of the supernatant is filtered on ultrafree-MC (0.1 ⁇ m, Millipore) and analyzed by HPLC. Sample analysis is performed on an Agilent 1200 HPLC chain with a diode array detector. The samples (100 ⁇ l) are injected on an Atlantis dC18 column, 5 ⁇ m; 4.6 mm x 250 mm (Waters).
  • a genomic DNA library of Streptomyces ambofaciens ATCC23877 was constructed in the artificial bacterial chromosome pBeloBACl 1 described by Kim et al. (Kim et al., 1996). This library was then used to determine the terminal sequence sequence of the S. ambofaciens linear chromosome ATCC23877 (approximately 1.3 megabases on each side). These sequences are analyzed thanks to the programs GLIMMER ("Gene Locator and Interpolated Markov Modeler (Delcher et al., 1999), FRAME (Ishikawa & Hotta, 1999) and GeneMark (Lukashin and Borodovsky, 1998). The coding regions and the corresponding protein sequences could thus be precisely defined.
  • This group contains two genes encoding NetP1 and NetP2 homologs that confer congidocidin resistance in Streptomyces netropsis (Stumpp et al, 2005).
  • This group isolated from the genomic DNA of S. ambofaciens, directs the biosynthesis of this metabolite whose biosynthetic pathway was unknown until now.
  • These 22 genes are named cgc3 * to cgcl * on the one hand and cgcl to cgcl9 on the other hand.
  • Figure 3 illustrates the positioning and orientation of these genes on the chromosome of S. ambofaciens.
  • Table III presents the different predicted functions for the proteins deduced from the 22 genes involved in the biosynthesis of congocidin.
  • a DNA fragment containing the ⁇ hyg cassette conferring resistance to hygromycin (allowing the selection of transformed Streptomyces), the ⁇ C31 integrase gene (Combes et al, 2002), the attP sequence of ⁇ C31 (necessary for integration, promoted by integrase, BAC in the chromosome at a specific site) and the oriT sequence of RK2 (necessary for its passage by conjugation of E. coli to Streptomyces) are introduced by ligation (Sambrook and Russell, 2001) at the unique HpaI site of pCGCOO1. This fragment was obtained as described below.
  • the pPAOI ⁇ vector described by Nalin et al. (Nalin et al, 2004) comprises a cassette containing the ⁇ C31 integrase gene, the attP site, oriT and the aacpramycin resistance gene. Nevertheless, because of the subsequent use of the aac gene for the inactivation of cgc genes, it was necessary to replace aac with another marker: the hygromycin resistance gene carried by the ⁇ hyg cassette.
  • the pPAO16 vector is thus digested by sequential digests with the enzymes BamHI, Klenow and XbaI, and the fragment containing oriT and aac is removed.
  • the HindIII / Klenow / XbaI digestion of the plasmid pOSVO10 makes it possible, after purification, to obtain a 3.1 kb fragment containing the ⁇ hyg and oriT cassette.
  • the ligation of this fragment with said plasmid pPAOI ⁇ digested by sequential digests by the enzymes BamHI, Klenow and Xbal (and lacking the fragment containing oriT and aac) makes it possible to obtain the plasmid pOSV201 containing the desired cassette.
  • the cgcl8 gene which encodes a protein similar to NRPS (containing the adenylation, condensation and PCP domains (Peptidyl Transport Protein) ), was interrupted in a strain of S. ambofaciens no longer producing spiramycin.
  • a fragment of the cgc1.8 gene is amplified by PCR under the conditions described in Example 1.4 from the genomic DNA of S. ambofaciens (ATCC23877) using the Taq Polymerase (Qiagen) and the CONGO-R oligonucleotides (SEQ ID NO: 58) and CONGO-D (SEQ ID NO: 59) for 30 cycles consisting of the following steps: 30 seconds at 96 ° C., 30 seconds at 60 ° C., 2 minutes at 72 ° C.
  • the amplification product an 815 bp fragment, which corresponds to nucleotides 2767 to 3581 of the sequence SEQ ID NO: 49, is purified and then cloned into the pGEM-T-Easy® vector of Promega.
  • the cgc fragment 18 is extracted from the plasmid obtained by EcoRI digestion.
  • the ends of the fragment obtained are then made blunt thanks to the action of the Klenow fragment, and then the fragment is introduced, at the EcoRI site, into the plasmid pOSV202, a derivative of pBluescript (pBC-SK +) carrying the ⁇ aac apramycin resistance cassette (Blondelet-Rouault et al., 1997) and the oriT sequence of RK2 cloned at the Ncol site of this vector.
  • the resulting plasmid is named pJMC101. After conjugation between E. coli S17.1 containing plasmid pJMC101 and S.
  • ambofaciens germinated spores SPM110 strain derived from mutated strain ATCC23877 in one of spiramycin biosynthetic genes, Karray et al., 2005
  • resistant clones apramycin are selected and the presence of the apramycin resistance gene is verified by PCR.
  • This amplification is carried out with oligonucleotides OMEGA A1 (SEQ ID NO: 60) and OMEGA A2 (SEQ ID NO: 61) according to the protocol described in Example 1.5.b).
  • a clone exhibiting the expected 1.1 kb band corresponding to the fragment of the amplified ⁇ aac cassette is selected and analyzed. This strain is named CGCA004.
  • Example 1.6 shows that a colony of strain SPM110 is surrounded by a halo of growth inhibition of the indicator strain (E. coli or B. subtilis), whereas for strain CGCA004, no growth inhibition of E. coli and B. subtilis is detected suggesting that congocidin production is abolished.
  • the comparative analysis of the metabolic profiles of the S. ambofaciens strains SPMI 10 and CGCA004 (FIG. 4) confirms that the strain CGCA004 does not produce congocidin (disappearance of a peak having the same retention time and the same mass as congocidin). standard). This demonstrates the involvement of the cgc group in the biosynthesis of congocidin.
  • EXAMPLE 4 Heterologous Expression of the Esc Gene Group in Streptomyces lividans
  • the transconjugants are selected by Phygromycin resistance and the presence of the ⁇ hyg cassette is verified by PCR using oligonucleotides OMEGA A1 (SEQ ID NO: 60) and OMEGA HYG2 (SEQ ID NO: 62) as indicated above.
  • the strain of S. lividans TK23 containing the vector pCGC002 integrated into its chromosome thus obtained is named CGCL006.
  • the proteins of the PCP family require, in order to be active, to be modified by the addition of a phosphopantheinyl arm by an enzyme of the phosphopantethrinyl transferase (PPTase) family.
  • PPTase phosphopantethrinyl transferase
  • the products of the genes cgc! 8 and cgcl9 have such PCP domains. Their modification by a PPTase is probably necessary. No gene from the cgc gene cluster is predicted to encode a PPTase. In S. ambofaciens a PPTase encoded by a gene located outside the cgc gene cluster is probably responsible for the modification of the PCP domains. S. lividans probably possesses a PPTase capable of modifying the proteins Cgcl8 and Cgcl9.
  • EXAMPLE 5 Definition of the boundaries of the esc gene cluster
  • the BAC pCGC002 contains other genes on either side of this group: 1 truncated gene and 4 complete genes on one side, 1 truncated gene and 11 complete genes on the other ( Figure 5A).
  • these genes are homologous to S. coelicolor genes and are part of regions of synteny with this strain. They do not seem to be involved in the biosynthesis of congocidin.
  • the sequence present between cgc21 and pBeloBACl 1 is excised to give the BAC pCGC017 and the strain CGCL009.
  • the sequence present between cgc3 * and pBeloBAC1 1 is excised to give the BAC pCGC019 and the strain CGCL010. This approach is explained in more detail below.
  • the cassette used, att3aac, obtained as indicated above, is similar to those described by Raynal et al. (Raynal et al., 2006) but lack T4 phage terminator sequences.
  • This cassette which comprises on both sides of the resistance gene the attL and attR sequences of pSAM2, is then excised by a site-specific recombination event promoted by the integrase and the excisionase of pSAM2 (Raynal et al. 1998).
  • the resulting BAC is then introduced to S. lividans.
  • the apramycin resistance cassette is amplified by PCR as previously described using the oligonucleotides of SEQ ID NO: 63 and SEQ ID NO: 64 (for the second fragment, the sequence oligonucleotides). SEQ ID NO: 65 and SEQ ID NO: 66 are used).
  • the PCR product obtained consists of the cassette flanked on either side of 40 nucleotide sequences identical to the sequences bordering the DNA fragment to be eliminated.
  • the hyper-recombinant E. coli strain DY330 containing the BAC pCGC002 is transformed by electroporation with the purified PCR product.
  • the clones are then selected for their double resistance to chloramphenicol (resistance conferred by the BAC) and apramycin (resistance conferred by the cassette).
  • the integration of the cassette and the deletion of the targeted fragment are verified by enzymatic digestion (BamHT), and the resulting BAC, called pCGCOl ⁇ , is introduced into the E. coli DH5 ⁇ strain containing the plasmid pOSInt3 (Raynal et al, 1998) in order to to excise the cassette att3aac.
  • Induction of the production of Xis and Int proteins necessary for excision is carried out in the presence of IPTG at 20 ⁇ g / mL.
  • BAC pCGCO 19 is introduced into S. lividans TK23 by conjugation to give the strain CGCL010.
  • deletions are carried out according to the same approach as for the elimination of the sequences situated upstream of cgc21 and downstream of cgc3 * (Example 5.A.1).
  • the apr3cac resistance cassette is amplified by PCR as previously described (Example 1.5) using the oligonucleotides cm1F (SEQ ID NO: 86) and cm1R (SEQ ID NO: 87).
  • cm1F SEQ ID NO: 86
  • cm1R SEQ ID NO: 87
  • the cassette is flanked on either side by sequences of 40 nucleotides identical to the sequences bordering the DNA fragment to be eliminated.
  • the hyper-recombinant E. coli strain DY330 containing the BAC pCGC002 is transformed by electroporation with the PCR product purified. The clones are then selected for their double resistance to chloramphenicol (resistance conferred by the BAC) and apramycin (resistance conferred by the cassette).
  • the integration of the cassette and the deletion of the targeted fragment are verified by PCR following the protocol described in Example 1.4 with the oligonucleotides cmj24F (SEQ ID NO: 100) and cmj24R (SEQ ID NO: 101) for the deletion of cgc21 and cm1OF (SEQ ID NO: 92) and cm1LO (SEQ ID NO: 93) for the deletion of cgc20.
  • the BAC where cgc21 is replaced by the at ⁇ aac cassette is named pCGC033 and the BAC where cgc20 is replaced by the att3aac cassette is named pCGC034.
  • Cgc3 * genes (coding a putative acyl-CoA synthetase), cgc4 (coding a putative nucleotide hydrolase), cgc7 (coding a putative phospho beta- glucosidase) cgc10 (coding a putative glycosyl transferase), cgc] 5 (coding a putative putative methylase / methyltransferase) and cgcl ⁇ (coding a putative condensation enzyme, similar to the peptide synthetase condensation domain non-ribosomal) were inactivated by the PCR-based REDIRECT® method (Gust et al., 2003).
  • oligonucleotides used for the inactivations of cgc3 *, cgc4, cgc7, cgc10, cgc15 and cgc13 are respectively cgc3 * -DIS-FOR (SEQ ID NO: 74) and cgc3 * -DIS-REV (SEQ ID NO: 75), cgc4 -DIS-FOR (SEQ ID NO: 70) and cgc4-DIS-REV (SEQ ID NO: 71), cgc7-DIS-FOR (SEQ ID NO: 50) and cgc7-DIS-REV (SEQ ID NO: 51) , cgClO-DIS-FOR (SEQ ID NO: 54) and cgCLO-DIS-REV (SEQ ID NO: 55), cgc15-DIS-F0R (SEQ ID NO: 78) and cgc15-DIS-REV (SEQ ID NO: 79) and cg
  • plasmid pW60 SEQ ID NO: 69
  • This plasmid originates from the vector pGEM-T easy® (Promega) in which the FRTaac cassette containing the pramycin resistance gene aac flanked by FLP recognition (FLP) sequences for recombination by FLP recombinase of yeast in E. coli.
  • FLP FLP recognition
  • constructs were verified by PCR using primers cgc3 * -SC-F0R (SEQ ID NO: 76) and cgc3 * -SC-REV (SEQ ID NO: 77) for the deletion of cgc3 *, cgc4-SC-F0R (SEQ ID NO: 72) and cgc4-SC-REV (SEQ ID NO: 73) for the deletion of cgc4, cgc7-SC-F0R (SEQ ID NO: 53) and cgc7-SC-REV (SEQ ID NO: 54 ) for the deletion of cgc7, cgc10-SC-FOR (SEQ ID NO: 56) and cgc10-SC-REV (SEQ ID NO: 57) for the deletion of cgc10, cgc15-SC-F0R (SEQ ID NO: 80) and cgc15-SC-REV (SEQ ID NO: 81) for the deletion of
  • BACs pCGC221, pCGC217, pCGC209, pCGC213, pCGC223 and pCGC225 were introduced into S. Hvidans TK23 by conjugation from E. coli S17-1 (see Example 1.4) and selected for hygromycin resistance.
  • the strain CGCL022 still produces congocidin, but in a much smaller quantity than the reference strain (CGCL006).
  • the apramycin resistance cassette was amplified by PCR as previously described (Example 1.5) with the oligonucleotides cm3F (SEQ ID NO: 90) and cm3R (SEQ ID NO: 91). After amplification, the cassette is flanked on either side by sequences of 40 nucleotides identical to the sequences bordering the DNA fragment to be eliminated.
  • the hyper-recombinant E. coli strain DY33O containing the BAC pCGC002 is transformed by electroporation with the purified PCR product. The clones are then selected for their double resistance to chloramphenicol (resistance conferred by the BAC) and apramycin (resistance conferred by the cassette).
  • the integration of the cassette and the deletion of the targeted fragment are verified by PCR with the oligonucleotides cmHlF (SEQ ID NO: 94) and cmHlR (SEQ ID NO: 95) according to the protocol described in Example 1.4.
  • the BAC where cgcl9 is replaced by the att3aac cassette is named pCGC035. This BAC is introduced into the strain E. coli DH5 ⁇ containing the plasmid pOSInt3 in order to excise the att3aac cassette. Induction of the production of Xis and Int proteins necessary for excision is carried out in the presence of IPTG at 20 ⁇ g / mL.
  • the apramycin resistance attlaac cassette was amplified by PCR as described previously (Example 1.5) using the oligonucleotides cm13F (SEQ ID NO: 96) and cm133R (SEQ ID NO: 97) and the template.
  • pOSV232 this matrix is used to amplify the attlaac cassette.
  • the cassette is flanked on either side by sequences of 40 nucleotides identical to the sequences bordering the DNA fragment to be eliminated.
  • the E. coli DY330 hyper-recombinant strain containing the plasmid pCGC041 is transformed by electroporation with the purified PCR product.
  • This plasmid pCGC041 corresponds to pUC19 containing at its SmaI site the jRytBI / Ry / WI / Klenow fragment isolated from pCGC002 and comprising the cgc1 and cgc2 genes (FIG. 14).
  • the clones are then selected for their double resistance to ampicillin (resistance conferred by the plasmid) and apramycin (resistance conferred by the cassette).
  • the integration of the cassette and the deletion of the targeted fragment are verified by PCR with the oligonucleotides cm114F (SEQ ID NO: 98) and cm114R (SEQ ID NO: 99) according to the protocol described in Example 1.4.
  • the plasmid where cgc2 is replaced by the cassette att2aac is named pCGC045; it is then digested by Pvull.
  • the 7.7 kb Pvull fragment contains the cgc2 replacing att2aac cassette and contains the neighboring cgc genes (Fragment A Figure 14).
  • the hyper-recombinant E. coli strain DY330 containing the BAC pCGC002 is then transformed by electroporation with the purified fragment A.
  • the clones are then selected for their double resistance to chloramphenicol (resistance conferred by the BAC) and apramycin (resistance conferred by the cassette).
  • the integration of the cassette and the deletion of cgc2 are checked by PCR with the oligonucleotides cm1f4F (SEQ ID NO: 98) and cm114R (SEQ ID NO: 99) according to the protocol described in Example 1.4.
  • the BAC where cgc2 is replaced by the att2aac cassette is named pCGC049. This BAC is introduced into the E. coli DH5 ⁇ strain containing the plasmid pOSInt3 in order to excise the att2aac cassette. Induction of the production of Xis and Int proteins necessary for excision is carried out in the presence of IPTG at 20 ⁇ g / mL.
  • the cgcl * and cgc2 * genes encode a putative ABC transporter.
  • the Cgcl * protein could constitute the ATP-binding protein and the Cgc2 * protein its transmembrane partner.
  • These two proteins are strongly similar to those identified by Stumpp et al. (Stumpp et al., 2005) encoded by the netP1 and netP2 genes present on the S. netropsis chromosome.
  • the two corresponding NetPl and NetP2 proteins form an ABC transporter and confer resistance to congocidin.
  • the two genes cgc1 * and cgc2 * are therefore introduced into the chromosome of S. lividans TK23 to test their ability to induce congocidin resistance in a sensitive heterologous host.
  • pCGC502 coli replicative shuttle vector and integrative in Streptomyces, (Bierman et al, 1992) at the EcoKV site, thus presenting the entire region between cgc1 * and cgc1 likely to contain the cgc1 * promoter which could be
  • the resulting plasmid is named pCGC502, and the presence of the insert is verified by enzymatic digestion (PstI) .
  • the plasmid pCGC502 is introduced into S. lividans TK23 by protoplast transformation according to the protocol. Kieser et al (Kieser et al, 2000)
  • the empty pSET152 vector was also introduced into S.
  • the strain containing the vector pCGC502 is called CGCL001
  • the congocidin resistance of these strains as well as that of the S. lividans strain TK23 transformed with the empty pSET152 vector is then tested on HT medium containing congocidine at 20 ⁇ g / ml. Transformants are selected for their resistance to apramycin. The cultures are examined after four days of incubation at 30 ° C.
  • the proteins encoded by the genes cgc4, cgc5 and cgc ⁇ show homologies with the proteins encoded by the genes plus, and Photorhabdus Iwninescens, genes which, like cgc4, cgc5 and cgc ⁇ , are grouped on the chromosome.
  • the inventors have theorized that the Cgc4, Cgc5 and Cgc ⁇ proteins are involved in the same biological process, for example the biosynthesis of one of the precursors of congocidin.
  • the cgc4 gene was deleted in phase in the pCGC002 BAC and the resulting BAC (pCGC217) introduced into S. lividans TK23 (strain CGCL022).
  • the strain CGCL022, containing the plasmid pCGC217 where the cgc4 gene is excised, is cultured for 45 h at 30 ° C. in 50 ml of MP5 medium. The culture is then divided into 2 cultures of 25 ml each. In the first culture, cytosine is added to the final concentration of 2 mM.
  • cytosine the presumed product of the Cgc4 catalyzed reaction
  • the amounts of congocidin and the biosynthetic intermediate were determined for each time.
  • FIG 8B clearly shows that the addition of cytosine in the culture medium of the strain CGCL022 makes it possible to restore a normal production of congocidine and stops the accumulation of the biosynthesis intermediate in the medium.
  • EXAMPLE 9 Biosynthesis of 4-amino-2-carboxypyrrole Groups The inventors hypothesized that the set of genes cgc3, cgc8, cgc9, cgcl1, cgc12, cgc J4 and cgc1. are involved in the biosynthesis of pyrrole groups according to the scheme shown in Figure 9. In order to verify this Assuming uniformly labeled 13 C glycerol is added to the culture medium of S. ambofaciens strain SPMI 10.
  • glycerol can be converted via glyceraldehyde-3-phosphate and the pentose phosphate route to fructose-6-phosphate, itself converted into glucosamine-1-phosphate in two successive steps by the enzymes GImS (glucosamine-fructose). -6-phosphate aminotransferase) and GImM (phosphoglucosamine mutase). If the hypothesis is correct, we expect a incorporation of 13 C 2 in positions C 6 -Cp and C 12 -C 15 respectively ( Figure 10A).
  • FIG. 12A The chromatogram shown in Figure 12A compared to the chromatograms of Figure 8A shows the presence of an additional peak.
  • the mass spectrometric analysis of this peak (FIG. 12B) demonstrates that it is 17-fluorocongocidin (FIG. 12C).
  • the addition of 5-fluorocytosine to the culture medium of mutant CGCL022 thus allows the biosynthesis of a new molecule (17-fluorocongocidin).
  • the biosynthesis of this molecule confirms the biosynthesis pattern of the amidinium precursor of the congocidin proposed in FIG. 7.
  • DNA minor-groove binders Design, synthesis, and biological evaluation of ligands structurally related to CC-1065, distamycin and anthramycin. Pure Appl. Chem., 75,
  • streptomyces genome contains multiple pseudo-attB sites for the (phi) C31-encoded site-specific recombination system. J Bacteriol 184, 5746-5752.
  • Netropsin a new antibiotic produced by a streptomyces. J. Am. Chem. Soc. 73, 341-343.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Chemical & Material Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

Polynucléotides et polypeptides codés par lesdits polynucléotides, impliqués dans la voie de biosynthèse de la congocidine, un antibiotique de la famille des pyrrolamides, et de ses dérivés, vecteurs comprenant lesdits polynucléotides, microorganismes transformés par lesdits polynucléotides, applications desdits polynucléotides et desdits polypeptides.

Description

POLYNUCLEOTIDES ET POLYPEPTIDES CODES PAR LESDITS
POLYNUCLEOTIDES IMPLIQUES DANS LA VOIE DE BIOSYNTHESE DE
LA CONGOCIDINE ET SES DERIVES
La présente invention est relative à de nouveaux polynucléotides, et aux polypeptides codés par lesdits polynucléotides, impliqués dans la voie de biosynthèse d'un antibiotique de la famille des pyrrolamides, aux vecteurs comprenant lesdits polynucléotides, aux microorganismes transformés par lesdits polynucléotides, aux applications desdits polynucléotides et desdits polypeptides.
La congocidine (Figure 1) a été isolée en 1952 par Cosar et al. chez Streptomyces ambofaciens (Cosar et al. , 1952). Cette molécule, dont la structure a été déterminée en 1967 (Julia & Preau- Joseph, 1967), est identique à une autre molécule, isolée un an auparavant chez Streptomyces netropsis, la nétropsine (Finlay et al, 1951). Les deux noms sont encore utilisés actuellement. Parfois, cette molécule est également appelée sinanomycine. La congocidine est un pyrrolamide (également appelé oligopyrrole ou oligopeptide). Cette famille de métabolites secondaires, produits par des bactéries du genre Streptomyces ou autres actinobactéries apparentées, regroupe des molécules caractérisées par la présence dans leur structure de groupements 2-carbonyl-4-amino- pyrrole (Figure IA). Il existe par ailleurs quelques molécules apparentées à cette famille, comme l'amidinomycine, la noformycine ou les proximicines (Figure IB).
Les pyrrolamides et les molécules apparentées possèdent des activités biologiques variées, (Voir Tableau I ci-après).
Tableau I : Activités biologiques des composés de la famille des pyrrolamides et de certaines des molécules a arentées
Figure imgf000002_0001
De nombreux pyrrolamides (congocidine, distamycine, TAN 868A et kikumycines) possèdent des activités antivirales et antimicrobiennes. La noformycine est un inhibiteur de la synthase inductible d'oxyde nitrique, une enzyme impliquée dans des maladies inflammatoires telles que l' arthrite (Gordon Green et al, 1996). Enfin, les deux membres les plus récents de cette famille, les pyrronamycines A et B ont montré une activité antitumorale contre le sarcome 180 dans des modèles de tumeurs murines in vivo (Asai et al, 2000).
Une autre activité biologique de ces molécules présentant de l'intérêt est leur capacité à se lier, au moins pour un certain nombre d'entrés elles (congocidine, distamycine et pyrronamycines), à l'ADN, dans le petit sillon de la double hélice, avec une certaine spécificité de séquence (trois à quatre bases A/T consécutives, forte discrimination des paires G/C) (Neidle, 2001). Ainsi, la distamycine et la congocidine ont servi et servent encore de modèles pour l'étude de la liaison de petits ligands dans le petit sillon de l'ADN (Aleman et al, 1996 ; Van Hecke et al, 2005). Il a été montré que ces molécules se lient à l'ADN de manière réversible, non covalente, par des liaisons hydrogènes, des contacts de Van der Waals, et des interactions électrostatiques (Dolenc et al, 2005).
La congocidine et la distamycine ne sont pas parmi les meilleurs agents anticancéreux se liant dans le petit sillon de l'ADN, car leur liaison n'est pas covalente. Néanmoins, au cours des quinze dernières années, de nombreux analogues ou hybrides de la congocidine et de la distamycine ont été synthétisés, afin de modifier et d'accroître la spécificité de la liaison à l'ADN et de créer des molécules capables de se lier de manière spécifique et covalente à l'ADN (Dyatkina et al, 2002 ; Khalaf et al, 2004). De telles molécules pourraient en effet être utilisées pour réduire l'expression de gènes spécifiques dans des maladies telles que le cancer, ou être couplées à des anticorps monoclonaux, comme cela est déjà le cas pour une autre molécule se liant dans le petit sillon de l'ADN, la calichéamicine liée à l'anticorps monoclonal anti-CD33 gemtuzumab ozogamicin (Mylotarg®) (Harris, 2004). La congocidine et la distamycine ont ainsi déjà été utilisées comme transporteurs à spécificité de séquence d'agents alkylant l'ADN, comme dans le cas de la tallimustine, qui a été étudiée en phases I et II d'essais cliniques en tant qu'agent anticancéreux (Denny, 2001). Des analogues de ces molécules ont également été couplés avec des agents anticancéreux connus tels que l'anthramycine (spécifique de régions riches en G/C), et les molécules hybrides possèdent des propriétés antitumorales (Baraldi et al. , 2003).
L'évolution des techniques de l'ADN recombinant et les progrès réalisés dans la connaissance et la compréhension des mécanismes de biosynthèse des produits naturels au cours des vingt dernières années permettent d'envisager une production biotechnologique de produits naturels, production généralement plus économique que la production par synthèse chimique. Les connaissances accumulées depuis une vingtaine d'années montrent que chez les actinobactéries, les gènes dirigeant la biosynthèse d'un métabolite secondaire donné sont en général groupés dans une même région du génome (Chater & Bruton, 1985). L'utilisation de cette propriété, en combinaison avec l'hybridation hétérologue avec des sondes basées sur des séquences en acides aminés hautement conservées d'enzymes biosynthétiques a déjà montré son utilité pour cloner des groupes de gènes de biosynthèse de métabolites secondaires (Hopwood, 1997 ; Turgay & Marahiel, 1994).
Toutefois, en ce qui concerne la congocidine, les gènes impliqués dans la voie de biosynthèse de la congocidine chez Streptomyces n'ont actuellement pas été identifiés. Or, il existe un réel besoin d'identifier ces gènes, et notamment de caractériser la voie de biosynthèse de la congocidine, pour les raisons suivantes. La caractérisation de cette voie de biosynthèse et l'isolement des gènes codant les enzymes impliquées dans cette biosynthèse pourraient permettre d'améliorer l'efficacité de production de cette molécule, par expression des gènes de la voie de biosynthèse dans un hôte hétérologue facilement manipulable par exemple. Il est également envisageable de dupliquer les gènes codant des enzymes catalysant des étapes cinétiquement limitantes de la biosynthèse de la congocidine, afin d'augmenter le rendement. Une telle approche a déjà été utilisée pour la production de tylosine par Streptomyces fradiae (Baltz et al, 1997). On pourrait aussi sur-exprimer des gènes régulateurs ayant un rôle d'activateur de l'expression des gènes de biosynthèse. On peut aussi envisager de multiplier, par manipulation génétique dirigée, le nombre de copies des gènes, ou du groupe (« cluster ») de gènes, dirigeant la biosynthèse de la congocidine, comme cela est parfois réalisé empiriquement lors de la sélection de souches surproductrices d'antibiotiques (Yanai et al, 2006).
De surcroît, la connaissance de la voie de biosynthèse de la congocidine et l'isolement des gènes impliqués dans cette biosynthèse peuvent permettre la manipulation génétique de ce groupe de gènes (inactivation de gènes, mutagénèse, biosynthèse combinatoire, ingénierie métabolique) pour conduire à la production d'intermédiaires spécifiques de biosynthèse et de nouveaux dérivés de cette molécule. De tels dérivés sont en effet hautement désirables, car la toxicité de la congocidine empêche son utilisation clinique. Des analogues de la congocidine possédant une forte activité antimicrobienne ou anticancéreuse mais une toxicité moindre pourraient avoir d'importantes applications biomédicales. Pour répondre à ces besoins, les inventeurs ont maintenant réussi à mettre en évidence l'existence, chez Streptomyces ambofaciens, d'un locus particulier regroupant plusieurs gènes contrôlant la biosynthèse de congocidine et la résistance à la congocidine. Ce groupe de gènes, ci-après dénommé groupe de gènes cgc, ou groupe cgc, ou encore « cluster cgc », comprend 22 phases ouvertes de lecture, ou ORFs (« open reading frame »), numérotées ORFl à ORF22, codant pour des polypeptides de la voie de biosynthèse de la congocidine chez S. ambofaciens. Les gènes correspondant à ces 22 ORFs sont respectivement dénommés cgc3*, cgc2*, cgcl*, cgcl, cgc2, cgc3, cgc4, cgc5, cgcό, cgc7, cgc8, cgc9, cgclO, cgcll, cgcl2, cgcl 3, cgcl 4, cgcl 5, cgcl 6, cgcl 7, cgcl 8 et cgcl 9 . Ils ont été séquences et les séquences polypeptidiques correspondantes ont été déduites des séquences nucléotidiques. Le Tableau II indique la correspondance entre ces ORF 1 à 22, les noms des gènes (cgc 3* à cgcl* et cgcl à cgcl 9), les noms des polypeptides correspondants (Cgc3* à Cgcl* et Cgcl à Cgc 19) ainsi que les numéros de séquences nucléotidiques et polypeptidiques correspondants de la liste de séquences annexée.
Initialement, deux phases ouvertes de lecture étaient supposées faire partie du groupe de gènes cgc. Il s'agit des phases ouvertes de lecture ORF 23 (SEQ ID NO: 45) et ORF 24 (SEQ ID NO: 47) codant pour les polypeptides Cgc20 (SEQ ID NO: 46) et Cgc21 (SEQ ID NO: 48). Les expériences de délétion montrent que ces deux phases ouvertes de lecture ne font finalement pas partie du groupe de gènes cgc.
Tableau II
Figure imgf000006_0001
Le groupe de gènes cgc est représenté par la séquence SEQ ID NO:49. Le Tableau III indique, pour chacun desdits gènes, les caractéristiques relatives à la localisation sur ladite séquence SEQ ID NO:49, à l'activité putative du produit de traduction (prédictions basées sur les résultats BLAST (Altschul et al., 1997), PSI-BLAST (Schâffer et al, 2001) et CD SEARCH (Marchler-Bauer et Bryant, 2004)), ainsi qu'à la comparaison, en termes de pourcentage d'identité et de similarité, de la séquence polypeptidique correspondante avec la séquence du polypeptide de la base de données Genbank® présentant le meilleur score BLAST (Altschul et al, 1997), en utilisant les paramètres par défaut. Dans ce Tableau III, % id correspond au pourcentage d'identité et % sim correspond au pourcentage de similarité fournis par BLAST entre la séquence de la protéine analysée et la séquence de la protéine identifiée par BLAST comme la plus similaire. TABLEAU III : Présentation des différents gènes du groupe cgc
Figure imgf000007_0001
Ces 22 ORF sont impliquées dans la voie de biosynthèse de la congocidine, qui inclut la biosynthèse proprement dite de la congocidine, la résistance à la congocidine, et la régulation de la biosynthèse de la congocidine.
Les comparaisons de séquences présentées dans le Tableau III révèlent les éléments suivants :
- le gène cgc3* (ORF 1) code pour un polypeptide présentant une homologie de séquence avec une acyl-CoA synthétase, ce qui suggère qu'il pourrait activer le groupement carboxyle du précurseur guanidino-acétate putatif (Figure 2) ; les quatre gènes cgc2, cgclό, cgclδ et cgcl9 (ORFs 5, 19, 21 et 22) codent pour des protéines présentant des homologies avec des NRPS (« Non
Ribosomal Peptide Synthétase », Synthétase de Peptides Non Ribosomique) ou avec des domaines de NRPS, ce qui suggère un rôle de catalyseur de l'assemblage de la congocidine en participant à la formation des trois liaisons amides présentes dans cette molécule ; - de manière inattendue, les produits des gènes cgc7 à cgcl3 (ORF 10 à ORF
16) présentent des homologies avec des enzymes impliquées dans la biosynthèse ou le transfert de sucre, et on ne pouvait donc pas a priori prévoir leur intervention dans la biosynthèse de la congocidine, puisque cette molécule ne comporte pas de sucre ; - les gènes cgc3, cgc4, cgc5, cgcό, cgcl4 et cgcl 7 (ORF 6 à 9, 17 et 20) codent pour des polypeptides ayant probablement une fonction enzymatique. Toutefois leur rôle dans la biosynthèse de la congocidine n'aurait pas pu être déterminé a priori ; les Inventeurs ont émis l'hypothèse qu'au moins les gènes cgc4, cgc5 et cgcό sont impliqués dans la biosynthèse du précurseur amidinium (Fig. 2). Ainsi, lorsque le gène cgc4 est délété, la quantité de congocidine synthétisée est fortement diminuée et un intermédiaire de biosynthèse s'accumule dans le milieu de culture; un niveau de production de congocidine comparable à celui observé avec le cluster cgc complet est rétabli avec l'ajout de cytosine dans le milieu de culture ; dans ce cas, l'intermédiaire de .biosynthèse ne s ' accumule plus ; le gène cgcl 5 (ORF 18) code pour un polypeptide présentant une homologie de séquence avec une méthyltransférase, ce qui suggère l'intervention du polypeptide Cgcl 5 dans la méthylation de l'atome d'azote des deux groupements pyrroles de la congocidine ; les Inventeurs ont montré que la délétion du gène cgcl 5 bloque Ia biosynthèse de congocidine et permet la biosynthèse d'un dérivé de la congocidine, la N,N-déméthylcongocidine ; - les gènes cgcl* et cgc2* (ORF 3 et ORP 2) codent pour des polypeptides
(Cgcl* et Cgc2*) susceptibles d'être des transporteurs de type ABC (« ATP
Binding Cassette »). Ces polypeptides présentent des homologies avec les polypeptides NetP2 et NetPl, impliqués dans la résistance à la congocidine chez Streptomyces netropsis. le gène cgcl (ORF 4) code pour un polypeptide présentant des homologies de séquences avec un régulateur de la famille LuxR à motif Hélice-Boucle- Hélice, suggérant qu'il pourrait réguler au niveau transcriptionnel la biosynthèse de la congocidine. Il est à noter que ce gène est le seul du groupe cgc à contenir un codon UUA, codon rare chez les Streptomyces.
En outre, les Inventeurs ont démontré expérimentalement que la délétion d'un des gènes cgc3*, cgc2, , cgcl, cgclO, cgcl5, cgclό, cgcl8 et cgcl9 bloque la biosynthèse de congocidine chez S. anibofaciens ou dans un système d'expression hétérologue chez S. lividans, ce qui confirme leur implication dans cette voie de biosynthèse. Dans le cas de la délétion de cgc4, la quantité de congocidine synthétisée est fortement diminuée et un intermédiaire de biosynthèse s'accumule dans le milieu de culture. Les Inventeurs ont en outre montré expérimentalement que les gènes cgc2* et cgcl* sont effectivement impliqués dans la résistance à la congocidine. Les Inventeurs ont émis l'hypothèse que les gènes cgc4, cgc5 et cgcό sont impliqués dans la biosynthèse du précurseur amidinium et ont validé expérimentalement cette hypothèse pour cgc4.
L'analyse de la séquence du groupe de gènes cgc, premier groupe de gènes isolé dirigeant la biosynthèse d'un pyrrolamide, suggère une voie de biosynthèse originale pour la congocidine, une molécule dont l'origine des précurseurs putatifs, inusuels, ne peut être prédite.
L'isolement et la caractérisation des gènes du groupe de gènes cgc, impliqué dans la résistance, la régulation, et la biosynthèse de congocidine permet :
- d'introduire certains des gènes cgc, ou bien la totalité desdits gènes, dans une cellule hôte, de façon à lui conférer la capacité à synthétiser la congocidine ou un dérivé de la congocidine ;
- d'utiliser les gènes de résistance dans un système d'expression hétérologue afin de conférer à l'hôte la résistance à la congocidine (gènes cgc2* et cgcl*) ; - en outre, il est possible de réguler la biosynthèse de congocidine en agissant notamment sur le gène cgcl, par exemple en l' inactivant de manière à réduire ou inhiber ladite biosynthèse, ou bien en le surexprimant de manière à augmenter ladite biosynthèse.
Les gènes cgc2*, cgcl * et cgi ne sont pas indispensables à la synthèse de la congocidine ou de ses dérivés : le gène cgi permet d'améliorer le niveau d'expression des autres gènes cgc ; les gènes cgc2* et cgcl* sont utiles pour conférer la résistance à la congocidine ou à un dérivé de la congocidine en excrétant ces molécules dans le milieu de culture. Ainsi, il est possible de produire la congocidine ou un dérivé de la congocidine en l'absence des gènes cgc2* et cgcl* notamment dans un système d'expression hétérologue mettant en œuvre par exemple une souche bactérienne dans laquelle sont présents d'autres gènes permettant à ladite souche de résister, selon le cas, à la congocidine ou à un dérivé de la congocidine si ledit dérivé a une activité antibiotique.
Par ailleurs, l'isolement du groupe de gènes cgc peut donner accès à de nouveaux groupes de gènes impliqués dans la biosynthèse des pyrrolamides. La recherche, chez les actinobactéries, de séquences homologues aux séquences des ORFs dudit groupe cgc pourrait en effet permettre l'isolement et la caractérisation d'autres gènes et/ou groupes de gènes impliqués dans la voie de biosynthèse d'autres pyrrolamides que la congocidine, ou bien de molécules dérivées de la congocidine, telles que des dérivés non toxiques. Ainsi, les Inventeurs ont réussi à synthétiser plusieurs dérivés de la congocidine, tels que la 17-méthylcongocidine, la 17-fluorocongocidine ou encore la N,N-déméthylcongocidine.
La présente Invention a donc pour objet l'utilisation d'un polynucléotide pour la production de congocidine ou d'un dérivé de congocidine, ledit polynucléotide étant sélectionné dans le groupe constitué par : a) un polynucléotide comprenant l'ensemble des phases ouvertes de lecture ORF 1 et ORF 5 à ORF 22, codant respectivement pour les polypeptides de la voie de biosynthèse de la congocidine Cgc3* (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl l (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl5 (SEQ ID NO: 36), Cgcl 6 (SEQ ID NO: 38), Cgcl 7 (SEQ ID NO: 40), Cgcl 8 (SEQ ID NO: 42) et Cgcl 9 (SEQ ID NO: 44), l'une ou plusieurs desdites phases ouvertes de lecture étant optionnellement remplacée(s) par la (les) séquence(s) complémentaire(s) correspondante(s) ; b) un polynucléotide codant pour l'ensemble des polypeptides codés par lesdites phases ouvertes de lecture ORF 1 et ORP 5 à ORF 22 ; et c) un polynucléotide codant pour un analogue de chaque polypeptide codé par lesdites phases ouvertes de lecture ORF 1 et ORF 5 à ORF 22 ; et d) un polynucléotide s'hybridant dans des conditions stringentes au polynucléotide défini en a) et pouvant remplacer l'acide nucléique auquel il s'hybride spécifiquement pour diriger la biosynthèse de la congocidine ou dudit dérivé de la congocidine.
Définitions : - Le terme « hybridation » est connu de l'homme du métier, et se réfère au mécanisme de couplage d'acides nucléiques, en fonction notamment de leurs séquences respectives. L'hybridation peut être totale ou partielle. L'acide nucléique s'hybridant au polynucléotide selon l'invention est donc utilisable pour remplacer l'une des séquences d'acide nucléique telle que définie ci-dessus, ainsi qu'également selon sa longueur, comme sondes ARN ou ADN dans des analyses de type « Northern blot » ou « Southern blot ». Il peut également être utilisé comme amorce dans des analyses de type PCR (réaction de polymérisation en chaîne). Dans ce dernier cas, l'amorce comprend de préférence au moins 15 nucléotides.
L'homme du métier est en mesure de réaliser des expériences et analyses basées sur l'hybridation de polynucléotides. Il sait sur quels paramètres il doit agir pour faire varier les conditions d'hybridation compte tenu des séquences décrites. Ces conditions d'hybridation sont décrites dans des ouvrages de référence tels que Sambrook et al., Molecular Cloning : A Laboratory Manual ; CoId Spring Harbor Laboratory Press, 2nd édition 1989 et 3ème édition 2001 ; Gerhardt et al, Methods for General and Molecular Bacteriology ; ASM Press, 1994 ; Lefkovits ; Immunology Methods Manual : The Comprehensive Sourcebook of Techniques ; Académie Press, 1997 ; Golemis ; Protein-Protein Interactions : A Molecular Cloning Manual ; CoId Spring Harbor Laboratory Press, 2002 et d'autres ouvrages ou manuels de référence connus de l'homme du métier. - L'expression « en conditions stringentes » se réfère par exemple à une incubation pendant une nuit à 60°C dans une solution comprenant 6x SSC (NaCl 900 mM, citrate de sodium 90 raM), 5x de solution de Denhart, 0,5 % (poids/volume) de SDS, 100 μg/ml d'ADN de sperme de saumon cisaillé et dénaturé, suivi par exemple d'un lavage dans une solution de 0,2 x SSC à 650C. - Au sens de la présente invention, l'expression « dérivé de la congocidine » est utilisée pour désigner toute molécule bioactive susceptible d'être synthétisée par les polynucléotides selon l'invention, ladite molécule bioactive pouvant être par exemple un antibiotique de la famille des pyrrolamides autre que la congocidine ; il peut également s'agir de toute molécule structurellement et/ou fonctionnellement proche de la congocidine. De préférence, il s'agit d'un dérivé non toxique de la congocidine. Des exemples de dérivés structurellement proches de la congocidine sont les molécules représentées à la Figure 1. D'autres exemples de dérivés structurellement proches sont les dérivés fluorés, méthylés, déméthylés, bromes de la distamycine, la 17-méthylcongocidine, la 17-fluoro-congocidine, ou encore la N,N-déméthylcongocidine. Des exemples de dérivés fonctionnellement proches sont les molécules capables de se lier à l'ADN dans le petit sillon de la double hélice, avec une certaine spécificité de séquence comme décrit plus haut pour la congocidine, la distamycine et les pyrronamycines.
- L'expression « voie de biosynthèse » de la congocidine ou d'un dérivé de la congocidine est utilisée pour désigner l'ensemble des protéines codées par le groupe de gènes cgc et conduisant à la synthèse de la congocidine ou d'un dérivé de la congocidine. La voie de biosynthèse englobe notamment : la biosynthèse proprement dite de la congocidine ou d'un dérivé, c'est-à-dire l'assemblage des différents constituants de cette molécule. On regroupe dans cette catégorie notamment les protéines Cgc4, Cgc5 et Cgc6, impliquées dans la biosynthèse du précurseur amidinium ou encore les protéines Cgc3, Cgc8, Cgc9, Cgcl l, Cgc 12, Cgc 14 et Cgc 17, qui pourraient intervenir dans la biosynthèse des groupements pyrroles, et notamment du groupement 4-amino- 2-carboxypyrrole. Cette synthèse peut avoir lieu aussi bien dans un microorganisme comprenant de façon endogène le groupe de gènes cgc (par exemple Streptomyces ambofaciens), que dans un système d'expression hétérologue convenable, tel qu'une cellule recombinante (par exemple
Streptomyces lividans) transformée par un vecteur d'expression comprenant un ou plusieurs des gènes dudit groupe de gènes cgc. Pour la synthèse de dérivés de la congocidine, le milieu de culture comprend des précurseurs convenables, choisis en fonction du polynucléotide mis en œuvre et/ou en fonction du dérivé que l'on souhaite obtenir. Par exemple, pour la préparation de la 17- méthylcongocidine ou de la 17-fluorocongocidine, il est préférable de mettre en œuvre un milieu de culture comprenant de la 5-méthylcytosine ou de la 5- fluorocongocidine. Cette synthèse peut également avoir lieu, partiellement ou totalement, dans un système acellulaire mettant en œuvre les protéines Cgc choisies en fonction de la molécule à synthétiser (congocidine ou dérivé de la congocidine) ; - les éléments de régulation de ladite biosynthèse. La régulation peut notamment avoir lieu au niveau transcriptionnel, traductionnel, ou bien au niveau de l'activité enzymatique. Il peut s'agir d'une inhibition ou d'une augmentation de la transcription, de la traduction ou de l'activité enzymatique ; la protéine Cgc 1, par exemple, interviendrait dans la régulation transcriptionnelle de la biosynthèse de la congocidine ; et
- les éléments de résistance à la congocidine. Les protéines Cgc2* et Cgcl * font partie de cette catégorie. En effet, dans un système d'expression hétérologue d'un ou plusieurs gène(s) du groupe de gènes cgc, il peut être nécessaire de conférer à l'hôte le caractère de résistance à la congocidine, sans lequel la biosynthèse de congocidine pourrait ne pas avoir lieu de façon satisfaisante. Cela pourrait notamment être le cas pour un hôte naturellement sensible à la congocidine.
- l'expression « diriger la biosynthèse » de la congocidine ou d'un dérivé de congocidine est utilisée en référence à l'activité des protéines Cgc impliquées dans la biosynthèse proprement dite de la congocidine ou d'un dérivé de congocidine. Ainsi, un polynucléotide s'hybridant dans les conditions stringentes à un acide nucléique impliqué dans la biosynthèse de la congocidine ou d'un dérivé de la congocidine et pouvant le remplacer pour diriger ladite biosynthèse signifie que le ou les polypeptides pour lesquels il code ont une fonction identique ou équivalente à la fonction du ou des polypeptides codés par ledit acide nucléique.
- Au sens de la présente invention, les termes « polypeptide(s) » et « protéine(s) » sont interchangeables et peuvent être indifféremment utilisés pour désigner les produits de traduction des ORFs. - Au sens de l'invention, le terme « analogue » se réfère à un polypeptide stracturellement proche d'un polypeptide codé par un gène cgc et pouvant participer à la voie de biosynthèse de la congocidine ou d'un dérivé de la congocidine tel que décrit plus haut, par exemple un dérivé non toxique de la congocidine. Ainsi : - un analogue du polypeptide Cgc3* (SEQ ID NO: 2) présente au moins 53% d'identité et au moins 60% de similarité, de préférence au moins 60% d'identité et au moins 65% de similarité, de manière encore préférée au moins 65% d'identité et au moins 70% de similarité, de manière encore plus préférée, au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 2.
- un analogue du polypeptide Cgc2* (SEQ ID NO: 4) présente au moins 76% d'identité et au moins 84% de similarité, de préférence au moins 80% d'identité et au moins 84% de similarité, de manière encore préférée au moins 85% d'identité et au moins 90% de similarité, de manière encore plus préférée, au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 4.
- un analogue du polypeptide Cgcl* (SEQ ID NO: 6) présente au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins
85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 6.
- un analogue du polypeptide Cgcl (SEQ ID NO: 8) présente au moins 62% d'identité et au moins 71% de similarité, de préférence au moins 65% d'identité et au moins 71% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 8.
- un analogue du polypeptide Cgc2 (SEQ ID NO: 10) présente au moins 36% d'identité et au moins 48% de similarité, de préférence au moins 40% d'identité et au moins 48% de similarité, de préférence encore au moins 45% d'identité et au moins 48% de similarité, de manière plus préférée au moins 50% d'identité et au moins 55% de similarité, de manière plus préférée encore au moins 55% d'identité et au moins 60% de similarité, plus préférentiellement au moins 60% d'identité et au moins 65% de similarité, plus préférentiellement encore au moins 65% d'identité et au moins 70% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 10. - un analogue du polypeptide Cgc3 (SEQ ID NO: 12) présente au moins 49% d'identité et au moins 62% de similarité, de préférence au moins 55% d'identité et au moins 62% de similarité, de préférence encore au moins 60% d'identité et au moins 62% de similarité, plus préférentiellement encore au moins 65% d'identité et au moins 70% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 12.
- un analogue du polypeptide Cgc4 (SEQ ID NO: 14) présente au moins 55% d'identité et au moins 71% de similarité, de préférence au moins 60% d'identité et au moins 71% de similarité, de préférence encore au moins 65% d'identité et au moins 71% de similarité, de manière plus préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 14.
- un analogue du polypeptide Cgc5 (SEQ ID NO: 16) présente au moins 51% d'identité et au moins 67% de similarité, de préférence au moins 55% d'identité et au moins 67% de similarité, de préférence encore au moins 60% d'identité et au moins 67% de similarité, de manière plus préférée au moins 65% d'identité et au moins 67% de similarité, de manière plus préférée encore au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 16.
- un analogue du polypeptide Cgc6 (SEQ ID NO: 18) présente au moins 56% d'identité et au moins 72% de similarité, de préférence au moins 60% d'identité et au moins 72% de similarité, de préférence encore au moins 65% d'identité et au moins 72% de similarité, de manière plus préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 18.
- un analogue du polypeptide Cgc7 (SEQ ID NO: 20) présente au moins 32% d'identité et au moins 46% de similarité, de préférence au moins 40% d'identité et au moins 46% de similarité, de préférence encore au moins 45% d'identité et au moins 50% de similarité, de manière plus préférée au moins 50% d'identité et au moins 55% de similarité, de manière plus préférée encore au moins 55% d'identité et au moins 60% de similarité, plus préférentiellement au moins 60% d'identité et au moins 65% de similarité, plus préférentiellement encore au moins 65% d'identité et au moins 70% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 20. - un analogue du polypeptide Cgc8 (SEQ ID NO: 22) présente au moins 39% d'identité et au moins 56% de similarité, de préférence au moins 40% d'identité et au moins 56% de similarité, de préférence encore au moins 45% d'identité et au moins 56% de similarité, de manière plus préférée au moins 50% d'identité et au moins 56% de similarité, de manière plus préférée encore au moins 55% d'identité et au moins 60% de similarité, plus préférentiellement au moins 60% d'identité et au moins 65% de similarité, plus préférentiellement encore au moins 65% d'identité et au moins 70% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 22.
- un analogue du polypeptide Cgc9 (SEQ ID NO: 24) présente au moins 45% d'identité et au moins 58% de similarité, de préférence au moins 50% d'identité et au moins 58% de similarité, de préférence encore au moins 55% d'identité et au moins 58% de similarité, plus préférentiellement au moins 60% d'identité et au moins 65% de similarité, plus préférentiellement encore au moins 65% d'identité et au moins 70% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 24.
- un analogue du polypeptide CgclO (SEQ ID NO: 26) présente au moins 34% d'identité et au moins 47% de similarité, de préférence au moins 35% d'identité et au moins 47% de similarité, préférentiellement au moins 40% d'identité et au moins 47% de similarité, de préférence encore au moins 45% d'identité et au moins 50% de similarité, de manière plus préférée au moins 50% d'identité et au moins 55% de similarité, de manière plus préférée encore au moins 55% d'identité et au moins 60% de similarité, plus préférentiellement au moins 60% d'identité et au moins 65% de similarité, plus préférentiellement encore au moins 65% d'identité et au moins 70% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 26.
- un analogue du polypeptide Cgcl 1 (SEQ ID NO: 28) présente au moins 44% d'identité et au moins 65% de similarité, de préférence au moins 50% d'identité et au moins 65% de similarité, de préférence encore au moins 55% d'identité et au moins 65% de similarité, de manière plus préférée au moins 60% d'identité et au moins 65% de similarité, plus préférentiellement encore au moins 65% d'identité et au moins 70% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 28.
- un analogue du polypeptide Cgcl 2 (SEQ ID NO: 30) présente au moins 47% d'identité et au moins 60% de similarité, de préférence au moins 50% d'identité et au moins 60% de similarité, de préférence encore au moins 55% d'identité et au moins 60% de similarité, plus préférentiellement au moins 60% d'identité et au moins 65% de similarité, plus préférentiellement encore au moins 65% d'identité et au moins 70% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 30.
- un analogue du polypeptide Cgcl3 (SEQ ID NO: 32) présente au moins 26% d'identité et au moins 44% de similarité, de préférence au moins 30% d'identité et au moins 44% de similarité, préférentiellement encore au moins 35% d'identité et au moins 44% de similarité, de manière encore préférée au moins 40% d'identité et au moins 44% de similarité, de préférence encore au moins 45% d'identité et au moins 50% de similarité, de manière plus préférée au moins 50% d'identité et au moins 55% de similarité, de manière plus préférée encore au moins 55% d'identité et au moins 60% de similarité, plus préférentiellement au moins 60% d'identité et au moins 65% de similarité, plus préférentiellement encore au moins 65% d'identité et au moins 70% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 32.
- un analogue du polypeptide Cgcl4 (SEQ ID NO: 34) présente au moins 31% d'identité et au moins 48% de similarité, de préférence au moins 35% d'identité et au moins 48% de similarité, préférentiellement encore au moins 40% d'identité et au moins 48% de similarité, de préférence encore au moins 45% d'identité et au moins 48% de similarité, de manière plus préférée au moins 50% d'identité et au moins 55% de similarité, de manière plus préférée encore au moins 55% d'identité et au moins 60% de similarité, plus préférentiellement au moins 60% d'identité et au moins 65% de similarité, plus préférentiellement encore au moins 65% d'identité et au moins 70% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 34. - un analogue du polypeptide Cgcl5 (SEQ ID NO: 36) présente au moins 33% d'identité et au moins 46% de similarité, préférentiellement au moins 35% d'identité et au moins 46% de similarité, de préférence au moins 40% d'identité et au moins 46% de similarité, de préférence encore au moins 45% d'identité et au moins 50% de similarité, de manière plus préférée au moins 50% d'identité et au moins 55% de similarité, de manière plus préférée encore au moins 55% d'identité et au moins 60% de similarité, plus préférentiellement au moins 60% d'identité et au moins 65% de similarité, plus préférentiellement encore au moins 65% d'identité et au moins 70% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 36. - un analogue du polypeptide Cgcl6 (SEQ ID NO: 38) présente au moins 38% d'identité et au moins 55% de similarité, de préférence au moins 40% d'identité et au moins 55% de similarité, de préférence encore au moins 45% d'identité et au moins 55% de similarité, de manière plus préférée au moins 50% d'identité et au moins 55% de similarité, de manière plus préférée encore au moins 55% d'identité et au moins 60% de similarité, plus préférentiellement au moins 60% d'identité et au moins 65% de similarité, plus préférentiellement encore au moins 65% d'identité et au moins 70% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 38.
- un analogue du polypeptide Cgcl7 (SEQ ID NO: 40) présente au moins 39% d'identité et au moins 50% de similarité, de préférence au moins 45% d'identité et au et au moins 50% de similarité, de manière plus préférée au moins 50% d'identité et au moins 55% de similarité, de manière plus préférée encore au moins 55% d'identité et au moins 60% de similarité, plus préférentiellement au moins 60% d'identité et au moins 65% de similarité, plus préférentiellement encore au moins 65% d'identité et au moins 70% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 40. - un analogue du polypeptide Cgcl8 (SEQ ID NO: 42) présente au moins 40% d'identité et au moins 54% de similarité, de préférence au moins 45% d'identité et au moins 54% de similarité, de préférence encore au moins 50% d'identité et au moins 54% de similarité, de manière plus préférée encore au moins 55% d'identité et au moins 60% de similarité, plus préférentiellement au moins 60% d'identité et au moins 65% de similarité, plus préférentiellement encore au moins 65% d'identité et au moins 70% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins 90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 42.
- un analogue du polypeptide Cgcl9 (SEQ ID NO: 44) présente au moins 51% d'identité et au moins 55% de similarité, de manière plus préférée encore au moins 55% d'identité et au moins 60% de similarité, plus préférentiellement au moins 60% d'identité et au moins 65% de similarité, plus préférentiellement encore au moins 65% d'identité et au moins 70% de similarité, de manière encore préférée au moins 70% d'identité et au moins 75% de similarité, préférentiellement encore au moins 75% d'identité et au moins 80% de similarité, de manière encore plus préférée au moins 80% d'identité et au moins 85% de similarité, plus préférentiellement au moins 85% d'identité et au moins 90% de similarité, de préférence encore au moins
90% d'identité et au moins 95% de similarité, et de manière encore plus préférée, au moins 95% d'identité et au moins 99% de similarité avec la séquence SEQ ID NO: 44.
Par x% d'identité entre un polypeptide P et une séquence de référence, on entend que lorsque les deux séquences sont alignées, x% des acides aminés de P sont identiques à l'acide aminé correspondant de ladite séquence de référence. Par x% de similarité entre un polypeptide P et une séquence de référence, on entend que lorsque les deux polypeptides sont alignés, x% des acides aminés de P sont identiques à l'acide aminé correspondant de ladite séquence de référence ou sont remplacés par un acide aminé du même groupe. Ces pourcentages peuvent être déterminés à l'aide d'un alignement global des deux séquences, par exemple à l'aide du programme Needle (Needleman, S. B. et Wunsch, C. D. (1970) J. Mol. Biol. 48, 443-453). Le nombre de résidus identiques (ou similaires) ainsi déterminé est alors divisé par le nombre total de résidus dans la séquence P. Par acide aminé de même groupe, on entend un acide aminé possédant des propriétés chimiques sensiblement identiques. En particulier, on entend par ce terme des acides aminés ayant sensiblement la même charge et/ou la même taille, et/ou la même hydrophilie ou hydrophobie et/ou la même aromaticité.
De tels groupes d'acides aminés incluent notamment ; (i) glycine, alanine
(ii) isoleucine, leucine, valine (iii) tryptophane, tyrosine, phénylalanine (iv) acide aspartique, acide glutamique (v) arginine, lysine, histidine (vi) serine, thréonine
D'autres substitutions peuvent être envisagées, dans lesquelles on remplace un acide aminé par un autre acide aminé comparable mais non naturel (hydroxyproline, norleucine, ornithine, citrulline, cyclohexylalanine, acides aminés dextrogyres, ....). La présente invention a également pour objet l'utilisation d'un polynucléotide pour la production d'un dérivé de congocidine, ledit polynucléotide étant sélectionné dans le groupe constitué par : al) un polynucléotide comprenant l'ensemble des phases ouvertes de lecture ORF 1, ORF 5, ORF 6 et ORF 8 à ORF 22, codant respectivement pour les polypeptides Cgc3* (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO:
12), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8
(SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl 1 (SEQ ID
NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO:
34), Cgcl5 (SEQ ID NO: 36), Cgcl6 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl 8 (SEQ ID NO: 42) et Cgcl 9 (SEQ ID NO: 44), l'une ou plusieurs desdites phases ouvertes de lecture étant optionnellement remplacée(s) par la (les) séquence(s) complémentaire(s) correspondante(s) ; bl) un polynucléotide codant pour l'ensemble des polypeptides codés par lesdites phases ouvertes de lecture ORF 1, ORF 5, ORF 6 et ORF 8 à ORF 22 ; et cl) un polynucléotide codant pour un analogue de chacun des polypeptides codés par lesdits ORF 1, ORF 5, ORF 6 et ORF 8 à ORF 22 ; et dl) un polynucléotide s'hybridant dans des conditions stringentes au polynucléotide défini en al) et pouvant remplacer l'acide nucléique auquel il s'hybride spécifiquement pour diriger la biosynthèse dudit dérivé de la congocidine.
Selon un mode de mise en œuvre avantageux de ladite utilisation, ledit dérivé de la congocidine est sélectionné dans le groupe constitué par la 17- méthylcongocidine, et la 17-fluorocongocidine.
La présente Invention a également pour objet l'utilisation d'un polynucléotide pour la production d'un dérivé de la congocidine, ledit polynucléotide étant sélectionné dans le groupe constitué par : a2) un polynucléotide comprenant l'ensemble des phases ouvertes de lecture ORF 1, ORF 5 à ORF 17 et ORF 19 à ORF 22, codant respectivement pour les polypeptides de la voie de biosynthèse de la congocidine Cgc3* (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl 1 (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl6 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgclδ (SEQ ID NO: 42) et Cgcl9 (SEQ ID NO: 44), l'une ou plusieurs desdites phases ouvertes de lecture étant optionnellement remplacée(s) par la (les) séquence(s) complémentaire(s) correspondante(s) ; b2) un polynucléotide codant pour l'ensemble des polypeptides codés par lesdites phases ouvertes de lecture ORF 1, ORF 5 à ORF 17 et ORF 19 à ORF 22 ; et c2) un polynucléotide codant pour un analogue de chacun des polypeptides codés par lesdites phases ouvertes de lecture ORF 1 , ORF 5 à ORF 17 et ORF 19 à ORF 22 ; et d2) un polynucléotide s'hybridant dans des conditions stringentes au polynucléotide défini en a2) et pouvant remplacer l'acide nucléique auquel il s'hybride spécifiquement pour diriger la biosynthèse dudit dérivé de la congocidine.
La présente Invention a également pour objet l'utilisation d'un polynucléotide pour la production d'un dérivé de la congocidine, ledit polynucléotide étant sélectionné dans le groupe constitué par : a3) un polynucléotide comprenant l'ensemble des phases ouvertes de lecture ORF 1, ORF 5, ORF 6, ORF 8 à ORF 17 et ORF 19 à ORF 22, codant respectivement pour les polypeptides de la voie de biosynthèse de la congocidine
Cgc3* (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22),
Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl l (SEQ ID NO: 28), Cgcl2
(SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl6 (SEQ
ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl8 (SEQ ID NO: 42) et Cgcl9 (SEQ ID
NO: 44), l'une ou plusieurs desdites phases ouvertes de lecture étant optionnellement remplacée(s) par la (les) séquence(s) complémentaire(s) correspondante(s) ; b3) un polynucléotide codant pour l'ensemble des polypeptides codés par lesdites phases ouvertes de lecture ORF 1, ORF 5, ORF 6, ORF 8 à ORF 17 et ORF 19 à ORF 22 ; et c3) un polynucléotide codant pour un analogue de chacun des polypeptides codés par lesdites phases ouvertes de lecture ORF 1, ORF 5, ORF 6, ORF 8 à ORF 17 et ORF 19 à ORF 22 ; et d3) un polynucléotide s'hybridant dans des conditions stringentes au polynucléotide défini en a3) et pouvant remplacer l'acide nucléique auquel il s'hybride spécifiquement pour diriger la biosynthèse dudit dérivé de la congocidine. Selon un mode de mise en œuvre avantageux de cette utilisation, ledit dérivé de la congocidine est la 17-fluoro-déméthylcongocidine.
Selon un mode de mise en œuvre avantageux de cette utilisation, ledit dérivé de la congocidine est la N,N-déméthylcongocidine.
Selon un mode de mise en œuvre avantageux des utilisations selon l'invention : a4) le polynucléotide défini en a), al), a2) ou a3) comprend en outre la phase ouverte de lecture ORF 4 codant pour le polypeptide Cgcl (SEQ ID NO: 8) ; b4) le polynucléotide défini en b), bl), b2) ou b3) code en outre pour le polypeptide codé par ladite phase ouverte de lecture ORF 4 ; c4) le polynucléotide défini en c), cl), c2) ou c3) code en outre pour un analogue de Cgcl ; et d4) le polynucléotide défini en d), dl, d2) ou d3) s'hybride dans des conditions stringentes au polynucléotide défini en a4) et peut le remplacer pour réguler la biosynthèse de la congocidine ou du dérivé de la congocidine. Le polynucléotide incluant les phases ouvertes de lecture ORF 1 et
4 à 22, c'est-à-dire les phases ouvertes de lecture utiles pour la biosynthèse ainsi que les phases ouvertes de lecture utiles pour la régulation, est apte à réguler la biosynthèse de congocidine ou d'un dérivé de la congocidine chez un microorganisme ayant la capacité de synthétiser la congocidine ou ledit dérivé de la congocidine. En particulier, un tel polynucléotide permet d'augmenter la biosynthèse de congocidine ou dudit dérivé. Il peut également être utilisé pour conférer à un microorganisme hôte la capacité à produire la congocidine ou un dérivé de la congocidine, dans le cas notamment où l'hôte ne possède pas, initialement, le gène cgcl endogène, ou bien lorsque ce gène endogène est initialement inactivé. Comme précisé ci-après, ledit polynucléotide peut comprendre en outre optionnellement les phases ouvertes de lecture ORF 2 et ORF 3, impliquées dans la résistance à la congocidine. Selon un autre mode de mise en œuvre avantageux des utilisations objet de la présente invention : a5) le polynucléotide défini en a), al), a2), a3) ou a4) comprend en outre les phases ouvertes de lecture ORF 2 et ORF 3 codant pour les polypeptides Cgc2* (SEQ ID NO: 4) et Cgcl* (SEQ ID NO: 6) ; b5) le polynucléotide défini en b), bl), b2), b3) ou b4) code en outre pour les polypeptides codés par lesdites phases ouvertes de lecture ORF 2 et ORF 3 ; c5) le polynucléotide défini en c), cl), c2), c3) ou c4) code en outre pour un analogue de Cgc2* et un analogue de Cgcl * ; et d5) le polynucléotide défini en d), dl), d2), d3) ou d4) s'hybride dans des conditions stringentes au polynucléotide défini en a5) et peut remplacer l'acide nucléique auquel il s'hybride spécifiquement pour conférer la résistance à la congocidine.
Un tel polynucléotide confère à un microorganisme hôte le caractère de résistance à la congocidine. Selon une disposition avantageuse de ce mode de mise en œuvre, ledit polynucléotide comprend l'ensemble des phases ouvertes de lecture ORF 1 à ORF 22. De préférence, ledit polynucléotide est défini par la séquence SEQ ID NO: 49 ou la séquence SEQ ID NO: 102. Ledit polynucléotide, comprenant l'ensemble du groupe de gènes cgc, quelles que soient leurs orientations, confère à un hôte à la fois la capacité à produire la congocidine ou un dérivé de la congocidine et le caractère de résistance à la congocidine. Un tel polynucléotide est notamment utile lorsque le microorganisme choisi pour la production de congocidine ou d'un dérivé n'est initialement pas résistant à la congocidine.
Lorsque des protéines à domaine PCP doivent être exprimées (c'est le cas des protéines Cgcl 8 et Cgc 19, cf. Tableau III), il est nécessaire que ledit microorganisme exprime des phosphopantethéinyle transférases (PPTases). Le microorganisme peut par exemple exprimer de manière naturelle lesdites PPTases. S'il n'exprime pas de manière naturelle lesdites PPTases, ledit microorganisme peut être modifié de manière à exprimer lesdites PPTases. Il existe des PPTases capables de modifier un grand nombre de protéines contenant des domaines PCP, et qui peuvent être exprimées dans des hôtes hétérologues (Suo et al, 2001). Avantageusement, lesdites utilisations selon l'invention mettent en œuvre ledit polynucléotide dans un vecteur. De préférence, ledit vecteur est un plasmide, un cosmide, un chromosome artificiel bactérien (BAC), un vecteur dérivé d'un élément intégratif d'actinobactérie, un virus ou un bactériophage.
De manière avantageuse, les utilisations selon l'invention mettent en œuvre une cellule recombinante transformée par un vecteur tel que défini ci-dessus. De manière préférée, ladite cellule recombinante est une actinobactérie. De manière encore plus préférée, il s'agit d'une actinobactérie du genre Streptomyces, telle que Streptomyces lividans.
La présente invention a également pour objet un polynucléotide isolé, caractérisé en ce qu'il comprend au moins une séquence d'acide nucléique sélectionnée dans le groupe constitué par : a6) l'une quelconque des phases ouvertes de lecture ORF 1 à ORF 22 codant pour les polypeptides de la voie de biosynthèse de la congocidine Cgc3* (SEQ ID NO: 2), Cgc2* (SEQ ID NO: 4), Cgcl* (SEQ ID NO: 6), Cgcl (SEQ ID NO: 8), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl l (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl5 (SEQ ID NO: 36), Cgcl6 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl8 (SEQ ID NO: 42) et Cgcl 9 (SEQ ID NO: 44), l'une ou plusieurs desdites phases ouvertes de lecture étant optionnellement remplacée(s) par la (les) séquence(s) complémentaire(s) correspondante(s) ; b6) une séquence codant pour l'un quelconque des polypeptides codés par lesdites phases ouvertes de lecture ORF 1 à ORF 22 ; c6) une séquence codant pour un analogue de chacun des polypeptides codés par lesdites phases ouvertes de lecture ORF 1 à ORF 22 ; d6) une séquence comprenant au moins deux séquences de a6), b6) ou c6) ; et e6) une séquence s'hybridant dans des conditions stringentes à l'une quelconque des phases ouvertes de lecture ORF 1 à ORF 22 et pouvant remplacer la (les) phase(s) ouverte(s) de lecture à laquelle (auxquelles) elle s'hybride spécifiquement pour diriger la biosynthèse de la congocidine ou d'un dérivé de la congocidine, pour réguler ladite biosynthèse ou pour conférer la résistance à la congocidine.
Selon un mode de réalisation préféré de ce polynucléotide, il comprend une séquence d'acide nucléique sélectionnée dans le groupe constitué par : a7) une séquence comprenant les deux phases ouvertes de lecture
ORF 2 et ORF 3 codant pour les polypeptides impliqués dans la résistance à la congocidine, Cgc2* (SEQ ID NO: 4) et Cgcl* (SEQ ID NO: 6), l'une et/ou l'autre desdites phases ouvertes de lecture étant optionnellement remplacée(s) par la (les) séquence(s) complémentaire(s) correspondante(s) ; b7) une séquence codant pour les polypeptides codés par lesdites phases ouvertes de lecture ORF 2 et 3 ; c7) une séquence codant pour les analogues desdits polypeptides codés par lesdites phases ouvertes de lecture ORF 2 et 3, lesdits analogues étant tels que définis dans la revendication 1 ; et d7) une séquence s'hybridant dans des conditions stringentes à l'acide nucléique défini en a7) et pouvant remplacer l'acide nucléique auquel elle s'hybride spécifiquement pour conférer la résistance à la congocidine.
Un tel polynucléotide code uniquement pour les polypeptides impliqués dans la résistance à la congocidine. Selon un autre mode de réalisation dudit polynucléotide objet de l'invention, celui-ci est sélectionné dans le groupe constitué par : a8) un polynucléotide comprenant la phase ouverte de lecture ORF 4 codant pour le polypeptide impliqués dans la régulation de la biosynthèse de la congocidine Cgcl (SEQ ID NO: 8), ladite phase ouverte de lecture étant optionnellement remplacée par la séquence complémentaire correspondante ; b8) une séquence codant pour le polypeptide codé par ladite phase ouverte de lecture ORF 4 ; c8) une séquence codant pour un analogue de Cgcl présentant au moins 62% d'identité et au moins 71% de similarité avec la séquence SEQ ID NO: 8 ; et d8) une séquence s'hybridant dans des conditions stringentes à la phase ouverte de lecture ORF 4 et pouvant la remplacer pour réguler la biosynthèse de la congocidine ou d'un dérivé de la congocidine.
Un tel polynucléotide code uniquement pour le polypeptide de régulation transcriptionnelle de la biosynthèse de congocidine.
La présente invention a également pour objet un polynucléotide isolé tel que défini plus haut et mis en œuvre dans les utilisations selon l'invention. L'invention a en outre pour objet l'utilisation d'un polynucléotide comprenant une séquence d'acide nucléique sélectionnée dans le groupe constitué par les séquences définies en a7), b7), c7) et d7) ci-dessus, pour conférer à un microorganisme le caractère de résistance à la congocidine. L'invention a également pour objet l'utilisation d'un polynucléotide comprenant une séquence d'acide nucléique sélectionnée dans le groupe constitué par les séquences définies en a8), b8), c8) et d8) ci-dessus, pour augmenter la biosynthèse de congocidine ou d'un dérivé de la congocidine.
Selon un mode de mise en œuvre avantageux de ces utilisations, ledit microorganisme est une actinobactérie. De préférence, ledit microorganisme est Streptomyces lividans.
L'invention a également pour objet un groupe de gènes comprenant les phases ouvertes de lecture codant pour les polypeptides Cgc3* (SEQ ID NO: 2),
Cgc2* (SEQ ID NO: 4), Cgcl* (SEQ ID NO: 6), Cgcl (SEQ ID NO: 8), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16),
Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ
ID NO: 24), Cgcl O (SEQ ID NO: 26), Cgcl 1 (SEQ ID NO: 28), Cgcl 2 (SEQ ID NO:
30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl5 (SEQ ID NO: 36),
Cgcl6 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl8 (SEQ ID NO: 42) et Cgcl9 (SEQ ID NO: 44).
Un autre objet de la présente invention est un vecteur comprenant un polynucléotide selon l'invention.
Avantageusement, ledit vecteur est un plasmide, un cosmide, un chromosome artificiel bactérien (BAC), un vecteur dérivé d'un élément intégratif d' actinobactérie, un virus ou un bactériophage.
La présente invention a également pour objet une cellule recombinante exprimant des phosphopantethéinyle transférases (PPTases) caractérisée en ce qu'elle est transformée par un vecteur selon l'invention.
De manière préférée, ladite cellule recombinante est une actinobactérie. De manière encore plus préférée, il s'agit d'une actinobactérie du genre Streptomyces, telle que Streptomyces lividans.
Selon un mode de réalisation de la cellule recombinante selon l'invention, celle-ci est apte à synthétiser la congocidine, et ledit vecteur est un vecteur d'expression comprenant au moins un polynucléotide comprenant les ORFs de la biosynthèse de la congocidine tel que décrit plus haut.
Selon un mode de réalisation de Ia cellule recombinante selon l'invention, celle-ci est apte à synthétiser un dérivé de la congocidine, et ledit vecteur est un vecteur d'expression comprenant au moins un polynucléotide comprenant les ORFs de la biosynthèse d'un dérivé de la congocidine tel que décrit plus haut.
Selon un autre mode de réalisation, ladite cellule recombinante est résistante à la congocidine, et ledit vecteur est un vecteur d'expression comprenant au moins un des polynucléotides comprenant les ORFs impliquées dans la résistance à la congocidine, tels que décrits plus haut.
L'invention a également pour objet un fragment d'au moins 15 nucléotides, et par ordre croissant de préférence, d'au moins 20 nucléotides, d'au moins 25 nucléotides, d'au moins 30 nucléotides, d'au moins 35 nucléotides, d'au moins 40 nucléotides, d'au moins 45 nucléotides ou d'au moins 50 nucléotides, d'au moins 55 nucléotides, d'au moins 60 nucléotides d'un polynucléotide selon l'invention, ledit fragment étant utilisable comme sonde ou amorce. De préférence, ledit fragment comprend au plus 100 nucléotides. De manière encore plus préférée, il comprend au plus 60 nucléotides. Avantageusement, ledit fragment comprend une séquence sélectionnée dans le groupe constitué par les séquences SEQ ID NO: 52, 53 et 56 à 59.
La présente invention a en outre pour objet un polypeptide isolé, impliqué dans la voie de la biosynthèse de la congocidine ou d'un dérivé de la congocidine, caractérisé en ce qu'il est sélectionné dans le groupe constitué par : - les polypeptides Cgc3* (SEQ ID NO: 2), Cgc2* (SEQ ID NO:
4), Cgcl* (SEQ ID NO: 6), Cgcl (SEQ ID NO: 8), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl l (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl5 (SEQ ID NO: 36), Cgcl6 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl 8 (SEQ ID NO: 42) et Cgcl9 (SEQ ID NO: 44) ; et les analogues desdits polypeptides. La présente invention a en outre pour objet l'utilisation des polypeptides Cgc3* (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl l (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl5 (SEQ ID NO: 36), Cgcl6 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl 8 (SEQ ID NO: 42) et Cgcl9 (SEQ ID NO: 44), chaque polypeptide étant optionnellement remplacé par un analogue correspondant, pour la production de la congocidine ou d'un dérivé de la congocidine. L'invention a également pour objet l'utilisation des polypeptides Cgc3* (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl l (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl5 (SEQ ID NO: 36), Cgcl6 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl8 (SEQ ID NO: 42) et Cgc 19 (SEQ ID NO: 44), chaque polypeptide étant optionnellement remplacé par un analogue correspondant, pour la production d'un dérivé de la congocidine. De préférence, ledit dérivé est la 17-méthylcongocidine ou la 17-fluorocongocidine. L'invention a également pour objet l'utilisation des polypeptides
Cgc3* (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl l (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl6 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), CgclS (SEQ ID NO: 42) et Cgc 19 (SEQ ID NO: 44), chaque polypeptide étant optionnellement remplacé par un analogue correspondant, pour la production d'un dérivé de la congocidine. De préférence, ledit dérivé est la N,N-déméthylcongocidine.
L'invention a également pour objet l'utilisation des polypeptides Cgc3* (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl l (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl6 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), CgclS (SEQ ID NO: 42) et Cgcl9 (SEQ ID NO: 44), chaque polypeptide étant optionnellement remplacé par un analogue correspondant, pour la production d'un dérivé de la congocidine. De préférence, ledit dérivé est la 17- fluoro-déméthylcongocidine.
La présente invention a également pour objet un procédé de production de congocidine ou d'un dérivé de la congocidine, caractérisé en ce qu'il comprend une étape consistant à mettre en culture une cellule recombinante apte à produire la congocidine ou un dérivé de la congocidine, telle que définie plus haut, dans des conditions permettant la synthèse de la congocidine ou dudit dérivé de congocidine.
L'expression « dans les conditions permettant la production de la congocidine ou d'un dérivé de la congocidine » signifie que : lorsque les gènes cgc2* et cgcl * sont absents du polynucléotide mis en œuvre, le procédé met en œuvre une cellule naturellement résistante, selon le cas, à la congocidine ou au dérivé de la congocidine, si ledit dérivé a une activité antibactérienne. Cette résistance est par exemple due à la présence de gènes cgc2* et cgcl* endogènes ou bien de gènes dont les produits permettent l'excrétion de la congocidine ou dudit dérivé dans le milieu de culture. - le procédé met en œuvre un milieu de culture convenable, tel qu'un milieu MP5 (extrait de levure : 7 g/1 ; NaCl : 5 g/1 ; NaNO3 : 1 g/1 ; glycérol : 40 g/1 ; MOPS : 100 raM, pH 7,5) (Pernodet et al, 1993). Le milieu MP5 est particulièrement adapté à la production de congocidine ou de diméthylcongocidine par une souche de Streptomyces. Ledit milieu de culture peut éventuellement être supplémenté par un ou plusieurs précurseur(s) particulier(s). Ainsi, un milieu de culture comprenant de la 5-méthylcytosine est particulièrement adapté à la production de 17-méthylcongocidine ; un milieu de culture comprenant de la 5-fluorocytosine est particulièrement adapté à la production de 17-fluorocongocidîne. la cellule recombinante mise en œuvre dans ledit procédé exprime des phosphopantethéinyle transférases (PPTases).
Selon un mode de mise en œuvre avantageux du procédé selon l'invention, ledit dérivé de la congocidine est la 17-méthylcongocidine et ladite cellule recombinante comprend un polynucléotide utilisable pour la production de 17- méthylcongocidine tel que défini plus haut et est mise en culture en présence de 5- méthylcytosine.
Selon un autre mode de mise en œuvre avantageux du procédé selon l'invention, ledit dérivé de la congocidine est la 17-fluorocongocidine et ladite cellule recombinante comprend un polynucléotide utilisable pour la production de 17- fluorocongocidine tel que défini plus haut et est mise en culture en présence de 5- fluorocytosine.
Selon un autre mode de mise en œuvre avantageux du procédé selon l'invention, ledit dérivé de la congocidine est la N,N-déméthylcongocidine et ladite cellule recombinante comprend un polynucléotide utilisable pour la production de N,N-déméthylcongocidine tel que défini plus haut Selon un autre mode de mise en œuvre avantageux du procédé selon l'invention, ledit dérivé de la congocidine est la 17-fluoro-déméthylcongocidine et ladite cellule recombinante comprend un polynucléotide utilisable pour la production de 17-fluoro-déméthylcongocidine tel que défini plus haut et est mise en culture en présence de 5-fluorocytosine. La présente invention a également pour objet un dérivé de la congocidine sélectionné dans le groupe constitué par la 17-méthylcongocidine, la 17- fluorocongocidine et laN,N-diméthylcongocidine. Outre les dispositions qui précèdent, l'invention comprend encore d'autres dispositions, qui ressortiront de la description qui va suivre, qui se réfère à des exemples de mise en œuvre du procédé objet de la présente invention ainsi qu'aux dessins annexés, dans lesquels : La Figure 1 représente la structure des molécules de la famille des pyrrolamides (A) et molécules apparentées (B).
La Figure 2 représente les précurseurs putatifs qui sont condensés pour former la molécule de congocidine.
La Figure 3 est une représentation schématique du groupe de gènes cgc (« cluster cgc ») impliqué dans la voie de biosynthèse de la congocidine.
La Figure 4 illustre l'analyse par HPLC des souches de Strepto- myces (Chromatogrammes à 297 nm des surnageants des cultures). A) Souche
SPMl 10 ; B) souche CGCA004 ; C) souche TK23 ; D) souche CGCL006 et E) souche
CGCL010. La congocidine est éluée à 14,2 min (identifiée par son temps de rétention, identique à celui de la congocidine standard, et par sa masse).
La Figure 5 est une représentation schématique des différents gènes présents dans l'insert des BAC pCGCOOl (A), pCGC017 (B) et pCGC019 (C). Les gènes appartenant au groupe cgc sont représentés par des flèches noires alors que les gènes extérieurs au groupe sont symbolisés par des flèches blanches. Les gènes représentés par des rectangles sont incomplets. Tous les gènes du groupe cgc ne sont pas représentés, le schéma n'est pas dessiné à l'échelle.
La Figure 6 correspond à une analyse par HPLC des souches de Streptomyces CGCL006, CGCL026, CGCL027 et CGCL028. Les chromatogrammes sont enregistrés à 297 nm. La congocidine est identifiée par son temps de rétention, identique à celui de la congocidine standard, et par sa masse.
La Figure 7 illustre la voie de biosynthèse proposée pour la biosynthèse du précurseur amidinium de la congocidine.
La Figure 8 correspond à l'analyse de la souche CGCL022. A) : Chromatogrammes à 297 nm des surnageants des cultures de CGCL022 sans cytosine ajoutée (chromatogramme du haut) et avec cytosine ajoutée (chromatogramme du bas), et B) Cinétiques respectives de production de la congocidine et de l'intermédiaire de biosynthèse identifié dans la souche CGCL022, en présence ou en l'absence de cytosine ajoutée au milieu de culture.
La Figure 9 illustre la voie de biosynthèse proposée pour la synthèse des précurseurs 4-amino-2carboxypyrroles de la congocidine.
La Figure 10 illustre la structure de la congocidine avec les différents atomes de carbones numérotés (A) et les spectres RMN 13C des carbones Cp, Cj5, C6 et C13 de la congocidine purifiée après ajout de I3C-3-glycérol dans le milieu de culture (B).
La Figure 11 illustre la biosynthèse de la 17-méthylcongocidine : A) Chromatogramme du surnageant d'une culture de CGCL022 après ajout de 5- méthylcytosine dans le milieu de culture. B) 1. Spectre de masse du pic correspondant à la 17-méthylcongocidine et 2. Fragmentation du pic de m/z =222.9 correspondant à la 17-méthylcongocidine. C) Structure de la 17-méthylcongocidine, un nouvel analogue de la congocidine.
La Figure 12 illustre la biosynthèse de la 17-fluorocongocidine : A) Chromatogramme du surnageant d'une culture de CGCL022 après ajout de 5- fluorocytosine dans le milieu de culture. B) 1. Spectre de masse du pic correspondant à la 17-fluorocongocidine et 2. Fragmentation du pic de m/z =224.9 correspondant à la 17-fluorocongocidine. C) Structure de la 17-fluorocongocidine, un nouvel analogue de la congocidine. La Figure 13 illustre la structure de la N,N-déméthylcongocidine
La Figure 14 correspond à la représentation schématique des plasmides pCGC041 et pCGC045.
Il doit être bien entendu, toutefois, que ces exemples sont donnés uniquement à titre d'illustration de l'objet de l'invention, dont ils ne constituent en aucune manière une limitation.
EXEMPLE 1 : Matériels et Méthodes
1) Souches, vecteurs, oligonucléotides
Les souches et vecteurs (plasmides, BAC) utilisés dans cette étude sont présentés dans le Tableau IV et les oligonucléotides dans le Tableau V.
TABLEAU IV : Souches, plasmides utilisés dans la présente Demande
Nom Propriétés Source/référence
Souches
E. coli S17.1 Souche utilisée pour Ia conjugaison E. coli I Streptomyces Simon et al., 1983
E. coli DH5α Souche utilisée comme hôte pour les clonages
Souche hyper-recombinante utilisée dans les expériences de
E. coli DY330 Yu et al., 2000 « PCR-targeting »
Souche sauvage de S. ambofaciens produisant la spiramycine
ATCC23877 et la congocidine
Souche de S. ambofaciens, dérivée de ATCC23877, ne
SPM110 Karray, 2005 produisant plus de spiramycine
Souche hôte Streptomyces pour l'expression hétérologue des
S. lividans TK23 Kieser et ai, 2000 gènes cgc
Demande en
CGCA004 Souche de S. ambofaciens SPM110 où cgc18 a été interrompu instance
S. lividans TK23 contenant pCGC502 intégré dans le Demande en
CGCL001 chromosome instance
S. lividans TK23 contenant pCGC002 intégré dans le Demande en
CGCL006 chromosome instance
S. lividans TK23 contenant pCGC017 intégré dans le Demande en
CGCL009 chromosome instance
S. lividans TK23 contenant pCGC019 intégré dans le Demande en
CGCL010 chromosome instance
S. lividans TK23 contenant pCGC209 intégré dans le Demande en
CGCL016 chromosome instance
S. lividans TK23 contenant pCGC213 intégré dans le Demande en
CGCL017 chromosome instance
S. lividans TK23 contenant pCGC217 intégré dans le Demande en
CGCL022 chromosome instance
S. lividans TK23 contenant pCGC037 intégré dans le Demande en CGCL026 chromosome instance
S. lividans TK23 contenant pCGC038 intégré dans le Demande en CGCL027 chromosome instance
S. lividans TK23 contenant pCGC039 intégré dans le Demande en CGCL028 chromosome instance S. lividans TK23 contenant pCGC221 intégré dans le Demande en CGCL030 chromosome instance
S. lividans TK23 contenant pCGC223 intégré dans le Demande en CGCL031 chromosome instance
S. lividans TK23 contenant pCGC225 intégré dans le Demande en CGCL032 chromosome instance
S. lividans TK23 contenant pCGC057 intégré dans le Demande en CGCL035 chromosome instance
Plasmides et BAC
Demande en pCGCOOl BAC, pBeloBAC11 contenant l'insert cgc instance
BAC dérivé de pCGCOOl avec le gène de l'intégrase de ΦC31, Demande en pCGC002 attP de ΦC31, Ωhyg, oriT instance
Dérivé de pCGC002 avec la cassette att3aac remplaçant la Demande en pCGC016 séquence entre cgc21 et l'extrémité de l'insert (Fig. 4). instance
Demande en pCGC017 Dérivé de pCGC016 après excision de la cassette att3aac instance
Dérivé de pCGC017 avec la cassette att3aac remplaçant la Demande en pCGC018 séquence entre cgc3* et l'extrémité de l'insert (Fig. 4). instance
pCGC019 Dérivé de pCGC018 après excision de la cassette att3aac Demande en instance
Dérivé de pCGC002 avec la cassette att3aac remplaçant le Demande en pCGC033 gène cgc21 instance
Dérivé de pCGC002 avec la cassette att3aac remplaçant le Demande en pCGC034 gène cgc20 instance
Demande en pCGC037 Dérivé de pCGC033 après excision de la cassette att3aac instance
Demande en pCGC038 Dérivé de pCGC034 après excision de la cassette att3aac instance
Dérivé de pCGC002 avec la cassette att3aac remplaçant le Demande en pCGC035 gène cgc19 instance
Demande en pCGC039 Dérivé de pCGC035 après excision de la cassette att3aac instance pCGC041 pUC19 contenant le fragment de pCGC002 (BsNMl et BstBl ) Demande en comprenant entre autres les gènes cgd et cgc2 instance nnrn Plasmide dérivé de pCGC041 où cgc2 est remplacé par Demande en pυ^υu45 att2aac instance rrrnΛQ Dérivé de pCGC002 avec la cassette att2aac remplaçant le Demande en piΛ>ou4y gène cgc2 instance
Demande en pCGC057 Dérivé de pCGC049 après excision de la cassette att2aac instance
Dérivé de pCGC002 avec remplacement de cgc7 par la Demande en pCGC208 cassette FRTaac instance
Dérivé de pCGC208 après excision de FRTaac, cgc7 délété en Demande en pCGC209 phase instance
Dérivé de pCGC002 avec remplacement de cgdO par la Demande en pCGC212 cassette FRTaac instance
Dérivé de pCGC212 après excision de FRTaac, cgdO délété Demande en pCGC213 en phase instance
Demande en pCGC216 Dérivé de pCGC002 avec remplacement de cgc4 par FRTaac instance
Dérivé de pCGC216 après excison de FRTaac, cgc4 délété en Demande en pCGC217 phase instance
Demande en pCGC220 Dérivé de pCGC002 avec remplacement de cgc3* par FRTaac instance
Dérivé de pCGC221 après excision de FRTaac, cgc3* délété Demande en pCGC221 en phase instance
Demande en pCGC222 Dérivé de pCGC002 avec remplacement de cgc15 par FRTaac instance
Dérivé de pCGC222 après excison de FRTaac, cgc15 délété Demande en pCGC223 en phase instance
Demande en pCGC224 Dérivé de pCGC002 avec remplacement de cgc16 par FRTaac instance
Dérivé de pCGC224 après excision de FRTaac, cgc16 délété Demande en pCGC225 en phase instance
Vecteur plasmidique pSET152 portant les gènes cgd* et Demande en pCGC502 cgc2*, réplicatif chez E. coli, intégratif chez Streptomyces. instance
Vecteur plasmidique pBC-SK+ portant la cassette Ωaac et oriT Demande en pOSV202 au niveau du site Λ/col instance
Plasmide dérivé de pOSV202 portant un fragment interne au Demande en pJMC101 gène cgd 8 instance Vecteur plasmidique dérivant de pTrc99A et contenant Demande en pOSVOIO l'intégrase de pSAM2, attP de pSAM2, Ωhyg, oriT instance
Vecteur plasmidique contenant le gène de l'intégrase de ΦC31, M ,. . , onn . pPAOI6 attP de ΦC31, aac(3)IV, oriT
Plasmide dérivé de pPAOlδ avec Ωhyg-oriT de pOSV010 à la Demande en
POSV201 place de aac(3)IV - oriT instance
Plasmide dérivé de pGP704/Not et contenant la cassette Karray, 2005 pOSV234 att3aac Raynal ef a/., 2006
pOSInt3 Plasmide dérivé de pTrc99A et exprimant Xis et Int de pSAM2 Raynal et ai, 1998
Norrander ef al., pUC19 Vecteur de clonage 1983
-„. ,„„„ Plasmide dérivé de pGP704/Not et contenant la cassette Karray, 2005 POSV232 atf2aac Raynal et al., 2006
TABLEAU V : Oligonucléotides utilisés dans la présente Demande
Nom Séquence 5'-3' Utilisation
Cgc7-DIS-FOR CTCGTGCACCGCGCGCCTTCGACCAGAGGAGAACCCATGA amorce pour le remplacement
(SEQ ID NO:50) TTCCGGGGATCCGTCGACC de cgc7 par la cassette FRTaac
Cgc7-DIS-REV CGGTCAGCAGAGCGACCTCGTTGCCGAAGCCGTAGATCAT amorce pour le remplacement
(SEQ ID NO:51) GTAGGCTGGAGCTGCTTC de cgc7 par la cassette FRTaac
Cgc7-SC-FOR GCGCGTCCAGACCGAGTTTC amorce de vérification pour la
(SEQ ID NO:52) délétion de cgc7
Cgc7-SC-REV GGGAGCGCCTGTTCTGGCAC amorce de vérification pour la
(SEQ ID NO:53) délétion de cgc7
Cgc10-DIS- ACGCGCAGGACATCGCGGCCCGCGGAACCGGGGCGTGAG amorce pour le remplacement
FOR CATTCCGGGGATCCGTCGACC de cgtfO par la cassette
(SEQ ID NO:54) FRTaac cgdO-DIS- AGTCGGCGTCCCTCGCCTCCGGCCAGTACCACTGCTCTCA amorce pour le remplacement
REV TGTAGGCTGGAGCTGCTTC de cgdO par la cassette
(SEQ ID NO:55) FRTaac cgc10-SC-FOR CAGCTGCGTGAGGATG amorce de vérification pour la
(SEQ ID NO:56) délétion de cgrfO cgc10-SC-REV GGTTGCGGGAACTGAC amorce de vérification pour la
(SEQ ID NO:57) délétion de cgrfO
CONGO-R ACCGCCTCCCTGGTCCGGCGCAGCAGCT amorce d'amplification d'un
(SEQ ID NO:58) fragment interne à cgc18
CONGO-D GAGCACGCGCTCCAAC AGGTCGTCCGGC amorce d'amplification d'un
(SEQ ID NO:59) fragment interne à cgc18
OMEGA A1 AGATCCTTGACCCGCAGTTG amorce d'amplification pour la
(SEQ ID NO:60) détection de Ωaac et Ωhyg
OMEGA A2 ACTACCTTGGTGATCTCGCCT amorce d'amplification pour la
(SEQ ID NO:61) détection de Ωaac
OMEGA HYG2 TCCTCGAACACCTCGAAGTC amorce d'amplification pour la
(SEQ ID NO:62) détection de Ωhyg
SEQ ID NO:63 CCGCTCGACCCGCTCCGCCCACTCCGGGTGGCCCGCCTTG amorce pour le remplacement
ATCGCGCGCGCTTCGTTCGGGACGAA des gènes SAMR0897 à
SAMR0888 par la cassette attëaac
SEQ ID NO:64 CCTGTGGCCCGCCACTTCCAGCAAGGCCGTCGCGCCCGAC amorce pour le remplacement
ATCTGCCTCTTCGTCCCGAAGCAACT des gènes SAMR0897 à
SAMR0888 par la cassette att3aac
SEQ ID NO:65 CTGCCCCGGCCCATGCCGCCAAGGCCAGGTGTTCCGCAGG amorce pour le remplacement
ATCGCGCGCGCTTCGTTCGGGACGAA des gènes SAMR0926 à
SAMR0922 par la cassette att3aac
SEQ ID NO:66 CTCTAGAGGATCCTGTTCGCCACCGGCCGCGTCCCCCGCA amorce pour le remplacement
ATCTGCCTCTTCG TCCCGAAGCAACT des gènes SAMR0926 à
SAMR0922 par la cassette att3aac cgc4-DIS-F0R CATCGCGCTTCGCCAAGCAGATCGGGAGATGTCATGAGGA amorce pour le remplacement
(SEQ ID NO: 70) TTCCGGGGATCCGTCGACC de cgc4 par la cassette FRTaac cgc4-DIS-REV ACAGCCGCAGCCCCAGAATCCGCGCGGTGCCGTTCACTCT amorce pour le remplacement
(SEQ ID NO: 71) GTAGGCTGGAGCTGCTTC de cgc4 par la cassette FRTaac cgc4-SC-F0R TTGGTGACCACGGCTGAAG amorce de vérification pour la
(SEQ ID NO: 72) délétion de cgc4 cgc4-SC-REV ACGAGTACACGCAGCTCAAG amorce de vérification pour la
(SEQ ID NO: 73) délétion de cgc4 cgc3*-DIS-FOR CGTCTGCTGTCCGCCGTCGAGAGGAAGGCGTGAGCGATG amorce pour le remplacement (SEQ ID NO: 74) ATTCCGGGGATCCGTCGACC de cgc3* par la cassette FRTaa cgc3*-DIS-REV TCCCTGAGCCGGTGTGCGACAAGCGGTACGGCGCTCCTAT amorce pour le remplacement (SEQ ID NO: 75) GTAGGCTGGAGCTGCTTC de cgc3* par la cassette FRTaa cgc3*-SC-FOR AGGGAGCGCACCACCATC amorce de vérification pour I (SEQ ID NO: 76) délétion de cgc3* cgc3*-SC-REV ACGCGGTTCGGAGAGGTC amorce de vérification pour la
(SEQ ID NO: 77) délétion de cgc3* cgd 5-DIS-FOR GCGATGTCCTTCGTCCACGGCTACGAGTTCGACGCCATGA amorce pour le remplacement
(SEQ ID NO: 78) TTCCGGGGATCCGTCGACC de cgc15 par la cassette
FRTaac cgc15-DIS-REV CAGCTCCAGCCGCTCGAAGGTGGTCCGCAGGCCCTGGGT amorce pour le remplacement (SEQ ID NO: 79) TGTAGGCTGGAGCTGCTTC de cgd 5 par la cassette
FRTaac cgc15-SC-FOR TGCTGGGCGTACGACAGG amorce de vérification pour I (SEQ ID NO: 80) délétion de cgc15 cgc15-SC-REV CAGGATGGCGCAGTTGGC amorce de vérification pour I (SEQ ID NO: 81) délétion de cgc15 cgc16-DIS-FθR GGGCGTCAAGTAACCGGGGACGAGGGGGAGGCGCGCATG amorce pour le remplacement (SEQ ID NO: 82) ATTCCGGGGATCCGTCGACC de cgd 6 par la cassette FRTaac cgc16-DIS-REV TGCCGTGCCACTGCAGCGCTCTCATGTGTCCTCCGGTTCT amorce pour le remplacement (SEQ ID NO: 83) GTAGGCTGGAGCTGCTTC de cgd 6 par la cassette FRTaac cgc16-SC-FOR CACGCCGGTGAACTCGTG amorce de vérification pour I, (SEQ ID NO: 84) délétion de cgc16 cgc16-SC-REV CTGTGCCGGTACTCGGTG amorce de vérification pour la
(SEQ ID NO: 85) délétion de cgd 6 cmj1 F TCGGGCGCGACGGCCTTGCTGGAAGTGGCGGGCCACAGG amorce pour le remplacement
(SEQ ID NO: 86) CATCGCGCGCGCTTCGTTCGGGACGAA de cgc21 par la cassette att3aac cmj1R CCTCAGTCTCGCGTCCGGATCTCCTGACACCGCGCGTACT amorce pour le remplacement
(SEQ ID NO: 87) ATCTGCCTCTTCGTCCCGAAGCAACT de cgc21 par la cassette att3aac cmj2F TCGCCTGTTCACGCTCGACTTGTTCCCGCTGCTCCAGATTA amorce pour le remplacement
(SEQ ID NO: 88) TCGCGCGCGCTTCGTTCGGGACGAA de cgc20 par la cassette att3aac cmj2R AGCCGGGCTCCGTATTCGGCGCCGTCGAAGTGGAACCGTT amorce pour le remplacement
(SEQ ID NO: 89) ATCTGCCTCTTCGTCCCGAAGCAACT de cgc20 par la cassette att3aac cmj3F CCGTCTGCGTCCTCTGCCGACGGCAGGAAAAGGCTCTCGA amorce pour le remplacement
(SEQ ID NO: 90) ATCGCGCGCGCTTCGTTCGGGACGAA de cgc19 par la cassette att3aac cmj3R TGCCCCGACGACCGGCCCCTTACGGCGACCCTGGAGGAA amorce pour le remplacement
(SEQ ID NO: 91) CATCTGCCTCTTCGTCCCGAAGCAACT de cgc19 par la cassette att3aac
cmjlOF TCGGCCTCGCTCAAGAAGTG amorce de vérification pour la
(SEQ ID NO: 92) délétion de cgc20 cmjiOR TGAGCCGGGCTCCGTATTCG amorce de vérification pour la
(SEQ ID NO: 93) délétion de cgc20 cmj11F GCCGCCCGGGAGAAGGTC amorce de vérification pour la
(SEQ ID NO: 94) délétion de cgc19 cmj11 R CCCGAGGCCGAGCTGTGAG amorce de vérification pour la
(SEQ ID NO: 95) délétion de cgd9 cmj13F GTGCCCTCGGCCGTGTCAGCCCACCCGGGGACGAGGCCC amorce pour le remplacement
(SEQ ID NO: 96) GATCTACCTCTTCGTCCCGAAGCAACT de cgc2 par la cassette att2aac cmj13R TACGGTGAGCGGGGCGTGACAGCCCCGGAGAGGAGCGAG amorce pour le remplacement (SEQ ID NO:97) CATCGGCGCGCTTCGTTCGGGACGAAG de cgc2 par la cassette att2aac cmj14F TCGGAGCCTTCGGCCACAG amorce de vérification pour la
(SEQ ID NO:98) délétion de cgc2 cmj14R CGGGCAGGGCCATATGTACC amorce de vérification pour la
(SEQ ID NO:99) délétion de cgc2
cmj24F GACGGCCTTGCTGGAAGTG amorce de vérification pour la
(SEQ ID NO:100) délétion de cgc21 cmj24R CGTCGTCGTCCTCAGTCTC amorce de vérification pour la
(SEQ ID NO:101) délétion de cgc21
2) Milieux et conditions de culture
Les souches d'Escherichia coli et de Bacillus subtilis sont cultivées en milieu LB ou en milieu SOB contenant 30 mM de MgSO4 au lieu de 10 mM (Sambrook et Russell, 2001).
Les souches de Streptomyces sont cultivées pour les manipulations génétiques et la préparation de stock de spores en milieu solide sur HT (Kieser et al,
2000) à 30°C. La production de congocidine s'effectue en milieu liquide MP5 (Extrait de levure : 7g/l ; NaCl : 5g/l ; NaNO3 : 1 g/1 ; Glycérol : 40g/l; MOPS : 100 mM, pH 7,5) (Pernodet et al, 1993) à 30°C pendant 4 jours.
3) Antibiotiques et produits chimiques
L'acétonitrile Lichrosolv et l'acide formique sont achetés chez Merck®, le L-arabinose chez Aldrich®, l'apramycine et le chloramphenicol chez Sigma®, l'hygromycine chez Euromedex®, l'ampicilline et PIPTG (isopropyl-beta- D-thiogalactopyranoside) chez Q-biogene®.
4) Préparation et manipulation d'ADN
Les procédés d'obtention et de manipulation d'ADN de plasmides et de BAC (extractions, purifications, digestions, ligations, etc) à partir de cellules d'E. coli sont décrits par Sambrook et Russell (Sambrook et Russell, 2001). Les transformations des souches d'E. coli sont effectuées par électroporation à 2500V, 600Ω et lOμF grâce à l'appareil « Εlectroporator » d'Εppendorf®. La préparation de cellules électrocompétentes d'E. coli DH5α ou E. coli DY330 est réalisée comme suit : les cellules sont cultivées à 37°C pour E. coli DH5α en milieu LB ou à 30°C pour E. coli DY330 en SOB-MgSO4 2OmM sous une agitation de 180 rpm jusqu'à ce qu'elles atteignent une densité optique de 0,6 à 600 nm. Les cellules sont alors centrifugées à 4°C, 4000 rpm pendant 10 minutes puis lavées une première fois dans un demi-volume de glycérol 10% puis dans un quart de volume de glycérol 10%. Finalement les cellules sont conservées à -70°C dans du glycérol 10%.
L'introduction d'ADN dans Streptomyces lividans et Streptomyces ambofaciens, soit par conjugaison interspécifique entre E. coli et Streptomyces, soit par transformation de protoplastes se fait selon les protocoles décrits par Kieser et al. (Kieser et α/,, 2000).
Lors des amplifications d'ADN par la Taq Polymérase (Qiagen), les mélanges réactionnels sont constitués de 1 μL d'ADN matrice d'une concentration approximative de 10 à 50 ng/μL, 1 μL de chacun des oligonucléotides à 30 μM, de 1 μL de dNTP à 10 mM chacun, de 5 μL de tampon 10X de la Taq Polymérase (Qiagen), de 10 μL de la solution Q (Qiagen) et de 0,25 μL de Taq Polymérase (Qiagen) dans un volume final de 50 μL.
Les purifications d'ADN se font grâce au kit « GFX-PCR & Gel Band Purification Kit®» de GE Healthcare suivant le protocole du fournisseur. 5) Protocole de PCR pour l'amplification des cassettes att2aac, att3aac, Ωaac et Ωhyg a) Préparation des cassettes attlaac et att3aac pour l 'inactivation de gènes par « PCR targeting »
Les amplifications des cassettes attlaac et attSaac utilisées pour déléter des gènes s'effectuent en utilisant la Taq Polymérase de Qiagen et le programme suivant : 4 minutes à 97°C, 1 minute à 80°C, dix cycles de 30 secondes à 970C, 30 secondes à 58°C et 2 minutes à 72°C puis 20 cycles de 30 secondes à 97°C, 30 secondes à 68°C et 2 minutes à 72°C puis dix minutes à 72°C. Les matrices utilisées sont pOSV232 pour attlaac et pOSV234 pour attSaac (Karray et al, 2005), plasmides constitués du vecteur pGP704/iVot/ décrit par Miller et Mekalanos (Miller & Mekalanos, 1988) dans lesquels les cassettes excisables ont été clonées. Ces cassettes qui confèrent la résistance à l'apramycine sont similaires à celles décrites par Raynal et collaborateurs (Raynal et al, 2006). att3aac est en particulier similaire à atύΩaac (SEQ ID NO:67), mais est dépourvue des séquences du terminateur du phage T4. att2aac diffère de attSaac uniquement par un nucléotide dans les séquences att, les séquences att3 étant remplacées par les séquences att2 (Raynal et al. , 2006) b) Vérification des clones transformés : amplification des cassettes Ωaac et Ωhyg
La vérification que les clones résistants à l'hygromycine ou à l'apramycine sont bien des clones transformés et pas des résistants spontanés s'effectue par PCR. Les amorces OMEGA Al (SEQ ID NO:60) et OMEGA A2 (SEQ ID NO:61) sont utilisées pour l'amplification de la cassette Ωaac et les amorces OMEGA Al (SEQ ID NO:60) et OMEGA HYG2 (SEQ ID NO:62) sont utilisées pour l'amplification de la cassette Ωhyg. Ces PCR, réalisées à partir d'une suspension de mycélium de Streptomyces, nécessitent le thermocycle préliminaire suivant : 30 secondes à 65°C, 30 seconde à 8°C, 90 secondes à 65°C, 180 secondes à 97°C, 60 secondes à 8°C, 180 secondes à 65°C, 60 secondes à 97°C, 60 secondes à 65°C, 4 minutes à 80°C. L'amplification des cassettes s'effectue ensuite à partir d'un microlitre du surnageant de cette suspension suivant le programme : 4 cycles de 1 minute à 97°C, 1 minute à 6O0C et 1 minute à 72°C suivis de 5 cycles de 1 minute à 970C, 1 minute à 52°C et 1 minute à 72°C et enfin 25 cycles de 1 minute à 97°C, 1 minute à 55°C et 1 minute à 720C.
6) Tests biologiques
Les tests biologiques sont réalisés après 5 jours de croissance à 300C d'une colonie de la souche de Streptomyces à analyser sur milieu HT solide en ajoutant une sur-couche de milieu contenant les microorganismes indicateurs : E. coli ou Bacittus subtilis. Le halo d'inhibition de croissance est observé après une nuit d'incubation à 37°C.
7) Méthode d'analyse HPLC de la congocidine
Les différentes souches analysées sont cultivées en milieu MP5, 4 jours à 300C. Après centrifugation, une fraction du surnageant est filtrée sur ultrafree- MC (0,1 μm, Millipore) et analysée par HPLC. L'analyse des échantillons s'effectue sur une chaîne HPLC Agilent 1200 munie d'un détecteur à barrette de diodes. Les échantillons (100 μl) sont injectés sur colonne Atlantis dC18, 5μm ; 4.6 mm x 250 mm (Waters). L'élution se fait à lml/min de la manière suivante : 7 min à 95% solvant A (eau + 0.1% acide formique) / 5% solvant B (acétonitrile + 0.1% acide formique), suivi d'un gradient jusqu'à 40% solvant A / 60% solvant B en 23 minutes. La détection s'effectue à 236 irai et 297 nm. EXEMPLE 2 : Mise en évidence du groupe de gènes esc
Cet Exemple montre l'identification du groupe de gènes impliqués dans la voie de biosynthèse de la congocidine chez Streptomyces ambofaciens. 1) Analyse de Ia séquence et identification des gènes du groupe de gènes ege
Une banque d'ADN génomique de Streptomyces ambofaciens ATCC23877 a été construite dans le chromosome bactérien artificiel pBeloBACl l décrit par Kim et al. (Kim et al., 1996). Cette banque a ensuite été utilisée pour déterminer la séquence des régions terminales du chromosome linéaire de S. ambofaciens ATCC23877 (environ 1,3 Mégabases de chaque coté). Ces séquences sont analysées grâce aux programmes GLIMMER (« Gène Locator and Interpolated Markov Modeler » Delcher et al, 1999), FRAME (Ishikawa & Hotta, 1999) et GeneMark (Lukashin et Borodovsky, 1998). Les régions codantes et les séquences protéiques correspondantes ont ainsi pu être définies avec précision.
La recherche de gènes dont les produits présentent des similitudes avec des enzymes généralement impliquées dans le métabolisme secondaire (par exemple les NRPS : Synthétase de Peptides Non Ribosomiques et les PKS : Synthétase de PolyCétide) a permis de mettre en évidence 12 groupes de gènes dirigeant potentiellement la biosynthèse de métabolites secondaires. Parmi eux, un groupe de 22 gènes (gènes de SAMR0900 à SAMR0921, selon la nomenclature de Choulet et al, 2006 ; 31,3 kb) sur le bras droit du chromosome de S. ambofaciens est situé dans une zone de rupture de synténie avec le chromosome de Streptomyces coelicolor. Ce groupe contient deux gènes codant des homologues de NetPl et NetP2 qui confèrent la résistance à la congocidine chez Streptomyces netropsis (Stumpp et al, 2005). Ce groupe, isolé à partir de l'ADN génomique de S. ambofaciens dirige la biosynthèse de ce métabolite dont la voie de biosynthèse était inconnue jusqu'à présent. Ces 22 gènes sont nommés cgc3* à cgcl* d'une part et cgcl à cgcl9 d'autre part. La Figure 3 illustre le positionnement et l'orientation de ces gènes sur le chromosome de S. ambofaciens.
Le Tableau III présente les différentes fonctions prédites pour les protéines déduites des 22 gènes impliqués dans la biosynthèse de congocidine.
2) Identification du BAC pCGCOOl et construction du BAC pCGC002
A partir de la banque d'ADN génomique (Exemple 2.1), les extrémités des inserts d'environ 5000 BAC ont été séquencées, et la comparaison des séquences de ces extrémités avec les séquences des régions flanquant le groupe de gènes cgc a permis d'identifier un BAC contenant le groupe de gènes cgc entier, ce BAC a été nommé pCGCOOl. Outre les 22 gènes du groupe de gènes cgc, Pinsert de 43377pb de ce BAC contient d'autres gènes complets de part et d'autre du groupe (Figure 5). Afin de pouvoir utiliser ce BAC chez Streptomyces, il est nécessaire de le modifier pour permettre son transfert, son intégration à un site spécifique dans le chromosome de Streptomyces et la sélection des clones de Streptomyces transformés.
Pour cela, un fragment d'ADN contenant la cassette Ωhyg (Blondelet-Rouault et ah, 1997) conférant la résistance à l'hygromycine (permettant Ia sélection des Streptomyces transformés), le gène de l'intégrase de ΦC31 (Combes et al, 2002), la séquence attP de ΦC31 (nécessaire à l'intégration, promue par l'intégrase, du BAC dans le chromosome à un site spécifique) et la séquence oriT de RK2 (nécessaire à son passage par conjugaison de E. coli à Streptomyces) sont introduits par ligation (Sambrook et Russell, 2001) au niveau du site unique Hpal de pCGCOOl. Ce fragment a été obtenu comme décrit ci-après.
Le vecteur pPAOIβ décrit par Nalin et al. (Nalin et al, 2004) comprend une cassette contenant le gène de l'intégrase de ΦC31, le site attP, oriT et le gène de résistance à Papramycine aac. Néanmoins, du fait de l'utilisation ultérieure du gène aac pour l'inactivation de gènes cgc, il était nécessaire de remplacer aac par un autre marqueur : le gène de résistance à l'hygromycine porté par la cassette Ωhyg. Le vecteur pPAO16 est donc digéré par digestions séquentielles par les enzymes BamHI, Klenow et Xbal, et le fragment contenant oriT et aac est éliminé. La digestion HindIII I Klenow / Xbal du plasmide pOSVOlO (SEQ ID NO:68) permet d'obtenir, après purification, un fragment de 3,1 kb contenant la cassette Ωhyg et oriT. La ligation de ce fragment avec ledit plasmide pPAOIό digéré par digestions séquentielles par les enzymes BamHI, Klenow et Xbal (et dépourvu du fragment contenant oriT et aac) permet d'obtenir le plasmide pOSV201 contenant la cassette souhaitée.
Cette cassette (5,3 kb) est extraite de pOSV201 par digestion par PvuII et clonée dans le plasmide pCGCOOl au niveau du site unique Hpal. Le BAC ainsi obtenu est nommé pCGC002. EXEMPLE 3 : Interruption du gène cscl8
Pour vérifier si ce groupe de 22 gènes est bien impliqué dans la voie de biosynthèse de la congocidine, le gène cgcl8, qui code une protéine similaire aux NRPS (contenant les domaines d'adénylation, de condensation et PCP (Protéine de transport de Peptidyle)), a été interrompu dans une souche de S. ambofaciens ne produisant plus de spiramycine.
1) Interruption de cgc!8
Un fragment du gène cgc!8 est amplifié par PCR dans les conditions décrites dans l'Exemple 1.4 à partir de l'ADN génomique de S. ambofaciens (ATCC23877) en utilisant la Taq Polymérase (Qiagen) et les oligonucléotides CONGO-R (SEQ ID NO: 58) et CONGO-D (SEQ ID NO: 59) durant 30 cycles constitués des étapes suivantes : 30 secondes à 960C, 30 secondes à 60°C, 2 minutes à 72°C. Le produit d'amplification, un fragment de 815 pb, qui correspond aux nucléotides 2767 à 3581 de la séquence SEQ ID NO :49, est purifié puis clone dans le vecteur pGEM-T-Easy® de Promega. Le fragment de cgc 18 est extrait du plasmide obtenu par digestion par EcoRI. Les extrémités du fragment obtenu sont ensuite rendues franches grâce à l'action du fragment de Klenow, puis le fragment est introduit, au niveau du site EcoRI, dans le plasmide pOSV202, un dérivé de pBluescript (pBC-SK+) portant la cassette de résistance à l'apramycine Ωaac (Blondelet-Rouault et al., 1997) et la séquence oriT de RK2 clonées au niveau du site Ncol de ce vecteur. Le plasmide obtenu est nommé pJMClOl. Après conjugaison entre E. coli S17.1 contenant le plasmide pJMClOl et des spores germées de S. ambofaciens SPM110 (souche dérivée de la souche ATCC23877 mutée dans un des gènes de biosynthèse de la spiramycine ; Karray et al. , 2005) les clones résistants à l'apramycine sont sélectionnés et la présence du gène de résistance à l'apramycine est vérifiée par PCR. Cette amplification est réalisée avec les oligonucléotides OMEGA Al (SEQ ID NO: 60) et OMEGA A2 (SEQ ID NO: 61) selon le protocole décrit dans l'Exemple 1.5.b). Un clone présentant la bande attendue à 1,1 kb correspondant au fragment de la cassette Ωaac amplifié est choisi et analysé. Cette souche est nommée CGCA004. Des expériences d'hybridation de type « Southern » effectuées sur l'ADN total de CGCA004 et sur celui de la souche SPMI lO ont permis de vérifier que, dans la souche CGCA004, le plasmide pJMClOl était bien intégré par recombinaison homologue dans le gène cgcl 8.
2) Résultat : preuve expérimentale de l'implication du groupe de gènes cgc dans la biosynthèse de congocidine
Le test biologique décrit dans l'Exemple 1.6 montre qu'une colonie de la souche SPM110 est entourée d'un halo d'inhibition de croissance de la souche indicatrice (E. coli ou B. subtilis), alors que pour la souche CGCA004, aucune inhibition de croissance de E. coli et B. subtilis n'est détectée suggérant que la production de congocidine est abolie. L'analyse comparative des profils métaboliques des souches S. ambofaciens SPMI lO et CGCA004 (Figure 4) confirme bien que la souche CGCA004 ne produit pas de congocidine (disparition d'un pic ayant le même temps de rétention et la même masse que la congocidine standard). Ceci démontre l'implication du groupe cgc dans la biosynthèse de congocidine. EXEMPLE 4 : Expression hétérologue du groupe de gènes esc chez Streptomyces lividans
Afin de vérifier que les 22 gènes du groupe de gènes cgc sont bien suffisants à la production de congocidine, ils sont introduits dans le chromosome d'un hôte hétérologue, S. lividans TK23 qui ne produit pas cette molécule. 1) Système d'expression hétérologue
L'introduction de pCGCOOl dans le chromosome de S. lividans TK23 dans les conditions définies à l'exemple 1.4, a nécessité au préalable le clonage dans ce BAC d'une cassette contenant le gène de l'intégrase de ΦC31, le site attP correspondant, la séquence oriT et la cassette Ωhyg conférant la résistance à l'hygromycine. Le BAC résultant, pCGC002, obtenu comme indiqué ci-dessus, est introduit dans S. lividans TK23 par conjugaison avec une souche de E. coli S 17.1 contenant pCGC002. Les transconjugants sont sélectionnés par la résistance à Phygromycine et la présence de la cassette Ωhyg est vérifiée par PCR en utilisant les oligonucléotides OMEGA Al (SEQ ID NO: 60) et OMEGA HYG2 (SEQ ID NO: 62) comme indiqué plus haut. La souche de S. lividans TK23 contenant le vecteur pCGC002 intégré dans son chromosome ainsi obtenu est nommé CGCL006.
2) Résultat : le groupe de gènes cgc est suffisant à la production de congocidine chez S. amhofaciens SPMIlO
Les analyses de l'activité biologique et HPLC ont révélé la production de congocidine par le clone CGCL006, alors que la souche S. lividans TK23 sauvage n'en produit pas (Figure 4). L'insert de pCGC002 intégré dans le chromosome de S. lividans TK23 est donc suffisant à la production de congocidine en quantité comparable à celle de la souche S. ambofaciens SPMl 10. Il est donc clair que cet hôte hétérologue peut être utilisé lors de l'étude plus approfondie du groupe de gènes cgc.
Il faut toutefois noter que les protéines de la famille des PCP nécessitent pour être actives leur modification par addition d'un bras phosphopantethéinyle par une enzyme de la famille des phosphopantethéinyle transférases (PPTases). Les produits des gènes cgc!8 et cgcl9 possèdent de tels domaines PCP. Leur modification par une PPTase est probablement nécessaire. Aucun gène du groupe de gènes cgc n'est prédit comme codant une PPTase. Chez S. ambofaciens une PPTase codée par un gène localisé en dehors du groupe de gènes cgc est probablement responsable de la modification des domaines PCP. S. lividans possède probablement une PPTase capable de modifier les protéines Cgcl8 et Cgcl9. EXEMPLE 5 : Définition des limites du groupe de gènes esc
Outre les 22 gènes du groupe cgc, le BAC pCGC002 contient d'autres gènes de part et d'autre de ce groupe : 1 gène tronqué et 4 gènes complets d'un coté, 1 gène tronqué et 11 gènes complets de l'autre (Figure 5A). Hormis les gènes cgc20 et cgc21, ces gènes sont homologues de gènes de S. coelicolor et font partie de régions de synténie avec cette souche. Ils ne semblent donc pas être impliqués dans la biosynthèse de congocidine. Pour vérifier qu'ils n'ont aucun rôle dans la production de congocidine, les séquences d'ADN présentes entre cgc21 et pBeloBACl l d'une part, et cgc3* et pBeloBACl l d'autre part, sont excisées de pCGC002. Pour ensuite affiner les limites du cluster, les gènes cgc21 puis cgc20 sont également délétés en totalité. A. Délétion dans l'insert du BAC pCGC002 des séquences ne faisant pas partie du groupe de gènes cgc 1) Approche
Brièvement, à partir de pCGC002, la séquence présente entre cgc21 et pBeloBACl 1 est excisée pour donner le BAC pCGC017 et la souche CGCL009. A partir de pCGC017 la séquence présente entre cgc3* et pBeloBACl 1 est excisée pour donner le BAC pCGC019 et la souche CGCL010. Cette approche est exposée plus en détail ci-après.
La délétion des séquences présentes dans l'insert de pCGC002 mais ne faisant pas partie du groupe cgc tel que défini par analyse bioinformatique est assurée par le remplacement des séquences à éliminer par une cassette excisable att3aac (conférant la résistance à l'apramycine). Ce remplacement résulte d'un double événement de recombinaison homologue entre les séquences flanquant Ia cassette excisable (séquences ajoutées lors de l'amplification de la cassette par PCR, voir ci- dessous) et les bornes de la région à déléter. Cette recombinaison est obtenue par « PCR-targeting » (Yu et al, 2000 ; Chaveroche et al, 2000 Gust et al, 2003). La cassette utilisée, att3aac, obtenue comme indiqué plus haut, est similaire à celles décrites par Raynal et al. (Raynal et al, 2006) mais dépourvue des séquences du terminateur du phage T4. Cette cassette, qui comprend de part et d'autre du gène de résistance les séquences attL et attR de pSAM2, est ensuite excisée par un événement de recombinaison spécifique de site promu par l'intégrase et l'excisionase de pSAM2 (Raynal et al, 1998). Le BAC résultant est ensuite introduit chez S. lividans.
L'élimination des fragments situés entre cgc21 et pBeloBACl 1 (c'est-à-dire, dans pCGCOOl, la région de l'insert en aval - en référence à la Figure 5 - de cgc21 qui ne fait pas partie du groupe cgc) d'une part, et entre cgc3* et pBeloBACl 1 (c'est-à-dire dans pCGCOOl la région de l'insert en amont - en référence à la Figure 5 - de cgc 3* qui ne fait pas partie du groupe cgc) d'autre part sont effectuées successivement. Pour l'élimination du premier fragment, la cassette de résistance à l'apramycine est amplifiée par PCR comme décrit précédemment en utilisant les oligonucléotides de séquences SEQ ID NO: 63 et SEQ ID NO: 64 (pour le deuxième fragment, les oligonucléotides de séquences SEQ ID NO: 65 et SEQ ID NO: 66 sont utilisés). Après amplification, le produit PCR obtenu est constitué de la cassette flanquée de part et d'autre de séquences de 40 nucléotides identiques aux séquences bordant le fragment d'ADN à éliminer. La souche hyper-recombinante E. coli DY330 contenant le BAC pCGC002 est transformée par électroporation avec le produit PCR purifié. Les clones sont ensuite sélectionnés pour leur double résistance au chloramphénicol (résistance conférée par le BAC) et à l'apramycine (résistance conférée par la cassette). L'intégration de la cassette et la délétion du fragment ciblé sont vérifiées par digestion enzymatique (BamHT), et le BAC résultant, dénommé pCGCOlβ, est introduit dans la souche E. coli DH5α contenant le plasmide pOSInt3 (Raynal et al, 1998) afin d'exciser la cassette att3aac. L'induction de la production des protéines Xis et Int nécessaires à l'excision s'effectue en présence d'IPTG à 20 μg/mL. Dans les clones résultants de la transformation / excision, il peut y avoir une coexistence du BAC pCGCOlό (avec la cassette att3aac) et du plasmide dans lequel cette cassette a été excisée. Une nouvelle étape de transformation dans E. coli DH5α est donc nécessaire pour l'obtention d'un clone ne contenant que le BAC avec la délétion (c'est-à-dire le BAC dépourvu de la cassette apramycine). Le BAC ainsi obtenu, dénommé pCGC017, est vérifié par digestion enzymatique (BamΗÏ) puis introduit dans S. lividans TK23 par conjugaison pour donner la souche CGCL009.
Ce protocole est répété à partir de pCGC017 afin d'éliminer le fragment d'ADN situé entre cgc3* et pBeloBACl l (BAC résultants pCGC018 et pCGCO 19, voir Tableau 3). Le BAC pCGCO 19 est introduit dans S. lividans TK23 par conjugaison pour donner la souche CGCL010.
2) Résultat : les gènes situés en amont de cgc3* et en aval de cgc21 ne sont pas nécessaires à la production de congocidine
La production de congocidine par la souche CGCL009, visualisée à l'aide d'un test biologique tel que décrit dans l'Exemple 1.6, démontre que les gènes présents en aval de cgc21 ne sont pas nécessaires à la biosynthèse de congocidine. De plus, l'analyse par test biologique et HPLC (Figure 4) de la souche CGCL010 montre que ce nouveau BAC permet toujours la production de congocidine, ce qui montre que les gènes situés en amont de cgc3* et en aval de cgc21 ne sont pas nécessaires à la production de congocidine.
B. Délétions de la totalité des gènes cgc20 et cgc21 1) Approche
Ces délétions sont réalisées suivant la même approche que pour l'élimination des séquences situées en amont de cgc21 et en aval de cgc3* (Exemple 5.A.1). Pour l'élimination de ces deux gènes, la cassette att3aac de résistance à l'apramycine est amplifiée par PCR comme décrit précédemment (Exemple 1.5) en utilisant les oligonucléotides cmjlF (SEQ ID NO: 86) et cmjlR (SEQ ID NO: 87) pour la délétion de cgc21 et les oligonucléotides cmj2F (SEQ ID NO: 88) et cmj2R (SEQ ID NO: 89) pour la délétion de cgc20. Après amplification, la cassette est flanquée de part et d'autre de séquences de 40 nucléotides identiques aux séquences bordant le fragment d'ADN à éliminer. La souche hyper-recombinante E. coli DY330 contenant le BAC pCGC002 est transformée par électroporation avec le produit PCR purifié. Les clones sont ensuite sélectionnés pour leur double résistance au chloramphénicol (résistance conférée par le BAC) et à l'apramycine (résistance conférée par la cassette). L'intégration de la cassette et la délétion du fragment ciblé sont vérifiées par PCR suivant le protocole décrit dans l'Exemple 1.4 avec les oligonucléotides cmj24F (SEQ ID NO: 100) et cmj24R (SEQ ID NO: 101) pour la délétion de cgc21 et cmjlOF (SEQ ID NO: 92) et cmjlOR (SEQ ID NO: 93) pour la délétion de cgc20. Le BAC où cgc21 est remplacé par la cassette atύaac est nommé pCGC033 et le BAC où cgc20 est remplacé par la cassette att3aac est nommé pCGC034. Ces BAC sont introduits dans la souche E. coli DH5α contenant le plasmide pOSInt3 (Raynal et al., 1998) afin d'exciser la cassette att3aac. L'induction de la production des protéines Xis et Int nécessaires à l'excision s'effectue en présence d'IPTG à 20 μg/mL. Dans les clones résultants de la transformation / excision, il peut y avoir une coexistence des BAC pCGC033 ou pCGC034 (avec la cassette attSaac) et des BAC dans lesquels cette cassette a été excisée. Une nouvelle étape de transformation dans E. coli DH5α est donc nécessaire pour l'obtention d'un clone ne contenant que le BAC avec la délétion. Après excision de la cassette att3aac les BAC ρCGC037 où cgc21 est délété en phase et pCGC038 où cgc20 est délété en phase sont vérifiés par PCR en utilisant les oligonucléotides présentés ci-dessus : cmj24F, cmj24R, cmjlOF et cmjlOR puis introduits dans S. lividans TK23 par conjugaison pour donner les souches CGCL026 et CGCL027.
2) Résultats : les gènes cgc20 et cgc21 ne sont pas nécessaires à la production de congocidine
La production de congocidine par ces deux souches CGCL026 et CGCL027 est analysée par HPLC (Exemple 1.7) après 4 jours de culture. Il apparaît que la production de congocidine est inchangée lorsque les gènes cgc21 (SEQ ID NO: 45) ou cgc20 (SEQ ID NO: 47) sont absents par rapport au BAC original (Figure 6). Ces deux gènes ne sont donc en fait pas impliqués dans la biosynthèse de congocidine. EXEMPLE 6 : Inactivation des gènes cgc3*, cgc2, cgc4* cgc7, cgclO, cgclS, cgclό et cgc 19 A. Gènes cgc3*, cgc4, cgc7, cgclO, cgcl5 et cgclό
1) Inactivation des gènes
Les gènes cgc3* (codant une Acyl-CoA synthétase putative), cgc4 (codant une hydrolase de nucléotide putative), cgc7 (codant une phospho beta- glucosidase putative) cgclO (codant une glycosyl-transférase putative), cgc] 5 (codant une méthylase/méthyltransférase putative) et cgclό (codant une en2yme de condensation putative, similaire au domaine de condensation de synthétase de peptide non-ribosomique) ont été inactivés par la méthode REDIRECT® basée sur la PCR (Gust et αZ., 2003).
Les oligonucléotides utilisés pour les inactivations de cgc3*, cgc4, cgc7, cgclO, cgcl5 et cgclό sont respectivement cgc3*-DIS-FOR (SEQ ID NO: 74) et cgc3*-DIS-REV (SEQ ID NO: 75), cgc4-DIS-FOR (SEQ ID NO: 70) et cgc4-DIS- REV (SEQ ID NO: 71), cgc7-DIS-FOR (SEQ ID NO: 50) et cgc7-DIS-REV (SEQ ID NO: 51), cgclO-DIS-FOR (SEQ ID NO: 54) et cgclO-DIS-REV (SEQ ID NO: 55), cgcl5-DIS-F0R (SEQ ID NO: 78) et cgcl5-DIS-REV (SEQ ID NO: 79) et cgclό- DIS-FOR (SEQ ID NO: 82) et cgcl6-DIS-REV (SEQ ID NO: 83). La cassette FRTaac utilisée pour les inactivations a été amplifiée par
PCR en utilisant le kit GC-rich PCR System® (Roche) et le plasmide pW60 (SEQ ID NO:69) comme matrice. Ce plasmide provient du vecteur pGEM-T easy® (Promega) dans lequel a été clone la cassette FRTaac contenant le gène de résistance à Fapramycine aac flanqué des séquences FRT (FLP récognition targets) pour la recombinaison par la FLP recombinase de levure chez E. coli. Le remplacement des gènes cgc3*, cgc4, cgc7, cgclO, cgclδ et cgclό par la cassette FRTaac dans le BAC pCGC002 a donné les BAC pCGC220, pCGC216, pCGC208, pCGC212, pCGC222 et pCGC224 respectivement, voir Tableau IV, pour l'expression hétérologue chez Streptomyces Hvidans TK23. L'excision de la cassette a été effectuée en suivant le protocole REDIRECT® (BACs résultants : pCGC221, pCGC217, pCGC209, pCGC213, pCGC223 et pCGC225 respectivement, voir Tableau 4). Les constructions ont été vérifiées par PCR en utilisant les amorces cgc3*-SC-F0R (SEQ ID NO: 76) et cgc3*-SC-REV (SEQ ID NO: 77) pour la délétion de cgc3*, cgc4-SC-F0R (SEQ ID NO: 72) et cgc4-SC-REV (SEQ ID NO: 73) pour la délétion de cgc4, cgc7-SC-F0R (SEQ ID NO: 53) et cgc7-SC-REV (SEQ ID NO: 54) pour la délétion de cgc7, cgclO- SC-FOR (SEQ ID NO: 56) et cgclO-SC-REV (SEQ ID NO: 57) pour la délétion de cgclO, cgcl5-SC-F0R (SEQ ID NO: 80) et cgcl5-SC-REV (SEQ ID NO: 81) pour la délétion de cgclδ, cgcl6-SC-F0R (SEQ ID NO: 84) et cgcl6-SC-REV (SEQ ID NO: 85) pour la délétion de cgclό. Les BAC pCGC221, pCGC217, pCGC209, pCGC213, pCGC223 et pCGC225 ont été introduits dans S. Hvidans TK23 par conjugaison à partir de E. coli S 17-1 (voir Exemple 1.4) et sélectionnés pour leur résistance à l'hygromycine.
2) Résultat : les gènes cgc3*, cgc4, cgc7, cgclO, cgclS et cgclό sont impliqués dans la biosynthèse de la congocidine L'analyse par test biologique (Exemple 1.6) et par HPLC (Exemple 1.7) des souches CGCL030, CGCL022, CGCLO 16, CGCLO 17, CGCL031 et CGCL032 contenant le groupe des gènes cgc intégré dans le chromosome de S. Hvidans TK23 et où cgc3*, cgc4, cgc7, cgc 10, cgc 15 et cgclό respectivement ont été délétés en phase a été effectuée. Elle montre que les souches CGCL030, CGCL016, CGCL017, CGCL031 et CGCL032 ne produisent plus de congocidine. Les gènes cgc7 et cgclO, qui comptent parmi les gènes de biosynthèse ou de transfert de sucres, sont donc impliqués dans la biosynthèse de la congocidine. Il semble ainsi probable que l'ensemble de ces gènes (cgc7 à cgc 13) soient bien impliqués dans la biosynthèse de congocidine, ce qui ne pouvait être prédit d'après la structure de la molécule de congocidine.
L'analyse par HPLC couplée à l'analyse par spectrométrie de masse a permis de montrer que le mutant CGCL031 produit un nouvel analogue de la congocidine, la N,N-déméthylcongocidine (Figure 13).
La souche CGCL022 produit encore de la congocidine, mais en quantité beaucoup plus faible que la souche de référence (CGCL006).
B. Gènes cgc2 et cgcl9
1) Inactivation des gènes Les délétions en totalité des gènes cgc2 (codant une enzyme de condensation putative, similaire au domaine de condensation de synthétase de peptide non-ribosomique) et cgc!9 (codant une protéine putative de transport de peptidyle, similaire au domaine PCP de synthétase de peptide non-ribosomique) ont été entreprises pour vérifier l'implication de ces gènes dans la biosynthèse de congocidine. Elles sont réalisées suivant le principe de « PCR targeting » utilisé aussi pour déléter les gènes cgcll et cgc20 ainsi que les séquences en amont de cgcll et en aval de cgc3* (Exemple 5).
Pour la délétion de cgcl9, la cassette atύaac de résistance à l'apramycine est amplifiée par PCR comme décrit précédemment (Exemple 1.5) avec les oligonucléotides cmj3F (SEQ ID NO: 90) et cmj3R (SEQ ID NO: 91). Après amplification, la cassette est flanquée de part et d'autre de séquences de 40 nucléotides identiques aux séquences bordant le fragment d'ADN à éliminer. La souche hyper-recombinante E. coli DY33O contenant le BAC pCGC002 est transformée par électroporation avec le produit PCR purifié. Les clones sont ensuite sélectionnés pour leur double résistance au chloramphénicol (résistance conférée par le BAC) et à l'apramycine (résistance conférée par la cassette). L'intégration de la cassette et la délétion du fragment ciblé sont vérifiées par PCR avec les oligonucléotides cmjl lF (SEQ ID NO: 94) et cmjl lR (SEQ ID NO: 95) suivant le protocole décrit à l'Exemple 1.4. Le BAC où cgcl9 est remplacé par la cassette att3aac est nommé pCGC035. Ce BAC est introduit dans la souche E. coli DH5α contenant le plasmide pOSInt3 afin d'exciser la cassette att3aac. L'induction de la production des protéines Xis et Int nécessaires à l'excision s'effectue en présence d'IPTG à 20 μg/mL. Dans les clones résultants de la transformation / excision, il peut y avoir une coexistence du BAC pCGC035 (avec la cassette att3aac) et du BAC dans lequel cette cassette a été excisée. Une nouvelle étape de transformation dans E. coli DH5α est donc nécessaire pour l'obtention d'un clone ne contenant que le BAC avec la délétion. Après excision de la cassette attSaac, le BAC pCGC039 où cgcl9 est délété en phase est vérifié par PCR avec les oligonucléotides mentionnés précédemment puis introduit dans S. lividans TK23 par conjugaison pour donner la souche CGCL028.
Pour la délétion de cgc2, la cassette attlaac de résistance à l'apramycine est amplifiée par PCR comme décrit précédemment (Exemple 1.5) en utilisant les oligonucléotides cmjl3F (SEQ ID NO: 96) et cmjl3R (SEQ ID NO: 97) et la matrice pOSV232 (cette matrice est utilisée pour amplifier la cassette attlaac). Après amplification, la cassette est flanquée de part et d'autre de séquences de 40 nucléotides identiques aux séquences bordant le fragment d'ADN à éliminer. La souche hyper-recombinante E. coli DY330 contenant le plasmide pCGC041 est transformée par électroporation avec le produit PCR purifié. Ce plasmide pCGC041 correspond à pUC19 contenant au niveau de son site Smal le fragment jRytBI/Ry/WI/Klenow isolé de pCGC002 et comprenant les gènes cgcl et cgc2 (Figure 14). Les clones sont ensuite sélectionnés pour leur double résistance à l'ampicilline (résistance conférée par le plasmide) et à l'apramycine (résistance conférée par la cassette). L'intégration de la cassette et la délétion du fragment ciblé sont vérifiées par PCR avec les oligonucléotides cmjl4F (SEQ ID NO: 98) et cmjl4R (SEQ ID NO: 99) suivant le protocole décrit à l'Exemple 1.4. Le plasmide où cgc2 est remplacé par la cassette att2aac est nommé pCGC045 ; il est ensuite digéré par Pvull. Le fragment Pvull de 7,7 kb contient la cassette att2aac remplaçant cgc2 et contient les gènes cgc voisins (Fragment A Figure 14). La souche hyper-recombinante E. coli DY330 contenant le BAC pCGC002 est alors transformée par électroporation avec le fragment A purifié. Les clones sont ensuite sélectionnés pour leur double résistance au chloramphénicol (résistance conférée par le BAC) et à l'apramycine (résistance conférée par la cassette). L'intégration de la cassette et la délétion de cgc2 sont vérifiées par PCR avec les oligonucléotides cmjl4F (SEQ ID NO: 98) et cmjl4R (SEQ ID NO: 99) suivant le protocole décrit à l'Exemple 1.4. Le BAC où cgc2 est remplacé par la cassette att2aac est nommé pCGC049. Ce BAC est introduit dans la souche E. coli DH5α contenant le plasmide pOSInt3 afin d'exciser la cassette att2aac. L'induction de la production des protéines Xis et Int nécessaires à l'excision s'effectue en présence d'IPTG à 20 μg/mL. Dans les clones résultants de la transformation / excision, il peut y avoir une coexistence des BAC pCGC049 (avec la cassette att2aac) et des BAC dans lesquels la cassette att2aac a été excisée. Une nouvelle étape de transformation dans E. coli DH5α est donc nécessaire pour l'obtention d'un clone ne contenant que le BAC avec la délétion. Après excision de la cassette att2aac le BAC pCGC057 où cgc2 est délété en phase est vérifié par PCR avec les oligonucléotides mentionnés précédemment puis introduit dans S. lividans TK23 par conjugaison pour donner la souche CGCL035.
2) Résultas La production de congocidine par les deux souches CGCL036 et
CGCL028 où les gènes cgc2 et cgcl9 sont délétés en phase est analysée par HPLC (Exemple 1.7) après 4 jours de culture. Il apparaît que la production de congocidine est abolie dans ces deux souches par rapport à la souche contenant les 22 gènes (voir la Figure 6 pour la délétion de cgcl9). Ces deux gènes sont donc nécessaires à la production de congocidine.
EXEMPLE 7 : Expression hétérologue des gènes de résistance
1) Expression hétérologue de cgcl* et cgc2*
Les gènes cgcl* et cgc2* codent un transporteur ABC putatif. La protéine Cgcl* pourrait constituer la protéine de liaison à l'ATP et la protéine Cgc2* son partenaire transmembranaire. Ces deux protéines sont fortement similaires à celles identifiées par Stumpp et al. (Stumpp et al. , 2005) codées par les gènes netPl et netP2 présents sur le chromosome de S. netropsis. Les deux protéines NetPl et NetP2 correspondantes forment un transporteur ABC et confèrent la résistance à la congocidine. Les deux gènes cgcl* et cgc2* sont donc introduits dans le chromosome de S. lividans TK23 pour vérifier leur capacité à induire la résistance à la congocidine chez un hôte hétérologue sensible.
Pour ce faire, un fragment d'ADN de 5,4 kb contenant cgcl* et cgc 2* en totalité et cgc3* tronqué ainsi que cgcl tronqué, obtenu par digestions séquentielles avec les enzymes Tfil et Klenow de pCGCOOl, est clone dans le plasmide pSET152 (vecteur navette réplicatif chez E. coli et intégratif chez Streptomyces, (Bierman et al, 1992) au niveau du site EcoKV. Cet insert présente ainsi toute la région entre cgcl* et cgcl susceptible de contenir le promoteur de cgcl* qui pourrait être co-transcrit avec cgc2*. Le plasmide résultant est nommé pCGC502, et la présence de l'insert est vérifiée par digestion enzymatique (Pstl). Le plasmide pCGC502 est introduit dans S. lividans TK23 par transformation de protoplastes d'après le protocole de Kieser et al. (Kieser et al, 2000). Le vecteur pSET152 vide a aussi été introduit dans S. lividans TK23 (témoin négatif). La souche contenant le vecteur pCGC502 est dénommée CGCL001. La résistance à la congocidine de ces souches ainsi que celle de la souche S. lividans TK23 transformée par le vecteur pSET152 vide est ensuite testée sur milieu HT contenant de la congocidine à 20μg/ml. Les transformants sont sélectionnés pour leur résistance à l'apramycine. Les cultures sont examinées après quatre jours d'incubation à 3O0C.
2) Résultat : Cgcl* et Cgc2* confèrent la résistance à la congocidine Le clone CGCL001, qui contient les gène cgcl* et cgc2* est le seul à pousser en présence de congocidine. Ces résultats montrent donc clairement que les deux gènes cgcl* et cgc2* confèrent la résistance à la congocidine, quand ils sont présents à une copie par chromosome et exprimés sous contrôle de leur propre promoteur dans un hôte hétérologue. EXEMPLE 8 : Biosvnthèse du précurseur amidinium
Les protéines codées par les gènes cgc4, cgc5 et cgcό présentent des homologies avec les protéines codées par les gènes plu3918, plu3917 et plu3916 de Photorhabdus Iwninescens, gènes qui, comme cgc4, cgc5 et cgcό, sont groupés sur le chromosome. Les inventeurs ont émis l'hypothèse que les protéines Cgc4, Cgc5 et Cgcό sont impliquées dans un même processus biologique, par exemple la biosynthèse de l'un des précurseurs de la congocidine. De plus, des analyses de type PSI-BLAST (Altschul et al, 1997) ont permis de mettre en évidence une homologie entre Cgc4 et BIsM, une hydrolase de nucléotide impliquée dans la biosynthèse de la blasticidine S chez Streptomyces griseochromogenes (Grochwski et Zabriskie, 2006). Ces informations, combinées avec l'analyse des séquences de Cgc5 et Cgcό, montrent que Cgc4, Cgc5 et Cgcό sont très probablement impliquées dans la biosynthèse du précurseur amidinium de la congocidine selon le schéma présenté à la Figure 7. Afin de vérifier cette hypothèse, le gène cgc4 a été délété en phase dans le BAC pCGC002 et le BAC résultant (pCGC217) introduit dans S. lividans TK23 (souche CGCL022). La souche CGCL022, contenant le plasmide pCGC217 où le gène cgc4 est excisé, est cultivée pendant 45h à 30°C dans 50 ml de milieu MP5. La culture est ensuite divisée en 2 cultures de 25 ml chacune. Dans la première culture, de la cytosine est ajoutée à la concentration finale de 2 mM. Aux temps t = 0 ; 1 ; 2 ; 4 ; 8 ; 23 ; 25 ; 32,5 et 5 Ih, 2 ml de cultures sont prélevés et les surnageants analysés par HPLC. Résultats : L'analyse du surnageant de culture de cette souche par HPLC montre que la congocidine est toujours produite, mais en quantité bien moindre que dans la souche de référence CGCL006 (S. lividans contenant le cluster cgc intégré dans son chromosome). De plus, l'apparition dans le chromatogramme à 297 nm d'un pic absent dans le chromatogramme d'un surnageant de culture de CGCL006 suggère l'accumulation d'un intermédiaire de biosynthèse (Figure 8A). Afin de confirmer le rôle de Cgc4 dans la biosynthèse de la congocidine, de la cytosine, produit supposé de la réaction catalysée par Cgc4, a été ajoutée dans une culture de CGCL022. 2 ml de milieu de cette culture ainsi que 2 ml d'une culture de CGCL022 témoin ont été prélevés aux temps t = 0 ; l ; 2 ; 4 ; 8 ; 23 ; 25 ; 32,5 et 5 Ih après l'ajout de cytosine et analysés par HPLC. Les quantités de congocidine et de l'intermédiaire de biosynthèse ont été déterminés pour chaque temps. La Figure 8B montre clairement que l'ajout de cytosine dans le milieu de culture de la souche CGCL022 permet de rétablir une production normale de congocidine et stoppe l'accumulation de l'intermédiaire de biosynthèse dans le milieu. EXEMPLE 9 : Biosynthèse des groupements 4-amino-2-carboxypyrroIe Les Inventeurs ont émis l'hypothèse que l'ensemble des gènes cgc3, cgc8, cgc9, cgcll, cgcl2, cgc J 4 et cgcl? sont impliqués dans la biosynthèse des groupements pyrroles selon le schéma présenté à la Figure 9. Afin de vérifier cette hypothèse, du glycérol uniformément marqué au 13C est ajouté au milieu de culture de la souche S. ambofaciens SPMI lO. En effet, le glycérol peut être converti via le glycéraldéhyde-3-phosphate et la voie des pentoses phosphate en fructose-6- phosphate, lui-même converti en glucosamine-1 -phosphate en deux étapes successives par les enzymes GImS (gIucosamine-fructose-6-phosphate aminotransferase) et GImM (phosphoglucosamine mutase). Si l'hypothèse est correcte, on attend une incorporation de 13C2 en positions C6-Cp et C12-C15 respectivement (Figure 10A).
Deux cultures de 50 ml chacune de la souche de Streptomyces ambofaciens SPMl 10 sont réalisées en milieu MP5 à 30°C. Aux temps t =32 ; 44 ; 56 et 7Oh, du glycérol uniformément marqué au carbone 13C est ajouté au milieu de culture (2 mM final pour chaque ajout). Après 96h, la culture est centrifugée. Le surnageant est récupéré, dilué 5 fois avec de l'eau déminéralisée puis chargé à 1 ml/min sur deux cartouches SPE strata-X-CW (33 μm ; 200 mg/6 ml ; Phenomenex). La colonne est ensuite lavée avec un mélange H2OZMeOH 9/1 puis avec 3 ml d'une solution 100 mM NH4Cl H20/MeOH 8/2. La congocidine est ensuite éluée avec une solution de H2OZMeOH 8/2 contenant 0.1% d'acide formique par fractions de 2 ml qui sont analysées par HPLC. Les fractions contenant la congocidine pure sont regroupées et lyophilisées. Pour l'analyse RMN 13C, l'échantillon est solubilisé dans D2O. La congocidine produite est purifiée à partir du surnageant de culture et analysée par RMN.
Résultats :
Le spectre 13C obtenu (Figure 10B) indique clairement l'incorporation aux positions C6-C9 et C12-C15 d'un fragment 13C2 provenant du 13C3- glycérol, confortant ainsi l'hypothèse émise. EXEMPLE 10 : Biosynthèse d'un nouvel analogue de Ia congocidine, Ia 17- méthylcongocidine
La souche CGCL022 est cultivée pendant 48h à 30°C dans 50 ml de milieu MP5. Une solution de 5-méthylcytosine est ajoutée à la culture (concentration finale de 2 mM). Aux temps t = 0 (moment de l'ajout) et 48h après l'ajout de 5- méthylcytosine, 2 ml de culture sont prélevés et les surnageants analysés par HPLC et
LC-MS.
Résultats
Le chromatogramme présenté Figure HA comparé aux chromatogrammes de la Figure 8A montre la présence d'un pic supplémentaire. L'analyse par spectrométrie de masse de ce pic (Figure 1 IB) démontre qu'il s'agit de la 17-méthylcongocidine (Figure HC). L'ajout d'un précurseur non naturel de la congocidine (5-méthylcytosine) au milieu de culture du mutant CGCL022 permet donc la biosynthèse d'une nouvelle molécule (17-méthylcongocidine). De plus, la biosynthèse de cette molécule conforte le schéma de biosynthèse du précurseur amidinium de la congocidine proposé à la Figure 7. EXEMPLE 11 : Biosynthèse d'un nouvel analogue de Ia congocidine, Ia 17- fluorocongocidine.
Matériels et méthodes
La souche CGCL022 est cultivée pendant 48h à 30°C dans 50 ml de milieu MP5. Une solution de 5-fluorocytosine est ajoutée à la culture (concentration finale de 2 mM). Aux temps t = 0 (moment de l'ajout) et 48h après l'ajout de 5- fluorocytosine, 2 ml de culture sont prélevés et les surnageants analysés par HPLC et
LC-MS.
Résultats
Le chromatogramme présenté à la Figure 12A comparé aux chromatogrammes de la Figure 8A montre la présence d'un pic supplémentaire. L'analyse par spectrométrie de masse de ce pic (Figure 12B) démontre qu'il s'agit de la 17-fluorocongocidine (Figure 12C). L'ajout de 5-fluorocytosine au milieu de culture du mutant CGCL022 permet donc la biosynthèse d'une nouvelle molécule (17- fluorocongocidine). De plus, la biosynthèse de cette molécule conforte le schéma de biosynthèse du précurseur amidinium de la congocidine proposé à la Figure 7. Références :
Aleman, C, Vega, M. C, Navarro, E. & Puiggali, J. (1996). Towards the understanding of the folding of méthylène units in the glutamine residue. JPeptSci l, 364-370. Altschul, S. F., Madden, T. L., Schaffer, A. A., Zhang, J., Zhang,
Z., Miller, W. & Lipman, D. J. (1997). Gapped BLAST and PSI-BLAST: a new génération of protein database search programs. Nucleic Acids Res 25, 3389-3402.
Asai, A., Sakai, Y., Ogawa, H., Yamashita, Y., Kakita, S., Ochiai, K., Ashizawa, T., Mihara, A., Mizukami, T., Nakano, H. (2000) Pyrronamycin A and B, novel antitumor antibiotics containing pyrrole-amide repeating unit, produced by Streptomyces sp. J. Antibiot, 53, 66-69. Baltz, R. H., McHenney, M. A., Cantwell, C. A., Queener, S. W. & Solenberg, P. J. (1997). Applications of transposition mutagenesis in antibiotic producing streptomycetes. Antonie Van Leeuwenhoek ll, 179-187.
Baraldi P.G., Tabrizi M.A., Preti D., Fruttarolo F., Avitabile B., Bovero A., Pavani G., del Carmen Nunez Carretero M. & Romagnoli R. (2003)
DNA minor-groove binders. Design, synthesis, and biological évaluation of ligands structurally related to CC-1065, distamycin and anthramycin. Pure Appl. Chem., 75,
187-194.
Bierman, M., Logan, R., O'Brien, K., Seno, E. T., Rao, R. N. & Schoner, B. E. (1992). Plasmid cloning vectors for the conjugal transfer of DNA from Escherichia coli to Streptomyces spp. Gène 116, 43-49.
Blondelet-Rouault, M. H., Weiser, J., Lebrihi, A., Branny, P. & Pernodet, J. L. (1997). Antibiotic résistance gène cassettes derived from the oméga interposon for use in E. coli and Streptomyces. Gène 190, 315-317. Chater, K. F. & Bruton, C. J. (1985). Résistance, regulatory and production gènes for the antibiotic methylenomycin are clustered. Embo J 4, 1893- 1897.
Chaveroche, M. K., Ghigo, J. M. & d'Enfert, C. (2000). A rapid method for efficient gène replacement in the filamentous fungus Aspergillus nidulans. Nucleic Acids Res 28, E97.
Choulet F., Gallois A., Aigle B., Mangenot S., Gerbaud C,
Truong C, Francou F-X., Borges F., Fourrier C, Guérineau M., Decaris B.,
Barbe V., Pernodet J-L., Leblond P. (2006). Intraspecific variability of the terminal inverted repeats of the linear chromosome of Streptomyces ambofaciens. Journal of Bacteriology 188: 6599-6610.
Combes, P., TiII, R., Bee, S. & Smith, M. C. (2002). The streptomyces génome contains multiple pseudo-attB sites for the (phi)C31-encoded site-specific recombination system. J Bacteriol 184, 5746-5752.
Cosar, C, Ninet, L., Pinnert-Sindico, S. & PreudΗomme, J. (1952). [Trypanocide action of an antibiotic produced by a Streptomyces.]. C R Hebd Séances Acad Sci 234, 1498-1499. Delcher, A. L., Harmon, D., Kasif, S., White, O. & Salzberg, S. L. (1999). Improved microbial gène identification with GLIMMER. Nucleic Acids Res 27, 4636-4641.
Denny, W. A. (2001). DNA minor groove alkylating agents. Curr Med Chem 8, 533-544.
Dolenc J., Borstnik U Hodoscek, M., Koller, J. & Janezic, D. (2005) An ab initio QM/MM study of the conformationalstability of complexes formed by netropsin and DNA. the importance of van der Waals interactions and hydrogen bonding. Theochem, 718, 77-85. Dyatkina, N. B., Roberts, C. D., Keicher, J. D., Dai, Y.,
Nadherny, J. P., Zhang, W., Schmitz, U., Kongpachith, A., Fung, K., Novikov, A. A., Lou, L., Velligan, M., Khorlin, A. A. & Chen, M. S. (2002). Minor groove DNA binders as antimicrobial agents. 1. Pyrrole tetraamides are potent antibacterials against vancomycin résistant Enterococci [corrected] and methicillin résistant Staphylococcus aureus. J Med Chem 45, 805-817.
Finlay, A. C, Hochstein, F.A. Sobin, B. A. and Murphy F. X. (1951) Netropsin, a new antibiotic produced by a streptomyces. J. Am. Chem. Soc. 73, 341-343.
Gordon Green B., Chabin R. & Grant S. K. (1996) The natural product noformycin is an inhibitor of inducible-nitric oxide synthase. Biochem. Biophys. Res. Commun., 225, 621-626.
Grochowski L.L. and Zabriskie T.M. (2006) Characterization of BIsM, a Nucleotide Hydrolase Involved in Cytosine Production for the Biosynthesis of Blasticidin S. ChemBioChem 7, 957-964 Gust B., Challis G. L., Fowler K., Kieser T., Chater K. F. (2003).
PCR-targeted Streptomyces gène replacement identifies a protein domain needed for biosynthesis of the sesquiterpene soil odor geosmin. PNAS, 100,1541-1546
Harris, M. (2004). Monoclonal antibodies as therapeutic agents for cancer. Lancet Oncol 5, 292-302. Hopwood, D. A. (1997). Genetic Contributions to Understanding
Polyketide Synthases. Chem Rev 91, 2465-2498. Ishikawa, J. & Hotta, K. (1999). FramePlot: a new implementation of the frame analysis for predicting protein-coding régions in bacterial DNA with a high G + C content. FEMS Microbiol Lett 174, 251-253.
Julia, M. & Preau-Joseph, N. (1967). [Amidines and guanidines related to congocidine. I. Structure of congocidine]. Bull Soc Chim Fr 11, 4348-4356.
Karray, F. (2005). Etude de la biosynthèse de l'antibiotique spiramycine par Streptomyces ambofaciens. Thèse Université Paris-Sud 11.
Khalaf, A. I., Ebrahimabadi, A. H., Drummond, A. J., Anthony, N. G., Mackay, S. P., Suckling, C. J. & Waigh, R. D. (2004). Synthesis and antimicrobial activity of some netropsin analogues. Org Biomol Chem 2, 3119-3127.
Kieser, T., MJ Bibb, MJ Buttner, KF Chater, DA Hopwood (2000). Practical Streptomyces Genetics.
Kim, U. J., Birren, B. W., Slepak, T., Mancino, V., Boysen, C, Kang, H. L., Simon, M. I. & Shizuya, H. (1996). Construction and characterization of a human bacterial artificial chromosome library. Genomics 34, 213-218.
Lukashin A., Borodovsky M. (1998). GeneMark.hmm: new solutions for gène finding. Nucleic acidRes, 26, 1107-1115.
Marchler-Bauer A., Bryant SH. (2004). CD-Search: protein domain annotations on the fly. Nucleic Acids Res. 32 (W) 327-331. Miller, V. L. & Mekalanos, J. J. (1988). A novel suicide vector and its use in construction of insertion mutations: osmoregulation of outer membrane proteins and virulence déterminants in Vibrio cholerae requires toxR. J Bacteriol 170, 2575-2583.
Nalin, R., Pujic, P., Tuphile, K., Gillet,B. (2004).Method for the expression of unknown environmental DNA into adapted host cells. In WO2004013327, pp. WO2004013327.
Neidle, S. (2001). DNA minor-groove récognition by small molécules. NatProdRep 18, 291-309.
Norrander J., Kempe T. and Messing J. (1983) Construction of improved M13 vectors using oligodeoxynucleotide-directed mutagenesis. Gène. 26, 101-106 Pernodet, J. L., Alegre, M. T., Blondelet-Rouault, M. H. & Guerineau, M. (1993). Résistance to spiramycin in Streptomyces ambofaciens, the producer organism, involves at least two différent mechanisms. J Gen Microbiol 139, 1003-1011. Raynal, A., Karray, F., Tuphile, K., Darbon-Rongere, E. &
Pernodet, J. L. (2006). Excisable cassettes: new tools for functional analysis of Streptomyces génomes. Appl Environ Microbiol 72, 4839-4844.
Raynal, A., Tuphile, K., Gerbaud, C, Luther, T., Guerineau, M. & Pernodet, J. L. (1998). Structure of the chromosomal insertion site for pSAM2: functional analysis in Escherichia coli. Mol Microbiol 28, 333-342.
Sambrook J. & Russell D. W. (2001). Molecular cloning, a laboratory manuel. Third édition. Editions: CoId Spring Harbor Laboratory Press, New York.
Schaffer A., Aravind L., Madden T.L., Shavirin S., Spouge J.L., WoIf YX, Koonin E. V., Altschul S.F. (2001). Improving the accuracy of PSI- BLAST protein database searches with composition-based statistics and other refinements. Nucleic Acids Res. 29, 2994-3005.
Simon, R., Priefer, U., Pϋlher, A., (1983). A broad host range mobilisation System for in vivo genetic engineering: transposon mutagenesis in Gram négative bacteria. Bio/technology 1, 784-791
Suo Z, Tseng CC, Walsh CT. (2001). Purification, priming, and catalytic acylation of carrier protein domains in the polyketide synthase and nonribosomal peptidyl synthetase modules of the HMWPl subunit of yersiniabactin synthetase. Pr oc NatlAcadSci USA, 98, 99-104. Stumpp, T., Himbert, S. & Altenbuchner, J. (2005). Cloning of the netropsin résistance gènes from Streptomyces flavopersicus NRRL 2820. J Basic Microbiol 45, 355-362.
Turgay, K. & Marahiel, M. A. (1994). A gênerai approach for identifying and cloning peptide synthetase gènes. Pept Res 7, 238-241. Van Hecke K, Nam, P.C. Nguyen, M. T., Van Meervelt, L.
(2005) Netropsin interactions in the minor groove of d(GGCAATTGG) studied by a combination of resolution enhancement and ab initio calculations). FEBS J. , 272, 3531-3541.
Yanai, K., Murakami, T. & Bibb, M. (2006). Amplification of the entire kanamycin biosynthetic gène cluster during empirical strain improvement of Streptomyces kanamy ceticus. Proc NatlAcadSci USA 103, 9661-9666.
Yu, D., Ellis, H. M., Lee, E. C, Jenkins, N. A., Copeland, N. G. & Court, D. L. (2000). An efficient recombination System for chromosome engineering in Escherichia coli. Proc NatlAcadSci USA 97, 5978-5983.

Claims

REVENDICATIONS
1) Utilisation d'un polynucléotide pour la production de congocidine ou d'un dérivé de congocidine, ledit polynucléotide étant sélectionné dans le groupe constitué par : a) un polynucléotide comprenant l'ensemble des phases ouvertes de lecture ORP 1 et ORP 5 à ORP 22, codant respectivement pour les polypeptides de la voie de biosynthèse de la congocidine Cgc3* (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl l (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl5 (SEQ ID NO: 36), Cgcl6 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl8 (SEQ ID NO: 42) et Cgcl9 (SEQ ID NO: 44), l'une ou plusieurs desdites phases ouvertes de lecture étant optionnellement remplacée(s) par la (les) séquence(s) complémentaire(s) correspondante(s) ; b) un polynucléotide codant pour l'ensemble des polypeptides codés par lesdites phases ouvertes de lecture ORF 1 et ORP 5 à ORP 22 ; et c) un polynucléotide codant pour :
- un analogue de Cgc3* présentant au moins 53% d'identité et au moins 60% de similarité avec la séquence SEQ ID NO: 2 ;
-. un analogue de Cgc2 présentant au moins 36% d'identité et au moins 48% de similarité avec la séquence SEQ ID NO: 10 ;
- un analogue de Cgc3 présentant au moins 49% d'identité et au moins 62% de similarité avec la séquence SEQ ID NO: 12 ; - un analogue de Cgc4 présentant au moins 55% d'identité et au moins 71% de similarité avec la séquence SEQ ID NO: 14 ;
- un analogue de Cgc5 présentant au moins 51% d'identité et au moins 67% de similarité avec la séquence SEQ ID NO: 16 ;
- un analogue de Cgc6 présentant au moins 56% d'identité et au moins 72% de similarité avec la séquence SEQ ID NO: 18 ;
- un analogue de Cgc7 présentant au moins 32% d'identité et au moins 46% de similarité avec la séquence SEQ ID NO: 20 ;
- un analogue de Cgc8 présentant au moins 39% d'identité et au moins 56% de similarité avec la séquence SEQ ID NO: 22 ; - un analogue de Cgc9 présentant au moins 45% d'identité et au moins 58% de similarité avec la séquence SEQ ID NO: 24 ; - un analogue de CgclO présentant au moins 34% d'identité et au moins 47% de similarité avec la séquence SEQ ID NO: 26 ;
- un analogue de Cgcl l présentant au moins 44% d'identité et au moins 65% de similarité avec la séquence SEQ ID NO: 28 ; - un analogue de Cgcl2 présentant au moins 47% d'identité et au moins 60% de similarité avec la séquence SEQ ID NO: 30 ;
- un analogue de Cgcl3 présentant au moins 26% d'identité et au moins 44% de similarité avec la séquence SEQ ID NO: 32 ;
- un analogue de Cgcl4 présentant au moins 31% d'identité et au moins 48% de similarité avec la séquence SEQ ID NO: 34 ;
- un analogue de Cgcl5 présentant au moins 33% d'identité et au moins 46% de similarité avec la séquence SEQ ID NO: 36 ;
- un analogue de Cgcl6 présentant au moins 38% d'identité et au moins 55% de similarité avec la séquence SEQ ID NO: 38 ; - un analogue de Cgcl7 présentant au moins 39% d'identité et au moins 50% de similarité avec la séquence SEQ ID NO: 40 ;
- un analogue de Cgclδ présentant au moins 40% d'identité et au moins 54% de similarité avec la séquence SEQ ID NO: 42 ; et
- un analogue de Cgcl9 présentant au moins 51% d'identité et au moins 55% de similarité avec la séquence SEQ ID NO: 44 ; et d) un polynucléotide s'hybridant dans des conditions stringentes au polynucléotide défini en a) et pouvant remplacer l'acide nucléique auquel il s'hy bride spécifiquement pour diriger la biosynthèse de la congocidine ou dudit dérivé de la congocidine. 2) Utilisation d'un polynucléotide pour la production d'un dérivé de congocidine, ledit polynucléotide étant sélectionné dans le groupe constitué par : al) un polynucléotide comprenant l'ensemble des phases ouvertes de lecture ORF 1, ORF 5, ORF 6 et ORF 8 à ORF 22, codant respectivement pour les polypeptides Cgc3* (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl 1 (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl5 (SEQ ID NO: 36), Cgcl6 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl 8 (SEQ ID NO: 42) et Cgcl9 (SEQ ID NO: 44), l'une ou plusieurs desdites phases ouvertes de lecture étant optionnellement remplacée(s) par la (les) séquence(s) complémentaire(s) correspondante(s) ; bl) un polynucléotide codant pour l'ensemble des polypeptides codés par lesdites phases ouvertes de lecture ORF 1, ORF 5, ORF 6 et ORF 8 à ORF 22 ; et cl) un polynucléotide codant pour un analogue de chacun des polypeptides codés par lesdites phases ouvertes de lecture ORF 1, ORF 5, ORF 6 et ORF 8 à ORF 22, lesdits analogues étant tels que définis dans la revendication 1 ; et dl) un polynucléotide s'hybridant dans des conditions stringentes au polynucléotide défini en al) et pouvant remplacer l'acide nucléique auquel il s'hybride spécifiquement pour diriger la biosynthèse dudit dérivé de la congocidine. 3) Utilisation selon la revendication 2, caractérisée en ce que ledit dérivé de la congocidine est sélectionné dans le groupe constitué par la 17- méthylcongocidine et la 17-fluorocongocidine.
4) Utilisation d'un polynucléotide pour la production d'un dérivé de la congocidine, ledit polynucléotide étant sélectionné dans le groupe constitué par : a2) un polynucléotide comprenant l'ensemble des phases ouvertes de lecture ORF 1, ORF 5 à ORF 17 et ORF 19 à ORF 22, codant respectivement pour les polypeptides de la voie de biosynthèse de la congocidine Cgc3* (SEQ ID NO: T), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl l (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgclό (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl8 (SEQ ID NO: 42) et Cgcl9 (SEQ ID NO: 44), l'une ou plusieurs desdites phases ouvertes de lecture étant optionnellement remplacée(s) par la (les) séquence(s) complémentaire(s) correspondante(s) ; b2) un polynucléotide codant pour l'ensemble des polypeptides codés par lesdites phases ouvertes de lecture ORF 1, ORF 5 à ORF 17 et ORF 19 à ORF 22 ; et c2) un polynucléotide codant pour un analogue de chacun des polypeptides codés par lesdites phases ouvertes de lecture ORF 1, ORF 5 à ORF 17 et ORF 19 à ORF 22, lesdits analogues étant tels que définis dans la revendication 1 ; et d2) un polynucléotide s'hybridant dans des conditions stringentes au polynucléotide défini en a2) et pouvant remplacer l'acide nucléique auquel il s'hybride spécifiquement pour diriger la biosynthèse dudit dérivé de la congocidine.
5) Utilisation selon la revendication 4, caractérisée en ce que ledit dérivé de la congocidine est la N,N-déméthylcongocidine.
6) Utilisation d'un polynucléotide pour la production d'un dérivé de la congocidine, ledit polynucléotide étant sélectionné dans le groupe constitué par : a3) un polynucléotide comprenant l'ensemble des phases ouvertes de lecture ORF 1, ORF 5, ORF 6, ORF 8 à ORF 17 et ORF 19 à ORF 22, codant respectivement pour les polypeptides de la voie de biosynthèse de la congocidine
Cgc3* (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22),
Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl l (SEQ ID NO: 28), Cgcl2
(SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl6 (SEQ
ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl8 (SEQ ID NO: 42) et Cgcl9 (SEQ ID
NO: 44), l'une ou plusieurs desdites phases ouvertes de lecture étant optionnellement remplacée(s) par la (les) séquence(s) complémentaire(s) correspondante(s) ; b3) un polynucléotide codant pour l'ensemble des polypeptides codés par lesdites phases ouvertes de lecture ORF 1, ORF 5, ORF 6, ORF 8 à ORF 17 et ORF 19 à ORF 22 ; et c3) un polynucléotide codant pour un analogue de chacun des polypeptides codés par lesdites phases ouvertes de lecture ORF 1, ORF 5, ORF 6, ORF 8 à ORF 17 et ORF 19 à ORF 22 ; et d3) un polynucléotide s'hybridant dans des conditions stringentes au polynucléotide défini en a3) et pouvant remplacer l'acide nucléique auquel il s'hybride spécifiquement pour diriger la biosynthèse dudit dérivé de la congocidine. 7) Utilisation selon la revendication 6, caractérisée en ce que ledit dérivé de la congocidine est la 17-fluoro-déméthylcongocidine.
8) Utilisation selon l'une quelconque des revendications 1 à 7, caractérisée en ce que : a4) le polynucléotide défini en a), al), a2) ou a3) comprend en outre la phase ouverte de lecture ORF 4 codant pour le polypeptide Cgcl (SEQ ID NO: 8) ; b4) le polynucléotide défini en b), bl), b2) ou b3) code en outre pour le polypeptide codé par ladite phase ouverte de lecture ORF 4 ; c4) le polynucléotide défini en c), cl), c2) ou c3) code en outre pour un analogue de Cgcl présentant au moins 62% d'identité et au moins 71% de similarité avec la séquence SEQ ID NO: 8 ; et d4) le polynucléotide défini en d), dl), d2) ou d3) s'hybride dans des conditions stringentes au polynucléotide défini en a4) et peut le remplacer pour réguler la biosynthèse de la congocidine ou du dérivé de la congocidine.
9) Utilisation selon l'une quelconque des revendications 1 à 8, caractérisée en ce que : a5) le polynucléotide défini en a), al), a2), a3) ou a4) comprend en outre les phases ouvertes de lecture ORF 2 et ORF 3 codant pour les polypeptides Cgc2* (SEQ ID NO: 4) et Cgcl * (SEQ ID NO: 6) ; b5) le polynucléotide défini en b), bl), b2), b3) ou b4) code en outre pour les polypeptides codés par lesdites phases ouvertes de lecture ORF 2 et ORF 3 ; c5) le polynucléotide défini en c), cl), c2), c3) ou c4) code en outre pour un analogue de Cgc2* présentant au moins 76% d'identité et 84% de similarité avec la séquence SEQ ID NO: 4 et pour un analogue de Cgcl* présentant au moins 80% d'identité et 85% de similarité avec la séquence SEQ ID NO: 6 ; et d5) le polynucléotide défini en d), dl), d2), d3) ou d4) s'hybride dans des conditions stringentes au polynucléotide défini en a5) et peut remplacer l'acide nucléique auquel il s'hybride spécifiquement pour conférer la résistance à la congocidine.
10) Utilisation selon la revendication 9, caractérisée en ce que ledit polynucléotide est défini par la séquence SEQ ID NO: 49 ou par la séquence SEQ ID
NO: 102.
11) Utilisation selon l'une quelconque des revendications 1 à 10, caractérisée en ce que ledit polynucléotide est présent dans un vecteur.
12) Utilisation selon la revendication 11, caractérisée en ce que ledit vecteur est un plasmide, un cosmide, un chromosome artificiel bactérien (BAC), un élément intégratif d'actinobactérie, un virus ou un bactériophage.
13) Utilisation selon la revendication 11 ou la revendication 12, caractérisée en ce que ledit vecteur est présent dans une cellule recombinante exprimant des phosphopantethéinyle transférases (PPTases). 14) Utilisation selon la revendication 13, caractérisée en ce que ladite cellule recombinante est une actinobactérie.
15) Utilisation selon la revendication 14, caractérisée en ce que ladite cellule recombinante est Streptomyces lividans.
16) Polynucléotide isolé, caractérisé en ce qu'il comprend au moins une séquence d'acide nucléique sélectionnée dans le groupe constitué par : a6) l'une quelconque des phases ouvertes de lecture ORF 1 à ORF 22 codant pour les polypeptides de la voie de biosynthèse de la congocidine Cgc3* (SEQ ID NO: 2), Cgc2* (SEQ ID NO: 4), Cgcl* (SEQ ID NO: 6), Cgcl (SEQ ID NO: 8), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl 1 (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl5 (SEQ ID NO: 36), Cgclό (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl8 (SEQ ID NO: 42) et Cgcl9 (SEQ ID NO: 44), l'une ou plusieurs desdites phases ouvertes de lecture étant optionnellement remplacée(s) par la (les) séquence(s) complémentaire(s) correspondante(s) ; b6) une séquence codant pour l'un quelconque des polypeptides codés par lesdites phases ouvertes de lecture ORF 1 à ORF 22 ; c6) une séquence codant pour au moins un analogue d'un polypeptide codé par l'une desdites phases ouvertes de lecture ORF 1 à ORF 22, lesdits analogues étant tels que définis dans les revendications 1, 8 et 9 ; et d6) une séquence comprenant au moins deux séquences de a6), b6) ou c6) ; et e6) une séquence s'hybridant dans des conditions stringentes à l'une quelconque des phases ouvertes de lecture ORF 1 à ORF 22 et pouvant remplacer la (les) phase(s) ouverte(s) de lecture à laquelle (auxquelles) elle s'hybride spécifiquement pour diriger la biosynthèse de la congocidine ou d'un dérivé de la congocidine, pour réguler ladite biosynthèse ou pour conférer la résistance à la congocidine.
17) Polynucléotide isolé selon la revendication 16, caractérisé en ce qu'il comprend une séquence d'acide nucléique sélectionnée dans le groupe constitué par : a7) une séquence comprenant les deux phases ouvertes de lecture
ORF 2 et ORF 3 codant pour les polypeptides impliqués dans la résistance à la congocidine, Cgc2* (SEQ ID NO: 4) et Cgcl* (SEQ ID NO: 6), l'une et/ou l'autre desdites phases ouvertes de lecture étant optionnellement remplacée(s) par la (les) séquence(s) complémentaire(s) correspondante(s) ; b7) une séquence codant pour les polypeptides codés par lesdites phases ouvertes de lecture ORF 2 et 3 ; c7) une séquence codant pour les analogues desdits polypeptides codés par lesdites phases ouvertes de lecture ORF 2 et 3, lesdits analogues étant tels que définis dans la revendication 1 ; et d7) une séquence s'hybridant dans des conditions stringentes à l'acide nucléique défini en a7) et pouvant remplacer l'acide nucléique auquel elle s'hybride spécifiquement pour conférer la résistance à la congocidine.
18) Polynucléotide selon la revendication 16 sélectionné dans le groupe constitué par : a8) un polynucléotide comprenant la phase ouverte de lecture ORF 4 codant pour le polypeptide impliqués dans la régulation de la biosynthèse de la congocidine Cgcl (SEQ ID NO: 8), ladite phase ouverte de lecture étant optionnellement remplacée par la séquence complémentaire correspondante ; b8) une séquence codant pour le polypeptide codé par ladite phase ouverte de lecture ORF 4 ; c8) une séquence codant pour un analogue de Cgcl présentant au moins 62% d'identité et au moins 71% de similarité avec la séquence SEQ ID NO: 8 ; et d8) une séquence s 'hy bridant dans des conditions stringentes à la phase ouverte de lecture ORF 4 et pouvant la remplacer pour réguler la biosynthèse de Ia congocidine ou d'un dérivé de la congocidine.
19) Polynucléotide isolé tel que défini dans l'une quelconque des revendications 1, 2, 4, 6, 8 et 9.
20) Utilisation d'un polynucléotide tel que défini dans la revendication 8 ou d'un polynucléotide selon la revendication 17 pour conférer à un microorganisme le caractère de résistance à la congocidine.
21) Utilisation d'un polynucléotide tel que défini dans la revendication 8 ou d'un polynucléotide selon la revendication 18 pour augmenter la biosynthèse de la congocidine ou d'un dérivé de la congocidine par un microorganisme exprimant des phosphopantethéinyle transférases (PPTases) et capable de synthétiser la congocidine ou un dérivé de la congocidine.
22) Utilisation selon la revendication 20 ou la revendication 21, caractérisée en ce que ledit microorganisme est une actinobactérie.
23) Utilisation selon la revendication 22, caractérisé en ce que ledit microorganisme est Streptomyces lividans. 24) Groupe de gènes comprenant les phases ouvertes de lecture codant pour les polypeptides Cgc3* (SEQ ID NO: 2), Cgc2* (SEQ ID NO: 4), Cgcl* (SEQ ID NO: 6), Cgcl (SEQ ID NO: 8), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl l (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl5 (SEQ ID NO: 36), Cgcl6 (SEQ ID NO: 38), Cgcl 7 (SEQ ID NO: 40), Cgcl 8 (SEQ ID NO: 42) et Cgcl 9 (SEQ ID NO: 44).
25) Vecteur comprenant un polynucléotide selon l'une quelconque des revendications 15 à 19. 26) Vecteur selon la revendication 25, caractérisé en ce qu'il s'agit d'un plasmide, d'un cosmide, d'un chromosome artificiel bactérien (BAC), d'un élément intégratif d' actinobactérie, d'un virus ou d'un bactériophage. 27) Cellule recombinante exprimant des phosphopantethéinyle transférases (PPTases) caractérisée en ce qu'elle est transformée par un vecteur selon la revendication 25 ou la revendication 26.
28) Cellule recombinante selon la revendication 27, caractérisée en ce qu'elle est apte à synthétiser la congocidine et en ce que ledit vecteur est un vecteur d'expression comprenant un polynucléotide tel que défini dans la revendication 1 ou la revendication 10.
29) Cellule recombinante selon la revendication 27, caractérisée en ce qu'elle est apte à synthétiser un dérivé de la congocidine et en ce que ledit vecteur est un vecteur d'expression comprenant un polynucléotide tel que défini dans l'une quelconque des revendications 1, 2, 4 et 6.
30) Cellule recombinante selon l'une quelconque des revendications 27 à 29, caractérisée en ce qu'il s'agit d'une actinobactérie.
31) Cellule recombinante selon la revendication 28, caractérisée en ce qu'il s'agit de Streptomyces lividans.
32) Fragment d'au moins 15 nucléotides d'un polynucléotide selon l'une quelconque des revendications 16 à 19 utilisable comme sonde ou amorce.
33) Fragment selon la revendication 32, caractérisé en ce qu'il comprend au moins l'une des séquences SEQ ID NO: 52, 53 et 56 à 59. 34) Polypeptide isolé, impliqué dans la voie de la biosynthèse de la congocidine ou d'un dérivé de la congocidine, caractérisé en ce qu'il est sélectionné dans le groupe constitué par :
- les polypeptides Cgc3* (SEQ ID NO: 2), Cgc2* (SEQ ID NO: 4), Cgcl* (SEQ ID NO: 6), Cgcl (SEQ ID NO: 8), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl 1 (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl 5 (SEQ ID NO: 36), Cgcl 6 (SEQ ID NO: 38), Cgcl 7 (SEQ ID NO: 40), Cgcl 8 (SEQ ID NO: 42) et Cgcl 9 (SEQ ID NO: 44) ; et
- les analogues desdits polypeptides, lesdits analogues étant tels que définis dans les revendications 1, 8 et 9.
35) Utilisation des polypeptides Cgc3* (SEQ ID NO: 2), Cgc2 (SEQ
ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ
ID NO: 24), CgclO (SEQ ID NO: 26), Cgcll (SEQ ID NO: 28), Cgcl2 (SEQ ID NO:
30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl5 (SEQ ID NO: 36), Cgclβ (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl8 (SEQ ID NO: 42) et Cgcl9 (SEQ ID NO: 44), chaque polypeptide étant optionnellement remplacé par un analogue correspondant, ledit analogue étant tel que défini dans la revendication 1, pour la production de la congocidine ou d'un dérivé de la congocidine. 36) Utilisation des polypeptides Cgc3* (SEQ ID NO: 2), Cgc2 (SEQ
ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl l (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl5 (SEQ ID NO: 36), Cgcl6 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl8 (SEQ ID NO: 42) et Cgcl9 (SEQ ID NO: 44), chaque polypeptide étant optionnellement remplacé par un analogue correspondant, ledit analogue étant tel que défini dans la revendication 1, pour la production d'un dérivé de la congocidine.
37) Utilisation selon la revendication 36, caractérisée en ce que ledit dérivé de la congocidine est la 17-méthylcongocidine ou la 17-fluorocongocidine.
38) Utilisation des polypeptides Cgc3* (SEQ ID NO: T), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc4 (SEQ ID NO: 14), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl 1 (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl6 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl8 (SEQ ID NO: 42) et Cgcl9 (SEQ ID NO: 44), chaque polypeptide étant optionnellement remplacé par un analogue correspondant, ledit analogue étant tel que défini dans la revendication 1, pour synthétiser la congocidine ou un dérivé de la congocidine. 39) Utilisation selon la revendication 36, caractérisée en ce que ledit dérivé est la N,N-déméthylcongocidine.
40) Utilisation des polypeptides Cgc3* (SEQ ID NO: 2), Cgc2 (SEQ ID NO: 10), Cgc3 (SEQ ID NO: 12), Cgc5 (SEQ ID NO: 16), Cgc6 (SEQ ID NO: 18), Cgc7 (SEQ ID NO: 20), Cgc8 (SEQ ID NO: 22), Cgc9 (SEQ ID NO: 24), CgclO (SEQ ID NO: 26), Cgcl 1 (SEQ ID NO: 28), Cgcl2 (SEQ ID NO: 30), Cgcl3 (SEQ ID NO: 32), Cgcl4 (SEQ ID NO: 34), Cgcl6 (SEQ ID NO: 38), Cgcl7 (SEQ ID NO: 40), Cgcl 8 (SEQ ID NO: 42) et Cgcl 9 (SEQ ID NO: 44), chaque polypeptide étant optionnellement remplacé par un analogue correspondant, pour la production d'un dérivé de la congocidine. 41) Utilisation selon la revendication 40, caractérisée en ce que ledit dérivé de la congocidine est la 17-fluoro-déméthylcongocidine. 42) Procédé de production de congocidine ou d'un dérivé de la congocidine, caractérisé en ce qu'il comprend une étape consistant à mettre en culture une cellule recombinante selon l'une quelconque des revendications 27 à 31 dans des conditions permettant la synthèse de la congocidine ou dudit dérivé de congocidine. 43) Procédé selon la revendication 42, caractérisé en ce que ledit dérivé de la congocidine est la 17-méthylcongocidine et ladite cellule recombinante comprend un polynucléotide tel que défini dans la revendication 2 et est mise en culture en présence de 5-méthylcytosine.
44) Procédé selon la revendication 42, caractérisé en ce que ledit dérivé de la congocidine est la 17-fluorocongocidine et ladite cellule recombinante comprend un polynucléotide tel que défini dans la revendication 2 et est mise en culture en présence de 5-fluorocytosine.
45) Procédé selon la revendication 42, caractérisée en ce que ledit dérivé de la congocidine est la N,N-déméthylcongocidine et ladite cellule recombinante comprend un polynucléotide tel que défini dans la revendication 4.
46) Procédé selon la revendication 42, caractérisé en ce que ledit dérivé de la congocidine est la 17-fluoro-déméthylcongocidine et ladite cellule recombinante comprend un polynucléotide tel que défini dans la revendication 6 et est mise en culture en présence de 5-fruorocytosine. 47) Dérivé de la congocidine, sélectionné dans le groupe constitué par la 17-fluorocongocidine, la 17-méthylcongocidine et la N,N-déméthylcongocidine.
PCT/FR2007/001721 2006-10-18 2007-10-18 Polynucleotides et polypeptides codes par lesdits polynucleotides impliques dans la voie de biosynthese de la congocidine et ses derives WO2008047006A2 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0609147 2006-10-18
FR0609147A FR2907465A1 (fr) 2006-10-18 2006-10-18 Polynucleotides et polypeptides codes par lesdits polynucleotides impliques dans la voie de biosynthese de la congocidine et ses derives

Publications (4)

Publication Number Publication Date
WO2008047006A2 true WO2008047006A2 (fr) 2008-04-24
WO2008047006A3 WO2008047006A3 (fr) 2008-07-24
WO2008047006A8 WO2008047006A8 (fr) 2008-11-06
WO2008047006A9 WO2008047006A9 (fr) 2009-09-03

Family

ID=37853111

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2007/001721 WO2008047006A2 (fr) 2006-10-18 2007-10-18 Polynucleotides et polypeptides codes par lesdits polynucleotides impliques dans la voie de biosynthese de la congocidine et ses derives

Country Status (2)

Country Link
FR (1) FR2907465A1 (fr)
WO (1) WO2008047006A2 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015079397A1 (fr) * 2013-11-28 2015-06-04 Piramal Enterprises Limited Composés pour le traitement de la tuberculose

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2586762A (en) * 1949-08-25 1952-02-19 Pfizer & Co C Netropsin and process for its production

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1255840A2 (fr) * 2000-02-08 2002-11-13 Norges Teknisk Naturvitenskapelige Universitet Nouveaux genes codant une polyketide de nystatine synthase, manipulation et utilisation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2586762A (en) * 1949-08-25 1952-02-19 Pfizer & Co C Netropsin and process for its production

Non-Patent Citations (26)

* Cited by examiner, † Cited by third party
Title
BAILLY C ET AL: "SEQUENCE-SPECIFIC DNA MINOR GROOVE BINDERS. DESIGN AND SYNTHESIS OF NETROPSIN AND DISTAMYCIN ANALOGUES" BIOCONJUGATE CHEMISTRY, ACS, WASHINGTON, DC, US, vol. 9, no. 5, 1 septembre 1998 (1998-09-01), pages 513-538, XP000619990 ISSN: 1043-1802 *
CHOULET FREDERIC ET AL: "Evolution of the terminal regions of the streptomyces linear chromosome" MOLECULAR BIOLOGY AND EVOLUTION, vol. 23, no. 12, 1 septembre 2006 (2006-09-01), pages 2361-2369, XP002429260 ISSN: 0737-4038 *
DATABASE BIOSIS [Online] BIOSCIENCES INFORMATION SERVICE, PHILADELPHIA, PA, US; 1993, CANNELL RICHARD J P ET AL: "The squalestatins, novel inhibitors of squalene synthase produced by a species of Phoma: IV. Preparation of fluorinated squalestatins by directed biosynthesis" XP002480677 Database accession no. PREV199497029346 & JOURNAL OF ANTIBIOTICS (TOKYO), vol. 46, no. 9, 1993, pages 1381-1389, ISSN: 0021-8820 *
DATABASE BIOSIS [Online] BIOSCIENCES INFORMATION SERVICE, PHILADELPHIA, PA, US; 1994, ADAMS ERIK S ET AL: "Directed biosynthesis of 5"-fluoropactamycin in Streptomyces pactum" XP002480675 Database accession no. PREV199598118309 & JOURNAL OF ANTIBIOTICS (TOKYO), vol. 47, no. 12, 1994, pages 1456-1465, ISSN: 0021-8820 *
DATABASE BIOSIS [Online] BIOSCIENCES INFORMATION SERVICE, PHILADELPHIA, PA, US; novembre 2004 (2004-11), IGARASHI YASUHIRO ET AL: "Directed biosynthesis of fluorinated pseurotin A, synerazol and gliotoxin" XP002480673 Database accession no. PREV200500095792 & JOURNAL OF ANTIBIOTICS (TOKYO), vol. 57, no. 11, novembre 2004 (2004-11), pages 748-754, ISSN: 0021-8820 *
DATABASE EMBASE [Online] ELSEVIER SCIENCE PUBLISHERS, AMSTERDAM, NL; 2005, LI S -M ET AL: "New aminocoumarin antibiotics from genetically engineered Streptomyces strains" XP002480674 Database accession no. EMB-2005100566 & CURRENT MEDICINAL CHEMISTRY 2005 NL, vol. 12, no. 4, 2005, pages 419-427, ISSN: 0929-8673 *
DATABASE EMBL [Online] 25 avril 1997 (1997-04-25), "S.pristinaespiralis snbC gene & snbDE gene" XP002429281 extrait de EBI accession no. EMBL:Y11548 Database accession no. Y11548 *
DATABASE EMBL [Online] 28 août 2004 (2004-08-28), "Streptomyces netropsis two component response regulator-like gene, partial cds; netropsin resistance protein subunit 1 (netP1) and netropsin resistance protein subunit 2 (netP2) genes, complete cds; and acyl-CoA synthetase-like gene, partial cds." XP002429274 extrait de EBI accession no. EMBL:AY693642 Database accession no. AY693642 -& STUMPP TINA ET AL: "CLONING OF THE NETROPSIN RESISTANCE GENES FROM STREPTOMYCES FLAVOPERSICUS NRRL 2820" JOURNAL OF BASIC MICROBIOLOGY, BERLIN, DE, vol. 45, no. 5, 2005, pages 355-362, XP009081065 ISSN: 0233-111X *
DATABASE EMBL [Online] 30 août 2000 (2000-08-30), "Streptomyces verticillus bleomycin biosynthetic gene cluster, complete cds." XP002429278 extrait de EBI accession no. EMBL:AF210249 Database accession no. AF210249 -& DU L ET AL: "Identification and characterization of a type II peptidyl carrier protein from the bleomycin producer Streptomyces verticillus ATCC 15003." CHEMISTRY & BIOLOGY AUG 1999, vol. 6, no. 8, août 1999 (1999-08), pages 507-517, XP002429258 ISSN: 1074-5521 *
DATABASE EMBL [Online] 6 septembre 2001 (2001-09-06), "Sequence 35 from Patent WO0159126." XP002429275 extrait de EBI accession no. EMBL:AX211739 Database accession no. AX211739 -& WO 01/59126 A (NORGES TEKNISK NATURVITENSKAPE [NO]; STIFTELSEN IND OG TEK FORSK [NO];) 16 août 2001 (2001-08-16) *
DATABASE EMBL [Online] 7 avril 1999 (1999-04-07), "Streptomyces aureofaciens CCM3239 putative aldehyde dehydrogenase (aldA) gene, complete cds; benzylalcohol dehydrogenase homolog (adhA) gene, partial cds; and unknown gene." XP002429279 extrait de EBI accession no. EMBL:AF110772 Database accession no. AF110772 *
DATABASE EPO Proteins [Online] 29 juillet 2004 (2004-07-29), "Sequence 40 from Patent WO2004058976." XP002429280 extrait de EBI accession no. EPOP:CQ840002 Database accession no. CQ840002 *
DATABASE UniProt [Online] 1 juin 2003 (2003-06-01), "Hypothetical protein." XP002429283 extrait de EBI accession no. UNIPROT:Q82GK8 Database accession no. Q82GK8 *
DATABASE UniProt [Online] 11 octobre 2004 (2004-10-11), "Acyl-CoA synthetase-like (Fragment)." XP002429272 extrait de EBI accession no. UNIPROT:Q66LI9 Database accession no. Q66LI9 *
DATABASE UniProt [Online] 11 octobre 2004 (2004-10-11), "Netropsin resistance protein subunit 1." XP002429276 extrait de EBI accession no. UNIPROT:Q66LJ1 Database accession no. Q66LJ1 *
DATABASE UniProt [Online] 11 octobre 2004 (2004-10-11), "Netropsin resistance protein subunit 2." XP002429273 extrait de EBI accession no. UNIPROT:Q66LJ0 Database accession no. Q66LJ0 *
DATABASE UniProt [Online] 11 octobre 2004 (2004-10-11), "Two component response regulator-like (Fragment)." XP002429277 extrait de EBI accession no. UNIPROT:Q66LJ2 Database accession no. Q66LJ2 *
DATABASE UniProt [Online] 15 décembre 2003 (2003-12-15), "Hypothetical protein." XP002429282 extrait de EBI accession no. UNIPROT:Q7N0H0 Database accession no. Q7N0H0 *
DATABASE UniProt [Online] 28 novembre 2006 (2006-11-28), "Hypothetical protein." XP002480685 extrait de EBI accession no. UNIPROT:A0ADR7 Database accession no. A0ADR7 *
DATABASE UniProt [Online] 28 novembre 2006 (2006-11-28), "Hypothetical protein." XP002481037 extrait de EBI accession no. UNIPROT:A0ADQ0 Database accession no. A0ADQ0 *
DATABASE UniProt [Online] 28 novembre 2006 (2006-11-28), "Putative acyl-CoA synthetase." XP002480681 extrait de EBI accession no. UNIPROT:A0ADS3 Database accession no. A0ADS3 *
DATABASE UniProt [Online] 28 novembre 2006 (2006-11-28), "Putative aldehyde dehydrogenase." XP002480684 extrait de EBI accession no. UNIPROT:A0ADR8 Database accession no. A0ADR8 *
DATABASE UniProt [Online] 28 novembre 2006 (2006-11-28), "Putative netropsin resistance protein subunit 1." XP002480682 extrait de EBI accession no. UNIPROT:A0ADS1 Database accession no. A0ADS1 *
DATABASE UniProt [Online] 28 novembre 2006 (2006-11-28), "Putative netropsin resistance protein subunit 2." XP002480680 extrait de EBI accession no. UNIPROT:A0ADS2 Database accession no. A0ADS2 *
DATABASE UniProt [Online] 28 novembre 2006 (2006-11-28), "Putative two component response regulator-like." XP002480683 extrait de EBI accession no. UNIPROT:A0ADS0 Database accession no. A0ADS0 *
STUMPP TINA: "Spectinomycin und neptrosin: biosynthese und resistenz in den Produzentenstämmen der Gattung Streptomyces" INTERNET ARTICLE, [Online] 2003, XP002429259 2003 Extrait de l'Internet: URL:http://elib.uni-stuttgart.de/opus/volltexte/2003/1406/pdf/diss_tina_stumpp.pdf> [extrait le 2007-03-30] *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015079397A1 (fr) * 2013-11-28 2015-06-04 Piramal Enterprises Limited Composés pour le traitement de la tuberculose

Also Published As

Publication number Publication date
WO2008047006A8 (fr) 2008-11-06
FR2907465A1 (fr) 2008-04-25
WO2008047006A3 (fr) 2008-07-24
WO2008047006A9 (fr) 2009-09-03

Similar Documents

Publication Publication Date Title
Videau et al. Assessment of Anabaena sp. strain PCC 7120 as a heterologous expression host for cyanobacterial natural products: Production of lyngbyatoxin A
US20230242923A1 (en) Generation of acyl amino acids
EP2342335B1 (fr) Nouvelle groupe de gènes
Miao et al. The lipopeptide antibiotic A54145 biosynthetic gene cluster from Streptomyces fradiae
Nguyen et al. A glutamic acid 3‐methyltransferase encoded by an accessory gene locus important for daptomycin biosynthesis in Streptomyces roseosporus
Garcia‐Gonzalez et al. Elucidation of sevadicin, a novel non‐ribosomal peptide secondary metabolite produced by the honey bee pathogenic bacterium P aenibacillus larvae
JP2020000247A (ja) アシルアミノ酸の生成
Mast et al. Identification and functional characterization of phenylglycine biosynthetic genes involved in pristinamycin biosynthesis in Streptomyces pristinaespiralis
Nishizawa et al. Characterization of the locus of genes encoding enzymes producing heptadepsipeptide micropeptin in the unicellular cyanobacterium Microcystis
JP6430250B2 (ja) グリセリマイシン及びメチルグリセリマイシンの生合成のための遺伝子クラスター
EP0662134B1 (fr) Polypeptides impliques dans la biosynthese des streptogramines, sequences nucleotidiques codant pour ces polypeptides et leur utilisation
EP1523498B1 (fr) Polynucleotides et polypeptides codes par lesdits polynucleotides impliques dans la synthese de derives des dicetopiperazines
US20110030103A1 (en) Lipopeptides and lipopeptide synthetases
EP0673422B1 (fr) Cellules modifiees au niveau du catabolisme de la betaine, preparation et utilisations, notamment pour la production de metabolites ou d'enzymes
WO2008047006A2 (fr) Polynucleotides et polypeptides codes par lesdits polynucleotides impliques dans la voie de biosynthese de la congocidine et ses derives
US8188245B2 (en) Enduracidin biosynthetic gene cluster from streptomyces fungicidicus
WO2010020036A1 (fr) Absorption du fer par l’intermédiaire de sidérophore dans une infection bactérienne
JP5587763B2 (ja) 二次代謝物の製造方法
FR2739859A1 (fr) Polypeptide precurseur d'adn gyrase contenant une inteine
Spohn Exploiting gene regulation as an approach to identify, analyze and utilize the biosynthetic pathways of the glycopeptide ristomycin A and the zincophore [S, S]-EDDS in Amycolatopsis japonicum
Tan Formation and modification of enduracididine, a nonproteinogenic amino acid
Philmus Investigations into the microcystin gene cluster from Hapalosiphon hibernicus BZ-3-1 and Planktothrix agardhii CYA 126/8
JP2005508189A (ja) 新規分子

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 07866401

Country of ref document: EP

Kind code of ref document: A2

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: CONSTATATION DE LA PERTE D UN DROIT CONFORMEMENT A LA REGLE 112(1) CBE (FORM 1205A DU 21.08.2009).

122 Ep: pct application non-entry in european phase

Ref document number: 07866401

Country of ref document: EP

Kind code of ref document: A2