WO2003093461A2 - Banque genomique du cyanophage s-2l et analyse fonctionnelle - Google Patents

Banque genomique du cyanophage s-2l et analyse fonctionnelle Download PDF

Info

Publication number
WO2003093461A2
WO2003093461A2 PCT/FR2003/001328 FR0301328W WO03093461A2 WO 2003093461 A2 WO2003093461 A2 WO 2003093461A2 FR 0301328 W FR0301328 W FR 0301328W WO 03093461 A2 WO03093461 A2 WO 03093461A2
Authority
WO
WIPO (PCT)
Prior art keywords
polypeptide
nucleotide sequence
bases
sequence
seq
Prior art date
Application number
PCT/FR2003/001328
Other languages
English (en)
Other versions
WO2003093461A8 (fr
WO2003093461A3 (fr
Inventor
Philippe Marliere
Pierre-Alexandre Kaminski
Frédérique GALISSON
Madeleine Bouzon
Sylvie Pochet
Jean Weissenbach
William Saurin
Catherine Robert
Virginie Vico
Original Assignee
Institut Pasteur
Centre National De La Recherche Scientifique (Cnrs)
Genoscope -Centre National De Sequencage
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institut Pasteur, Centre National De La Recherche Scientifique (Cnrs), Genoscope -Centre National De Sequencage filed Critical Institut Pasteur
Priority to US10/510,953 priority Critical patent/US20060270005A1/en
Priority to AU2003249159A priority patent/AU2003249159A1/en
Priority to CA002483706A priority patent/CA2483706A1/fr
Priority to EP03747467A priority patent/EP1499713A2/fr
Publication of WO2003093461A2 publication Critical patent/WO2003093461A2/fr
Publication of WO2003093461A3 publication Critical patent/WO2003093461A3/fr
Publication of WO2003093461A8 publication Critical patent/WO2003093461A8/fr

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D473/00Heterocyclic compounds containing purine ring systems
    • C07D473/02Heterocyclic compounds containing purine ring systems with oxygen, sulphur, or nitrogen atoms directly attached in positions 2 and 6
    • C07D473/16Heterocyclic compounds containing purine ring systems with oxygen, sulphur, or nitrogen atoms directly attached in positions 2 and 6 two nitrogen atoms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes

Definitions

  • the subject of the present invention is the genomic sequence and nucleotide sequences coding for polypeptides of the cyanophagus S-2L.
  • the polypeptides described in the present invention are, without limitation, polypeptides involved in the synthesis, transcription and replication of purine bases.
  • the determination of the genome of cyanophagus S-2L is a useful tool for the supply of genes, which expressed in recombinant bacteria, allow the synthesis of DNA monomers incorporating the D base (2.6 diaminopurine) instead of base A (adenine) and thus produce chemically reshaped nucleic acids in bacteria.
  • the invention also relates to the use of the genomic sequence and / or the nucleotide and / or polypeptide sequences described in the present invention for the analysis of gene expression.
  • the two main nucleic acids DNA and RNA are polymers of nucleotides which are composed of a purine or pyrimidine base linked to a 5-carbon sugar (deoxyribose in the case of DNA, ribose in TARN) by an N-glycosidic bond. and a phosphate esterified to the hydroxyl group of the carbon located at the 5 ′ position of the sugar.
  • RNA and DNA contain four types of nucleotides which are distinguished by their bases: adenine (A), guanine (G), cytosine (C) and uracil (U) for RNA; 5-methyluracil, i.e. thymine (T), replacing uracil in DNA.
  • A adenine
  • G guanine
  • C cytosine
  • U uracil
  • T replacing uracil in DNA
  • Modified bases are observed in the DNA of all organisms, and may be involved in phenomena regulating gene expression (5). Except in bacteriophages, the DNA modifications known up to now are produced by post-replicative enzymatic reactions, of which a DNA duplex is the substrate. On the contrary, during infection with certain bacteriophages, the DNA modifications known up to now are produced by pre-replicative enzymatic reactions, of which a nucleotide is the substrate, to lead to a non-canonical deoxynucleoside triphosphate.
  • the entities include: dUTP, 5-hydroxymethyl-dUTP, 5-dihydroxypentyl-dUTP, 5-hydroxymethyl-dCTP. Another entity is strongly suspected: 5-methyl-dCTP (11).
  • the emergence of modified bases in bacteriophages is generally interpreted as a countermeasure to the restriction systems of bacteria (11).
  • Bromouracil or 8-azaguanine are synthetic analogs of the natural bases thymine and guanine. These analogs are converted to triphosphate nucleotides by the purine or pyrimidine backup pathways and are then incorporated into DNA.
  • 6-methyladenine and 5-methylcytosine are the most frequently encountered modified bases.
  • Methylated nucleotides are not incorporated as such into DNA but are the product of the action of specific DNA methyltransferases. These enzymes transfer the methyl group from S-adenosylmethionine to adenine or cytosine after DNA replication.
  • DNA methyltransferases transfer the methyl group from S-adenosylmethionine to adenine or cytosine after DNA replication.
  • DNA methylation influences the regulation of gene expression and cell differentiation.
  • T phages such as bacteriophage T4
  • cytosine is systematically replaced by 5-hydroxymethylcytosine. This substitution requires on the one hand a pathway for the biosynthesis of hydroxymethyldoxycytidine triphosphate (HM dCTP) as well as enzymes allowing the exclusion of the normal base.
  • HM dCTP hydroxymethyldoxycytidine triphosphate
  • the HMC DNA biosynthesis pathway involves a hydroxymethylase which converts dCMP to hydroxymethyl dCMP, a nucleoside monophosphate kinase which phosphorylates HM dCMP to give diphosphate, precursor of HM dCTP which is then incorporated into DNA polymerase then glycosylated by a gly cozy ltransferase.
  • Excluding cytosine involves endonucleases on the one hand specific for DNA containing this base and a dCDPase-dCTPase which converts the corresponding nucleotides into dCMP which is then the substrate for dCMP hydroxymethylase and dCMP deaminase.
  • DCMP deaminase generates the dUMP precursor of dTMP.
  • thymine is replaced by 5-hydroxymethyluracil (phages SPO1 and ⁇ e) or uracil (phages PBS2) in several phages of Bacillus substilis (Warren, 1980; Kornberg and Baker, 1991 ).
  • phages such as SP15 or ⁇ W14 have DNA whose thymine has been replaced by 5-dihydroxypentyluracil and -putrescinylthymine. However, this replacement is only partial and seems to be due to post-replicative modifications.
  • Cyanophagus S-2L was isolated from water samples collected in the Leningrad region. This phage is capable of lyzing a relatively small number of Synechococcus: sp. 698, 58 and PCC6907. From a morphological point of view it consists of an icosahedral head and a flexible non-contractile tail. S-2L is said to be part of a family whose other member could be phage SM-2 which is morphologically similar to it (Fox et al. 1976). The phage S-2L DNA is linear double strand with a size of 42 kb composed of
  • the invention aims in particular to sequence the genome of phage S-2L, so as to obtain a deposit of genes which, once propagated in isolation and expressed under control in recombinant bacteria, are intended in particular to form biotechnologically new monomers DNA and to produce, see replicate, chemically reshaped nucleic acids in bacteria.
  • the invention also aims to use nucleotide sequences obtained for the identification of metabolic pathways leading to the production of D bases.
  • the invention also relates to the enzymatic production of deoxynucleoside analogues which are very useful in particular in the chemotherapy of AIDS.
  • the invention also aims to express in a cyanophagous S2L host nucleic acids coding for proteins involved in the metabolism of D bases.
  • the invention also aims to obtain S-2L genes which propagated individually in E. coli and expressed under strict transcriptional control will make it possible to test the hypotheses concerning their function in the metabolism of the nucleotides, the replication and the transcription.
  • the invention relates, according to a first aspect, to a nucleotide sequence of the cyanophagus S-2L corresponding to SEQ ID No. 1.
  • the present invention also relates to a nucleotide sequence of cyanophagus S-2L chosen from: a) a nucleotide sequence comprising at least 80%, 85%, 90%, 95% or 98% identity with SEQ ID No. 1; b) a nucleotide sequence hybridizing under conditions of high stringency with SEQ ID No. 1; c) a nucleotide sequence complementary to SEQ ID
  • the present invention also relates to the nucleotide sequences characterized in that they come from SEQ ID No. 1 and in that they code for polypeptides chosen from the sequences SEQ ID No. 2 to SEQ ID No. 527 or a biologically active fragment of these polypeptides.
  • the invention also relates to the nucleotide sequences characterized in that they comprise a nucleotide sequence chosen from: a) a nucleotide sequence derived from SEQ ID No. 1 and coding for a polypeptide chosen from the sequences from SEQ ID No. 2 to SEQ ID N °
  • nucleotide sequence comprising at least 80%, 85%, 90%, 95% or 98% of identity with a nucleotide sequence according to a); c) a nucleotide sequence hybridizing under conditions of high stringency with a nucleotide sequence according to a) or b); d) a complementary nucleotide or RNA sequence corresponding to a sequence as defined in a), b) or c); e) a nucleotide sequence of a fragment representative of a sequence as defined in a), b), c) or d); and f) a modified nucleotide sequence of a sequence as defined in a), b), c), d) or e),
  • the invention relates to a nucleotide sequence characterized in that it codes for a polypeptide chosen from: a) the polypeptides of cyanophagus S-2L of sequences SEQ ID No. 2 to SEQ ID NO: a) the polypeptides of cyanophagus S-2L of sequences SEQ ID No. 2 to SEQ ID NO: a) the polypeptides of cyanophagus S-2L of sequences SEQ ID No. 2 to SEQ ID
  • polypeptides having at least 80%, preferably 85%, 90%, 95% and 98% identity with a polypeptide of a), b), c); e) the biologically active fragments of the polypeptides of a), b), c), d) f) the modified polypeptides of a), b), c), d), e).
  • the invention also relates to a nucleotide sequence characterized in that it comprises a nucleotide sequence chosen from: a) a nucleotide sequence as defined above; b) a nucleotide sequence comprising at least 80% identity with a nucleotide sequence of a); c) a nucleotide sequence hybridizing under conditions of high stringency with a nucleotide sequence of a) or b); d) a complementary nucleotide or RNA sequence corresponding to a sequence as defined in a), b) or c); e) a nucleotide sequence of a fragment representative of a sequence as defined in a), b), c) or d); and f) a nucleotide sequence modified from a sequence as defined in a), b), c), d) or e).
  • nucleic acid nucleic or nucleic acid sequence, polynucleotide, oligonucleotide, polynucleotide sequence, nucleotide sequence, terms which will be used interchangeably in the present description, is intended to denote a precise sequence of nucleotides, modified or not, making it possible to define a fragment or region of a nucleic acid, which may or may not contain unnatural nucleotides, and which may correspond to both double-stranded DNA, single-stranded DNA and transcripts of said DNAs.
  • the nucleic acid sequences according to the invention also include PNA (Peptid Nucleic Acid), or the like.
  • nucleotide sequences in their natural chromosomal environment that is to say in the natural state.
  • sequences which have been isolated and / or purified that is to say that they have been taken directly or indirectly, for example by copying, their environment having been at least partially modified.
  • This also means the nucleic acids obtained by chemical synthesis.
  • percentage of identity between two nucleic acid or amino acid sequences within the meaning of the present invention is meant a percentage of identical nucleotides or amino acid residues between the two sequences to be compared, obtained after the best alignment, this percentage being purely statistical and the differences between the two sequences being distributed at random and over their entire length.
  • the term “best alignment” or “optimal alignment” is intended to denote the alignment for which the percentage of identity determined as below is the highest. Sequence comparisons between two nucleic acid or amino acid sequences are traditionally carried out by comparing these sequences after having optimally aligned them, said comparison being carried out by segment or by "comparison window” to identify and compare the regions. sequence similarity locale.
  • the optimal alignment of the sequences for comparison can be achieved, besides manually, by means of the local homology algorithm of Smith and Waterman (1981, Ad. App. Math. 2: 482), by means of the algorithm. of local homology by Neddleman and Wunsch (1970, J. Mol. Biol. 48: 443), using the similarity search method of Pearson and Lipman (1988, Proc. Natl. Acad. Sci. USA 85: 2444 ), using computer software using these algorithms (GAP, BESTFIT, BLAST P, BLAST N, FASTA and TFASTA in the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI).
  • the BLAST program is preferably used with the BLOSUM 62 matrix.
  • the PAM or PAM250 matrices can also be used.
  • the percentage of identity between two nucleic acid or amino acid sequences is determined by comparing these two optimally aligned sequences in which the nucleic acid or amino acid sequence to be compared may include additions or deletions compared to the reference sequence for optimal alignment between these two sequences.
  • the percentage of identity is calculated by determining the number of identical positions for which the nucleotide or the amino acid residue is identical between the two sequences, by dividing this number of identical positions by the total number of positions compared and by multiplying the result obtained by 100 to obtain the percentage of identity between these two sequences.
  • nucleic acid sequences having a percentage identity of at least 80%, preferably 85% or 90%, more preferably 95% or even 98%, after optimal alignment with a reference sequence is meant the nucleic acid sequences having , with respect to the reference nucleic acid sequence, certain modifications such as in particular a deletion, a truncation, an elongation, a chimeric fusion and / or a substitution, in particular punctual, and whose nucleic sequence has at least 80%, preferably 85%, 90%, 95% or 98%, identity after optimal alignment with the reference nucleic sequence.
  • They are preferably sequences whose complementary sequences are capable of hybridizing specifically with the reference sequences.
  • the specific hybridization conditions or high stringency will be such that they ensure at least 80%, preferably 85%, 90%, 95% or 98% of identity after optimal alignment between one of the two sequences and the complementary sequence of the other.
  • Hybridization under conditions of high stringency means that the conditions of temperature and ionic strength are chosen in such a way that they allow hybridization to be maintained between two complementary DNA fragments.
  • high stringency conditions of the hybridization step for the purpose of defining the polynucleotide fragments described above are advantageously as follows.
  • DNA-DNA or DNA-RNA hybridization is carried out in two stages: (1) prehybridization at 42 ° C for 3 hours in phosphate buffer (20 mM, pH 7.5) containing 5 x SSC (1 x SSC corresponds to a 0.15 M NaCl + 0.015 M sodium citrate solution), 50% formamide, 7% sodium dodecyl sulfate (SDS), 10 x Denhardt's, 5% dextran sulfate and 1% salmon sperm DNA; (2) actual hybridization for 20 hours at a temperature depending on the size of the probe (ie: 42 ° C, for a probe of size> 100 nucleotides) followed by 2 washes of 20 minutes at 20 ° C in 2 x SSC + 2% SDS, 1 wash for 20 minutes at 20 ° C in 0.1 x SSC + 0.1% SDS.
  • the last washing is carried out in 0.1 ⁇ SSC + 0.1% SDS for 30 minutes at 60 ° C. for a probe of size> 100 nucleotides.
  • the conditions of high stringency hybridization described above for a polynucleotide of defined size can be adapted by the skilled person for oligonucleotides of larger or smaller size, according to the teaching of Sambrook et al., ( 1989, Molecular cloning: a laboratory manual. 2 nd Ed. Cold Spring Harbor).
  • fragment representative of sequences according to the invention is intended to denote any nucleotide fragment having at least 15 nucleotides, preferably at least 20, 30, 75, 150, 300 and 450 consecutive nucleotides of the sequence from which it is derived.
  • ORFs sequences ORFs for "Open Reading Frame"
  • the numbering of the nucleotide sequences ORFs which will be used subsequently in the present description corresponds to the numbering of the amino acid sequences of the proteins encoded by said ORFs.
  • nucleotide sequences ORF2, ORF3 ..., ORF526 and ORF527 respectively code for the proteins of amino acid sequences SEQ ID N ° 2, SEQ ID N ° 3 ..., SEQ ID N ° 526 and SEQ ID N ° 527 appearing in the sequence list of the present invention.
  • the detailed nucleotide sequences of the sequences ORF2, ORF3 ..., ORF526 and ORF527 are determined by their respective positions on the genomic sequence SEQ ID No. 1 of cyanophagus S2L. Table 1 provides the coordinates of 54 preferred ORFs with respect to the nucleotide sequence SEQ ID No.
  • sequence listing indicates for each of the 526 ORFs identified, numbered ORF2 to ORF527, the reading frame.
  • sequence SEQ ID No. 1 is a DNA strand in the 5 ′ -3 ′ orientation
  • sequence SEQ ID No. 2 is a protein sequence encoded by ORF No. 2.
  • a “positive” frame of +1 corresponds to the reading frame designated +1 starting at nucleotide nt 3 of SEQ ID No. 1 ( 1st codon of 1ORF2 located on this reading frame and starting at nt 9 of SEQ ID No. l: TCG which corresponds to serine S; 2 nd codon of ORF 2 according to this framework: GAG which corresponds to glutamic acid E).
  • a +2 frame corresponds to the reading frame designated +2 and starting at nucleotide nt 1 of SEQ ID No. 1 ( 1st codon of ORF
  • a +3 frame corresponds to the designated reading frame +3 starting at nucleotide nt 2 of SEQ ID No.1 ( 1st codon of ORF 5 located on this reading frame and starting at nt35 of SEQ ID No.1: CGT which corresponds to arginine R; 2 nd codon of ORF 5 according to this framework: TCA which corresponds to serine
  • ORF 2 starts at nt n ° 9 of SEQ ID n ° l (ie base T) and stops at nt n ° 515 (ie base G).
  • ORF 4 starts at nt 10 of SEQ
  • a negative frame corresponds to the complementary antiparallel strand of the positive strand.
  • the sequence on the complementary strand TAC will read CAT.
  • the complementary strand of nucleotides 782 to 791 (CCT CGA TAG) is (GGA GCT ATC) reading in the negative direction CTA TCG AGG which correspond respectively to amino acids L , S, R.
  • the representative fragments according to the invention can be obtained for example by specific amplification such as PCR or after digestion with appropriate restriction enzymes of nucleotide sequences according to the invention, this method being described in particular in work by Sambrook et al. Said representative fragments can also be obtained by chemical synthesis when their size is not too large, according to methods well known to those skilled in the art.
  • sequences containing sequences of the invention we also mean the sequences which are naturally framed by sequences which have at least 80%, 85%, 90%, 95% or 98% identity with the sequences according to the invention.
  • modified nucleotide sequence any nucleotide sequence obtained by mutagenesis according to techniques well known to those skilled in the art, and comprising modifications with respect to the normal sequences, for example mutations in the regulatory and / or promoter sequences of the expression of the polypeptide, in particular leading to a modification of the level of expression or of the activity of said polypeptide.
  • modified nucleotide sequence is also meant any nucleotide sequence coding for a modified polypeptide as defined below.
  • the present invention provides all the nucleotide and polypeptide sequences of the cyanophagous S-2L genome. Furthermore, it is an object of the present invention to disclose the functions of these genes and proteins.
  • the genes described in the invention were isolated from DNA fragments using primers deduced from the sequence of the cyanophagus S-2L.
  • the invention relates to a nucleotide sequence characterized in that it codes for a cyanophagous polypeptide S-2L or one of its representative fragments involved in the metabolism of nucleotides, purines, pyrimidines or nucleosides.
  • the term "representative agent" for a peptide means a biologically active fragment of this peptide (having an activity of at least 10, 20, 50, 100% of the activity obtained with this peptide).
  • the invention relates to a nucleotide sequence characterized in that it codes for a cyanophagous polypeptide S-2L or one of its representative fragments involved in the metabolism of base D nucleotides, in particular a peptide of sequence SEQ ID No. 175 or one of its representative fragments.
  • the invention relates to a nucleotide sequence characterized in that it codes for a cyanophagous polypeptide S-2L or one of its representative fragments involved in the replication process, in particular a peptide of sequence SEQ ID No. 14,18,142,355,429,454 or one of their representative fragments.
  • the invention relates to a nucleotide sequence characterized in that it codes for an envelope polypeptide, in particular of capsid, of cyanophagus S-2L or one of its representative fragments, in particular a peptide of sequence SEQ ID No. 169,316,351,392,395,406,422,425 or one of their representative fragments.
  • the invention relates to a nucleotide sequence according to the invention characterized in that it codes for a cyanophagous polypeptide S-2L or one of its fragments involved in the diversion of cellular machinery.
  • the invention relates to a nucleotide sequence according to the invention characterized in that it codes for a cyanophagous polypeptide S-2L or one of its representative fragments involved in the transcription process, in particular a peptide of sequence SEQ ID N ° 92,143, 187,234 or one of their representative fragments.
  • the invention relates to a nucleotide sequence according to the invention characterized in that it codes for a cyanophagous polypeptide S-2L or one of its representative fragments involved in the viral virulence process, in particular a peptide of sequence SEQ ID No. 257 or a representative fragment.
  • the invention relates to a nucleotide sequence according to the invention characterized in that it codes for a cyanophagous polypeptide S-2L or one of its representative fragments involved in the functions relating to transposons in particular a peptide of sequence SEQ ID N ° 208 or one of its representative fragments.
  • the representative fragments of nucleotide sequences according to the invention can also be probes or primers, which can be used in methods of detection, identification, assay or amplification of nucleic sequences.
  • a probe or primer is defined, within the meaning of the invention, as being a fragment of single-stranded nucleic acids or a denatured double-stranded fragment comprising for example from 12 bases to a few kb, in particular from 15 to a few hundred bases, preferably from 15 to 50 or 100 bases, and having a specificity of hybridization under determined conditions to form a hybridization complex with a target nucleic acid.
  • the probes and primers according to the invention can be labeled directly or indirectly with a radioactive or non-radioactive compound by methods well known to those skilled in the art, in order to obtain a detectable and / or quantifiable signal.
  • the unlabeled polynucleotide sequences according to the invention can be used directly as a probe or primer.
  • sequences are generally marked to obtain sequences which can be used for numerous applications.
  • the labeling of the primers or probes according to the invention is carried out with radioactive elements or with non-radioactive molecules.
  • Non-radioactive entities are selected from ligands such as biotin, avidin, streptavidin, dioxygenin, haptens, dyes, luminescent agents such as radioluminescent, chemoluminescent, bioluminescent, fluorescent, phosphorescent agents.
  • the polynucleotides according to the invention can thus be used as a primer and / or probe in methods using in particular the PCR technique (polymerase chain reaction) (Rolfs et al., 1991, Berlin: Springer-Nerlag).
  • This technique requires the choice of pairs of oligonucleotide primers framing the fragment which must be amplified.
  • the amplified fragments can be identified, for example after agarose or polyacrylamide gel electrophoresis, or after a chromatographic technique such as gel filtration or ion exchange chromatography, and then sequenced.
  • the specificity of the amplification can be controlled by using, as primer, the nucleotide sequences of polynucleotides of the invention as template, plasmids containing these sequences or else the derived amplification products.
  • the amplified nucleotide fragments can be used as reagents in hybridization reactions in order to demonstrate the presence, in a biological sample, of a target nucleic acid of sequence complementary to that of said amplified nucleotide fragments.
  • the invention also relates to the nucleic acids capable of being obtained by amplification using primers according to the invention.
  • Other techniques for amplifying the target nucleic acid can advantageously be used as an alternative to PCR (PCR-like) using pairs of primers of nucleotide sequences according to the invention.
  • PCR-like we mean designate all the methods using direct or indirect reproductions of the nucleic acid sequences, or in which the labeling systems have been amplified, these techniques are of course known, in general it is the amplification of the DNA by a polymerase; when the original sample is an RNA, a reverse transcription should be carried out beforehand.
  • the target polynucleotide to be detected is an mRNA
  • an enzyme of reverse transcriptase type in order to obtain a cDNA from the mRNA contained in the biological sample.
  • the cDNA obtained will then serve as a target for the primers or probes used in the amplification or detection method according to the invention.
  • the probe hybridization technique can be carried out in various ways (Matthews et al, 1988, Anal. Biochem., 169, 1-25).
  • the most general method consists in immobilizing the nucleic acid extracted from cells of different tissues or cells in culture on a support (such as nitrocellulose, nylon, polystyrene) and incubating, under well defined conditions, the target nucleic acid immobilized with the probe. After hybridization, the excess probe is eliminated and the hybrid molecules formed are detected by an appropriate method (measurement of radioactivity, fluorescence or enzymatic activity linked to the probe).
  • the latter can be used as capture probes.
  • a probe called a “capture probe”
  • a probe is immobilized on a support and is used to capture by specific hybridization the target nucleic acid obtained from the biological sample to be tested and the target nucleic acid is then detected.
  • a second probe called a “detection probe”, marked by an easily detectable element.
  • the antisense oligonucleotides that is to say those whose structure ensures, by hybridization with the target sequence, an inhibition of the expression of the corresponding product. Mention should also be made of sense oligonucleotides which, by interaction with proteins involved in the regulation of the expression of the corresponding product, will induce either an inhibition or an activation of this expression.
  • the probes or primers according to the invention are immobilized on a support, covalently or non-covalently.
  • the support can be a DNA chip or a high density filter, also objects of the present invention.
  • the term “DNA chip or high density filter” is intended to denote a support on which DNA sequences are fixed, each of which can be identified by its geographic location. These chips or filters differ mainly in their size, the material of the support, and possibly the number of DNA sequences attached to them.
  • the probes or primers according to the present invention can be fixed on solid supports, in particular DNA chips, by various manufacturing methods. In particular, a synthesis can be carried out in situ by photochemical addressing or by ink jet. Other techniques consist in carrying out an ex situ synthesis and in fixing the probes on the support of the DNA chip by mechanical, electronic or inkjet addressing. These different methods are known to those skilled in the art.
  • a nucleotide sequence (probe or primer) according to the invention therefore allows detection and / or amplification of specific nucleic acid sequences.
  • the detection of these said sequences is facilitated when the probe is fixed to a DNA chip, or to a high density filter.
  • DNA chips or high density filters indeed makes it possible to determine the expression of genes in an organism having a genomic sequence close to the cyanophagus S-2L.
  • the genomic sequence of cyanophagus S-2L serves as the basis for the construction of these DNA chips or filter.
  • the preparation of these filters or chips consists in synthesizing oligonucleotides, corresponding to the 5 'and 3' ends of the genes. These oligonucleotides are chosen using the genomic sequence and its annotations disclosed by the present invention.
  • the pairing temperature of these oligonucleotides at the corresponding places on the DNA must be approximately the same for each oligonucleotide. This makes it possible to prepare DNA fragments corresponding to each gene by the use of appropriate PCR conditions in a highly automated environment.
  • the amplified fragments are then immobilized on filters or supports in glass, silicon or synthetic polymers and these media are used for hybridization.
  • filters and / or chips and of the corresponding annotated genomic sequence makes it possible to study the expression of large sets, or even of all the genes in viruses close to the cyanophagus S-2L, by preparing the complementary DNAs, and by hybridizing them to DNA or to oligonucleotides immobilized on filters or chips. Also, the filters and / or the chips make it possible to study the variability of the strains by preparing the DNA of these viruses and by hybridizing them to the DNA or to the oligonucleotides immobilized on the filters or the chips.
  • the differences between the genomic sequences of the different strains or species can greatly affect the intensity of hybridization and, therefore, disturb the interpretation of the results. It may therefore be necessary to have the precise sequence of the genes of the strain that one wishes to study.
  • the use of high density filters and / or microchips provides new knowledge on the regulation of genes in organisms of industrial importance, and in particular recombinant bacteria incorporating genes from cyanophagus S-2L propagated under various conditions. It also allows rapid identification of the differences between the genomes of the strains used in multiple industrial applications.
  • DNA chips or filters according to the invention containing probes or primers specific for cyanophagus S-2L, are very advantageous elements of kits or necessary for the detection and / or quantification of the expression of genes of cyanophagus S-2L in recombinant bacteria integrating these genes.
  • the control of gene expression is a critical point for the metabolic pathways of cyanophagus S-2L, either by allowing the expression of one or more new genes, or by modifying the expression of genes already present in the cell.
  • the present invention provides all the naturally active sequences in cyanophagus S-2L allowing gene expression. It thus allows the determination of all the sequences expressed in cyanophagus S-2L. It also provides a tool for identifying genes whose expression follows a given pattern. To achieve this, the DNA of all or part of the genes of cyanophagus S-2L can be amplified using primers according to the invention, then fixed to a support such as for example glass or nylon or a DNA chip, in order to build a tool to monitor the expression profile of these genes.
  • This tool consisting of this support containing the coding sequences, serves as a hybridization matrix for a mixture of labeled molecules reflecting the messenger RNAs expressed in the cell (in particular the labeled probes according to the invention).
  • each control sequence present upstream of the segments serving as probes and to monitor their activity using an appropriate means such as a reporter gene (luciferase, ⁇ -galactosidase, GFP).
  • a reporter gene luciferase, ⁇ -galactosidase, GFP.
  • These isolated sequences can then be modified and assembled by metabolic engineering with sequences of interest with a view to their optimal expression.
  • the present invention gives the list of genes coding or capable of coding for proteins regulating the transcription of the genes of cyanophagus S-2L. Altering the structure or integrity of these genes could allow the expression of target genes controlled by target promoters of these regulators to be modified.
  • the indications given also allow those skilled in the art to choose the regulator or regulators relevant to the desired application as well as their target, which allows the optimization of the expression of genes of interest.
  • the invention relates to polypeptides comprising: a) a polypeptide coded by a nucleotide sequence according to the invention as defined above, in particular a polypeptide coded by an ORF; b) a polypeptide having at least 80%, preferably 85%, 90%, 95
  • the invention preferably relates to: a) the polypeptides of cyanophagus S-2L of sequences SEQ ID No. 2 to SEQ ID No. 527, coded respectively by ORFs 2 to 527, b) the 54 polypeptides mentioned in Table 1 ( SEQ ID N ° 14,18,26,68,86,92,105,109,134,142,143,148,152,169,175,187,
  • the invention also relates to: d) polypeptides having at least 80%, preferably 85%, 90%, 95% and
  • the invention obviously relates very especially to the polypeptides involved in the biosynthesis of D bases and metabolic intermediates of this biosynthesis, in particular the peptide of sequence SEQ ID No. 175 with succidinylate synthetase activity.
  • the phages for which the modifications are pre-replicative which is probably the case of cyanophages S-2L, have the protein coding sequences necessary for the biosynthesis of the modified bases, in the present case of the D bases.
  • the polymerase enzymes in particular DNA polymerases, must be able to have base D specifically as a substrate instead of base A.
  • the DNA polymerase of cyanophagus S-2L is thus capable of discriminate dDTP from dATP. Likewise, transcription depends on a specific RNA polymerase and / or on a specific sigma factor.
  • the invention therefore relates, according to a preferred embodiment, to the specific polypeptides with DNA polymerase, RNA polymerase activity and associated factors, in particular the peptides of sequence SEQ ID No. 92 and SEQ ID No. 234 which have specific activities of transcription of DNA comprising bases D.
  • polypeptides polypeptide sequences, peptides and proteins are interchangeable. It should be understood that the invention does not relate to polypeptides in natural form, that is to say that they are not taken in their natural environment but that they could have been isolated or obtained by purification from natural sources, or obtained by genetic recombination, or by chemical synthesis, and that they can then contain non-natural amino acids as will be described later.
  • polypeptide having a certain percentage of identity with another which will also be designated by homologous polypeptide, is meant to designate the polypeptides exhibiting, relative to the natural polypeptides, certain modifications, in particular a deletion, addition or substitution of at least one amino acid, a truncation, an elongation, a chimeric solution and / or a mutation, or the polypeptides exhibiting post- translational.
  • homologous polypeptides those whose amino acid sequence have at least 80%, preferably 85%, 90%, 95% and 98% of homology with the amino acid sequences of the polypeptides according to the invention are preferred. .
  • equivalent amino acids aims here to designate any amino acid capable of being substituted for one of the amino acids of the basic structure without however essentially modifying the biological activities of the corresponding peptides and as they will be defined by the following.
  • Leucine can thus be replaced by valine or isoleucine, aspartic acid by glutamine acid, glutamine by asparagine, arginine by lysine, etc. reverse substitutions being naturally possible in the same conditions.
  • the homologous polypeptides also correspond to the polypeptides encoded by the homologous or identical nucleotide sequences, as defined above and thus include, in the present definition, polypeptides which are mutated or correspond to inter or intra species variations, which may exist in the cyanophagus S-2L, and which correspond in particular to truncations, substitutions, deletions and / or additions, of at least one amino acid residue. It is understood that the percentage of identity between two polypeptides is calculated in the same way as between two nucleic acid sequences. Thus, the percentage of identity between two polypeptides is calculated after alignment optimal of these two sequences, on a window of maximum homology. To define said maximum homology window, the same algorithms can be used as for the nucleic acid sequences.
  • biologically active fragment of a polypeptide according to the invention is intended to denote in particular a fragment of polypeptide comprising at least 5 amino acids, preferably at least 7, 10, 15, 25, 50, 75, 100,150, 200, 250 , 300 amino acids, having at least one of the biological characteristics of the polypeptides according to the invention, in particular in that it is capable of generally exercising even partial activity, such as for example: - enzymatic (metabolic) activity or an activity which may be involved in the biosynthesis or biodegradation of organic or inorganic compounds;
  • Polypeptide fragments can also be prepared by chemical synthesis, from hosts transformed by an expression vector according to the invention which contain a nucleic acid allowing the expression of said fragment, and placed under the control of regulatory elements and / or appropriate expression.
  • modified polypeptide of a polypeptide according to the invention is intended to denote a polypeptide obtained by genetic recombination or by chemical synthesis as described below, which exhibits at least one modification with respect to the normal sequence. These modifications can be carried in particular on amino acids necessary for the specificity or the efficiency of the activity, or at the origin of the structural conformation, of the charge, or of the hydrophobicity of the polypeptide according to the invention. It is thus possible to create polypeptides of equivalent, increased or decreased activity, or of equivalent specificity, narrower or wider.
  • modified polypeptides mention should be made of the polypeptides in which up to five amino acids can be modified, truncated at the N or C-terminus, or else deleted, or added.
  • modifications of a polypeptide are aimed in particular: - to allow its implementation in processes of biosynthesis or biodegradation of organic or inorganic compounds,
  • Chemical synthesis also has the advantage of being able to use unnatural amino acids or non-peptide bonds. Thus, it may be advantageous to use unnatural amino acids, for example in D form, or analogs of amino acids, in particular suffering forms.
  • the invention relates to a polypeptide according to the invention, characterized in that it is a cyanophagous polypeptide S-2L or one of its representative fragments involved in the metabolism of nucleotides, purines, pyrimidines or nucleosides.
  • the invention relates to a polypeptide according to the invention, characterized in that it is a cyanophagous polypeptide S-2L or one of its representative fragments involved in the replication process, and in that it is chosen from the polypeptides of sequence SEQ ID No. 14,18,142,355,429,454 and one of their fragments.
  • the invention very advantageously relates to cyanophagous S2L polypeptides of at least 7 amino acids and having adenylosuccinate activity synthetase.
  • such fragments comprise the motif GSTGKG.
  • the inventors have indeed identified consensus sites, in particular the phosphate and IMP binding site zones. .
  • the invention relates to a polypeptide according to the invention, characterized in that it is a cyanophagous polypeptide S-2L or one of its fragments involved in the process of transcription, and in that it is chosen from the polypeptides of sequence SEQ ID No. 92,143,187 and one of their representative fragments.
  • the invention relates to a polypeptide according to the invention, characterized in that it is a cyanophagous envelope polypeptide S-2L or one of its fragments, and in that it is chosen from the polypeptides corresponding to ORF169,316,351,392,395,406,422,425 and one of their representative fragments.
  • the invention relates to a polypeptide according to the invention, characterized in that it is a cyanophagous polypeptide S-2L or one of its representative fragments involved in the hijacking of cellular machinery or in intermediate metabolism.
  • the invention relates to a polypeptide according to the invention, characterized in that it is a cyanophagous polypeptide S-2L or one of its representative fragments involved in the virulence process, in particular the polypeptide of sequence SEQ ID No. 247 and one of its representative fragments.
  • the invention relates to a polypeptide according to the invention, characterized in that it is a polypeptide of cyanophagus S-2L or one of its fragments involved in the functions relating to transposons, in particular the polypeptide of sequence SEQ ID No. 208 and one of its representative fragments.
  • a subject of the present invention is also the nucleotide and / or polypeptide sequences according to the invention, characterized in that said sequences are recorded on a recording medium the shape and nature of which facilitate reading, analysis and / or the exploitation of said sequence (s).
  • These supports can also contain other information extracted from the present invention, in particular analogies with already known sequences, as mentioned in Table 1 and / or information concerning the nucleotide sequences and / or polypeptides of other microorganisms in order to facilitate comparative analysis and use of the results obtained.
  • recording media particular preference is given to media readable by a computer, such as magnetic, optical, electrical or hybrid media, in particular computer floppy disks, CD-ROMs, computer servers. Such recording media are also subject of the invention.
  • the recording media according to the invention are very useful for the choice of primers or nucleotide probes for the determination of genes in the cyanophagus S-2L or strains close to this organism.
  • the use of these supports for the study of the genetic polymorphism of strain close to the cyanophagus S-2L, in particular by the determination of the regions of collinearity is very useful insofar as these supports provide not only the sequence nucleotide of the cyanophagous S-2L genome, but also the genomic organization in said sequence.
  • the uses of recording media according to the invention are also objects of the invention.
  • a method of studying the genetic polymorphism between strains close to the cyanophagus S-2L, by determining the regions of collinearity can comprise the steps of
  • sequence comparison software such as the Blast software, or the software of the GCG kit, described above.
  • the invention also relates to a nucleotide sequence as described above, immobilized on a support, covalently or non-covalently, in particular a high density filter or a DNA chip.
  • the invention also relates to a nucleotide sequence as described above for the detection and / or amplification of nucleic sequences.
  • such a detection and amplification method comprises for example the following steps: a) optionally, isolation of the DNA from the biological sample to be analyzed, or obtaining a cDNA from the RNA biological sample; b) specific amplification of the DNA of cyanophages S-2L using at least one primer according to the invention; c) highlighting of the amplification products.
  • This process is based on specific amplification of DNA, in particular by an amplification chain reaction.
  • a method is also preferred comprising the following steps: a) bringing a nucleotide probe according to the invention into contact with a biological sample, the nucleic acid contained in the biological sample having, if necessary, previously been made accessible to hybridization, under conditions allowing hybridization of the probe to the nucleic acid of cyanophagus S-2L; b) demonstration of the hybrid possibly formed between the nucleotide probe and the DNA of the biological sample.
  • a method should not be limited to the detection of the presence of the DNA contained in the certified biological sample, it can also be implemented to detect the RNA contained in said sample. This process includes in particular the Southern and Northern blot.
  • the present invention also includes a kit or kit for the detection and / or identification of cyanophagus S-2L, characterized in that it comprises the following elements: a) a nucleotide probe according to the invention; b) optionally, the reagents necessary for carrying out a hybridization reaction; c) optionally, at least one primer according to the invention as well as the reagents necessary for a DNA amplification reaction.
  • kits or kits for the detection and / or identification of cyanophagus S-2L comprising the following elements: a) a nucleotide probe, called capture probe, according to the invention; b) an oligonucleotide probe, called the revelation probe, according to the invention; c) optionally, at least one primer according to the invention as well as the reagents necessary for a DNA amplification reaction.
  • the invention also relates to the cloning and / or expression vectors, which contain a nucleotide sequence according to the invention. Particularly preferred are the nucleotide sequences encoding polypeptides involved in nucleotide metabolism, purines, pyrimidines or nucleosides.
  • the vectors according to the invention preferably comprise elements which allow the expression and / or the secretion of the nucleotide sequences in a determined host cell.
  • the vector must then include a promoter, initiation signals and translation termination, as well as appropriate regions for transcription regulation. It must be able to be maintained stably in the host cell and may possibly have specific signals which specify the secretion of the translated protein. These various elements are chosen and optimized by a person skilled in the art according to the cell host used. To this end, the nucleotide sequences according to the invention can be inserted into vectors with autonomous replication within the chosen host, or can be vectors integrating with the chosen host.
  • Such vectors are prepared by methods commonly used by those skilled in the art, and the resulting clones can be introduced into an appropriate host by standard methods, such as lipofection, electroporation, heat shock, or chemical methods .
  • the vectors according to the invention are for example vectors of plasmid or viral origin. They are useful for transforming host cells in order to clone or express the nucleotide sequences according to the invention.
  • the cyanophagus S-2L itself can be used directly as a vector.
  • the invention also includes host cells transformed with a vector according to the invention.
  • the cell host can be chosen from prokaryotic or eukaryotic systems, for example bacterial cells but also yeast cells or animal cells, in particular mammalian cells. You can also use insect cells or plant cells.
  • the preferred host cells according to the invention are in particular prokaryotic cells.
  • the cells transformed according to the invention can be used in processes for the preparation of recombinant polypeptides according to the invention.
  • the processes for preparing a polypeptide of interest according to the invention in recombinant form, outside the natural environment, characterized in that they use a vector and / or a cell transformed with a vector according to the invention are themselves included in the present invention.
  • the use of cyanophagus S-2L for the production of such peptides therefore also forms part of the invention.
  • a cell transformed with a vector according to the invention is cultivated under conditions which allow the expression of said polypeptide. of interest and said recombinant peptide is recovered.
  • the host cells according to the invention can also be used for the preparation of food compositions, which are themselves subject of the present invention.
  • Such a process for obtaining proteins of interest from the cyanophagus S-2L comprises the insertion of genes of interest from the genome of the phage S-2L, typically by ligation, into cloning and expression vectors , under conditions allowing their expression by the taking over by the replication machinery of a host organism such as E. coli, and the extraction of the proteins produced.
  • Hereditary folding messages copied in the form of canonical DNA are able to express themselves as cyanobacteria genes.
  • the messenger RNAs issued after rewriting S-2L DNA in E. coli are translated into proteins identical to those produced during infection of Synechococcus with S-2L.
  • polypeptides of interest are proteins involved in the metabolism of D bases, in particular succinyladenylate synthetase.
  • D base is probably formed by pre-replicative modification and that cellular genes have been recruited for this purpose, two biosynthetic pathways appearing to form dDTP from a deoxynucleotide. canonical, either dAMP or dGMP.
  • the activated monomer dATP is immediately hydrolyzed into dAMP by an enzyme of the type coded by dut in E. coli (9) or of the product of the mutT (9) gene, which has has the double effect of blocking the access of dATP to DNA synthesis and of providing the precursor of DMP. Its biosynthesis takes place according to the two successive reactions converting IMP to GMP in cellular metabolism (9); the nucleotide is finally activated in dDTP in two stages of phosphorylation.
  • dDMP is obtained by applying to dGMP the two reactions converting in IMP cells to AMP (9). If it also takes dATP as a precursor, this second path is longer because dGMP must first be synthesized in dIMP life. Throughout this second pathway, three specific and mutagenic dNTPs are formed (dIMP, dXMP and dSMP), against a single (diGMP) in the first ( Figure 2a).
  • the polypeptides of interest are cyanophagous polymerases S-2L, capable of polymerizing D bases, which allows the propagation of nucleic acids incorporating D bases in vitro and in vivo.
  • DNA polymerases specialized in high stability duplexes which are incapable of replicating dA taken as a constituent of the matrix or as a triphosphate monomer.
  • These DNA polymerases will typically be obtained by a process comprising a step of expression, outside the natural environment, of the gene for said DNA polymerase in recombinant bacteria.
  • the polypeptides of interest are polypeptides capable of modifying the transcription of the DNA of host cells of the cyanophagus S-2L.
  • T4 alter the RNA polymerase of E. coli.
  • S-2L deviates from the consensus known to those skilled in the art (TATA box in particular). It is likely that transcription initiation factors (sigma or other) are coded or modified by the phage, or even that they are embedded in the capsid to allow the initiation of the viral program. Be that as it may, the sequencing carried out by the inventors makes it possible to identify without excessive effort certain genes of S-2L responsible for the control of transcription by chemical alteration of the DNA.
  • the cell host can be chosen from prokaryotic or eukaryotic systems.
  • a vector according to the invention carrying such a sequence can therefore be advantageously used for the production of recombinant proteins, intended to be secreted. Indeed, the purification of these recombinant proteins of interest will be facilitated by the fact that they are present in the supernatant of the cell culture rather than inside the host cells.
  • the polypeptides according to the invention can also be prepared by chemical synthesis. Such a preparation process is also an object of the invention.
  • a person skilled in the art knows the chemical synthesis processes, for example the techniques implementing solid phases (see in particular Steward et al., 1984, Solid phase peptides synthesis, Pierce Chem. Company, Rockford, 111, 2nd ed., (1984)) or techniques using partial solid phases, by condensation of fragments or by synthesis in conventional solution.
  • the polypeptides obtained by chemical synthesis and which may contain corresponding unnatural amino acids are also included in the invention.
  • the invention also includes the hybrid polypeptides which comprise at least the sequence of a polypeptide according to the invention, and the sequence of a polypeptide capable of inducing an immune response in humans or animals.
  • the invention also includes the nucleotide sequences which code for such hybrid polypeptides, or the vectors which contain these nucleotide sequences.
  • This coupling between a polypeptide according to the invention and an immunogenic polypeptide of interest can be carried out chemically, or biologically.
  • the bifunctional reagents allowing this coupling are determined as a function of the end chosen to achieve this coupling, and the coupling techniques are well known to those skilled in the art.
  • the conjugates resulting from a coupling of peptides can also be prepared by genetic recombination.
  • the hybrid (conjugated) peptide can in fact be produced by recombinant DNA techniques, by insertion or addition to the DNA sequence coding for the polypeptide according to the invention, of a sequence coding for the peptide (s) ) antigen (s), immunogenogen (s) or hapten (s).
  • said immune polypeptide is chosen from the group of peptides containing toxoids, in particular the diphtheria toxoid or the tetanus toxoid, proteins derived from Streptococcus (such as the protein for binding to human seralbumin), OMPA membrane proteins and complexes. proteins from external membranes, vesicles from external membranes or thermal shock proteins.
  • nucleotide and vector sequences coding for a hybrid polypeptide according to the invention are also subject of the invention.
  • hybrid polypeptides according to the invention are very useful for obtaining monoclonal or polyclonal antibodies capable of specifically recognizing the polypeptides according to the invention. Indeed, a hybrid polypeptide according to the invention allows the potentiation of the immune response, against the polypeptide according to the invention coupled to the immunogenic molecule. Such monoclonal or polyclonal antibodies, their fragments, or chimeric antibodies, recognizing the polypeptides according to the invention, are also objects of the invention.
  • the specific monoclonal antibodies can be obtained according to the conventional method of hybridoma culture described by Kohler and Milstein (1975, Nature 256, 495).
  • the antibodies according to the invention are, for example, chimeric antibodies, humanized antibodies, Fab fragments, or F (ab ') 2 . It can also be in the form of an immunoconjugate or of labeled antibodies in order to obtain a detectable and / or quantifiable signal.
  • the antibodies according to the present invention are in particular usable in order to detect an expression of a cyanophagous gene S-2L.
  • the presence of the expression product of a gene recognized by an antibody specific for said expression product can be detected by the presence of an antigen-antibody complex formed after contacting a recombinant bacterium expressing a d gene. given interest of cyanophagus S-2L with an antibody according to the invention.
  • the bacterial strain used may have been "prepared", that is to say centrifuged, lysed, placed in a reagent suitable for constituting the medium suitable for the immunological reaction.
  • a method of detecting the expression of a gene, corresponding to a Western blot which can be carried out after a polyacrylamide gel electrophoresis of a lysate of the bacterial strain, in the presence or in the absence of reducing conditions (SDS-PAGE). After migration and separation of the proteins on the polyacrylamide gel, said proteins are transferred to an appropriate membrane (for example made of nylon) and the presence of the protein or polypeptide of interest is detected, by bringing said membrane into contact with a antibody according to the invention.
  • an appropriate membrane for example made of nylon
  • polypeptides and antibodies according to the invention can advantageously be immobilized on a support, in particular a protein chip.
  • a protein chip is an object of the invention, and may also contain at least one polypeptide from a microorganism other than cyanophagus S-2L or an antibody directed against a compound of a microorganism other than cyanophagus S-2L.
  • the protein chips or high density filters containing proteins according to the invention can be constructed in the same way as the DNA chips according to the invention.
  • the latter method is preferable, when it is desired to attach proteins of large size to the support, which are advantageously prepared by genetic engineering.
  • an antibody according to the invention is fixed on the support of the protein chip, and the presence of the corresponding antigen, specific for Cyanophage S-2L or an associated microorganism, is detected.
  • a protein chip described above can be used for the detection of gene products, to establish an expression profile of said genes, in addition to a DNA chip according to the invention.
  • the protein chips according to the invention are also extremely useful for proteomics experiments, which studies the interactions between the different proteins of a given microorganism.
  • proteomics experiments which studies the interactions between the different proteins of a given microorganism.
  • peptides representative of the various proteins of an organism are fixed on a support. Then, said support is brought into contact with labeled proteins, and after an optional rinsing step, interactions between said labeled proteins and the peptides attached to the protein chip.
  • protein chips comprising a polypeptide sequence according to the invention or an antibody according to the invention are subject of the invention, as well as the kits or kits containing them.
  • the primers and / or probes and / or polypeptides and / or antibodies according to the present invention used in the methods according to the present invention are chosen from primers and / or probes and / or polypeptides and / or antibodies specific for Cyanophage S -2L
  • the present invention also relates to the strains of Cyanophage S-2L and / or associated microorganisms containing one or more mutation (s) in a nucleotide sequence according to the invention, in particular an ORF sequence, or their regulatory elements (in particular promoters).
  • strains of Cyanophage S-2L having one or more mutation (s) in the nucleotide sequences coding for polypeptides involved in the metabolism of D bases, replication and transcription are preferred, according to the present invention.
  • Said mutations can lead to inactivation of the gene, or in particular when they are located in the regulatory elements of said gene, to overexpression of the latter.
  • strains of Cyanophage S-2L overexpressing a polypeptide according to the invention involved in the functions relating to the synthesis of bases D or of polynucleotides incorporating at least one base D.
  • the invention also relates to the use of the polypeptide sequences as described above for the production of bases D and or of polynucleotide sequences comprising bases D.
  • These polynucleotide sequences will in particular be DNA or RNA sequences, in particular mRNA.
  • the invention relates to a method for obtaining bases D and / or polynucleotides of interest comprising at least one base D, said method comprising the culture of a microorganism containing at least one nucleotide sequence of cyanophagus S- 2L coding for at least one polypeptide involved in the synthesis of bases D, under conditions suitable for the development of the vector and the synthesis of bases D.
  • the cultivated microorganism comprises a vector as described previously containing the said nucleotide sequence (s) of cyanophagus S-2L coding.
  • such a method comprises:
  • such a method comprises:
  • restriction enzymes whose restriction sites do not have an A base, in particular Smal (site CCCGGG), SacII (site CCGCGG), Mspl (CCGG site), BspRI (GGCC site).
  • restriction enzymes comprising at least one base A do not hydrolyze the DNA of S-2L: BamHI (GCATCC), EcoRI (GAATTC), HindIII (AAGCTT), Sau3AI (GATC).
  • the invention relates to a process for obtaining bases D and / or polynucleotides of interest comprising at least one base D, said process comprising:
  • the invention relates to a process for obtaining polynucleotides of interest comprising at least one base D, said process comprising the culture of a microorganism containing at least one nucleotide sequence of cyanophagus S-2L coding for at least one polypeptide involved in the elongation of said polynucleotides with incorporation of bases D, DNA polymerase in particular, under conditions suitable for the development of the vector and the elongation of said polynucleotides.
  • the invention relates to the use of the cyanophagus S-2L for the production of reagents useful for PCR or PCR Like reactions involving D bases.
  • these reagents will be dDTP monomers.
  • the dDTP monomer is a good substrate for the DNA polymerases of cyanophagus S-2L, and matrices comprising the base D are effectively replicated (1).
  • the biotechnological production of dD, dDMP and dDTP thus applies to PCR techniques, by increasing the thermal stability of duplexes, or by masking and unmasking numerous restriction sites (10). It is understood that this production is not production in the natural environment, production in the natural environment signifying production by the cyanophagus S-2L itself.
  • the invention also relates to a method for producing polynucleotides of interest comprising at least one base D, said method comprising a step of amplification, in the presence of cyanophagous polymerase D and suitable primers, of polynucleotides comprising at least one base D. Thanks to this method, according to a technique of PCR or PCR like type, from a polynucleotide of interest comprising at least one base D of known sequence, a large number of copies of this nucleotide are obtained.
  • the gene involved in the synthesis of polynucleotides of interest comprising at least one base D is the gene for succinyladenylate synthetase.
  • succinyladenylate synthetase catalyzes the reaction of dGMP to dSMP itself transformed into dDMP ( Figure 2).
  • the polynucleotides of interest are nucleosides of therapeutic interest.
  • the polynucleotides of interest are produced by hemisynthesis or by fermentation.
  • the invention further relates to a method for selecting compounds capable of stimulating or inhibiting the synthesis of bases D and / or of polynucleotides of interest incorporating at least one base D, comprising the addition to the synthesis medium of the compound tested and comparing the synthesis in the presence and absence of said compound.
  • the invention relates to the use of the cyanophagous nucleotide sequences S-2L as described above for testing their function in the metabolism of nucleotides, purines, pyrimidines or nucleosides, replication and transcription.
  • the invention relates to the use of the cyanophagus S-2L for the determination of genes making it possible to repair the G: T or iG: T mismatches occurring by deamination.
  • base D itself is known as a mutagen in E. coli.
  • iG isoguanine
  • M. Bouzon, P. Marlière, unpublished results isoguanine
  • Deamination of D at position 6 leads to guanine. That this last deamination reaction occurs after incorporation of D into DNA, it will result in a mutation in the next replication cycle. Thanks to the sequencing performed, the identification of genes capable of repairing G: T or iG: T mismatches occurring by deamination is now possible.
  • the invention relates to the use of the cyanophagus S-2L for the identification of genes and the production of proteins capable of regenerating 5'-termini.
  • the replication of cyanophagous DNA whose stability is high (7,8), could moreover require tailor-made auxiliary proteins (helicase, S SB).
  • the genome is made up of a linear duplex, which supposes a 5'-termini regeneration machinery, like the endonuclease used to resolve concatemers in T7 (4), or the 5 'adduction protein in phi29 ( 6), whose activity may require the presence of D in their substrates.
  • the invention relates to the use of the cyanophagus S-2L for the identification of genes capable of modulating the activity of ribosomes
  • the cyanophagus S-2L is moreover capable of forming a ribonucleotide precursor carrying the base D, to then reduce it to a corresponding deoxyribonucleotide, as happens with the four bases of the RNA (9).
  • the transcription and translation of the phage genes could be carried out via the use of codons, or even tRNAs as in T4 and T5, comprising this base. If such an option was taken by the phage, it is possible that some of its genes modulate the activity of ribosomes.
  • the invention relates to the use of the cyanophagus S-2L for the identification or the production of compounds which inhibit the biosynthesis of purine nucleotides.
  • phage genomes specify a whole range of inhibitors targeting cellular enzymes such as thymidylate synthase, dUTPase, etc. (11).
  • S-2L the inventors can now identify inhibitors capable of affecting the biosynthesis of purine nucleotides.
  • the invention thus also relates to a method using such inhibitors to control the metabolism or the genetic expression of cells capable of being infected by a cyanophagus S2L, in particular cyanobacteria.
  • the invention also relates to a method using such inhibitors to control this metabolism.
  • Figures 2a and 2b represent two possible biosynthetic pathways for the synthesis of bases D by the cyanophagus S-2L, the path of Figure 2b being the most likely
  • FIG. 4 schematically represents the potential difficulty of cloning genes incorporating D bases in E.Coli.
  • S2L cyanophages are cultivated in mass from the species
  • Synechococcus elongatus (8) The extracted DNA is fragmented by sonication to constitute a shotgun library cloned into a vector in E. coli. The clones are sequenced intensively on a sequencer until the genome is completely covered.
  • ORFs are elucidated as homologs to known genes, their expression is carried out in E. coli or in Synechococcus, according to the functions assumed, in particular with the aim of validating the functional hypotheses or exploring the synthetic potentials.
  • FIG. 2 the supposed intermediates of the synthesis pathways (FIG. 2) have been synthesized according to current methods of the chemistry of nucleosides and nucleotides. They are systematically subjected to extracts or mixtures of extracts of recombinant strains each expressing an S-2L gene, in order to identify the enzymatic activities specified by the phage.
  • the DNA of phage S-2L was prepared from Synechoccus culture lysate. elongatus by adapting the techniques used to prepare the phage ⁇ DNA.
  • This DNA was digested with various restriction enzymes, including Smal, which made it possible to verify that the restriction profile obtained was identical to that described. Then, it was shown that S-2L DNA can be replicated in E. coli and sequenced according to standard protocols, which led to the construction of a total library.
  • This library was constructed by inserting DNA fragments digested by the enzyme CviJI (of size between 3 and 5 kb) in the plasmid pBAM digested by the enzyme SmaI and dephosphorylated. After electroporation of the strain of E.
  • tail protein MLKI and J proteins involved in the formation and assembly of the tail of the bacteriophage ⁇ : tail protein MLKI and J, of the protein GP17 which plays a role in the packaging of DNA in the bacteriophage T4, an exonuclease which could intervene in the exclusion of base A, an RNA helicase, a sigma factor and a succinyladenylate synthetase.
  • 2,6-diaminopurine becomes toxic (10 mM) for ⁇ . coli when it is in phosphorylated form (which has been tested in the same strain of col. coli expressing the yaaG gene of Bacillus subtilis or MG1655 pSU yaaG) which makes it possible to have a screen to identify the complete pathway in vivo of base D biosynthesis.
  • complete identification is not necessary to obtain D bases now by the methods described above.
  • Another approach consists in systematically expressing the ORFs specifying all the possible S-2L genes and in combining the crude activities resulting from this expression in order to make the metabolites of the pathway appear in vitro.
  • An inducible metabolic pathway producing dDTP will then be built in E. coli by assembling the appropriate genes. The path thus constructed will be applied to synthetic precursors to generate nucleotides deviating from the base and from sugar.
  • base D in the replication and transcription processes is systematically sought in extracts from bacteria expressing phage ORFs.
  • the above results were obtained using the following works.
  • the ddbA gene was expressed in E. coli under the control of an inducible promoter and several tests were carried out in order to determine the activity of the corresponding protein.
  • the results obtained show that the expression of ddbA makes it possible to restore the growth of E. coli in the presence of a high concentration of dGMP.
  • 2,6-diaminopurine becomes toxic for E. coli when it is in phosphorylated form which should make it possible to have a screen to identify in vivo the complete pathway for base D biosynthesis.
  • the ddbA gene was amplified using 100 pmol of each oligonucleotide ngaattcaagctttcagcgacggtagcgggcatac and nnnnccatggtgaagaactgcaacctgatc, lOOng of S-2L DNA as template DNA, 200mM of each dNTPs, 10 ml of Pfu polymeraseU buffer 10% concentrated 10-fold Pfu polymeraseu.
  • the amplification cycles were: a stage of 10 min at 95 ° C, then 25 cycles 95 ° C 30 sec, 56 ° C 30 sec, 72 ° C 2 min 20 sec then a step of 10 min at 72 ° C.
  • the amplification product was then purified using the Kit
  • the amplification product was inserted into the plasmid pBAD24 (Guzman et al., 1995 J Bacteriol 177: 4121-4130) digested with the same restriction enzymes.
  • the ddbA gene is in this construction expressed from the promoter of the araBAD operon which is inducible by arabinosis.
  • the cyanophagous bank S2L is maintained in the strain of E. Coli B2033 deposited on January 24, 2001 at the National Collection of Cultures of Microorganisms, Institut Pasteur, 25 rue du Dr Roux, 75724 PARIS Cedex 15, France, according to the provisions of Budapest Treaty, and was registered under serial number 1-2619.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Virology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • General Engineering & Computer Science (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

L présente invention a pour objet la séquence génomique et des séquences nucléotidiques codant pour des polypeptides du cyanophage S-2L. Les polypeptides décrits dans la présente invention sont, de façon non limitative, des polypeptides impliqués dans la synthèse, la transcription et la réplication des bases puriques. En particulier, la détermination du génome du cyanophage S-2L est un outil utile pour la fourniture de gènes, qui exprimés dans des bactéries recombinantes, permettent la sythèse de monomères d'ADN incorporant la base D (2,6 diaminopurine) au lieu de la base A (adénine) et ainsi de produire des acides nucléiques chimiquement remodelés chez les bactéries.

Description

Banque génomique du cyanophage S-2L et analyse fonctionnelle
La présente invention a pour objet la séquence génomique et des séquences nucléotidiques codant pour des polypeptides du cyanophage S-2L. Les polypeptides décrits dans la présente invention sont, de façon non limitative, des polypeptides impliqués dans la synthèse, la transcription et la replication des bases puriques. En particulier, la détermination du génome du cyanophage S-2L est un outil utile pour la fourniture de gènes, qui exprimés dans des bactéries recombinantes, permettent la synthèse de monomères d'ADN incorporant la base D (2,6 diaminopurine) au lieu de la base A (adénine) et ainsi de produire des acides nucléiques chimiquement remodelés chez les bactéries.
L'invention concerne également l'utilisation de la séquence génomique et/ou des séquences nucléotidiques et/ou polypeptidiques décrites dans la présente invention pour l'analyse de l'expression de gènes.
Les deux acides nucléiques principaux ADN et ARN sont des polymères de nucléotides qui sont composés d'une base purine ou pyrimidine liée à un sucre à 5 carbones (désoxyribose dans le cas de l'ADN, ribose dans TARN) par une liaison N- glycosidique et un phosphate estérifié au groupement hydroxyl du carbone situé à la position 5' du sucre. ARN et ADN contiennent quatre types de nucléotides qui se distinguent par leurs bases : adénine (A), guanine (G), cytosine (C) et uracile (U) pour l'ARN ; le 5-méthyluracile, c'est-à-dire la thymine (T), remplaçant l'uracile dans l'ADN. Parmi les altérations chimiques de l'ADN et de l'ARN possibles seules des modifications des bases et non du sucre ont été observées. Contrairement à l'ADN aucun ARN modifié n'a pu être répliqué à ce jour.
Des bases modifiées s'observent dans l'ADN de tous les organismes, et peuvent être impliquées dans des phénomènes de régulation de l'expression génétique (5). Sauf chez les bactériophages, les modifications de l'ADN connues jusqu'à présent sont produites par des réactions enzymatiques post-réplicatives, dont un duplex d'ADN est le substrat. Au contraire, lors de l'infection par certains bactériophages, les modifications de l'ADN connues jusqu'à présent sont produites par des réactions enzymatiques pré- réplicatives, dont un nucléotide est le substrat, pour aboutir à un désoxynucléoside triphosphate non-canonique. Parmi les modifications connues on citera les entités : dUTP, 5-hydroxyméthyl-dUTP, 5-dihydroxypentyl-dUTP, 5-hydroxyméthyl-dCTP. Une autre entité est fortement suspectée : le 5-méthyl-dCTP (11). L'émergence des bases modifiées chez les bactériophages est généralement interprétée comme une contre-mesure aux systèmes de restriction des bactéries (11).
Quelques exemples de bases modifiées sont représentés sur la figure 1. Le bromouracile ou la 8-azaguanine sont des analogues synthétiques des bases naturelles thymine et guanine. Ces analogues sont convertis en nucléotides tri- phosphate par les voies de sauvegarde des purines ou pyrimidines et sont ensuite incorporés dans l'ADN.
La 6-méthyladénine et la 5-méthylcytosine sont les bases modifiées les plus fréquemment rencontrées. Les nucléotides méthylés ne sont pas incorporés en tant que tel dans l'ADN mais sont le produit de l'action d'ADN méthyltransférases spécifiques. Ces enzymes transfèrent le groupement méthyl de la S- adénosylméthionine à l'adénine ou la cytosine et ce après la replication de l'ADN. Chez les procaryotes le rôle principal de la méthylation de l'ADN est la dégradation de l'ADN étranger. Chez les eucaryotes la méthylation de l'ADN influe sur la régulation de l'expression des gènes et sur la différenciation cellulaire.
Chez certaines phages de type T comme le bactériophage T4, la cytosine est remplacée systématiquement par la 5-hydroxyméthylcytosine. Cette substitution nécessite d'une part une voie de biosynthèse de l'hydroxyméthyldésoxycytidine tri- phosphate (HM dCTP) ainsi que des enzymes permettant l'exclusion de la base normale.
La voie de biosynthèse de l'HMC DNA fait intervenir une hydroxyméthylase qui convertit le dCMP en hydroxyméthyl dCMP, une nucléoside monophosphate kinase qui phosphoryle le HM dCMP pour donner le diphosphate, précurseur du HM dCTP qui est ensuite incorporé dans l'ADN polymérase puis glycosylé par une gly cosy ltransférase .
L'exclusion de la cytosine fait intervenir d'une part des endonucléases spécifiques de l'ADN contenant cette base et une dCDPase-dCTPase qui convertit les nucléotides correspondant en dCMP qui est alors substrat de la dCMP hydroxyméthylase et de la dCMP désaminase. La dCMP désaminase génère le dUMP précurseur du dTMP. Par un mécanisme similaire à celui décrit ci-dessus, la thymine est remplacée par le 5-hydroxyméthyluracile (phages SPO1 et φe) ou l'uracile (phages PBS2) chez plusieurs phages de Bacillus substilis (Warren, 1980 ; Kornberg et Baker, 1991).
D'autres phages tel SP15 ou φW14 ont un ADN dont la thymine a été remplacée par la 5-dihydroxypentyluracile et l' -putrescinylthymine. Cependant, ce remplacement n'est que partiel et semble être dû à des modifications post- réplicatives.
Dans le cas de S-2L, la voie de synthèse de la base D n'est pas encore parfaitement établie et la modification post-réplicative de l'adénine en diaminopurine ne peut être totalement écartée. Cependant, la biosynthèse du monomère non- canonique dDTP apparaît comme significativement plus vraisemblable, compte tenu du fait que le remplacement de A par D dans l'ADN de S-2L est total et non majoritaire (7,8), comme c'est le cas pour les modifications post-réplicatives d'hydroxyméthyl-U en putrescinyl-T dans le phage φW14. De plus, la modification de A en D in situ nécessiterait la rupture des liaisons hydrogène des duplex d'ADN et, pouvant difficilement s'effectuer en une seule étape chimique, introduirait des lésions mutagènes si ce processus était interrompu.
Le cyanophage S-2L
Le cyanophage S-2L a été isolé d'échantillons d'eau prélevés dans la région de Leningrad. Ce phage est capable de lyser un nombre relativement restreint de Synechococcus: sp. 698, 58 et PCC6907. D'un point de vue morphologique il se compose d'une tête icosaèdrique et d'une queue flexible non contractile. S-2L ferait partie d'une famille dont l'autre membre pourrait être le phage SM-2 qui lui est morphologiquement similaire (Fox et coll. 1976). L'ADN du phage S-2L est linéaire double brin d'une taille de 42 kb composé de
70% G:C et de 30% d'une paire équivalente à A:T dans laquelle l'adénine a été remplacée par la 2,6 diaminopurine (D). Ce remplacement est total et aucune autre base n'a pu être identifiée (Kirnos et coll., 1977 ; Khudyokov et coll., 1978). Comme on l'a vu précédemment, seuls des remplacements totaux de bases pyrimidines ont été rapportés, S-2L est jusqu'à ce jour le seul cas pour une base purine.
Comme dans les paires G:C trois liaisons hydrogène sont formées entre la purine et la pyrimidine de la paire D:T ce qui confère à l'ADN une plus grande stabilité.
La présence de la base D dans l'ADN de S-2L entraîne une résistance à la digestion par les endonucléases de restriction possédant un A dans leur site de reconnaissance (l'enzyme de restriction Taql étant la seule exception). Par contre, la paire D:T semble être reconnue comme une paire G:C par les enzymes de restriction clivant les séquences riches en G:C comme Smal (Szekeres et Matveyev, A.V., 1978).
Compte tenu du fait que le remplacement de la base A par D est total et non majoritaire, il est fort vraisemblable que le génome du phage S-2L code pour au moins une voie de biosynthèse de la base D.
Au vu de l'art antérieur, l'étude du cyanophage S-2L demande de nouvelles approches, en particulier génétiques, afin d'améliorer la compréhension des différentes voies métaboliques de cet organisme.
Ainsi, un objet de la présente invention est de divulguer la séquence complète du génome du cyanophage S-2L et de tous les gènes contenus dans cedit génome.
En effet, la connaissance du génome de cet organisme permet de mieux définir les interactions entre les différents gènes, les différentes protéines, et par là-même, les différentes voies métaboliques. En effet, et contrairement à la divulgation de séquences isolées, la séquence génomique complète d'un organisme forme un tout, permettant d'obtenir immédiatement toutes les informations nécessaires à cet organisme pour croître et fonctionner.
L'invention vise en particulier à séquencer le génome du phage S-2L, de manière à obtenir un gisement de gènes qui, une fois propagés isolément et exprimés sous contrôle dans des bactéries recombinantes, sont destinés notamment à former par voie biotechnologique de nouveaux monomères de l'ADN et à produire, voir répliquer, des acides nucléiques chimiquement remodelés chez les bactéries.
L'invention vise également à utiliser des séquences nucléotidiques obtenues pour l'identification des voies métaboliques conduisant à la production des bases D.
L'invention vise également à la production enzymatique d'analogues de désoxynucléosides très utiles notamment dans la chimiothérapie du SIDA.
L'invention vise également à exprimer chez un hôte du cyanophage S2L des acides nucléiques codant pour des protéines impliquées dans le métabolisme des bases D.
Ainsi l'invention vise également à obtenir des gènes de S-2L qui propagés individuellement chez E.coli et exprimés sous strict contrôle transcriptionnel permettront de tester les hypothèses concernant leur fonction dans le métabolisme des nucléotides, la replication et la transcription.
Pour atteindre les différents résultats techniques recherchés, l'invention concerne selon un premier aspect une séquence nucléotidique du cyanophage S-2L correspondant à SEQ ID N° 1.
La présente invention concerne également une séquence nucléotidique du cyanophage S-2L choisie parmi : a) une séquence nucléotidique comportant au moins 80 %, 85 %, 90 %, 95 % ou 98 % d'identité avec SEQ ID N° 1 ; b) une séquence nucléotidique hybridant dans des conditions de forte stringence avec SEQ ID N° 1 ; c) une séquence nucléotidique complémentaire de SEQ ID
N° 1 ou complémentaire d'une séquence nucléotidique telle que définie en a), ou b), ou une séquence nucléotidique de l'ARN correspondant ; d) une séquence nucléotidique de fragment représentatif de SEQ ID N° 1, ou de fragment représentatif d'une séquence nucléotidique telle que définie en a), b) ou c); e) une séquence nucléotidique comprenant une séquence telle que définie en a), b), c) ou d) ; et f) une séquence nucléotidique modifiée d'une séquence nucléotidique telle que définie en a), b), c), d) ou e). De façon plus particulière, la présente invention a également pour objet les séquences nucléotidiques caractérisées en ce qu'elles sont issues de SEQ ID N° 1 et en ce qu'elles codent pour des polypeptides choisis parmi les séquences SEQ ID N° 2 à SEQ ID N° 527 ou un fragment biologiquement actif de ces polypeptides.
De plus, l'invention concerne également les séquences nucléotidiques caractérisées en ce qu'elles comprennent une séquence nucléotidique choisie parmi : a) une séquence nucléotidique issue de SEQ ID N° 1 et codant pour un polypeptide choisi parmi les séquences parmi SEQ ID N° 2 à SEQ ID N°
527. b) une séquence nucléotidique comportant au moins 80 %, 85 %, 90 %, 95 % ou 98 % d'identité avec une séquence nucléotidique selon a) ; c) une séquence nucléotidique s'hybridant dans des conditions de forte stringence avec une séquence nucléotidique selon a) ou b); d) une séquence nucléotidique complémentaire ou d'ARN correspondant à une séquence telle que définie en a), b) ou c) ; e) une séquence nucléotidique de fragment représentatif d'une séquence telle que définie en a), b), c) ou d) ; et f) une séquence nucléotidique modifiée d'une séquence telle que définie en a), b), c), d) ou e),
De préférence l'invention concerne une séquence nucléotidique caractérisée en ce qu'elle code pour un polypeptide choisi parmi : a) les polypeptides du cyanophage S-2L de séquences SEQ ID N°2 à SEQ ID
N°527 ; b) de préférence les 54 polypeptides mentionnés sur le tableau 1 à savoir: SEQ ID N°14,18,26,68,86,92,105,109,134,142,143,148,152,169,175,187, 208,211, 234,246, 250,257,264,286,298,316,332,342,347,348,351,355,364,365, 369,370,392,395, 406, 418,422,425,429,432,433,454,464,466,472,484,489,494,500 ; c) de préférence encore les 14 polypeptides du cyanophage S-2L indiqués sur le tableau 1 comme présentant une homologie significative à savoir les séquences SEQ ID N° 86,92,152,175,234,257,298,316,395,406,425,484 ; d) les polypeptides présentant au moins 80 % de préférence 85 %, 90 %, 95 % et 98 % d'identité avec un polypeptide de a), b) ,c) ; e) les fragments biologiquement actifs des polypeptides de a), b), c), d) f) les polypeptides modifiés de a),b),c),d),e). L'invention concerne également une séquence nucléotidique caractérisée en ce qu'elle comprend une séquence nucléotidique choisie parmi : a) une séquence nucléotidique telle que définie ci-dessus ; b) une séquence nucléotidique comportant au moins 80 % d'identité avec une séquence nucléotidique de a) ; c) une séquence nucléotidique s'hybridant dans des conditions de forte stringence avec une séquence nucléotidique de a) ou b) ; d) une séquence nucléotidique complémentaire ou d'ARN correspondant à une séquence telle que définie en a), b) ou c) ; e) une séquence nucléotidique de fragment représentatif d'une séquence telle que définie en a), b), c) ou d) ; et f) une séquence nucléotidique modifiée d'une séquence telle que définie en a), b), c), d) ou e). Par acide nucléique, séquence nucléique ou d'acide nucléique, polynucléotide, oligonucléotide, séquence de polynucléotide, séquence nucléotidique, termes qui seront employés indifféremment dans la présente description, on entend désigner un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment ou une région d'un acide nucléique, comportant ou non des nucléotides non naturels, et pouvant correspondre aussi bien à un ADN double brin, un ADN simple brin que des produits de transcription desdits ADNs. Ainsi, les séquences nucléiques selon l'invention englobent également les PNA (Peptid Nucleic Acid), ou analogues.
Il doit être compris que la présente invention ne concerne pas les séquences nucléotidiques dans leur environnement chromosomique naturel, c'est-à-dire à l'état naturel. Il s'agit de séquences qui ont été isolées et/ou purifiées, c'est-à-dire qu'elles ont été prélevées directement ou indirectement, par exemple par copie, leur environnement ayant été au moins partiellement modifié. On entend ainsi également désigner les acides nucléiques obtenus par synthèse chimique.
Par « pourcentage d'identité » entre deux séquences d'acides nucléiques ou d'acides aminés au sens de la présente invention, on entend désigner un pourcentage de nucléotides ou de résidus d'acides aminés identiques entre les deux séquences à comparer, obtenu après le meilleur alignement, ce pourcentage étant purement statistique et les différences entre les deux séquences étant réparties au hasard et sur toute leur longueur. On entend désigner par "meilleur alignement" ou "alignement optimal", l'alignement pour lequel le pourcentage d'identité déterminé comme ci-après est le plus élevé. Les comparaisons de séquences entre deux séquences d'acides nucléiques ou d'acides aminés sont traditionnellement réalisées en comparant ces séquences après les avoir alignées de manière optimale, ladite comparaison étant réalisée par segment ou par « fenêtre de comparaison » pour identifier et comparer les régions locales de similarité de séquence. L'alignement optimal des séquences pour la comparaison peut être réalisé, outre manuellement, au moyen de l' algorithme d'homologie locale de Smith et Waterman (1981, Ad. App. Math. 2 : 482), au moyen de l'algorithme d'homologie locale de Neddleman et Wunsch (1970, J. Mol. Biol. 48 : 443), au moyen de la méthode de recherche de similarité de Pearson et Lipman (1988, Proc. Natl. Acad. Sci. USA 85 : 2444), au moyen de logiciels informatiques utilisant ces algorithmes (GAP, BESTFIT, BLAST P, BLAST N, FASTA et TFASTA dans le Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI). Afin d'obtenir l'alignement optimal, on utilise de préférence le programme BLAST, avec la matrice BLOSUM 62. On peut également utiliser les matrices PAM ou PAM250.
Le pourcentage d'identité entre deux séquences d'acides nucléiques ou d'acides aminés est déterminé en comparant ces deux séquences alignées de manière optimale dans laquelle la séquence d'acides nucléiques ou d'acides aminés à comparer peut comprendre des additions ou des délétions par rapport à la séquence de référence pour un alignement optimal entre ces deux séquences. Le pourcentage d'identité est calculé en déterminant le nombre de positions identiques pour lesquelles le nucléotide ou le résidu d'acide aminé est identique entre les deux séquences, en divisant ce nombre de positions identiques par le nombre total de positions comparées et en multipliant le résultat obtenu par 100 pour obtenir le pourcentage d'identité entre ces deux séquences.
Par séquences nucléiques présentant un pourcentage d'identité d'au moins 80 %, de préférence 85 % ou 90 %, de façon plus préférée 95 % voire 98 %, après alignement optimal avec une séquence de référence, on entend désigner les séquences nucléiques présentant, par rapport à la séquence nucléique de référence, certaines modifications comme en particulier une délétion, une troncation, un allongement, une fusion chimérique et/ou une substitution, notamment ponctuelle, et dont la séquence nucléique présente au moins 80 %, de préférence 85 %, 90 %, 95 % ou 98 %, d'identité après alignement optimal avec la séquence nucléique de référence. Il s'agit de préférence de séquences dont les séquences complémentaires sont susceptibles de s'hybrider spécifiquement avec les séquences de référence. De préférence, les conditions d'hybridation spécifiques ou de forte stringence seront telles qu'elles assurent au moins 80 %, de préférence 85 %, 90 %, 95 % ou 98 % d'identité après alignement optimal entre l'une des deux séquences et la séquence complémentaire de l'autre.
Une hybridation dans des conditions de forte stringence signifie que les conditions de température et de force ionique sont choisies de telle manière qu'elles permettent le maintien de l'hybridation entre deux fragments d'ADN complémentaires. A titre illustratif, des conditions de forte stringence de l'étape d'hybridation aux fins de définir les fragments polynucléotidiques décrits ci-dessus, sont avantageusement les suivantes.
L'hybridation ADN-ADN ou ADN-ARN est réalisée en deux étapes : (1) préhybridation à 42°C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) contenant 5 x SSC (1 x SSC correspond à une solution 0,15 M NaCl + 0,015 M citrate de sodium), 50 % de formamide, 7 % de sodium dodécyl sulfate (SDS), 10 x Denhardt's, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) hybridation proprement dite pendant 20 heures à une température dépendant de la taille de la sonde (i.e. : 42°C, pour une sonde de taille > 100 nucléotides) suivie de 2 lavages de 20 minutes à 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes à 20°C en 0,1 x SSC + 0,1 % SDS. Le dernier lavage est pratiqué en 0,1 x SSC + 0,1 % SDS pendant 30 minutes à 60°C pour une sonde de taille > 100 nucléotides. Les conditions d'hybridation de forte stringence décrites ci-dessus pour un polynucléotide de taille définie, peuvent être adaptées par l'homme du métier pour des oligonucléotides de taille plus grande ou plus petite, selon l'enseignement de Sambrook et al., (1989, Molecular cloning : a laboratory manual.2nd Ed. Cold Spring Harbor).
De plus, par fragment représentatif de séquences selon l'invention, on entend désigner tout fragment nucléotidique présentant au moins 15 nucléotides, de préférence au moins 20, 30, 75, 150, 300 et 450 nucléotides consécutifs de la séquence dont il est issu. On entend en particulier une séquence nucléique codant pour un fragment biologiquement actif d'un polypeptide, tel que défini plus loin, notamment d'un polypeptide de séquence SEQ ID N°2 à 527.
Par fragment représentatif, on entend également les séquences intergéniques, et en particulier les séquences nucléotidiques portant les signaux de régulation (promoteurs, terminateurs, voire enhancers...). Parmi lesdits fragments représentatifs, on préfère ceux ayant des séquences nucléotidiques correspondant à des cadres ouverts de lecture, dénommés séquences ORFs (ORF pour « Open Reading Frame »), compris en général entre un codon d'initiation et un codon stop, ou entre deux codons stop, et codant pour des polypeptides, de préférence d'au moins 30 acides aminés, tel que par exemple, sans s'y limiter, les séquences ORFs qui seront décrites par la suite.
La numérotation des séquences nucléotidiques ORFs qui sera utilisée par la suite dans la présente description correspond à la numérotation des séquences d'acides aminés des protéines codées par lesdites ORFs.
Ainsi, les séquences nucléotidiques ORF2, ORF3..., ORF526 et ORF527 codent respectivement pour les protéines de séquences d'acides aminés SEQ ID N° 2, SEQ ID N° 3..., SEQ ID N° 526 et SEQ ID N° 527 figurant dans la liste de séquences de la présente invention. Les séquences nucléotidiques détaillées des séquences ORF2, ORF3..., ORF526 et ORF527 sont déterminées par leur position respective sur la séquence génomique SEQ ID N° 1 du cyanophage S2L. Le tableau 1 fournit les coordonnées de 54 ORFs préférées par rapport à la séquence nucléotidique SEQ ID N° 1, en donnant le nucléotide de départ, le nucléotide de fin d'ORF, et le cadre de lecture +1,2,3 ou -1,2,3 tel qu'expliqué ci-après. Le listing des séquences indique pour chacune des 526 ORF identifiées, numérotées ORF2 à ORF527, le cadre de lecture. Pour une parfaite concordance des numérotations des ORF et des SEQ ID dans le listing de séquence, on a choisi de faire débuter les ORF au numéro 2 (il n'y a donc pas d'ORF 1). Il est entendu que la séquence SEQ ID N°l est un brin ADN dans l'orientation 5 '-3', la séquence SEQ ID N°2 est une séquence protéique codée par l'ORF N°2. Un cadre « positif » de +1 correspond au cadre de lecture désigné +1 commençant au nucléotide nt 3 de la SEQ ID N°l (1er codon de 1ORF2 situé sur ce cadre de lecture et commençant au nt 9 de SEQ ID N°l : TCG qui correspond à la serine S ; 2eme codon de l'ORF 2 selon ce cadre : GAG qui correspond à l'acide glutamique E). Un cadre +2 correspond au cadre de lecture désigné +2 et commençant au nucléotide nt 1 de la SEQ ID N°l (1er codon de l'ORF
4 situé sur ce cadre de lecture et commençant au nt 10 de SEQ ID N°l : CGG qui correspond à l'arginine R ; 2eme codon de l'ORF 4 selon ce cadre : AGG qui correspond à l'arginine R). Un cadre +3 correspond au cadre de lecture désigné +3 commençant au nucléotide nt 2 de la SEQ ID N°l (1er codon de l'ORF 5 situé sur ce cadre de lecture et commençant au nt35 de SEQ ID N°l : CGT qui correspond à l'arginine R ; 2eme codon de l'ORF 5 selon ce cadre : TCA qui correspond à la serine
S).
Ainsi l'ORF 2 commence au nt n°9 de SEQ ID n°l (c'est à dire la base T) et s'arrête au nt n°515 (c'est à dire la base G). L'ORF 4 commence au nt n°10 de SEQ
ID n°l (c'est à dire la base T) et s'arrête au nt n°342 (c'est à dire la base G). L'ORF
5 commence au nt n°35 de SEQ ID n°l (c'est à dire la base C) et s'arrête au nt n°280 (c'est à dire la base A).
A l'inverse, un cadre négatif correspond au brin complémentaire antiparallèle du brin positif. Par exemple pour une séquence ATG sur le brin positif dans le sens 5 '-3', la séquence sur le brin complémentaire TAC se lira CAT. Par exemple pour l'ORF 3 (nt 9 à nt 791), le brin complémentaire des nucléotides 782 à 791 (CCT CGA TAG) est (GGA GCT ATC) se lisant dans le sens négatif CTA TCG AGG qui correspondent respectivement aux acides aminés L, S, R. Les fragments représentatifs selon l'invention peuvent être obtenus par exemple par amplification spécifique telle que la PCR ou après digestion par des enzymes de restriction appropriés de séquences nucléotidiques selon l'invention, cette méthode étant décrite en particulier dans l'ouvrage de Sambrook et al.. Lesdits fragments représentatifs peuvent également être obtenus par synthèse chimique lorsque leur taille n'est pas trop importante, selon des méthodes bien connues de l'homme du métier.
Parmi les séquences contenant des séquences de l'invention, ou des fragments représentatifs, on entend également les séquences qui sont naturellement encadrées par des séquences qui présentent au moins 80 %, 85 %, 90 %, 95 % ou 98 % d'identité avec les séquences selon l'invention.
Par séquence nucléotidique modifiée, on entend toute séquence nucléotidique obtenue par mutagénèse selon des techniques bien connues de l'homme du métier, et comportant des modifications par rapport aux séquences normales, par exemple des mutations dans les séquences régulatrices et/ou promotrices de l'expression du polypeptide, notamment conduisant à une modification du taux d'expression ou de l'activité dudit polypeptide. Par séquence nucléotidique modifiée, on entend également toute séquence nucléotidique codant pour un polypeptide modifié tel que défini ci-après.
La présente invention fournit toutes les séquences nucléotidiques et polypeptidiques du génome du cyanophage S-2L. Par ailleurs, il est un objet de la présente invention que de divulguer les fonctions de ces gènes et protéines. Les gènes décrits dans l'invention ont été isolés sur des fragments d'ADN grâce à des amorces déduites de la séquence du cyanophage S-2L.
De manière préférée, l'invention est relative à une séquence nucléotidique caractérisée en ce qu'elle code pour un polypeptide de cyanophage S-2L ou un de ses fragments représentatifs impliqué dans le métabolisme des nucléotides, des purines, des pyrimidines ou nucléosides. Dans ce texte, le terme « f agment représentatif» pour un peptide signifie un fragment biologiquement actif de ce peptide (ayant une activité d'au moins 10, 20, 50, 100% de l'activité obtenue avec ce peptide).
En particulier l'invention est relative à une séquence nucléotidique caractérisée en ce qu'elle code pour un polypeptide de cyanophage S-2L ou un de ses fragments représentatifs impliqué dans le métabolisme des nucléotides bases D, notamment un peptide de séquence SEQ ID N° 175 ou un des ses fragements représentatifs.
De manière préférée, l'invention est relative à une séquence nucléotidique caractérisée en ce qu'elle code pour un polypeptide de cyanophage S-2L ou un de ses fragments représentatifs impliqué dans le processus de replication, notamment un peptide de séquence SEQ ID N°14,18,142,355,429,454 ou un de leurs fragments représentatifs.
De manière préférée, l'invention est relative à une séquence nucléotidique caractérisée en ce qu'elle code pour un polypeptide d'enveloppe, notamment de capside, de cyanophage S-2L ou un de ses fragments représentatifs, notamment un peptide de séquence SEQ ID N°169,316,351,392,395,406,422,425 ou un de leurs fragments représentatifs. De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention caractérisée en ce qu'elle code pour un polypeptide de cyanophage S-2L ou un de ses fragments impliqué dans le le détournement de la machinerie cellulaire. De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention caractérisée en ce qu'elle code pour un polypeptide de cyanophage S-2L ou un de ses fragments représentatifs impliqué dans le processus de transcription, notamment un peptide de séquence SEQ ID N°92,143, 187,234 ou un de leurs fragments représentatifs. De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention caractérisée en ce qu'elle code pour un polypeptide de cyanophage S-2L ou un de ses fragments représentatifs impliqué dans le processus de virulence virale, notamment un peptide de séquence SEQ ID N° 257 ou un fragment représentatif. De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention caractérisée en ce qu'elle code pour un polypeptide de cyanophage S-2L ou un de ses fragments représentatifs impliqué dans les fonctions relatives aux transposons notamment un peptide de séquence SEQ ID N°208 ou un de ses fragments représentatifs. Les fragments représentatifs de séquences nucléotidiques selon l'invention peuvent également être des sondes ou amorces, qui peuvent être utilisées dans des procédés de détection, d'identification, de dosage ou d'amplification de séquences nucléiques.
Une sonde ou amorce se définit, au sens de l'invention, comme étant un fragment d'acides nucléiques simple brin ou un fragment double brin dénaturé comprenant par exemple de 12 bases à quelques kb, notamment de 15 à quelques centaines de bases, de préférence de 15 à 50 ou 100 bases, et possédant une spécificité d'hybridation dans des conditions déterminées pour former un complexe d'hybridation avec un acide nucléique cible. Les sondes et amorces selon l'invention peuvent être marquées directement ou indirectement par un composé radioactif ou non radioactif par des méthodes bien connues de l'homme du métier, afin d'obtenir un signal détectable et/ou quantifiable. Les séquences de polynucléotides selon l'invention non marquées peuvent être utilisées directement comme sonde ou amorce.
Les séquences sont généralement marquées pour obtenir des séquences utilisables pour de nombreuses applications. Le marquage des amorces ou des sondes selon l'invention est réalisé par des éléments radioactifs ou par des molécules non radioactives.
Parmi les isotopes radioactifs utilisés, on peut citer le 32P, le 33P, le 35S, le 3H ou le 125I. Les entités non radioactives sont sélectionnées parmi les ligands tels la biotine, l'avidine, la streptavidine, la dioxygénine, les haptènes, les colorants, les agents luminescents tels que les agents radioluminescents, chémoluminescents, bioluminescents, fluorescents, phosphorescents.
Les polynucléotides selon l'invention peuvent ainsi être utilisés comme amorce et/ou sonde dans des procédés mettant en oeuvre notamment la technique de PCR (amplification en chaîne par polymérase) (Rolfs et al., 1991, Berlin : Springer-Nerlag). Cette technique nécessite le choix de paires d'amorces oligonucléotidiques encadrant le fragment qui doit être amplifié. On peut, par exemple, se référer à la technique décrite dans le brevet américain U.S. Ν° 4,683,202. Les fragments amplifiés peuvent être identifiés, par exemple après une électrophorèse en gel d'agarose ou de polyacrylamide, ou après une technique chromatographique comme la filtration sur gel ou la chromatographie échangeuse d'ions, puis séquences. La spécificité de l'amplification peut être contrôlée en utilisant comme amorce les séquences nucléotidiques de polynucléotides de l'invention comme matrice, des plasmides contenant ces séquences ou encore les produits d'amplification dérivés. Les fragments nucléotidiques amplifiés peuvent être utilisés comme réactifs dans des réactions d'hybridation afin de mettre en évidence la présence, dans un échantillon biologique, d'un acide nucléique cible de séquence complémentaire à celle desdits fragments nucléotidiques amplifiés.
L'invention vise également les acides nucléiques susceptibles d'être obtenus par amplification à l'aide d'amorces selon l'invention. D'autres techniques d'amplification de l'acide nucléique cible peuvent être avantageusement employées comme alternative à la PCR (PCR-like) à l'aide de couple d'amorces de séquences nucléotidiques selon l'invention. Par PCR-like on entend désigner toutes les méthodes mettant en œuvre des reproductions directes ou indirectes des séquences d'acides nucléiques, ou bien dans lesquelles les systèmes de marquage ont été amplifiés, ces techniques sont bien entendu connues, en général il s'agit de l'amplification de l'ADN par une polymérase ; lorsque l'échantillon d'origine est un ARN il convient préalablement d'effectuer une transcription reverse. Il existe actuellement de très nombreux procédés permettant cette amplification, comme par exemple la technique SDA (Strand Displacement Amplification) ou technique d'amplification à déplacement de brin (Walker et al., 1992, Nucleic Acids Res. 20 : 1691), la technique TAS (Transcription-based Amplification System) décrite par Kwoh et al. (1989, Proc. Natl. Acad. Sci. USA, 86, 1173), la technique 3SR (Self-Sustained Séquence Replication) décrite par Guatelli et al. (1990, Proc. Natl. Acad. Sci. USA 87: 1874), la technique NASBA (Nucleic Acid Séquence Based Amplification) décrite par Kievitis et al. (1991, J. Virol. Methods, 35, 273), la technique TMA (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction) décrite par Landegren et al. (1988, Science 241, 1077), la technique de RCR (Repair Chain Reaction) décrite par Segev (1992, Kessler C. Springer Verlag, Berlin, New- York, 197- 205), la technique CPR (Cycling Probe Reaction) décrite par Duck et al. (1990, Biotechniques, 9, 142), la technique d'amplification à la Q-béta-réplicase décrite par Miele et al. (1983, J. Mol. Biol, 171, 281). Certaines de ces techniques ont depuis été perfectionnées .
Dans le cas où le polynucléotide cible à détecter est un ARNm, on utilise avantageusement, préalablement à la mise en oeuvre d'une réaction d'amplification à l'aide des amorces selon l'invention ou à la mise en œuvre d'un procédé de détection à l'aide des sondes de l'invention, une enzyme de type transcriptase inverse afin d'obtenir un ADNc à partir de l'ARNm contenu dans l'échantillon biologique. L'ADNc obtenu servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le procédé d'amplification ou de détection selon l'invention.
La technique d'hybridation de sondes peut être réalisée de manières diverses (Matthews et al, 1988, Anal. Biochem., 169, 1-25). La méthode la plus générale consiste à immobiliser l'acide nucléique extrait des cellules de différents tissus ou de cellules en culture sur un support (tels que la nitrocellulose, le nylon, le polystyrène) et à incuber, dans des conditions bien définies, l'acide nucléique cible immobilisé avec la sonde. Après l'hybridation, l'excès de sonde est éliminé et les molécules hybrides formées sont détectées par une méthode appropriée (mesure de la radioactivité, de la fluorescence ou de l'activité enzymatique liée à la sonde).
Selon un autre mode de mise en œuvre des sondes nucléiques selon l'invention, ces dernières peuvent être utilisées comme sondes de capture. Dans ce cas, une sonde, dite « sonde de capture », est immobilisée sur un support et sert à capturer par hybridation spécifique l'acide nucléique cible obtenu à partir de l'échantillon biologique à tester et l'acide nucléique cible est ensuite détecté grâce à une seconde sonde, dite « sonde de détection », marquée par un élément facilement détectable. Parmi les fragments d'acides nucléiques intéressants, il faut ainsi citer en particulier les oligonucléotides anti-sens, c'est-à-dire dont la structure assure, par hybridation avec la séquence cible, une inhibition de l'expression du produit correspondant. Il faut également citer les oligonucléotides sens qui, par interaction avec des protéines impliquées dans la régulation de l'expression du produit correspondant, induiront soit une inhibition, soit une activation de cette expression.
De façon préférée, les sondes ou amorces selon l'invention sont immobilisées sur un support, de manière covalente ou non covalente. En particulier, le support peut être une puce à ADN ou un filtre à haute densité, également objets de la présente invention. On entend désigner par puce à ADN ou filtre haute densité, un support sur lequel sont fixées des séquences d'ADN, chacune d'entre elles pouvant être repérée par sa localisation géographique. Ces puces ou filtres diffèrent principalement par leur taille, le matériau du support, et éventuellement le nombre de séquences d'ADN qui y sont fixées. On peut fixer les sondes ou amorces selon la présente invention sur des supports solides, en particulier les puces à ADN, par différents procédés de fabrication. En particulier, on peut effectuer une synthèse in situ par adressage photochimique ou par jet d'encre. D'autres techniques consistent à effectuer une synthèse ex situ et à fixer les sondes sur le support de la puce à ADN par adressage mécanique, électronique ou par jet d'encre. Ces différents procédés sont connus de l'homme du métier.
Une séquence nucléotidique (sonde ou amorce) selon l'invention permet donc la détection et/ou l'amplification de séquences nucléiques spécifiques. En particulier, la détection de cesdites séquences est facilitée lorsque la sonde est fixée sur une puce à ADN, ou à un filtre haute densité.
L'utilisation de puces à ADN ou de filtres à haute densité permet en effet de déterminer l'expression de gènes dans un organisme présentant une séquence génomique proche du cyanophage S-2L.
La séquence génomique du cyanophage S-2L, complétée par l'identification de tous les gènes de cet organisme, telle que présentée dans la présente invention, sert de base à la construction de ces puces à ADN ou filtre. La préparation de ces filtres ou puces consiste à synthétiser des oligonucléotides, correspondant aux extrémités 5' et 3' des gènes. Ces oligonucléotides sont choisis en utilisant la séquence génomique et ses annotations divulguées par la présente invention. La température d'appariement des ces oligonucléotides aux places correspondantes sur l'ADN doit être approximativement la même pour chaque oligonucléotide. Ceci permet de préparer des fragments d'ADN correspondants à chaque gène par l'utilisation de condition de PCR appropriées dans un environnement hautement automatisé. Les fragments amplifiés sont ensuite immobilisés sur des filtres ou des supports en verre, silicium ou polymères synthétiques et ces milieux sont utilisés pour l'hybridation.
La disponibilité de tels filtres et/ou puces et de la séquence génomique correspondante annotée permet d'étudier l'expression de grands ensembles, voire de la totalité des gènes dans des virus proches du cyanophage S-2L, en préparant les ADN complémentaires, et en les hybridant à l'ADN ou aux oligonucléotides immobilisés sur les filtres ou les puces. Egalement, les filtres et/ou les puces permettent d'étudier la variabilité des souches en préparant l'ADN de ces virus et en les hybridant à l'ADN ou aux oligonucléotides immobilisés sur les filtres ou les puces.
Les différences entre les séquences génomiques des différentes souches ou espèces peuvent grandement affecter l'intensité de l'hybridation et, par conséquent, perturber l'interprétation des résultats. Il peut donc être nécessaire d'avoir la séquence précise des gènes de la souche que l'on souhaite étudier. L'utilisation des filtres à haute densité et/ou des puces permet d'obtenir des connaissances nouvelles sur la régulation des gènes dans les organismes d'importance industrielle, et en particulier les bactéries recombinantes incorporant des gènes du cyanophage S-2L propagées dans diverses conditions. Elle permet aussi une identification rapide des différences entre les génomes des souches utilisées dans de multiples applications industrielles.
Par ailleurs, les puces à ADN ou les filtres selon l'invention, contenant des sondes ou amorces spécifiques du cyanophage S-2L, sont des éléments très avantageux de kits ou nécessaires pour la détection et/ou la quantification de l'expression de gènes du cyanophage S-2L dans des bactéries recombinantes intégrant ces gènes.
En effet, le contrôle de l'expression des gènes est un point critique pour les voies métaboliques du cyanophage S-2L, soit en permettant l'expression d'un ou plusieurs gènes nouveaux, soit en modifiant l'expression de gènes déjà présents dans la cellule. La présente invention fournit l'ensemble des séquences naturellement actives chez le cyanophage S-2L permettant l'expression des gènes. Elle permet ainsi la détermination de l'ensemble des séquences exprimées chez le cyanophage S-2L. Elle fournit également un outil permettant de repérer les gènes dont l'expression suit un schéma donné. Pour réaliser cela, l'ADN de tout ou partie des gènes du cyanophage S-2L peut être amplifié grâce à des amorces selon l'invention, puis fixé à un support comme par exemple le verre ou le nylon ou une puce à ADN, afin de construire un outil permettant de suivre le profil d'expression de ces gènes. Cet outil, constitué de ce support contenant les séquences codantes sert de matrice d'hybridation à un mélange de molécules marquées reflétant les ARN messagers exprimés dans la cellule (en particulier les sondes marquées selon l'invention). En répétant cette expérience à différents instants et en combinant l'ensemble de ces données par un traitement approprié, on obtient alors les profils d'expression de l'ensemble de ces gènes. La connaissance des séquences qui suivent un schéma de régulation donnée peut aussi être mise à profit pour rechercher de manière dirigée, par exemple par homologie, d'autres séquences suivant globalement, mais de manière légèrement différente le même schéma de régulation. En complément, il est possible d'isoler chaque séquence de contrôle présente en amont des segments servant de sondes et d'en suivre l'activité à l'aide de moyen approprié comme un gène raporteur (luciférase, β-galactosidase, GFP). Ces séquences isolées peuvent ensuite être modifiées et assemblées par ingénierie métabolique avec des séquences d'intérêt en vue de leur expression optimale. La présente invention donne la liste de gènes codant ou susceptibles de coder pour des protéines régulant la transcription des gènes du cyanophage S-2L. Modifier la structure ou l'intégrité de ces gènes pourra permettre de modifier l'expression des gènes cibles contrôlés par des promoteurs cibles de ces régulateurs. Les indications données permettent de plus à l'homme du métier de choisir le ou les régulateurs pertinents pour l'application recherchée ainsi que leur cible, ce qui permet l'optimisation de l'expression de gènes d'intérêt. L'utilisation des outils précédemment décrits tels les puces à ADN, permet aussi de repérer l'ensemble des gènes dont la régulation est modifiée par cette inactivation. Il est ainsi possible de sélectionner un ensemble de séquence de contrôle répondant, à des nuances près, à un même type de régulation. Ces séquences peuvent être alors utilisées pour contrôler l'expression de gènes d'intérêt.
Selon un autre aspect, l'invention concerne les polypeptides comprenant : a) un polypeptide codé par une séquence nucléotidique selon l'invention telle que définie précédemment, en particulier un polypeptide codé par une ORF ; b) un polypeptide présentant au moins 80 % de préférence 85 %, 90 %, 95
% et 98 % d'identité avec un polypeptide de a) ; c) un fragment biologiquement actif d'au moins 5, 7, 10 acides aminés d'un polypeptide selon a) ou b) ; d) un polypeptide modifié d'un polypeptide selon l'invention, ou tel que défini en a), b), ou c).
L'invention concerne de préférence : a) les polypeptides du cyanophage S-2L de séquences SEQ ID N°2 à SEQ ID N°527, codés respectivement par les ORF 2 à 527, b) les 54 polypeptides mentionnés sur le tableau 1 (SEQ ID N°14,18,26,68,86,92,105,109,134,142,143,148,152,169,175,187,
208,211 ,234,246,250,257,264,286,298,316,332,342,347,348,
351,355,364,365,369,370,392,395,406,418,422,425,429,432,433,454,464,
466,472,484,489,494,500. c) les 14 polypeptides du cyanophage S-2L, indiqués sur le tableau 1 comme présentant une homologie très significative, de séquence SEQ ID N°
86,92, 152, 175,234,257,298,316,395,406,425,484 . L'invention concerne également : d)les polypeptides présentant au moins 80 % de préférence 85 %, 90 %, 95 % et
98 % d'identité avec un polypeptide de a), b) ,c) e)les fragments biologiquement actifs des polypeptides de a), b), c), d) f) les polypeptides modifiés de a),b),c),d),e).
L'invention concerne bien entendu tout spécialement les polypeptides impliqués dans la biosynthèse des bases D et des intermédiaires métaboliques de cette biosynthèse, en particulier le peptide de séquence SEQ ID N°175 à activité succidinylate synthétase. Les phages pour lesquels les modifications sont pré-réplicatives, ce qui est vraisemblablement le cas du cyanophages S-2L, possèdent les séquences codantes de protéines nécessaires à la biosynthèse des bases modifiées, dans le cas présent des bases D. De plus, dans la mesure où les bases D font partie du génome du cyanophage, les enzymes polymérases notamment ADN polymérases doivent être capables d'avoir la base D spécifiquement comme substrat au lieu de la base A. L'ADN polymérase du cyanophage S-2L est ainsi capable de discriminer le dDTP du dATP. De même, la transcription dépend d'une ARN polymérase spécifique et/ou d'un facteur sigma spécifique. L'invention concerne donc selon une réalisation préférée les polypeptides spécifiques à activité ADN polymérase, ARN polymérase et facteurs associés, en particulier les peptides de séquence SEQ ID N° 92 et SEQ ID N°234 qui ont des activités spécifiques de la transcription d'ADN comprenant des bases D .
Dans la présente description, les termes polypeptides, séquences polypeptidiques, peptides et protéines sont interchangeables. II doit être compris que l'invention ne concerne pas les polypeptides sous forme naturelle, c'est-à-dire qu'ils ne sont pas pris dans leur environnement naturel mais qu'ils ont pu être isolés ou obtenus par purification à partir de sources naturelles, ou bien obtenus par recombinaison génétique, ou par synthèse chimique, et qu'ils peuvent alors comporter des acides aminés non naturels comme cela sera décrit plus loin.
Par polypeptide présentant un certain pourcentage d'identité avec un autre, que l'on désignera également par polypeptide homologue, on entend désigner les polypeptides présentant par rapport aux polypeptides naturels, certaines modifications, en particulier une délétion, addition ou substitution d'au moins un acide aminé, une troncation, un allongement, une solution chimérique et/ou une mutation, ou les polypeptides présentant des modifications post-traductionnelles. Parmi les polypeptides homologues, on préfère ceux dont la séquence d'acides aminés présentent au moins 80 %, de préférence 85 %, 90 %, 95 % et 98 % d'homologie avec les séquences d'acides aminés des polypeptides selon l'invention. Dans le cas d'une substitution, un ou plusieurs acide(s) aminé(s) consécutifs) ou non consécutifs) sont remplacés par des acides aminés « équivalents ». L'expression « acides aminés équivalents » vise ici à désigner tout acide aminé susceptible d'être substitué à l'un des acides aminés de la structure de base sans cependant modifier essentiellement les activités biologiques des peptides correspondant et telles qu'elles seront définies par la suite.
Ces acides aminés équivalents peuvent être déterminés soit en s 'appuyant sur leur homologie de structure avec les acides aminés auxquels ils se substituent, soit sur des résultats d'essais comparatifs d'activité biologique entre les différents polypeptides susceptibles d'être effectués.
A titre d'exemple, on mentionne les possibilités de substitution susceptibles d'être effectuées sans qu'il résulte en une modification approfondie de l'activité biologique du polypeptide modifié correspondant. On peut remplacer ainsi la leucine par la valine ou l'isoleucine, l'acide aspartique par l'acide glutamine, la glutamine par l'asparagine, l'arginine par la lysine, etc.. les substitutions inverses étant naturellement envisageables dans les mêmes conditions.
Les polypeptides homologues correspondent également aux polypeptides codés par les séquences nucléotidiques homologues ou identiques, telles que définies précédemment et comprennent ainsi dans la présente définition des polypeptides mutés ou correspondant à des variations inter ou intra espèces, pouvant exister chez le cyanophage S-2L, et qui correspondent notamment à des troncatures, substitutions, délétions et/ou additions, d'au moins un résidu d'acides aminés. II est entendu que l'on calcule le pourcentage d'identité entre deux polypeptides de la même façon qu'entre deux séquences d'acides nucléiques. Ainsi, le pourcentage d'identité entre deux polypeptides est calculé après alignement optimal de ces deux séquences, sur une fenêtre d'homologie maximale. Pour définir ladite fenêtre d'homologie maximale, on peut utiliser les mêmes algorithmes que pour les séquences d'acide nucléique.
Par fragment biologiquement actif d'un polypeptide selon l'invention, on entend désigner en particulier un fragment de polypeptide comportant au minimum 5 acides aminés, de préférence au moins 7, 10, 15, 25, 50, 75, 100,150, 200, 250, 300 acides aminés, présentant au moins une des caractéristiques biologiques des polypeptides selon l'invention, notamment en ce qu'il est capable d'exercer de manière générale une activité même partielle, telle que par exemple : - une activité enzymatique (métabolique) ou une activité pouvant être impliquée dans la biosynthèse ou la biodégradation de composés organiques ou inorganiques ;
- une activité structurelle (enveloppe cellulaire...) ;
- une activité dans le processus de replication, amplification, préparation, transcription, traduction ou maturation, notamment de l'ADN, de l'ARN ou des protéines
- et tout particulièrement une activité impliquée dans la biosynthèse de bases D.
Les fragments de polypeptides peuvent correspondre à des fragments isolés ou purifiés naturellement présents dans les souches du cyanophage S-2L, ou à des fragments qui peuvent être obtenus par clivage dudit polypeptide par une enzyme protéolitique telle que la trypsine ou la chymotrypsine ou la collagénase, par un réactif chimique (bromure de cyanogène, CNBr) ou en plaçant ledit polypeptide dans un environnement très acide (par exemple à pH = 2,5). Des fragments polypeptidiques peuvent également être préparés par synthèse chimique, à partir d'hôtes transformés par un vecteur d'expression selon l'invention qui contiennent un acide nucléique permettant l'expression dudit fragment, et placé sous le contrôle des éléments de régulation et/ou d'expression appropriés.
Par « polypeptide modifié » d'un polypeptide selon l'invention, on entend désigner un polypeptide obtenu par recombinaison génétique ou par synthèse chimique comme décrit plus loin, qui présente au moins une modification par rapport à la séquence normale. Ces modifications peuvent être notamment portées sur des acides aminés nécessaires pour la spécificité ou l'efficacité de l'activité, ou à l'origine de la conformation structurale, de la charge, ou de l'hydrophobicité du polypeptide selon l'invention. On peut ainsi créer des polypeptides d'activité équivalente, augmentée ou diminuée, ou de spécificité équivalente, plus étroite ou plus large. Parmi les polypeptides modifiés, il faut citer les polypeptides dans lesquels jusqu'à cinq acides aminés peuvent être modifiés, tronqués à l'extrémité N ou C-terminale, ou bien délétés, ou ajoutés.
Comme cela est indiqué, les modifications d'un polypeptide ont pour objectif notamment : - de permettre sa mise en œuvre dans des procédés de biosynthèse ou de biodégradation de composés organiques ou inorganiques,
- de permettre sa mise en œuvre dans des procédés de replication, d'amplification, de réparation et règle de transcription, de traduction, ou de maturation notamment de l'ADN, l'ARN, ou de protéines, - de permettre sa sécrétion améliorée,
- de modifier sa solubilité, l'efficacité ou la spécificité de son activité, ou encore de faciliter sa purification.
La synthèse chimique présente également l'avantage de pouvoir utiliser des acides aminés non naturels ou des liaisons non peptidiques. Ainsi, il peut être intéressant d'utiliser des acides aminés non naturels, par exemple sous forme D, ou des analogues d'acides aminés, notamment des formes souffrées.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de de cyanophage S-2L ou un de ses fragments représentatifs impliqué dans le métabolisme des nucléotides, des purines, des pyrimidines ou nucléosides.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de de cyanophage S-2L ou un de ses fragments représentatifs impliqué dans le processus de replication, et en ce qu'il est choisi parmi les polypeptides de séquence SEQ ID N°14,18,142,355,429,454 et un de leurs fragments.
L'invention concerne de manière très avantageuse des polypeptides de cyanophage S2L d'au moins 7 acides aminés et ayant une activité adénylosuccinate synthétase. De manière préférée, de tels fragments comprennent le motif GSTGKG. En plus des résultats biologiques (métabolisme spécifique du cyanophage S2L capable de synthétiser et de polymériser de l'ADN incorporant des bases D), les inventeurs ont en effet identifié, des sites consensus en particulier les zones site de liaison de phosphate et d'IMP. On retrouve en particulier le fragment QYGSTGKG, proche de la signature Prosite QWGDEGKG attribuée à l'adenylosuccinate synthétase, ou le fragment GSTGKG proche du fragment GDEGKG commun à Escherichia coli, Methanobacterium thermaoautotrophicum, Pyrococcus horikosshi OT3. Les inventeurs ont identifié des homologies significatives pour les activités adenylosuccinate synthétase, hélicase, facteur sigma, ces trois activités étant a priori directement liées étroitement avec le métabolisme spécifique des bases D.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de de cyanophage S-2L ou un de ses fragments impliqué dans le processus de transcription, et en ce qu'il est choisi parmi les polypeptides de séquece SEQ ID N°92,143,187 et un de leurs fragments représentatifs.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide d'enveloppe de cyanophage S-2L ou un de ses fragments, et en ce qu'il est choisi parmi les polypeptides correspondant aux ORF169,316,351,392,395,406,422,425 et un de leurs fragments représentatifs.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de de cyanophage S-2L ou un de ses fragments représentatifs impliqué dans le détournement de la machinerie cellulaire ou dans le métabolisme intermédiaire.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de de cyanophage S-2L ou un de ses fragments représentatifs impliqué dans le processus de virulence, notamment le polypeptide de séquence SEQ ID N°247 et un de ses fragments représentatifs .
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de cyanophage S-2L ou un de ses fragments impliqué dans les fonctions relatives aux transposons, notamment le polypeptide de séquence SEQ ID N°208 et un de ses fragments représentatifs.
II faut noter toutefois qu'un organisme vivant est un tout et doit être pris comme tel. Ainsi, afin de pouvoir se développer et d'exhiber ses propriétés, tout organisme a besoin d'interactions entre les différentes voies métaboliques. Ainsi, la classification énoncée ci-dessus ne doit pas être considérée comme limitative, un gène pouvant être impliqué dans plusieurs voies métaboliques distinctes. La présente invention a également pour objet les séquences nucléotidiques et/ou de polypeptides selon l'invention, caractérisées en ce que lesdites séquences sont enregistrées sur un support d'enregistrement dont la forme et la nature facilitent la lecture, l'analyse et/ou l'exploitation de ladite ou desdites séquence(s). Ces supports peuvent également contenir d'autres informations extraites de la présente invention, notamment les analogies avec des séquences déjà connues, comme mentionné dans le Tableau 1 et/ou des informations concernant les séquences nucléotidiques et/ou de polypeptides d'autres microorganismes afin de faciliter l'analyse comparative et l'exploitation des résultats obtenus.
Parmi cesdits supports d'enregistrement, on préfère en particulier les supports lisibles par un ordinateur, tels les supports magnétiques, optiques, électriques ou hybrides, en particulier les disquettes informatiques, les CD-ROM, les serveurs informatiques. De tels supports d'enregistrement sont également objet de l'invention.
Les supports d'enregistrement selon l'invention, avec les informations apportées, sont très utiles pour le choix d'amorces ou de sondes nucléotidiques pour la détermination de gènes dans le cyanophage S-2L ou souches proches de cet organisme. De même, l'utilisation de ces supports pour l'étude du polymorphisme génétique de souche proche de du cyanophage S-2L, en particulier par la détermination des régions de colinéarité, est très utile dans la mesure où ces supports fournissent non seulement la séquence nucléotidique du génome du cyanophage S- 2L, mais également l'organisation génomique dans ladite séquence. Ainsi, les utilisations de supports d'enregistrement selon l'invention sont également des objets de l'invention. Un procédé d'étude du polymorphisme génétique entre les souches proches du cyanophage S-2L, par détermination des régions de colinéarité, peut comprendre les étapes de
- fragmentation de l'ADN chromosomal de ladite autre souche (sonication, digestion),
- séquence des fragments d'ADN,
- analyse d'homologie avec le génome du cyanophage S-2L (SEQ ID N° 1). Ce procédé qui comprend une étape d'analyse d'homologie avec le génome du cyanophage S-2L, en particulier grâce à l'aide d'un support d'enregistrement, est également l'objet de l'invention.
L'analyse d'homologie entre différentes séquences s'effectue en effet avantageusement à l'aide de logiciels de comparaisons de séquences, tels le logiciel Blast, ou les logiciels de la trousse GCG, décrits précédemment.
L'invention vise également une séquence nucléotidique telle que décrite précédemment, immobilisée sur un support, de manière covalente ou non-covalente, notamment un filtre à haute densité ou une puce à ADN.
L'invention vise également une séquence nucléotidique telle que décrite précédemment pour la détection et/ou l'amplification de séquences nucléiques.
Selon une réalisation un tel procédé de détection et d'amplification comprend par exemple les étapes suivantes : a) éventuellement, isolement de l'ADN à partir de l'échantillon biologique à analyser, ou obtention d'un ADNc à partir de l'ARN de l'échantillon biologique ; b) amplification spécifique de l'ADN du cyanophages S-2L à l'aide d'au moins une amorce selon l'invention ; c) mise en évidence des produits d'amplification.
Ce procédé est basé sur l'amplification spécifique de l'ADN, en particulier par une réaction d'amplification en chaîne.
On préfère également un procédé comprenant les étapes suivantes : a) mise en contact d'une sonde nucléotidique selon l'invention avec un échantillon biologique, l'acide nucléique contenu dans l'échantillon biologique ayant, le cas échéant, préalablement été rendu accessible à l'hybridation, dans des conditions permettant l'hybridation de la sonde à l'acide nucléique du cyanophage S-2L ; b) mise en évidence de l'hybride éventuellement formé entre la sonde nucléotidique et l'ADN de l'échantillon biologique. Un tel procédé ne doit pas être limité à la détection de la présence de l'ADN contenu dans l'échantillon biologique attesté, il peut être également mis en œuvre pour détecter l'ARN contenu dans ledit échantillon. Ce procédé englobe en particulier les Southern et Northern blot.
Ainsi, la présente invention englobe également un kit ou nécessaire pour la détection et/ou l'identification de cyanophage S-2L, caractérisé en ce qu'il comprend les éléments suivants : a) une sonde nucléotidique selon l'invention ; b) éventuellement, les réactifs nécessaires à la mise en œuvre d'une réaction d'hybridation ; c) éventuellement, au moins une amorce selon l'invention ainsi que les réactifs nécessaires à une réaction d'amplification de l'ADN. De même, la présente invention englobe également les kits ou nécessaires pour la détection et/ou l'identification de cyanophage S-2L, comprenant les éléments suivants : a) une sonde nucléotidique, dite sonde de capture, selon l'invention; b) une sonde oligonucléotidique, dite sonde de révélation, selon l'invention ; c) éventuellement, au moins une amorce selon l'invention ainsi que les réactifs nécessaires à une réaction d'amplification de l'ADN. L'invention vise également les vecteurs de clonage et/ou d'expression, qui contiennent une séquence nucléotidique selon l'invention. On préfère en particulier les séquences nucléotidiques codant pour des polypeptides impliqués dans le métabolisme nucléotides, des purines, des pyrimidines ou nucléosides.
Les vecteurs selon l'invention comportent de préférence des éléments qui permettent l'expression et/ou la sécrétion des séquences nucléotidiques dans une cellule hôte déterminée.
Le vecteur doit alors comporter un promoteur, des signaux d'initiation et de terminaison de la traduction, ainsi que des régions appropriées de régulation de la transcription. Il doit pouvoir être maintenu de façon stable dans la cellule hôte et peut éventuellement posséder des signaux particuliers qui spécifient la sécrétion de la protéine traduite. Ces différents éléments sont choisis et optimisés par l'homme du métier en fonction de l'hôte cellulaire utilisé. A cet effet, les séquences nucléotidiques selon l'invention peuvent être insérées dans des vecteurs à replication autonome au sein de l'hôte choisi, ou être des vecteurs intégratifs de l'hôte choisi.
De tels vecteurs sont préparés par des méthodes couramment utilisées par l'homme du métier, et les clones résultant peuvent être introduits dans un hôte approprié par des méthodes standard, telle que la lipofection, l'électroporation, le choc thermique, ou des méthodes chimiques.
Les vecteurs selon l'invention sont par exemple des vecteurs d'origine plasmidique ou virale. Ils sont utiles pour transformer des cellules hôtes afin de cloner ou d'exprimer les séquences nucléotidiques selon l'invention. On peut utiliser comme vecteur directement le cyanophage S-2L lui-même.
L'invention comprend également les cellules hôtes transformées par un vecteur selon l'invention.
L'hôte cellulaire peut être choisi parmi des systèmes procaryotes ou eucaryotes, par exemple les cellules bactériennes mais également les cellules de levure ou les cellules animales, en particulier les cellules de mammifères. On peut également utiliser des cellules d'insectes ou des cellules de plantes. Les cellules hôtes préférées selon l'invention sont en particulier les cellules procaryotes. Les cellules transformées selon l'invention sont utilisables dans des procédés de préparation de polypeptides recombinants selon l'invention. Les procédés de préparation d'un polypeptide d'intérêt selon l'invention sous forme recombinante, hors de l'environnement naturel, caractérisés en ce qu'ils mettent en œuvre un vecteur et/ou une cellule transformée par un vecteur selon l'invention sont eux-mêmes compris dans la présente invention. L'utilisation du cyanophage S-2L pour la production de tels peptides fait donc également partie de l'invention.
De préférence, on cultive une cellule transformée par un vecteur selon l'invention dans des conditions qui permettent l'expression dudit polypeptide d'intérêt et on récupère ledit peptide recombinant. Les cellules hôtes selon l'invention peuvent également être utilisées pour la préparation de compositions alimentaires, qui sont elles-mêmes objet de la présente invention.
Un tel procédé d'obtention de protéines d'intérêt du cyanophage S-2L, comprend selon une réalisation l'insertion de gènes d'intérêt du génome du phage S- 2L, typiquement par ligation, dans des vecteurs de clonage et d'expression, dans des conditions permettant leur expression par la prise en charge par la machinerie de replication d'un organisme hôte comme E. coli, et l'extraction des protéines produites. Les messages héréditaires du pliage recopiés sous forme d'ADN canonique sont aptes à s'exprimer comme des gènes de cyanobactéries. Les ARN messagers émis après réécriture de l'ADN de S-2L chez E. coli sont traduits en des protéines identiques à celles produites au cours de l'infection de Synechococcus par S-2L.
Selon une réalisation préférée les polypeptides d'intérêt sont des protéines impliquées dans le métabolisme de bases D, notamment la succinyladénylate synthétase .
En effet, il a été précisé plus haut qu'une base D est vraisemblablement formée par modification pré-réplicative et que des gènes cellulaires ont été recrutés à cette fin, deux voies de biosynthèse se présentant pour former le dDTP à partir d'un désoxynucléotide canonique, soit dAMP soit dGMP.
Suivant la première voie (figure 2a), le monomère activé dATP est d'emblée hydrolyse en dAMP par une enzyme du type de celle codée par dut chez E. coli (9) ou du produit du gène mutT (9), ce qui a pour double effet de barrer l'accès de dATP à la synthèse de l'ADN et de fournir le précurseur de DMP. La biosynthèse de celui- ci s'effectue suivant les deux réactions successives convertissant IMP en GMP dans le métabolisme cellulaire (9) ; le nucléotide est finalement activé en dDTP en deux étapes de phosphorylation.
Suivant la deuxième voie (figure 2b), dDMP est obtenu en appliquant à dGMP les deux réactions convertissant dans les cellules IMP en AMP (9). Si elle prend aussi comme précurseur le dATP, cette deuxième voie est plus longue car dGMP doit préalablement être synthétisé vie dIMP. Tout au long de cette deuxième voie, trois dNTP spécifiques et mutagènes sont formés (dIMP, dXMP et dSMP), contre un seul (diGMP) dans la première (figure 2a).
Comme cela sera décrit plus loin les inventeurs ont réussi à identifier un ORF codant pour une enzyme de la seconde voie, la succinyladénylate synthétase.
Selon une autre réalisation préférée, les polypeptides d'intérêt sont des polymérases de cyanophages S-2L, capables de polymériser des bases D, ce qui permet la propagation des acides nucléiques incorporant des bases D in vitro et in vivo.
Les inventeurs obtiennent en particulier des ADN polymérases spécialistes des duplex de haute stabilité et inaptes à répliquer dA pris comme constituant de la matrice ou comme monomère triphosphate. Ces ADN polymérases seront typiquement obtenues par un procédé comprenant une étape d'expression, hors de l'environnement naturel, du gène de ladite ADN polymérase dans des bactéries recombinantes.
Selon une réalisation préférée les polypeptides d'intérêt sont des polypeptides capables de modifier la transcription de l'ADN de cellules hôtes du cyanophage S-2L
En effet la transcription du génome de S-2L d'une ARN polymérase sur mesure, même si celle-ci n'est pas codée dans le phage. On sait que des enzymes de
T4 altèrent l'ARN polymérase d'E. coli. Les promoteurs présents dans le génome de
S-2L dévient du consensus connu de l'homme du métier (TATA box en particulier). II est vraisemblable que des facteurs d'amorçage de la transcription (sigma ou autre) soient codés ou modifiés par le phage, voire à ce qu'ils soient embarqués dans la capside pour permettre le déclenchement du programme viral. Quoi qu'il en soit, le séquençage effectué par les inventeurs permet d'identifier sans effort excessif certains gènes de S-2L responsables du contrôle de la transcription par altération chimique de l'ADN.
Ainsi qu'il a été dit, l'hôte cellulaire peut être choisi parmi des systèmes procaryotes ou eucaryotes. En particulier, il est possible d'identifier des séquences nucléotidiques selon l'invention, facilitant la sécrétion dans un tel système procary ote ou eucaryote. Un vecteur selon l'invention portant une telle séquence peut donc être avantageusement utilisé pour la production de protéines recombinantes, destinées à être sécrétées. En effet, la purification de ces protéines recombinantes d'intérêt sera facilité par le fait qu'elles sont présentes dans le surnageant de la culture cellulaire plutôt qu'à l'intérieur des cellules hôtes.
On peut également préparer les polypeptides selon l'invention par synthèse chimique. Un tel procédé de préparation est également un objet de l'invention. L'homme du métier connaît les procédés de synthèse chimique, par exemple les techniques mettant en œuvre des phases solides (voir notamment Steward et al., 1984, Solid phase peptides synthesis, Pierce Chem. Company, Rockford, 111, 2ème éd., (1984)) ou des techniques utilisant des phases solides partielles, par condensation de fragments ou par une synthèse en solution classique. Les polypeptides obtenus par synthèse chimique et pouvant comporter des acides aminés non naturels correspondant sont également compris dans l'invention.
L'invention comprend également les polypeptides hybrides qui comprennent au moins la séquence d'un polypeptide selon l'invention, et la séquence d'un polypeptide susceptible d'induire une réponse immunitaire chez l'homme ou l'animal. L'invention comprend également les séquences nucléotidiques qui codent pour de tels polypeptides hybrides, ou les vecteurs qui contiennent ces séquences nucléotidiques. Ce couplage entre un polypeptide selon l'invention et un polypeptide immunogène d'intérêt, peut être effectué par voie chimique, ou par voie biologique. Ainsi, selon l'invention, il est possible d'introduire un ou plusieurs élément(s) de liaison, notamment des acides aminés pour faciliter les réactions de couplage entre le polypeptide selon l'invention, et le polypeptide immunostimulateur, le couplage co valent de l'antigène immunostimulateur pouvant être réalisé à l'extrémité N ou C- terminale du polypeptide selon l'invention. Les réactifs bifonctionnels permettant ce couplage sont déterminés en fonction de l'extrémité choisie pour réaliser ce couplage, et les techniques de couplage sont bien connues de l'homme du métier. Les conjugués issus d'un couplage de peptides peuvent être également préparés par recombinaison génétique. Le peptide hybride (conjugué) peut en effet être produit par des techniques d'ADN recombinant, par insertion ou addition à la séquence d'ADN codant pour le polypeptide selon l'invention, d'une séquence codant pour le ou les peptide(s) antigène(s), inτmunogène(s) ou haptène(s). Ces techniques de préparation de peptides hybrides par recombinaison génétique sont bien connues de l'homme du métier (voir par exemple Makrides, 1996, Microbiological Reviews 60,512-538). De préférence, ledit polypeptide immunitaire est choisi dans le groupe des peptides contenant les anatoxines, notamment le toxoïde diphtérique ou le toxoïde tétanique, les protéines dérivées du Streptocoque (comme la protéine de liaison à la séralbumine humaine), les protéines membranaires OMPA et les complexes de protéines de membranes externes, les vésicules de membranes externes ou les protéines de chocs thermiques.
Les séquences nucléotidiques et vecteurs, codant pour un polypeptide hybride selon l'invention sont également objet de l'invention.
Les polypeptides hybrides selon l'invention sont très utiles pour obtenir des anticorps monoclonaux ou polyclonaux, capables de reconnaître spécifiquement les polypeptides selon l'invention. En effet, un polypeptide hybride selon l'invention permet la potentiation de la réponse immunitaire, contre le polypeptide selon l'invention couplé à la molécule immunogène. De tels anticorps monoclonaux ou polyclonaux, leurs fragments, ou les anticorps chimériques, reconnaissant les polypeptides selon l'invention, sont également objets de l'invention.
Les anticorps monoclonaux spécifiques peuvent être obtenus selon la méthode classique de culture d'hybridome décrite par Kôhler et Milstein (1975, Nature 256, 495).
Les anticorps selon l'invention sont par exemple des anticorps chimériques, des anticorps humanisés, des fragments Fab, ou F(ab')2. Il peut également se présenter sous forme d'immunoconjugué ou d'anticorps marqué afin d'obtenir un signal détectable et/ou quantifiable.
Les anticorps selon la présente invention sont notamment utilisables afin de détecter une expression d'un gène de cyanophage S-2L. En effet, la présence du produit d'expression d'un gène reconnu par un anticorps spécifique dudit produit expression peut être détectée par la présence d'un complexe antigène-anticorps formé après la mise en contact d'une bactérie recombinante exprimant un gène d'intérêt donné du cyanophage S-2L avec un anticorps selon l'invention. La souche bactérienne utilisée peut avoir été « préparée », c'est-à-dire centrifugée, lysée, placée dans un réactif approprié pour la constitution du milieu propice à la réaction immunologique. En particulier, on préfère un procédé de détection de l'expression d'un gène, correspondant à un Western blot, pouvant être effectué après une électrophorèse sur gel de polyacrylamide d'un lysat de la souche bactérienne, en présence ou en l'absence de conditions réductrices (SDS-PAGE). Après migration et séparation des protéines sur le gel de polyacrylamide, on transfère lesdites protéines sur une membrane appropriée (par exemple en nylon) et on détecte la présence de la protéine ou du polypeptide d'intérêt, par mise en contact de ladite membrane avec un anticorps selon l'invention.
Les polypeptides et les anticorps selon l'invention peuvent avantageusement être immobilisés sur un support, notamment une puce à protéines. Une telle puce à protéines est un objet de l'invention, et peut également contenir au moins un polypeptide d'un microorganisme autre que le cyanophage S-2L ou un anticorps dirigé contre un composé d'un microorganisme autre que cyanophage S-2L.
Les puces à protéines ou filtres à haute densité contenant des protéines selon l'invention peuvent être construits de la même manière que les puces à ADN selon l'invention. En pratique, on peut effectuer la synthèse des polypeptides fixés directement sur la puce à protéines, ou effectuer une synthèse ex situ suivie d'une étape de fixation du polypeptide synthétisé sur ladite puce. Cette dernière méthode est préférable, lorsque l'on désire fixer des protéines de taille importante sur le support, qui sont avantageusement préparées par génie génétique. Toutefois, si l'on ne désire fixer que des peptides sur le support de ladite puce, il peut être plus intéressant de procéder à la synthèse desdits peptides directement in situ.
De préférence, on fixe un anticorps selon l'invention sur le support de la puce à protéines, et on détecte la présence de l'antigène correspondant, spécifique de Cyanophage S-2L ou d'un microorganisme associé.
Une puce à protéines ci-dessus décrite peut être utilisée pour la détection de produits de gènes, pour établir un profil d'expression desdits gènes, en complément d'une puce à ADN selon l'invention.
Les puces à protéines selon l'invention sont également extrêmement utiles pour les expériences de protéomique, qui étudie les interactions entre les différentes protéines d'un microorganisme donné. De façon simplifiée, on fixe des peptides représentatifs des différentes protéines d'un organisme sur un support. Puis, on met ledit support en contact avec des protéines marquées, et après une étape optionnelle de rinçage, on détecte des interactions entre lesdites protéines marquées et les peptides fixés sur la puce à protéines.
Ainsi, les puces à protéines comprenant une séquence polypeptidique selon l'invention ou un anticorps selon l'invention sont objet de l'invention, ainsi que les kits ou nécessaires les contenant. De préférence, les amorces et/ou sondes et/ou polypeptides et/ou anticorps selon la présente invention utilisés dans les procédés selon la présente invention sont choisis parmi les amorces et/ou sondes et/ou polypeptides et/ou anticorps spécifiques du Cyanophage S-2L
La présente invention a également pour objet les souches de Cyanophage S-2L et/ou de microorganismes associés contenant une ou plusieurs mutation(s) dans une séquence nucléotidique selon l'invention, en particulier une séquence ORF, ou leurs éléments régulateurs (en particulier promoteurs).
On préfère, selon la présente invention, les souches de Cyanophage S-2L présentant une ou plusieurs mutation(s) dans les séquences nucléotidiques codant pour des polypeptides impliqués dans le métabolisme des bases D, la replication et la transcription.
Lesdites mutations peuvent mener à une inactivation du gène, ou en particulier lorsqu'elles sont situées dans les éléments régulateurs dudit gène, à une surexpression de celui-ci. Ainsi, on recherche en particulier des souches de Cyanophage S-2L surexprimant un polypeptide selon l'invention, impliquées dans les fonctions relatives à la synthèse de bases D ou de polynucléotides incorporant au moins une base D.
L'art antérieur fait état de la connaissance du métabolisme spécifique du de cyanophage S-2L, conduisant à la synthèse de bases D au lieu de bases A. Toutefois, jusqu'à présent, sans connaître la séquence exacte du cyanophage S-2L, l'homme du métier n'avait pas à sa disposition les séquences ORF codantes et donc ne pouvait effectivement notamment cloner une séquence ORF donnée, tester l'activité biologique correspondante et exprimer des polypeptides d'intérêt. Ce type de procédé est désormais possible grâce au séquençage du génome du cyanophage S-2L effectué par les inventeurs.
Même sans connaître exactement à ce stade avec certitude la voie de synthèse des bases D, les inventeurs ont réussi à identifier des séquences codantes impliquées dans cette voie métabolique. En testant successivement, mais sans effort excessif pour l'homme du métier, la fonction biologique des ORF susceptibles d'intervenir dans cette voie métabolique à partir des résultats obtenus (plus spécialement les ORF du groupe des polypeptides intervenant dans le métabolisme nucléotides, des purines, des pyrimidines ou nucléosides), les inventeurs peuvent donc repérer celles qui codent pour les protéines déterminant cette voie.
L'invention concerne également selon un autre aspect l'utilisation des séquences polypeptidiques telles que décrites précédemment pour la production de bases D et ou de séquences polynucléotidiques comprenant des bases D. Ces séquences polynucléotidiques seront notamment des séquences ADN, ou ARN, en particulier des ARNm.
L'invention concerne selon un autre aspect un procédé d'obtention de bases D et/ou de polynucléotides d'intérêt comprenant au moins une base D, ledit procédé comportant la culture d'un microorganisme contenant au moins une séquence nucléotidique de cyanophage S-2L codante pour au moins un polypeptide impliqué dans la synthèse de bases D, dans des conditions appropriées pour le développement du vecteur et la synthèse de bases D. Tpiquement le microorganisme cultivé comprend un vecteur tel que décrit précédemment contenant la ou lesdites séquences nucléotidiques de cyanophage S-2L codantes. Selon une réalisation un tel procédé comprend :
- l'addition à un milieu comprenant les substrats nécessaires à l'obtention de bases D, d'un extrait ou mélange d'extraits de bactéries recombinantes exprimant au moins un gène de cyanophage S-2L impliqué dans la synthèse de bases D - le cas échéant l'extraction de bases D et/ou dédits polynucléotides d'intérêt. Selon une réalisation un tel procédé comprend :
- la préparation d'au moins une séquence ADN codante pour un polypeptide capable de provoquer chez un microorganisme hôte la synthèse d'au moins une base D
- le clonage de ladite séquence codante dans un vecteur capable d'être tranféré dans et de se répliquer dans ledit microorganisme hôte, ce vecteur comprenant les éléments nécessaires à l'expression de ladite séquence codante
- le transfert du vecteur comprenant ladite séquence codante dans un microorganisme capable de produire les enzymes de la synthèse de bases D dirigée par ladite séquence codante
- la culture du microorganisme dans des conditions appropriées pour le développement du vecteur et la synthèse des bases D
- le cas échéant l'extraction de bases D et/ou dédits polynucléotides d'intérêt. Comme sela sera décrit plus loin, les inventeurs ont réussi à cloner de l'ADN contenant des bases D, en utilisant des enzymes de restriction dont les sites de restriction ne possèdent pas de base A, notamment Smal (site CCCGGG), SacII (site CCGCGG), Mspl (site CCGG), BspRI (site GGCC). Les inventeurs ont montré que des enzymes de restriction comprenant au moins une base A n'hydrolysent pas l'ADN de S-2L : BamHl (GCATCC), EcoRI (GAATTC), HindlII (AAGCTT), Sau3AI (GATC). Pour cela les inventeurs sont allés à l'encontre d'un préjugé technique, à savoir que le clonage d'un ADN comprenant des bases D pourrait conduire à des ambiguïtés de copie lors du clonage. En effet, comme indiqué sur la figure 4, le clonage de « D DNA » chez E.Coli, est susceptible de conduire à des séquences différentes de celles issues du clonage de « A DNA ».
L'invention concerne selon un autre aspect un procédé d'obtention de bases D et/ou de polynucléotides d'intérêt comprenant au moins une base D ledit procédé comportant :
- l'addition, à un milieu comprenant les substrats nécessaires à l'obtention de bases D, du produit d'expression d'au moins un gène de cyanophage S-
2L impliqué dans la synthèse de bases D, de manière à produire des bases D et/ou des polynucléotides d'intérêt comprenant au moins une base D
- le cas échéant l'extraction des bases D et/ou dédits polynucléotides d'intérêt. Dans les procédés mentionnés ci-dessus, par synthèse de bases D et/ou de polynucléotides comprenant au moins une base D, on entend que les conditions de la synthèse sont telles que l'on obtienne uniquement ou essentiellement des bases D, ou uniquement ou essentiellement des polynucléotides comprenant au moins une base D, ou à la fois des bases D et des polynucléotides comprenant au moins une base D dans des quantités souhaitées. Les quantités produites de bases D et de polynucléotides comprenant au moins une base D dépendront notamment du contrôle de l'expression de protéines impliquées dans la synthèses des bases D et dans l'incorporation des bases D lors de l'élongation des chaînes polynucléotidiques.
Selon un autre aspect l'invention concerne un procédé d'obtention de polynucléotides d'intérêt comprenant au moins une base D, ledit procédé comprenant la culture d'un microorganisme contenant au moins une séquence nucléotidique de cyanophage S-2L codante pour au moins un polypeptide impliqué dans l'élongation desdits polynucléotides avec incorporation de bases D, ADN polymérase notamment, dans des conditions appropriées pour le développement du vecteur et l'élongation desdits polynucléotides.
Selon un autre aspect l'invention concerne l'utilisation du cyanophage S-2L pour la production de réactifs utiles pour des réactions PCR ou PCR Like faisant intervenir des bases D. En particulier selon un mode de réalisation préféré ces réactifs seront des monomères dDTP.
En effet, le monomère dDTP est un bon substrat des ADN polymérases du cyanophage S-2L, et des matrices comportant la base D sont efficacement répliquées (1). La production biotechnologique de dD, dDMP et dDTP s'applique ainsi aux techniques de PCR, en augmentant la stabilité thermique des duplex, ou en masquant et en démasquant de nombreux sites de restriction (10). On entend que cette production n'est pas une production dans l'environnement naturel, la production dans l'environnement naturel signifiant une production par le cyanophage S-2L lui- même.
L'invention concerne également un procédé de production de polynucléotides d'intérêt comprenant au moins une base D, ledit procédé comportant une étape d'amplification, en présence de polymérase de cyanophage D et d'amorces appropriées, de polynucléotides comprenant au moins une base D. Grâce à ce procédé, selon une technique de type PCR ou PCR like, à partir d'un polynucléotide d'intérêt comprenant au moins une base D de séquence connue, on obtient un grand nombre d'exemplaires de ce nucléotide. Selon une réalisation le gène impliqué dans la synthèse de polynucléotides d'intérêt comprenant au moins une base D est le gène de la succinyladénylate synthétase. En effet, la succinyladénylate synthétase (ddba) catalyse la réaction de dGMP au dSMP lui-même transformé en dDMP (figure 2). Selon une réalisation les polynucléotides d'intérêt sont des nucléosides d'intérêt thérapeutique.
Selon une réalisation, les polynucléotides d'intérêt sont produits par hémisynthèse ou par fermentation.
L'invention concerne en outre un procédé de sélection de composés capables de stimuler ou d'inhiber la synthèse de bases D et/ou de polynucléotides d'intérêt incorporant au moins une base D, comprenant l'addition au milieu de synthèse du composé testé et la comparaison de la synthèse en présence et en absence dudit composé.
L'invention concerne selon un autre aspect l'utilisation des séquences nucléotidiques de cyanophage S-2L telles que décrites précédemment pour tester leur fonction dans le métabolisme des nucléotides, des purines, des pyrimidines ou nucléosides, la replication et la transcription.
Selon un autre aspect l'invention concerne l'utilisation du cyanophage S-2L pour la détermination de gènes permettant de réparer les mésappariements G :T ou iG :T survenant par désamination.
En effet, la base D elle-même est connue comme un mutagène chez E. coli. Ce fait pourrait s'expliquer par le fait que la désamination de D à la position 2 mène à l'isoguanine (iG), dont il a été récemment montré que le désoxynucléoside est mutagène (M. Bouzon, P. Marlière, résultats non publiés). La désamination de D à la position 6 mène à la guanine. Que cette dernière réaction de désamination survienne après incorporation de D dans l'ADN, elle résultera en une mutation au cycle de replication suivant. Grâce au séquencage réalisé, l'identification de gènes aptes à réparer les mésappariements G:T ou iG:T survenant par désamination est désormais possible. Selon un autre aspect l'invention concerne l'utilisation du cyanophage S-2L pour l'identification de gènes et la production de protéines capables de régénérer des 5'-termini. En effet, la replication de l'ADN du cyanophage, dont la stabilité est élevée (7,8), pourrait par ailleurs exiger des protéines auxiliaires (hélicase, S SB) sur mesure. Le génome est constitué d'un duplex linéaire, ce qui suppose une machinerie de régénération des 5'-termini, comme l'endonucléase utilisée pour résoudre les concatémères chez T7 (4), ou la protéine d'adduction en 5' chez phi29 (6), dont l'activité pourrait nécessiter la présence de D dans leurs substrats.
Selon un autre aspect l'invention concerne l'utilisation du cyanophage S-2L pour l'identification de gènes capables de moduler l'activité des ribosomes
En effet, le cyanophage S-2L est par ailleurs susceptible de former un précurseur ribonuclotidique portant la base D, pour le réduire ensuite en un désoxyribonucléotide correspondant, comme il advient pour les quatre bases de l'ARN (9). Dans ce cas, la transcription et la traduction des gènes phagiques pourraient s'effectuer via l'utilisation de codons, voire de tARNs comme chez T4 et T5, comportant cette base. Si une telle option a été empruntée par le phage, il est possible que certains de ses gènes modulent l'activité des ribosomes.
Selon un autre aspect l'invention concerne l'utilisation du cyanophage S-2L pour l'identification ou la production de composés inhibiteurs de la biosynthèse des nucléotides puriques.
En effet les génomes phagiques spécifient toute une gamme d'inhibiteurs ayant pour cible des enzymes cellulaires telles que la thymidylate synthase, la dUTPase, etc. (11). Dans le cas de S-2L, les inventeurs peuvent désormais identifier des inhibiteurs capables d'affecter la biosynthèse des nucléotides puriques.
L'invention concerne ainsi également un procédé utilisant de tels inhibiteurs pour contrôler le métabolisme ou l'expression génétique de cellules susceptibles d'être infectées par un cyanophage S2L, notamment des cyanobactéries.
Dans la mesure où le contrôle du métabolisme des acides nucléiques ou nucléosides, en particulier des pyrimidines de l'ADN, est très utile en chimiothérapie et génothérapie (2), l'invention concerne aussi un procédé utilisant de tels inhibiteurs pour contrôler ce métabolisme.
D'autres aspects et avantages de l'invention apparaîtront à la lecture de la description qui suit illustrée par les figures dans lesquelles : - la figure 1 représente quelques exemples de bases modifiées
- les figures 2a et 2b représentent deux voies de biosynthèses possibles pour la synthèse de bases D par le cyanophage S-2L, la voie de la figure 2b étant la plus vraisemblable
- la figure 3 illustre schématiquement le génome du cyanophage S-2L
- la figure 4 représente schématiquement la difficulté potentielle du clonage de gènes incorporant des bases D chez E.Coli.
Des cyanophages S2L sont cultivés en masse à partir de l'espèce
Synechococcus elongatus (8). L'ADN extrait est fragmenté par sonication pour constituer une banque shotgun clonée dans un vecteur chez E. coli. Les clones sont séquences intensivement sur un séquenceur jusqu'à couverture complète du génome.
A mesure que des ORF sont élucidés comme homologues à des gènes connus, il est procédé à leur expression chez E. coli ou chez Synechococcus, selon les fonctions supposées, notamment dans le but de valider les hypothèses fonctionnelles ou d'explorer les potentialités synthétiques.
A cette fin, les intermédiaires supposés des voies de synthèse (figure 2) ont été synthétisés suivant les méthodes courantes de la chimie des nucléosides et nucluéotides. Ils sont systématiquement soumis à des extraits ou des mélanges d'extraits de souches recombinantes exprimant chacune un gène de S-2L, pour identifier les activités enzymatiques spécifiées par le phage.
Plus précisément, l'ADN du phage S-2L a été préparé à partir de lysat de culture de Synechoccus. elongatus en adaptant les techniques utilisées pour préparer l'ADN du phageλ. Cet ADN a été digéré par différentes enzymes de restriction dont Smal, ce qui a permis de vérifier que le profil de restriction obtenu était identique à celui décrit. Puis, on a montré que l'ADN de S-2L peut être répliqué chez E. coli et séquence selon les protocoles standard, ce qui a conduit à construire une banque totale. Cette banque a été construite par insertion de fragments d'ADN digéré par l'enzyme CviJI (de taille comprise entre 3 et 5 kb) dans le plasmide pBAM digéré par l'enzyme Smal et déphosphorylé. Après électroporation de la souche d'E. coli DH10B, 400 clones ont été isolés et parmi ceux-ci 330 séquences (290 dans les deux orientations, 40 dans l'orientation + ou -) au Genoscope France. Les lectures ont été assemblées en un seul contig de 44,16 kb dont la composition en bases est conforme à celle de l'ADN du phage, c'est-à-dire 69,3 % G:C et 30,7% A:T (à la place de D:T). L'ensemble des ORFs déduites de ce contig a été comparé aux différentes banques de doimées, ce qui a permis d'annoter tout particulièrement 54 d'entre elles représentées sur le tableau 1 et tout particulièrement 14 d'entre elles (en ne tenant compte que des homologies statistiquement significatives avec des protéines bactériennes ou phagiques connues) mentionnées « très significatives » sur le tableau 1.
Figure imgf000042_0001
Figure imgf000043_0001
Il s'agit notamment des protéines intervenant dans la formation et l'assemblage de la queue du bactériophage λ : protéine de la queue MLKI et J, de la protéine GP17 qui joue un rôle dans le packaging de l'ADN dans le bactériophage T4, d'une exonucléase qui pourrait intervenir dans l'exclusion de la base A, d'une RNA hélicase, d'un facteur sigma et d'une succinyladénylate synthétase.
L'identification de gènes codant pour un facteur sigma et une hélicase conduisent à conclure que la transcription du génome de S-2L et la replication de l'ADN du cyanophage requièrent vraisemblablement des protéines spécifiques codées par le phage et dont l'activité pourrait dépendre de la base D.
D'autre part, il semble très vraisemblable que la base D soit formée par modification hémiréplicative. Entre les deux voies de biosynthèse de formation de dDTP décrites ci-dessus, l'identification d'un homologue du gène de la succinyladénylate synthétase appelée ddbA (pour désoxyribodiaminopurine biosynthetic gène A) conduisent à conclure que c'est la deuxième voie qui est vraisemblablement empruntée lors de l'infection phagique (figure 2). Plusieurs tests ont été effectués dans le but de déterminer l'activité de la protéine correspondante. Les résultats suggèrent que l'expression de ddbA permet de restaurer la croissance d'une souche d'E. coli exprimant le gène yaaG de Bacillus subtilis en présence d'une concentration élevée de dG (lOmM). D'autre part, la 2,6- diaminopurine devient toxique (lOmM) pour Ε. coli lorsqu'elle est sous forme phosphorylée (ce qui a été testé dans la même souche d'Ε. coli exprimant le gène yaaG de Bacillus subtilis soit MG1655 pSU yaaG) ce qui permet d'avoir un crible pour identifier in vivo la voie complète de biosynthèse de la base D. Toutefois l'identification complète n'est pas nécessaire pour obtenir dès à présent des bases D par les procédés décrits précédemment.
Une autre approche consiste à exprimer systématiquement les ORF spécifiant tous les gènes possibles de S-2L et à combiner les activités brutes résultant de cette expression pour faire apparaître in vitro les métabolites de la voie. Une voie métabolique inductible produisant le dDTP sera ensuite édifiée chez E. coli par assemblage des gènes appropriés. La voie ainsi édifiée sera appliquée à des précurseurs synthétiques pour générer des nucléotides déviants par la base et le sucre.
L'utilisation de la base D dans les processus de replication et de transcription est systématiquement recherchée dans les extraits des bactéries exprimant les ORF phagiques.
Les résultats ci-dessus ont été obtenus à l'aide des travaux suivants. Le gène ddbA a été exprimé chez E. coli sous le contrôle d'un promoteur inductible et plusieurs tests ont été effectués dans le but de déterminer l'activité de la protéine correspondante. Les résultats obtenus montrent que l'expression de ddbA permet de restaurer la croissance d'E. coli en présence d'une concentration élevée de dGMP. D'autre part, la 2,6-diaminopurine devient toxique pour E. coli lorsqu'elle est sous forme phosphorylée ce qui devrait permettre d'avoir un crible pour identifier in vivo la voie complète de biosynthèse de la base D. Le gène ddbA a été amplifié en utilisant 100 pmol de chaque oligonucléotide ngaattcaagctttcagcgacggtagcgggcatac et nnnnccatggtgaagaactgcaacctgatc, lOOng d'ADN de S-2L comme ADN matrice, 200mM de chaque dNTPs, 10 ml de tampon Pfu polymérase 10 fois concentré, DMSO 10%> et 5U Pfu polymérase. Les cycles d'amplification étaient : une étape de 10 min à 95°C, puis 25 cycles 95°C 30 sec, 56°C 30 sec, 72°C 2 min 20 sec puis une étape de 10 min à 72°C. Le produit d'amplification a ensuite été purifié à l'aide du Kit
Jetsorb (Genomed GmbH) puis digéré par les enzymes de restriction Ncol et HindlII.
Après purification, le produit d'amplification a été inséré dans le plasmide pBAD24 (Guzman et al., 1995 J Bacteriol 177:4121-4130) digéré par les mêmes enzymes de restriction. Le gène ddbA est dans cette construction exprimé à partir du promoteur de l'opéron araBAD qui est inductible par l'arabinose.
La banque de cyanophage S2L est maintenue dans la souche d'E.Coli B2033 déposée le 24 janvier 2001 à la Collection Nationale de Cultures de Microorganismes, Institut Pasteur, 25 rue du Dr Roux, 75724 PARIS Cedex 15, France, selon les provisions du traité de Budapest, et a été enregistrée sous le numéro d'ordre 1-2619.
Grâce aux travaux réalisés par les inventeurs, le séquencage du génome de S-
2L permet d'altérer, d'inhiber ou de diversifier la synthèse des acides nucléiques in vitro et in vivo.

Claims

REVENDICATIONS
1. Séquence nucléotidique de cyanophage S-2L caractérisée en ce qu'elle correspond à SEQ ID N° 1.
2. Séquence nucléotidique de cyanophage S-2L, caractérisée en ce qu'elle est choisie parmi : a) une séquence nucléotidique comportant au moins 80 % d'identité avec SEQ ID N° 1 ; b) une séquence nucléotidique hybridant dans des conditions de forte stringence avec SEQ ID N° 1 ; c) une séquence nucléotidique complémentaire de SEQ ID N° 1 ou complémentaire d'une séquence nucléotidique telle que définie en a), ou b), ou une séquence nucléotidique de l'ARN correspondant ; d) une séquence nucléotidique de fragment représentatif de SEQ ID N° 1, ou de fragment représentatif d'une séquence nucléotidique telle que définie en a), b) ou c); e) une séquence nucléotidique comprenant une séquence telle que définie en a), b), c) ou d) ; et f) une séquence nucléotidique modifiée d'une séquence nucléotidique telle que définie en a), b), c), d) ou e).
3. Séquence nucléotidique selon la revendication 2, caractérisée en ce qu'elle code pour un polypeptide choisi parmi : a) les polypeptides du cyanophage S-2L de séquences SEQ ID N°2 à SEQ ID
N°527 ; b) de préférence les polypeptides de séquence SEQ ID
N°14,18526,68,86,92,1055109,134,142,143,148,152,169,175,187, 208,211, 234,246, 250,257,264,286,298,316,332,342,347,348,351,355,364,365, 369,370,392,395, 406, 418,422,425,429,432,433,454,464,466,472,
484,489,494,500 ; c) de préférence encore les polypeptides de séquence SEQ ID N° 86,92,152,175, 234,257,298,316,395,406,425,484 ; d) les polypeptides présentant au moins 80 % de préférence 85 %, 90 %, 95 % et
98 % d'identité avec un polypeptide de a), b) ,c) e) les fragments biologiquement actifs des polypeptides de a), b), c), d) f) les polypeptides modifiés de a),b),c),d),e).
4. Séquence nucléotidique caractérisée en ce qu'elle comprend une séquence nucléotidique choisie parmi : a) une séquence nucléotidique selon la revendication 3 ; b) une séquence nucléotidique comportant au moins 80 % d'identité avec une séquence nucléotidique selon la revendication 3 ; c) une séquence nucléotidique s 'hybridant dans des conditions de forte stringence avec une séquence nucléotidique selon la revendication 3 ; d) une séquence nucléotidique complémentaire ou d'ARN correspondant à une séquence telle que définie en a), b) ou c) ; e) une séquence nucléotidique de fragment représentatif d'une séquence telle que définie en a), b), c) ou d) ; et f) une séquence nucléotidique modifiée d'une séquence telle que définie en a), b), c), d) ou e).
5. Polypeptide codé par une séquence nucléotidique selon l'une des revendications 2 à 4.
6. Polypeptide selon la revendication 5, caractérisé en ce qu'il est choisi parmi les peptides de séquence SEQ ID N°2 à 527, de préférence parmi les séquences
SEQ ID N°14,18,26,68,86,92,105,109,134,142,143,148,152, 169,175,187, 208,211,234,246,250,257,264,286,298,316,332,342,347,348, 351,355,364,365, 369,370,392,395,406,418,422,425,429,432,433,454,464, 466,472,484,489,494,500.
7. Polypeptide selon la revendication 5 ou 6, caractérisé en ce qu'il est choisi parmi les séquences SEQ ID N° 86,92,152,175,234,257,298,316,395,406,425,
484.
8. Polypeptide caractérisé en ce qu'il comprend un polypeptide choisi parmi : a) un polypeptide selon l'une des revendications 5 à 7 ; b) un polypeptide présentant au moins 80 % d'identité avec un polypeptide selon l'une des revendications 5 à 7 ; c) un fragment d'au moins 5 acides aminés d'un polypeptide selon l'une des revendications 5 à 7, ou tel que défini en b) ; d) un fragment biologiquement actif d'un polypeptide selon l'une des revendications 5 à 7, ou tel que défini en b) ou c) ; et e) un polypeptide modifié d'un polypeptide selon l'une des revendications 5 à 7 ou tel que défini en b), c) ou d).
9. Séquence nucléotidique selon l'une des revendications 2 à 4, caractérisée en ce qu'elle code pour un polypeptide de cyanophage S-2L impliqué dans la biosynthèse des nucléotides, des purines, des pyrimidines ou nucléosides ou pour l'un de ses fragments représentatifs.
10. Séquence nucléotidique selon l'une des revendications 2 à 4, caractérisée en ce qu'elle code pour un polypeptide de cyanophage S-2L impliqué dans la biosynthèse de bases D ou pour l'un de ses fragments représentatifs.
11. Séquence nucléotidique selon la revendication 10, caractérisée en ce qu'elle code pour un peptide de séquence SEQ ID N° 175.
12. Séquence nucléotidique selon l'une des revendications 2 à 4, caractérisée en ce qu'elle code pour un polypeptide de Cyanophage S-2L impliqué dans le processus de replication, ou pour l'un de ses fragments représentatifs, de préférence un peptide de séquence SEQ ID N°14,18,142,355,429,454
(activité ADN polymérase, topoisomérase).
13. Séquence nucléotidique selon l'une des revendications 2 à 4, caractérisée en ce qu'elle code pour un polypeptide de Cyanophage S-2L impliqué dans le processus de transcription ou pour l'un de ses fragments représentatifs, de préférence un peptide de séquence SEQ ID N°92,143, 187,234 encore de préférence SEQ ID N°92.
14. Séquence nucléotidique selon l'une des revendications 2 à 4, caractérisée en ce qu'elle code pour un polypeptide d'enveloppe de Cyanophage S-2L ou l'un de ses fragments représentatifs, de préférence un peptide de séquence SEQ ID N°169,316,351,392,395,406,422,425, notamment un peptide de séquence SEQ ID N°395,406,425.
15. Séquence nucléotidique selon l'une des revendications 2 à 4, caractérisée en ce qu'elle code pour un polypeptide de Cyanophage S-2L impliqué dans le détournement de la machinerie cellulaire ou l'un de ses fragments représentatifs.
16. Séquence nucléotidique selon l'une des revendications 2 à 4, caractérisée en ce qu'elle code pour un polypeptide de Cyanophage S-2L impliqué dans la virulence ou l'un de ses fragments représentatifs, de préférence un peptide de séquence SEQ ID N°257.
17. Polypeptide selon l'une des revendications 5 à 8, caractérisé en ce qu'il s'agit d'un polypeptide de Cyanophage S-2L impliqué dans la biosynthèse des nucléotides, des purines, des pyrimidines ou nucléosides.
18. Polypeptide selon l'une des revendications 5 à 8, caractérisé en ce qu'il s'agit d'un polypeptide de Cyanophage S-2L impliqué dans la biosynthèse de bases D, de préférence un peptide de séquence SEQ ID N°175 ou un fragment représentatif.
19. Polypeptide selon l'une des revendications 5 à 8, caractérisé en ce qu'il s'agit d'un polypeptide de Cyanophage S-2L impliqué dans le processus de replication, de préférence un peptide de séquence SEQ ID N°14,18,142,355,429,454 ou un fragment représentatif.
20. Polypeptide selon l'une des revendications 5 à 8, caractérisé en ce qu'il s'agit d'un polypeptide de Cyanophage S-2L impliqué dans le processus de transcription, de préférence un peptide de séquence SEQ ID N°92,143,187 ou un fragment représentatif.
21. Polypeptide selon l'une des revendications 5 à 8, caractérisé en ce qu'il s'agit d'un polypeptide d'enveloppe de Cyanophage S-2L, de préférence un peptide de séquence SEQ ID N°169,316,351,392,395,406,422,425 ou un fragment représentatif.
22. Polypeptide selon l'une des revendications 5 à 8, caractérisé en ce qu'il s'agit d'un polypeptide de Cyanophage S-2L impliqué dans le métabolisme intermédiaire, ou un fragment représentatif.
23. Polypeptide selon l'une des revendications 5 à 8, caractérisé en ce qu'il s'agit d'un polypeptide de Cyanophage S-2L impliqué dans le processus de détournement de la machinerie cellulaire ou l'un de ses fragments.
24. Puce à ADN ou filtre, caractérisée en ce qu'elle contient au moins une séquence nucléotidique selon l'une quelconque des revendications 2 à 4.
25. Vecteur de clonage, et/ou d'expression, caractérisé en ce qu'il contient une séquence nucléotidique selon l'une des revendications à 3 ou 4 ou 9 à 16.
26. Vecteur de clonage, et/ou d'expression selon la revendication 25, caractérisé en ce qu'il contient une séquence nucléotidique selon la revendication 10 ou 11, en particulier codant pour une protéine impliquée dans la synthèse de bases D.
27. Vecteur de clonage, et/ou d'expression selon la revendication 25, caractérisé en ce qu'il contient une séquence nucléotidique selon la revendication 11 ou 12, en particulier codant pour une polymérase capable de polymériser des bases D.
28. Cellule hôte, caractérisée en ce qu'elle est transformée par un vecteur selon l'une des revendications 25 à 27.
29. Cellule hôte selon la revendication 28, caractérisée en ce qu'il s'agit d'une bactérie.
30. Procédé de préparation d'un polypeptide d'intérêt, caractérisé en ce que l'on cultive une cellule transformée par un vecteur selon l'une des revendications 25 à 27 dans des conditions permettant l'expression dudit polypeptide et que l'on récupère ledit polypeptide recombinant.
31. Procédé selon la revendication 30, caractérisé en ce que le polypeptide d'intérêt est une protéine impliquée dans le métabolisme de bases D, notamment la succinyladénylate synthétase.
32. Procédé selon la revendication, caractérisé en ce que le polypeptide d'intérêt est une polymérase de cyanophages S-2L, capable de polymériser des bases D.
33. Polypeptide recombinant susceptible d'être obtenu par un procédé selon la revendication 30.
34. Anticorps monoclonal ou polyclonal, ses fragments, ou anticorps chimérique, caractérisé en ce qu'il est capable de reconnaître spécifiquement un polypeptide selon l'une des revendications 5 à 8 ou 17 à 23.
35. Anticorps selon la revendication 34, caractérisé en ce qu'il s'agit d'un anticorps marqué.
36. Puce à protéine, caractérisée en ce qu'elle contient au moins un polypeptide selon l'une des revendications 5 à 8 ou 17 à 23, ou au moins un anticorps selon l'une des revendications 34 ou 35, immobilisé sur le support de ladite puce.
37. Procédé de détection et/ou d'identification du cyanophage S-2L ou d'un phage associé dans un échantillon biologique, caractérisé en ce qu'il met en œuvre une séquence nucléotidique selon l'une des revendications 3 à 4 ou 9 à 16.
38. Procédé d'obtention de bases D et/ou de polynucléotides d'intérêt comprenant au moins une base D, comportant la culture d'un microorganisme comprenant au moins une séquence nucléotidique de cyanophage S-2L codante pour au moins un polypeptide impliqué dans la synthèse de bases D, dans des conditions appropriées pour le développement du vecteur et la synthèse de bases D et/ou dédits polynucléotides d'intérêt.
39. Procédé selon la revendication 38 comportant : l'addition à un milieu comprenant les substrats nécessaires à l'obtention de bases D, d'un extrait ou un mélange d'extrait de bactéries recombinantes exprimant au moins un gène de cyanophage S-2L impliqué dans la synthèse de bases D le cas échéant l'extraction des polynucléotides d'intérêt.
40. Procédé selon la revendication 38 comportant :
- la préparation d'au moins une séquence ADN codante pour un polypeptide capable de provoquer chez un microorganisme hôte la synthèse d'au moins une base D
- le clonage de ladite séquence codante dans un vecteur capable d'être tranféré dans et de se répliquer dans ledit microorganisme hôte, ce vecteur comprenant les éléments nécessaires à l'expression de ladite séquence codante le transfert du vecteur comprenant ladite séquence codante dans un microorganisme capable de produire les enzymes de la synthèse de bases D dirigée par ladite séquence codante la culture du microorganisme dans des conditions appropriées pour le développement du vecteur et la synthèse des bases D le cas échéant l'extraction de bases D et/ou dédits polynucléotides d'intérêt.
41. Procédé d'obtention de bases D et/ou de polynucléotides d'intérêt comprenant au moins une base D ledit procédé comportant : l'addition, à un milieu comprenant les substrats nécessaires à l'obtention de bases D, du produit d'expression d'au moins un gène de cyanophage S- 2L impliqué dans la synthèse de bases D, de manière à produire des bases D et/ou des polynucléotides d'intérêt comprenant au moins une base D - l'extraction des bases D et/ou dédits polynucléotides d'intérêt.
42. Procédé d'obtention de polynucléotides d'intérêt comprenant au moins une base D, ledit procédé comprenant la culture d'un microorganisme contenant au moins une séquence nucléotidique de cyanophage S-2L codante pour au moins un polypeptide impliqué dans l'élongation desdits polynucléotides avec incorporation de bases D, ADN polymérase notamment, dans des conditions appropriées pour le développement du vecteur et l'élongation desdits polynucléotides.
43. Procédé selon l'une quelconque des revendications 38 à 42 caractérisé en ce que le gène impliqué dans la synthèse de bases D est le gène de la succinyladénylate synthétase.
44. Procédé selon l'une quelconque des revendications 38 à 42 caractérisé en ce qu'il comprend une étape d'amplification, en présence de polymérase de cyanophage
D et d'amorces appropriées, de polynucléotides comprenant au moins une base D.
45. Procédé de sélection de composés capables de stimuler ou d'inhiber la synthèse de bases D et/ou de polynucléotides d'intérêt comprenant au moins une base D, comprenant l'addition au milieu de synthèse du composé testé et la comparaison de la synthèse en présence et en absence dudit composé.
46. Utilisation du cyanophage S-2L pour l'obtention d'ADN polymérase ou d'ARN polymérase impliquées dans le métabolisme des bases D.
47. Utilisation du cyanophage S-2L pour la fabrication de nucléotides d'intérêt non obtenus naturellement comprenant au moins une base D, dDMP et dDTP.
48. Souche de Cyanophage S-2L déposée à la CNCM n° 1-2619 caractérisée en ce qu'elle contient au moins une séquence nucléotidique selon la revendication 1 à 4,
49. Procédé de production d'une banque génomique de cyanophage S2L caractérisée en ce que le procédé comprend les étapes suivantes : a) Culture des cyanophages S2L purifié à partir de l'espèce Synechococcus, b) Fragmentation de l'ADN extrait par la technique de sonication, c) Clonage de la banque Shotgun obtenue dans un vecteur E.coli, et d) Séquençage des clones jusqu'à couverture complète du génome.
50. Banque génomique de cyanophage S2L déposée le 24 janvier 2001 à la C.N.C.M. selon les provisions du traité de Budapest, et enregistrées sous le numéro d'accession I- 2619 obtenue par un procédé selon la revendication 49.
51. Plasmides contenus dans des bactéries recombinantes déposées à la C.N.C.M. sous la référence 1-2619.
52. Bactéries recombinantes telles que déposées à la C.N.C.M. sous la référence 1-2619.
PCT/FR2003/001328 2002-04-30 2003-04-28 Banque genomique du cyanophage s-2l et analyse fonctionnelle WO2003093461A2 (fr)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US10/510,953 US20060270005A1 (en) 2002-04-30 2003-04-28 Genomic library of cyanophage s-2l and functional analysis
AU2003249159A AU2003249159A1 (en) 2002-04-30 2003-04-28 Genomic library of cyanophage s-2l and functional analysis
CA002483706A CA2483706A1 (fr) 2002-04-30 2003-04-28 Banque genomique du cyanophage s-2l et analyse fonctionnelle
EP03747467A EP1499713A2 (fr) 2002-04-30 2003-04-28 Banque genomique du cyanophage s-2l et analyse fonctionnelle

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0205424A FR2839079B1 (fr) 2002-04-30 2002-04-30 Banque genomique du cyanophage s-2l et analyse fonctionnelle partielle
FR02/05424 2002-04-30

Publications (3)

Publication Number Publication Date
WO2003093461A2 true WO2003093461A2 (fr) 2003-11-13
WO2003093461A3 WO2003093461A3 (fr) 2004-04-01
WO2003093461A8 WO2003093461A8 (fr) 2004-06-24

Family

ID=28800065

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2003/001328 WO2003093461A2 (fr) 2002-04-30 2003-04-28 Banque genomique du cyanophage s-2l et analyse fonctionnelle

Country Status (6)

Country Link
US (1) US20060270005A1 (fr)
EP (1) EP1499713A2 (fr)
AU (1) AU2003249159A1 (fr)
CA (1) CA2483706A1 (fr)
FR (1) FR2839079B1 (fr)
WO (1) WO2003093461A2 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022219033A1 (fr) 2021-04-15 2022-10-20 The European Syndicate Of Synthetic Scientists And Industrialists Nouvelle famille de polymérases d'adn acceptant la 2-aminoadénine et rejetant l'adénine dans leurs substrats

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3800251B1 (fr) * 2015-11-19 2021-11-03 Niigata University Peptide présentant une accumulation spécifique au cancer du pancréas
CN110945010A (zh) * 2017-06-19 2020-03-31 急速制药有限责任公司 肽组合物和相关方法
CN114836399A (zh) * 2021-01-14 2022-08-02 天津大学 异鸟嘌呤脱氧核糖核苷酸的制备方法
WO2022214617A1 (fr) * 2021-04-07 2022-10-13 Institut Pasteur Acides nucléiques modifiés en 2-aminoadénine, cellules les comprenant, et leurs procédés de production

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
HILL F ET AL: "Polymerase recognition of synthetic oligodeoxyribonucleotides incorporating degenerate pyrimidine and purine bases" PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF USA, NATIONAL ACADEMY OF SCIENCE. WASHINGTON, US, vol. 95, no. 8, 14 avril 1998 (1998-04-14), pages 4258-4263, XP002239241 ISSN: 0027-8424 *
HONZATKO R B ET AL: "ADENYLOSUCCINATE SYNTHETASE: RECENT DEVELOPMENTS" ADVANCES IN ENZYMOLOGY AND RELATED AREAS OF MOLECULAR BIOLOGY, XX, XX, vol. 73, 1999, pages 57-102, XP008012753 *
KHUDYAKOV I YA ET AL: "2 6 DI AMINO PURINE A NEW ADENINE REPLACING BASE IN THE DNA OF CYANO PHAGE S-2" DOKLADY BIOCHEMISTRY (ENGLISH TRANSLATION OF DOKLADY AKADEMII NAUK, vol. 232, no. 1-6, 1977, pages 42-45, XP008016379 1977 ISSN: 0012-4958 cité dans la demande *
KHUDYAKOV I YA ET AL: "CYANOPHAGE S-2L CONTAINS DNA WITH 2 6 DI AMINO PURINE SUBSTITUTED FOR ADENINE" VIROLOGY, vol. 88, no. 1, 1978, pages 8-18, XP008016377 EN ISSN: 0042-6822 cité dans la demande *
KIRNOS M D ET AL: "2 AMINO ADENINE IS AN ADENINE SUBSTITUTING FOR A BASE IN S-2L CYANOPHAGE DNA" NATURE (LONDON), vol. 270, no. 5635, 1977, pages 369-370, XP002239457 ISSN: 0028-0836 cité dans la demande *
SAMBROOK J, RUSSELL DW: "Molecular cloning: A laboratory manual, Volume 2: Generation of a library of randomly overlapping DNA inserts" 2001 , COLD SPRING HARBOR LABORATORY PRESS , COLD SPRING HARBOR, NEW YORK XP002239458 page 12.10 -page 12.25 *
See also references of EP1499713A2 *
STOECKLER J D ET AL: "Purine nucleoside phosphorylase. 3. Reversal of purine base specificity by site-directed mutagenesis" BIOCHEMISTRY 1997 UNITED STATES, vol. 36, no. 39, 1997, pages 11749-11756, XP002260667 ISSN: 0006-2960 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022219033A1 (fr) 2021-04-15 2022-10-20 The European Syndicate Of Synthetic Scientists And Industrialists Nouvelle famille de polymérases d'adn acceptant la 2-aminoadénine et rejetant l'adénine dans leurs substrats

Also Published As

Publication number Publication date
US20060270005A1 (en) 2006-11-30
AU2003249159A8 (en) 2003-11-17
EP1499713A2 (fr) 2005-01-26
CA2483706A1 (fr) 2003-11-13
WO2003093461A8 (fr) 2004-06-24
FR2839079A1 (fr) 2003-10-31
AU2003249159A1 (en) 2003-11-17
FR2839079B1 (fr) 2007-10-12
WO2003093461A3 (fr) 2004-04-01

Similar Documents

Publication Publication Date Title
Reina-San-Martin et al. A B-cell mitogen from a pathogenic trypanosome is a eukaryotic proline racemase
CN101970679B (zh) 氨基转移酶和氧化还原酶核酸和多肽和使用方法
US7303901B2 (en) Thermostable RNA ligase from thermus phage
US20210139884A1 (en) Reverse transcriptase for nucleic acid sequencing
Delaney et al. Assays for Determining Lesion Bypass Efficiency and Mutagenicity of Site‐Specific DNA Lesions In Vivo
WO2004022736A1 (fr) Procede de disruption genique ciblee, genome de bacterie hyperthermostable et puce genomique utilisant un tel procede
CZ30696A3 (en) Dna sequencing enzymes
CN102421892B (zh) 二鸟苷酸环化酶、其生产方法及其在制备环化-di-GMP及其类似物中的应用
KR20220035247A (ko) 숙주 세포에서 푸코실락토스의 제조
Mignolet et al. Functional dichotomy and distinct nanoscale assemblies of a cell cycle-controlled bipolar zinc-finger regulator
US20220136024A1 (en) Protecting group chemistry for clean, reductant-free dyeing
US20090215114A1 (en) Method of enzymatically synthesizing 3' -phosphoadenosine-5' -phosphosulfate
Barrows et al. Synchronized swarmers and sticky stalks: Caulobacter crescentus as a model for bacterial cell biology
CN115867324A (zh) 优化的核苷酸序列的生成
Esteban et al. T double-stranded RNA (dsRNA) sequence reveals that T and W dsRNAs form a new RNA family in Saccharomyces cerevisiae. Identification of 23 S RNA as the single-stranded form of T dsRNA.
WO2003093461A2 (fr) Banque genomique du cyanophage s-2l et analyse fonctionnelle
Burman et al. Viral proteins activate PARIS-mediated tRNA degradation and viral tRNAs rescue infection
US20120083018A1 (en) Thermostable dna polymerases and methods of use
Bednarski et al. In vitro processing of the proproteins GrdE of protein B of glycine reductase and PrdA of d‐proline reductase from Clostridium sticklandii: formation of a pyruvoyl group from a cysteine residue
KR100713104B1 (ko) 뉴로스포라 크라사 유래의s-아데노실메티오닌-6-n-라이신-메틸트란스퍼라제, 그를코딩하는 폴리뉴클레오티드, 상기 폴리뉴클레오티드를포함하는 벡터 및 숙주세포 및 상기 숙주세포를 이용하여트리메틸라이신을 생산하는 방법
TW201201700A (en) SpnK strains
CA2286343C (fr) Arn-polymerase arn-dependante fonctionnant preferentiellement sur matrice d'arn et procede de transcription d'arn sous la dependance d'un promoteur avec ledit arn polymerase arn-dependante
WO2015115661A1 (fr) Procédé pour la production de peptides ayant un squelette dérivé d'azole
Rodionova et al. A novel transcription factor PunR and Nac are involved in purine and purine nucleoside transporter punC regulation in E. coli
JP2003061683A (ja) 変異型rnaポリメラーゼ

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NI NO NZ OM PH PL PT RO RU SC SD SE SG SK SL TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
CFP Corrected version of a pamphlet front page
CR1 Correction of entry in section i

Free format text: IN PCT GAZETTE 46/2003 UNDER (71) REPLACE "FOR US ONLY" BY "FOR ALL DESIGNATED STATES EXCEPT THE US"

WWE Wipo information: entry into national phase

Ref document number: 2483706

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 2003747467

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2003747467

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2006270005

Country of ref document: US

Ref document number: 10510953

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Country of ref document: JP

WWP Wipo information: published in national office

Ref document number: 10510953

Country of ref document: US