WO2001081625A1 - Methode de mesure quantitative de l'expression des genes - Google Patents

Methode de mesure quantitative de l'expression des genes Download PDF

Info

Publication number
WO2001081625A1
WO2001081625A1 PCT/FR2001/001293 FR0101293W WO0181625A1 WO 2001081625 A1 WO2001081625 A1 WO 2001081625A1 FR 0101293 W FR0101293 W FR 0101293W WO 0181625 A1 WO0181625 A1 WO 0181625A1
Authority
WO
WIPO (PCT)
Prior art keywords
probes
pcr
size
sequences
transcriptome
Prior art date
Application number
PCT/FR2001/001293
Other languages
English (en)
Inventor
Fabienne Hermitte
Vincent Fert
Original Assignee
Ipsogen
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ipsogen filed Critical Ipsogen
Priority to EP01929726A priority Critical patent/EP1276910A1/fr
Publication of WO2001081625A1 publication Critical patent/WO2001081625A1/fr
Priority to US10/281,255 priority patent/US20030143593A1/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips

Definitions

  • the present invention relates to a method for carrying out quantitative measurements of expression levels or expression variability of large sets of genes, in the microarray technique.
  • PROBE means any sequence of labeled nucleic acids representative of a complex mixture which it is desired to study and for which an analysis of the elements is sought; these probes are obtained by transc ⁇ ption or retro-transcription of the complex mixture of nucleic acid from the start if necessary followed by a method of amplification of the sequences.
  • This labeling can be a radioactive labeling, in particular with phosphorus P 32 or phosphorus P 33 , or non-isotopic such as an enzymatic or fluorescent labeling. It can be single strand DNA, double strand DNA or RNA.
  • TARGET by target is meant the nucleic acid sequences fixed in an orderly fashion on a chip. These sequences are generally known; they can be a single-stranded nucleic acid or a double-stranded nucleic acid. They are likely to be hybridized with the probes representative of the population that one seeks to study.
  • CALIBRATION means a process for obtaining a population of nucleic acids representative of a starting population and substantially homogeneous in size.
  • substantially homogeneous it is meant that for a chosen size, the difference in length does not exceed 20%, and preferably 10% for lengths greater than the selected size, and 50% for lengths less than the selected size.
  • the term “chip” means any support carrying, in an orderly fashion, nucleotide or oligonucleotide target sequences hybridizable with probes.
  • the supports can be either silica, glass or organic polymer of nylon or nitrocellulose type.
  • the nucleotide or oligonucleotide sequences can be fixed therein by any means known to a person skilled in the art from the moment when hybridization with the target sequences is possible. In the present, we will speak of chip, micro-network or micro-array, macro-network or macro-array. On the characteristics of these different chip technologies, one can advantageously refer to S. GRANJEAUD et al. (1).
  • TRANSCRIPTOME by transcriptome is meant all of the RNA extracted or purified from a cell or from a cell population.
  • a transcriptome is a reflection of the expression of the genome. The relative amounts of each RNA reflect the expression of the corresponding gene; a modification of this level of expression may result either from a modification of the expression of the corresponding gene, or from a modification of the stability of the RNA in question. In any case, this modification is likely to have consequences on the structure and / or on the quantity of proteins synthesized, when it is messenger RNA.
  • NUCLEIC ACID by nucleic acid is meant here any single strand / double strand sequence, expressed or copy, from the moment when it can be hybridized with a messenger RNA of the transcriptome or of its complementary sequence.
  • the large-scale expression measurements are all based on the use of a complex probe prepared from a transcriptome and hybridized with an ordered set (array) of several hundred or thousands of targets each representing a different gene.
  • the great strength of this approach is its parallelism: each hybridization gives information on each gene represented in the game and its information is cumulative.
  • the growing interest in these technologies is explained by two obvious reasons: the first is that knowing the level of expression of a gene in different tissues or different physiological or pathological situations makes it possible to make hypotheses about its role; the second is technical: these data are currently the only ones likely to be obtained for large sets of genes, and they are part of the work of sequencing cDNA or genome banks integers.
  • complex probes are produced from a mixture of RNA (total or messenger RNAs, extracted for example from a tissue or from a cellular culture). These probes are then hybridized with target DNA sequences deposited on a support (nylon membrane, glass, etc.). The quantification of the signals obtained for each target makes it possible to determine the amount of corresponding RNA in the tissue (or cell culture) studied.
  • the production of the complex probe is a key step, since the products present in the probe (products obtained after reverse transcription of the mRNAs) must rigorously reflect the representativeness of each mRNA in the initial mixture.
  • the efficiency of the reverse transcription reaction is not the same for all RNA sequences: very stable secondary structures can, for example, block the cDNA synthesis reaction.
  • labeled nucleotides are incorporated in this step in order to allow the detection of hybridization signals.
  • the measurement obtained for two messenger RNAs present at equal concentrations may be different due to two distinct phenomena: i) if these two RNAs are of different sizes or ii) for RNAs of identical size, if there is premature termination of the reverse transcription for one of the two, producing two cDNAs of different sizes.
  • These two phenomena introduce the same bias: during labeling, the longest fragment incorporates more labeled nucleotides and its measurement is overvalued.
  • the cDNAs obtained have sizes between 7 kb and 300 nucleotides, as shown in the publication by Rajeevan MS et al. (5).
  • RNA conventionally derived from several milligrams of tissue or several million cells
  • complex probes making it possible to detect reliably the scarce messenger RNAs.
  • This constraint makes it necessary to amplify the corresponding RNA or cDNA for their application to the study of tissues or cells available only in very small quantities, as is the case for example for certain biopsies.
  • a probe which reflects the representativeness of the RNAs in the initial mixture (both the highly expressed RNAs and those for the weakly expressed) and which generates reproducible hybridization data.
  • PCR amplification This technique makes it possible to amplify a DNA sequence, but only when the sequences of the 5 ′ and 3 ′ ends are known, in order to allow the choice of primers on either side of the sequence to be amplified.
  • these primers can be introduced during the steps of synthesis of the first strands (by reverse transcription) and second strands, and this is called anchored PCR.
  • the double stranded DNA thus obtained are then amplified by PCR nested from primers chosen from the 5 ′ and 3 ′ anchors.
  • the problem with PCR amplification is that the amplification yield of a nucleotide fragment is a function of the size of the fragment concerned: a short fragment co-amplified by PCR with a longer fragment will always be preponderant in the final product of reaction, even if it was less abundant in the initial mixture.
  • This bias becomes particularly troublesome when it comes to studying the levels of gene expression: it is absolutely essential that each mRNA is present in the same proportions in the complex probe as in the cell type or the tissue of which it comes from.
  • the size of the amplified product will depend, on the one hand, on the efficiency of the reverse transcription step, on the other hand, on the initiation of the synthesis of the second. strand and amplification steps.
  • the non-specific product shorter than the specific fragments expected
  • RNA amplification technique for small products, the amount of radioactivity, flourescence, or even reporter molecule (for example biotin) incorporated per molecule will be less important than for larger products, also introducing a potential difference in intensity of signals obtained after hybridization of the chips.
  • reporter molecule for example biotin
  • This method makes it possible, by reverse transcription of the messenger RNAs initiated from an oligonucleotide containing several T (complementary to the poly A tail of the messenger RNA) flanked by a sequence recognized by the T7 phage RNA polymerase, to obtain Single-stranded cDNA comprising at the 5 ′ end the promoter sequence for the T7 RNA Pol.
  • tail either by the technique known as "tailing", which consists in adding, thanks to the enzymatic activity of TdT, a homopolymeric tail at the 3 'end of the neo-synthesized single-strand cDNAs, then in initiating the synthesis of the second strand to from an oligonucleotide complementary to the homopolymeric tail.
  • the double-stranded products obtained are then amplified by incubation with the T7 RNA polymerase enzyme.
  • the size of the amplified product will depend, on the one hand, on the efficiency of the reverse transcription step and, on the other hand, on the initiation of the synthesis of the second. strand. If the products obtained are of variable sizes, the efficiency of the amplification will not be the same for all the molecules of the mixture, and the measurements carried out during the hybridization of the chips may not be reproducible.
  • the amount of radioactivity incorporated per molecule will be less than for larger products, introducing a potential difference when quantifying hybridization.
  • the present invention aims to remedy the biases introduced by all these techniques during the amplification and labeling of nucleic acids of heterogeneous sizes, biases which limit the quantitative analysis of transcriptomes. It provides a method for producing a complex probe from a transcriptome which makes it possible to conserve the representativeness of each RNA in the final product by obtaining fragments of homogeneous size and specific labeling, and this after a step d amplification of cDNAs.
  • the products obtained can thus serve as complex probes for the study of gene expression and more particularly to acquire quantitative data on this expression.
  • the present invention relates to a method for producing complex probes from total RNA or messenger RNA, for the study of the quantitative expression of genes on DNA chips.
  • the main advantage compared to the methods described above resides, on the one hand, in the fact that the RNAs are transcribed into cDNAs of homogeneous size, and that the amount of radioactivity (or any other type of labeling) incorporated is the same for all the molecules present in the initial mixture and, on the other hand, that the measurement is carried out on a DNA chip comprising strands of target DNA characterized by a sequence representing the 3 ′ end of the genes whose transcripts are to be measured .
  • the quantification carried out after hybridization on DNA chips is therefore not biased by differences in specific activities of the synthesized cDNAs.
  • this method is applicable to probes produced from the poly A ends of the mRNAs (the reverse transcription of the mRNAs into cDNA is initiated by a poly T oligonucleotide), and to chips in which so-called 3 'clones are deposited, that is to say cDNAs (in the form of PCR products or bacterial clones) having also been obtained from the 3' ends of the mRNAs.
  • this production method cannot be applied to a random priming of the reverse transcription step of the probe mRNAs, the probe cDNAs having to be in the same region as the cDNAs deposited on the support so to allow hybridization.
  • the step allowing the size homogenization takes place during the reverse transcription of the mRNAs into single-stranded cDNA, step which is calibrated (that is to say controlled from a kinetic point of view) so that the Single stranded cDNAs are all of comparable size.
  • the present invention relates to a process for obtaining probes representative of a population of nucleic acids of which a quantitative analysis of the elements is sought, characterized in that it comprises: a) a step of calibrating the experimental conditions of transcription or retro-transcription making it possible to obtain nucleic acid fragments of substantially the same length, said length being between 20 and 2000 nucleotides; b) a step of obtaining a population of probe sequences resulting from the transc ⁇ ption or retrotranscription of the population of nucleic acids, a quantitative analysis of the elements of which is sought under the conditions pre-established during the previous step, so that the probes are of uniform size and are representative of the 3 ′ part of each element of said population; c) a step of amplification of the sequences obtained in b).
  • the fragments sought will preferably have a size of between 500 and 1500 nucleotides, and preferably around 1000 nucleotides.
  • the population of a probe sequence of homogeneous size can come from a transcription and retrotranscription step followed by an amplification.
  • amplification it is understood here any technique which, from the starting sequence, whether it is an RNA or a DNA, makes it possible to obtain a large number of identical or complementary copies of said sequences.
  • Such techniques are described in the literature and include many derivatives. Examples include PCR, RT-PCR, TMA (transcription mediated amplification), NASBA (Nucieic acid sequence based amplification) and 3SR (Self sustained sequence replication).
  • PCR RT-PCR
  • TMA transcription mediated amplification
  • NASBA Nucieic acid sequence based amplification
  • 3SR Self sustained sequence replication
  • the complex mixture of RNA is back transcribed according to the method described in a) and b) from a primer containing a poly T sequence flanked by a known sequence, or 3 ′ anchor, in which primers are chosen allowing to carry out nested PCRs.
  • the single-stranded cDNAs obtained are ligated in 5 ′ using the phage T4 RNA ligase (T4 RNA Lig.) With a modified oligonucleotide of chosen sequence (5 ′ phosphate end for ligation with the 3 ′ OH end of the cDNAs , and 3 'NH2 end in order to avoid ligation of the oligonucleotide on itself).
  • This 5 'anchor contains sequences for several nested PCR primers, compatible in terms of PCR with the primers of the 3' anchor.
  • sequence of anchors chosen has the following characteristics: the sequence of the anchors must not present homologies with the sequences of the species whose transcriptome is being studied;
  • these anchors can range from 20 to 70 nucleotides, preferably 50 nucleotides in order to choose inside, up to 3 nested PCR primers.
  • PCR oiigos will be chosen in pairs, to account for i) compatibility of hybridization temperatures, ii) absence of hairpins, iii) absence of formation of intra- and inter- dimers stable molecular.
  • the double-strand products thus obtained are then all of the same size, and have at their ends 5 ′ and 3 ′ known anchors; it is possible to amplify by nested PCR all the sequences present in the mixture thanks to the primers chosen in the 5 ′ and 3 ′ anchors. This process avoids the non-specific primers observed, for example in the case of the use of a homopolymeric primer for anchored PCR using "tailing".
  • This ligation technique can also be applied to linear amplification.
  • the probes are marked during transcription, reverse transcription or, where appropriate, the amplification of transcripts or retrotranscripts.
  • the labeling is carried out by any known means for labeling the oligonucleotides during synthesis.
  • radioactivity by the incorporation of radioactive triphosphate nucleotides, fluorescence by the incorporation of fluorescent nucleotides, or the incorporation of nucleotides comprising a chemical modification which allows the link with a compound which directly or indirectly is capable of emitting a fluorescent, phosphorescent, luminescent or colorimetric signal.
  • a classic example of this type of labeling today is the coupling of the nucleotide to biotin, where the signal is produced by coupling of biotin to avidin or streptavidin carrying an enzyme, itself capable of transforming a substrate into a fluorescent or luminescent or colored molecule.
  • step a) of calibration for obtaining transcripts or retrotranscripts of previously chosen homogeneous size consists in:
  • RNAs of different sizes added to the initial RNA mixture in the same proportions: for example RNAs of 0.5, 1 and 2.5 kb are introduced at 2 ° / 00 (for example: 0.2 ng of each for 5 ⁇ g of total RNA).
  • the quantification of these control RNA spots should give the same intensities for the three different sizes if the condition is correct.
  • the PCR amplification products pose a real problem insofar as the size of the amplified product depends, on the one hand, on the efficiency of the reverse transcription step, on the other hand part of the initiation of the synthesis of the second strand and the amplification steps. Therefore, the shorter the starting matrix, the more the amplification product tends to become the majority in the final product. This is true for all the amplification techniques described in the literature and particularly with the improved amplification technique described above consisting in flanking a known sequence to a poly T primer in order to obtain known anchors in 5 ′ and 3 .
  • the method of the invention comprising a step of calibrating and producing transcripts or retrotranscripts of homogeneous size and representative of the 3 ′ part of the messenger RNAs makes it possible to envisage the use of an amplification technique on these transcripts or on these retrotranscripts leading to a population of amplified sequences representative of the starting sequences.
  • the amplification products must also be considered as representative of the initial transcriptome since the amplification step from a matrix composed of fragments of homogeneous size no longer includes this bias resulting from the difference in size of the fragments.
  • the quantitative analysis of a transcriptome is advantageously carried out by the simultaneous analysis of a large number of hybridizations between the probes and representative target sequences. genes of the corresponding genome. Also, the method of the invention is particularly advantageous when it is applied to the implementation of hybridizations on macro- or micro-networks (macro- or micro-arrays) or on DNA chips.
  • the present invention also relates to a method for quantitative analysis of a transcriptome and is characterized in that it comprises: a) a calibration for determining the optimal conditions for obtaining probes of homogeneous size; b) the production of labeled probes consisting of a complex mixture of labeled nucleic acids representative of the transcriptome by implementing a method described above; c) amplification of the probes obtained in b) by any technique known to those skilled in the art such as PCR, anchored PCR, nested PCR, RT-PCR, TMA, NASBA; d) the preparation of a support on which are fixed in an orderly manner cDNAs (targets) corresponding to the 3 ′ ends of the mRNAs of interest each representing a different gene; e) hybridization of the probes in b) or c) with the targets in d); f) quantitative measurement of the marking obtained at each target.
  • step c) above the improved anchored PCR method described above can preferably be used in which the poly T primer is flanked by a known anchor and the cDNA ligated with a 5 'anchor thanks to the T4 RNA ligase.
  • step f) above the marking measured is a faithful reflection of the relative amounts of the various elements of the transcriptome studied.
  • the method of the invention for the quantitative analysis of a transcriptome makes it possible to overcome the various biases of the existing methods mentioned in the introduction and which led to overestimating or underestimate the amount of certain categories of messenger RNA in a given transcriptome.
  • the relative proportions of the different messenger RNAs are the same after the retrotranscription and amplification steps. The method according to the invention thus makes it possible to make a
  • the probes marked with the mixture in b) or in c) are of homogeneous size and between 20 and 2000 nucleotides and preferably between 500 and 1500 nucleotides. An optimal length is around 1000 nucleotides. It goes without saying that in the process which includes an amplification step, the first transcription or retrotranscription step leads to the constitution of nucleic acid fragments of homogeneous size but not labeled. Obtaining the labeled probes is then carried out by amplification of this intermediate mixture.
  • the hybridization of the amplified probes with the targets fixed on the chips is preferably carried out in excess of targets relative to the probes so that the quantity fixed on the target of the corresponding species is proportional to its relative abundance in the initial mixture. It is essential in the process of the invention that the measurements carried out after hybridization on the chip are effectively quantitative and reflect the level of expression of the transcriptome and its variability.
  • control reagents it is advantageous to include control reagents.
  • reagents can be used to quantitatively calibrate the measurement.
  • internal controls consist in simultaneously performing on the same chip the hybridization of the probes corresponding to the transcriptome with the targets and the hybridization of an exogenous probe with a complementary target. The use of such an external standard has been described in (3). In this article, an A.
  • thaliana sequence from cytochrome C554 which has no homology with mammalian DNA has been integrated both as a spot on the chip and as a probe in the transcriptome sample.
  • the quantification of the signals obtained for these positive internal controls makes it possible to give an estimate of the abundance of the other RNAs in the sample.
  • These controls also make it possible to compare several independent experiments with each other in a reliable manner, since they correct the differences in labeling, washing, exposure time and possible loss of material on the membranes after several successive hybridizations (3).
  • the measurement can be quantitatively calibrated by measuring in the probe mRNAs corresponding to ubiquitous genes or housekeeping genes of which it is known that the level of expression is constant in all the samples studied.
  • reagents can be used to control the efficiency of the calibration process.
  • an internal measurement validation control is carried out by incorporating, into the RNA sample to be analyzed, from 0.05% to 0.2%, or even more, of at least two exogenous RNAs synthesized in vitro. . It can be for example a cytochrome C554 RNA (or CG03) of 1kb, and two other exogenous RNAs of different size, for example 0.5 kb and 2.5 kb, which make it possible to advantageously verify that the length does not influence the signal intensity when the reverse transcription is carried out for a period determined by the calibration method according to the present invention.
  • a negative control can also be carried out: clones containing polyA sequences are regularly deposited on the membrane, in order to verify that the polyT sequences introduced during the synthesis of the complex probe by reverse transcription do not induce background noise.
  • the chips can be micro-networks or macro-networks.
  • the support can be made of silica, glass or nylon as is widely described in (1) where the respective performances of the nylon or glass supports are provided.
  • Fleas carry 1 to 100,000 targets. This of course depends on the surface of the chip itself and the transcriptome studied. In certain cases, it is advantageous to use membranes with low density, the format of which can be adapted to the number of genes studied or to the quantity of starting material available.
  • High density membranes on nylon backing can also be developed. These membranes can have a microarray type format (the size of a glass slide), or have a macroarray type format (10 to 100 cm 2 approximately). These high density chips allow the analysis of several thousand genes simultaneously.
  • the targets can be purified oligonucleotides or cDNAs fixed by methods well known to those skilled in the art, from the moment when the fraction corresponding to the 3 ′ part of the mRNA of the transcriptome is accessible to hybridization.
  • the targets can also be bacterial clones, the genome of which carries the sequence the quantification of which is sought or of a sequence complementary thereto.
  • the techniques for depositing these clones or of these purified sequences on the chips can be used and are known to those skilled in the art. It is obvious that any other technique making it possible to leave the complementary sequences accessible of the 3 ′ part of the messenger RNAs can be used in the method of the invention.
  • a support on which are fixed in an orderly manner target sequences capable of being hybridized with 3 'copies of the mRNAs of the transcriptome, and at least two targets hybridizable with the control probes.
  • the kit according to the invention can also contain all of the reagents necessary for carrying out an amplification.
  • the targets on the support are purified cDNAs.
  • the targets can also be bacterial extracts whose genome or plasmid (s) contains the sequences capable of being hybridized with the probes.
  • the Nylon support lends itself equally well to deposits of low density bacterial colonies (for example 36 deposits per cm 2 ) as to deposits of PCR products with low, medium or high densities (up to 2,000 deposits per cm 2 ). It allows the detection of hybridization complexes by radioactivity (which has the best sensitivity), and also lends itself to non-isotopic detection methods such as chemiluminescence (5) or colorimetry (4). Finally, as we have seen above, the performance of Nylon microarrays / radioactive probe remains unequaled and can be adapted to themes where the size of the sample to be treated is reduced (biopsies, primary cell cultures, etc.). The carrying out of the experiments below indicates that the calibration method leading to the obtaining of homogeneous-size retrotranscripts effectively leads to the obtaining of quantitative and reproducible results as regards the rate of hybrid probes on the targets. LEGEND OF THE FIGURES:
  • FIG. 1 represents an image obtained after hybridization of a membrane containing 1056 spots (each spot corresponding to a mouse cDNA clone) with a complex probe produced by applying the standard method of the invention to total RNA of mouse thymus in two hours of reverse transcription.
  • the surrounded spots correspond to clones whose measured level of expression is much higher when the transcription is long, and whose mRNA are long.
  • the framed spots correspond to the clones whose expression level is constant whatever the transcription time, and whose mRNAs are small.
  • FIG. 2 represents an image obtained after hybridization of a membrane containing 1056 spots with a complex probe produced by applying the method of the invention to total RNA of mouse thymus in 30 minutes of reverse transcription.
  • FIG. 3 represents a Northern Blot produced from total RNA from the brain and hybridized with a probe produced from a clone whose level of expression measured is constant whatever the transcription time.
  • the band observed corresponds to an mRNA of 200 nucleotides, as indicated by the molecular weight scale.
  • FIG. 4 represents radioactively labeled cDNAs obtained by reverse transcription (15 min, 30 min, 1 h and 2 h of RT) and migrate on a denaturing alkaline gel making it possible to analyze the size of the cDNAs (molecular weight scale on the left) .
  • membranes are prepared according to the protocols described in (2) and (3). After depositing on the membranes, bacterial clones or target DNA produced by PCR, these are denatured in situ and then neutralized. 2. Oligonucleotide hybridization (vector):
  • oligonucleotides used depend on the sequences flanking the target cDNAs, that is for example for the plasmids pcDNAI and pT7T3:
  • Labeling is then carried out by incubation of the oligonucleotides in the presence of 1 ⁇ l of oligo (1 ⁇ g / ⁇ l), 2 ⁇ l of 10 X T4 polynucleotide kinase buffer (Biolabs), 3 ⁇ l of ⁇ AT 33 P (5000 Ci / mM), 1 ⁇ l of T4 polynucleotide kinase (10 U / ⁇ l, Biolabs), Sterile water qs 20 ⁇ l final.
  • the DNA is then precipitated in the presence of 1 ⁇ l of herring sperm DNA (Boehringer, 10 mg / ml), 2 ⁇ l of 3M sodium acetate, 60 ⁇ l of cold absolute ethanol (-20 ° C).
  • the reaction mixture is placed 15 min at -80 ° C, centrifuged 30 min at 4 ° C then the supernatant (highly radioactive) is removed. The pellet is resuspended in 100 ⁇ l of sterile water.
  • the counting is then carried out in liquid scintillation.
  • Hybridization of the oligonucleotide probe The hybridization / prehybridization buffer consists of 5X SSC, TX Dehnardt's, 0.5% SDS. (buffer H).
  • the filters are prehybridized at 42 ° C for a minimum of 4 hours (12 h maximum) in buffer H (50 ml of buffer and 4 filters maximum per box or 10 ml in tubes).
  • the filters are hybridized in 50 ml of buffer H and then removed.
  • a cold / hot probe mixture is added to the buffer.
  • the filters are then returned to the box one by one. Hybridization takes place at 42 ° C for
  • the cold / hot probe mixture consists of 10 ⁇ g of cold vector oligo, 100,000 to 200,000 cpm / ml of labeled oligo (i.e. 5 to 10 million for 50 ml).
  • Washes are carried out with 1 liter of 2X SSC 0.1% SDS buffer, 10 min, at room temperature and then 5 min at 42 ° C, changing the buffer once.
  • the membranes are exposed to a phosphor screen which is then read by a Fuji Bas 1500 type device.
  • the complex probe is prepared from the total RNA extracted from the sample of interest (tissue, cell culture, etc.).
  • the first step is a pairing or "annealing" step (so that the RNAs lose their secondary structure and to saturate the polyA tails with the oligo dT). A large excess of oligo dT is used so that RT transcription begins just after the start of the polyA tail.
  • the conditions are as follows: 5 ⁇ g of RNA and 0.2 ng of mRNA of the CG03 control (cytochrome) as well as 0.2 ng of each other exogenous RNA serving as a quantitative validation control, and 8 ⁇ g of dT25 are added 13 ⁇ l of sterile water and incubated 8 min at 70 ° C, then 30 min from 70 ° C to 42 ° C.
  • the RT reaction is stopped after 15 min, 30 min,
  • the reaction is stopped by passage through ice and then alkaline lysis of the RNAs, or by any other method known to those skilled in the art: for example RNase H or addition of ddNTP.
  • These four "test" probes are hybridized on arrays containing at least the three complementary targets of the 3 exogenous RNAs of different sizes (500/1000/2500) introduced in the same proportions into the RNAs of the initial mixture. That of the four conditions making it possible to obtain signals of the same intensity for the control spots is defined as the optimal condition for the continuation of the experiments involving: the same RTase, the same experimental conditions throughout the protocol.
  • reaction mixture is then neutralized by adding 10 ⁇ l of TRIS IM, 3 ⁇ l of 2N HCl and sterile water qs 150 ⁇ L
  • Anchors were added 3 'and 5' to the cDNAs obtained.
  • 3 ' it is an oligo dT containing in its 5' part the promoter sequence for the T7 RNA polymerase and in 5 'a sequence complementary to the SP6 promoter.
  • the first anchor is added during the reverse transcription carried out according to the conditions defined in b), and the second anchor is added by ligation with the T4 RNA ligase, at the 3 ′ end of the cDNAs synthesized.
  • the PCR amplification is carried out with a pair of primers complementary to the 3 ′ and 5 ′ anchors, namely T7 and SP6.
  • the labeling is done during or after the PCR.
  • the prehybridization step is carried out between 65 and 68 ° C for 6 hours minimum in buffer H; - the hybridization step is carried out between 65 and 68 ° C for
  • the membranes are exposed to a phosphor screen which is then read by a Fuji Bas 1500 type device.
  • the dehybridization is carried out in 0.1% SDS / 1 mM EDTA at 80 ° C. for 2 hours 30 minutes (1 liter for 4 filters).
  • the starting RNAs are the total RNAs of mouse brains.
  • the reverse transcription (RT) reaction was carried out according to the protocol described in the publications above and in (2) and (3).
  • RT 1 hour 100 ⁇ cDNA ⁇ 4.367 nucleotides
  • RT 30 min 100 ⁇ cDNA ⁇ 2,760 nucleotides
  • CDNAs transcribed from mouse thymus RNA were hybridized on microarrays carrying cDNAs from genes expressed in mice and carried by bacterial plasmids.
  • the duration of the retrotranscription reaction was fixed at 30 min.
  • FIG. 1 represents the intensities of the spots obtained after the conventional duration of the reverse transcription (2 hours, FIG. 1), and for the chosen duration of 30 min., Deduced from the prior calibration operation (FIG. 2).

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

La présente invention est relative à une méthode de mesure quantitative de l'expression des gènes par obtention de sondes marquées de taille homogène préalablement choisie, après rétrotranscription et amplification. Elle porte également sur le procédé de préparation des sondes marquées, et sur des trousses de mise en oeuvre par utilisation de micro-réseaux ou de macro-réseaux.

Description

METHODE DE MESURE QUANTITATIVE DE L'EXPRESSION DES GENES
La présente invention porte sur un procédé de réalisation de mesures quantitatives de niveaux d'expression ou de variabilité d'expression de grands ensembles de gènes, dans la technique des puces à ADN.
Dans l'ensemble du texte qui suit les termes employés ont la signification suivante : SONDE : signifie toute séquence d'acides nucléiques marqués représentative d'un mélange complexe que l'on souhaite étudier et dont une analyse des éléments est recherchée ; ces sondes sont obtenues par transcπption ou rétro-transcription du mélange complexe d'acide nucléique du départ le cas échéant suivie par une méthode d'amplification des séquences.
Ces sondes sont marquées directement ou indirectement afin d'émettre un signal détectable par les techniques classiques. Ce marquage peut être un marquage radio-actif, notamment avec du phosphore P32 ou du phosphore P33, ou non isotopique tel un marquage enzymatique ou fluorescent. Il peut s'agir d'ADN simple brin, d'ADN double brin ou d'ARN.
CIBLE : on entend par cible les séquences d'acides nucléiques fixées de manière ordonnée sur une puce. Ces séquences sont généralement connues ; elles peuvent être un acide nucléique simple brin ou un acide nucléique double brin. Elles sont susceptibles d'être hybridées avec les sondes représentatives de la population que l'on cherche à étudier.
CALIBRAGE : signifie un procédé d'obtention d'une population d'acides nucléiques représentative d'une population de départ et sensiblement homogène en taille. Par sensiblement homogène, on entend que pour une taille choisie, la différence de longueur n'excède pas 20 %, et de préférence 10 % pour des longueurs supérieures à la taille choisie, et 50 % pour des longueurs inférieures à la taille choisie.
PUCE : dans les présentes, on entend par puce tout support porteur, et ce de façon ordonnée, de séquences cibles nucléotidiques ou oligonucléotidiques hybridables avec des sondes. Les supports peuvent être, soit en silice, soit en verre, soit en polymère organique de type nylon ou nitrocellulose. Les séquences nucléotidiques ou oligonucléotidiques peuvent y être fixées par tout moyen connu de l'homme du métier à partir du moment où l'hybridation avec les séquences cibles est possible. Dans les présentes, on parlera de puce, de micro-réseau ou micro-array, de macro-réseau ou macro-array. Sur les caractéristiques de ces différentes technologies de puce, on pourra avantageusement se rapporter à S. GRANJEAUD et al. (1).
TRANSCRIPTOME : par transcriptome, on entend la totalité des ARN extraits ou purifiés d'une cellule ou d'une population cellulaire. Un transcriptome est le reflet de l'expression du génome. Les quantités relatives de chaque ARN sont le reflet de l'expression du gène correspondant ; une modification de ce taux d'expression peut résulter soit d'une modification de l'expression du gène correspondant, soit d'une modification de la stabilité de l'ARN en cause. En tout état de cause, cette modification est susceptible d'avoir des conséquences sur la structure et/ou sur la quantité des protéines synthétisées, lorsqu'il s'agit d'ARN messager.
ACIDE NUCLEIQUE : par acide nucléique, on entend ici toute séquence simple brin/double brin, exprimée ou copie, à partir du moment où elle est hybridable avec un ARN messager du transcriptome ou de sa séquence complémentaire.
L'identification de l'expression génétique en réponse à différentes conditions physiologiques ou pathologiques apparaît comme une approche essentielle à l'élucidation des mécanismes moléculaires associés à certaines pathologies, à des traitements thérapeutiques ou à un état particulier de développement d'organes ou de tissus. La technologie des puces sur lesquelles sont fixées de l'ADNc ou des EST à haute densité offre une approche directe pour ce type d'analyse.
Les mesures d'expression à grande échelle reposent toutes sur l'emploi d'une sonde complexe préparée à partir d'un transcriptome et hybridée avec un jeu ordonné (array) de plusieurs centaines ou milliers de cibles représentant chacune un gène différent. La grande force de cette approche est son parallélisme : chaque hybridation donne un renseignement sur chaque gène représenté dans le jeu et ses informations sont cumulatives. L'intérêt croissant porté à ces technologies s'explique par deux raisons évidentes : la première est que la connaissance du niveau d'expression d'un gène dans différents tissus ou différentes situations physiologiques ou pathologiques permet d'émettre des hypothèses sur son rôle ; la seconde est d'ordre technique : ces données sont à l'heure actuelle les seules susceptibles d'être obtenues pour de grands ensembles de gènes, et elles s'inscrivent dans la continuité du travail de séquençage de banques d'ADNc ou de génomes entiers.
L'étude conjointe d'un grand nombre de séquences et de tissus dans lesquels s'expriment les gènes correspondants ainsi que la comparaison des profils obtenus à partir de tissus sains et pathologiques, ou dans différentes situations d'un même tissu, permet d'identifier des gènes cibles susceptibles d'être impliqués dans un phénomène biologique. On parle alors de "gène discovery". Il est aussi possible de choisir de travailler avec un plus petit nombre de gènes connus et sélectionnés a priori pour leur implication certaine ou supposée dans un processus biologique. La mesure du profil d'expression relevée sur ce jeu de gènes est alors employée pour caractériser l'état du tissu étudié et en tirer des indications diagnostiques ou des éléments de pronostic.
Dans le cadre d'études d'expression à grande échelle (sur puces à ADN), des sondes complexes sont réalisées à partir d'un mélange d'ARN (ARN totaux ou messagers, extraits par exemple d'un tissu ou d'une culture cellulaire). Ces sondes sont ensuite hybridees avec des séquences d'ADN cibles déposées sur un support (membrane de Nylon, verre...). La quantification des signaux obtenus pour chaque cible permet de déterminer la quantité de l'ARN correspondant dans le tissu (ou la culture cellulaire) étudié. La réalisation de la sonde complexe est une étape clé, puisque les produits présents dans la sonde (produits obtenus après transcription inverse des ARNm) doivent refléter rigoureusement la représentativité de chaque ARNm dans le mélange initial. Or, l'efficacité de la réaction de transcription inverse n'est pas la même pour toutes les séquences d'ARN : des structures secondaires très stables peuvent par exemple bloquer la réaction de synthèse d'ADNc. Or, la plupart du temps, des nucléotides marqués sont incorporés à cette étape afin de permettra la détection des signaux d'hybridation. La mesure obtenue pour deux ARN messagers présents à des concentrations égales peut être différente du fait de deux phénomènes distincts : i) si ces deux ARN sont de tailles différentes ou ii) pour des ARN de taille identique, si il y a arrêt prématuré de la rétrotranscription pour l'un des deux, produisant deux ADNc de tailles différentes. Ces deux phénomènes introduisent le même biais : lors du marquage, le fragment le plus long incorpore plus de nucléotides marqués et sa mesure est surévaluée. Dans des conditions de transcription inverse classiques, les ADNc obtenus ont des tailles comprises entre 7kb et 300 nucléotides, comme le montre la publication de Rajeevan MS et coll. (5). Les auteurs de la publication Chen JJW et coll. (1998) (4) soulignent le problème du biais des mesures dû aux différences en tailles des transcrits de la sonde.
Il existe donc un besoin réel d'une méthode fiable permettant de transcrire la population complexe d'ARNm en ADNc de tailles homogènes, afin que les ADNc aient tous la même activité spécifique, et que le mélange d'ADNc obtenu soit la représentation exacte (en terme de nombre de molécules) du mélange d'ARNm initial. L'hybridation de la sonde sur une puce à ADN reflétera alors exactement la représentativité des ARN dans le mélange initial et générera des données reproductibles, parfaitement quantitatives, permettant non seulement de réaliser des différentiels d'expression (par exemple pour des conditions physiologiques différentes) mais aussi de réaliser des mesures exactes du nombre de transcrits pour une condition donnée.
De la même façon, les études d'expression à grande échelle nécessitent la plupart du temps des quantités importantes d'ARN (classiquement issues de plusieurs milligrammes de tissu ou de plusieurs millions de cellules), afin d'obtenir des sondes complexes permettant de détecter de façon fiable les ARN messagers peu abondants. Cette contrainte rend nécessaire une étape d'amplification des ARN ou des ADNc correspondants pour leur application à l'étude de tissus ou de cellules disponibles seulement en très faibles quantités, comme c'est le cas par exemple pour certaines biopsies. Il existe donc un besoin réel d'une méthode fiable permettant, à partir d'un petit nombre de cellules (et donc de faibles quantités d'ARN), d'amplifier de façon homogène la population complexe d'ARNm afin de produire une sonde en quantité suffisante pour l'hybridation des puces à ADN, sonde qui reflète la représentativité des ARN dans le mélange initial (aussi bien les ARN fortement exprimés que pour ceux faiblement exprimés) et qui génère des données d'hybridation reproductibles.
Différentes méthodes d'amplification ont déjà été appliquées à la réalisation de sondes complexes. La méthode la plus couramment utilisée est une amplification par PCR. Cette technique permet d'amplifier une séquence d'ADN, mais uniquement lorsque les séquences des extrémités 5' et 3' sont connues, afin de permettre le choix d'amorces de part et d'autre de la séquence à amplifier. Dans le cas d'un mélange complexe d'ARN messagers dont les séquences sont inconnues, ces amorces peuvent être introduites lors des étapes de synthèse des premiers brins (par transcription inverse) et seconds brins, et l'on parle alors de PCR ancrée. Différentes méthodes de PCR ancrées ont précédemment été décrites, la plus courante étant d'initier l'étape de transcription inverse avec un oligonucièotide poly T flanqué d'une séquence connue (ancre 3'), puis d'ajouter une queue homopolymérique (par exemple des G) à l'extrémité 3' des ADNc sb (complémentaires simple brin) néo-synthétisés, grâce à l'activité enzymatique de l'enzyme déoxyribonucléotidyle transférase terminale (TdT). Le second brin est ensuite synthétisé à partir d'une amorce poly C (déoxycitidines) flanquée d'une séquence connue (ancre 5'). Les ADN double brin ainsi obtenus sont alors amplifiés par des PCR emboîtées à partir d'amorces choisies dans les ancres 5' et 3'. Le problème de l'amplification par PCR est que le rendement d'amplification d'un fragment nucléotidique est fonction de la taille du fragment concerné : un fragment court co-amplifié par PCR avec un fragment plus long sera toujours prépondérant dans le produit final de réaction, et ce même si il était moins abondant dans le mélange initial. Ce biais devient particulièrement gênant lorsqu'il s'agit d'étudier justement les niveaux d'expression de gènes : il est absolument essentiel que chaque ARNm soit présent dans les mêmes proportions dans la sonde complexe que dans le type cellulaire ou le tissu dont il provient.
En effet, pour chaque ARNm présent dans le mélange initial, la taille du produit amplifié dépendra, d'une part, de l'efficacité de l'étape de transcription inverse, d'autre part, de l'amorçage de la synthèse du second brin et des étapes d'amplification. Au cours des étapes d'amplification par PCR, il suffit d'un appariement non spécifique à l'intérieur d'un des deux brins pour que le produit non spécifique (plus court que les fragments spécifiques attendus) devienne majoritaire dans le produit final de réaction.
Pour les produits de petite taille, la quantité de radioactivité, de flourescence, ou encore de molécule rapporteur (par exemple biotine) incorporée par molécule sera moins importante que pour les produits de plus grande taille, introduisant là aussi une différence potentielle d'intensité des signaux obtenus après hybridation des puces. Une autre technique d'amplification des ARN, cette fois-ci linéaire, a également été décrite (Van Gelder et coll., 1990, PNAS 87: 1663-1667). Cette méthode permet, par transcription inverse des ARN messagers amorcée à partir d'un oligonucièotide contenant plusieurs T (complémentaires de la queue poly A des ARN messagers) flanqués d'une séquence reconnue par l'ARN Polymérase du phage T7, d'obtenir des ADNc simple brin comprenant à leur extrémité 5' la séquence promotrice pour la T7 ARN Pol. La synthèse d'un double brin complémentaire de l'ADNc simple brin est ensuite initiée selon différents protocoles : - soit par la méthode dite de l'épingle à cheveux (Maniatis et coll., 1978, Cell, 15 : 687-701), qui implique une réaction à la Nucléase S1 difficile à contrôler et conduisant à des réarrangements dans la partie correspondant aux extrémités 5' des ARNm ;
- soit par la méthode dite de Gubler et Hoffman (Gubler et Hoffman, 1983, Genêt., 25 : 263-269), qui peut elle aussi générer des épingles à cheveux et nécessiter un traitement à la Nucléase S1 ;
- soit par la technique dite du "tailing", qui consiste à rajouter grâce à l'activité enzymatique de la TdT une queue homopolymérique à l'extrémité 3' des ADNc simple brin néo-synthétisés, puis à amorcer la synthèse du second brin à partir d'un oligonucièotide complémentaire de la queue homopolymérique.
Les produits double brin obtenus sont ensuite amplifiés par incubation avec l'enzyme T7 ARN polymérase. Cependant, pour chaque ARNm présent dans le mélange initial, la taille du produit amplifié dépendra, d'une part, de l'efficacité de l'étape de transcription inverse et, d'autre part, de l'amorçage de la synthèse du second brin. Si les produits obtenus sont de tailles variables, l'efficacité de l'amplification ne sera pas la même pour toutes les molécules du mélange, et les mesures réalisées lors de l'hybridation des puces risquent de ne pas être reproductibles. De plus, pour les produits de petite taille, la quantité de radioactivité incorporée par molécule sera moins importante que pour les produits de plus grande taille, introduisant une différence potentielle lors de la quantification de l'hybridation.
La présente invention vise à remédier aux biais introduits par toutes ces techniques lors de l'amplification et du marquage d'acides nucléiques de tailles hétérogènes, biais qui limitent l'analyse quantitative des transcriptomes. Elle fournit un procédé de réalisation d'une sonde complexe à partir d'un transcriptome qui permet de conserver la représentativité de chaque ARN dans le produit final par l'obtention de fragments de taille et de marquage spécifique homogènes, et ce après une étape d'amplification des ADNc.
Elle s'applique à toutes les méthodes d'amplification utilisables pour l'analyse d'un mélange complexe d'acides nucléiques.
Les produits obtenus peuvent ainsi servir de sondes complexes pour l'étude de l'expression des gènes et plus particulièrement d'acquérir des données quantitatives sur cette expression.
La présente invention concerne un procédé de réalisation de sondes complexes à partir d'ARN totaux ou d'ARN messagers, pour l'étude de l'expression quantitative des gènes sur puces à ADN. Le principal avantage par rapport aux méthodes décrites précédemment réside, d'une part, dans le fait que les ARN sont transcrits en ADNc de taille homogène, et que la quantité de radioactivité (ou de tout autre type de marquage) incorporée est la même pour toutes les molécules présentes dans le mélange initial et, d'autre part, que la mesure est réalisée sur une puce à ADN comportant des brins d'ADN cibles caractérisés par une séquence représentant l'extrémité 3' des gènes dont on veut mesurer les transcrits.
La quantification réalisée après l'hybridation sur puces à ADN n'est donc pas biaisée par des différences d'activités spécifiques des ADNc synthétisés.
Plus précisément, cette méthode s'applique à des sondes réalisées à partir des extrémités poly A des ARNm (la transcription inverse des ARNm en ADNc est amorcée par un oligonucièotide poly T), et à des puces où sont déposés des clones dits en 3', c'est-à-dire des ADNc (sous forme de produits de PCR ou de clones bactériens) ayant également été obtenus à partir des extrémités 3' des ARNm. En effet, ce procédé de réalisation ne peut pas s'appliquer à un amorçage au hasard de l'étape de transcription inverse des ARNm de la sonde, les ADNc de la sonde devant être dans la même région que les ADNc déposés sur le support afin de permettre l'hybridation.
Plus précisément, l'étape permettant l'homogénéisation en taille a lieu lors de la transcription inverse des ARNm en ADNc simple brin, étape qui est calibrée (c'est-à-dire contrôlée d'un point de vue cinétique) pour que les ADNc simple brin soient tous de tailles comparables.
Leur amplification ultérieure n'est en conséquence plus biaisée par les différences de taille entre les produits de la transcription reverse. Ainsi, la présente invention porte sur un procédé d'obtention de sondes représentatives d'une population d'acides nucléiques dont une analyse quantitative des éléments est recherchée, caractérisé en ce qu'il comprend : a) une étape de calibrage des conditions expérimentales de transcription ou de rétro-transcription permettant l'obtention de fragments d'acides nucléiques sensiblement de la même longueur, ladite longueur étant comprise entre 20 et 2000 nucléotides ; b) une étape d'obtention d'une population de séquences sondes issues de la transcπption ou rétrotranscription de la population d'acides nucléiques dont une analyse quantitative des éléments est recherchée dans les conditions préétablies lors de l'étape précédente, de sorte que les sondes sont de taille homogène et sont représentatives de la partie 3' de chaque élément de ladite population ; c) une étape d'amplification des séquences obtenues en b). Les fragments recherchés auront de préférence une taille comprise entre 500 et 1500 nucléotides, et de manière préférée d'environ 1000 nucléotides.
Il est donc bien entendu, vu ce qui précède, que la population d'une séquence sonde de taille homogène peut être issue d'une étape de transcription et de rétrotranscription suivie d'une amplification. Par amplification, il est entendu ici toute technique qui, à partir de la séquence de départ, qu'elle soit un ARN ou un ADN, permet d'obtenir un grand nombre de copies identiques ou complémentaires desdites séquences. De telles techniques sont décrites dans la littérature et comprennent de nombreux dérivés. On peut citer à titre d'exemple la PCR, la RT-PCR, la TMA (transcription mediated amplification), la NASBA (Nucieic acid séquence based amplification) et la 3SR (Self sustained séquence replication). De préférence si on choisit d'amplifier par PCR, on privilégiera une méthode qui ne produise pas de fragments tronqués, et ce en utilisant de préférence la technique suivante :
Le mélange complexe d'ARN est rétro-transcrit selon le procédé décrit en a) et b) à partir d'une amorce contenant une séquence poly T flanquée d'une séquence connue, ou ancre 3', dans laquelle sont choisies des amorces permettant de réaliser des PCR emboîtées. Les ADNc simple-brin obtenus sont ligaturés en 5' grâce à l'ARN ligase du phage T4 (T4 ARN Lig.) avec un oligonucièotide modifié de séquence choisie (extrémité 5' phosphate pour la ligature avec l'extrémité 3' OH des ADNc, et extrémité 3' NH2 afin d'éviter la ligature de l'oligonucléotide sur lui-même). Cette ancre 5' contient des séquences pour plusieurs amorces de PCR emboîtées, compatibles en terme de PCR avec les amorces de l'ancre 3'.
La séquence des ancres choisies présentent les caractéristiques suivantes : - la séquence des ancres ne doit pas présenter d'homologies avec les séquences de l'espèce dont on étudie le transcriptome ;
- leur composition en base sera de préférence de 60 % de GC afin d'améliorer la qualité de l'hybridation ; - la taille de ces ancres peut aller de 20 à 70 nucléotides, de préférence 50 nucléotides afin de choisir à l'intérieur, jusqu'à 3 amorces de PCR emboîtées ("nested" PCR).
Ces oiigos de PCR seront choisis par couples, pour rendre compte i) de la compatibilité des températures d'hybridation, ii) de l'absence d'épingles à cheveux, iii) de l'absence de formation de dimères intra- et inter-moléculaires stables.
Les produits double brin ainsi obtenus sont alors tous de même taille, et comportent à leurs extrémités 5' et 3' des ancres connues ; il est possible d'amplifier par PCR emboîtées toutes les séquences présentes dans le mélange grâce aux amorces choisies dans les ancres 5' et 3'. Ce procédé évite les amorçages non spécifiques observés par exemple dans le cas de l'usage d'une amorce homopolymérique pour la PCR ancrée utilisant le "tailing". Cette technique de ligature peut aussi s'appliquer à une amplification linéaire. Les sondes sont marquées à l'occasion de la transcription, la transcription réverse ou le cas échéant de l'amplification des transcrits ou de rétrotranscrits. Le marquage est réalisé par tout moyen connu pour marquer les oligonucléotides en cours de synthèse. A titre d'exemple, et parmi les plus classiques, on peut citer la radio-activité par incorporation de nucléotides triphosphate radioactifs, la fluorescence par incorporation de nucléotides fluorescents, ou à l'incorporation de nucléotides comprenant une modification chimique qui en permet le lien avec un composé qui directement ou indirectement est susceptible d'émettre un signal fluorescent, phosphorescent, luminescent ou colorimétrique. Un exemple aujourd'hui classique de ce type de marquage est le couplage du nucléotide à la biotine, où le signal est produit par couplage de la biotine à l'avidine ou à la streptavidine porteur d'une enzyme, elle-même susceptible de transformer un substrat en molécule fluorescente ou luminescente ou colorée.
Dans le procédé de l'invention, l'étape a) de calibrage pour l'obtention de transcrits ou de rétrotranscrits de taille homogène préalablement choisie consiste à :
- préparer un mélange complexe d'acides nucléiques ;
- réaliser un mélange d'incubation comprenant ledit mélange, une transcriptase ou une transcriptase réverse, les quatre deoxynucléotides triphosphate dont au moins un est marqué et l'ensemble des réactifs permettant la réaction enzymatique ;
- incuber ce mélange à la température d'activité de l'enzyme ;
- prélever des aliquots au cours du temps d'incubation ;
- analyser la taille des produits de la réaction pour chaque aliquot ; - choisir le temps d'incubation qui produit des ADNc de taille homogène préalablement choisie.
Ces étapes ne seront pas effectuées pour chaque réalisation de sondes, mais permettent d'établir la condition de rétrotranscription optimale qui sera appliquée pour toutes les sondes réalisées dans des conditions similaires, notamment avec la même enzyme.
Lorsque l'on parle de préparation de mélange complexe d'acides nucléiques, il s'agit en fait de préparer des ARN totaux en quantité suffisante à la réalisation d'une cinétique permettant de choisir la durée d'incubation optimale pour une taille de rétrotranscπts donnée. L'analyse de la taille des produits de la réaction permettant d'établir le temps d'incubation optimal peut être réalisée par tout moyen connu de l'homme du métier. Parmi ceux-ci, on peut citer l'électrophorèse sur gel dénaturant (5).
Afin de vérifier que le calibrage est correct, on réalise une hybridation "contrôle" d'une puce où se trouvent des ADN complémentaires de 3 ARN de tailles différentes ajoutés au mélange d'ARN initial dans les mêmes proportions : par exemple des ARN de 0,5, 1 et 2.5 kb sont introduits à 2 °/00 (par exemple : 0,2 ng de chaque pour 5 μg d'ARN totaux). La quantification de ces spots d'ARN contrôles devra donner les mêmes intensités pour les trois tailles différentes si la condition est correcte. Une fois la condition optimale déterminée, cette condition est appliquée à l'échantillon contenant le transcriptome que l'on veut étudier. Elle peut également être appliquée, dans un premier temps, à la transcription réverse du transcriptome puis à l'amplification du mélange complexe obtenu. Comme il a été dit plus haut, les produits d'amplification par PCR posent un réel problème dans la mesure où la taille du produit amplifié dépend, d'une part, de l'efficacité de l'étape de transcription inverse, d'autre part de l'amorçage de la synthèse du second brin et des étapes d'amplification. Donc, plus la matrice de départ est courte, plus le produit d'amplification a tendance à devenir majoritaire dans le produit final. Ceci est vrai pour toutes les techniques d'amplification décrites dans la littérature et particulièrement avec la technique d'amplification améliorée décrite ci-dessus consistant à flanquer une séquence connue à une amorce poly T afin d'obtenir des ancres connues en 5' et 3'. Le procédé de l'invention comprenant une étape de calibrage et de production de transcrits ou de rétrotranscrits de taille homogène et représentative de la partie 3' des ARN messagers permet d'envisager l'utilisation d'une technique d'amplification sur ces transcrits ou sur ces rétrotranscrits conduisant à une population de séquences amplifiées représentatives des séquences de départ. Ainsi, les produits d'amplification doivent également être considérés comme représentatifs du transcriptome du départ puisque l'étape d'amplification à partir d'une matrice composée de fragments de taille homogène ne comporte plus ce biais résultant de la différence de tailles des fragments.
L'analyse quantitative d'un transcriptome est avantageusement réalisée par l'analyse simultanée d'un grand nombre d'hybridations entre les sondes et des séquences cibles représentatives des gènes du génome correspondant. Aussi, le procédé de l'invention est particulièrement intéressant lorsqu'il est appliqué à la mise en oeuvre des hybridations sur macro-ou micro-réseaux (macro- ou micro-arrays) ou sur des puces à ADN. La présente invention porte également sur un procédé d'analyse quantitative d'un transcriptome et est caractérisé en ce qu'il comprend : a) un calibrage pour la détermination des conditions optimales d'obtention de sondes de taille homogène ; b) la réalisation de sondes marquées constituées d'un mélange complexe d'acides nucléiques marqués représentatif du transcriptome par mise en oeuvre d'un procédé décrit ci-dessus ; c) l'amplification des sondes obtenues en b) par toute technique connue de l'homme du métier telle la PCR, la PCR ancrée, la PCR emboîtée, RT- PCR, TMA, NASBA ; d) la préparation d'un support sur lequel sont fixées de manière ordonnée des ADNc (cibles) correspondant aux extrémités 3' des ARNm d'intérêt représentant chacune un gène différent ; e) l'hybridation des sondes en b) ou c) avec les cibles en d) ; f) la mesure quantitative du marquage obtenu au niveau de chaque cible.
Dans l'étape c) ci-dessus, on peut utiliser de manière préférée la méthode améliorée de PCR ancrée décrite ci-dessus dans laquelle l'amorce poly T est flanquée d'une ancre connue et l'ADNc ligaturé avec une ancre 5' grâce à la T4 ARN ligase.
Dans l'étape f) ci-dessus, le marquage mesuré est un reflet fidèle des quantités relatives des différents éléments du transcriptome étudié.
Ainsi, le procédé de l'invention d'analyse quantitative d'un transcriptome permet de surmonter les différents biais des méthodes existantes citées dans l'introduction et qui conduisaient à surestimer ou sous-estimer la quantité de certaines catégories d'ARN messagers dans un transcriptome donné. Ici, les proportions relatives des différents ARN messagers sont les mêmes après les étapes de rétrotranscription et d'amplification. Le procédé selon l'invention permet ainsi de faire une
"photographie" d'un transcriptome donné et donc, le cas échéant, de le comparer à un autre. Ceci est particulièrement intéressant dans différentes situations où l'on cherche à analyser un état physiologique ou pathologique d'une cellule, ou de l'effet d'un traitement. Dans ce procédé, les sondes marquées du mélange en b) ou en c) sont de taille homogène et comprises entre 20 et 2000 nucléotides et de préférence entre 500 et 1500 nucléotides. Une longueur optimale est d'environ 1000 nucléotides. Il va de soi que dans le procédé qui intégre une étape d'amplification, la première étape de transcription ou de rétrotranscription conduit à la constitution de fragments d'acides nucléiques de taille homogène mais non marqués. L'obtention des sondes marquées est alors réalisée par amplification de ce mélange intermédiaire.
Dans le procédé de l'invention, l'hybridation des sondes amplifiées avec les cibles fixées sur les puces, se fait de préférence en excès de cibles par rapport aux sondes de sorte que la quantité fixée sur la cible de l'espèce correspondante est proportionnelle à son abondance relative dans le mélange initial. Il est essentiel dans le procédé de l'invention que les mesures effectuées après hybridation sur la puce soient effectivement quantitatives et reflètent le taux d'expression du transcriptome et sa variabilité.
Aussi, et afin de garantir la fiabilité des résultats de quantification, il avantageux d'inclure des réactifs de contrôles.
Ainsi, dans le procédé de l'invention, il est avantageux d'incorporer au transcriptome au moins un ARNm exogène en quantité connue et dans l'étape d) une cible hybridable avec ce ou ces même ARN ou avec le produit de sa transcription réverse. On peut utiliser, d'une part, des réactifs permettant d'étalonner quantitativement la mesure. Pour ce faire, on inclut des contrôles internes qui consistent à réaliser simultanément sur la même puce l'hybridation des sondes correspondant au transcriptome avec les cibles et l'hybridation d'une sonde exogène avec une cible complémentaire. L'utilisation d'un tel standard extérieur a été décrit dans (3). Dans cet article, une séquence de A. thaliana de cytochrome C554 (ou CG03) qui n'a aucune homologie avec l'ADN de mammifères a été intégrée et comme spot sur la puce et comme sonde dans l'échantillon de transcriptome. La quantification des signaux obtenus pour ces contrôles internes positifs permet de donner une estimation de l'abondance des autres ARN dans l'échantillon. Ces contrôles permettent de plus de comparer plusieurs expériences indépendantes entre elles de façon fiable, puisqu'ils corrigent les différences de marquage, lavage, temps d'exposition et perte éventuelle de matériel sur les membranes après plusieurs hybridations successives (3). Dans le procédé de l'invention, on peut étalonner quantitativement la mesure en mesurant dans la sonde des ARNm correspondant à des gènes ubiquitaires ou gènes de ménage dont on sait que le niveau d'expression est constant dans tous les échantillons étudiés. On peut utiliser, d'autre part, des réactifs permettant de contrôler l'efficacité du procédé de calibration. Pour ce faire, un contrôle interne de validation des mesures est réalisé par incorporation, dans l'échantillon d'ARN à analyser, de 0,05 % à 0,2 %, voire plus, d'au moins deux ARN exogènes synthétisés in vitro. Il peut s'agir par exemple d'un ARN de cytochrome C554 (ou CG03) de 1kb, et de deux autres ARN exogènes de taille différente, par exemple de 0,5 kb et 2,5 kb, qui permettent de vérifier avantageusement que la longueur n'influe pas sur l'intensité du signal quand la transcription inverse est réalisée pendant une durée déterminée par la méthode de calibrage selon la présente invention. Un contrôle négatif peut être également réalisé : des clones contenant des séquences polyA sont déposés régulièrement sur la membrane, afin de vérifier que les séquences polyT introduites lors de la synthèse de la sonde complexe par transcription inverse n'induisent pas de bruit de fond.
Enfin, des dépôts de clones contenant le "vecteur" vide (ou l'absence de dépôt à certains emplacements) sur la membrane permettent de mesurer le bruit de fond et éventuellement de le déduire des signaux spécifiques.
Dans le procédé de l'invention, les puces peuvent être des micro-réseaux ou des macro-réseaux. Le support peut être en silice, en verre ou en nylon comme cela est largement décrit dans (1) où les performances respectives des supports en nylon ou en verre sont fournies. Les puces sont porteuses de 1 à 100.000 cibles. Cela dépend bien entendu de la surface de la puce elle-même et du transcriptome étudié. Dans certains cas, il est intéressant d'utiliser des membranes à basse densité, dont le format peut être adapté au nombre de gènes étudiés ou à la quantité de matériel de départ disponible.
Des membranes à haute densité sur support de nylon peuvent aussi être développées. Ces membranes peuvent avoir un format de type microarray (de la taille d'une lame de verre), ou avoir un format de type macroarray (10 à 100 cm2 environ). Ces puces à haute densité permettent l'analyse de plusieurs milliers de gènes simultanément.
Les cibles peuvent être des oligonucléotides ou des ADNc purifiés fixés par les méthodes bien connues de l'homme du métier, à partir du moment où la fraction correspondant à la partie 3' du ARNm du transcriptome est accessible à l'hybridation.
Les cibles peuvent être également des clones bactériens dont le génome est porteur de la séquence dont la quantification est recherchée ou d'une séquence complémentaire de celle-ci. Les techniques de dépôt de ces clones ou de ces séquences purifiées sur les puces peuvent être utilisées et sont connues de l'homme du métier. Il est évident que tout autre technique permettant de laisser accessible les séquences complémentaires de la partie 3' des ARN messagers est utilisable dans le procédé de l'invention.
La présente invention porte également sur un kit pour l'étude quantitative de la variabilité d'un transcriptome caractérisé en ce qu'il comprend au moins :
- des dNTP libres dont l'un est marqué ;
- une réverse transcriptase ;
- au moins deux sondes de contrôle de validation quantitative constituées de deux séquences d'acides nucléique de taille prédéterminée et différente pour chacune, ne faisant pas partie du transcπptome ou n'étant pas hybridables avec des éléments de ce dernier ;
- un support sur lequel sont fixées de manière ordonnée des séquences cibles susceptibles d'être hybridees avec des copies en 3' des ARNm du transcriptome, et au moins deux cibles hybridables avec les sondes de contrôle.
Le kit selon l'invention peut contenir également l'ensemble des réactifs nécessaires à la mise en oeuvre d'une amplification.
Dans le kit selon l'invention, les cibles sur le support sont des ADNc purifiés. Néanmoins, les cibles peuvent être également des extraits bactériens dont le génome ou le(s) plasmide(s) contient les séquences susceptibles d'être hybridees avec les sondes.
Le support Nylon se prête aussi bien à des dépôts de colonies bactériennes à faible densité (par exemple 36 dépôts par cm2) qu'à des dépôts de produits de PCR à faible, moyenne ou haute densités (jusqu'à 2.000 dépôts par cm2). Il permet la détection des complexes d'hybridation par radioactivité (qui présente la meilleure sensibilité), et se prête également à des méthodes de détection non isotopiques comme la chemiluminescence (5) ou la colorimétrie (4). Enfin, comme nous l'avons vu précédemment, les performances des microarrays Nylon/sonde radioactive restent inégalées et s'adaptent à des thématiques où la taille de l'échantillon à traiter est réduite (biopsies, cultures primaires de cellules...). La réalisation des expériences ci-après indique que la méthode de calibrage conduisant à l'obtention de rétrotranscrits de taille homogène conduit effectivement à l'obtention de résultats quantitatifs et reproductibles quant au taux de sondes hybridees sur les cibles. LEGENDE DES FIGURES :
La figure 1 représente une image obtenue après hybridation d'une membrane contenant 1056 spots (chaque spot correspondant à un clone d'ADNc souris) avec une sonde complexe réalisée en appliquant le procédé standard de l'invention à des ARN totaux de thymus de souris en deux heures de transcription inverse.
Les spots entourés correspondent à des clones dont le niveau d'expression mesuré est beaucoup plus élevé lorsque la transcription est longue, et dont les ARNm sont de longue taille.
Les spots encadrés correspondent aux clones dont le niveau d'expression est constant quel que soit le temps de transcription, et dont les ARNm sont de petite taille.
La figure 2 représente une image obtenue après hybridation d'une membrane contenant 1056 spots avec une sonde complexe réalisée en appliquant le procédé de l'invention à des ARN totaux de thymus de souris en 30 minutes de transcription inverse.
La figure 3 représente un Northern Blot réalisé à partir d'ARN totaux de cerveau et hybrides avec une sonde réalisée à partir d'un clone dont le niveau d'expression mesuré est constant quel que soit le temps de transcription. La bande observée correspond à un ARNm de 200 nucléotides, comme l'indique l'échelle de poids moléculaire.
La figure 4 représente des ADNc marqués radioactivement obtenus par transcription inverse (15 min, 30 min, 1 h et 2 h de RT) et migres sur un gel alcalin dénaturant permettant d'analyser la taille des ADNc (échelle de poids moléculaire à gauche). PROTOCOLES EXPERIMENTAUX :
1. Préparation des membranes : Les membranes sont préparées selon les protocoles décrits dans (2) et (3). Après dépôt sur les membranes, des clones bactériens ou des ADN cibles produits par PCR, ceux-ci sont dénaturés in situ puis neutralisés. 2. Hybridation oligonucléotidique (vecteur) :
L'hybridation vecteur sert à mesurer le taux d'ADN de chaque spot afin d'effectuer une correction des valeurs obtenues avec les sondes complexes. Il est important d'exposer suffisamment longtemps et de quantifier correctement cette hybridation avant celle en sonde complexe. 2.1. Préparation de l'oligonucléotide radiomarqué :
Les oligonucléotides utilisés dépendent des séquences flanquant les ADNc cibles, soit par exemple pour les plasmides pcDNAI et pT7T3 :
- pCDNAI : 5'gcttatcgaaattaatacgactcactatag - pT7T3pac : 5'tgtggaattgtgagcggata ou
T7 : taatacgactcactataggga
2.2. Le marquage est ensuite réalisé par incubation des oligonucléotides en présence de 1 μl d'oligo (1 μg/μl), 2 μl de tampon 10 X T4 polynucléotide kinase (Biolabs), 3 μl de γAT33P (5000 Ci/mM), 1 μl de T4 polynucléotide kinase (10 U/ul, Biolabs), Eau stérile qsp 20 μl final.
2.3. Précipitation (pour éliminer la plupart des ATP non incorporés) :
L'ADN est ensuite précipité en présence de 1 μl d'ADN de sperme de hareng (Boehringer, 10 mg/ml), 2 μl d'acétate de sodium 3M, 60 μl d'éthanol absolu froid (-20° C).
Le mélange réactionnel est placé 15 min à -80° C, centrifugé 30 min à 4° C puis le surnageant (fortement radioactif) est éliminé. Le culot est resuspendu dans 100 μl d'eau stérile.
Le comptage est ensuite effectué en scintillation liquide. 2.4. Hybridation de la sonde oligonucléotidique : Le tampon d'hybridation/préhybridation est constitué de 5X SSC, TX Dehnardt's, 0,5 % SDS. (tampon H).
2.4.1 Préhybridation :
A 50 ml de tampon H sont ajoutés 100 μg/ml (concentration finale) de DNA de sperme de hareng soniqué (Boehringer). La solution stock est à 10 mg/ml et l'aliquot nécessaire est dénaturé juste avant son utilisation par chauffage 10 min à 100° C puis refroidi rapidement à O°C en plaçant le tube 10 min dans la glace.
Les filtres sont préhybridés à 42° C pendant 4 heures minimum (12 h maximum) dans le tampon H (50 ml de tampon et 4 filtres maximum par boîte ou 10 ml dans des tubes).
2.4.2 Hybridation :
Les filtres sont hybrides dans 50 ml de tampon H puis retirés.
Un mélange sonde froide/chaude est ajouté au tampon. Les filtres sont ensuite remis dans la boîte un par un. L'hybridation se fait à 42° C pendant
12 heures au moins et sous agitation en ambiance humide afin d'éviter une éventuelle évaporation.
Le mélange sonde froide/chaude est constitué de 10 μg d'oligo vecteur froid, 100.000 à 200.000 cpm/ml d'oligo marqué (soit 5 à 10 millions pour 50 ml).
2.4.3 Lavages et déshybridation :
Les lavages se font avec 1 litre de tampon 2X SSC 0,1 % SDS, 10 min, à température ambiante puis 5 min à 42° C en changeant une fois le tampon. Les membranes sont exposées à un écran de phosphore qui est ensuite lu par un appareil de type Fuji Bas 1500.
2.4.4. Déshybridation :
Déshybrider en 0,1 X SSC/0,1 % SDS pendant 3 heures à 68° C en changeant une fois le tampon. 3. Marquage de sondes complexes à partir de 5μg d'ARN total :
3.1. Préparation de la sonde radiomarquée : La sonde complexe est préparée à partir des ARN totaux extraits de l'échantillon d'intérêt (tissu, culture cellulaire...). La première étape est une étape d'appariement ou "annealing" (pour que les ARN perdent leur structure secondaire et pour saturer les queues polyA avec l'oligo dT). Un large excès d'oligo dT est utilisé pour que la RT transcription commence juste après le début de la queue polyA. Les conditions sont les suivantes : 5 μg d'ARN et 0,2 ng d'ARNm du contrôle CG03 (cytochrome) ainsi que 0,2 ng de chaque autre ARN exogène servant de contrôle de validation quantitative, et 8 μg de dT25 sont ajoutés à 13 μl d'eau stérile et incubés 8 min à 70° C, puis 30min de 70° C à 42° C.
3.2. Transcription Inverse (pour synthétiser et marquer simultanément l'ADN simple brin correspondant à environ 100 ng d'ARNm présent dans les 5 μg d'ARN total) :
Celle-ci est effectuée dans les conditions suivantes : à l'échantillon maintenu à 42° C sont ajoutés 1 μl de RNasin (Ribonuclease inhibitor, Promega, Ref N2511 , 40U/μl), 6 μl de tampon premier brin 5X (BRL), 2 μl de DTT 0,1 M, 0,6 μl de dATG 20 mM (20 mM chacun), 0,6 μl de dCTP 120 μM, 3 μl de (α33P) dCTP 10 μCi/μl (> 3000 Ci/mM), 1 μl de reverse transcriptase (SUPERSCRIPT RNase H free RT, BRL, 200U/μl), eau stérile qsp 30 μl. a) protocole classique :
- incuber 1 heure à 42° C (étuve)
- rajouter 1 μl de reverse transcriptase
- incuber de nouveau 1 heure à 42° C (étuve) b) protocole de calibrage :
La réaction de RT est stoppée au bout de 15 min, 30 min,
1 heure ou 2 heures (c'est-à-dire 4 réactions avec des ARN non précieux).
L'arrêt de la réaction se fait par passage dans la glace puis lyse alcaline des ARN, ou par tout autre méthode connue de l'homme du métier : par exemple RNase H ou ajout de ddNTP. Ces quatre sondes "tests" sont hybridees sur des arrays contenant au moins les trois cibles complémentaires des 3 ARN exogènes de tailles différentes (500/1000/2500) introduits dans les mêmes proportions dans les ARN du mélange initial. Celle des quatre conditions permettant d'obtenir des signaux de même intensité pour les spots contrôles est définie comme condition optimale pour la suite des expériences mettant en jeu : la même RTase, les mêmes conditions expérimentales sur l'ensemble du protocole.
Le mélange réactionnel est ensuite neutralisé par ajout de 10 μl de TRIS IM, 3 μl d'HCI 2N et eau stérile qsp 150 μL
Les sondes complexes sont purifiées sur une colonne de 1 ml de Sephadex G50 (Pharmacia). c) protocole d'amplification par PCR :
Des ancres ont été ajoutées en 3' et en 5' des ADNc obtenus. En 3', il s'agit d'un oligo dT contenant dans sa partie 5' la séquence promotrice pour la T7 ARN polymérase et en 5' une séquence complémentaire du promoteur SP6.
La première ancre est ajoutée lors de la transcription inverse réalisée selon les conditions définies en b), et la deuxième ancre est ajoutée par ligature avec la T4 ARN ligase, à l'extrémité 3' des ADNc synthétisés.
L'amplification PCR est réalisée avec un couple d'amorces complémentaires des ancres en 3' et en 5', à savoir T7 et SP6. Le marquage se fait pendant ou après la PCR. 4. Hybridation de la sonde complexe :
Les conditions d'hybridation sont les mêmes que celles décrites en 2.4 ci-dessus, avec les modifications suivantes :
- l'étape de préhybridation est effectuée entre 65 et 68° C pendant 6 heures minimum dans le tampon H ; - l'étape d'hybridation est réalisée entre 65 et 68° C pendant
48 heures. Toute la sonde marquée doit être ajoutée afin de ne pas modifier la concentration des espèces d'ARN et rendre difficile la comparaison avec d'autres expériences ;
- les lavages se font dans 1 litre (pour 4 filtres) de solution 0,1 X SSC, 0,1 % SDS à 68° C pendant 3 heures en changeant une fois la solution de lavage.
(La solution de lavage étant préchauffée à 68° C).
Les membranes sont exposées à un écran de phosphore qui est ensuite lu par un appareil de type Fuji Bas 1500.
La déshybridation est réalisée en 0,1 % SDS/ 1 mM EDTA à 80°C pendant 2 heures 30 (1 litre pour 4 filtres).
EXEMPLE 1 : Taille des ADNc obtenus après 4 temps différents de transcription inverse :
Les ARN de départ sont les ARN totaux de cerveau de souris.
La réaction de transcription inverse (RT) a été conduite selon le protocole décrit dans les publications ci-dessus et dans (2) et (3).
Quatre réactions ont été réalisées en parallèle :
. Réaction de 2 heures (protocole "classique", 1 heure de RT, ajout d'1 μl d'enzyme et de nouveau 1 heure de RT) ;
. 1 heure de RT, . 30 minutes de RT,
. 15 minutes de RT.
Les produits de RT (dans lesquels ont été incorporés des nucléotides radioactifs marqués au phosphore 32) ont ensuite été déposés sur gel alcalin dénaturant (5) avec un marqueur de poids moléculaire, puis visualisés par autoradiographie. Les résultats obtenus apparaissent sur la figure 4.
Les tailles approximatives observées sont respectivement :
. RT 2 heures : 100 < ADNc < 5.930 nucléotides,
. RT 1 heure : 100 < ADNc < 4.367 nucléotides, . RT 30 min : 100 < ADNc < 2.760 nucléotides,
. RT 15 min : 100 < ADNc < 1575 nucléotides. EXEMPLE 2 : Analyse quantitative du transcriptome :
Des ADNc rétrotranscrits à partir d'ARN de thymus de souris ont été hybrides sur des puces porteuses de ADNc de gènes exprimés chez la souris et portés par des plasmides bactériens.
Après avoir mis en oeuvre la méthode de calibrage selon l'invention, la durée de la réaction de rétrotranscription a été fixée à 30 min.
La figure 1 représente les intensités des spots obtenus après la durée classique du rétrotranscription (2 heures, figure 1), et pendant la durée choisie de 30 min., déduite de l'opération préalable de calibrage (figure 2).
L'intensité des spots obtenus a été comparée dans ces deux conditions expérimentales et les résultats sont indiqués dans le tableau suivant :
Figure imgf000026_0001
Ces valeurs ont été obtenues après quantification par le logiciel Biolmage (Fuji) des images des figures n° 1 et 2. Les valeurs données sont des abondances relatives (AR : abondance de l'ARNm de chaque clone dans le transcriptome utilisé pour réaliser la sonde complexe). La première colonne renseigne sur le nom des clones, les deuxième et troisième colonnes donnent les abondances relatives de ces clones pour les filtres n° 7 (colonne 2) et n° 10 (colonne 3), et la dernière colonne donne pour chaque clone le rapport des mesures 2 heures/30 minutes. Les 7 premiers clones entourés dans les figures 1 et 2 ont des mesures d'expression nettement supérieures lorsque la sonde est réalisée en deux heures. Les autres clones encadrés dans les figures 1 et 2 et correspondant au groupe B des tableaux ont des mesures d'expression constantes quel que soit le temps de transcription. On remarque en observant les valeurs du Tableau une beaucoup plus grande stabilité du rapport dans la série des spots B que dans la série des spots A. En effet, dans les spots A, la radio-activité mesurée sur chaque spot est beaucoup plus importante après deux heures qu'après trente min. de rétrotranscription. Cela correspond à des ARN longs comme le montrent des expérences de Northern Blot réalisées par la suite.
En revanche, la stabilité du rapport deux heures/30 min. dans la série B est le signe d'une hybridation d'ARNm courts.
Ceci a été vérifié par une hybridation en Northern Blot qui montre effectivement que les ARN en cause ont une taille de
200 nucléotides comme l'illustre la figure 3.
On peut conclure de cette expérience que, lorsque les ARN sont courts, aucun biais n'est apporté dans la mesure quantitative de la quantité d'ARN présents. En revanche, lorsque les ARN sont de grande taille, la quantité de marquage mesuré est variable et ne peut donc être comparée d'un spot à un autre. Cette expérience valide le fait que la comparaison des intensités de marquage obtenues d'un spot à un autre est fiable pour des rétrotranscrits de courte taille.
REFERENCES BIBLIOGRAPHIQUES
(1 ) Granjeaud S., Bertucci F. et Jordan B. R. Expression profiling: DNA arrays in many guises. BioEssays, (1999) 21 : 781-790
(2) Bertucci F., Van Huist S., Bernard K., Loriod B., Granjeaud S., Tagett R., Starkey M., Nguyen C, Jordan B. Birnbaum D. Expression scanning of an array of growth control gènes in human tumor cell lines. Oncogene, 1999 July, 18(26): 3905-3912
(3) Bernard K. et coll., Nucl. Acids Research (1996) 24(8): 1435-42
(4) Chen et coll., Genomics (1998) 51 : 313-324
(5) Rajeevan M. S., Dimulescu J.M., Unger F.R., Vernon S.D.
Chemiluminescent analysis of gène expression on high-density filter arrays. J. Histochem Cytochem, 1999 March, 47(3): 337-342

Claims

REVENDICATIONS
1. Procédé d'obtention de sondes représentatives d'une population d'acides nucléiques dont une analyse quantitative des éléments est recherchée, caractérisé en ce qu'il comprend : a) une étape de calibrage des conditions expérimentales de transcription ou de rétro-transcription permettant l'obtention de fragments d'acides nucléiques de taille homogène ; b) une étape d'obtention d'une population de séquences sondes issues de la transcription ou rétrotranscription de la population d'acides nucléiques dont une analyse quantitative des éléments est recherchée dans les conditions de durée d'incubation préétablies lors de l'étape précédente, de sorte que les sondes sont de taille homogène et sont représentatives de la partie 3' de chaque élément de ladite population ; c) une étape d'amplification des séquences obtenues en b).
2. Procédé selon la revendication 1 dans lequel l'étape a) de calibrage pour l'obtention de transcrits ou de rétrotranscπts de taille homogène préalablement choisie consiste à :
- préparer un mélange complexe d'acides nucléiques de référence ; - réaliser un mélange d'incubation comprenant ledit mélange, une transcriptase ou une transcriptase réverse, les quatre deoxynucléotides triphosphate dont au moins un est marqué et l'ensemble des réactifs permettant la réaction enzymatique ;
- incuber ce mélange à la température d'activité de l'enzyme ; - prélever des aliquots au cours du temps d'incubation ;
- analyser la taille des produits de la réaction ;
- choisir la durée d'incubation qui produit des ADNc de taille homogène préalablement choisie.
3. Procédé selon la revendication 2 dans laquelle le mélange initial est un mélange d'ARN et l'enzyme est une transcriptase réverse.
4. Procédé selon la revendication 1 dans lequel les sondes de taille homogène sont amplifiées notamment par PCR, RT-PCR, la TMA, la NASBA, la 3SR, la PCR emboîtée, la PCR ancrée.
5. Procédé selon la revendication 4 dans lequel la PCR ancrée est améliorée par : a) addition en 3' d'une amorce poly T laquelle est flanquée d'un oligonucièotide de séquence connue dans laquelle sont choisies des amorces permettant de réaliser des PCR emboîtées ; b) ligature en 5' par l'ARN ligase du phage T4 d'un oligonucièotide de séquence connue et contenant des séquences pour plusieurs amorces de
PCR emboîtées compatibles avec les amorces de l'ancre en 3', lesdites séquences en a) et en b) ne devant pas présenter d'homologies avec les séquences de l'espèce dont on étudie le transcπptome.
6. Procédé selon l'une des revendications 1 à 5 caractérisé en ce que la population d'acides nucléiques dont une analyse quantitative des éléments est recherchée est une population d'ARN messagers cellulaires ou transcriptome, dont on cherche à analyser la variabilité d'expression entre différentes populations cellulaires, et la transcription réverse est amorcée en 3' par un oligonucièotide poly T.
7. Procédé selon l'une des revendications précédentes dans lequel le mélange complexe est marqué par incorporation de nucléotides triphosphates radioactifs ou susceptibles de porter un signal de détection fluorescent, phosphorescent ou luminescent.
8. Procédé selon l'une des revendications précédentes dans lequel l'analyse quantitative est une hybridation sur un micro-réseau (micro- array) porteur de séquences oligonucléotidiques susceptibles de s'hybrider avec les transcrits ou rétrotranscrits.
9. Procédé d'analyse quantitative d'un transcriptome caractérisé en ce qu'il comprend : a) un calibrage mettant en oeuvre la méthode de la revendication 2 ; b) la réalisation de sondes de taille homogène constituées d'un mélange complexe d'acides nucléiques marqués représentatif du transcriptome et susceptible d'être obtenu par le procédé selon la revendication 1 ; c) l'amplification des produits obtenus en b) notamment par PCR, PCR ancrée, PCR emboîtée, RT-PCR, TMA, NASBA ; d) la préparation d'un support sur lequel sont fixées de manière ordonnée des ADNc (cibles) correspondant aux extrémités 3' des ARNm d'intérêt représentant chacune un gène différent ; e) l'hybridation des sondes obtenues en b) ou c) avec les cibles en d) ; f) la mesure quantitative du marquage obtenu au niveau de chaque cible.
10. Procédé selon la revendication 9 dans lequel les sondes marquées du mélange obtenu en c) sont de taille homogène comprise entre 500 et 1500 nucléotides.
11. Procédé selon la revendication 9 dans lequel l'étape d'amplification en c) est une amplification PCR ancrée comportant : a) addition en 3' d'une amorce poly T laquelle est flanquée d'un oligonucièotide de séquence connue dans laquelle sont choisies des amorces permettant de réaliser des PCR emboîtées ; b) ligature en 5' par l'ARN ligase du phage T4 d'un oligonucièotide de séquence connue et contenant des séquences pour plusieurs amorces de PCR emboîtées compatibles avec les amorces de l'ancre 3'.
12. Procédé selon la revendication 9 dans lequel l'hybridation en e) est réalisée en conditions d'excès de cibles fixée par rapport aux sondes hybridees de sorte que la quantité fixée sur la cible de l'espèce correspondante est proportionnelle à son abondance relative dans le mélange initial.
13. Procédé selon la revendication 9 dans lequel on incorpore au transcriptome au moins un ARNm exogène en quantité connue et dans l'étape d) une cible hybridable avec ce ou ces même ARN ou avec le produit de sa transcription réverse.
14. Procédé selon la revendication 9 dans lequel on mesure dans le transcriptome au moins un ARN ubiquitaire (ou de ménage) dont une cible hybridable avec ce ou ces mêmes ARN ou avec le produit de sa transcription réverse a été incorporée dans l'étape d).
15. Procédé selon la revendication 9 dans lequel un contrôle interne de validation quantitative est introduit par incorporation dans le mélange complexe réalisé en b) ou en c) de au moins deux fragments d'acide nucléique de taille différente entre eux et de taille différente de la taille choisie pour les sondes du mélange complexe, et on incorpore sur le support en d) une séquence hybridable à ceux-ci.
16. Procédé selon la revendication 15 dans lequel lorsque la taille des sondes est d'environ 1000 nucléotides, les tailles des fragments d'acide nucléique sont respectivement d'environ 500 nucléotides et
1500 nucléotides.
17. Procédé selon la revendication 9 dans lequel le support en d) est porteur de 1 à 100 000 cibles.
18. Procédé selon la revendication 9 dans lequel les cibles fixées en d) sont des ADNc purifiés.
19. Procédé selon la revendication 9 dans lequel les cibles sont des clones bactériens dont le génome est porteur de la séquence dont la quantification est recherchée.
20. Kit pour l'étude quantitative de la variabilité d'un transcriptome caractérisé en ce qu'il comprend au moins :
- des dNTP libres dont l'un est marqué ;
- une réverse transcriptase ;
- au moins deux contrôles de validation quantitative constitués de deux séquences d'acides nucléiques de taille prédéterminée et différente l'une de l'autre, ne faisant pas partie du transcriptome ou n'étant pas hybridables avec des éléments de ce dernier ; - un support sur lequel sont fixées de manière ordonnée des séquences cibles susceptibles d'être hybridees avec des copies en 3' des ARNm du transcriptome, et au moins deux cibles hybridables avec les standards externes.
21. Kit selon la revendication 20 caractérisé en ce qu'il contient en outre les réactif pour réaliser une amplification.
22. Kit selon la revendication 20 dans lequel les cibles fixées sur le support sont des cADN purifiés.
23. Kit selon la revendication 20 dans lequel les cibles sont des extraits bactériens dont le génome contient les séquences susceptibles d'être hybridees avec les sondes.
PCT/FR2001/001293 2000-04-26 2001-04-26 Methode de mesure quantitative de l'expression des genes WO2001081625A1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP01929726A EP1276910A1 (fr) 2000-04-26 2001-04-26 Methode de mesure quantitative de l'expression des genes
US10/281,255 US20030143593A1 (en) 2000-04-26 2002-10-28 Quantative method for measuring gene expression

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0005322A FR2808287B1 (fr) 2000-04-26 2000-04-26 Methode de mesure quantitative de l'expression des genes
FR00/05322 2000-04-26

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US10/281,255 Continuation US20030143593A1 (en) 2000-04-26 2002-10-28 Quantative method for measuring gene expression

Publications (1)

Publication Number Publication Date
WO2001081625A1 true WO2001081625A1 (fr) 2001-11-01

Family

ID=8849615

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2001/001293 WO2001081625A1 (fr) 2000-04-26 2001-04-26 Methode de mesure quantitative de l'expression des genes

Country Status (4)

Country Link
US (1) US20030143593A1 (fr)
EP (1) EP1276910A1 (fr)
FR (1) FR2808287B1 (fr)
WO (1) WO2001081625A1 (fr)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005001135A2 (fr) * 2003-06-03 2005-01-06 Arcturus Bioscience, Inc. Detection d'acides nucleiques induite en 3'
EP2189792A2 (fr) * 2003-09-24 2010-05-26 Commissariat à l'Energie Atomique Dispositif pour séparer et/ou analyser plusieurs cibles moléculaires en solution dans un mélange complexe

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7374927B2 (en) * 2004-05-03 2008-05-20 Affymetrix, Inc. Methods of analysis of degraded nucleic acid samples

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6004755A (en) * 1998-04-07 1999-12-21 Incyte Pharmaceuticals, Inc. Quantitative microarray hybridizaton assays
WO2000014273A2 (fr) * 1998-09-03 2000-03-16 Signalgene Inc. Technique de representation de differentiels genetiques et vecteur

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19518505A1 (de) * 1995-05-19 1996-11-21 Max Planck Gesellschaft Verfahren zur Genexpressionsanalyse

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6004755A (en) * 1998-04-07 1999-12-21 Incyte Pharmaceuticals, Inc. Quantitative microarray hybridizaton assays
WO2000014273A2 (fr) * 1998-09-03 2000-03-16 Signalgene Inc. Technique de representation de differentiels genetiques et vecteur

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
BERNARD KARINE ET AL: "Multiplex messenger assay: Simultaneous, quantitative measurement of expression of many genes in the context of T cell activation.", NUCLEIC ACIDS RESEARCH, vol. 24, no. 8, 1996, pages 1435 - 1442, XP002159704, ISSN: 0305-1048 *
BERTUCCI FRANCOIS ET AL: "Expression scanning of an array of growth control genes in human tumor cell lines.", ONCOGENE, vol. 18, no. 26, 1 July 1999 (1999-07-01), pages 3905 - 3912, XP000979482, ISSN: 0950-9232 *
CHEN JEREMY J W ET AL: "Profiling expression patterns and isolating differentially expressed genes by cDNA microarray system with colorimetry detection.", GENOMICS, vol. 51, no. 3, 1 August 1998 (1998-08-01), pages 313 - 324, XP002159705, ISSN: 0888-7543 *
DUGGAN D J ET AL: "EXPRESSION PROFILING USING CDNA MICROARRAYS", NATURE GENETICS,NEW YORK, NY,US, vol. 21, no. SUPPL, January 1999 (1999-01-01), pages 10 - 14, XP000865980, ISSN: 1061-4036 *
NEWTON C R ET AL: "5. Isolierung und Konstruktion von DNA-Klonen", PCR, BIOS SCIENTIFIC PUBLISHERS, OXFORD, GB, 1994, pages 87 - 99, XP002177681 *
NGUYEN C ET AL: "DIFFERENTIAL GENE EXPRESSION IN THE MURINE THYMUS ASSAYED BY QUANTITATIVE HYBRIDIZATION OF ARRAYED CDNA CLONES", GENOMICS,US,ACADEMIC PRESS, SAN DIEGO, vol. 29, 1995, pages 207 - 216, XP002914394, ISSN: 0888-7543 *
ZHAO N ET AL: "High-density cDNA filter analysis: a novel approach for large-scale, quantitative analysis of gene expression", GENE,NL,ELSEVIER BIOMEDICAL PRESS. AMSTERDAM, vol. 156, no. 2, 1995, pages 207 - 213, XP004042356, ISSN: 0378-1119 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005001135A2 (fr) * 2003-06-03 2005-01-06 Arcturus Bioscience, Inc. Detection d'acides nucleiques induite en 3'
WO2005001135A3 (fr) * 2003-06-03 2005-02-03 Arcturus Bioscience Inc Detection d'acides nucleiques induite en 3'
EP2189792A2 (fr) * 2003-09-24 2010-05-26 Commissariat à l'Energie Atomique Dispositif pour séparer et/ou analyser plusieurs cibles moléculaires en solution dans un mélange complexe

Also Published As

Publication number Publication date
FR2808287A1 (fr) 2001-11-02
US20030143593A1 (en) 2003-07-31
EP1276910A1 (fr) 2003-01-22
FR2808287B1 (fr) 2004-09-17

Similar Documents

Publication Publication Date Title
EP0713922B1 (fr) Oligonucléotide utilisable comme amorce dans une méthode d&#39;amplification basée sur une réplication avec déplacement de brin
EP0721988B1 (fr) Oligonucléotide chimère et son utilisation dans l&#39;obtention de transcrits d&#39;un acide nucléique
CA2200627C (fr) Procede d&#39;amplification de sequences d&#39;acide nucleique par deplacement, a l&#39;aide d&#39;amorces chimeres
WO1997005277A1 (fr) Procede de detection d&#39;acides nucleiques utilisant des sondes nucleotidiques permettant a la fois une capture specifique et une detection
CA2464691A1 (fr) Procedes et systemes de profilage dynamique de l&#39;expression de genes
FR2683827A1 (fr) Procede de determination de la quantite d&#39;un fragment d&#39;adn d&#39;interet par une methode d&#39;amplification enzymatique.
WO2005116261A2 (fr) Biopuces d&#39;expression d&#39;arn
US6727068B2 (en) Method for non-redundant library construction
WO2001081625A1 (fr) Methode de mesure quantitative de l&#39;expression des genes
EP1283911B1 (fr) Detection et caracterisation de l&#39;activite de proteines impliquees dans la reparation de lesions de l&#39;adn
EP1802773A1 (fr) Procédé pour le diagnostic d&#39;une intolérance à l&#39;aspirine
EP1616031B1 (fr) Procede de preparation de fragments d&#39;adn par fragmentation selective d&#39;acides nucleiques et ses applications
FR2842534A1 (fr) Amplification multiplex quantitative a l&#39;echelle d&#39;un genome, et applications a la detection de remaniements genomiques
EP1794320B1 (fr) Méthode pour générer des transcrits
EP2081948B1 (fr) Nouvel oligonucleotide marque
EP1137804B9 (fr) Methode de detection in vitro d&#39;une substance cable dans un echantillon comprenant le marquage de ladite substance par un gene rapporteur et par les sequences necessaires a l&#39;expression dudit gene rapporteur in vitro
US6861219B2 (en) Preferential display
WO1996034115A1 (fr) Tampon et methode d&#39;evaluation des conditions optimales d&#39;amplification de sequences cibles d&#39;acide nucleique, et leurs applications
EP1025264B1 (fr) Méthode de diagnostique in vitro de pathologies associées à des remaniements géniques et trousses de diagnostic
JP2005224172A (ja) 新規なリニアrna増幅法
US6602665B2 (en) Referenced amplification of small quantities of RNA
OA17210A (fr) Sondes et amorces pour la détection du gène BCR-ABL en réaction duplex.
Ruggeri et al. 17 Amplification Strategies and DNA Biochips
US20050084889A1 (en) Preferential display

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CA JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2001929726

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 10281255

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 2001929726

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Ref document number: 2001929726

Country of ref document: EP