METHODE D'ANALYSE D'ACIDES NUCLEIQUES
La présente invention se rapporte à un procédé d'analyse d'une population d'acides nucléiques simple brin E, comprenant l'étape de comparer l'hybridation d'une population de sondes T sur un population de sondes S en absence ou en présence de ladite population E, la comparaison entre les niveaux d'hybridation obtenus dans les deux cas permettant de décrire la composition de la population E.
Le séquençage complet du génome humain permet de disposer de données sur l'information génétique sans pour autant donner des informations sur l'expression des gènes dans différents types cellulaires, suivant les phases de vie des cellules ou encore à la suite de l'application de stimuli externes (par exemple l'action d'un médicament). Il peut être également intéressant de connaître l'expression des gènes dans des cas pathologiques, par exemple dans le cas de cellules cancéreuses, pour mieux connaître les mécanismes cellulaires de la pathologie, en prévision de choix thérapeutiques.
Par ailleurs, il peut être intéressant de pouvoir obtenir un résultat global et quantitatif sur l'expression des gènes d'intérêt en une seule opération, lorsque les cellules étudiées sont soumises à différentes conditions (par exemple une évolution dans le temps après l'application d'un stimulus), ou sur plusieurs types cellulaires à la fois. On veut alors effectuer une étude en multiplex.
Dans la majorité des cas, les résultats sont obtenus en comparaison avec des témoins pour lesquels la seule différence est qu'ils ne sont pas soumis au stimulus étudié, et ceci est nécessaire puisque la quantification est actuellement relative. La pharmacogénomique est une discipline née grâce à la construction d'ensembles de sondes d'acides nucléiques (issues des données du séquençage génomique), qui a notamment pour objet l'étude de la réponse au traitement par les différents médicaments.
Afin d'étudier l'expression différentielle de gènes entre deux cellules, une méthode parmi les plus utilisées est la synthèse de l'ADN complémentaire (ADNc) à partir de l'ARN messager (ARNm) de chacun des états cellulaires, en marquant ledit ADNc de façon différente selon sa provenance (par exemple avec un fluorophore vert pour l'état 1, et un fluorophore rouge pour l'état 2).
On effectue alors une étude d'hybridation sur des sondes fixées sur un support solide (souvent appelé puce à ADN), lesdites sondes étant en excès par rapport à la quantité d'ADNc étudiée.
On peut effectuer une seule réaction d'hybridation en mélangeant les deux échantillons portant des marqueurs discernables, ou effectuer deux réactions sur deux supports identiques. A l'issue de la réaction, on compare les niveaux de fluorescence obtenus pour chacune des sondes et pour chaque ADNc. On peut ainsi déduire la différence de quantité de l'ADNc correspondant pour un gène donné entre les deux états cellulaires étudiés, différence qui est le reflet de la quantité d' ARNm transcrit à partir de ce gène.
Le document Zhong et al. (Anal Biochem. 2000 ; 282(1) : 129-35) décrit l'hybridation compétitive et indique (page 130, colonne 2) qu'il convient de préparer de l'ADNc pour les deux échantillons.
Le document DeRisi et al. (Science, 1997 ; 278 :680-6) décrit l'analyse de l'expression des gènes après synthèse d'ADNc (page 680, colonne 1).
Le document WO 99/27090 décrit la comparaison entre deux populations d'acides nucléiques sur deux grilles identiques distinctes.
Le document WO 97/29212 décrit la compétition entre deux populations d'acides nucléiques marquées chacune différemment, par compétition de l'hybridation de chacune des populations sur le même support.
Le document US 5,807,522 décrit la même méthode de compétition que le document WO 97/29212.
Les documents Ermolaeva et Sverdlov (Genêt Anal. 1996 Jul;13(2):49-58) et Hufton et al. (FEBS Lett. 1999 Dec 10;463(l-2):77-82) décrivent le principe de l'hybridation soustractive, pour laquelle on effectue une synthèse d'ADNc pour les deux populations d'ARNm que l'on étudie.
Une autre méthode qui a été développée consiste en la méthode CGH (pour « Comparative Genomic Hybridization »). Dans ce cas, les acides nucléiques marqués utilisés ne sont pas en excès, et l'hybridation des ADNc marqués par des fluorescences différentes s'effectue donc en compétition sur lesdites sondes. Ainsi, la partition de la fluorescence observée sur le support reflète la partition des deux ADNc dans la solution d'hybridation. On corrèle de nouveau cette valeur au taux de représentation des ADN dans l'échantillon.
Toutefois, un désavantage de ces méthodes est qu'elles nécessitent la synthèse d'ADNc et le marquage pour les deux échantillons, ces méthodes se trouvant ainsi soumises aux fluctuations induites par la reverse transcription. Il y a risque d'interprétation de ces variations enzymatiques comme résultant d'expressions différentielles.
De plus, il est toujours délicat de corréler réellement la quantité d'ADNc à la quantité d'ARNm initial. En effet, la réaction de transcription inverse est relativement peu reproductible (taux de variation de l'ordre d'environ 150 %), et il est connu que certaines séquences sont difficiles à obtenir par cette réaction. Ainsi, un des désavantages des méthodes précédemment décrites est qu'elles demandent d'effectuer deux réactions de transcription inverse (pour chacun des deux échantillons).
Une autre méthode pour l'étude de l'expression différentielle est l'analyse par Northern Blot, où l'on étudie l'intensité d'hybridation d'une sonde marquée sur une population d'ARNm. Toutefois, cette méthode ne peut être utilisée aisément pour l'étude d'un grand nombre de transcrits, la quantité d'ARNm devenant rapidement prohibitive.
On peut aussi utiliser la cytométrie de flux, afin d'étudier la présence de la protéine produite par F ARNm, par exemple avec un anticorps reconnaissant ladite protéine.
La présente invention a pour objet une nouvelle méthode servant notamment pour l'analyse de l'expression des gènes dans une cellule (procaryote ou eucaryote), pour laquelle aucune opération de synthèse d'ADNc complémentaire, ou autre opération enzymatique n'est absolument nécessaire, bien que des réactions de digestion enzymatiques puissent être effectuées. Cette méthode peut également être mise en œuvre directement sur le lysat cellulaire, sans qu'il soit nécessaire de purifier l'ARNm. Cette méthode permet de quantifier l'ARN présent dans la cellule. Il s'agit d'une Hybridation Quantitative par Inhibition. L'invention se rapporte également à la mise en œuvre de cette méthode pour étudier l'expression différentielle entre deux cellules ou types cellulaires. Lorsque l'invention est mise en œuvre selon ce mode de réalisation, on n'effectue alors
qu'une seule synthèse d'ADNc, plutôt que les deux synthèses qui sont la norme dans l'état de la technique pour les études d'expression différentielle.
Ainsi, la présente invention a pour objet un procédé d'analyse d'une population d'acides nucléiques simple brin (écran E), comprenant les étapes consistant à : a) mettre en contact ladite population E avec une population de sondes S d'acides nucléiques simple brin et une population de sondes T d'acides nucléiques simple brin pouvant s'hybrider aux sondes S, b) étudier l'hybridation des sondes T aux sondes S, c) comparer l'hybridation obtenue à l'étape b) à l'hybridation obtenue en l'absence de la population E.
De préférence, la population S présente « la même polarité » que ladite population E, c'est-à-dire qu'elles n'hybrident pas l'une sur l'autre mais peuvent hybrider l'autre population T « de polarité inverse ».
La méthode est préférentiellement mise en œuvre dans des conditions permettant l'hybridation entre deux acides nucléiques de polarité inverse.
Dans un mode de réalisation préféré, la population T de sondes d'acides nucléiques est connue, c'est-à-dire que l'on connaît la séquence et la quantité de toutes les sondes d'acides nucléiques formant la population T.
Dans un mode de réalisation du procédé selon l'invention, lesdites sondes S sont en solution.
Dans un autre mode de réalisation lesdites sondes S sont immobilisées sur un support solide. La détection est particulièrement simplifiée lorsque les sondes S sont immobilisées sur un support solide. De préférence, ce support permet leur identification d'après leurs coordonnées. Un support particulièrement adapté est une puce à ADN, qui permet d'utiliser un nombre élevé de sondes en même temps. On peut également utiliser des billes marquées chacune de façon individuelle en fonction de la sonde qu'elle porte, la lecture se faisant notamment par télémétrie en fonction de l'événement d'hybridation.
Dans un mode de réalisation préféré, lesdites sondes S et T sont marquées de telle façon qu'elles émettent un signal détectable après hybridation de l'une sur l'autre.
Dans les modes préférés de réalisation, ledit signal est obtenu par « quenching », FRET ou SPA.
A titre d'illustration, dans le cas du « quenching », les acides nucléiques de la population S sont modifiés et portent un fluorophore, et les acides nucléiques de la population T sont également modifiés et portent un composé qui absorbe le signal excitant ou émis par ledit fluorophore, lorsqu'il se trouve à proximité. L'hybridation entre les acides nucléiques des deux populations est donc détectée par diminution du niveau de fluorescence sur le support.
A titre d'illustration, dans le cas du FRET (« fluorescence résonance energy transfer », Wu et Brand, Analytical Biochem, 218, 1-13, 1994), les acides nucléiques de la population S portent un fluorophore I qui émet à une longueur d'onde excitant le fluorophore II porté par les acides nucléiques de la population T. L'hybridation entre les acides nucléiques des deux populations est donc détectée par l'émission de la lumière du fluorophore II après exposition à une longueur d'onde permettant l'excitation du fluorophore I.
A titre d'illustration, dans le cas du SPA (« scintillation proximity assay »), les acides nucléiques de la population S sont modifiés et présentent un scintillant ou sont fixés sur un support (billes SPA, Amersham) qui renferme un scintillant. Lorsque ces acides nucléiques s'hybrident aux acides nucléiques complémentaires de la population T, marqués radioactivement, la proximité du radioélément et du scintillant déclenche l'émission d'un signal (émission de photons par le scintillant). Ainsi, le signal détecté après hybridation est soit un signal émis (FRET,
SPA), soit la diminution d'un signal (« quenching »).
Dans un autre mode de réalisation, la solution de réaction contient des agents intercalants spécifiques des acides nucléiques simples ou doubles brins, l'hybridation entre les sondes S et T étant observé par la différence de signal émise avant et après hybridation.
En effet, si les agents intercalants sont spécifiques de l'ADN simple brin, ils seront déplacés après hybridation S - T, et le signal émis sera moins intense. Si les
agents intercalants sont spécifiques de l'ADN double brin, ils s'associeront aux duplexes formés lors de l'hybridation S - T et un signal proportionnel aux nombres de duplexes apparaîtra alors.
Dans un mode de réalisation, lesdits agents sont les composés SyBrGreen I et/ou II.
En tout état de cause, le signal obtenu après hybridation des populations T et S est inversement proportionnel à la quantité d'acides nucléiques E présents dans l'échantillon, qui fait écran à l'hybridation parfaite S - T.
Dans un mode de réalisation de l'invention, les sondes S et T sont des acides nucléiques simple brin synthétiques.
Dans un mode particulier de réalisation, lesdites sondes S et T ont une taille inférieure à 70 nucléotides, et peuvent être aussi petites que 25 nucléotides. Dans un autre mode de réalisation, lesdites sondes S et T ont une taille supérieure à 150 nucléotides. Dans le mode préféré de mise en œuvre de l'invention, lesdites sondes S et T ont une taille comprise entre 25 et 150 nucléotides, de préférence entre 50 et 90 nucléotides. La taille préférée des sondes S et T est d'environ 65 à 90 nucléotides, en particulier environ 80 nucléotides. D'une façon générale, la taille des sondes pour les populations S et T est choisie de telle sorte d'éviter des hybridations non spécifiques.
Dans un mode de réalisation préféré du procédé selon l'invention, les sondes S sont choisies de telle sorte que la probabilité de fixation de la population E auxdites sondes soit très faible. Ceci peut se faire par comparaison des séquences des sondes S avec les séquences des ARNm connus pour éviter que les sondes S présentent des séquences complémentaires à la population E d'une longueur supérieure à 25 % de la longueur des sondes S. Dans un mode de réalisation où la taille des sondes S est de 60 nucléotides, la longueur d'homologie maximale acceptable est d'environ 15 nucléotides. Cette précaution est surtout importante lorsque l'ensemble des sondes S est grand et que la probabilité de présence de séquences complémentaires aux ARNm augmente de façon significative.
En tant que sondes T, on peut choisir par exemple des sondes d'environ 70 bases du kit « Human Génome Oligo Set », vendu par Operon (www.operon.com),
représentant environ 16 700 gènes humains, de la base de données UniGene (www.ncbi.nlm.nih.gov/UniGene).
On peut également utiliser les kits OligoLibraries™ de Sigma et Compugen (http://www.cgen.com/products/oligo.htm). On peut aussi utiliser, pour la population T, uniquement un nombre réduit d'oligonucléotides correspondant à des gènes particuliers que l'on désire étudier.
Les sondes S sont alors synthétisées comme les oligonucléotides complémentaires aux oligonucléotides de ces kits, et on les choisit de préférence de telle sorte que le recouvrement soit approximativement parfait lors de l'hybridation (à 2-3 bases près).
On peut avoir des oligonucléotides de taille légèrement inférieure pour la population T (environ 60-70 nucléotides) que pour la population S (environ 80 nucléotides).
Le marquage des acides nucléiques des populations S et T est effectué de telle sorte que les effets liés à l'hybridation puissent être observés (c'est-à-dire que les deux composés modifiants les acides nucléiques des populations T et S puissent se trouver dans la configuration telle que le FRET ou le « quenching » (proximal ou lié à FRET) puisse avoir lieu.
Dans un mode de réalisation, on effectue la mesure d'hybridation en présence de la population écran E après avoir effectué la mesure d'hybridation en l'absence de la population écran E.
Dans un autre mode de réalisation, on effectue la mesure d'hybridation en présence de la population écran E avant d'avoir effectué la mesure d'hybridation en l'absence de la population écran E.
Dans un mode de réalisation, on effectue la mesure d'hybridation en présence de la population écran E dans le même mélange réactionnel servant à effectuer la mesure d'hybridation en l'absence de la population écran E. Dans ce cas, il est avantageux d'effectuer un désappariement des complexes hybrides dans un premier temps avant l'étude de la seconde réaction d'hybridation, par changement des propriétés du mélange réactionnel, notamment par variation de la température, ou changement de la force ionique du mélange.
Lorsque l'on effectue la mesure d'hybridation en présence de la population écran E avant d'avoir effectué la mesure d'hybridation en l'absence de la population écran E , et si l'on effectue cette mesure dans le même mélange réactionnel, on peut mettre en œuvre la destruction de la population E avant d'effectuer la mesure d'hybridation en l'absence de la population écran E, notamment par digestion enzymatique spécifique de la population E (par exemple par digestion avec la RNase H, si la population E est l'ARN, et les populations T et S sont de l'ADN, cette enzyme digérant l'ARN des complexes ARN-ADN).
Ainsi, dans un cas préféré, la population écran E est constituée d'ARNm, ou d'ARN total, ce dernier pouvant être préalablement extrait ou présent dans un lysat cellulaire.
Dans un mode de réalisation préféré, lesdites sondes S et T sont des ADN, ou PNA, modifiés ou non (phosphorothioates, méthylphosphonates).
Ainsi que l'on a vu, dans un mode de mise en œuvre de l'invention, la nature (séquences des sondes) et la composition (quantité des sondes) de la population T sont connues. On choisit alors avantageusement la nature et composition de la population S afin de permettre l'hybridation de chaque sonde de la population T. Dans un mode de réalisation préféré, la quantité de chaque sonde de la population T est égale ou légèrement supérieure à la quantité de chaque sonde de la population S.
Dans un mode de réalisation particulier, les acides nucléiques de la population T sont en excès par rapport aux acides nucléiques de la population E. Ceci permet d'affiner le dosage de la population E. En effet, la quantité maximale d'acides nucléiques dans la population E pouvant être dosés par la méthode selon l'invention est égale à la quantité d'acides nucléiques s'y hybridant, présents dans la population T. L'utilisation d'un excès de population T par rapport à la population E permet donc de doser toute l'ensemble de la population E.
Dans un mode de réalisation particulier, la quantité de chaque sonde de la population T est supérieure à la quantité de la sonde correspondante dans la population S, de telle sorte que l'hybridation entre ces deux espèces moléculaires aboutisse à la saturation de la sonde S en l'absence d'inhibiteurs (notamment la population E). il est en effet préférable qu'après un temps raisonnable (durant lequel
on n'observe pas d'hydrolyse significative de l'ARN, c'est-à-dire environ 24-48 heures aux températures envisagées), le signal au niveau des sondes S soit saturé pour les couples ne présentant pas de séquence correspondante dans l'échantillon écran E. Si l'on effectue une mesure en temps réel, en suivant les cinétiques d'hybridation, il peut être avantageux de faire varier la quantité de sondes T, notamment en ajoutant des quantités croissantes de sondes T dans le mélange réactionnel pour imposer des paramètres de cinétique variable au cours du temps.
L'utilisation d'oligonucléotides synthétiques, pour la population T, permet d'en obtenir les quantités suffisantes pour assurer que l'on travaille en excès, si ceci est désiré.
On peut aisément étudier la présence d'acides nucléiques inhibant la fixation de la population T sur les sondes S (et les quantifier), par l'étude de la cinétique d'hybridation des sondes T sur les sondes S. En effet, en l'absence de la population E, l'hybridation de chaque sonde T sur la sonde S correspondante se fait avec une cinétique spécifique, qui dépend notamment de la séquence et de la concentration de la sonde. En présence de la population E compétitrice et inhibitrice, l'hybridation des sondes T sur les sondes S est ralentie, et la différence de cinétique d'hybridation peut servir à quantifier la population E.
On peut ainsi faire une étude préalable de la cinétique d'hybridation de chaque sonde de la population T sur les sondes de la population S, afin de créer des abaques (références) servant à la mesure des variations de cinétique en présence de la population E.
Il est également possible d'introduire des acides nucléiques sans objet avec les acides nucléiques de la population E (par exemple des acides nucléiques bactériens, de plantes lorsque la population E est une population d'acides nucléiques provenant de cellules mammifères, en particulier humaines), dont les quantités et séquences sont connues, et pouvant s'hybrider avec certaines sondes de la population T, afin de servir également de référence interne pour affiner la quantification des acides nucléiques de la population E.
A titre d'illustration, la méthode selon l'invention peut être mise en œuvre de la façon suivante :
- éventuellement, contrôle de la quantité de sondes S (notamment si elles portent un fluorophore Fs) - éventuellement, contrôle de la quantité de sondes T (notamment si elles portent un fluorophore FT)
- éventuellement, contrôle du niveau d'hybridation S - T en absence de la population E (notamment par FRET) ajout de la population E, - mesure du niveau d'hybridation S - T en présence de la population E,
- ajout de RNase H et digestion de la population E,
- mesure du niveau d'hybridation S - T en absence de la population E,
Le procédé selon l'invention permet d'effectuer des études en multiplex. Ainsi, l'invention se rapporte à un procédé d'analyse de plusieurs populations d'acides nucléiques simple brin (Ei, E2 ... En), comportant les étapes consistant à : a) mélanger ladite population Ei avec une population de sondes S d'acides nucléiques simple brin présentant la même polarité que ladite population Ei et une population de sondes T d'acides nucléiques simple brin pouvant s'hybrider aux sondes S, b) étudier l'hybridation des sondes T aux sondes S, c) comparer l'hybridation obtenue à l'étape b) à l'hybridation obtenue en l'absence de la population Ei, d) répéter les étapes a) à c), en ajoutant successivement les populations E ... En au milieu réactionnel, et en comparant, à l'étape c) l'hybridation obtenue à l'étape b) à l'hybridation obtenue en l'absence de la population E2 ... En.
Pour la mise en œuvre de ce procédé en multiplex, il est avantageux d'effectuer, avant l'étape d), une mesure de l'hybridation entre les sondes S et T en l'absence de la population Ei, E ... En_ι étudiée au cycle précédent, éventuellement par digestion enzymatique de ladite population utilisée au cycle précédent, en particulier par digestion avec RNase H. Ainsi, entre chaque étape, on remesure le
« blanc » (hybridation S - T), afin de s'affranchir de tous problèmes éventuels pouvant être liés à une dégradation partielle des oligonuléotides ou à une séparation possible des oligonuléotides S du support. L'utilisation de RNase H permet d'effectuer l'analyse des réactions d'hybridation en continu, sans qu'il soit besoin de changer le milieu réactionnel.
On peut opérer de façon suivante :
- éventuellement, contrôle de la quantité de sondes S éventuellement, contrôle de la quantité de sondes T
- éventuellement, contrôle de l'hybridation S - T en absence de la population Ei,
- ajout de la population Ei,
- hybridation S - T en présence de la population Ei ,
- ajout de RNase H et digestion de la population Ei, hybridation S - T en absence de la population Ei, - inactivation de la RNase H (ceci peut avoir lieu avant l'étape précédente et être effectué par chauffage),
- éventuellement, contrôle des populations S et T,
- ajout de la population E2,
Dans un autre mode de réalisation, le procédé selon l'invention permet d'effectuer des études en multiplex, pour lesquelles on analyse plusieurs populations d'acides nucléiques simple brin (Ei, E2, ..., En) notamment correspondant à divers états cellulaires (différents types cellulaires, et/ou différents stimuli, et/ou différents états temporels...) en mélangeant lesdites populations en quantité équivalentes pour obtenir un échantillon E, et en appliquant un procédé selon l'invention audit échantillon E.
Dans un autre mode de réalisation du procédé selon l'invention, la population T n'est pas nécessairement connue, et le procédé selon l'invention permet notamment d'étudier l'expression différentielle entre deux cellules ou types cellulaires, avec une lecture simplifiée (un seul type de marquage utilisé), plus ou moins binaire, c'est-à-dire qu'un signal positif indique que le gène correspondant
audit signal est exprimé dans la cellule test, alors qu'il ne l'est pas dans l'autre cellule. La méthode selon l'invention permet aussi une étude en multiplex, qui est avantageuse pour une mise en œuvre à grande échelle. En effet, l'utilisation du multiplex donne des résultats rapides, qui permettent d'identifier aisément certains gènes exprimés au cours du traitement (par exemple si on étudie la réponse à un médicament), et de définir ainsi aisément les sondes à utiliser ultérieurement pour l'analyse plus détaillée des échantillons. Ceci permet notamment d'effectuer une économie importante dans le nombre de sondes à utiliser pour les études de pharmacogénomique (environ 10 % du nombre actuellement utilisé).
Ainsi, la présente invention a également pour objet un procédé de mise en évidence de la différence de composition entre deux populations d'acides nucléiques simple brin (test T, et écran E), comportant les étapes consistant à: a) synthétiser un brin d'acide nucléique complémentaire à partir de la population T d'acides nucléiques simple brin, b) séparer ledit brin d'acide nucléique complémentaire obtenu à l'étape a) en deux fractions égales I et II, c) étudier l'hybridation de la fraction I à des sondes S d'acides nucléiques, d) mettre en contact la fraction II avec la population E d'acides nucléiques simple brin, antérieurement ou de façon concomitante, à son hybridation aux mêmes sondes S d'acides nucléiques définies à l'étape c), e) comparer les résultats d'hybridation obtenues pour les deux fractions I et II dans les étapes c) et d).
Ce mode de mis en œuvre de la méthode développée selon la présente invention peut être résumé comme étant une Hybridation Différentielle par Compétition.
Dans ce mode de réalisation, on met en œuvre le procédé général selon l'invention, la population « T » de ce procédé étant alors choisie comme étant la population d'acide nucléique complémentaire synthétisée à partir de la population test.
Il est évident que les populations d'acides nucléiques simple brin peuvent être de toutes sortes. Ainsi, et dans un premier mode de mise en œuvre préféré lesdites populations d'acides nucléiques simple brin sont des ARN, ledit brin complémentaire obtenu à l'étape a) étant un ADN complémentaire. Cet ADNc est obtenu par des méthodes classiques de transcription inverse, bien connues de l'homme du métier. Il est intéressant de noter que le rendement de la transcription inverse est relativement faible et que les ADNc obtenus représentent en masse 10- 15 % de la masse des ARN dont ils sont issus. Dans un second mode de mise en œuvre du procédé selon l'invention, lesdites populations d'acides nucléiques simple brin sont des ADN simple brin, ledit brin complémentaire étant un ADN. Cet ADN peut être obtenu par extension à partir d'une amorce s'hybridant sur l'ADN matrice, notamment avec des ADN polymérases telles le fragment de Klenow, ou la Taq Polymérase. Ces techniques sont également bien connues de l'homme du métier.
Dans un autre mode de mise en œuvre de l'invention, lesdites populations d'acides nucléiques simple brin sont des ADN simple brin, et ledit brin complémentaire de l'étape b) est un ARN, obtenu notamment grâce à une ARN polymérase. II peut être avantageux d'optimiser les conditions de synthèse dudit brin complémentaire de l'étape a), afin d'obtenir des fragments d'environ 300 à 500 paires de bases (pb). On peut donc optimiser le choix des amorces, par exemple en utilisant des héxa-nucléotides aléatoires et en en ajustant la concentration, ou encore limiter le temps d'action de l'enzyme, avec utilisation éventuelle d'amorces spécifiques, ou faire varier les températures de réaction. On peut aussi choisir le type d'enzyme utilisé pour obtenir les fragments de taille recherchée. Le tampon utilisé (notamment la salinité) est également un paramètre pouvant être variable. De façon générale, l'homme du métier connaît la façon de faire varier ces paramètres pour obtenir le but recherché. Cette taille préférée des brins complémentaires permet d'optimiser l'hybridation desdits brins sur toute leur longueur avec les acides nucléiques simple brins dont ils sont issus.
Il est également possible d'utiliser des nucléotides modifiés lors de la réaction d'élongation et de synthèse du brin complémentaire, et que celui-ci présente ainsi des modifications dans son squelette (par exemple des phosphorothioate, méthyl-phosphonate, ou qu'il soit un PNA, pour « Peptid Nucleic Acid ») ou à ses extrémités.
Afin de faciliter la détection des hybridations dudit acide nucléique complémentaire sur les sondes, il est avantageux que celui-ci présente un marqueur permettant son traçage. Un tel marqueur peut être fluorescent, luminescent, ou de préférence radioactif. Parmi les isotopes radioactifs utilisés, on peut citer le 32P, le 33P, le 35S, ou le
3H. Les entités non radioactives sont sélectionnées parmi les ligands tels la biotine, l'avidine, la streptavidine, la digoxigénine, les haptènes, les colorants, les agents luminescents tels que les agents radioluminescents, chémoluminescents, bioluminescents, fluorescents, phosphorescents. Ledit marqueur est introduit de préférence lors de la synthèse dudit acide nucléique complémentaire, en utilisant par exemple des amorces marquées ou des nucléotides marqués.
La détection est particulièrement simplifiée lorsque les sondes S sont immobilisées sur un support solide. De préférence, ce support permet leur identification d'après leurs coordonnées. Un support particulièrement adapté est une puce à ADN, qui permet de déposer un nombre extrêmement élevé de sondes en même temps. On peut également utiliser des billes marquées chacune de façon individuelle en fonction de la sonde qu'elle porte, la lecture se faisant notamment par télémétrie en fonction de l'événement d'hybridation. Afin que le brin complémentaire puisse s'hybrider aux sondes, il est nécessaire que celles-ci aient une « polarité inverse » de celui-ci, c'est-à-dire lui soient complémentaires. Il est alors important de noter que les sondes ont alors la « même polarité » que l'acide nucléique simple brin dont est issu le brin complémentaire, celui-ci ne pouvant alors pas s'hybrider aux sondes. Dans un mode de mise en œuvre préféré de la méthode selon l'invention, les sondes sont présentes en excès par rapport à la population des acides nucléiques, qui leur sont complémentaires.
Lors de l'étape d'hybridation entre le brin complémentaire et les acides nucléiques de la population E (étape d), on peut utiliser une quantité d'acides nucléiques simple brin de la population E utilisée égale à la quantité d'acides nucléiques simple brin de la population T utilisée dans l'étape a), pour la synthèse du brin complémentaire.
Alternativement, il est possible d'utiliser une quantité d'acides nucléiques de la population E supérieure à la quantité d'acides nucléiques de la population T utilisée dans l'étape a), de préférence dans un ratio compris entre 2/1 et 50/1. Ce ratio est de préférence compris entre 5/1 et 20/1, de façon plus préférée environ égal à 10/1.
Dans un mode de mise en œuvre spécifique de l'invention, l'hybridation de la fraction II du brin complémentaire est effectuée sur les sondes de manière concomitante à sa mise en contact avec la population E d'acides nucléiques simple brin. Dans un autre mode de mise en œuvre de l'invention, on effectue l'hybridation de la fraction II sur les sondes postérieurement à sa mise en contact avec la population E d'acides nucléiques simple brin.
Ces deux modes de mise en œuvre sont indifféremment préférés, chacun possédant des avantages spécifiques, ainsi qu'il sera discuté plus bas. Dans un mode préféré de mise en œuvre de la méthode selon l'invention, lesdites populations d'acides nucléiques simple brins sont des ARNm issus de deux populations de cellules (culture cellulaire, biopsie), l'une d'entre elles ayant éventuellement été soumise à un stimulus. Ces deux populations sont appelées population A et population B. II s'agit en effet de pouvoir étudier l'expression différentielle des gènes entre ces deux populations de cellules. Ces deux populations de cellules peuvent être notamment issues soient de cultures cellulaires, soit de biopsies chez un patient. Ceci peut être notamment particulièrement utile lorsque l'on étudie par exemple la réponse à un traitement anti-cancéreux. Il n'est pas nécessaire que les deux populations de cellules soient du même type cellulaire, on peut ainsi observer les gènes spécifiquement exprimés dans un certain type cellulaire (par exemple un neurone par rapport à une cellule gliale, ou un lymphocyte T CD4, par rapport à un lymphocyte T CD8...).
L'une des deux populations de cellules peut aussi avoir été soumise à un ou plusieurs stimulus, comme par exemple la mise en contact avec un composé (notamment un médicament, ou une toxine, un antigène), ou un micro-organisme (notamment une bactérie, un virus ou un fongus), ou des variations physicochimiques de son milieu, (notamment hyperthermie, altération du pH physiologique, irradiation après incorporation d'un composé absorbant le rayonnement émis) ce qui permet de détecter les différences d'expression en présence ou non du stimulus.
Ainsi qu'il sera démontré précisément plus loin, la méthode selon l'invention permet de détecter les gènes sur-exprimés dans la population T, ou qui ne sont pas présents dans la population E.
Ainsi, afin de pouvoir obtenir une photographie complète du schéma d'expression différentielle, il est donc avantageux d'utiliser, dans un premier temps, la population de cellules A comme source de population T d'ARNm, (le procédé permettant la détection des ARNm sur-exprimés dans A par rapport à B), et dans un deuxième temps, la population de cellules B comme source de population T d'ARNm, (le procédé permettant la détection des ARNm sous-exprimés dans A par rapport à B).
Il est à noter que la méthode selon l'invention n'implique pas nécessairement la purification des ARNm issus de la population E avant l'étape d'hybridation avec la fraction II du brin complémentaire.
Dans certains cas particuliers, il est possible que certains ARNm de la population E s'hybrident avec les sondes, bien que celles-ci soient à priori de « même polarité ». En effet, il est possible que certaines parties de la séquence de l'ARNm soient malgré tout partiellement complémentaires à certaines sondes, les conditions de réaction permettant leur hybridation. L'homme du métier connaît les techniques pour faire varier les conditions d'hybridation, et les rendre notamment plus ou moins stringentes (variation de la température, de la salinité...).
Ceci ne devrait normalement pas poser de problème dans la mesure où l'ARNm de la population E ne porte pas de marquage. Toutefois il est aussi possible qu'un autre fragment dudit ARNm de la population E soit également complémentaire d'un brin complémentaire obtenu à l'étape a) du procédé selon l'invention, ledit brin étant marqué. Ce risque de faux positif est largement diminué
par un traitement avec la RNase H sur la fraction II mise en contact avec la population E, qui digère alors l'ARNm dans le duplex ARN- ADN et libère donc l'ADNc marqué.
Il est à noter que la méthode selon l'invention permet une étude en multiplex de plusieurs conditions, ainsi qu'il sera vu plus bas. Ainsi, le procédé selon l'invention peut également être mis en œuvre sur une population T qui consiste en un mélange d'acides nucléiques présentant tous une propriété commune, et une population E consistant également en un mélange d'acides nucléiques présentant tous une propriété commune. Le terme propriété commune signifie par exemple que les acides nucléiques des populations sont issus de cellules ayant toutes été confrontées au même stimulus. On peut notamment étudier en une seule opération la réponse de plusieurs types cellulaires à un médicament, à divers moments après addition dudit médicament. Ainsi que discuté plus haut, ceci permet d'avoir une idée très rapide des gènes différentiellement exprimés et de définir les sondes qui devront être utilisées pour une analyse plus précise.
Il est donc clair que la présente invention a également pour objet l'utilisation d'un procédé selon l'invention pour la détermination de l'action d'un composé ou d'un micro-organisme sur une population cellulaire, pour des études pharmacogénomiques, ou pour juger de la réponse d'un patient à un traitement (par exemple le cancer, avant ou après traitement à partir d'une biopsie).
DESCRIPTION DES FIGURES Figure 1 : Description du principe de l'Hybridation Quantitative par Inhibition. On a un support présentant des sondes S. Cas 1 : on ajoute les sondes marquées T, sans population E, et on obtient émission d'un signal spécifique après l'hybridation. Cas 2 : on ajoute la population E, et on observe une diminution du signal émis, du fait de la capture de certaines sondes T par les acides nucléiques E. La diminution du signal permet de quantifier la population E.
Figure 2 : Hybridation Différentielle par Compétition (figures 2-6). Hybridation de référence, permettant de décrire la population des ADNc issus de l'échantillon biologique traité. Les séquences décrites dans le tableau I sont représentées ici par
les sondes correspondantes (rectangles foncés), fixées sur le support solide (rectangle gris foncé). Les molécules d'ADNc sont représentées sous forme de rectangles gris clair.
Figure 3 : Hybridation après compétition concomitante avec une quantité égale d'ARN écran. L'effet écran du compétiteur a inhibé, au moins partiellement, l'hybridation des séquences communes entre l'échantillon analysé et le témoin. Figure 4 : Hybridation après compétition concomitante avec un excès d'ARN écran. Ici l'effet de l'inhibition est accentué grâce à l'utilisation d'un excès de compétiteur. Par contre les signaux correspondant à des séquences présentes uniquement dans l 'échantillon analysé ne sont pas affectés.
Figure 5 : Schéma comparatif résumant les différentes conditions des figures 1 à 3. Figure 6 : Comparaison de l'hybridation directe et de l'hybridation après compétition antérieure avec une quantité égale d'ARN écran. La pré incubation de la SHC (Solution d'Hybridation en Compétition) permet d'obtenir un effet de compétition accentué, malgré l'utilisation d'une faible quantité de compétiteur.
Les exemples ci-dessous servent à expliciter l'invention et ne sont pas limitatifs. L'homme du métier sait notamment préparer de l'ADNc marqué à partir d'ARNm extrait de cellules, déterminer les conditions d'hybridation optimales entre deux brins d'acide nucléique, effectuer une lecture de la liaison d'un acide nucléique sur une sonde fixée sur un support...
DEFINITIONS et PRINCIPE
Array : sondes d'acides nucléiques immobilisées sur un support solide suivant un motif permettant leur identification d'après leurs coordonnées.
Population test : la population d'acides nucléiques analysés ; dans la majorité des cas les molécules portent des marqueurs permettant leur traçage (population T).
Population écran : la population d'acides nucléiques de référence ; dans la majorité des cas les molécules ne sont pas marquées (population E). Hybridation en phase mixte : réaction d'hybridation faisant intervenir les sondes de F array.
Hybridation en phase liquide : réaction d'hybridation faisant intervenir les acides nucléiques en solution.
Soit une population d'ARNm extraits d'un échantillon biologique ayant subi un traitement dont on désire analyser les conséquences en termes d'induction de l'expression des gènes. La transcription inverse de ces ARNm donne une population d'ADNc, qui peuvent être marqués durant cette phase de synthèse. Ce sont les ADNc qui constituent la population test. L'échantillon biologique dont ils sont issus peut-être simple, ou le résultat du mélange de plusieurs échantillons simples.
Le degré de complexité qu'il est possible d'obtenir en fonction de la sensibilité offerte par le type de marquage utilisé et les conséquences en termes de sensibilité de détection d'une séquence particulière seront discutés ci-dessous.
Soit une population d'ARNm extraits d'un échantillon biologique n'ayant pas subi de traitement particulier. Cette population sert de référence pour l'analyse de la population test. Il s'agit de la population écran. Ces ARNm peuvent être utilisés sans être extraits de l'ensemble des ARN de l'échantillon biologique. La population écran ne porte pas de marquage. Elle peut être issue d'un échantillon biologique simple ou complexe. Le degré de complexion que l'on peut atteindre sans compromettre les propriétés de la population test que l'on souhaite étudier est limité par le degré de sensibilité que l'on désire obtenir.
On peut considérer que ces deux populations ne différent pas seulement pour la nature des acides nucléiques qui les composent, ADNc pour la population test et ARN pour la population écran, mais également pour leur polarité, sens pour la population écran et antisens pour la population test, puisque la population T est le résultat d'une transcription inverse d'une population de même nature que la population E. Ainsi, les acides nucléiques d'une population correspondant à un locus particulier peuvent s'hybrider à acides nucléiques correspondant au même locus, de l'autre population. Cette propriété est utilisée pour créer une compétition entre la population écran et les sondes disposées sur l'array, pour la capture des molécules marquées de la population test.
EXEMPLES
Exemple 1 : compétition concomitante avec ajout d'une quantité d'ARN de la population E égale à la quantité d'ARN utilisé pour la synthèse du brin complémentaire
L'ADNc correspondant à la population test est synthétisé en y incorporant le marqueur de choix. L'ARN correspondant à la population écran est extrait.
Les arrays utilisés pour l'analyse sont préparés de façon adéquate pour recevoir les ADNc marqués. Cette préparation n'a rien de particulier, elle consiste essentiellement à une réhydratation du support et la saturation des sites de fixation non spécifique sur le support solide, pour éviter le bruit de fond que généreraient les molécules marqués en s'y fixant. Cette méthode est connue de l'homme du métier.
La population test est séparée en deux partie égales, diluée dans du tampon d'hybridation. Une des parties sera utilisée telle quelle (SHD pour Solution d'Hybridation Directe). L'autre partie reçoit la population écran (SHC pour Solution d'Hybridation en Compétition).
La population écran est utilisée en excès. En effet, si l'on utilise une masse d'ARN égale à celle utilisée pour la synthèse de l'ADNc le rapport obtenu est favorable, à cause du faible rendement de la reverse transcriptase. Le rapport entre la masse d'ARN utilisée pour la synthèse de l'ADNc et la masse d'ARN écran est noté ici par R. Ainsi, dans cet exemple, R = 1.
Un array est hybride avec la SHD et pour obtenir les signaux permettant la quantification relative des espèces moléculaires qui composent la population des ADNc. Un autre array est hybride avec la SHC et sert à l'obtention de signaux permettant la quantification relative des espèces moléculaires de la population qui restent réactifs malgré la présence des ARN utilisés en écran.
Considérons les populations décrites ci-dessous.
Les séquences n° 9 et 10 ne sont représentées que dans l'échantillon traité, il s'agit des molécules qui vont nous indiquer l'activation des gènes correspondants. Ici, la référence est la population moléculaire issue de cellules non traitées, ce qui permet d'obtenir les résultats d'induction d'expression de gènes par le traitement. L'ADNc est issu de l'échantillon traité.
Si l'on utilise comme référence la population moléculaire issue de cellules traitées, on obtient alors les données concernant la répression de l'expression des gènes suivant le traitement.
Dans le cas de l'hybridation utilisant la SHD, on aura :
Tabl
Ceci est également illustré sur la figure 1.
Pour la simplicité de la démonstration à ce niveau, on peut assimiler le nombre des molécules disponibles pour l'hybridation aux signaux obtenus. En réalité il y a proportionnalité entre les deux paramètres, qui dans les conditions d'utilisations des arrays, elle est simple et directe. Les signaux obtenus ici serviront de référence ; ils donnent en fait un descriptif de la population de l'ADNc.
Ainsi que vu plus haut, on peut faire l'hypothèse d'un rendement de la transcriptase reverse de 10 %, indépendant de la nature de la séquence.
Donc, si l'on considère maintenant le cas de l'hybridation avec la SHC obtenue par l'addition d'ARN de masse égale à celle utilisée pour la synthèse de l'ADNc, on obtient les résultats du tableau III, et de la figure 2.
a eau I : y at on en comp t t on, AR comp t teur ga celui qui a permis la synthèse de l'ADNc
On remarque ainsi que l'ADNc disponible pour l'hybridation est affecté par la présence du compétiteur, qui en s'hybridant sur lui l'empêche de venir se fixer sur la sonde correspondante. Les rapports des signaux obtenus ici, avec ceux de la SHD, figurent dans la dernière colonne. Bien entendu l'absence de compétiteur fait que ce rapport est égal à l'unité pour les séquences 9 et 10 qui n'étaient pas exprimées dans la population non traitée. Les séquences communes entre les deux échantillons sont affectées. Si l'on considère maintenant en particulier le cas de la séquence 4, la disponibilité pour l'hybridation est de 5000, malgré le fait qu'il y a égalité entre le nombre de molécules dans l'ADNc et l'ARN écran. Ceci indique que la compétition se fait en même temps que l'hybridation sur l'array. il a en effet été considéré pour l'exemple que les vitesses d'hybridations sont dentiques, ce qui en réalité n'est pas le cas. En fait l'avantage est pour les hybridations en solution et donc pour l'épuisement de l'ADNc par l'ARN écran.
Le résultat obtenu n'est que semi-quantitatif. Des rapports SHD/SDC inférieurs à 1 indiquent qu'il y a compétition mais ne permettent pas de la quantifier, sans données sur
(i) l'efficacité de la transcription inverse et (ii) des rapports exacts entre populations d'ARNm qui sont contenus dans les ARN utilisés.
Exemple 2 : compétition concomitante avec ajout d'une quantité d'ARN de la population E supérieure à la quantité d'ARN utilisé pour la synthèse du brin complémentaire
Le déséquilibre observé dans l'exemple 1 peut être renforcé en utilisant une masse d'ARN supérieure à celle utilisée pour la synthèse de la population test, c'est-à-dire avec un rapport R > 1.
On obtient alors les résultats suivants, avec R = 10 :
Tableau III : Hybridation en compétition, ARN compétiteur en excès
L'excès d'ARN écran a ici effacé le signal obtenu de la séquence 4, mais ne peut toujours pas affecter les signaux correspondant aux séquences 9 et 10, qui apparaîtront identiques entre les deux expériences (SHD et SHC) quel que soit cet excès.
Ceci permet donc d'obtenir des données non ambiguës sur les gènes expπmées dans l'échantillon test, qui ne l'étaient pas dans l'échantillon de référence.
La figure 3 permet de schématiser les résultats obtenus pour cet exemple d'application, la figure 4 résumant les résultats des exemples 1 et 2.
Exemple 3 : compétition antérieure à l'hybridation avec ajout d'une quantité d'ARN de la population E égale à la quantité d'ARN utilisé pour la synthèse du brin complémentaire
Le protocole suivi est quasiment identique au protocole suivi précédemment, la seule variation intervenant après la préparation des solutions d'hybridation.
Ici en fait, la SHC est incubée dans les conditions permettant l'hybridation de l'ARN écran sur l'ADNc, avant d'être mise au contact de l'array. La durée de l'incubation est calculée en fonction du rapport des vitesses d'hybridation en phase mixte et liquide. Il s'agit en fait d'épuiser l'ADNc avant de le présenter aux sondes qui composent l'array. Ainsi, si le rapport des vitesses est de dix et que le temps d'hybridation de la SHD de 24 h, la pré incubation de la SDC sera de (24/10) 2,4 h.
L'effet de compétition est alors amplifié et pour une hybridation en condition iso (même quantité d'ARN E qu'utilisé pour la synthèse du brin complémentaire) on aura :
Là encore les signaux des séquences 9 et 10 ne sont pas affectés. En revanche, le signal correspondant à la séquence 4 est nettement affaibli. Ceci est dû
à l'hybridation de l'ADNc correspondant sur les ARN de la population écran durant la phase de pré incubation.
Cette variante permet en fait de minimiser la quantité d'ARN écran à utiliser. Ceci peut être intéressant lorsque l'on désire économiser le matériel (par exemple ARN écran provenant d'une biopsie donc en très petite quantité), ou si l'on veut éviter l'utilisation de solutions d'acides nucléiques trop concentrés, car ces solutions peuvent entraîner des altérations de leurs propriétés d'hybridation, par des phénomènes tels que la formation de réseaux d'hybridation.
La figure 5 schématise les résultats obtenus pour cette variante de mise en œuvre.
En conclusion, pour décrire l'action du traitement en termes d'inhibition et d'induction de l'expression des gènes quatre hybridations sur des arrays sont nécessaires.
Elles doivent être comparées deux à deux et dans chaque comparaison une même population d'ADNc marquée, séparée en deux échantillons identiques est utilisée. Ceci diminue les problèmes souvent rencontrés dus à des variations de la transcription inverse.
Exemple 4 : utilisation en multiplex La puissance du système décrit ci-dessus est multipliée par la possibilité d'utiliser des populations d'ARN issues de plusieurs échantillons biologiques qui partagent des caractéristiques communes.
Un cas concret peut être considéré. On peut rechercher les gènes dont l'expression est induite par l'action d'un médicament dans une série de lignées cellulaires, notée Cl , C2,...,Cn. On se limite, dans cet exemple à 5 types cellulaires.
Le médicament est administré dans chaque cas à une dose biologiquement significative, par exemple 1TC50 (dans les conditions de travail) et les échantillons sont prélevés à divers moments après l'addition du médicament dans la culture traitée, par exemple six temps, TO, Tl,...,T6. Les prélèvements d'échantillons sont réalisés en parallèle pour les cultures qui servent de référence et qui n'ont pas été mises en contact avec reçue le médicament.
On dispose ainsi d'une série d'échantillons :
Les échantillons « gris foncé» peuvent être mélangés pour former l'ARN de référence, ceux en « gris clair » pour former l'ARN échantillon. L'ARN écran est fourni par la référence. En une seule expérience, utilisant un seul produit marqué (l'ADNc), on peut analyser en parallèle une grande série de conditions (ici pour les cinq lignées cellulaires, n=30).
La sensibilité de détection peut être affectée. Ainsi, plus le nombre de conditions est grand, plus chaque échantillon est dilué dans la population d'ARN finale. Il est donc possible que des séquences qui étaient proches du seuil de détection dans le cas d'analyse d'un échantillon unique puissent disparaître. Cet effet peut être minimisé par l'utilisation de quantités d'ADNc plus importantes et en réalisant des hybridations plus longues sur l'array.
Les compensations que l'on peut apporter viennent de l'augmentation de la quantité d'ADNc, de la pré-hybridation de compétition et de la durée d'hybridation.
Il est important de noter que cette approche permet d'identifier rapidement les composants qui apparaissent à cause du traitement, mais ne permet pas d'identifier dans quelle lignée et/ou à quel temps ceci a lieu. Son utilisation permet de connaître les sondes que nous devrons utiliser par la suite pour analyser les divers échantillons de façon détaillée. Et son intérêt réside à l'économie réalisée en nombre de sondes utilisées (environ 10 % dans les systèmes que nous connaissons jusqu'à aujourd'hui). Il sera d'autant plus important que la collection de sondes initialement utilisée sera importante.
La schématisation de l'exemple donné ci-dessus est relativement lourde. Le schéma ci-dessous résume les résultats pour deux lignées et deux temps, et est plus simple à « visualiser ». Deux niveaux d'expression ont été considérés : 0 et 1000.
La dernière colonne concerne les signaux attendus. En souligné sont donnés les signaux « négatifs », correspondant à des inhibitions d'expression qui ne seront mises en évidence que lors de l'hybridation symétrique.
Le calcul est effectué en supposant que les quantités d'ADNc et d'ARN écran utilisés seront augmentées proportionnellement au degré de multiplexage. Malgré le fait que ce ne sera pas le cas, les proportions seront maintenues. Le taux de sondes à maintenir est ici exagéré du fait que ne sont pas présentées les séquences qui seraient maintenues en taux de transcription entre les deux populations.