BIOPUCE DE DIAGNOSTIC DU CARACTERE METASTATIQUE OU LOCALISE D'UNE TUMEUR MAMMAIRE, PROCEDE ET KIT D'UTILISATION
La présente invention a pour objet un support solide revêtu d'un jeu de fragments représentatifs de gènes dont le profil d'expression pour l'ensemble de ces gènes chez un sujet présentant une tumeur mammaire permet le diagnostic ou le pronostic du caractère métastatique ou localisé de ladite tumeur, ainsi qu'un kit comprenant un tel support ; l'invention a également pour objet un procédé de diagnostic ou de pronostic in vitro du caractère métastatique ou localisé d'une tumeur mammaire, le cas échéant permettant également de caractériser si les cellules de ladite tumeur mammaire expriment ou non les récepteurs aux oestrogènes, ledit procédé mettant en oeuvre l'utilisation du support solide.
Le cancer peut être défini de façon très large comme une maladie liée à la prolifération et la diffusion incontrôlée de cellules de l'organisme devenues anormales : ces cellules anormales, dites « malignes », prolifèrent de manière anarchique à partir d'un foyer primitif, qui peut récidiver localement après son ablation, s'étendre aux tissus voisins et essaimer à distance (métastases).
Le cancer touche environ 10 millions de personnes dans le monde. Plus de 4,4 millions des cas proviennent d'Asie. L'Europe compte 2,8 millions de cas, l'Amérique du Nord 1,4 millions et l'Afrique 627 000 cas. Le cancer est l'une des premières causes de mortalité dans les pays développés ; en Europe et aux Etats-Unis, on estime qu'une personne sur cinq décédera d'un
cancer. L'incidence des cancers sur les 100 dernières années paraît être en progression, mais cette observation doit être pondérée par le fait que la probabilité de développer un cancer augmente avec l'âge, et que globalement la proportion de la population âgée est aussi en augmentation.
Chez la femme, le cancer du sein et le plus fréquent : on note ainsi 43 000 nouveaux cas et 11 000 décès par an en France. Le cancer du sein est la première cause de décès par cancer chez la femme. Il est à noter que 99% des cancers du sein apparaissant chez la femme, et 1% chez l'homme.
En Europe, la mise en place de moyens de dépistage et de prévention permet un diagnostic des tumeurs mammaires à un stade précoce, qui permet de définir ensuite une orientation thérapeutique. Un facteur pronostic important consiste à déterminer si des métastases sont présentes dans les ganglions lymphatiques ; on parle alors d'envahissement ganglionnaire ; en l'absence d'envahissement ganglionnaire, on parle de tumeur mammaire localisée.
L'une des méthodes jusqu'ici couramment employées pour caractériser l'envahissement ganglionnaire consiste à effectuer un curage axillaire, qui consiste à prélever des ganglions axillaires (aisselles) et réaliser des coupes de ces ganglions en coloration hématoxyline et éosine. Toutefois, cette technique du curage est actuellement remise en question : le curage axillaire est responsable de la plupart des symptômes fonctionnels post-chirurgicaux du cancer du sein, allant de 10 % pour ce qui est du lymphoedème
(syndrome du gros bras) à plus de 80 % de gêne et de douleurs à la mobilisation du membre supérieur. En outre, dans les pays occidentaux, la proportion des tumeurs, dépourvues d'envahissement ganglionnaire (N-) approche les 80 %, ce qui veut dire que près de 4 femmes sur 5 subissent un curage axillaire inutile.
La classification des tumeurs mammaires en stade N- ( sans envahissement ganglionnaire) ou N+ ( avec envahissement ganglionnaire) est d'autant plus exacte que le nombre de ganglions prélevés est plus élevé, conduisant ainsi à des résultats présentant un certain risque d'erreur. L'examen anatomopathologique standard pour les ganglions d'un curage axillaire
(coloration des coupes) pourrait être complété par des techniques d'immunohistochimie basées sur une réaction immunologique spécifique et un contrôle morphologique des cellules immunoréactives. Cependant, l'identification de micrométastases en réalisant des coupes sériées et une immunohistochimie n'est pas envisageable en pratique courante, pour des raisons de temps et de coût sur l'ensemble des ganglions prélevés dans un curage axillaire.
Une alternative à la réalisation du curage ganglionnaire axillaire est la tomographie d'émission de positron (PET pour « Positron Emission Tomography »), une technique d'imagerie médicale de médecine nucléaire dans laquelle un marqueur radioactif émetteur de positrons est injecté in vivo (FDG-PET pour (18F)FluoroDeoxyGlucose-PET). Cette technique, très sensible, est pour l'instant trop coûteuse et peu accessible.
Une autre alternative au curage axillaire est l'étude du ganglion sentinelle. Ce dernier est défini comme le premier ganglion qui reçoit le flux lymphatique de la tumeur primaire. La technique du ganglion sentinelle est donc une méthode efficace pour évaluer le statut ganglionnaire axillaire et éviter le curage axillaire chez les patientes ayant un cancer du sein de petite taille sans envahissement ganglionnaire clinique. En effet, un ganglion sentinelle non atteint exclut en théorie un envahissement métastatique du reste de l'aisselle et rend donc le curage axillaire inutile. Bien que les investigations sur un seul ganglion puissent être à l'origine de la stadification axillaire, la technique du ganglion sentinelle n'est pas encore
standardisée et les taux de faux négatifs sont évalués dans la littérature de 0 à 15 %. Ce taux peut être diminué par l'utilisation de techniques de biologie moléculaire telles que la RT-PCR (amplification en chaîne par polymérase — Transcription inverse ; RT-PCR pour « Reverse Transription Polymérase Chain Reaction »). Mais l'étude en biologie moléculaire s'effectue à partir . de tissu congelé, ce qui implique que Panatomopathologiste doit soustraire une partie du ganglion à l'étude histologique standard.
Ainsi, il est indispensable de pouvoir disposer d'un autre outil de diagnostic simple à mettre en œuvre, peu coûteux et fiable pour évaluer le statut ganglionnaire dans le cancer du sein.
Cet objectif a été atteint par les inventeurs désignés dans la présente demande. Ces derniers ont pu mettre au point une biopuce à ADN qui permet de définir le statut ganglionnaire de patientes ayant développé une tumeur mammaire. Les tumeurs mammaires sont hétérogènes car elles résultent de l'accumulation et de combinaisons de multiples altérations moléculaires. Les indications thérapeutiques et diagnostiques sont fondées sur des facteurs pronostics classiques (histologiques et cliniques) qui ne révèlent pas cette hétérogénéité. En effet, cela correspond le plus souvent à l'étude d'un seul gène ou produit de gène à la fois. Une caractérisation moléculaire globale et détaillée, obtenue à l'aide de la biopuce sleon l'invention, permet donc d'affiner le diagnostic, les indications thérapeutiques et donc la survie des patients.
Les « sondes » (ou fragments représentatifs) déposées sur la biopuce correspondent à des gènes dont les niveaux d'expression sont modifiés dans les tumeurs mammaires, permettant ainsi l'étude de paramètres tels que la réceptivité hormonale, l'envahissement ganglionnaire, le statut BRCA1/BRCA2, la surexpression de erbb2, la prolifération cellulaire, les types cellulaires présents dans la tumeur. Les inventeurs ont pu identifier un
ensemble de gènes dont la surexpression est caractéristique d'un envahissement ganglionnaire et donc d'une tumeur métastatique (tumeur N+), et un autre ensemble de gènes dont la surexpression est caractéristique de l'absence d'envahissement ganglionnaire et donc d'une tumeur localisée (tumeur N-). Ces gènes sont listés dans les Tableaux Al, A2 et A3.
Dans la présente demande, la détermination de l' envahissement ganglionnaire, et donc du caractère métastatique ou localisé d'une tumeur, passe d'abord par la caractérisation de l'expression des récepteurs aux oestrogènes par les cellules de la tumeur mammaire. Une tumeur mammaire est ainsi classée ER+ lorsqu'elle exprime les récepteurs aux oestrogènes, et ER- dans le cas contraire.
Le Tableau Al rassemble les gènes discriminants pour l' envahissement ganglionnaire surexprimés dans les tumeurs mammaires qui expriment les récepteurs aux oestrogènes (tumeurs ER+).
Le Tableau A2 rassemble les gènes discriminants pour l'envahissement ganglionnaire surexprimés à la fois dans les tumeurs mammaires qui expriment les récepteurs aux oestrogènes (tumeurs ER+) et celles qui ne l'expriment pas (tumeurs ER-).
Le Tableau A3 rassemble les gènes discriminants pour l'envahissement ganglionnaire surexprimés dans les tumeurs mammaires qui n'expriment pas les récepteurs aux oestrogènes (tumeurs ER-).
Ainsi, la présente invention a pour objet un support solide revêtu d'un jeu de fragments représentatifs de gènes dont le profil d'expression pour l'ensemble de ces gènes chez un sujet présentant une tumeur mammaire permet le diagnostic ou le pronostic du caractère métastatique ou localisé de ladite tumeur, caractérisé en ce que ledit jeu comprend : - au moins 36 fragments, chacun des 36 fragments étant représentatif d'un gène distinct choisi parmi les gènes des Tableaux Al et A2, ou au
moins 88 fragments, chacun des 88 fragments étant représentatif d'un gène distinct choisi parmi les gènes des Tableaux A2 et A3, ou au moins 119 fragments, chacun des 119 fragments étant représentatif d'un gène distinct choisi parmi les gènes des Tableaux Al, A2 et A3, et est en outre constitué au maximum par 393 fragments, chacun des 393 fragments étant représentatif d'un gène choisi parmi les gènes du Tableau B.
Ce jeu, qui comprend au moins lesdits 36 ou 88 ou 119 fragments, est en outre constitué au maximum par 393 fragments, chacun des 393 fragments étant représentatif d'un gène distinct choisi parmi les gènes du Tableau B. L'expression « en outre constitué au maximum par » signifie que le jeu, comprenant au moins les 36 fragments ou au moins les 88 fragments ou au moins les 119 fragments, peut en outre contenir de 1 à 393 autres fragments représentatifs de gènes tels que définis dans le Tableau B. De préférence, le jeu est en outre constitué par 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160,
170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 391 ou 392 fragments représentatifs de gènes tels que définis dans le Tableau B.
De préférence, le jeu comprend : au moins 36 fragments, chacun des 36 fragments étant représentatif d'un gène distinct choisi parmi les gènes des Tableaux Al et A2, ou au moins 88 fragments, chacun des 88 fragments étant représentatif d'un gène distinct choisi parmi les gènes des Tableaux A2 et A3, ou au moins 119 fragments, chacun des 119 fragments étant représentatif
d'un gène distinct choisi parmi les gènes des Tableaux Al, A2 et A3, et est en outre constitué au maximum par 200 fragments, chacun des 200 fragments étant représentatif d'un gène disctinct choisi parmi les gènes du Tableau B.
Le support dont le jeu comprend au moins les 36 fragments (dont chacun est représentatif d'un gène distinct choisi parmi les gènes des Tableaux Al et A2), permet de dépister l'envahissement ganglionnaire dans le cas de tumeurs ER+. Le support dont le jeu comprend au moins les 88 fragments
(dont chacun est représentatif d'un gène distinct choisi parmi les gènes des Tableaux A2 et A3), permet de dépister l'envahissement ganglionnaire dans le cas de tumeurs ER-. Le support dont le jeu comprend au moins les 119 fragments (dont chacun est représentatif d'un gène distinct choisi parmi les gènes des Tableaux Al, A2 et A3), permet de dépister l'envahissement ganglionnaire à la fois dans le cas de tumeurs ER- et dans le cas de tumeurs ER+. Bien entendu, dans ce dernier cas, il convient de déterminer avant le dépistage si les tumeurs expriment ou non le récepteur aux oestrogènes (respectivement tumeurs ER+ ou ER-) ; ensuite, si les tumeurs sont ER+, on s'intéressera uniquement au profil d'expression obtenu pour les gènes listés dans les Tableaux Al et A2, et si les tumeurs sont ER-, on s'intéressera au profil d'expression obtenu pour les gènes listés dans les Tableaux A2 et A3.
Le profil d'expression, qui est obtenu en utilisant le support solide selon la présente invention, contient les informations relatives à l'expression de l'ensemble des gènes dont un fragment représentatif a été déposé sur ledit support solide.
Par l'expression « fragment représentatif » d'un gène du Tableau Al, A2, A3, B ou du Tableau C on entend désigner dans la présente demande tout fragment codant (ARNm, ADNc) d'un de ces gènes qui est suffisamment
long pour s'hybrider spécifiquement, dans des conditions appropriées pour l'hybridation, avec un fragment d'ARNm ou d'ADNc présent dans l'échantillon d'acide nucléique test ou avec un fragment présent dans l'échantillon d'acide nucléique de référence, et permet ainsi d'identifier ledit fragment présent dans l'échantillon d'acide nucléique test ou de référence comme étant un fragment constitutif dudit gène donné, ledit gène étant donc présent dans l' échantillon d'acide nucléique test ou dans l'échantillon d'acide nucléique de référence ; lorsqu'un tel fragment représentatif d'un gène du Tableau Al, A2, A3, B ou du Tableau C est séquence, la séquence identifiée permet de conclure sans ambiguïté que ledit fragment appartient audit gène donné du Tableau Al, A2, A3, B ou du Tableau C. Le terme « sonde » est également utilisé dans la présente demande pour désigner un fragment représentatif.
Dé préférence, le fragment représentatif d'un gène selon l'invention comprend et/ou est constitué par au moins 15, de préférence 20, 25, 30, 35, 40, 45, 47, 48, 49 et de manière particulièrement préférée 50 nucléotides identiques à ceux du fragment de l'acide nucléique test ou de référence constitutif dudit gène donné, ledit gène étant donc présent dans l'acide nucléique test et dans l'acide nucléique de référence.
L'expression "conditions appropriées pour l'hybridation" dans là présente invention désigne des conditions de forte stringence qui permettent l'hybridation lorsque des séquences complémentaires à au moins 80, 82, 85, 87, 89, 90, 92, 95, 97 or 99 % sont capables de s'hybrider spécifiquement.
Les conditions de forte stringence sont largement décrites dans la littérature, par exemple dans Sambrook et al., (1989, « Molecular cloning, A laboratory Manual », CoId Spring Harbor), Maniatis et al., 1982 (« Molecular cloning, A laboratory Manual », CoId Spring Harbor Lab.CSH, N. Y. USA ou l'une de ses récentes rééditions et dans Ausubel et al., Eds. (1995) "Current
Protocols in Molecular Biology, Chapter 2" (Greene Publishing and Wiley-
Interscience, N. Y.), et ces conditions peuvent être adaptées par l'homme du métier en fonction de la taille des fragments nucléotidiques, selon les enseignements appropriés connus.
On utilisera par exemple des tampons d'hybridation ou de lavage appropriés (Corning), ou encore les conditions d'hybridation suivantes :
(1) préhybridation à 42°C pendant 3 heures en tampon phosphate (2OmM, pH 7,5) contenant 5X SSC (IX SSC correspond à une solution 0.15M NaCl
+ 0.015 M de citrate de sodium), 50% de formamide, 7% de sodium dodecyl sulfate (SDS), 10X de solution de Denhardt's, 5% de dextran sulfate et 1% d'ADN de sperme de saumon ;
(2) hybridation proprement dite pendant 20 heures à une température dépendant de la taille de la sonde (par exemple 55°C pour une sonde de taille d'environ 50 nucléotides) suivie de 2 lavages de 20 minutes à 20°C en 2X SSC + 2% SDS, 1 lavage de 20 minutes à 20°C en 0.1X SSC + 0.1% SDS. Le dernier lavage est pratiqué en 0..1X SSC + 0.1% SDS pendant 30 minutes à 60°C pour une sonde de taille d'environ 50 nucléotides.
Le support solide utilisé pour la réalisation de la présente invention, également appelé de manière indifférente dans la présente demande « (bio)puce » ou « (bio)ρuce à ADN », peut être de manière générale tout support miniaturisé de verre, de silicium ou de polymère qui peut être revêtu de séquences nucléotidiques de séquence connue, en particulier les fragments représentatifs de gènes selon la présente invention déposés en arrangement ordonné, et dont la fonction est de reconnaître, dans un mélange, leurs séquences nucléotidiques complémentaires. Comme exemple de support solide on peut citer, mais sans s'y limiter, des membranes telles que les membranes de nylon à densité élevée (par exemple Performa, Genetix, New Milton, UK) ; on utilisera de préférence des lames microréseau en arnino-silane, disponibles notamment chez Corning (ultraGAP™, NY). La surface du support est traitée pour former un réseau dense et régulier de microsurfaces sur lesquelles les fragments représentatifs
sont fixés ; l'emplacement de chacun d'entre eux est précisément connu. De tels supports solides sont bien connus de l'homme de l'art, qui saura choisir le type de support à utiliser et les conditions appropriées pour un test d'hybridation donné.
Le sujet présentant une tumeur mammaire est de préférence un mammifère, et de manière particulièrement préférée l'homme. La présente invention est tout particulièrement appropriée pour le dépistage de tumeurs mammaires métastatiques chez la femme, mais elle peut également être utilisée dans les cas de cancers du sein chez l'homme.
Par « pourcentage d'identité » entre deux séquences d'acides nucléiques, on entend désigner un pourcentage de nucléotides identiques entre les deux séquences à comparer, obtenu après leur meilleur alignement, ce pourcentage étant purement statistique et les différences entre les deux séquences étant réparties au hasard et sur toute leur longueur. L'alignement optimal des séquences pour la comparaison peut être réalisé à l'aide d'algorithmes mathématiques. D'une manière préférée, non limitative, on peut citer différents algorithmes rappelés dans le document Fundamentals of database searching (review) Stephen F., Altschul, Bioinformatics : A trends
Guide, 1998 :5 :7-9, notamment les algorithmes de Karlin et Altschul (1990) Proc. Natl. Acad. Sci. USA 872264, modifié dans Karlin et Altschul (1993) Proc. Natl. Acad. Sci. USA 90:5873-5877. On pourra utiliser en particulier les programmes : -BLAST, notamment BLASTN, BLAST2 (Tatusova et al., 1999, "Blast 2 séquences - a new tool for comparing protein and nucleotide séquences", FEMS Microbiol Lett. 174:247-250), gapped BLAST (Altschul et al., 1997, Nucleic Acids Res. 25(17) :3389-3402), -FASTA (Altschul S. F. ét al, 1990, J. Mol. Biol., 403-410), -Clustal W (Thompson, J. D. et al, 1994, Nucleic Acids Res. 22, 4673-80),
-BESTFIT.
L'algorithme BLAST est décrit en détail sur le site du NCBI (http :ww.ncbi.nih.gov).
Les expressions « acide nucléique », « séquence nucléique » ou « d'acide nucléique », « polynucléotide », « oligonucléotide », « séquence de polynucléotide », « séquence nucléotidique », pourront être employés de manière indifférente dans la présente demande pour désigner un enchaînement précis de nucléotides pouvant correspondre aussi bien à de l'ADN qu'à ses produits de transcription (ARN). Ces acides nucléiques sont isolés de leur environnement naturel.
Selon un mode de réalisation préféré de l'invention, au moins un fragment représentatif d'un gène choisi parmi les gènes des Tableaux Al, A2, A3 et B est choisi parmi les fragments suivants : a) les fragments de séquence SEQ ID N0 2S SEQ ID N0 8, SEQ ID N0
11, SEQ ID N° 20, SEQ ID N° 32, SEQ ID N° 38 à 41, SEQ ID N° 45, SEQ ID N° 47, SEQ ID N° 51, SEQ ID N° 62, SEQ ID N° 114, SEQ ID N° 206, SEQ ID N° 219, SEQ ID N0 231, SEQ ID N° 233, SEQ ID N° 259, SEQ ID N° 286, SEQ ID N° 288, SEQ ID N° 311, SEQ ID N° 350, SEQ ID N° 441, SEQ ID N° 467 et SEQ ID N° 484 à 489 pour le Tableau Al , les fragments de séquence SEQ ID N° 5, SEQ ID N° 30, SEQ ID N° 43, SEQ ID N0 58 et SEQ ID N0 118 pour le Tableau A2, les fragments de séquence SEQ ID N° 15, SEQ ID N° 48, SEQ ID
N° 59, SEQ ID N° 63, SEQ ID N° 68, SEQ ID N° 69, SEQ ID N0 71 ou 72, SEQ ID N°73, SEQ ID N° 76, SEQ ID N0 80 à 83, SEQ ID N0 85,
SEQ ID N° 86, SEQ ID N° 91, SEQ ID N° 95 à 97, SEQ ID N° 100, SEQ
ID N° 101, SEQ ID N° 103, SEQ ID N° 106, SEQ ID N° 110, SEQ ID N°
111, SEQ ID N° 113, SEQ ID N° 119, SEQ ED N° 120, SEQ ID N° 123,
SEQ ID N° 126, SEQ ID N° 129, SEQ ID N° 132, SEQ ID N0 133, SEQ ID N° 141, SEQ ID N° 142, SEQ ID N° 144, SEQ ID N° 149 à 152, SEQ
ID N° 154, SEQ ID N° 156, SEQ ID N° 157, SEQ ID N° 164, SEQ ID N°
.
12
171, SEQ ID N° 175, SEQ ID N° 181, SEQ ID N° 187, SEQ DD N° 192, SEQ ID N° 195, SEQ ID N° 212, SEQ ID N0 235, SEQ ID N° 262, SEQ ID N° 281, SEQ ID N° 316, SEQ ID N° 320, SEQ ID N° 321, SEQ ID N° 325, SEQ ID N° 337, SEQ ID N° 352, SEQ ID N° 366, SEQ ID N0 372, SEQ ID N° 385, SEQ ID N° 398, SEQ ID N0 402, SEQ ID N0 411, SEQ
ID N° 422, SEQ ID N0 434, SEQ ID N° 437, SEQ ID N° 470 et SEQ ID N° 490 à 502 pour le Tableau A3, et les fragments de séquence SEQ ID N° I5 SEQ ID N° 3, SEQ ED N° 4, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 9, SEQ ID N° 10, SEQ ID N° 12 à 14, SEQ ID N° 16 à 19, SEQ ID N° 21 à 29, SEQ ID N0 31, SEQ ID
N° 33 à 37, SEQ ID N° 42, SEQ ID N° 44, SEQ ID N° 46, SEQ ID N° 49, SEQ ID N0 50, SEQ ID N° 52 à 57, SEQ ID N° 60, SEQ ID N° 61, SEQ ID N° 64 à 67, SEQ ID N° 70, SEQ ED N° 74, SEQ ED N° 75, SEQ ID N° 77 à 79, SEQ ID N° 84, SEQ ID N° 87 à 90, SEQ ID N° 92 à 94, SEQ ID N° 98, SEQ ID N0 99, SEQ ID N0 102, SEQ ID N° 104, SEQ ID N° 105,
SEQ ID N° 107 à 109, SEQ ID N° 112, SEQ ED N° 115 à 117, SEQ ID N° 121, SEQ ID N0 122, SEQ ED N0 124, SEQ ID N° 125, SEQ ED N° 127, SEQ ED N° 128, SEQ ID N° 130, SEQ ED N° 131, SEQ ED N° 134 à 140, SEQ ED N0 143, SEQ ID N° 145 à 148, SEQ ED N0 153, SEQ ID N° 155, SEQ ED N° 158 à 163, SEQ ED N° 165 à 170, SEQ ED N° 172 à 174, SEQ
ID N° 176 à 180, SEQ ID N° 182 à 186, SEQ ID N° 188 à 191, SEQ ID N° 193 ou 194, SEQ ID N° 196 à 201, SEQ ED N° 202 ou 203, SEQ ED N° 204, SEQ ID N° 205, SEQ ED N0 207 à 211, SEQ ID N° 213 à 218, SEQ ID N0 220 à 230, SEQ ID N° 232, SEQ ID N° 234, SEQ ED N° 236 à 258, SEQ ED N0 260, SEQ ID N0 261, SEQ ED N° 263 à 280, SEQ ID N° 282 à
285, SEQ ID N° 287, SEQ ED N0 289 à 310, SEQ ID N° 312 à 315, SEQ ED N° 317 à 319, SEQ ID N° 322 à 324, SEQ ID N° 326 à 336, SEQ ID N° 338 à 349, SEQ ED N0 351, SEQ ED N° 353 à 365, SEQ ED N° 367 à 371, SEQ ID N° 373 à 384, SEQ ID N° 386 à 397, SEQ ID N° 399 à 401, SEQ ED N0 403 à 410, SEQ ED N° 412 à 421, SEQ ED N0 423 à 433, SEQ
ID N° 435, SEQ ED N° 436, SEQ ED N° 438 à 440, SEQ ED N° 442 à 466,
SEQ ID N° 468, SEQ ID N0 469, SEQ ID N0 471 à 483 et SEQ ID N° 503 " à 513 pour le Tableau B5 ou b) les fragments ayant au moins 70 % d'identité avec les fragments tels que définis en a), ou c) les fragments comprenant les fragments tels que définis en a) ou en b), ou d) les fragments dont les séquences sont complémentaires des séquences des fragments tels que définis en a), b) ou c).
Selon un mode de réalisation encore plus préféré, au moins un fragment représentatif de gène pour l'ensemble des gènes des Tableaux Al, A2, A3 et B est choisi parmi les fragments suivants : a) les fragments de séquence SEQ ED N° 2, SEQ ID N° 8, SEQ ID N0 11, SEQ ID N° 20, SEQ ID N° 32, SEQ ID N° 38 à 41, SEQ ID N° 45, SEQ ID N° 47, SEQ ID N° 51, SEQ ID N° 62, SEQ ID N° 114, SEQ ID N° 206,
SEQ ID N° 219, SEQ ID N° 231, SEQ ID N0 233, SEQ ID N° 259, SEQ ID N0 286, SEQ ID N° 288, SEQ ID N0 311, SEQ ID N° 350, SEQ ID N° 441, SEQ ID N° 467 et SEQ ID N° 484 à 489 pour le Tableau Al, les fragments de séquence SEQ ID N0 5, SEQ ID N° 30, SEQ ID N0 43, SEQ ID N° 58 et SEQ ED N° 118 pour le Tableau A2, les fragments de séquence SEQ ID N° 15, SEQ ID N° 48, SEQ ID N0 59, SEQ ID N° 63, SEQ ID N° 68, SEQ ID N° 69, SEQ ID N° 71 ou 72, SEQ ID N°73, SEQ ID N° 76, SEQ ID N° 80 à 83, SEQ ID N° 85, SEQ ID N° 86, SEQ ID N° 91, SEQ ID N° 95 à 97, SEQ ID N° 100, SEQ ID N0 101, SEQ ID N° 103, SEQ ID N° 106, SEQ ID N° 110, SEQ ID N°
111, SEQ ID N° 113, SEQ ID N° 119, SEQ ID N° 120, SEQ ID N° 123, SEQ ID N° 126, SEQ ID N° 129, SEQ ID N° 132, SEQ ID N° 133, SEQ ID N° 141, SEQ ID N° 142, SEQ ID N° 144, SEQ ID N° 149 à 152, SEQ ID N° 154, SEQ ED N° 156, SEQ ID N0 157, SEQ ED N0 164, SEQ LD N° 171, SEQ LD N0 175, SEQ ID N0 181, SEQ ED N0 187, SEQ ED N0 192,
SEQ ED N0 195, SEQ ID N0 212, SEQ ID N° 235, SEQ ED N° 262, SEQ
ID N0 281, SEQ ID N0 316, SEQ ID N° 320, SEQ ED N0 321, SEQ ID N° 325, SEQ ID N° 337, SEQ ID N° 352, SEQ ID N° 366, SEQ ID N° 372, SEQ ID N° 385, SEQ ID N° 398, SEQ ID N° 402, SEQ ID N° 411, SEQ ID N° 422, SEQ ID N° 434, SEQ ID N0 437, SEQ ID N° 470 et SEQ ID N° 490 à 502 pour le Tableau A3, et les fragments de séquence SEQ ID N° 1, SEQ ID N° 3, SEQ ID N°
- 4, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 9, SEQ ID N° 10, SEQ ID N°
12 à 14, SEQ ID N° 16 à 19, SEQ ID N° 21 à 29, SEQ ID N° 31, SEQ ID
N° 33 à 37, SEQ ID N° 42, SEQ ID N° 44, SEQ ID N° 46, SEQ ID N° 49, SEQ ID N° 50, SEQ ID N° 52 à 57, SEQ ID N° 60, SEQ ID N° 61, SEQ
ID N° 64 à 67, SEQ ID N° 70, SEQ ID N° 74, SEQ ID N° 75, SEQ ID N0 77 à 79, SEQ ID N° 84, SEQ ID N° 87 à 90, SEQ ID N° 92 à 94, SEQ ID N° 98, SEQ ID N° 99, SEQ ID N° 102, SEQ ID N° 104, SEQ ID N0 105, SEQ IDN0 107 à 109, SEQ ID N° 112, SEQ ID N0 115 à 117, SEQ ID N° 121, SEQ ID N° 122, SEQ ID N° 124, SEQ ID N° 125, SEQ ID N0 127,
SEQ ID N° 128, SEQ ID N° 130, SEQ ID N° 131, SEQ ID N° 134 à 140, SEQ ID N° 143, SEQ ID N° 145 à 148, SEQ ID N° 153, SEQ JD N0 155, SEQ ID N° 158 à 163, SEQ ID N0 165 à 170, SEQ DD N° 172 à 174, SEQ ID N° 176 à 180, SEQ ID N° 182 à 186, SEQ ID N° 188 à 191, SEQ ID N° 193 ou 194, SEQ ID N° 196 à 201, SEQ ID N° 202 ou 203, SEQ ID N°
204, SEQ ID N0 205, SEQ ID N0 207 à 211, SEQ ID N° 213 à 218, SEQ ID N° 220 à 230, SEQ ID N° 232, SEQ ID N° 234, SEQ ID N° 236 à 258, SEQ ID N° 260, SEQ ID N° 261, SEQ ID N° 263 à 280, SEQ ID N° 282 à 285, SEQ ID N0 287, SEQ ID N° 289 à 310, SEQ ID N° 312 à 315, SEQ ID N° 317 à 319, SEQ ID N° 322 à 324, SEQ ID N° 326 à 336, SEQ ID
N° 338 à 349, SEQ ID N0 351, SEQ ID N° 353 à 365, SEQ ID N0 367 à 371, SEQ ID N° 373 à 384, SEQ ED N° 386 à 397, SEQ ID N° 399 à 401, SEQ ID N0 403 à 410, SEQ ID N0 412 à 421, SEQ ED N° 423 à 433, SEQ ID N° 435, SEQ ID N° 436, SEQ ID N° 438 à 440, SEQ ID N° 442 à 466, SEQ ID N0 468, SEQ ED N0 469, SEQ ID N° 471 à 483 et SEQ ID N° 503 à 513 pour le Tableau B, ou
b) les fragments ayant au moins 70 % d'identité avec les fragments tels que définis en a), ou c) les fragments comprenant les fragments tels que définis en a) ou en b), ou d) les fragments dont les séquences sont complémentaires des séquences des fragments tels que définis en a), b) ou c).
L'un (SEQ ID N° 71) ou l'autre (SEQ ID N0 72) des deux fragments représentatifs du gène TUBB (Tableau A3) peut être utilisé de manière indifférente dans la présente invention, de même que les deux fragments peuvent être utilisés de manière simultanée (SEQ ID N° 71 et SEQ ID N° 72). De même, l'un (SEQ ID N° 193) ou l'autre (SEQ ID N° 194) des deux fragments représentatifs du gène BCARl peut être utilisé de manière indifférente dans la présente invention, de même que les deux fragments peuvent être utilisés de manière simultanée (SEQ ID N0 193 et SEQ ID N°
94). Enfin, l'un (SEQ ID N° 202) ou l'autre (SEQ ID N° 203) des deux fragments représentatifs du gène CCNEl peut être utilisé de manière indifférente dans la présente invention, de même que les deux fragments peuvent être utilisés de manière simultanée (SEQ ID N0 202 et SEQ ID N° 203).
Les fragments tels que définis au point b) des modes de réalisation ci-dessus qui restent représentatifs des gènes donnés, résultent par exemple d'un polymorphisme nucléotidique ou d'une mutation (délétion, insertion, substitution...).
Selon un mode de réalisation tout particulièrement préféré, le jeu est constitué par 36 fragments, chacun des 36 fragments étant représentatif d'un gène distinct choisi parmi les gènes des Tableaux Al et A2, ou par 88 fragments, chacun des 88 fragments étant représentatif d'un gène distinct choisi parmi les gènes des Tableaux A2 et A3, ou par 119 fragments, chacun
des 119 fragments étant représentatif d'un gène distinct choisi parmi les gènes des Tableaux Al, À2 et A3.
Selon un mode de réalisation tout particulièrement préféré, le jeu est constitué par 510 fragments, chacun des 510 fragments étant représentatif d'un gène distinct choisi parmi les gènes des Tableaux Al, A2 et A3, et B. 3 gènes (TUBB ,. BCARl et CCNEl) sont chacun représentés par 2 fragments (cf. supra). Ainsi, selon une alternative, le jeu est constitué par 511 fragments, chacun des 511 fragments étant représentatif d'un gène choisi parmi les gènes des Tableaux Al, A2 et A3, et B. Selon une autre alternative,, le jeu est constitué par 512 fragments, chacun des 512 fragments étant représentatif d'un gène choisi parmi les gènes des Tableaux Al, A2 et A3, et B. Selon une dernière alternative préférée entre toutes, le jeu est. constitué par 513 fragments, chacun des 513 fragments étant représentatif d'un gène choisi parmi les gènes des Tableaux Al, A2 et A3, et B.
Un tel support solide revêtu d'un jeu constitué par un ensemble de fragments dont chacun est représentatif des gènes des Tableaux Al, A2, A3 et B permet de caractériser l' envahissement ganglionnaire, et donc le caractère métastatique ou localisé d'une tumeur mammaire, et permet également de déterminer d'autres éléments tels que l'évaluation de la survie des patientes, le statut BRCA1/BRCA2, la prolifération cellulaire et l'expression des récepteurs aux oestrogènes par les cellules d'une tumeur mamaire.
La caractérisation de l'expression des récepteurs aux oestrogènes par les cellules d'une rumeur mammaire (ER+ ou ER-) précède la détermination l'envahissement ganglionnaire pour une tumeur mammaire donnée (cf. supra).
Un deuxième aspect de la présente invention concerne un procédé de diagnostic ou de pronostic in vitro du caractère métastatique ou localisé
d'une tumeur mammaire à partir d'un prélèvement de ladite tumeur chez un sujet, caractérisé en ce que ledit procédé comprend une étape dans laquelle on dépose un échantillon d'un extrait d'acide nucléique, le cas échéant après rétro-transcription, issu dudit prélèvement tumoral, sur un support solide selon la présente invention, et en ce qu'on analyse la quantité d'acide nucléique ayant hybride avec le jeu de fragments représentatifs déposé sur ledit support. . . ..
De préférence, le procédé de diagnostic ou de pronostic in vitro du caractère métastatique ou localisé d'une tumeur mammaire est caractérisé en ce qu'il comprend les étapes suivantes : a) l'extraction d'un échantillon d'acide nucléique test à partir du prélèvement tumoral, b) le marquage de l'acide nucléique test de l'échantillon obtenu à l'étape a) à l'aide d'un premier marqueur, . . c) en parallèle, le marquage d'un échantillon d'acide nucléique de référence à l'aide d'un deuxième marqueur différent du premier marqueur de l'étape b), d) la mise en contact de l'échantillon d'acide nucléique test marqué obtenu à l'étape b) et de l'échantillon d'acide nucléique de référence marqué obtenu à l'étape c) avec le support selon la présente invention dans des conditions appropriées pour l'hybridation, chaque fragment représentatif d'un gène du support solide étant capable de s'hybrider avec un fragment du gène présent dans l'échantillon d'acide nucléique test marqué et un fragment du gène présent dans l'échantillon d'acide nucléique de référence, e) la normalisation, pour chaque fragment représentatif de gène déposé sur le support, de l'intensité d'hybridation obtenue pour l'échantillon d'acide nucléique test marqué et celle obtenue pour l'échantillon d'acide nucléique de référence marqué, f) la comparaison, pour chaque fragment représentatif de gène déposé sur le support, de l'intensité d'hybridation normalisée obtenue pour
l'échantillon d'acide nucléique test marqué avec celle obtenue pour l'échantillon d'acide nucléique de référence marqué, de sorte à obtenir un profil d'expression des gènes dont les fragments représentatifs ont été déposés sur le support solide, g) le classement de la tumeur mammaire comme étant métastatique ou localisée après analyse du profil d'expression obtenu à l'étape f).
L'extraction d'un échantillon d'acide nucléique test à partir du prélèvement tumoral telle que définie à l'étape a) du procédé de prédiction selon la présente invention est une technique couramment employée en biologie moléculaire. De manière générale, pour la réalisation de la présente invention, l'échantillon d'acide nucléique test est soit un échantillon d'ARNm, soit un échantillon d'ADNc obtenu après rétrotranscription de cet ARNm ; l'acide nucléique (ARKm ou ADNc) contenu dans un tel échantillon est en quantité suffisante pour caractériser le profil d'expression de l'ensemble des gènes dont un fragment représentatif a été déposé sur le support solide. Les techniques de biologie moléculaire employées pour la réalisation de la présente invention sont bien connues de l'homme de l'art, et sont largement décrites dans la littérature (voir par exemple Sambrook, Russell et al, "Molecular cloning: A laboratory manual", Vol.3, January 15,
2001, CoId Spring Harbor Laboratory ; « Nucleic acid hybridization », BD Haines, SJ Higgins (Eds), 1985, IRL Press). Ainsi, l'homme du métier saura appliquer la procédure nécessaire pour l'extraction d'un échantillon de l'acide nucléique test à partir du prélèvement tumoral.
Le marquage de l'échantillon d'acide nucléique test à l'étape b) et celui de l'échantillon d'acide nucléique de référence à l'étape c) permet l'émission d'un signal détectable et quantifiable, caractéristique de l'intensité d'hybridation obtenue lorsqu'un fragment représentatif d'un gène donné s'hybride d'une part avec un fragment présent dans l'échantillon d'acide nucléique test, d'autre part avec un fragment présent dans l'échantillon
d'acide nucléique de référence. L'intensité d'hybridation obtenue est proportionnelle au niveau d'expression du gène représenté par le fragment déposé sur le support solide.
Le marquage peut consister en un radio-marquage (tel que 32P, 33P ,35S, qui peut être détecté en utilisant par exemple un compteur gamma ou un scintillateur, autoradiographie,...), un marquage erizymatique (biotine, digoxigénine,...), un marquage chimioluminescent (luminol, dioxétane, luciférase, luciférine) ou un marquage fluorescent. Lorsqu'on utilise le marquage radioactif, le support solide ne doit pas être en verre.
Le marquage fluorescent est particulièrement préféré pour la réalisation de la présente invention. Comme exemple de marqueurs fluorescents on peut citer, mais sans s'y limiter, la fluorescéine et ses dérivés, tels que l'isothiocyanate de fluorescéine (FITC), les coumarines, les cyanines 2, 3 et
5, les dérivés de la phycocyanine, l'allophycocyanine (APC), la phycoérythrine-cyanine 5 (PC5) et la phycoérythrine (PE), la calcéine (AM), la tetraméthyl-rhodamine de fluorescence rouge ou la rhodamine et ses dérivés, la protéine de fluorescence verte ou GFP (« Green Fluorescent Protein »), le chlorure de dansyl, Pumbelliferone etc.. (voir également W. T.
Mason (1999), « Fluorescent and Luminescent Probes for Biological Activity », Académie Press, Londres, 2è édition).
On choisira les deux marqueurs pour l'échantillon d'acide nucléique test et ipour l'échantillon d'acide nucléique de référence de sorte à obtenir deux signaux caractéristiques de l'intensité d'hybridation comparables entre eux.
Les méthodes de marquage sont bien connues de l'homme de l'art et sont largement décrites dans la littérature (voir par exemple "Pratique de l'utilisation des sondes nucléiques et de l'hybridation moléculaire", Gérard Lacotte, May 1992, Ed. Lavoisier, Paris, et W. T. Mason (1999),
« Fluorescent and Luminescent Probes for Biological Activity », Académie Press, Londres, 2è édition) ; les kits et les marqueurs sont disponibles dans le commerce (voir par exemple le kit « Low RNA Input Fluorescent Linear Amplification Kit », disponible chez Agilent Technologies, ou d'autres kits/marqueurs disponibles par exemple chez Molecular Probes, Leiden, NL,
Clontech, PaIo Alto, CA, Stratagene, La JoIIa5 CA, etc...).
On entend désigner par « échantillon d'acide nucléique de référence » dans la présente demande un pool d'acide nucléique obtenu à partir de différentes lignées cellulaires normales et tumorales. Ces lignées cellulaires sont de manière générale mises en culture à l'échelle industrielle afin de produire des lots de taille importante, qui subissent des procédures de contrôle qualité stringentes. Un tel échantillon d'acide nucléique de référence sert de contrôle pour obtenir les informations relatives à l'expression des gènes présents dans l'échantillon d'acide nucléique test après hybridation avec les fragments représentatifs déposés sur le support solide.
Comme exemple d'échantillon d'acide nucléique de référence on peut citer, mais sans s'y limiter, le pool d'ARN « Universal human référence RNA », commercialisé par Stratagene.
La normalisation à l'étape e) permet de s'affranchir des différences causées par le bruit de fond, la durée de l'hybridation, le marquage plus ou moins important des échantillons d'acides nucléiques test et de référence, les quantités variables des échantillons d'acides nucléiques test et de référence déposés sur le support solide, etc.. La normalisation des résultats est couramment utilisée dans les expériences de biologie moléculaire et est bien connue de l'homme de l'art. Tous types de méthodes peuvent être utilisés pour la réalisation de la présente invention, tels que notamment la méthode « Lowess Global » (Yang IV et al. Within the fold: assessing differential
expression measures and reproducibility in microarray assays. Génome Biol. 3, research 0062.1-0062.12, 2002). "
L'analyse à l'étape g) en fonction du profil d'expression obtenu à l'étape f) est réalisée à l'aide de la méthode d'Analyse en Composantes Principales développée par le. laboratoire Génome et Informatique d'Evry (logiciel
GeneAnova, voir point 5 « analyse des données » de l'exemple). D'autres méthodes d'analyse à plusieurs variables appropriées pourront être utilisées pour classer la tumeur mammaire comme étant métastatique ou localisée. On peut citer à titre d'exemple les logiciels suivants, disponibles sur Internet :
- TIGR Multi-experiment Viewer: www.tigr.org/software,
- J-Express:www.ii.uib.no/%7Ebjarted/jexρress, et
- Genesis, genome.tugraz.at/Software/Genesis/ (sans www).
De préférence, le procédé selon la présente invention est caractérisé en ce que le classement à l'étape g) est déterminé par comparaison du profil d'expression obtenu à l'étape f) au moyen du support solide selon l'invention avec le profil d'expression tel que défini dans les Tableaux Al, A2 etA3.
Comme cela a été dit précédemment, avant de déterminer l'envahissement ganglionnaire pour une tumeur mammaire donnée, il est indispensable de caractériser l'expression des récepteurs aux oestrogènes par les cellules de ladite tumeur. Cette caractérisation de l'expression des récepteurs aux oestrogènes peut être effectuée selon toute méthode appropriée connue de l'homme de l'art telle que par exemple l'immunobistochimie, mais également en utilisant le procédé selon la présente invention.
Ainsi, selon un mode particulier de réalisation, le procédé selon la présente invention permet également de caractériser si les cellules de la tumeur
mammaire expriment ou non les récepteurs aux oestrogènes, ce dit procédé étant caractérisé en ce qu'après l'étape f), on compare le profil d'expression de l'ensemble des gènes du Tableau C obtenu au moyen du support solide selon la présente invention avec le profil d'expression tel que défini dans ledit Tableau C.
Les gènes du Tableau C constituent un groupe de gènes sélectionnés parmi les gènes des Tableaux Al, A2, A3 et B. Ainsi, un support solide selon la présente invention, permettant de dépister l'envahissement ganglionnaire à la fois dans les tumeurs ER- et dans les tumeurs ER+, et comprenant notamment ce groupe de gènes, pemettra également de caractériser si les cellules de la tumeur mammaire expriment (ER+) ou non (ER-) les récepteurs aux oestrogènes : à l'aide de ce support, on caractérisera dans un premier temps si la tumeur à partir de laquelle le prélèvement a été effectué est une tumeur ER+ ou une tumeur ER-, et dans un deuxième temps, si la tumeur est ER+, on s'intéressera uniquement au profil d'expression obtenu pour tout ou partie des gènes listés dans les Tableaux Al et A2, et si la tumeur est ER-, on s'intéressera au profil d'expression obtenu pour tout ou partie des gènes listés dans les Tableaux A2 et A3.
Selon encore une autre préférence, le procédé selon la présente invention est caractérisé en ce que la comparaison à l'étape f) de l'intensité d'hybridation normalisée obtenue pour l'échantillon d'acide nucléique test marqué avec celle obtenue pour l'échantillon d'acide nucléique de référence marqué comprend les étapes suivantes : a) le calcul, pour chaque fragment représentatif d'un gène déposé sur le support, du rapport entre l'intensité d'hybridation normalisée obtenue pour l'échantillon d'acide nucléique test marqué et celle obtenue pour 1 ' échantillon d' acide nucléique de référence marqué, b) le calcul, pour chaque fragment représentatif d'un gène déposé sur le support, du log2 de chaque rapport obtenu à l'étape a).
Chaque fragment représentatif du jeu est déposé de manière générale une fois, de préférence deux fois, manière encore préférée trois fois, voire quatre fois sur le support solide. Ainsi, selon un mode de réalisation particulier, le procédé selon la présente invention est caractérisé en ce que, lorsque chaque fragment du jeu est déposé trois fois sur le support, la moyenne des 1Og2 des trois réplicats est calculée pour chacun de ces fragments.
Selon un autre mode de réalisation, le procédé selon la présente invention est caractérisé en ce que les échantillons d'acides nucléiques test et de référence sont de l'ARN, de préférence de PARNm.
De préférence, le procédé selon la présente invention est caractérisé en ce que l'étape b) de marquage de l'ARN test, de préférence de l'ARNm test, de l'échantillon à l'aide du premier marqueur comprend les étapes suivantes : i) la rétrotranscription de l'ARN test de l'échantillon obtenu à l'étape a), ii) l'incorporation du premier marqueur lors de la transcription in vitro de l'ADN test obtenu à l'étape i).
Selon une autre préférence, le procédé selon la présente invention est caractérisé en ce que l'étape c) de marquage de l'échantillon d'ARN de référence, de préférence de l'ARNm de référence, à l'aide du deuxième marqueur comprend les étapes suivantes : i) la rétrotranscription de l'ARN de référence de l'étape c), ii) l'incorporation du deuxième marqueur lors de la transcription in vitro de l'ADN test obtenu à l'étape i).
De manière encore préférée, le procédé selon la présente invention est caractérisé en ce que les premier et deuxième marqueurs sont choisis parmi la cyanine 3 et la cyanine 5.
Un dernier aspect de la présente invention concerne un kit comprenant le support solide selon la présente invention. Les kits comprenant un support solide d'hybridation sont suffisamment décrits dans la littérature, et comprennent de manière générale, outre le support solide, des réactifs nécessaires pour l'hybridation tels que notamment des marqueurs ou des tampons d'hybridation, et de. lavage.
Les légendes des figures et exemples qui suivent sont destinées à illustrer l'invention sans aucunement en limiter la portée.
FIGURES
Figure IA : Classification obtenue par Analyse en Composantes Multiples pour les tumeurs ER+ (ACP, logiciel GeneAnova, laboratoire génome et informatique d'Evry).
Figure IB : Classification obtenue par Analyse en Composantes Multiples pour les tumeurs ER-. Figure 2 : Classification obtenue par Analyse en Composantes Multiples pour l'étude de l'expression des récepteurs aux oestrogènes(ER+/ER-) par les cellules de tumeurs mammaires.
EXEMPLES
Exemple 1 : Etude de l'envahissement ganglionnaire
1. Patientes
Des fragments chirurgicaux de tumeurs mammaires chez des patientes opérées au centre Jean Perrin (Clermont-Ferrand) ont été prélevés. Les critères de sélection des tumeurs ont été le type histologique (il s'agit de
carcinomes canalaires infiltrants) et la survenue de ces tumeurs dans un contexte sporadique. Au total, 69 tumeurs sont étudiées.
2. Echantillons biologiques L'extraction d'ARN est réalisée à partir des rumeurs congelées dans l'azote liquide avec le protocole Trizol (Invitrogen, Cergy-Pontoise, France). Après vérification de la qualité des. ARN obtenus par. microélectrophorèse sur le bioanalyseur (Agilent technologies, Massy, France), 10 μg d'ARN totaux sont utilisés pour l'étude sur puce. Un pool d'ARN de lignées cellulaires est utilisé comme ARN référence
(Universal human référence RNA, Stratagene, La Jolla, CA). Ce pool d'ARN de référence, disponible dans le commerce, comprend une collection d'ARN obtenus à partir d'un certain nombre de lignées cellulaires pour couvrir une gamme optimale de gènes.
3. Préparation des biopuces (ou « supports solides »)
Les sondes moléculaires (ou « fragments représentatifs ») sont des oligonucléotides de 50 bases synthétisés par la société MWG. La séquence de certains oligonucléotides est disponible dans les banques de MWG, d'autres ont été recherchées la demande des inventeurs. Ces oligonucléotides sont dilués à une concentration de 25 μM dans une solution de DMSO 50% (diméthylsulfoxide) puis déposés sur des lames Ultragaps (Corning, New York, US) grâce à un robot ( Microgrid II, Biorobotics, Genomic Solutions, Cambridge, UK). Chaque sonde moléculaire est déposées en triplicat sur la lame. Après dépôt, les molécules d'ADN sont fixées par incubation sur des lames à 8O0C, pendant 2 heures. Un traitement chimique tel que défini par la société Corning est réalisé. Les lames sont alors conservées à température ambiante, à l'obscurité.
4. Marquage et hybridation
Pour chaque échantillon, 10 μg d'ARN sont rétrotranscrits en présence d'amino-allyl dUTP (Fairplay Microarray labelling kit, Stratagene, La Jolla, US). Les ADNc obtenus à partir des ARN de la tumeur et de TARN référence sont respectivement incubés avec de la cyanine 5 et cyanine 3 (Amersham Biosciences, Québec, CA) qui vont se fixer sur le groupement amino-allyl. Les ADNc fluorescents sont alors purifiés et séchés sous vide. Le culot est repris dans 16 μl de tampon d'hybridation (Corning, New York, US) puis l'on procède ensuite à la dénaturation à 100°C. L'hybridation se fait avec un « coverslip » qui permet de maintenir le contact entre la cible et la surface de la lame, à 370C et 50% d'humidité, pendant la nuit.
Les lames sont ensuite lavées dans des solutions de SDS (dodécylsulfate de sodium) et SSC (citrate de sodium salin) à différentes concentrations. La fluorescence est détectée par passage de la puce dans un scanner (GMS 418, Affymetrix).
5. Analyses des données
Les images obtenues sont analysées avec un logiciel d'analyse d'image
, (Jaguar, Affymetrix, UK). La normalisation des données est effectuée selon la méthode lowess global car il y a une dépendance systématique entre la valeur du Iog2(ratio) et l'intensité, qui apparaît généralement par des valeurs du Iog2(ratio) élevées pour des valeurs d'intensité faibles. Cette méthode permet d'enlever de tels effets. Ensuite, le ratio des intensités tumeur/référence est calculé, puis le Iog2 des ratios. Pour chaque gène, la moyenne des Iog2(ratio) des trois réplicats est calculée, chaque sonde moléculaire étant déposée trois fois sur la puce.
Le test de Student est alors utilisé. H s'agit d'un test de significativité qui peut être employé lors de la comparaison de deux moyennes. Le test t est calculé en effectuant le rapport de la différence des moyennes sur l'erreur standard. Une valeur p < 0,05 est considérée comme significative. Ce test est impliqué pour évaluer le niveau de significativité entre les moyennes d'expression des différents gènes entre le groupe des échantillons
« sensibles » et le groupe des échantillons « résistantes ». Les profils d'expression des gènes discriminants (p<0,05) sont alors étudiés par une analyse en composantes principales (ACP).
L'Analyse en Composantes Principales (logiciel GeneAnova, Laboratoire Génome et Informatique d'Evry, FR) est une méthode dite descriptive, elle vise à structurer et simplifier des données issues de plusieurs variables, sans
-privilégier- l'une d'entre elles.. L'ACP permet de visualiser la géométrie du nuage des observations quand l'espace à plus de 3 dimensions. Elle procède en 2 étapes, le détermination des axes d'inertie du nuage puis sa projection sur les plans déterminés par les axes d'inertie pris 2 à 2. L'analyse de la sphère des corrélations permet de visualiser les similitudes entre différents profils d'expression. La corrélation linéaire entre 2 profils est égale au cosinus de l'angle entre les vecteurs correspondants à ces conditions expérimentales (un angle de 90° montre une absence totale de corrélation).
6. Résultats et discussion
Deux groupes de patientes sont étudiés (cf. Tableau « Données cliniques des patientes »). Le premier correspond aux patientes dont les tumeurs expriment le récepteur aux oestrogènes (« estrogen receptor positive », ER+), le second à celles qui ne l'expriment pas (« estrogen receptor négative », ER -).
111 gènes (cf. Tableaux A2 et A3) ont un profil d'expression qui permet de discriminer les tumeurs ER-/N- des tumeurs ER-/N+ contre 72 gènes (cf. Tableaux Al et A2) pour les tumeurs ER+. Les classifications (Figures IA pour les tumeurs ER+ et IB pour les tumeurs ER-) obtenues par analyse en composantes multiples révèlent deux groupes, l'un correspond au tumeurs N-, l'autre correspond aux tumeurs N+.
La biopuce utilisée dans le cadre de cette étude peut donc être utilisée pour déterminer le statut ganglionnaire d'une tumeur en évitant ainsi un curage axillaire aux patientes.
Tableau « Données cliniques des patientes »
Le groupe 1 correspond aux patientes dont les tumeurs expriment le récepteur aux oestrogènes ( ER+).
Le groupe 2 correspond aux patientes dont les tumeurs n'expriment pas le récepteur aux oestrogènes ( ER-).
ND : Statut ganglionnaire non déterminé.
Statut N : N+, envahissement ganglionnaire ; N-, pas d'envahissement ganglionnaire.
Exemple 2 : Etude de l'expression des récepteurs aux oestrogènes
Le cancer du sein est hormonodépendant. Les cellules tumorales expriment les récepteurs- aux oestrogènes- ( ER, estrogen receptor). Les tumeurs ER+ sont de meilleur pronostic que les tumeurs ER-.
Les données utilisées sont celles des patientes étudiées pour la caractérisation de l'envahissement ganglionnaire.
La démarche technique est identique (cf. Exemple 1). Seuls les gènes discriminant les tumeurs ER+ des tumeurs ER- changent et sont indiqués dans le Tableau C.
La classification obtenue est celle de la Figure 2. La patiente n°68 initialement caractérisée ER+ se classe dans le groupe ER-.
TABLEAUAl
U)
TABLEAU A2
TABLEAU A3
(J-)
OJ
TABLEAUB
U) OO
U)
«o
ë
è
6
£
LU
4->
OO
TABLEAU C
O