PROCEDE DE DETERMINATION DE LA PRESENCE D'UN ATNC
RESPONSABLE D'UNE ENCEPHALOPATHIE SPONGIFORME
SUBAIGUË TRANSMISSIBLE
La présente invention porte sur une méthode d'identification de gènes dont le niveau d'expression cellulaire est corrélé à la présence d'un agent transmissible non conventionnel (ATNC), ou d'une forme pathologique d'une protéine prion (PrP). Elle porte en outre sur un procédé de détermination de la présence d'un ATNC responsable d'une Encéphalopathie Spongiforme Subaiguë Transmissible dans un échantillon biologique ainsi que sur un procédé de sélection d'un composé apte à ralentir, stopper ou empêcher le développement d'une ESST. Enfin, sont également visés dans la présente invention, les amorces, les sondes nucléotidiques et les kits pour la mise en œuvre du procédé de détermination de la présence d'un ATNC.
Le groupe des Encéphalopathies Spongiformes Subaiguës Transmissibles
(ESST) humaines et animales, ou maladies à prions, dont le mode d'apparition peut être infectieux, génétique ou sporadique, sont des affections dégénératives du cerveau caractérisées par l'accumulation d'une protéine de l'hôte, la protéine du prion ou PrP. Ceci se traduit par des lésions de spongiose et de gliose. Les ESST incluent notamment chez l'homme la maladie de Creutzfeldt-Jakob, le syndrome Gerstmann- Straussler-Scheinker, l'insomnie fatale familiale et sporadique, le kuru et, plus récemment, la nouvelle variante de la maladie de Creutzfeldt-Jakob. Chez l'animal, les ESST comprennent notamment la tremblante du mouton et l'encéphalopathie spongiforme bovine (maladie de la vache folle). Les
ESST humaines et animales, naturelles ou expérimentales présentent les caractéristiques communes suivantes :
la période d'incubation asymptomatique est particulièrement longue au regard de la durée de vie des individus de l'espèce considérée, alors même que la phase clinique, qui évolue selon un mode subaigu et qui est le reflet exclusif de l'atteinte nerveuse centrale, est relativement courte ; les ESST ne présentent aucun des signes cliniques et neuropathologiques rencontrés habituellement dans les viroses lentes du système nerveux central ; la réplication de l'agent transmissible semble échapper au contrôle du système immunitaire.
Ainsi, les ESST peuvent être définies comme des maladies neurodégénératives toujours mortelles, évoluant très lentement, et caractérisées par une très longue période d'incubation asymptomatique. La nature exacte des agents de ces maladies étant toujours inconnue, mais présentant des propriétés différentes des agents microbiens ou viraux, connus à ce jour, ils sont nommés dans le présent texte Agent Transmissible Non Conventionnels (ATNC).
Les ATNC sont en outre caractérisés par les propriétés suivantes : ils ont une taille estimée entre 14 et 40 nm (Alper et al., 1996, BBRC, 22 (3) : 278-284) ; ils sédimentent dans un gradient de sucrose en premier lieu avec la fraction microsomale (Tamai, Y., 1991 , Neurochemistry, In Creutzfeldt- Jakob disease and other transmissible spongiform encephalopathies. Mosby/yearBook, Baltimore, Md, pp 97-114) ; - ils présentent une grande résistance aux radiations aux températures élevées et aux protéases (Bockman, J.M. 1991 , Physicochemical and biological properties of the transmissible agent, 11-35. In Bastian, F.O.
(Md.), Creutzfeldt-Jakob disease and other transmissible spongiform encephalopathies. Mosby/yearBook, Baltimore, Md.).
Les ATNC se propagent de manière interspécifique et intraspécifique. Si la transmission au sein d'une même espèce animale est relativement aisée, la transmission d'une espèce à une autre dépend majoritairement de l'homologie de séquence des gènes codant la PrP du donneur et du receveur.
L'ensemble de ces observations a permis d'étayer l'hypothèse d'une nature protéique de l'ATNC constitué par la protéine PrP. Dans cette hypothèse, la pathogénicité serait acquise par un changement de la structure tridimensionnelle de la PrP sans modification de la séquence primaire. La forme anormale infectieuse ou pathologique de la PrP est encore appelée PrPSo ou prPRes selon la nomenclature. Les symptômes cliniques de la maladie seraient la conséquence d'une accumulation post- transcriptionnelle d'une protéine neurotoxique répondant à un mécanisme , de transconformation, la propagation de la conformation anormale se faisant par contact direct « protéine-protéine ».
Cependant, les mécanismes de neurodégénérescence pourraient se révéler plus complexes puisque deux études au moins (Bϋeler et al., 1994, Mol Med. 1 (1): 19-30 ; Lasmézas et al., 1997, Science 275 : 402-5) ont rapporté clairement une dissociation entre l'accumulation de PrP anormale, les signes anatomo-pathologiques et l'apparition de signes cliniques : les lésions de spongiose et de gliose seraient la conséquence de l'accumulation de la PrP pathologique tandis que la mort neuronale, responsable des signes cliniques, aurait une autre cause, potentiellement liée à la réplication des agents responsables des ESST.
Si aucune séquence spécifique n'a été identifiée dans les acides nucléiques qui copurifient avec l'infectiosité, il existe pourtant plusieurs « souches » d'ATNC.
La nature exacte du support de l'information spécifique de souche reste hypothétique et controversée. S'il s'agit de la PrP anormale elle-même, l'information serait portée exclusivement par les repliements anormaux de la protéine. Dans une autre hypothèse, les ATNC pourraient correspondre à un acide nucléique, protégé par la PrP anormale de l'hôte particulièrement résistante (c'est l'hypothèse du virino). A ce jour, les informations disponibles ne permettent pas de trancher entre l'une ou l'autre des hypothèses.
Le groupe des ESST humaines et animales, ou maladies à prions, constitue un problème de santé publique émergent majeur compte tenu d'une part du risque iatrogénique en pathologie humaine, et d'autre part de l'impact économique dans le domaine des maladies animales.
Plusieurs approches diagnostiques existent aujourd'hui. La première consiste en la recherche de formes pathologiques de la PrP par des tests immunologiques.
Elles portent en particulier sur la détection immùno-enzymatique de l'accumulation de la protéine PrP sous sa forme partiellement résistante aux protéases, post mortem à partir de prélèvements cérébraux chez l'homme, ou ante mortem à partir de biopsie d'amygdale pour le diagnostic du nouveau variant de la maladie de Creutzfeldt-Jakob (Kascsak et al.,
1987 , J Virol β . : 3688-93 ; Collinge et al., 1997, Lancet 349).
Par ailleurs, différents tests sont aussi actuellement commercialisés en Europe pour le dépistage systématique des bovins de plus de 30 mois. Le test suisse Prionics (WO 9915651) est basé sur une technique de western blot. Le test irlandais (Enfer) (PCT/IE 98/00007) est basé sur une technique
Elisa qui est plus adaptée au dépistage à grande échelle. Enfin, le test Français (CEA-B oRad) est basé sur une technique de purification de la forme pathologique de la protéine PrP couplée à une détection Elisa (WO 99/41280, CEA). On remarquera que l'ensemble de ces tests repose
sur la détection directe d'une forme anormale de la protéine prion dans un tissu infecté ou susceptible de l'être.
Ces méthodes sont donc particulièrement invasives, et ne peuvent être pratiquées qu'en dernier recours et aux dépens d'une détection précoce.
Une technique d'électrophorèse capillaire a récemment été décrite permettant de détecter la protéine PrP pathologique dans le sang des moutons (Schmerr et al., 1999, J ChromatogrA 853, 207-14).
Cependant, seul un diagnostic sensible des ESST avant l'apparition des premiers symptômes cliniques permettrait de limiter efficacement la propagation des ESST chez les animaux ou de traiter des hommes à un stade précoce de la maladie.
D'autres méthodes proposent la détection inmmuno-enzymatique de protéines présentes dans le liquide céphalo-rachidien telles que la protéine 14-3-3 (WO 9835236, 1998 ; Lee and Harrington, 1996, Lancet. 1996, 348, . 887) ou l'Enolase spécifique de Neurones (Zerr et ai, 1996, Lancet 348,
846-849 ; Kropp et al., 1999, Neurosci Lett. 267:124-6.). La détection plasmatique et urinaire d'un métabolite du cortisol au cours de la tremblante naturelle du mouton a aussi été décrite (Schlelcher et al., 1999, Endocrinology 140 : 2422-5). Cependant, la détection de ces molécules ne constitue actuellement qu'un élément d'orientation diagnostic et non des marqueurs pathognomoniques de ces maladies.
Par ailleurs, des marqueurs de prédisposition ou de susceptibilité aux ESST ont été identifiés. Leur utilisation reste cependant limitée à l'identification de certains génotypes de la PrP chez l'homme et le mouton.
Enfin, aucun traitement n'est encore disponible pour les ESST. Néanmoins, quelques molécules telles que les Polyanions, le rouge Congo, l'Amphotéricine B et les Anthracyclines sont capables de retarder
l'apparition des signes cliniques et éventuellement de prolonger la durée de vie des animaux infectés expérimentalement (Muller et al., 2000, Mech Ageing Dev 116 : 193-218 ; Seman and Adjou, 1999 ; La revue du praticien 49, 971-975). De fait, les approches thérapeutiques demeurent limitées, d'une part, par l'absence de diagnostic précoce de la maladie et d'autre part, par le manque de connaissances concernant l'apparition de la maladie et sa propagation.
Il existe donc un réel besoin d'identifier de nouveaux marqueurs moléculaires des ESST, et notamment les gènes dont l'expression est corrélée au développement et à la propagation des ESST. Ces marqueurs seraient utiles non seulement pour l'établissement de nouveaux outils de diagnostic mais aussi pour le criblage de médicaments pour le traitement des ESST.
Une approche pour l'identification de tels marqueurs moléculaires consiste à rechercher les polypeptides présentant des altérations quantitatives ou qualitatives consécutives à l'infection, et identifier leurs gènes.
L'une des approches consiste à rechercher les gènes différentiellement exprimés dans des cellules infectées par un ATNC responsable d'une ESST et dans des cellules non infectées. Pour simplifier la lecture de ce texte, par « gènes différentiellement exprimés », on entend un gène dont le niveau d'expression est différent dans une cellule infectée par un ATNC de celui observé dans une cellule du même type et du même tissu, non infectée par ledit ATNC.
Des ARNs messagers différentiellement exprimés au cours de l'infection ont été isolés en particulier par hybridation soustractive de banques d'ADNc (Borras T. et al. ; 1986, Arch. Virol. 88 ;79-90).
Huit gènes dont l'expression est augmentée dans le cerveau de souris infectées par les ATNC ont aussi été identifiés par la méthode du Differential Display (Dandoy-Dron et al., 2000, Brain Res Mol Brain Res,
76, 173-9). Cependant, rien dans ces premières approches ne permet d'identifier l'un quelconque de ces gènes à un marqueur pathognomonique de la maladie.
Il s'avère donc nécessaire de rechercher l'existence de ces marqueurs identifiables à un stade précoce de l'infection, à partir d'échantillons de cellules ou tissus provenant de prélèvements moins invasifs. La notion même de marqueurs de maladie implique l'existence d'une corrélation entre la présence de ce marqueur et l'état pathologique. En particulier, la guérison ou la réversion d'un état pathologique à un état normal doit s'accompagner de la disparition du ou des marqueurs identifiés.
La présente invention porte sur de tels marqueurs, dont certains correspondent à des gènes codant des protéines référencées dans les bases de données mais jamais évoqués dans les ESST et d'autres ne correspondent à aucune expression connue. L'identification de ces marqueurs résulte d'une adaptation de la méthode RDA à l'identification de gènes dont l'expression cellulaire est corrélée à la présence d'un agent transmissible non conventionnel (ATNC) ou à la présence d'une forme pathologique d'une protéine prion (PrP).
La méthode RDA (Representational Différence Analysis) décrite initialement par Lisitsyn et collaborateurs pour l'analyse de différences entre deux génomes (Lisitsyn et al., 1993, Science 259, 946-51) permet d'identifier des gènes différentiellement exprimés entre deux populations d'ADNc issus de la transcription inverse d'extraits d'ARN messagers de deux échantillons cellulaires à comparer (Hubank et Shatz, 1994, Methods Enzymol 303, 325-49).
Il a été constaté que, de manière inattendue, la présente méthode permettait non seulement l'identification de gènes dont la structure était connue mais dont l'expression modifiée au cours de l'infection aux prions n'avait jamais été décrite, mais également, de séquences d'acides
nucléiques dont l'expression est modifiée au cours de l'infection aux prions et dont la structure et la fonction n'avaient jamais été décrites à ce jour.
La présente invention résulte également de l'observation selon laquelle certaines substances sont capables d'inverser le phénotype pathologique des ESST sur un modèle ex vivo (cellules GT1 , Schàtzl et al. J Virol 1997
71 : 8821-8821) et que cette réversion est correlée à une réversion de l'expression desdits gènes à son état normal. Parmi ces substances décrites comme ayant un effet thérapeutique sur les ESST, on peut citer le rouge congo, l'amphothéricine B et plus particulièrement le sulfate de dextran (Caughey et al., 1993, J Virol 67 : 643-650). Par modification de l'expression d'un gène, on entend sa transcription et/ou sa traduction, et/ou les fonctions de son ou ses produits d'expression. Une expression anormale de ces séquences étant correlée à la présence d'un ATNC ou de la PrP sous sa forme pathologique, l'analyse des quantités relatives des produits d'expression de ces gènes permet ainsi la détermination de la présence d'un ATNC ou d'une forme pathologique d'une PrP, dans un échantillon biologique.
Ainsi, dans un premier aspect, l'invention a trait à une méthode d'identification de gènes dont le niveau d'expression dans des cellules ou tissus est corrélé à la présence ou non dans lesdites cellules ou tissus d'un agent transmissible non conventionnel (ATNC) ou à la présence d'une forme anormale ou pathologique d'une protéine du prion (PrP), ladite méthode comprenant : a) la mise en œuvre de la méthode dite RDA (Representational Différence Analyse) à partir d'échantillons d'ARN totaux et/ou messagers issus de cellules ou tissus infectés par ledit ATNC et/ou PrP; b) l'identification de séquences partielles d'ARN messagers dont le niveau d'expression est augmenté ou diminué dans les cellules ou
tissus infectés par rapport à celui observé dans les cellules ou tissus de même type non-infectés ; c) le criblage de bases de données de gènes et/ou de banque d'ADNc obtenus à partir des mêmes cellules ou tissus, afin d'identifier le gène correspondant aux séquences partielles d'ARN messagers identifiées en b) ; d) le cas échéant, la confirmation de la sous-expression ou de la surexpression du gène identifié, par exemple, par RT-PCR, réalisée à l'aide d'amorces dont la séquence découle de l'étape c) ; e) le cas échéant, la recherche parmi les séquences identifiées, de celles dont le niveau d'expression redevient normal après traitement des cellules infectées par une substance apte à inverser le phénotype des cellules infectées à celui de cellules saines.
L'identification des ARNm en b) résulte de l'identification de fragments d'ARNm par la méthode RDA appliquée tant aux ARN totaux que messagers.
Dans la présente invention, par l'utilisation du mot « gène », il faut comprendre toute séquence d'ADN susceptible d'être transcrite en ARN messager ou comme un précurseur de celui-ci, et, le cas échéant, d'être exprimée sous forme de polypeptide. En particulier, par « gène », on entend indifféremment, les séquences codantes d'un gène, contenant les séquences d'exons (ADNc), la phase ouverte de lecture (ORF) comprenant les séquences des introns, ou la combinaison de la phase ouverte de lecture et les séquences promotrices et terminatrices adjacentes, nécessaires à l'initiation et la terminaison de la transcription et de la traduction.
Par « expression cellulaire d'un gène», il faut comprendre la synthèse des produits de transcription du gène et, le cas échéant, la traduction de l'ARN messager correspondant.
Le terme « ATNC » fait référence à tout Agent Transmissible Non Conventionnel, responsable d'une Encéphalopathie Spongiforme Subaiguë Transmissible. Les propriétés des ATNC ont été décrites plus haut.
Par « forme anormale ou pathologique d'une protéine prion », il faut comprendre la conformation d'une protéine prion associée au développement clinique d'une ESST, en particulier, la forme infectieuse de la protéine, aussi appelée PrPSc.
La forme anormale ou pathologique d'une protéine prion encore appelée prp es correSp0ncj à une protéine d'un faible poids moléculaire résistante aux proteases telles que la protéinase K, même en présence de détergent ionique. Cette propriété semble liée à une forme agrégée présentant une structure amyloïde (empilements de protéines au niveau de feuillets β). La forme anormale s'accumule dans les tissus cérébraux des patients au cours du développement clinique de la maladie. La forme normale ou PrPc est codée par un gène dont la séquence est très bien conservée chez les mammifères. Un polymorphisme sur le codon 129 (méthionine ou valine) semble associé à une sensibilité à l'infection chez l'homme.
La forme dite «anormale ou pathologique » est un conformère de la protéine prion PrPc, notamment exprimé à partir du gène cellulaire de la
PrPc.
Il est bien entendu que, dans le cadre de la présente invention, un ATNC n'est pas nécessairement uniquement constitué de la forme anormale ou pathologique de la protéine prion, mais pourrait comprendre d'autres facteurs, protéiques, peptidiques, nucléotidiques ou autres, nécessaires en particulier à la réplication et à l'infectiosité de l'agent.
Dans la présente invention, la dite méthode RDA est définie par les étapes suivantes :
1 ) l'obtention de deux sous-populations d'acides nucléiques représentatives de deux transcriptomes,
2) l'enrichissement des séquences différentiellement exprimées par le couplage d'hybridations soustractives et d'amplifications sélectives des séquences différentiellement exprimées entre les deux populations.
3) Le clonage et l'isolement des séquences enrichies après l'étape 2.
Un protocole spécifique de mise en œuvre de la méthode RDA est en particulier décrit par Hubank et Schatz (Hubank et Schatz, 1999, Methods Enzymol 303, 325-49). Un protocole est aussi décrit dans la partie expérimentale qui suit. Cependant, l'homme du métier saura adapter ce protocole, selon sa pratique et l'évolution des méthodologies de biologie moléculaire, en particulier, celles concernant les procédés d'amplification de séquence d'acides nucléique, de digestion de l'ADN par restriction et ligatures de l'ADN à l'aide de ligase ou de clonage et d'isolement d'acides nucléiques.
Dans un mode préféré de réalisation de la méthode de l'invention, l'étape 1 de la méthode RDA définie ci-dessus est en particulier réalisée par les opérations suivantes :
- extraction des ARN des deux populations, - le cas échéant, traitement à la Dnase, et purification des ARN messagers,
- rétrotranscription des ARN pour l'obtention d'ADNc double brins,
- digestion des ADNc à l'aide d'une enzyme de restriction, telle que Dpt.ll,
- ligation avec des adaptateurs (notés ci-après R), - amplification par PCR à l'aide d'amorces spécifiques des adaptateurs R,
- digestion des adaptateurs.
L'étape 2 peut être en outre réalisée par les opérations suivantes :
- ligation d'une population d'ADNc amplifiés, dite « testeur » à l'aide d'amorces notées ci-après J ;
- hybridation soustractive par mélange de la population « testeur » avec l'autre population d'ADNc amplifiés, dite « driver » en anglais, la quantité d'ADN de population amplifiée « driver » étant en excès, de préférence d'un facteur 10, par rapport à la quantité d'ADN de population « testeur », puis par amplification PCR sélective à l'aide des amorces J.
Dans un mode préféré de mise en œuvre, la méthode d'identification de gènes selon l'invention est caractérisée en ce que les ARN extraits des deux populations de cellules infectées et non-infectées sont des ARN totaux. Il a en effet été constaté que la méthode RDA mise en œuvre à partir d'extraits d'ARN totaux de cellules infectées ou non-infectées permettait l'identification de séquences différentes de celles obtenues par la mise en œuvre de la méthode RDA sur les ARNm.
Les cellules ou tissus choisis pour l'extraction des ARN sont préférentiellement des cellules de mammifères, préférentiellement prélevées de tissus cérébraux.
Les acides nucléiques amplifiés et enrichis par la méthode RDA correspondent théoriquement à des séquences partielles d'ARN messagers dont le niveau d'expression est augmenté ou diminué dans les cellules ou tissus infectés par rapport à celui observé dans les cellules ou tissus non- infectés de même type.
Afin d'identifier le cas échéant les gènes correspondants à ces acides nucléiques, les acides nucléiques peuvent être clones dans un vecteur, amplifiés et à nouveau purifiés et caractérisés par séquençage.
Les séquences obtenues sont comparées aux, séquences disponibles dans les bases de données, telles que GenBank, afin d'identifier les séquences complètes des gènes correspondants et, le cas échéant, la fonction potentielle du produit de ces gènes.
Si aucun gène connu ne correspond à la séquence identifiée par le procédé, il est possible alors, selon les techniques classiques de biologie moléculaire, d'isoler l'acide nucléique contenant le gène ou l'acide nucléique correspondant à la séquence identifiée par criblage d'une banque d'ADN génomique ou banque d'ADNc. Les méthodes de clonage d'un gène ou d'un ADNc par criblage d'une banque d'ADN génomique ou d'ADNc sont en particulier décrites par Sambrook et al., 2001 (Molecular Cloning : A laboratory Manual, 3rd Ed., Cold Spring Harbor, laboratory press, Cold Spring Harbor, New York).
Ainsi, à chaque séquence partielle d'ARN messager isolé par la méthode RDA, l'homme du métier en déduira aisément la séquence complète du . gène correspondant.
Afin de confirmer que le gène identifié est bien différentiellement exprimé entre les deux populations de cellules étudiées, infectées ou non-infectées, on comparera le cas échéant le niveau d'expression du gène dans les deux populations de cellules. Les méthodes de comparaison du niveau d'expression d'un gène sont bien connues de l'homme du métier et incluent notamment le Northern blot, la RT-PCR quantitative ou semi-quantitative ou encore la PCR en temps réel combinée avec la transcription inverse.
La RT-PCR quantitative permet d'évaluer la quantité initiale d'un ARN messager. La RT-PCR semi-quantitative consiste à comparer la quantité de produits d'amplification d'un ARN messager rétro-transcrit spécifique issus de deux populations distinctes par rapport à la quantité de produit d'amplification d'un ARN messager d'un gène « standard » dont l'expression est connue pour être constitutive. Parmi les gènes
« standard » utilisés pour la RT-PCR semi-quantitative, le gène codant la GAPDH est classiquement utilisé.
Des méthodes dites de PCR en temps réel pour la quantification des produits d'ADNc amplifiés sont celles utilisant des couples de groupements fluorophores/quenchers telles que le système TaqMan™ commercialisé par
ABI®, le système AmpliSensor™ commercialisé par InGen ou encore le système Sunrise™ commercialisé par Oncor® et Appligène®.
Afin de confirmer la corrélation directe entre le niveau d'expression anormal d'un gène et la présence d'un ATNC ou d'une forme pathologique de la protéine prion dans les cellules, la méthode d'identification de gènes de l'invention peut comprendre une étape de recherche parmi les séquences identifiées, de celles dont le niveau d'expression redevient normal après traitement des cellules infectées par une substance apte à inverser le phénotype des cellules infectées à celui de cellules saines (étape (e) ci- dessus).
Dans un mode de réalisation préféré, une substance apte à inverser le phénotype de cellules infectées à celui de cellules saines est le sulfate de dextran 500 (Caughey et al., 1993, J. Virol. 67 : 643-650). Les inventeurs ont constaté en effet que, dans les modèles cellulaires in vitro, l'administration du sulfate de dextran 500 aux cellules en culture conduit à une disparition de la forme pathologique de la protéine prion dans les cellules. Cet effet est corrélé également dans des modèles in vivo à une augmentation de la durée de vie des animaux et un ralentissement de l'apparition de la forme pathologique de la PrP.
Ainsi, la mise en œuvre du procédé de l'invention décrit ci-dessus a permis d'identifier 1 16 fragments de gènes dont l'expression anormale (surexpression ou sous-expression) est clairement correlée à la présence d'un Agent Transmissible Non Conventionnel (ATNC) responsable d'une Encéphalopathie Spongiforme Subaiguë Transmissible dans un échantillon
biologique constitué d'une culture de cellules susceptibles d'être infectées par la protéine prion PrPSc.
Plus précisément, ont été identifiés :
- 36 fragments de séquences d'acides nucléiques dont l'expression est diminuée à l'occasion d'une infection par un ATNC, dont 35 correspondent à des gènes référencés dans les bases de données (28 gènes différents identifiés) ;
- 80 fragments de séquences d'acides nucléiques dont l'expression est augmentée au cours de l'infection par un ATNC, dont 79 correspondent à des gènes référencés dans les bases de données (41 gènes différents identifiés).
La réversion phénotypique obtenue par le sulfate de dextran 500 dans un modèle cellulaire ou animal est accompagnée de la réversion de la surexpression ou sous-expression des gènes, dans tous les cas où celle-ci a pu être testée.
Le tableau 1 ci-après présente la liste des gènes différentiellement exprimés identifiés chez la souris selon la méthode de l'invention décrite plus haut.
Tableau 1 :
L'invention vise également un procédé de détermination de la présence d'un Agent Transmissible Non Conventionnel (ATNC) responsable d'une Encéphalopathie Spongiforme Subaiguë Transmissible dans un échantillon biologique isolé du corps humain ou animal et susceptible d'être infecté par un tel ATNC, ledit procédé comprenant la mise en évidence d'une expression différentielle d'un ou plusieurs produits de gènes correspondant à :
a) une sur-expression d'un ou plusieurs gènes, appartenant à un groupe constitué des gènes sur-exprimés dans les cellules ou tissus infectés tels qu'identifiés dans le procédé d'identification de gènes décrit précédemment ; et/ou,
b) une sous-expression d'un ou plusieurs gènes, appartenant à un groupe constitué des gènes sous-exprimés dans les cellules ou tissus infectés tels qu'identifiés dans le procédé d'identification de gènes décrit précédemment.
Par « procédé de détermination de la présence d'un ATNC », il faut comprendre que le procédé permet d'indiquer la présence d'un ATNC dans un échantillon biologique. Cependant, il sera bien sûr tenu compte par l'homme du métier que, comme dans le cas de tout procédé de détection, le procédé de l'invention présente une sensibilité et une spécificité en général inférieures à 100% et variables en fonction des gènes
différentiellement exprimés choisis pour sa mise en œuvre. Le procédé permet cependant de trier les échantillons sains des échantillons infectés avec une probabilité d'erreur statistiquement inférieure à celle d'un tri aléatoire. Il peut, le cas échéant, permettre d'établir un premier dépistage dans une population analysée, d'un sous-groupe d'individus susceptibles d'être infectés par un ATNC, lequel sous-groupe fera l'objet d'un diagnostic, sensible et spécifique, pour confirmer la présence d'ATNC ou non. Un tel premier dépistage peut être avantageux, en particulier dans le cas où un diagnostic sensible et spécifique ne peut être mis en œuvre en routine sur des populations importantes, notamment en raison de difficultés techniques, de son caractère invasif, ou de son coût. Dans ce cas, une sensibilité importante du premier procédé de dépistage selon l'invention est plus particulièrement recherchée afin d'éviter des faux-négatifs, tout en étant suffisamment spécifique pour diminuer de manière importante le nombre d'individus pour lesquels le diagnostic sera établi.
Par « échantillon biologique », il faut comprendre tout matériel biologique susceptible de contenir des cellules infectées par un ATNC, et en particulier, un échantillon de cellules, de tissus, d'organes, de fluides biologiques tels que le sang, l'urine ou encore le liquide céphalo-rachidien.
Dans un mode de réalisation préféré, et notamment dans l'objectif de procéder à un diagnostic d'une ESST à partir d'un échantillon biologique isolé du corps humain ou animal, l'échantillon biologique provient de tissus humains, bovins ou ovins. Le procédé de l'invention peut ainsi être appliqué à une méthode de diagnostic in vitro d'une ESST chez l'homme ou l'animal, et notamment de diagnostic de la maladie de Creutzfeldt-Jakob chez l'homme, de ['Encéphalopathie Spongiforme Bovine chez les bovins et de la tremblante chez le mouton.
Dans un mode de réalisation particulier, et notamment dans l'objectif de procéder à un diagnostic d'une ESST à partir d'un échantillon biologique
isolé du corps humain ou animal, l'échantillon biologique provient du cerveau ou de la rate.
Dans l'objectif d'une mise en œuvre précoce ou systématique d'un tel procédé, il est préférable que le mode d'extraction d'un échantillon biologique soit peu invasif.
Ainsi, dans un mode de mise en œuvre préféré du procédé, l'échantillon biologique prélevé provient du sang ou des tissus lymphoïdes.
L'échantillon biologique peut en particulier être constitué de cellules isolées du sang, notamment de cellules dendritiques, de populations de macrophages et/ou des lymphocytes B.
Pour mettre en évidence une sur-expression ou sous-expression d'un ou plusieurs gènes, on déterminera le niveau d'expression d'un gène par rapport à celui observé dans un échantillon contrôle, dont on sait qu'il n'est pas infecté par un ATNC. En particulier, on déterminera la quantité d'ARN messagers transcrits ou de polypeptides ou protéines, traduites à partir du gène à l'aide des méthodes de quantification de produits d'expressions connues de l'homme du métier.
Une surexpression (respectivement sous-expression) est mise en évidence lorsque le niveau d'expression relatif dans l'échantillon testé est significativement supérieur (respectivement inférieur) à celui mesuré dans les cellules non-infectées de même type et de même tissu. De préférence, une surexpression (respectivement sous-expression) est mise en évidence lorsque le niveau d'expression relatif dans l'échantillon testé est supérieur d'au moins 10%, et mieux encore, au moins deux fois supérieur (respectivement inférieur) à celui mesuré dans les susdites cellules non- infectées.
On peut également déterminer le niveau d'expression relatif d'un gène par rapport à celui d'un échantillon contrôle, dont on sait qu'il n'est pas infecté par un ATNC, en comparant le niveau d'expression dudit gène à un gène de référence exprimé dans l'échantillon testé et dont on sait que son expression n'est pas modifiée par la présence d'un ATNC (gène dit
« constitutif »).
Bien entendu, la mise en évidence d'une expression différentielle d'un gène pris isolément ne détermine pas nécessairement la présence d'un ATNC dans l'échantillon analysé. L'homme du métier choisira de préférence un groupe de gènes, parmi les gènes différentiellement exprimés identifiés par le procédé de l'invention, dont le profil d'expression dans les cellules de l'échantillon analysé sera significatif de la présence ou de l'absence d'un ATNC dans l'échantillon analysé. Ce groupe de gènes peut être choisi plus spécifiquement en fonction de l'origine de l'échantillon analysé, et notamment des tissus dont il provient, de l'organisme dont il provient, et de la souche d'ATNC susceptible d'être présente dans l'échantillon.
En général, le procédé comprendra la mise en évidence d'une expression différentielle d'un groupe d'environ 10 à 100 gènes, de préférence 10 à 69 gènes et mieux encore de 10 à 30 gènes.
On observera que l'invention vise à fournir une signature de l'infection par un ATNC, correspondant à la présence de marqueurs résultant de l'expression différentielle de gènes. S'il est donc intéressant de connaître individuellement la nature, voire la fonction desdits gènes différentiellement exprimés, cela n'est pas néanmoins systématiquement nécessaire dès lors que le groupe de marqueurs est identifié et suffit à déterminer le risque d'infection dû à un ATNC.
En particulier, un mode de mise en œuvre préféré du procédé de détection décrit ci-dessus comprend la mise en évidence d'une expression différentielle d'un ou plusieurs produits de gènes correspondant à : a) une sur-expression d'un ou plusieurs produits d'expression, appartenant à un groupe constitué des produits d'expression des gènes comprenant l'une des séquences d'acides nucléiques suivantes : SEQ ID NO: 1-51 et/ou d'une sur-expression d'un ou plusieurs ARN comprenant une séquence correspondant à l'une des séquences suivantes : SEQ ID NO: 64-92 ; et/ou, b) une sous-expression d'un ou plusieurs produits d'expression, appartenant à un groupe constitué des produits d'expression des gènes comprenant les séquences d'acides nucléiques suivantes : SEQ ID NO: 52-63 et/ou d'une sous-expression d'un ou plusieurs ARN contenant une séquence correspondant à l'une des séquences d'acides nucléiques suivantes : SEQ ID NO: 93-116 ; et/ou, c) une expression différentielle d'un ou plusieurs produits d'expression de gènes ou d'ARN, homologues chez l'homme ou chez un animal d'intérêt, des gènes ou des ARN correspondant définis en a) ou b).
Au sens de l'invention, deux gènes sont dits « homologues » lorsqu'ils proviennent de deux espèces distinctes et codent pour des protéines de structure et de fonction similaires.
Un animal d'intérêt peut être notamment choisi parmi les primates, les ovins, les bovins et notamment le singe, le mouton, la vache et les bovidés sauvages.
Dans un mode de mise en œuvre, lesdits produits d'expression dont l'expression différentielle est recherchée sont choisis parmi le groupe
constitué des produits d'expression des gènes listés dans le tableau 2 suivant :
Tableau 2 : Liste des gènes de souris différentiellement exprimés et leur numéro d'accès dans la base de données NCBI
Les produits d'expression peuvent également être recherchés parmi des gènes homologues des gènes précédents cités dans le tableau 2, chez l'homme ou chez un animal d'intérêt.
Dans un mode de réalisation préféré, les produits d'expression recherchés sont des ARN messagers. Le niveau d'expression des ARN messagers peut en particulier être évalué par RT-PCR.
Afin de pouvoir estimer la quantité relative de chaque transcrit amplifié et de tenir compte de la variabilité de la quantité d'ARN total extrait d'un échantillon à un autre, un contrôle interne est utilisé. Un tel contrôle interne peut être le transcrit du gène GAPDH ou de la β-actine. L'expression relative (normalisée par rapport au contrôle interne) d'un gène donné, dans un échantillon à tester, est alors comparée par rapport à l'expression relative de ce gène dans des cellules non-infectées.
Plus généralement, toute calibration permettant une évaluation quantitative des transcrits, notamment celles qui éliminent les biais introduits lors des amplifications de transcrits de tailles différentes, peut être valablement utilisée dans cette étape du procédé de l'invention.
Dans un autre mode de réalisation du procédé de l'invention, les produits d'expression recherchés sont des polypeptides. Le niveau d'expression des polypeptides peut en particulier être évalué à l'aide d'un test immunologique permettant la reconnaissance spécifique d'un antigène porté par les polypeptides avec un anticorps ou fragment d'anticorps et la quantification du complexe antigène-anticorps formé.
L'invention vise en outre les différents moyens permettant la mise en œuvre du procédé de détermination de la présence d'un ATNC décrit ci- dessus. Outre les amorces déjà décrites, lesdits moyens comprennent notamment des sondes nucléotidiques ou des amorces utilisables pour la mesure des niveaux d'expression des gènes différentiellement exprimés, par l'hybridation avec des extraits d'acides nucléiques.
Ainsi l'invention vise l'utilisation, comme moyens pour la mise en œuvre du procédé tel que défini ci-dessus, d'une ou plusieurs sondes nucléotidiques
d'au moins 50 nuciéotides, de préférence d'une taille comprise entre 50 et 1000 nuciéotides, et mieux d'environ 100 à 300 nuciéotides, et hybridant spécifiquement dans des conditions stringentes avec l'un ou plusieurs desdits ARN messagers dont une expression différentielle est recherchée.
Par « conditions stringentes » ou « conditions de forte stringence », on entend les conditions qui permettent l'hybridation spécifique de deux séquences d'ADN simple brin à environ 65°C par exemple dans une solution de 6 x SSC, 0,5% SDS, 5X Denhardt's solution et 100 μg d'ADN non spécifique ou toute autre solution de force ionique équivalente et après un lavage à 65°C, par exemple dans une solution d'au plus 0,2 x SSC et
0,1 % SDS ou toute autre solution de force ionique équivalente. Les paramètres définissant les conditions de stringence dépendent de la température à laquelle 50% des brins appariés se séparent (Tm). Pour les séquences comprenant plus de 30 bases, Tm est définie par la relation : Tm = 81 ,5 + 0,41 (%G + C) + 16,6Log (concentration en cations) - 0,63(% formamide) - (600/nombre de bases). Pour les séquences de longueur inférieure à 30 bases, Tm est définie par la relation : Tm = 4 (G+C) + 2(A+T). Les conditions de stringence peuvent donc être adaptées par l'homme du métier selon la taille de la séquence, la teneur en GC et tout autre paramètre, selon notamment les protocoles décrits dans Sambrook et al., 2001 (Molecular Cloning : A laboratory Manual, 3rd Ed., Cold Spring Harbor, laboratory press, Cold Spring Harbor, New York).
Les sondes nucléotidiques utilisables dans le procédé de l'invention sont en particulier choisies dans le groupe constituée de : a) un acide nucléique hybridant spécifiquement dans des conditions stringentes avec l'une des séquences SEQ ID NO: 1-1 16 ; b) un fragment spécifique de l'une des séquences SEQ ID NO: 1-116.
Dans un mode de réalisation préféré, les sondes nucléotidiques sont choisies en ce qu'elles hybrident spécifiquement dans des conditions
stringentes avec les ARN messagers (ou leurs ADNc correspondant obtenus par transcription inverse), choisis parmi les produits d'expression des gènes définis dans le tableau 2 ou des gènes homologues des précédents chez l'homme ou chez un animal d'intérêt.
L'invention concerne également l'utilisation, comme moyens pour la mise en œuvre du procédé selon l'invention tel que défini plus haut, d'une amorce oligonucléotidique comprenant entre 10 et 50 nuciéotides, de préférence entre 15 et 35 nuciéotides, et hybridant spécifiquement dans des conditions stringentes avec l'un ou plusieurs desdits ARN messagers dont une expression différentielle est recherchée. Les amorces utilisées sont en particulier choisies dans le groupe constitué de a. une amorce oligonucléotidique hybridant spécifiquement dans des conditions de forte stringence avec l'une des séquences SEQ ID NO: 1- 116, et/ou b. une amorce oligonucléotidique telle que définie en a), et constituée d'un fragment spécifique de l'une des séquences SEQ ID NO: 1-116 ; et/ou c. l'une des amorces de séquences SEQ ID NO 119-190; et/ou d. l'une des amorces de séquences SEQ ID NO 197-274 ; et/ou, e. l'une des amorces hybridant spécifiquement dans des conditions stringentes avec l'une des séquences homologues, chez l'homme ou chez un animal d'intérêt, des gènes comprenant l'une des séquences SEQ ID NO :1-1 16.
En particulier, pour l'amplification quantitative des séquences d'acides nucléiques spécifiques décrites ci-dessus, la RT-PCR peut être réalisée à l'aide d'un ou plusieurs couples d'amorces appropriées pour l'amplification de plusieurs fragments nucléotidiques spécifiques d'un ou plusieurs desdits ARN messagers dont une expression différentielle doit être mise en évidence.
Dans un mode de réalisation particulier, les couples d'amorces sont choisis parmi les couples d'amorces définis dans le tableau 3 ci-après :
Tableau 3 : Couples d'amorces pour l'amplification de fragments spécifiques des gènes de souris différentiellement exprimés
SEQ ID NOS 255 et 256
SEQ ID NOS 257 et 258
SEQ ID NOS 259 et 260
SEQ ID NOS 261 et 262
SEQ ID NOS 263 et 264
SEQ ID NOS 265 et 266
SEQ ID NOS 267 et 268
SEQ ID NOS 269 et 270
SEQ ID NOS 271 et 272
SEQ ID NOS 273 et 274
Les couples d'amorces utilisables dans le procédé de l'invention- sont de préférence appropriés pour l'amplification des produits d'expression des gènes définis dans le tableau 2 ou des gènes homologues des précédents chez l'homme ou chez l'animal d'intérêt.
Fait également partie de l'invention, un kit pour la mise en œuvre du procédé de détermination de la présence d'un ATNC responsable d'une Encéphalopathie Spongiforme Subaiguë Transmissible, dans un échantillon biologique tel que défini ci-dessus, caractérisé en ce qu'il comprend : a. une ou plusieurs sondes nucléotidiques telles que définies plus haut, b. et/ou une ou plusieurs amorces telles que définies plus haut, et/ou c. un ou plusieurs couples d'amorces tels que définis plus haut ; d. le cas échéant, des réactifs et/ou des moyens pour effectuer une hybridation desdites sondes nucléotidiques avec un extrait d'acides nucléiques ou effectuer une amplification génique, à partir desdites amorces oligonucléotidiques ; e. le cas échéant, une ou plusieurs sondes ou amorces, spécifiques d'un ou plusieurs gène(s) contrôle(s) dont l'expression est constitutive.
Dans un mode de réalisation préféré, le(s) couple(s) d'amorces ou le(s) sonde(s) choisis permettent l'amplification ou la détection de séquences de gènes humains, bovins ou ovins. Ils sont choisis en particulier parmi les amorces de séquences SEQ ID NOs 119-190 et 197-274, permettant d'amplifier les gènes tels que présentés dans le tableau 1.
Avantageusement, l'expression des transcrits correspondant aux gènes différentiellement exprimés est étudiée par hybridation des extraits d'ADNc ou d'ARNm dans des kits constitués de « puces à ADN », ou micro-réseaux ou macro-réseaux sur lesquels sont fixées une ou plusieurs sonde(s) ou amorces spécifique(s) d'un ou plusieurs gène(s) différentiellement exprimé(s) dont l'expression est recherchée.
Par « puce à ADN », il faut ainsi comprendre tout type de support permettant la fixation stable d'une quantité d'acides nucléiques, l'hybridation des acides nucléiques fixés sur le support avec une séquence contenue dans un extrait d'ADN ou d'ARN préalablement marqué, puis la quantification de l'hybridation. Les technologies des puces à ADN sont en particulier décrites par Sambrook et al. (voir plus haut).
La puce à ADN permet notamment, en une seule étape, de comparer le niveau d'expression de plusieurs gènes différentiellement exprimés entre deux échantillons (échantillon testé et échantillon contrôle).
La puce à ADN peut permettre aussi de comparer en une seule étape le niveau d'expression de plusieurs gènes différentiellement exprimés et d'un ou plusieurs gènes constitutifs contrôle dans l'échantillon testé.
De préférence, la puce à ADN permet d'analyser en parallèle l'expression de 10 à 100 gènes, de préférence de 10 à 69 gènes différentiellement exprimés, et mieux encore de 10 à 30 gènes différentiellement exprimés.
L'invention porte donc en particulier sur une puce à ADN pour la détermination de la présence d'un ATNC d'une Encéphalopathie Spongiforme Subaiguë Transmissible dans un échantillon biologique, contenant a. une ou plusieurs sondes nucléotidiques telles que définies plus haut, et/ou b. une ou plusieurs amorces ou un ou plusieurs couples d'amorces tels que définis plus haut.
Dans un mode de réalisation particulier, la puce à ADN comprend un ou plusieurs acide(s) nucléique(s) choisi(s) parmi les séquences suivantes : a) SEQ ID NO: 1-116 ; b) un acide nucléique d'au moins 15 nuciéotides s'hybridant spécifiquement dans des conditions de forte stringence avec l'une des séquences définies en a) ;ou c) une séquence présentant un pourcentage d'homologie d'au moins 80%, de préférence au moins 90%, avec l'une des séquences définies en a) après alignement optimal ;ou d) un fragment spécifique d'un gène homologue, chez l'homme ou chez un animal d'intérêt, d'un gène comprenant l'une des séquences SEQ ID NO : 1-116.
Le pourcentage d'homologie est évalué à l'aide d'un programme d'alignement optimal de séquence, tel que le programme BESTFIT (Wisconsin Genetics Software Package, Genetics Computer Group, GCG) ou encore le programme Clustal w. Ces programmes prennent en compte la dégénération du code génétique sur la 3ème base des triplets, qui n'est pas comptée dans le pourcentage d'homologie. L'homologie de séquence est d'au moins 80%, et de préférence au moins 90%, sur les deux premières bases des triplets et donc sur les acides aminés correspondants.
Il est entendu également ici que ces pourcentages d'homologie ne prennent pas en compte les séquences non traduites, telles certaines des séquences régulatrices de l'expression des gènes.
En particulier, pour la réalisation des puces à ADN selon l'invention, un acide nucléique choisi est un fragment d'une séquence de gène humain, bovin ou ovin.
A titre d'exemples, une puce à ADN pour déterminer la présence d'un ATNC dans un échantillon biologique extrait de cellules de la rate, comprend des sondes nucléotidiques spécifiques de chacun des gènes suivants : SH2-containing inositol phosphatase, Aczonine, Hcn-1 , Ser/thr protein phosphatase type 1a, RBM-3.
Une puce à ADN pour déterminer la présence d'un ATNC dans un échantillon biologique extrait de cellules de cerveau, peut comprendre par exemple des sondes nucléotidiques spécifiques de chacun des gènes suivants : Secretogranine, ATP synthase, CAG repeat, stathmin, RBM-3
Les séquences de ces sondes nucléotidiques étant choisies à partir des séquences génomiques, accessibles dans les bases de données, de l'organisme duquel provient l'échantillon biologique analysé, par exemple de l'homme.
Alternativement, l'homme du métier peut utiliser, comme moyens pour la mise en œuvre du procédé de l'invention, un anticorps ou fragment d'anticorps capable de détecter un produit d'expression spécifique de l'un des gènes ou ARN différentiellement exprimés comprenant l'une des séquences SEQ ID NO :1-116 ou de l'un des gènes ou ARN homologues correspondant chez l'homme ou chez un animal d'intérêt.
De préférence, l'anticorps ou fragment d'anticorps est capable de détecter un produit d'expression spécifique de l'un des gènes comprenant l'une des séquences choisies parmi :
i. SEQ ID NO: 1-116 ; ii. une séquence hybridant dans des conditions de forte stringence avec l'une des séquences SEQ ID NO: 1- 116 ; ou, iii. une séquence nucléotidique présentant un pourcentage d'homologie d'au moins 80%, de préférence au moins 90% avec l'une des séquences de
SEQ ID NO: 1-116 après alignement optimal
L'invention porte également sur un kit pour l'identification d'un ATNC responsable d'une Encéphalopathie Subaiguë Spongiforme Transmissible (ESST), caractérisé en ce qu'il comprend : i) un anticorps ou fragment d'anticorps tel que défini plus haut ; ii) le cas échéant des réactifs pour la détection d'un complexe antigène- anticorps spécifique.
Un mode de réalisation préféré d'un kit selon l'invention est caractérisé en ce qu'il comprend un anticorps ou fragment d'anticorps capable de détecter' un produit d'expression spécifique d'un gène humain, bovin ou ovin.
Ces kits peuvent notamment comprendre une « puce à protéines » constituée d'un support sur lequel est fixé un anticorps ou fragment d'anticorps dirigé contre un produit d'expression d'un gène différentiellement exprimé. Les techniques de puces à protéines sont en particulier décrites dans les références suivantes : Emili & Cagney, 2000,
Nat. Biotechnol. 18, 393-397 ; MacBeath & Schreiber, 2000, Science 289, 1760-1763 ; Zhu et al., 2000, at Genêt. 26, 283-289 ; Holt et al., 2000, Nucleic Acids Res. 28, e72 ; Mahlknecht et al., 2001 , J. Biotechnol. 88, 89- 94. L'invention porte donc sur une puce à protéine pour la détermination de la présence d'un ATNC responsable d'une Encéphalopathie Subaiguë Spongiforme Transmissible (ESST) dans un échantillon biologique, ladite
puce à protéine contenant un anticorps ou fragment d'anticorps tel que défini plus haut.
Dans un mode de réalisation préféré, une puce à protéine selon l'invention est caractérisée en ce que ledit anticorps ou fragment d'anticorps est capable de détecter spécifiquement un produit d'expression d'un gène humain, bovin ou ovin.
Les séquences identifiées par le procédé de l'invention dont l'expression anormale est correlée à la présence d'un ATNC ou d'un état pathologique d'une protéine prion dans une cellule constituent évidemment des cibles particulièrement intéressantes dans le cadre de criblage de molécules actives dans le traitement ou la prévention des symptômes liés au développement d'une ESST.
Aussi, l'invention porte sur une méthode de sélection d'un composé apte à ralentir, stopper ou empêcher le développement d'une ESST, comprenant a. la culture de cellules infectées par un ATNC responsable de l'ESST ; b. la mise en contact de la culture avec un composé candidat ; c. la détermination de l'expression d'un ou plusieurs gènes choisis parmi le groupe des gènes comprenant l'une des séquences SEQ ID NO: 1- 116 ou des gènes homologues chez l'homme ou chez un animal d'intérêt correspondant; d. la sélection d'un composé capable de diminuer ou augmenter le niveau d'expression d'un ou de plusieurs des gènes définis à l'étape c).
Dans un mode de mise en œuvre particulier, les gènes dont l'expression est déterminée à l'étape c) sont choisies dans le groupe constitué des gènes définis dans le tableau 2 ou des gènes homologues des précédents chez l'homme ou chez un animal d'intérêt.
Dans un autre mode de mise en œuvre, le composé sélectionné est capable de diminuer le niveau d'expression d'un ou de plusieurs ARN choisi(s) dans un groupe constitué des ARN contenant une séquence correspondant à l'une des séquences SEQ ID NO :1-51 et 64-92 et/ou capable d'augmenter le niveau d'expression d'un ou plusieurs ARN choisi(s) dans le groupe constitué des ARN contenant une séquence correspondant à l'une des séquences SEQ ID NO :52-63 et 93-116.
Dans un mode de réalisation spécifique du procédé décrit ci-dessus, les cellules infectées sont des cellules GT-1 (Schâtzl et al., voir supra).
L'invention porte également sur une méthode de sélection d'un composé apte à ralentir, stopper ou empêcher le développement d'une ESST, comprenant a. l'administration d'un composé candidat à un modèle animal infecté par un ATNC ; b. le prélèvement de cellules potentiellement infectées ; c. la détermination de l'expression d'un ou plusieurs gènes choisis parmi le groupe des gènes comprenant l'une des séquences SEQ ID NO: 1- 116 ou des gènes homologues correspondant chez l'homme ou chez un animal d'intérêt; et, d. la sélection d'un composé capable de diminuer ou augmenter le niveau d'expression d'un ou de plusieurs des gènes définis à l'étape c).
Dans un mode de mise en œuvre particulier, les gènes dont l'expression est déterminée à l'étape c) sont choisies dans le groupe constitué des gènes définis dans le tableau 2 ou des gènes homologues des précédents chez l'homme ou chez un animal d'intérêt.
Dans un autre mode de mise en œuvre, le composé sélectionné à l'étape c) est capable de diminuer le niveau d'expression d'un ou de plusieurs ARN
choisi(s) dans le groupe constitué des ARN contenant une séquence correspondant à l'une des séquences SEQ ID NO: 1-51 et 64-92 et/ou capable d'augmenter le niveau d'expression d'un ou plusieurs ARN choisi(s) dans le groupe constitué des ARN contenant une séquence correspondant à l'une des séquences SEQ ID NO: 52-63 et 93-116.
Dans le cadre du procédé de sélection de composés selon l'invention, les cellules choisies peuvent être obtenues à partir de tissus d'animaux jnfectés. Les cellules potentiellement infectées prélevées à l'étape b. sont de préférence prélevés du cerveau ou de la rate. Dans un autre mode de mise en œuvre, les cellules sont prélevées du sang ou des tissus lymphoïdes. Il peut en particulier s'agir de cellules dendritiques, de populations de macrophages et/ou de lymphocytes B.
Les exemples et figures ci-après illustrent, sans limiter la portée de l'invention, certains modes de réalisation spécifiques.
LEGENDES DES FIGURES
La figure 1 illustre l'effet du sulfate de dextran 500 sur la réversion de l'état pathologique de la protéine PrP résistant exprimées par les cellules GT1 , à un état normal, sensible aux proteases.
La figure 2 est un diagramme illustrant les étapes de la méthode RDA de la préparation des ADN tester et driver à la première hybridation soustractive.
La figure 3 est un diagramme illustrant les étapes de la méthode RDA de l'hybridation soustractive à la première amplification sélective.
La figure 4 est un diagramme illustrant les étapes de la méthode RDA de la première amplification sélective au clonage et à l'analyse des produits d'amplification.
La figure 5 est un gel d'agarose représentant la séparation de produits d'amplification issus de la 4ème soustraction de la RDA.
La figure 6 montre les résultats des RT-PCR révélant les niveaux d'expression de certains gènes identifiés par le procédé de l'invention dans les cellules GT-1 infectées ou non infectées par la PrP.
Les figures 7 et 8 sont des graphes illustrant les différences d'expression déterminée par PCR en temps réel des gènes RBM-3 (figure
7) et aczonine (figure 8) respectivement dans des échantillons cérébraux et spéniques de souris infectées et non infectées. Le gène constitutif codant la GAPDH dont la séquence d'ADNc peut être amplifié à l'aide du couple d'amorces 117- 118 est utilisé comme gène contrôle.
EXEMPLES
Mise en évidence de la réversion du phénotype pathologique de la PrP en présence du sulfate de dextran 500
Les cellules non infectées GT1.7 ou infectées avec la souche Chandier, GT K* ont été cultivées en présence de 10 μg/ml de sulfate de dextran 500 pendant 4 jours consécutifs, espacées d'un passage cellulaire. Après 11 jours de culture, les protéines et les ARN totaux sont extraits après lyse cellulaire. Le lysat protéique total subit un traitement à la protéinase K (2 μg de PK pour 500 μg de protéine) 1 heure à 37°C. La présence de la PrPres est ensuite analysée en Western Blot à l'aide d'un anticorps spécifique. Les résultats présentés à la figure 1 montrent que les extraits protéiques correspondant aux cellules non traitées au sulfate de dextran 500 contiennent une forme protéique résistante aux proteases, caractéristique de la protéine prion pathologique. En revanche, les extraits protéiques correspondant aux cellules traitées avec 10 μg/ml de sulfate de dextran 500 ne contiennent plus de traces visibles de la présence de protéine prion pathologique. Ces résultats sont conformes à d'autres résultats obtenus avec des substances aptes à inverser le phénotype pathologique des protéines prions.
Identification de séquences d'acides nucléiques dont le niveau d'expression anormal est corrélé à la présence d'une forme pathologique de la protéine prion
1. Matériels
1.1 Les cellules utilisées :
6 flasques de 175 cm2 ont été préparées contenant les cellules non infectées GT1.7.
9 flasques de 175 cm2 ont été préparées contenant les cellules infectées avec la souche Chandier, GT K* (tremblante expérimentale de la souris).
1.2 Les amorces utilisées :
R Dpn 24 : 5'-AGC ACT CTC GAG CCT CTC ACC GCA-3' (62 μM, 0,5μg/μL) (SEQ ID NO: 191)
R Dpn 12 : 5'-GAT CTG CGG TGA-3' (62 μM, 0,25μg/μL) (SEQ ID NO: 192)
J Dpn 24 : 5'-AGC GAC GTC GAC TAT CCA TGA ACA-3' (62 μM, 0,5μg/μL) (SEQ ID NO: 193)
J Dpn 12 : 5'-GAT CTG TTC ATG-3' (62 μM, 0,25μg/μL) (SEQ ID NO: 194) N Dpn 24 : 5'-AGC CAA CTG TGC TAT CCG AGG GAA-3' (62 μM, 0,5μg/μL)
(SEQ ID NO: 195)
N Dpn 12 : 5'-GAT CTT CGC TCG-3' (62 μM, 0,25μg/μL) (SEQ ID NO: 196)
1.3 Les enzymes utilisées :
Taq DNA polymerase : Taq Qbiogene 15 U/μL (ref #EPT QC200) Dpnll : New England Biolabs 10U/μL (ref # R0543L)
T4 ligase: New England Biolabs 400 U/μL (ref #M0202L)
1.4 Kits
Universal Riboclone cDNA Synthesis System : Promega (ref#C4360)
RNeasy midi kit: Qiagen (ref#75144) Oligotex direct mRNA mni kit: Qiagen (ref#72022)
Quiaquick PCR purification kit: Qiagen (ref#28106)
Qiaprep spin miniprep kit: Qiagen (ref#27106)
Qiaexll gel extraction kit: Qiagen (ref#20021)
MessageClean Kit: Genhunter Corporation (ref#M601) TOPO-TA pCR-4 cloning kit: Invitrogen (ref#K458040)
2. Mise en œuyre de la méthode RDA pour l'identification de séquences différentiellement exprimées
2.1 Obtention de deux sous-populations d'acides nucléiques représentatives de deux transcriptomes Les ARN totaux issus de 6 flasques de 175 cm2 de culture de cellules de souris GT1.7 (cellules non infectées) (Schatzl et al., voir supra) et de 9 flasques de 175 cm2 de culture de cellules de souris GT K* (cellules infectées avec la souche Chandier, tremblante expérimentale de la souris) ont été extraits à l'aide du kit Rneasy columns commercialisé par QIAGEN. Chaque extrait d'ARN a été traité à la DNase (Geneclean, GENE
HUNTER), puis les ARN ont été purifiés sur colonne.
Afin d'obtenir un échantillon d'ARN messager séparé des ARN de transferts et des ARN ribosomaux, une partie des échantillons d'ARN totaux a été purifiée à l'aide du Kit Oligotex (QIAGEN). Quatre microgrammes d'ARN totaux ou messagers purifiés ont ensuite été rétrotranscrits à l'aide du kit Universal Riboclone cDNA synthesis PROMEGA puis purifiés sur colonne PCR (QIAGEN).
Les quatre populations d'ADNc ainsi obtenues (une population issue d'extrait d'ARN totaux de cellules non infectées, une population issue d'extrait d'ARN totaux de cellules infectées, une population issue d'ARN messagers de cellules infectées et une population issue d'ARN messagers de cellules non infectées) ont ensuite été incubées en présence de l'enzyme de restriction Dpπll, puis à nouveau purifiées sur colonne PCR (QIAGEN). Les adaptateurs R12 et R24 sont ligaturés sur les produits de digestion
Dpnïï issus des ADNc dérivés des cellules infectées et non-infectées. On procède ensuite pour chacune des populations à une première amplification de 20 cycles dans des conditions standard avec l'amorce R24
comme représentée à la figure 2 (RDA, étape 1). Après purification sur colonne PCR, les adaptateurs sont libérés par digestion Dpnll.
On obtient ainsi deux sous-populations représentatives des transcriptomes de cellules infectées et de cellules non-infectées.
2.2 Les étapes d'hybridation soustractive et d'amplification sélective
La population dite « tester » est ensuite ligaturée avec les adaptateurs J12 et J24, spécifiques des sites de restriction Dpnïï. Environ 0,5 μg (1/10 en quantité finale) d'ADNc « tester » est mélangé avec 5 μg (9/10 en quantité finale) d'ADNc « driver » pour une première hybridation soustractive à l'aide des adaptateurs J.
Les ratios d'ADNc tester/ADNc driver sont de l'ordre de 1:100, 1:5000 et 1 :25000 pour les deuxième, troisième et quatrième hybridations soustractives.
Les différents produits de la première hybridation soustractive sont représentés à la figure 3. Une première amplification PCR est réalisée à l'aide des amorces J Dpnll 24 permettant une amplification exponentielle sélective des séquences double-brin uniques, résultat de l'hybridation de séquences de brins complémentaire de l'échantillon testeur. Les opérations d'hybridation soustractive et d'amplification sélective sont répétées pour l'enrichissement des séquences présentes uniquement dans l'échantillon testeur, l'ADN testeur étant lié à l'adaptateur de la série J pour la première amplification et la troisième amplification et à l'adaptateur de la série N pour la deuxième amplification et la quatrième amplification (voir figure 4).
Les produits issus de la quatrième amplification soustractive sont déposés sur gel d'agarose 4%. Les bandes apparentes sur gel, telles que montré à la figure 5, sont ensuite découpées et purifiées à l'aide du kit QIAGEN QIAexIl (Qiaexll gel extraction kit, ref#20021). Les fragments d'ADN purifiés sont ensuite clones et séquences.
Les séquences obtenues ont été comparées aux séquences disponibles dans les banques de données à l'aide du programme BLAST (NCBI).
L'expression différentielle des gènes identifiés a ensuite été confirmée par RT-PCR sur les cellules GT1-7 infectées et non-infectées et pour certains gènes sur les cellules GT1-7 infectées et les cellules GT1-7 infectées traitées au sulfate de dextran 500. La RT-PCR a été réalisée dans les conditions suivantes :
Les ARN ont été extraits selon un protocole identique à celui utilisé pour la mise en œuvre de la méthode RDA (décrit plus haut). Les conditions d'amplification sont les conditions standards : 30 à 35 cycles, 45 s de dénaturation à 94°C, 1 minute d'hybridation à 56°C et 45 s d'élongation à 72°C.
Les couples d'amorces utilisés pour l'amplification spécifique de chacun des gènes identifiés sont précisés dans le tableau 1.
Les produits PCR obtenus ont été semi-quantifiés sur gel d'agarose en se rapportant au gène GAPDH dont l'expression est constitutive. La figure 6 illustre les résultats obtenus avec les gènes codant la Gna14, la transgéline, l'astrotactine et la secretogranine II.
3. Résultats
116 clones ont été identifiés à l'issue de l'application de la méthode RDA aux cellules GT1-7 infectées ou non-infectées correspondant aux séquences SEQ ID NO: 1-116.
Parmi ces 116 clones, ont été identifiés 41 gènes connus et 1 fragment d'acide nucléique inconnu, sur-exprimés dans les cellules infectées, 28 gènes connus et 1 fragment d'acide nucléique inconnu, sous-exprimés dans les cellules infectées.
Le tableau 4 résume les principaux résultats obtenus, en particulier les noms des gènes identifiés, et la confirmation par RT-PCR de leur expression anormale dans les cellules infectées et/ou de la réversion de leur phénotype d'expression après traitement au sulfate de dextran 500.
La mise en œuvre de la méthode selon l'invention a permis en particulier d'identifier 28 gènes de séquences connues dont le niveau d'expression est diminué dans des cellules exprimant la forme pathologique de la PrP 41 gènes de séquences connues dont le niveau d'expression est augmenté dans des cellules exprimant la forme pathologique de la PrP.
TABLEAU 4
Gènes sur-exprimés dans les cellules infectées
Gènes sous-exprimés dans les cellules infectées
(1) m = RDA sur ARN messagers T = RDA sur ARN total
(2) OUI = expression différentielle confirmée par RT-PCR NC = n'a pas encore été testé
4. Détermination du niveau d'expression in vivo des séquences identifiées par RDA
Modèles animaux :
Six lot de souris C57 BI6/N femelles âgées de 6 semaines sont constitués à raison de 12 animaux par cage .
Trois lots d'animaux sont infectés par voie intra-cérébrale avec 20μl d'un inoculum à 1 %(p/v) préparé, soit à partir de cerveau de souris saine (souris contrôle), soit à partir de cerveau de souris infectée par la souche 6PB1 (souche BSE adaptée à la souris), soit à partir de cerveau de souris infectée par la souche C506M3 (souche de tremblante adaptée à la souris).
Trois lots d'animaux sont infectés par voie intra-péritonéale avec 100μl d'un inoculum à 1 %(p/v) préparé comme décrit ce dessus.
Les animaux infectés par voie intra-cérébrale sont sacrifiés soit 90 jours, soit 150 jours après inoculation, soit en phase terminale de la maladie. Les animaux infectés par voie intra-péritonéale sont sacrifiés soit 6 jours, soit 50 jours, soit 250 jours après inoculation.
Matériels : kit Rneasy columns (QIAGEN, # 75144)
DNase (RNase Free DNase set, QIAGEN, # 79254) Transcriptase inverse :(Superscipt™ Il 200U/ml, # 18064-014)
Amorces aléatoires :(Random Primers, INVITROGEN, 3mg/ml, # 48190-
011)
Oligo dT : (oligo(dT)12-18 Primer, INVITROGEN, 0,5mg/ml, # 18418-012)
Supermix : (BIORAD, IQ™ SYBER R Green Supermix, # 170-8882) ICycler IQ BIORAD, # 582 BR 8741.
Prélèvements et purification des ARN :
Les ARN sont extraits à partir des organes (cerveaux et rates) prélevés immédiatement après sacrifice des animaux et selon le protocole préconisé dans le kit Rneasy columns. L'ensemble des échantillons d'ARN subit un traitement Dnase avant élution de la colonne de purification.
Obtention du cDNA et amplification par PCR :
Les ADNc de chaque échantillon sont obtenus par transcription inverse de 10μg d'ARN purifié à partir d'un mélange d'amorces aléatoires et d'amorces oligo dT à raison de 0,5μg de primer par microgramme d'ARN et selon le protocole préconisé par le fournisseur.
L'expression différentielle des séquences identifiées par RDA est confirmée par amplification d'ADNc par PCR en temps réel sur chaque échantillon. Le mélange réactionnel d'amplification, de 25μl par échantillon, comprend 20ng d'ADNc, 6,25pmoles de chacune des amorces utilisées pour amplifier. le gène d'intérêt, 12,5 μl de superMix comprenant la T.ap DNA polymérase, les dNTPs ainsi que le marqueur fluorescent SYBERGreen. Ces expériences sont pratiquées sur le thermocycleur ICycler IQ (Bio-Rad) selon le protocole d'amplification suivant : Cycle 1 : 95°C, 1 min (dénaturation) Cycle 2 (répété 40 fois) :
Etape 1 : 95°C, 15 sec (dénaturation)
Etape 2 : 60°C, 1 min (hybridation/élongation et mesure de la fluorescence) Cycle 3 (répété 80 fois) : 55°C à 90°C, 10 sec (courbe de fusion)
Quantification et analyse de l'amplification en temps réel :
L'analyse en temps réel s'effectue, au cours de l'étape d'élongation de chaque cycle de la PCR, par la mesure de fluorescence réémise, après
excitation à 488 nm, par l'incorporation de SYBERgreen intercalé dans le double brin d'ADN. Cette fluorescence est proportionnelle à la quantité d'ADN néosynthétisée à chaque cycle de l'amplification par PCR.
Les différences de niveau d'expression sont établies à partir des différences de mesures de CT (Cycle Threshold : cycle de PCR permettant d'atteindre le seuil de fluorescence arbitrairement imposée dans la phase linéaire d'amplification). Ces différences de CT sont normalisées en les Fapportant aux mesures de CT d'un gène de référence non soumis à régulation transcriptionnelle (dans cet exemple, les gènes codant la GAPDH ou le facteur TFIId sont utilisées comme gène de référence).
Résultats et discussion:
Une récente publication (Yoo et al, 2002) a confirmé la sur-expression protéique de la protéine disulfide isomérase dans le cerveau de patient atteint de la maladie de Creutzfeldt-Jakob, dont une expression différentielle a été identifiée par la méthode de l'invention.
Les expressions différentielles observées dans des modèles cellulaires chroniquement infectées par les ATNC ont également vérifiées lors d'infections in vivo, pour certains des gènes identifiés. Une étude cinétique standardisée d'infection de modèles murins à l'aide de différentes souches d'ATNC (BSE et tremblante) a ainsi été réalisée.
Les résultats concernant L'analyse par PCR en temps réel de l'expression dans des souris infectées ou non infectées sont présentés pour deux gènes isolés selon la méthode de l'invention dans les figures 7 et 8.
Les résultats obtenus indiquent cependant que les profils d'expression sont variables en fonction de l'organe et/ou de la souche d'agent transmissible non conventionnel (ATNC) utilisée pour l'inoculation.
En vue d'un diagnostic sensible et spécifique d'une infection, il est clair que le choix des groupes de gènes dont l'expression différentielle sera recherchée sera établi en fonction de l'origine de l'échantillon biologique analysé.
A titre d'exemple, les groupes de gènes présentés dans le tableau 5 suivant sont plus particulièrement intéressants dans le cadre d'un diagnostic à partir d'un échantillon de tissus de la rate et du cerveau respectivement.
Tableau 5 :
Dans la mesure où les résultats obtenus montrent que plusieurs familles de gènes sans rapport fonctionnel ou structural entre elles ont leur expression modifiée dans des cellules infectées par rapport à des cellules saines, l'utilisation de puces à ADN permettant de déterminer l'expression de nombreux gènes en parallèle semble plus particulièrement avantageuse dans le cadre de la mise en œuvre d'une méthode de détermination de la
présence d'un ATNC dans un échantillon biologique selon le procédé de l'invention.
A titre d'exemples, une puce à ADN pour déterminer la présence d'un ATNC dans un échantillon biologique extrait de cellules de la rate, comprend des sondes nucléotidiques spécifiques de chacun des gènes suivants : SH2-containing inositol phosphatase, Aczonine, Hcn-1 , Ser/thr protein phosphatase type 1a, RBM-3.
Une puce à ADN pour déterminer la présence d'un ATNC dans un échantillon biologique extrait de cellules de cerveau, peut comprendre par exemple des sondes nucléotidiques spécifiques de chacun des gènes suivants : Secretogranine, ATP synthase, CAG repeat, stathmin, RBM-3
Les séquences de ces sondes nucléotidiques étant choisies à partir des séquences génomiques disponibles dans les bases de données sur internet de l'organisme duquel provient l'échantillon biologique analysé, par exemple de l'homme.