WO2001047981A1

WO2001047981A1 - SEQUENCES NUCLEOTIDIQUES CODANT POUR UN POLYPEPTIDE CAPABLE D'INTERAGIR AVEC DES PROTEINES DES FAMILLES p300/CBP ET Rb

Info

Publication number: WO2001047981A1
Application number: PCT/FR2000/003677
Authority: WO
Inventors: Nazanine Modjtahedi; Laurent Cavarec
Original assignee: Institut Gustave Roussy; Centre National De La Recherche Scientifique
Priority date: 1999-12-23
Filing date: 2000-12-22
Publication date: 2001-07-05
Also published as: FR2802944A1; AU2858701A; FR2802944B1

Abstract

L'invention a pour objet, des protéines cellulaires susceptibles de constituer des partenaires capables d'interagir avec des protéines participant au contrôle de la prolifération cellulaire en particulier des partenaires des protéines p300/CBP et Rb. L'invention a aussi pour objet des séquences nucléotidiques codant pour ces protéines.

Description

SEQUENCES NUCLEOTIDIQUES CODANT POUR UN POLYPEPTIDE CAPABLE D'INTERAGIR AVEC DES PROTEINES DES FAMILLES p300/CBP ET Rb

La prolifération cellulaire est une procédure complexe qui est positivement et négativement contrôlée par l'activité d'un certain nombre de gènes cellulaires. Parmi ceux-là, les produits des gènes p300/CBP et Rb, qui sont des régulateurs de la machinerie transcriptionnelle de la cellule interviennent au niveau du contrôle de la prolifération et du cycle cellulaire. Ces polypeptides jouent un rôle tellement important que certains virus ont développé des mécanismes qui leur permettent de s'associer aux produits de ces gènes et de les inactiver. Par exemple, la protéine E1A des adénovirus est capable de se complexer et d' inactiver aussi bien les membres de la famille p300/CBP que ceux de la famille Rb. A la lumière de cette donnée, les inventeurs de la présente demande se sont posés la question de savoir s'il pouvait exister, dans la cellule normale, un ou plusieurs polypeptides cellulaires qui, comme IΕ1A virale, pourraient cibler et moduler l'activité de p300/CBP et Rb. L'hypothèse a donc été émise, que parmi les protéines cellulaires recherchées, pouvait également se trouver l'activité « EIA cellulaire » décrite dans la littérature.

La recherche d'un ou plusieurs partenaire(s) susceptible(s) d' interagir avec des protéines participant au contrôle de la prolifération cellulaire, revêt une importance particulière non seulement dans l'étude du rôle des protéines p300/CBP et Rb dans le contrôle de la prolifération cellulaire mais également dans le domaine de vectorologie adénovirale.

L'invention a pour objet de telles protéines (encore désignées polypeptides qui, au vu des résultats obtenus par les Inventeurs, présentés ci-après, ont les caractéristiques d'un nouveau partenaire potentiel de p300/CBP et de Rb. Ces résultats obtenus semblent aussi indiquer que p300/CBP et Rb peuvent également recruter une nouvelle activité enzymatique qui cette fois-ci pourrait modifier la conformation des polypeptides présents dans le complexe. Les protéines p300 et CBP sont des protéines nucléaires codées par des gènes différents (Chrivia, J.C, et al Nature, 365,855-859 (1993) ; Eckner, R. et al, Gènes & Dev. 8, 869-884 (1994) ; Arany, Z. Sellers, W., Livingston, D.M. & Eckner, R. Cell 77, 799-800 (1994)). CBP a été initialement isolé grâce au recrutement de son produit par le facteur de transcription CREB phosphorylé (Chrivia, J.C, et al Nature, 365,855-859 (1993)). En effet, à la suite de l'augmentation de la concentration de l'AMP cyclique dans la cellule, la protéine kinase A (PKA) est activée et phosphorylé le facteur de transcription CREB qui à son tour stimule la transcription de gènes qui portent un élément de réponse à l'AMP cyclique (CRE) dans leur région promotrice. Les expériences de transfection et de microinjection d'anticorps anti-CBP montrent une très bonne corrélation entre le recrutement de CBP par la protéine CREB phosphorylée et la stimulation de la transcription de promoteurs qui répondent à la voie AMP cyclique (Kwok, R.P.S., et al, Nature 370,223-226 (1994) ; Arias, J., et al., Nature, 370,226- 229 (1994)).

Des expériences de transfection et de microinjection d'anticorps anti-CBP avaient suggéré que les protéines de la famille p300/CBP pouvaient être impliquées dans la régulation de la transcription de gènes qui répondent à d'autres voies de signalisation (Arias, J., et al., Nature, 370,226-229 (1994)). A la suite de cette première observation, de nombreux groupes ont concentré leurs efforts sur l'étude d'une telle possibilité et l'ensemble des travaux publiés montre qu'effectivement, en plus de la voie AMP cyclique, les protéines de la famille p300/CBP coactivent la transcription en réponse à des voies de signalisation différentes comme celle du sérum (Janknecht, R. & Nordheim, A. Oncogene 12,1961-1969 (1996)), du complexe AP1 (Bannister, A.J. & Kouzarides, T. EMBO Journal, 14, 4758-4762 (1995a) ; Bannister, A.J., Oehler, T. Wilhelm, D., Angel, P. & Kouzarides, T. Oncogene 11 , 2509-2514 (1995b), des facteurs de croissance (Nakajima, T. ; et al. Cell, 86,465-474 (1996), des récepteurs aux hormones nucléaires (Yao, T.-P., Ku, G., Zhou, N., Scully, R. & Livingston, D.M., Proceedings of the National Academy of Sciences 93, 10626-10631 (1996) ; Kamei, Y., et al. Cell, 85, 403-414 (1996) ; Smith, CL, Onate, S.A., Tsai, M.J. & O'Malley, B.W. Proceedings of the National Academy of Sciences 93, 8884-8888 (1996) ; Chakravarti, D., et al. Nature 383, 99-103 (1996)), de l'infection virale (Merika, M., Williams, A.J., Chen, G., Collins, T. & Thanos, D. Molecular Cell 1 , 277-287 (1998), de la différentiation musculaire MyoD-dépendante (Yuan, W., Condorelli, G., Caruso, M., Felsani, A. & Giordano, A. The Journal of Biological Chemistry 271 ,9009-9013 (1996) ; Eckner, R., Yao, T.-P., OIdread, E. & Livingston, D.M. gènes & Development 10, 2478-2490 (1996a) ; Puri, P.L., et al. EMBO Journal 16,369-383 (1997a).

Les résultats de ces travaux permettent de tirer plusieurs conclusions qui ont leur importance dans la compréhension du rôle de ces protéines dans le contrôle de la prolifération cellulaire. Premièrement, on observe que l'utilisation d'un coactivateur commun permet à ces différentes voies de signalisation de communiquer et de dialoguer (Kamei, Y., et al. Cell, 85, 403-414 (1996). Par exemple, les récepteurs aux hormones nucléaires stimulent, d'une manière hormono-dépendante, la transcription de gènes qui portent un élément de réponse à ceux-ci. Cependant, ces mêmes récepteurs inhibent la transcription de gènes qui sont transactivés par le complexe AP1. Pour expliquer ce dialogue antagoniste entre les récepteurs aux hormones nucléaires et le complexe AP1 , les résultats des travaux actuels permettent d'invoquer la compétition pour des quantités limitantes du coactivateur commun p300/CBP. Cette possibilité est également fortement suggérée par l'observation de Petrij et al (Nature 376, 348-351 (1995)) qui établissent une corrélation entre la maladie de Rubinstein Taybi et l'hémizygotie du gène CBP. Ils suggèrent que cette maladie héréditaire, dont les caractéristiques sont des anomalies physiques et mentales ainsi qu'une prédisposition accrue au cancer, serait due à une « haploinsuffisance » de la protéine CBP.

Deuxièmement, les coactivateurs p300/CBP ne sont pas de simples ponts physiques établissant une communication entre les facteurs de transcription et la machinerie basale de la transcription. Ces polypeptides régulent activement la transcription en recrutant des polypeptides qui ont des activités enzymatiques. Ces enzymes permettent la restructuration et le remodelage local de la chromatine. Entre autres parmi les enzymes recrutées par p300/CBP on peut citer la RNA hélicase A (Nakajima, T., et al. Cell, ; 90, 1107-1112 (1997a), ainsi que les HAT (histones acétyltransférases) P/CAF (Yang, X.-J., Ogryzko, V.V., Nishikawa, J.-i, Howard, B.H. & Nakatani, Y. Nature 382, 319-324 (1996)), Srd (Kamei, Y., et al. Cell, 85, 403-414 (1996) ; Spencer, T.E., et al., Nature 389,194-198 (1997)) ou bien ACTR (Chen, H., et al. Cell 90, 569-580 (1997)).

L'importance de ces activités enzymatiques est également soulignée par la démonstration de l'association d'un type particulier de leucémie aigϋe avec une translocation chromosomique qui entraîne la fusion de la protéine CBP avec la protéine MOZ qui est également une histone acétyltransférase (Borrow, J., et al Nature Genetics 14,3341 (1996)). Ces observations suggèrent que la synthèse d'une telle protéine de fusion pourrait avoir pour conséquence un criblage aberrant du substrat « acétilable » suivi de la dérégulation transcriptionnelle de gènes qui contrôlent la prolifération cellulaire.

Les protéines de la famille Rb (Rb, p107, p130) sont également des régulateurs de transcription. Le membre le plus connu de la famille Rb est le produit du gène de la susceptibilité au rétinoblastome (Rb) et le rôle suppresseur de tumeur de ce dernier est aujourd'hui bien établi (Wang et al, Ad. In Cancer Res. 64, 25-85 (1994)).

Ces régulateurs de transcription contrôlent essentiellement l'activité des facteurs de transcription E2F (Moran E. Curr. Opin. Genêt Dev. 3, 63-70 (1993)). L'activité principale de Rb est la régulation négative des promoteurs des gènes qui dépendent de E2F. Récemment, il a été montré que Rb s'associe non seulement avec E2F mais également avec l'histone déacétylase HDAC1 (Brehm et al., Nature ,391 , 597-601 (1998) ; Magnani-Jaulin L. et al. Nature ,391 , 601-605 (1998)). Ces données suggèrent que l'effet répresseur de Rb sur les promoteurs E2F-dépendants pourrait être médié par l'activité Histone déacétylase de HDAC1 qui permet le remodelage de la chromatine. Indépendamment de leur interaction avec E2F et HDAC1 , les membres de la famille Rb sont probablement impliqués dans le contrôle de l'activité d'autres protéines cellulaires. L'interaction spécifique de Rb avec un certain nombre de protéines, parmi lesquelles on trouve des facteurs de transcription , a été décrite (Wang et al. Ad. In Cancer Res. 64, 25-85 (1994)). L'oncoproteine mdm2 est également capable de s'associer avec Rb (Xiao et al. Nature, 375, 694-698 (1995). L'importance de ces interactions physiques et fonctionnelles dans le rôle cellulaire de Rb reste encore à être défini.

Les protéines p300/CBP et Rb contrôlent la progression du cycle cellulaire, en particulier au niveau du passage des phases G1 à S d'une part, et G2 à M d'autre part (G1/S et G2/M). Les membres de la famille Rb contrôlent le passage G1/S via les facteurs de transcription E2F (Moran et al, Curr.Opin. Devel. 3, 63-70 (1993) (Helin et al, Curr. Opin. Genêt. Dev. 8, 28-35 (1998)). En effet, dans une cellule normale, ces protéines s'associent et séquestrent les facteurs de transcription E2F dont l'activité est nécessaire à la stimulation de l'expression d'un certain nombre de gènes nécessaires à l'induction de la phase S du cycle.

Le contrôle du passage G1/S du cycle par les membres de la famille p300/CBP se fait très probablement via le produit du gène suppresseur p53 (Levine et al, 351 , 453-456 (1991 ) (Lill et al, Nature 387, 823-827 (1997b)). En effet, les protéines de la famille p300/CBP coactivent p53 dans sa fonction de transactivation séquence-spécifique (Levine et al, 351 , 453-456 (1991 ) (Levine et al, Cell 88, 323-331 (1997)).

D'une manière simple et schématique le cycle cellulaire peut être présenté comme un processus contrôlé essentiellement par deux familles de régulateurs de transcription, Rb et p300/CBP, qui agissent en parallèle. Les données de la littérature montrent que E1A cible et inhibe les fonctions des protéines p300/CBP et Rb dans le contrôle du cycle cellulaire.

Dans le cadre de l'étude fonctionnelle des protéines des familles p300/CBP et Rb dans le contrôle du cycle cellulaire, prenant en compte les facteurs cellulaires et extra-cellulaires, notamment adénoviraux, susceptibles d'interférer avec ce cycle, les inventeurs ont mis en évidence un nouveau partenaire polypeptidique cellulaire, des susdites protéines.

L'expression « partenaire polypeptidique » englobe dans le cadre de la présente invention, des polypeptides (quelle que soit leur taille, comprenant des peptides, des protéines ou des dérivés notamment des phosphoproteines, des formes acétylées des protéines, des glycoprotéines...) susceptibles d'interagir avec les protéines ciblées, en l'occurrence celles des familles p300/CBP et Rb.

La présente invention décrit donc l'existence et la caractérisation d'un nouveau polypeptide cellulaire, qui est capable de cibler aussi bien les protéines Rb que les protéines p300/CBP.

Les inventeurs ont mis au point une stratégie qui leur a permis d'isoler un clone d'ADNc (aussi désigné dans la suite par cDNA), dont le produit d'expression est un partenaire potentiel de protéines de la famille p300/CBP et des protéines de la famille Rb. La caractérisation moléculaire de cette protéine ouvre un champ d'applications non seulement dans le domaine de la pharmacologie mais également dans le domaine de la thérapie génique.

Les inventeurs ont ainsi isolé et caractérisé, chez la drosophile, une séquence nucléotidique codant pour un polypeptide capable d'interagir avec des protéines de la famille p300/CBP et de la famille Rb (ci-après désignées parfois protéines p300/CBP et protéines Rb). Ce polypeptide est ainsi capable d'interagir avec une protéine dCBP mise en évidence chez la drosophile et qui appartient à la famille des protéines p300/CBP.

La séquence nucléotidique selon l'invention, a été identifiée au moyen des sondes de protéines de fusion préparées à partir de dCBP et à partir de Rb. Des protéines de fusion particulières sont décrites en détail dans les exemples qui suivent et comprennent les polypeptides de fusion exprimés par les plasmides PGEX2TKL31.3, et pGEX2TKL31.3 MN, pGEX2TKRb.

Les expressions « séquence nucléotidique » ou « séquence de nucléotides » signifient dans le cadre de la présente demande, tout enchaînement de nucléotides, sans restriction de taille a priori, sauf lorsque cela est indiqué expressément ou résulte de critères fonctionnels précisés. Ces expressions englobent, quel que soit leur mode de préparation (extraction, clonage ou synthèse enzymatique ou chimique) à la fois des séquences d'ADN, y compris d'ARN, notamment d'ARNm. Ces expressions peuvent s'appliquer à des séquences sens ou antisens.

Selon un premier mode de réalisation de l'invention, la séquence de nucléotides code pour un polypeptide capable d'interagir avec des protéines de la famille p300/CBP et de la famille Rb. La susdite capacité d'interaction avec des protéines de la famille p300/CBP est observée par la capacité du polypeptide, de s'associer in vitro dans une réaction de type protéine-protéine, avec un polypeptide de fusion comprenant l'enchaînement d'acides aminés compris entre les résidus 2366 et 2540 du polypeptide dCBP, représenté à la Figure 10 Akimura et al (1997, Nature, 386,735-738), exprimé par PGEX2TKL31.3MN.

La capacité d'interaction avec les protéines de la famille Rb, peut être testée par la capacité du polypeptide codé par la séquence nucléotidique de l'invention de s'associer in vitro avec la protéine de fusion exprimée par le plasmide pGEX2TKRb (379-792).

Dans le cadre de la définition donnée ci-dessus de la séquence de nucléotides de l'invention, la mention de la capacité du polypeptide codé par la susdite séquence, d'interagir avec la sonde polypeptidique issue de dCBP, portée par pGEX2TKL31.3MN, permet de sélectionner des séquences de nucléotides qui présentent un domaine d'interaction avec les protéines des familles p300/CBP et de la famille Rb à la fois.

On observera que cette interaction met en cause un domaine de la séquence nucléotidique de l'invention, qui présente au niveau polypeptidique, une similitude structurale avec le domaine de la protéine E1A adénovirale qui interagit avec la région CH3 des protéines humaines de la famille p300/CBP.

Les membres de la famille p300/CBP possèdent 3 régions riches en résidus cystéines et histidines (CHi, CH₂ et CH₃). CH₃ est la plus C-terminale de ces 3 régions et correspond au domaine d'association à E1A, du polypeptide (Eckner et al (1994) Gènes & Dev. : 8, 869-884).

La similitude structurale du polypeptide codé par la séquence de l'invention, avec la protéine E1A adénovirale, pourrait signifier que dans le cadre de son interaction avec les protéines des familles p300/CBP et Rb, le polypeptide codé par la séquence nucléotidique de l'invention pourrait faire partie de l'activité E1A cellulaire décrite dans la littérature.

De façon générale, l'interaction recherchée dans le cadre de l'invention, du polypeptide caractérisé, partenaire des protéines des familles p300/CBP et Rb, peut être testée sur un quelconque des polypeptides de chacune de ces familles.

Une séquence de nucléotides selon l'invention est avantageusement une séquence d'ADN et en particulier d'ADN génomique ou de cDNA résultant de la transcription d'un ARNm. Il peut s'agir aussi d'une séquence d'ARN.

Cette séquence, et en particulier la séquence de cDNA identifiée chez la drosophile ainsi que le polypeptide correspondant, fournissent des moyens permettant l'accès à la protéine correspondante exprimée chez d'autres espèces animales, en particulier chez les mammifères, par exemple chez les rongeurs (souris, rat) ou chez l'homme à partir de cellules exprimant cette protéine.

Selon une autre définition de l'invention, une séquence nucléotidique est caractérisée en ce qu'elle présente, avantageusement en complément des propriétés précédemment décrites, la capacité de coder pour un polypeptide reconnu spécifiquement par un antisérum purifié comprenant des anticorps obtenus contre le polypeptide 613-627 contenu dans la séquence d'acides aminés représentée à la figure 3 et ayant l'enchaînement d'acides aminés suivant : QDNEYRNRYPLSPIR.

La spécificité de la reconnaissance entre l'antisérum ci-dessus défini et le produit d'expression de la séquence nucléotidique, peut être vérifiée en réalisant le test suivant : - on préincube le peptide correspondant à la séquence d'acides aminés QDNEYRNRYPLSPIR, avec un antisérum purifié comprenant des anticorps obtenus contre ledit peptide,

- on met en contact les anticorps de l'antisérum préincubé, avec un milieu comprenant des polypeptides dont on recherche la capacité à lier spécifiquement des anticorps dirigés contre le peptide QDNEYRNRYPLSPIR,

- on détecte l'absence ou la présence d'une réaction immunologique entre les susdits polypeptides testés et l'antisérum ayant subi l'étape de préincubation.

Lorsque le polypeptide testé a la capacité d'être reconnu par des anticorps dirigés contre le peptide QDNEYRNRYPLSPIR, il n'est plus reconnu dans une liaison immunologique avec l'antisérum ayant subi l'étape de préincubation avec le peptide QDNEYRNRYPLSPIR.

En l'absence de l'étape de préincubation ci-dessus définie, le polypeptide testé, s'il entre dans le cadre de l'invention, est reconnu par le susdit antisérum. Cette réaction peut être mise en œuvre à titre de réaction témoin.

Selon un mode de réalisation avantageux de l'invention, la séquence nucléotidique code pour un polypeptide comprenant 987 acides aminés, répondant à l'enchaînement d'acides aminés représenté à la figure 3, ou pour un polypeptide de 967 acides aminés compris dans l'enchaînement de la figure 3 et commençant avec le résidu 20.

Selon un autre mode de réalisation de l'invention, la séquence nucléotidique code pour un polypeptide variant, modifié par insertion, délétion ou substitution d'un ou plusieurs acides aminés dans l'un des susdits polypeptides.

Ce polypeptide variant peut être reconnu par un antisérum purifié comprenant des anticorps obtenus contre le peptide identifié précédemment par sa séquence. Ce polypeptide variant a la capacité d'interagir avec des protéines de la famille p300/CBP et de la famille Rb, qui ont un effet sur la régulation transcriptionnelle des cellules qui les expriment, ou encore peut présenter les deux caractéristiques ci-dessus. Il peut être dérivé d'une autre espèce animale notamment de mammifère, en particulier de l'homme.

Avantageusement, un polypeptide variant ainsi défini possède au moins la partie C-terminale du polypeptide de la figure 3, c'est à dire environ le tiers final de ce polypeptide, cette partie étant impliquée dans l'interaction entre ce polypeptide variant et des protéines de la famille p300/CBP et de la famille Rb.

La partie C-terminale de la protéine ci-dessus définie dans le cadre de l'invention, contient le domaine présentant une similitude de structure avec le domaine d'association de la protéine virale E1A. La caractérisation d'un partenaire commun à p300/CBP et Rb qui peut éventuellement rendre compte de l'activité « E1A cellulaire » revêt une importance particulière dans l'étude du rôle de ces polypeptides dans le contrôle du cycle cellulaire.

La capacité d'un polypeptide, codé par une séquence nucléotidique de l'invention, à interagir avec des protéines de la famille p300/CBP et de la famille Rb, peut être testée par le procédé suivant :

- on met en contact in vitro, le polypeptide testé avec d'une part, une protéine de fusion exprimée par pGEX2TKL31.3MN et d'autre part, une protéine de fusion exprimée par pGEX2TKRb (379-792), le cas échéant au cours de réactions distinctes,

- on observe une éventuelle association entre le produit d'expression de la séquence nucléotidique et les protéines de fusion testées, caractéristiques des protéines de la famille p300/CBP et des protéines de la famille Rb.

Un test pour la détection de l'association recherchée et de sa spécificité est décrit dans les exemples et son résultat est illustré à la Figure 9. La séquence de cDNA isolée et caractérisée chez la drosophile, codant pour un polypeptide partenaire des protéines p300/CBP et Rb, est représentée à la figure 2. Cette séquence de cDNA (appelée clone 532) contient les nucléotides du cadre ouvert de lecture (ORF) permettant d'exprimer un polypeptide de 987 acides aminés et un polypeptide de 967 acides aminés commençant par un codon (codant le résidu Méthionine) à la position 61 de la séquence de la figure 2. Ces polypeptides peuvent avoir une activité d'interaction avec des protéines telle que dCBP chez la drosophile appartenant à la famille p300/CBP et avec des protéines de la famille Rb. L'invention concerne en particulier une séquence d'ADNc comprise dans la séquence représentée à la figure 2 entre les codons ATG en position 61 (G) et TAA en position 2965.

L'invention concerne également la séquence d'ADN génomique correspondant au gène codant pour le polypeptide cellulaire de la drosophile dont il est question précédemment. Cette séquence génomique a une taille d'environ 6 kb, dans laquelle les différents domaines fonctionnels contenus dans les exons sont interrompus par des introns. Ce gène est représenté à la figure 1 et les différents domaines apparaissant sur la figure tels que chacun des exons ou des introns, ainsi que les séquences identifiées telles que celles des séquences utilisables comme amorces, entrent individuellement dans le cadre de l'invention.

La figure 1 comprend les séquences 1A et 1 B, la séquence 1B différant de la séquence 1A de façon ponctuelle au niveau des nucléotides 394, 479, 1723, 2819, 3100, 3159 (positions données par référence à la séquence 1A) -et lo séquence 1 B étant constituéG par uno partie (nucléotides 1-5202 du gène).

Ce gène est susceptible de subir un épissage alternatif, conduisant dès lors à plusieurs ARNm à partir desquels différents polypeptides pourraient être exprimés, incluant notamment un polypeptide dépourvu du domaine rotamase situé dans la partie N-terminale du polypeptide exprimé à partir du cDNA du clone 532.

La présente demande concerne également une séquence nucléotidique hybridant avec une séquence de nucléotides telle que définie précédemment. Les conditions d'hybridation sont aisément définies selon les techniques classiques, à partir de la sonde d'hybridation choisie.

Avantageusement, une telle séquence hybridant dans des conditions stringentes avec un ADN génomique ou un cDNA décrit ci-dessus code également pour un polypeptide capable d'interagir avec des protéines de la famille p300/CBP et des protéines de la famille Rb. Il peut s'agir d'une séquence ayant son origine dans des cellules humaines.

A cet égard, les inventeurs ont mis en évidence que des lignées cellulaires de type U2-OS provenant d'un ostéosarcome peuvent être utilisées pour isoler les séquences nucléotidiques de l'invention, d'origine humaine.

Entrent également dans le cadre de la présente invention, des fragments d'une séquence nucléotidique telle que définie précédemment. Un premier groupe de fragments comprend une séquence de nucléotides codant pour une séquence d'acides aminés dérivée d'un polypeptide cellulaire capable d'interagir avec des protéines de la famille p300/CBP et des protéines de la famille Rb, ladite séquence d'acides aminés comprenant au moins la partie C-terminale dudit polypeptide cellulaire.

De façon avantageuse, un fragment de séquence nucléotidique selon l'invention code pour un polypeptide capable d'interagir avec des protéines de la famille p300/CBP et des protéines de la famille Rb. Un tel fragment comprend avantageusement la partie C-terminale de la séquence du clone 532. Par exemple, il peut s'agir du fragment de la séquence comprenant la région présentant les signaux de localisation nucléaire. Un fragment particulier est par exemple celui qui code pour l'enchaînement d'acides aminés compris entre les résidus 800 et 987 de la séquence de la figure 3. Un autre fragment est celui qui code pour l'enchaînement d'acides aminés compris entre les résidus 900 et 987de la séquence représentée à la figure 3.

Selon un autre mode de réalisation particulier de l'invention, un fragment de séquence nucléotidique est caractérisé en ce qu'il contient 200 à 300 nucléotides contigus d'une séquence nucléotidique répondant à l'une au moins des définitions ci-dessus données.

Un tel fragment peut notamment être utilisé comme sonde pour la détection de variants des séquences nucléotidiques particulières de l'invention.

L'invention a aussi pour objet des séquences de nucléotides comprenant tout ou partie des éléments de régulation du gène codant pour un polypeptide de l'invention tel que défini précédemment. Une telle séquence de nucléotides peut être localisée dans la région 5' non codante du gène et isolée notamment au moyen d'une sonde comprenant les nucléotides 1 à 357 de la séquence représentée à la figure 1 (1A ou 1B).

L'invention vise également des vecteurs recombinants de clonage et/ou d'expression, comprenant une séquence nucléotidique selon l'invention, entrent également dans le cadre de l'invention, des cellules recombinantes, procaryotes ou eucaryotes, comprenant une séquence de nucléotides selon l'invention, le cas échéant portée par un vecteur tel que ci-dessus défini. Ces cellules sont avantageusement des bactéries, des cellules d'insectes ou de mammifères.

L'invention a également pour objet un polypeptide codé par une des séquences nucléotidiques répondant aux définitions précédentes.

Ce polypeptide a été caractérisé dans les pages qui précèdent par ses différentes propriétés.

De façon essentielle, ce polypeptide est caractérisé en ce qu'il est capable d'interagir avec des protéines de la famille p300/CBP et des protéines de la famille Rb.

Un polypeptide selon l'invention peut par ailleurs être caractérisé en ce qu'il est reconnu spécifiquement par un antisérum purifié comprenant des anticorps obtenus contre le peptide QDNEYRNRYPLSPIR contenu dans la séquence présentée à la figure 3.

Un polypeptide particulier selon l'invention est celui qui a été isolé chez la drosophile et répond à l'enchaînement d'acides aminés représenté à la figure 3.

Selon un mode de réalisation particulièrement avantageux, le polypeptide de l'invention est un polypeptide humain.

Un tel polypeptide exprimé dans les cellules humaines peut être obtenu à partir de cellules humaines. Alternativement, les polypeptides selon l'invention peuvent être fabriqués par tout moyen approprié et en particulier par voie recombinante ou par synthèse chimique. A titre d'exemple, un polypeptide cellulaire d'origine humaine, entrant dans le cadre de la définition de l'invention, peut être identifié par criblage d'une banque d'expression (de cDNA humain) préparée à partir de cellules humaines. La lignée cellulaire d' ostéosarcome U-2OS (catalogue ATCC n° HTB-96) peut par exemple être utilisée pour préparer une banque de cDNA selon les techniques connues dans la littérature. Une fois la banque d'expression obtenue, elle peut être criblée, par exemple au moyen d'un antisérum contenant des anticorps préparés contre le peptide QDNEYRNRYPLSPIR.

Les inventeurs ont observé la présence, dans les cellules de la lignée humaine U-2OS, de deux polypeptides dont l'un a un poids moléculaire observé après électrophorèse sur gel d'environ 180 kDa, et l'autre a un poids moléculaire d'environ 75 kDa. Ces deux polypeptides pourraient être différents du fait de la présence ou au contraire de l'absence d'un domaine rotamase, dans leur partie N- terminale.

Le polypeptide humain peut être détecté en utilisant l'antisérum comprenant des anticorps dirigés contre le peptide ci-dessus désigné.

L'invention concerne également des fragments d'un polypeptide tel que défini ci-dessus. Ces fragments ont par exemple la capacité d'interagir avec des protéines p300/CBP et avec des protéines de la famille Rb. Alternativement ou en complément de cette propriété, ces fragments comprennent un ou plusieurs domaines fonctionnels des polypeptides de l'invention, choisis parmi

- un domaine immunophiline comprenant de 100 à 300 acides aminés,

- un domaine défini par les acides aminés EVES (acides aminés 501 à 504 sur la figure 3)

- un domaine de similitude structurale avec la protéine virale E1A (acides aminés 880 à 980 sur la figure 3),

- un domaine de similitude avec la protéine cellulaire p53 (acides aminés 900 à 987 sur la figure 3),

- un domaine répété DSPX(K/R) (K/R) (acides aminés 650 à 800 sur la figure 3), - un domaine TTPPHWK (acides aminés 350 à 390 sur la figure 3),

- un ou plusieurs domaine(s) capable(s) d'interagir avec des protéines de la famille P300/CBP et des protéines de la famille Rb,

- un ou plusieurs domaines riches en acide aminé Serine et Arginine (SR) dispersés tout au long du polypeptide,

- un ou plusieurs domaines riches en acide aminé lysine (K) dispersés tout au long du polypeptide.

L'invention a également pour objet un antisérum purifié contenant des anticorps obtenus contre un polypeptide de l'invention. Un tel antisérum est, selon un mode de réalisation particulier de l'invention, d'origine polyclonale.

L'invention vise également des anticorps monoclonaux dirigés contre un polypeptide répondant aux définitions précédentes, et en particulier des anticorps monoclonaux dirigés contre les domaines fonctionnels de ce polypeptide.

L'invention a également pour objet un procédé pour détecter la capacité d'un polypeptide d'interagir avec l'activité de prolifération de cellules données, comprenant les étapes de :

- transfection de cellules exprimant des protéines de la famille p300/CBP et de la famille Rb, avec une séquence de nucléotides telle que décrite ci-dessus, dans des conditions permettant l'expression de cette séquence de nucléotides,

- détection d'une modification éventuelle de l'activité de prolifération des cellules transfectees.

Alternativement, selon un autre procédé de l'invention, les cellules transfectees selon l'étape précédente, sont des cellules qui n'expriment pas les protéines de la famille p300/CBP ni les protéines de la famille Rb.

L'invention a donc pour objet, un procédé pour détecter in vitro la sensibilité d'un polypeptide défini ci-dessus, à un composé Immunosupresseur, par exemple la cyclosporine, comprenant : - la mise en contact de cellules exprimant le polypeptide de l'invention et exprimant des protéines de la famille p300/CBP et de la famille Rb, avec un composé immunosupresseur,

- l'observation de l'activité de prolifération.

L'expression du polypeptide de l'invention peut être endogène dans les cellules testées ou apportée par transfection de ces cellules avec une séquence nucléotidique de l'invention.

Le cas échéant, l'interaction de polypeptide de l'invention, avec un composé immunosupresseur, fait intervenir un partenaire cellulaire supplémentaire, par exemple un facteur de transcription, notamment le facteur MYB. Ainsi, le procédé ci-dessus peut comporter l'expression du polypeptide de l'invention, dans des cellules exprimant des protéines de la famille p300/CBP et de la famille Rb, en présence d'un facteur de transcription tel que MYB, et en présence d'un composé immunosupresseur.

L'invention concerne aussi l'utilisation de polypeptides selon l'invention dans un procédé pour le criblage in vitro de composés immunosupresseurs ou non-immunosupresseurs capables d'interagir physiquement et/ou fonctionnellement, avantageusement de façon spécifique, avec le susdit polypeptide.

L'invention a aussi pour objet, l'utilisation du polypeptide précédemment défini, pour identifier sa capacité à interagir avec le polypeptide E1A viral. Cette utilisation peut être réalisée dans un test in vitro permettant d'observer une activité de compétition entre le polypeptide de l'invention et le polypeptide E1A cellulaire, mis en présence par exemple de protéines des familles p300/CBP et Rb.

Une autre application du polypeptide de l'invention peut être son utilisation dans la transformation cellulaire, par exemple par induction de la prolifération ou la différenciation cellulaire ou par interférence avec les processus de prolifération ou de différenciation cellulaire. Le cas échéant, la transformation peut résulter en la production de cellules malignes. La transformation peut être le résultat de l'expression du polypeptide sauvage ou peut résulter au contraire de l'expression d'un variant par exemple d'un polypeptide muté. Une de ces applications comprend, la transfection de cellules avec un ADN codant pour un polypeptide de l'invention, et l'observation de l'effet obtenu à la suite de l'expression du polypeptide de l'invention, sur la prolifération, la différenciation ou l'acquisition du caractère malin des cellules transfectees. Cette activité peut le cas échéant être testée en présence de composés actifs (tels que la protéine E1A virale, ou des composés capables d'altérer l'activité rotamase), sur la prolifération et/ou la différenciation, par exemple pour observer un éventuel effet de coopération ou au contraire de compétition, par exemple par remplacement ou par déplacement, avec le polypeptide de l'invention.

Légende des figures Figure 1A :séguence du gène de la drosophile, présentant plusieurs exons entre les nucléotides 358 et 5157. Ce gène code pour un polypeptide capable d'interagir avec des protéines de la famille p300/CBP et des protéines de la famille Rb, dont le résidu Méthionine trouvé à l'extrémité 5' du cDNA illustré à la figure 2 est codé par le codon ATG commençant au nucléotide 416, à l'intérieur de l'exon 1 et le résidu terminal est codé par le codon TAA en position 5010. Les positions des introns et des exons sont respectivement les suivantes :

Figure 1B :La figure 1 B est une variante de la séquence 1A, différant de la séquence 1A de façon ponctuelle au niveau des nucléotides 394, 479, 1723, 2819, 3100, 3159 (positions données par référence à la séquence 1A) et ne contenant pas de séquence du vecteur en position 3' terminale. Figure 2 : Séquence de cDNA transcrite à partir de l'ARNm du gène de la drosophile représenté à la figure 1 (1A ou 1B). Cette séquence de cDNA code pour un polypeptide de 967 acides aminés et contient en amont du codon ATG initiateur de la traduction, un enchaînement de nucléotides qui pourrait correspondre à un produit d'expression allongé à l'extrémité N-terminale, par rapport au produit d'expression identifié du cDNA de la figure 2. Un cDNA allongé en 5' coderait pour une forme variante du polypeptide de 967 acides aminés, cette forme variante comprenant au moins 987 acides aminés correspondant à l'ORF. Figure 3 :Séguence de 987 acides aminés du polypeptide codé par l'ORF contenu dans le cDNA du clone 532.

Cette séquence comprend également la séquence du polypeptide de 967 acides aminés, initiée par un résidu Méthionine en position 20.

Figure 4 : Représentation des domaines fonctionnels et des domaines de similitude structurale (désignés aussi par l'expression domaines d'homologie) avec la protéine E1A de l'adénovirus. Ces domaines sont identifiés dans la protéine de 987 acides aminés. Cette protéine contient 8 à 10 signaux de localisation nucléaire dans sa partie C-terminale. Il pourrait donc s'agir d'une protéine nucléaire. La similitude structurale avec E1A est également illustrée à la figure 6.

Figure 5 : Analyse de la structure secondaire de la protéine montrant les régions hydrophiles et hydrophobes de la séquence de 987 acides aminés. Figure 6 : Comparaison de la région C-terminale de la protéine 532, avec la région N-terminale de la protéine E1A de différents adénovirus. Cette comparaison montre la similitude structurale entre les deux régions comparées de la protéine de l'invention d'une part (encore appelée 532) et la protéine E1A de différents isolats d 'adénovirus. Par similitude structurale on entend dans le cadre de la présente demande, l'identité des résidus d'acides aminés dans la région comparée des deux polypeptides ou à défaut d'identité, leur parenté de structure, caractérisée par leur appartenance commune à des familles d'acides aminés définies telles que celles des acides aminés polaires, neutres, basiques hydrophiles, non polaires hydrophobes.

Figure 7 : La Figure 7 représente les sites de clonage du plasmide pGEX-2TK et la carte de restriction complète du site de clonage de pGEX-2TKL. Figure 8 : La Figure 8 représente les plasmides pGEX31.3 et pGEX MN. Figure 9 : La Figure 9 représente les résultats de l'autoradiographie montrant l'association in vitro des produits de traduction respectivement des clones 814 et 532 à l'aide d'un marquage radioactif, avec les protéines de fusion exprimées par les plasmides pGEXRb, pGEX2TKL31.3MN et le plasmide pGEX. Figure 10 : La Figure 10 représente la séquence du cDNA codant pour la protéine dCBP identifiée chez la drosophile (Akimura et al 1997, Nature.386, 735-738). Un fragment de 998pb a été amplifié à partir du mRNA de cellules S2 de drosophile en utilisant les amorces cys35 et cys33. Ce fragment amplifié a été utilisé pour préparer les sondes protéiques pGEX2TKL31.3 et pBluescript31.9 représentés. La séquence d'acides aminés codée par ce fragment est représentée en alignement.

Les séquences des amorces sont les suivantes :

Cvs35

5'CGGAATTCCGTGAAGTCAGCGGCGATGGC3'

Cvs33

5'GAAGATCTTCGGGGGATCACCTGTTGGCT FIGURE 11 : Construction du plasmide p814 Met, par addition d'un codon d'initiation de traduction. La construction obtenue peut être vérifiée par coupure avec Xhol qui permet de récupérer l'ADNc. FIGURE 12 : stratégie de séquençage adoptée pour identifier la séquence génomique du clone B7

EXEMPLES

C'est grâce à l'oncoproteine E1A des adénovirus que les deux familles de polypeptides p300/CBP et Rb ont été initialement identifiées et que ces polypeptides ont ensuite été décrits comme des régulateurs de la transcription et du cycle cellulaire. L'observation qui est l'origine du projet initié par les inventeurs est que la même molécule virale , en l'occurrence IΕ1A des adénovirus, est capable de cibler et d'inactiver deux polypeptides cellulaires appartenant à des familles différentes alors que ces derniers ne présentent même pas de similitudes de séquences apparentes. A la suite de cette observation, les inventeurs se sont posés la question de savoir s'il pouvait exister, dans la cellule normale, un ou plusieurs polypeptides cellulaires, qui comme IΕ1A viral, pourraient cibler et moduler l'activité de p300/CBP et Rb. Le ciblage par l'oncoproteine E1A des polypeptides Rb et p300/CBP révèle des domaines fonctionnels importants de ces polypeptides et laisse supposer que ces domaines sont essentiels aux fonctions cellulaires des protéines précitées. Très probablement, dans les cellules normales (non infectées) au moins une partie des fonctions des protéines des familles p300/CBP et Rb est régulée via ces domaines, par leur interaction avec un ou plusieurs polypeptides parmi lesquels peut éventuellement se trouver « l'homologue cellulaire d'E1A ». Dans les cellules infectées par l'adénovirus, la surexpression d'E1A peut rompre l'interaction de p300/CBP et Rb avec ce partenaire inconnu et par conséquent perturber le fonctionnement normal de ces polypeptides. Différentes observations décrites dans la littérature suggèrent effectivement l'existence d'une activité « E1A cellulaire » dans les cellules de mammifère (Impériale, MJ, Kao, HT, Feldman, L.T., Nevins, J.R. & Strickland, S. Molecular and Cellular Biology 4, 867-874 (1984), La Thangue, N.B. & Rigby, P.W.J. Cell 49, 507-513 (1987), Kelly, F. 8 Condamine, H. Biochim. Biophys. Acta 651 , 105-141 (1982), Borrelli, E. Hen, R. & Chambon, P. Nature 312, 608-612 (1984), Gorman CM, Rigby, P.W.J. & Lane, D . Cell 42, 519-526 (1985), Velcich A. & Ziff, E. Cell, 40, 705-716 (1985), Sleigh, M. Trends Genêt. 1 ,17-21 (1985). Si l'on accepte l'idée que « l'activité E1A cellulaire » pourrait exister, dans le cadre de la présente demande de brevet, les inventeurs ont émis l'hypothèse que s'il n'existe pas de similitude de séquences au niveau nucléotidique, il pourrait néanmoins y avoir conservation de domaines fonctionnels entre la protéine E1A virale et le (ou ) les polypeptides cellulaires responsables de l'activité « E1A cellulaire ». Deux hypothèses peuvent être fait quant à la « réalité moléculaire » de cette activité « E1A cellulaire » : Premièrement, on peut imaginer qu'un seul et même polypeptide cellulaire possède les différents motifs fonctionnels de la protéine E1A virale, et de fait est suffisant pour rendre compte de « l'activité E1A cellulaire ». Deuxièmement, peuvent exister, dans la cellule, différentes protéines possédant chacune un des domaines fonctionnels regroupés au sein de la protéine E1A virale. La formation d'un ou plusieurs complexes entre ces différentes protéines pourrait alors expliquer « l'activité E1A cellulaire » décrite chez les mammifères. Plusieurs polypeptides cellulaires possédant le motif LXCXE (X étant n'importe quel acide aminé) du domaine CR2 de la protéine E1A de l'adénovirus ont déjà été identifiés (UBF; Elf-1; Brm; BRG1; les cyclines D1 , D2, D3;RBP1 et RBP2; ainsi que PP1alpha2) (Taya Y 1997, Trends in Biochemical Science 22, 14-17). Le motif LXCXE d'E1A est, rappelons le, le domaine du polypeptide nécessaire et suffisant pour le ciblage et l'association avec les protéines de la famille Rb. Un deuxième site de fixation de E1A avec Rb se trouve dans le domaine CR1 et chevauche avec celui nécessaire pour la formation de complexe avec les membres de la famille p300/CBP. La question intéressante qui se pose est celle de savoir s'il existe dans la cellule des polypeptides qui possèdent ce dernier domaine d'E1A nécessaire à son association avec p300/CBP et éventuellement à Rb. Si de telles molécules existent peut-on les trouver en complexe avec les protéines à motif LXCXE et si oui, est ce que ces complexes multi-protéiques peuvent rendre compte de « l'activité E1A cellulaire ». Comme décrit plus loin, le polypeptide codé par le clone de cDNA isolé par les inventeurs renferme un domaine qui présente des similitudes structurales avec le domaine d'E1A impliqué dans son association avec p300/CBP et Rb.

Les domaines d'interaction avec E1A de chacun des polypeptides Rb et p300/CBP étant cartographiés, les inventeurs ont mis à profit cette information, afin d'aborder la recherche d'un partenaire commun à p300/CBP et Rb en utilisant un crible fonctionnel fondé sur les interactions de type protéine-protéine. Plus précisément, une sonde protéique, correspondant au domaine d'association à E1A d'un membre de la famille p300/CBP, a été utilisée pour cribler une banque de cDNA d'expression. Bien que très puissante, cette technique ne permet pas en pratique de cribler un très grand nombre de clones recombinants. Face à la complexité du génome des mammifères, cette limitation peut être un problème surtout si on cherche à isoler un cDNA correspondant à un mRNA rare. Pour contourner ce problème, les inventeurs ont décidé d'utiliser le génome de la drosophile qui est 20 fois moins complexe que celui de l'homme. Il existe en effet dans les cellules de la drosophile, un polypeptide (dCBP) appartenant à la famille p300/CBP (Akimura et al.). L'existence d'un tel polypeptide et la conservation de son domaine CH₃ laisse penser que les cellules de drosophile pourraient également exprimer un partenaire cellulaire éventuel capable de complexer avec dCBP grâce à ce même domaine. Par ailleurs, la drosophile est l'organisme de choix pour étudier les fonctions des gènes car, la génétique de cet organisme a été extensivement étudiée et des mutations définissant plusieurs centaines de gènes ont été isolées et caractérisées phénotypiquement.

MATERIELS ET METHODES

1 -Construction et caractérisation de sondes protéigues dCBP et Rb

Dans un premier temps, les outils moléculaires nécessaires à la réalisation de ce projet ont été construits. Une série de plasmides recombinants permettant l'expression des sondes protéiques nécessaires à tout criblage fondé sur les interactions de type protéine-protéine a été construite. A cette fin, les cDNA correspondant aux domaines d'association à E1A des polypeptides Rb d'une part et dCBP d'autre part, ont été clones dans les vecteurs d'expression procaryotes pGEX2TK et pGEX2TKL (Kaelin et al., Ce// 64, 521-532 (1991) (Smith et al, Gène 67, 31-40(1987). Les protéines de fusion obtenues avec ces vecteurs d'expression présentent l'avantage d'être facilement purifiées avec des billes de sépharose couplées au glutathion. Les vecteurs pGEX2TK et pGEX2TKL possèdent un site de phosphorylation en aval du cadre de lecture ouvert du glutathion qui permet en outre le radiomarquage des protéines de fusion à l'aide de la protéine Kinase A (HMK) et de <gamma 32P> ATP. Cette phosphorylation, compte tenu de la position du site sur lequel elle se fait, ne doit pas perturber l'association des protéines recombinantes à leurs cibles potentielles.

Le plasmide pGEX2TK a été décrit par Shirodkar et al (1992 Cell 68, 157- 166) ; il est commercialisé par PHARMACIA/AMERSHAM. Ce plasmide a été modifié pour les besoins de la construction au niveau des sites de restriction de la séquence du polylinker (Figure 7), donnant lieu au plasmide pGEX2TKL dont le site de clonage est représenté à la Figure 7.

Cette première série de plasmides d'expression a donc permis aux inventeurs de produire chez la bactérie, les protéines de fusion correspondant au domaine d'association à E1A du polypeptide Rb (aa 379-792 : « small pocket ». Une forme mutée de ce domaine, incapable de s'associer à la protéine virale E1A (« small pocket » pour laquelle la cystéine en position 706 est substituée par une phénylalanine) a également été utilisée. Par ailleurs, les inventeurs ont produit une protéine de fusion pGEX 31.3 (aa 2208-2540 de dCBP : sonde dCBPA) qui correspond au domaine d'association à E1A de dCBP isolé chez la drosophile (un membre de la famille p300/CBP) ainsi que trois versions mutées de celle-ci (mutants de délétion interne). Pour des raisons qui seront détaillées plus loin, les inventeurs ont construit une seconde série de protéines de fusion dCBP (pGEX 31.3 MN: sonde dCBPB et trois mutants de délétion) correspondant toujours au domaine d'association à E1A. Les protéines de fusion pGEXRb « small pocket » et pGEXRb comportant une mutation, ainsi que pGEX 31.3 et pGEX 31.3MN ont été obtenues comme suit.

Le plasmide pGEX2TKRb (379-792), comprenant les acides aminés 379- 792 de la protéine Rb (ladite séquence étant appelée « small pocket ») a été décrit par Kaelin et al (1991 , Cell, 64, 521-532) et Shirodkar et al (1992, 68, 157-166), à partir du cDNA décrit par Friend et al (1986, Nature 323, 643-646).

Le plasmide pCMVRb (379-792) mut 706OF a été décrit Par Qin et al (1992, Gènes dev, 6, 953-964). Ce plasmide contient le « small pocket » de Rb (aa 379-792) qui porte une mutation au niveau du résidu cystéine en position 706 remplacé par un résidu phénylalanine. Cette mutation est décrite par Kaye et al (1990, PNAS, 87, 6922-6956).

Le plasmide pGEX2TKRb (379-792) mut 706 c->F a été construit à partir de pGEX2TKRb (379-792) et pCMVRb (379-792) mut 706OF.

Le plasmide pGEX2TKL31.3 a été construit en utilisant la stratégie suivante : les ARN PolyA+ de cellules en culture S2 (Schneider) de drosophile ont été purifiés à l'aide d'un kit « Quick prep micro purification » commercialisé par Pharmacia/Amersham. Les ARNm ainsi purifiés ont été soumis à une réaction de réverse transcription (RT) par l'enzyme reverse transcriptase de MuMLV(commercialisée par Stratagene), en présence d'amorces aléatoires (d(N)6 (commercialisées par Biolabs). Ensuite, le produit de la réverse transcription (RT) a été utilisé dans une réaction d'amplification par PCR en présence d'amorces spécifiques du gène dCBP de la drosophile appartenant à la famille p300/CBP (amorces cys 35 (nucléotides 6892-6903) et cys 33 (nucléotides 7890-7873)). Les amorces utilisées dans cette réaction de PCR sont spécifiques du gène codant pour dCBP. Le fragment amplifié de dCBP (appelé fragment 31 ) ainsi obtenu est long de 998 nucléotides et correspond aux positions nucléotidique de 6892 à 7890 du cDNA de dCBP .Ce fragment a la capacité de coder pour un polypeptide de 332 aa (positions 2208 à 2540 du polypeptide codé par le cDNA dCBP). Le fragment 31 est bordé par les sites EcoR1 et Bglll introduits artificiellement à l'aide des amorces cys35 et cys 33. Après digestion avec les enzymes EcoRI et Bglll, le fragment 31 digéré est purifié et utilisé dans deux réactions de ligation indépendantes. La ligation avec le plasmide pBIuescript (Stratagene) digéré par EcoRI et BamH1 a permis l'obtention du plasmide recombinant pBIuescript 31.9. La ligation avec le vecteur pGEX2TKL digéré par EcoRI et BamH1 a donné naissance au plasmide recombinant pGEX2TKL31.3.

Le plasmide pGEX2TK31.3MN, renferme un segment de dCBP qui correspond aux positions nucléotidique de 7365 à 7890 du cDNA de dCBP . Ce fragment a la capacité de coder pour un polypeptide de 174 aa (positions 2366 à 2540 du polypeptide codé par le cDNA dCBP). Ce plasmide recombinant a été obtenu de la manière suivante : le plasmide pBIuescript 31.9 a été digéré par l'enzyme Not1 (dans le polylinker de pBIuescript) et traité ensuite avec l'enzyme DNA polymerase (fragment klenow) afin de rendre franc le site ouvert par la première enzyme. Le produit de remplissage par Klenow a été ensuite digéré par l'enzyme Msc1 (site à la position nucléotide 7365 du cDNA dCBP) et le fragment Msc1-Not1 /klenow (525 paires de bases) ainsi obtenu a été purifié et ligué avec le vecteur pGEX2TK digéré par l'enzyme Sma1 pour donner naissance au plasmide recombinant pGEX2TK31.3MN.

Les plasmides pGEX2TKL31.3 ET pGEX2TK31.3MN sont présentés sur la Figure 8. Lorsqu'il est fait référence dans la suite aux sondes protéiques, il s'agit des protéines de fusion radiomarquées définies ci-dessus, sauf précision contraire.

Une fois les plasmides construits, les inventeurs ont mis au point les conditions de synthèse optimale des protéines de fusion ainsi que celles de leur extraction et de leur purification. Les protéines recombinantes surexprimées dans la bactérie peuvent se trouver « piégées » dans des corps d'inclusion et sont par conséquent très difficiles à extraire. Après avoir testé plusieurs souches bactériennes et essayé différentes conditions de lyse, les inventeurs ont réussi à extraire de la fraction insoluble des lysats bactériens les protéines recombinantes pGEXRb et pGEXdCBP, et ceci tout en minimisant leur protéolyse. Par la suite les conditions de leur radiomarquage par la protéine kinase A (HMK) ont été optimisées.

Dans un premier temps, la capacité des sondes radiomarquées pGEXRb et pGEX31.3 à s'associer à la protéine E1A sous forme native a été testée, lorsqu'elle est déposée sur membrane de nitrocellulose (expériences d'hybridation sur « dot blot »). Les inventeurs ont choisi cette technique car l'état du polypeptide E1A déposé sur membrane de nitrocellulose est semblable à celui des protéines produites au niveau des plages de lyse d'une banque d'expression. Ainsi, les inventeurs ont montré que la sonde pGEXRb sauvage est capable de s'associer spécifiquement à la protéine E1A virale sous forme native dans des expériences de « dot-blot » (la sonde mutée en est incapable). Ces conditions expérimentales permettent également à la sonde pGEX31.3 (dCBP A) de reconnaître le polypeptide E1A viral et ceci de manière spécifique. Bien que cette association soit spécifique, la relative faiblesse du signal obtenu pouvait faire craindre certaines difficultés techniques lors de la deuxième partie du travail (criblage d'une banque de cDNA d'expression). Les inventeurs ont alors cherché à améliorer l'intensité de ce signal d'hybridation. Parmi les différentes explications possibles, les inventeurs ont privilégié celle impliquant la présence dans la sonde pGEX2TKL31.3, d'une séquence ou d'une structure inhibitrice qui lorsqu'elle est délétée permet à la sonde de s'associer plus fortement à la protéine E1A virale. De fait, la nouvelle sonde pGEX31.3MN (dCBP B), codée par le plasmide pGEX2TK31.3MN, a une affinité sensiblement supérieure à celle de la sonde pGEX31.3 pour E1A (gain d'un facteur 50). Les inventeurs ont ainsi pu mettre en évidence dans la sonde pGEX31.3, une séquence ou une structure inhibitrice pour la liaison à E1A.

L'obtention de la sonde pGEX2TK31.3MN capable de s'associer fortement à la protéine E1A déposée sur membrane de nitrocellulose a décidé les inventeurs à passer à l'étape du criblage d'une banque d'expression.

2-Mise au point et criblage de bangue d'expression : Afin de cribler une banque d'expression à l'aide d'une sonde protéique radiomarquée les inventeurs ont décidé d'utiliser les protocoles décrits par Kaelin et al. (Cell, 1992, 70, 351-364). Cependant, il leur a fallu plus d'un an de mise au point afin d'adapter la stratégie à leur besoins et aux outils disponibles. Comme le montre le paragraphe décrivant la fabrication et caractérisation de la sonde protéique pGEX2TK31.3MN (dCBP B), l'obtention de cette sonde était l'une des premières étapes d'amélioration des conditions expérimentales.

Ensuite, il leur a fallu optimiser les conditions de criblage. Les inventeurs ont constaté que le niveau de production des protéines recombinantes dans les plages de lyse était l'une des étapes limitantes de la technique de criblage par expression. Ils ont observé que pour améliorer ce niveau de production, il fallait remplacer les bactéries E.Coli XLIBlueMRF' (dont l'utilisation est conseillée dans le protocole lambda zapll publié par Stratagene) par la souche LE392 (disponible dans le catalogue ATCC sous le numéro 33572).

Ils ont également constaté que ce niveau de production était tout à fait dépendant de la qualité d'agarose utilisée dans la préparation des boîtes d'agarose/LB sur lesquelles les bactéries infectées ont été étalées. En l'occurrence l'utilisation de l'agarose Sea kem ME (commercialisé par FMC/TEBU) a nettement amélioré le niveau de production des protéines recombinantes dans les plages de lyse.

En ce qui concerne l'étape de traitement des membranes après obtention des répliques de plages de lyse, les inventeurs ont observé que le séchage des membranes à 4°C ainsi que l'éventuelle omission de l'étape de blocage de ces dernières, avant l'étape de dénaturation/renaturation des protéines transférées, pouvaient également améliorer la détection du signal après l'hybridation de la sonde.

Enfin, les temps de lavage, après l'étape d'hybridation avec la sonde, ont été considérablement écourtés afin de minimiser les pertes non spécifiques des signaux d'hybridation. En résumé, le criblage de 1x10⁵ phage d'une banque d'expression construite (selon les méthodes connues de préparation des banques d'expression) dans le vecteur lambda Zapll (commercialisé par Stratagene) et correspondant aux ARN messagers d'embryons de drosophile âgés de 0 à 9h a été entrepris à l'aide de la sonde pGEX2TK31.3MN. Ainsi, 8 clones positifs ont été isolés. Un seul de ces clones (le clone 814) est resté positif au cours des deux étapes successives de criblage/amplification. A partir de phage purs 814, le cDNA insert a été sous clone (selon le protocole d'excision in vivo publié par Stratagene) dans le plasmide pBIuescript (Stratagene). Ce premier plasmide recombinant a été appelé p814. Le séquençage complet de l'insert de 1 ,2 kb a révélé l'existence d'une queue polyA à son extrémité 3'. Une sonde (814ES) construite à partir du plasmide p814 a permis d'analyser par Northern les ARN polyA+ de cellules de drosophile en culture et de mettre en évidence un ARNm majeur d'une taille proche de 3,5 kb. Ce résultat indiquait que le cDNA isolé était partiel. Afin de cloner la totalité du cDNA une banque d'embryons âgés de 0 à 24h (construite dans le vecteur lambda zapll) a été criblée avec la sonde nucléotidique 814ES précédemment utilisée en Northern (voir plus haut) et une vingtaine de clones ont été ainsi isolés.

Dans un premier temps, une cartographie par enzymes de restriction et un séquençage partiel des quatre clones les plus longs (252, 422, 532) ont été réalisés afin d'établir leur relation avec le clone 814. Ces analyses ont montré qu'il s'agissait de séquences identiques et colinéaires à celle du clone 814. Par la suite les inventeurs ont focalisé leur effort sur l'analyse et le séquençage complet du clone le plus long, c'est-à-dire le clone 532, dont la taille de 3,2 kb est le plus proche du messager correspondant.

3-Clonage du gène 532

Afin de cloner le gène 532, les inventeurs ont dans un premier temps amplifié des fragments de cDNA 532 avec le but de les utiliser comme sondes radioactives au cours des différentes étapes de clonage. Ainsi, les couples d'amorces 532E/422AY ; 422AX/814C ; 814B/T71 (voir positions sur la figure) utilisés dans des réactions de PCR en présence du plasmide recombinant pBluescript532 (renfermant le cDNA 532) ont permis respectivement l'amplification des fragments PCR1 (1197bp ; position 280 à 1477), PCR2 (826 bp ; position 1298 à 2124) et PCR3 (882 bp ; 2001 à 2883). Les réactions de PCR ont été réalisées à l'aide de l'enzyme PFU de Stratagene en utilisant le protocole conseillé par le fournisseur. L'amplification a eu lieu dans un appareil Perkin Elmer 9600 en utilisant le programme suivant : 1x(95°C pendant 45 sec), 30x(95°C pendant 45 sec, 55°C pendant 45 sec, 72°C pendant 3 min), 1x(72°C pendant 20 min). Les fragments amplifiés ont été purifiés et analysés par la suite.

Le fragment PCR2 du clone 532 a été utilisé pour cribler une d'ADN génomique de drosophile clonée dans le vecteur phagique P1 et ordonnée sur une membrane (High density P1 filter ; Genomesystems.USA). Les conditions d'hybridation sont celles conseillées par le fournisseur.

Un clone positif a été identifié et sa localisation a été obtenue en utilisant le programme informatique disponible sur le site web de Genomesystems. La localisation est identifiée par : Filtrai :1 ; Field 1 :1 ; Plate13 :19 ; WellA17 :A17. Ceci permet de répertorier le clone 49-9 (clone ID DS04617) dans la banque. Ce clone a été obtenu sous la forme du phage P1 chez Genomesystems.

L'ADN du phage recombinant a été préparé et digéré par différentes enzymes de restriction puis analysé par Southern Blot à l'aide des sondes 532 (PCR1 , PCR2,et PCR3 voir plus haut). L'hybridation a été réalisée dans les conditions suivantes : après 2 à 3 h de préhybridation dans du tampon Church (Church and Gilbert (1984), PNAS, 81 , 1991-1995) (0.5M NaP04 pH6,8, 1 mM EDTA, 7% SDS) à 65°C, la membrane est incubée dans le même tampon renouvelé contenant la sonde (10⁶cpm/ml) préalablement dénaturée par ébullition. Après 16 à 24 h d'hybridation la membrane est lavé 2x 10 min à 65°C dans le tampon 2xSSC (300 mM NaCI, 30 mM CiNa3) + 0,1 % SDS.

Les résultats d'analyse par Southern à l'aide des trois sondes révèlent le même fragment Bglll ; on peut en conclure que tout le cDNA est contenu dans un fragment génomique minimal. Ce fragment Bglll (taille estimée à 6 kb) a été purifié et sous clone dans le vecteur pBIuescript digéré par BamHI . Le plasmide recombinant ainsi obtenu a été appelé clone B7 et séquence suivant la stratégie décrite pour conduire à la séquence représentée à la figure 1 à la Figure 12.

4-Construction du plasmide p814Met

Afin de réaliser des expériences de transcription et traduction in vitro, il était nécessaire d'ajouter un codon initiateur ATG (Methionine) au début du cDNA partiel 814 clone dans le plasmide pBluescript814 (p814). Pour cela un fragment du polylinker du plasmide pET-19 (Novagen) renfermant un codon initiateur a été digéré par Xba1 et BamHI , purifié et clone entre les sites BamHI et Xba1 du plasmide p814. Le nouveau plasmide recombinant ainsi obtenu est appelé p814Met (Figure 11 ).

RESULTATS

Après une mise au point technique difficile, l'utilisation de la sonde protéique dCBP a permis aux inventeurs d'isoler le cDNA (clone 532) d'un nouveau gène dont le produit présente les caractéristiques postulées d'un partenaire de p300/CBP et Rb. Plus précisément, les expériences d'interaction iri vitro montrent que le produit du clone 532 a la capacité de s'associer aussi bien avec dCBP qu'avec Rb.

1- analyse de la structure nucléotidigue primaire du clone 532: Le séquençage du clone 532 montre que ce cDNA est long de 3120 nucléotides sans tenir compte de la queue polyA⁺ et possède un cadre de lecture ouvert de 2964 nucléotides (987 acides aminés). Le premier codon initiateur (codant pour un résidu methionine) du cDNA se trouve à la position 61. Cependant, il est difficile de savoir si ce codon correspond ou pas au résidu methionine initiateur du mRNA, car dans les 60 premiers nucléotides du cDNA, aucun codon stop n'a été trouvé, caractéristique des régions 5' non traduites des mRNA. La comparaison des tailles respectives du cDNA et du mRNA majeur correspondant à 532, ainsi que l'analyse de l'extrémité 5' du cDNA 532 semble indiquer que ce dernier n'est pas complet ; il lui manquerait entre 100 à 200 nucléotides. Afin d'analyser l'extrémité 5' manquante du clone 532, plusieurs types d'expériences ont été réalisées. Les expériences d'extension d'amorce et de 5'RACE ont permis d'observer qu'effectivement, il fallait 200 nucléotides de plus afin d'atteindre l'extrémité 5' du mRNA 532. Par ailleurs, après avoir clone et séquence le gène 532 (voir plus loin l'analyse structurale du gène) sa séquence a été comparée avec celle du cDNA correspondant. Cette comparaison ainsi que l'utilisation de programmes informatiques d'analyse de séquence semblent confirmer les premières données car elles montrent que le gène 532 a le potentiel d'être transcrit en un mRNA qui contiendrait un codon methionine initiateur se trouvant 146 nucléotides en amont du premier ATG rencontré à l'extrémité 5' du cDNA 532. Ce qui veut dire que pour cloner le cadre de lecture complet de 532, 91 nucléotides supplémentaires du côté 5' sont nécessaires. Les expériences nécessaires ont été mises en marche afin de cloner le fragment manquant du cDNA. Il est également possible que le gène 532 subisse des démarrages de transcription multiples qui peuvent affecter le choix du codon initiateur. 2. analyse de la séquence polypeptidigue primaire Le clone 532, entièrement séquence, code un polypeptide de 112 kDa ayant 987 acides aminés commençant avec le résidu Methionine en position 20. L'interrogation des banques de données indique que ce cDNA n'a pas été clone et séquence par d'autres groupes. La protéine putative codée par ce cDNA possède plusieurs domaines remarquables :

1. Ce polypeptide possède plusieurs signaux de localisation nucléaire bipartite entre les résidus 500 et 940 ainsi que des sites de phosphorylation. La présence de sites de phosphorylation multiples par respectivement la kinase cycline-dépendante cdc2, la caséine kinase il, la protéine kinase C ainsi que la protéine kinase A (PKA) semble indiquer que l'activité de cette protéine pourrait être contrôlée au cours du cycle cellulaire et/ou en réponse à différentes voies de signalisation.

2. L'extrémité N-terminale (environ 200 acides aminés) du polypeptide présente une forte similitude de séquence avec les protéines à domaine rotamase (peptidyl prolyl isomérase). Cette activité enzymatique permet la modification de la conformation d'une protéine cible à la proximité d'un résidu praline. D'ores et déjà, ces structures indiquent que grâce à l'activité rotamase, le polypeptide 532 pourrait posséder une activité enzymatique susceptible de modifier un ou plusieurs partenaire(s) protéique(s) présents dans le complexe.

3. Ce polypeptide possède un motif EVES présent également dans le facteur de transcription Myb. Dans le cas de la proto-oncoprotéine Myb, il a été montré que le motif EVES était capable de médier aussi bien la régulation intramoléculaire que intermoléculaire de ce polypeptide. On peut donc penser que le motif EVES présent dans 532 pourrait être responsable de la régulation de l'activité du polypeptide, et/ou également de l'association de celui-ci avec des facteurs de transcription comme Myb.

4. Le polypeptide 532 est très riche en résidus serine (S) et argine (R). La signification d'une telle signature en acides aminés n'est pas claire ; néanmoiins, les domaines protéiques SR (sérine-arginine) ont été impliqués dans les interactions de type protéine-protéine.

5. Etant donné que le clone 532 a été initialement isolé grâce à son association avec une sonde protéique correspondant au domaine d'association à E1A de dCBP, les inventeurs se sont posés la question de savoir si 532 pouvait présenter des similitudes de séquences avec la protéine virale E1A. L'alignement des deux séquences (acides aminés) montre un domaine de similitude non négligeable. Plus précisément, un segment C-terminal de 532 présente une similitude avec un domaine N-terminal de E1A virale. Rappelons que le domaine N-terminal de E1A viral est nécessaire à son association avec p300/CBP et Rb. 3-analvse de la structure génomioue du clone 532 :

Afin de cloner le gène 532, les inventeurs ont criblé, à l'aide d'une sonde nucléotidique 532, une banque de DNA génomique de drosophile construite dans le vecteur phagique P1 (Geneomesystems Inc.). Un phage recombinant contenant un insert de 80 kb a été ainsi isolé. Après une cartographie par enzymes de restriction suivie d'analyses par Southern réalisées à l'aide de sondes couvrant différentes régions du cDNA 532, un fragment Bglll de 6 kb contenant le gène 532 a été isolé et sous clone. Ce fragment génomique a été entièrement séquence et la comparaison de sa séquence à celle du cDNA permettant aux inventeurs de faire plusieurs observations : premièrement, comme mentionné plus haut, l'analyse de la séquence de la région en 5' du clone génomique a permis d'estimer la taille de l'extrémité 5' manquante du cDNA. Deuxièmement, on a pu observer que le gène 532 était morcelé et que les introns interrompaient le domaine rotamase (ou PPiase) alors que la région contenant les signaux de localisation nucléaire se trouvait d'un seul tenant dans le même exon. Troisièmement, la présence de plusieurs TATA box potentielles dans la région en amont du premier exon suggère que ce fragment génomique pourrait contenir la région promotrice du gène 532.

4-analvse de l'expression du mRNA correspondant au clone 532 :

Une fois que le clone 532 a été isolé et avant même que son séquençage soit fini, on a vérifié que le cDNA de 3,2 kb (clone 532) correspondait bien à une structure colinéaire et n'était pas un artefact de construction de la banque. A l'aide d'oligonucléotides spécifiques des parties 5' et 3' du clone 532 (3,2 kb), les cDNA correspondant aux ARNm de cellules de drosophile en culture ont été amplifiées par PCR. Les produits d'amplification ont ensuite été hybrides par la technique de Southern avec la sonde 814ES précédemment utilisée en Northern (voir plus haut). L'hybridation révéla une bande unique d'environ 2,5 kb à la taille attendue. Les deux oligonucléotides ayant été choisis dans les régions 5' et 3' du cDNA, les résultats obtenus confirmèrent que ce dernier était une structure colinéaire et ne correspondait pas à un artefact de construction de la banque (produit de la fusion de deux cDNA).

Afin d'étudier rapidement le contrôle de l'expression du gène au cours du développement, les cDNA stades d'embryons de drosophile (0-4h, 4-8h, 12-24h ont été analysés par PCR, à l'aide de ces mêmes oligonucléotides. Les résultats obtenus révélèrent tout d'abord dans les différents stades étudiés une bande de 2.5 kb comigrant avec celle observée dans les cellules de drosophile en culture. Par ailleurs, l'expression du gène correspondant au cDNA clone semblait être contrôlée au cours du développement embryonnaire. Plus précisément, l'expression du gène était importante aux stades précoces du développement embryonnaire (stades 0-4h et 4-8h) et plus faible aux stades tardifs (12-24h). Etant donné qu'aux stades précoces du développement embryonnaire de la drosophile, comme chez la plupart des organismes eucaryotes, correspondent des cycles très rapides de divisions cellulaires, il a été spéculé que le gène correspondant au cDNA isolé pouvait être impliqué dans le contrôle de la prolifération. Afin de mieux étudier l'expression spatio-temporelle du mRNA 532, à l'aide de sondes RNA, des expériences d'hybridation in situ sur embryons entiers ont été réalisées.

5-étude in vitro de l'interaction 532/dCBP et 532/Rb :

Rappelons que le premier clone cDNA partiel du gène 532 (le clone 814) a pu être isolé initialement grâce au criblage d'une banque de cDNA d'expression à l'aide de la sonde protéique dCBP. Afin de confirmer la spécificité de l'association du produit du clone initial 814 à la sonde pGEX2TKL31.3 MN, des expériences de coprécipitation in vitro (expériences de « GST pull-down ») ont été réalisées. Le clone 814 étant partiel, un codon initiateur de la traduction en phase avec le cadre de lecture du cDNA de 1.2 kb a été inséré dans le plasmide p814, de façon à pouvoir le traduire in vitro. Cette nouvelle construction a été appelée p814 Met. Le produit de traduction in vitro de ce plasmide (marqué à la methionine ³⁵S) a été incubé en présence de la protéine recombinante sauvage pGEX2TKL31.3 MN ou bien de la partie pGEX seule du vecteur d'expression. Les résultats obtenus montrent que la protéine de fusion pGEX2TKL31.3 MN précipite spécifiquement le produit de traduction in vitro du plasmide pB-814Met, alors que pGEX seul en est incapable. Ensuite, le même type d'expérience a été réalisé cette fois avec le produit de la traduction in vitro du grand clone 532 (967 aa). Une fois de plus, il a été observé que la protéine de fusion pGEX2TKL31.3MN précipitait spécifiquement le produit de traduction in vitro du clone 532 alors que pGEX seul en est incapable.

Parmi les critères qui étaient fixé initialement, l'un des plus importants était la reconnaissance conjointe du produit du clone isolé par les protéines dCBP et Rb. Pour voir si effectivement le produit de traduction in vitro de 532 était capable de se complexer spécifiquement avec la protéine Rb, le même type d'expérience a été réalisé en remplaçant la protéine de fusion pGEXdCBP par la protéine de fusion pGEXRb. Les résultats montrent que la protéine pGEXRb est non seulement capable de précipiter spécifiquement le produit de traduction in vitro du clone 532 mais également celui du clone partiel 814 (pB-814Met).

En conclusion, on peut dire que le polypeptide 532 présente les caractéristiques postulées d'un partenaire commun de p300/CBP et Rb, puisque les expériences d'interaction in vitro montrent que celui-ci a la capacité de s'associer aussi bien à p300/CBP que Rb.

6-Etude de l'interaction 532/dCBP 532/Rb in vivo :

Afin de mettre en évidence un tel complexe, des expériences de co- immunoprécipitation à l'aide d'anticorps dirigés contre chacun des partenaires doivent être réalisées. Dans ce but, un anticorps polyclonal de lapin (Eurogentec) dirigé contre un peptide de 16 acides aminés de 532, répondant à la séquence QDNEYRNRYPLSPIR a été obtenu. Dans un premier temps, les inventeurs ont cherché à caractériser cette anticorps par analyse en western ainsi que par immunoprécipitation.

L'analyse en Western, d'extrait protéique de cellule de drosophile en culture, à l'aide de l'anticorps précité révèle 9 polypeptides. L'utilisation du peptide compétiteur libre montre que seul 2 parmi les 9 polypeptides réagissent spécifiquement avec l'anticorps. Le premier polypeptide qui a un poids moléculaire apparent de 150 kDa et qui comigre avec le produit de traduction in vitro du clone 532 est probablement le produit du mRNA correspondant à 532. Plus haut, on a vu que le poids moléculaire théorique de 532 était de 112 kDa. Cette différence entre le poids moléculaire théorique et apparent peut être expliquée par la présence de certains acides aminés qui peuvent affecter la migration du polypeptide en gel d'électrophorèse PAGE/SDS. Par ailleurs, des modifications post-traductionnelles peuvent également être à l'origine de cette différence de poids moléculaire. Le deuxième polypeptide spécifique révélé par l'anticorps à un poids moléculaire apparent de 80 kDa. Un certain nombre de données concernant un cDNA variant laissent penser que ce polypeptide pourrait être le produit d'un épissage alternatif du gène 532. La taille théorique du polypeptide putatif de ce cDNA variant étant semblable à celle du deuxième polypeptide détecté spécifiquement par l'anticorps, on peut spéculer qu'ils correspondent au même produit.

Dans un deuxième temps, l'anticorps a été caractérisé dans des expériences d'immunoprécipitation. Au cours de ces expériences, les inventeurs se sont heurtés à des difficultés majeures. Plus précisément, systématiquement, l'utilisation des protocoles classiques d'immunoprécipitation entraînait l'agrégation du complexe immun qui précipitait dans le puit de dépôt du gel d'électrophorèse PAGE/SDS.

Le protocole d'immunoprécipitation a été modifié et le complexe immun a pu être analysé par électrophorèse sur PAGE/SDS suivie d'analyse en Western. En résumé, les résultats de telles expériences montrent que l'anticorps dirigé contre 532 est capable d'immunoprécipiter deux polypeptides de 150 et 80 kDa à partir de cellules de drosophile.

L'anticorps polyclonal anti 532 caractérisé par Western et immunoprécipitation, peut être utilisé dans des expériences de coprécipitation afin de rechercher in vivo les complexes protéiques contenant 532. DISCUSSION

Les programmes informatiques d'analyse des protéines montrent que le polypeptide 532 est une molécule multi-domaines avec une localisation nucléaire. Ces domaines protéiques seront utilisés comme des points d'entrée dans l'étude de la fonction de 532. Très probablement, certains d'entre eux sont impliqués dans les interactions protéine-protéine. La caractérisation de ces domaines est non seulement importante dans la compréhension de la fonction de 532 dans le contrôle de la prolifération cellulaire, en relation avec les protéines des familles p300/CBP et Rb, mais également dans le développement d'un certain nombre d'outils d'intérêts thérapeutique et pharmacologique. Car tout outil (ligand, peptide, anticorps, etc..) provoquant l'altération de l'activité de chacun de ces domaines fonctionnels pourra être exploité dans ce but.

Domaine de similitude avec les protéines à domaine rotamase et Domaine EVES

La région N-terminale de 532 présente un domaine de forte similitude avec les peptidyl prolyl isomérases (PPiase) (ou appelé encore rotamase) des immunophilines. En principe, les PPiases catalysent le changement de conformation polypeptidique à la proximité d'un résidu praline qui se trouve dans le contexte d'une séquence consensus. Initialement , les immunophilines ont été isolées en temps que récepteurs cellulaires de drogues immunosupresseurs comme la cyclosporine A ou bien FK506. En relation avec leur structure polypeptidique et sensibilité aux drogues, les immunophilines ont été classées en trois groupes : les cyclophilines, les FKBP et les parvulines. La majorité des immunophilines décrite à ce jour est ^' localisée dans le cytoplasme, et les organelles. 532 est l'une des rares immunophilines nucléaires et structurellement fait partie du groupe cyclophiline. 532 devrait être sensible à la drogue immunosupresseur cyclosporine et, en contrôlant la transcription via p300/CBP et Rb, elle serait la première immunophiline nucléaire impliquée dans le contrôle de la transcription cellulaire.

Le domaine rotamase de 532 affecterait la formation de complexe avec les membres de la famille p300/CBP, Rb ou bien un autre partenaire protéique présent dans le complexe. Des données obtenues par les inventeurs semblent indiquer que le facteur de transcription MYB pourrait être l'un des substrats candidats de cette activité. En conclusion, 532 pourrait être une immunophiline capable de cibler et affecter le fonctionnement de MYB. Une éventuelle liaison physique et fonctionnelle de 532 et MYB est d'autant plus intéressante que CBP/p300 est un coactivateur de cette dernière.

Domaine de similitude avec la protéine E1A virale

Un segment C-terminal de 532 présente une similitude structurale avec un domaine N-terminal de la protéine E1A des adénovirus. Des expériences peuvent être réalisées afin de comparer l'activité de ce domaine protéique avec celui de la protéine E1A virale. L'étude génétique des mutants d'E1A montre qu'un certain nombre d'activités transformantes d'E1A comme l'induction de la prolifération ou bien la perturbation des programmes de différenciation ainsi que la régulation de l'expression d'un certain nombre de promoteurs viraux et cellulaires nécessitent la présence de ce domaine d'E1A. La comparaison fonctionnelle de 532 et E1A peut être réalisée à plusieurs niveaux.

1 -Etude des protéines associées à 532 (via le domaine de similitude à E1A) et comparaison avec celles qui s'associe avec E1A.

2-Etude des protéines associées à 532 (via le domaine de similitude à E1A) en présence ou absence d' E1A afin de vérifier si la protéine virale peut entrer en compétition avec 532 pour le déplacer ou le remplacer.

3-Au niveau moléculaire, E1A est capable de contrôler la transcription d'un certain nombre de gènes cellulaires ou viraux. Plus précisément, cette protéine virale peut avoir un effet répresseur ou activateur sur la transcription de promoteurs spécifiques. Dans le contexte de ce travail, la transcription, à partir d'un certain nombre de promoteurs modèles, peut être étudiée en présence de E1A et 532 en parallèle afin d'établir la comparaison, ou bien en même temps afin d'étudier d'éventuels phénomènes d'interférences.

4-Au niveau cellulaire, E1A est connu pour ses activités transformantes dans des cellules de rongeurs. Parmi ces activités, sont décrites : l'induction de la prolifération cellulaire (induction de la synthèse d'ADN et de la mitose), perturbation des programmes de différenciation cellulaire, ainsi que la capacité à co-transformer des cellules en collaboration avec l'oncogène ras. Le cDNA 532 pourra être réintroduit dans les cellules par transfection en transitoire ou en stable afin d'étudier ces différents critères et d'établir une comparaison avec la protéine E1 A virale.

5-Les protéines E1A sont indispensables à la réplication de l'adénovirus en agissant à deux niveaux complémentaires : le contrôle de l'expression des gènes viraux ainsi que le maintien de la cellule hôte dans un état prolifératif propice à la propagation du virus.

La capacité de l'adénovirus à infecter des cellules quiescentes ainsi qu'un grand nombre de types cellulaires différents rend ce virus à ADN très attractif pour une utilisation en tant que vecteur de transfert pour la thérapie génique. La taille de l'ADN clonable (jusqu'à 30kb) dans le génome viral en fait également un vecteur unique. Les adénovirus des sérotypes 2 et 5, responsables de maladies respiratoires bénignes chez l'homme, ont donc servi ces dernières années à l'élaboration de vecteurs de transduction génique in vivo. Les adénovirus recombinants dits de première génération, développés pour la thérapie génique, ont subi des délétions de la totalité de leur gène E1A et d'une partie du gène E1B. De tels virus délétés recombinants, sont considérés comme défectifs pour la réplication car, les promoteurs des gènes précoces E2, E3 et E4 ne peuvent plus théoriquement être transactivés par les produits du gène E1A. Cependant à haute multiplicité d'infection, ces virus délétés de leur région E1A sont néanmoins capables de se répliquer à bas niveaux dans certains types cellulaires. La réplication à faible taux de l'ADN viral a pour conséquence une production résiduelle des protéines tardives du virus. L'accumulation de ces protéines tardives cytotoxiques est à l'origine d'effets cytopatiques directs sur la cellule transduite et au recrutement du système immunitaire de la cellule hôte (immunité cellulaire et humorale). La cytotoxicité des protéines virales tardives et la réponse immunitaire de la cellule hôte contre les antigènes viraux ont pour conséquence une inflammation locale et la destruction des cellules transduites. Cette destruction se traduit de facto par une expression limitée dans le temps du transgène in vivo, et limite donc l'utilisation en thérapie génique des vecteurs adénoviraux de première génération délétés de leur seule région E1A et d'une partie de la région E1B. Pour palier à cette inconvénient majeur, une seconde génération de vecteurs adénoviraux est en cours d'élaboration. Néanmoins, ces nouvelles stratégies ne permettent pas de répondre à la question fondamentale qui est de savoir comment un adénovirus délété de sa région E1A et d'une partie de sa région E1B est susceptible de se répliquer. Pourtant la réponse à cette question permettrait de mieux contrôler l'efficacité du transfert de gènes in vivo. Dans cette optique, la caractérisation de 532 qui pourrait éventuellement participer à l'activité E1A cellulaire (voir modèle plus haut), peut apporter des réponses à cette question et permettre de progresser dans le domaine de la vectorologie adénovirale. L'une des expériences qui peut être développée et élaborée dans cette perspective correspond à l'étude de l'expression et la réplication des mutants d'adénovirus ( délété ou muté dans la région E1A) en présence ou absence de 532 afin de tester la capacité de cette dernière à complémenter la déficience en E1 A virale.

Claims

REVENDICATIONS

1. Séquence nucléotidique caractérisée en ce qu'elle code pour un polypeptide cellulaire capable d'interagir avec des protéines de la famille p300/CBP et de la famille Rb, la susdite capacité d'interaction avec des protéines de la famille p300/CBP comprenant la capacité du polypeptide de s'associer in vitro dans une réaction de type protéine-protéine, avec une sonde exprimant l'enchaînement d'acides aminés compris entre les résidus 2366 et 2540 du polypeptide dCBP (SEQ ID NO : 11 ) représenté à la Figure 10.

2. Séquence nucléotidique, caractérisée en ce qu'elle code pour un polypeptide répondant à l'enchaînement de 967 acides aminés commençant au résidu Methionine en position 20 de la séquence d'acides aminés SEQ ID NO : 6 représentée à la figure 3, ou pour le polypeptide de 987 acides aminés SEQ ID NO : 6 représenté à la figure 3,ou pour un polypeptide variant, modifié par insertion, délétion ou substitution d'un ou plusieurs acides aminés du susdit polypeptide, le polypeptide variant ayant la capacité d'interagir avec des protéines de la famille p300/CBP et de la famille Rb.

3 Séquence nucléotidique selon l'une des revendications 1 ou 2, caractérisée en ce qu'elle code pour un polypeptide reconnu spécifiquement par un antisérum purifié comprenant des anticorps obtenus contre le peptide, ayant l'enchaînement d'acides aminés SEQ ID NO : 1 suivant :

QDNEYRNRYPLSPIR.

4. Séquence nucléotidique selon l'une quelconque des revendications 1 à 3 caractérisée en ce qu'il s'agit d'une séquence d'ADNc.

5. Séquence nucléotidique selon l'une quelconque des revendications 1 à 3 caractérisée en ce qu'il s'agit d'ADN génomique.

6. Séquence nucléotidique selon la revendication 4, caractérisée en ce qu'il s'agit de la séquence d'ADNc représentée à la figure 2, ou d'une séquence d'ADNc comprise dans la séquence SEQ ID NO : 5 représentée à la figure 2 entre les codons ATG en position 61 (G) et TAA en position 2965.

7. Séquence nucléotidique selon la revendication 5, caractérisée en ce qu'il s'agit de l'une des séquences d'ADN génomique SEQ ID NO : 4 ou SEQ ID NO : 13, représentées respectivement à la figure 1A et à la figure 1B.

8. Séquence nucléotidique selon l'une quelconque des revendications 1 à 5, caractérisée en ce qu'elle code pour un polypeptide cellulaire présent dans des cellules de mammifère.

9. Séquence nucléotidique selon l'une quelconque des revendications 1 à 5, caractérisée en ce qu'elle code pour un polypeptide cellulaire humain.

10. Séquence nucléotidique caractérisée en ce qu'elle hybride dans des conditions stringentes avec une séquence de nucléotides selon l'une quelconque des revendications 1 à 9.

11. Fragment d'une séquence nucléotidique selon l'une quelconque des revendications 1 à 10, caractérisé en ce qu'il comprend une séquence de nucléotides codant pour une séquence d'acides aminés dérivée d'un polypeptide cellulaire capable d'interagir avec des protéines de la famille p300/CBP et des protéines de la famille Rb.

12. Fragment d'une séquence nucléotidique selon l'une quelconque des revendications 1 à 10, caractérisé en ce qu'il code pour un polypeptide capable d'interagir avec des protéines de la famille p300/CBP et des protéines de la famille Rb.

13. Fragment d'une séquence nucléotidique selon l'une quelconque des revendications 1 à 10, caractérisé en ce qu'il code pour un polypeptide ayant un domaine immunophiline comportant 100 à 300 acides aminés.

14. Fragment selon la séquence 13, caractérisé en ce qu'il code pour le polypeptide comprenant les acides aminés 20 à 987 dans la séquence représentée à la figure 3 (SEQ ID NO : 6).

15. Fragment d'une séquence nucléotidique selon l'une quelconque des revendications 1 à 10, caractérisé en ce qu'il code pour un polypeptide comprenant les domaines fonctionnels suivants :

- un domaine immunophiline comprenant de 100 à 300 acides aminés,

- un domaine cyclophiline comprenant les acides aminés 1 à 200, environ,

- un domaine défini par les acides aminés EVES,

- un domaine de similitude avec la protéine E1A virale,

- un domaine de similitude avec la protéine cellulaire p53,

- un domaine répété (SEQ ID NO : 14) DSPX(K/R)(K/R),

- un domaine (SEQ ID NO : 15) TTPPHWK,

- un ou plusieurs domaines riches en acide aminé lysine,

- un ou plusieurs domaines SR.

16. Fragment de séquence nucléotidique, caractérisé en ce qu'il contient 200 à 300 nucléotides contigus d'une séquence nucléotidique selon l'une quelconque des revendications 1 à 15.

17. Polypeptide codé par une séquence de nucléotides selon l'une quelconque des revendications 1 à 16.

18. Polypeptide reconnu spécifiquement par un antisérum purifié comprenant des anticorps obtenus contre le peptide répondant à la séquence (SEQ ID NO : 1 ) QDNEYRNRYPLSPIR.

19. Polypeptide cellulaire, caractérisé en ce qu'il est capable d'interagir avec des protéines de la famille p300/CBP et des protéines de la famille Rb et capable de s'associer dans une réaction de type protéine-protéine, avec une sonde protéique PGEX2TKL31.3 MN comprenant l'enchaînement d'acides aminés du polypeptide dCBP, représenté à la Figure 10.

20. Polypeptide selon l'une quelconque des revendications 17 à 19, caractérisé en ce qu'il répond à l'enchaînement d'acides aminés SEQ ID NO : 6 représenté à la figure 3 ou à une partie de cet enchaînement comprenant les acides aminés 20 à 987.

21. Polypeptide selon l'une quelconque des revendications 17 à 19, caractérisé en ce qu'il est dérivé de cellules humaines.

22. Polypeptide dérivé d'un polypeptide selon l'une quelconque des revendications 17 à 21 , caractérisé en ce qu'il est capable d'interagir avec des protéines de la famille p300/CBP et des protéines de la famille Rb et en ce qu'il possède au moins un domaine fonctionnel choisi parmi les suivants :

- un domaine immunophiline comprenant de 100 à 300 acides aminés,

- un domaine cyclophiline comprenant les acides aminés 1 à 200, environ,

- un domaine défini par les acides aminés EVES,

- un domaine de similitude avec la protéine E1A virale,

- un domaine de similitude avec la protéine cellulaire p53, * un domaine répété (SEQ ID NO : 14) DSPX(K R)(K/R),

- un domaine (SEQ ID NO : 15) TTPPHWK,

- un ou plusieurs domaines riches en acide aminé lysine,

- un ou plusieurs domaines SR.

23. Antisérum purifié contenant des anticorps obtenus contre un polypeptide selon l'une quelconque des revendications 17 à 22.

24. Anticorps monoclonal dirigé contre un polypeptide selon l'une quelconque des revendications 17 à 22.

25. Procédé pour détecter la capacité d'un polypeptide à interagir avec l'activité de prolifération de cellules données, comprenant les étapes de :

- transfection des cellules avec une séquence de nucléotides selon l'une quelconque des revendications 1 à 16, dans des conditions permettant l'expression de cette séquence de nucléotides,

- détection de l'activité de prolifération des cellules transfectees.

26. Vecteur de clonage et/ou d'expression, caractérisé en ce qu'il comprend une séquence nucléotidique selon l'une quelconque des revendications 1 à 16.

27. Cellule recombinante, procaryote ou eucaryote, procaryote ou eucaryote, caractérisée en ce qu'elle contient une séquence nucléotidique selon l'une quelconque des revendications 1 à 16 ou un vecteur selon la revendication 26.

28. Utilisation de polypeptides selon l'une quelconque des revendications 17 à 22 dans un procédé de criblage in vitro de composés capables d'interagir physiquement et/ou fonctionnellement, avec lesdits polypeptides.