PROCÉDÉ IN VITRO DE PRODUCTION D 1 OVOCYTES OU D 1CEUFS PRÉSENTANT UNE MODIFICATION GÉNOMIQUE CIBLÉE
L ' invention concerne un procédé in vitro pour introduire dans un ovocyte ou un œuf une modification génomique ciblée ainsi qu'un procédé pour effectuer une insertion aléatoire dans le génome d'une cellule hôte .
La transgénèse est une technique de génétique moléculaire par laquelle de l 'ADN exogène est introduit dans le génome d 'un organisme multicellulaire et est transmis à la descendance de ce dernier. Cette transmission à la descendance impose l ' intégration stable dudit ADN dans le génome de l 'embryon et ceci à un stade précoce de développement.
À l 'heure actuelle, une des techniques de transgénèse les plus utilisées est celle de la micro-injection d'ADN nu dans un œuf de mammifères , laquelle conduit, dans un certain nombre de cas , à l ' intégration d'une partie des molécules d'ADN microinjectées dans le génome de l 'œuf . D ' autres techniques sont utilisables pour la transgénèse, et notamment les techniques d' introduction d'ADN exogène dans une cellule vivante qui sont bien connues de l ' homme du métier, notamment l 'électroporation, la transfection à l ' aide de précipités de phosphate de calcium, de liposomes ou de lipides modifiés tels que la lipofectamine® ( IN VITROGEN) .
Dans le cas d ' une intégration ciblée d'un ADN exogène dans le génome , il est nécessaire d'utiliser le mécanisme de recombinaison homologue . Dans ce cas , l 'ADN exogène doit présenter des séquences d ' acides nucléiques homologues avec celles présentes au niveau du site d' intégration ciblé dans le génome . Pour autant ces mécanismes de recombinaison homologue s 'opèrent à une fréquence extrêmement faible dans la plupart des organismes . Depuis peu, l 'utilisation
d 'endonucléases impliquées chez la levure dans le mécanisme de « intron homing » , lesquelles appartiennent à la famille des « méganucléases » , a permis d' augmenter de façon importante ces fréquences de recombinaison homologue dans des cultures cellulaires et notamment dans des cellules souches embryonnaires de mammifères (COHEN-TANNOUDJI et al . , Mol . CeIl. Biol . , vol .18 ( 3 ) , p : 1444-1448 , 1998 ) . Dans ces cellules , l ' induction de l 'expression d'une méganucléase exogène entraîne une coupure double brin dans l 'ADN génomique au niveau d'une séquence d' acides nucléiques spécifique de taille importante, 18 paires de bases pour la méganucléase I-Scel, suivie d'une recombinaison homologue entre des séquences d ' une molécule d'ADN exogène et des séquences homologues encadrant ce site de coupure . Ces méganucléases permettent ainsi de remplacer ou de déléter une séquence d' intérêt dans l 'ADN génomique ou encore d' introduire une séquence exogène dans l 'ADN génomique et ceci de façon « ciblée » .
De façon surprenante , les inventeurs ont mis en évidence qu' il était possible , en introduisant une séquence d' acide nucléique exogène et la méganucléase I-Scel dans un œuf , qui présente dans son génome un site I-Scel encadré par des séquences homologues à la séquence d' acides nucléiques exogène, d'obtenir un oeuf présentant une modification génomique ciblée correspondant à l ' insertion par recombinaison homologue d ' une séquence d ' acides nucléiques exogène au niveau du site I-Scel génomique .
La découverte des inventeurs permet de démontrer que si le mécanisme de recombinaison homologue qui utilise une méganucléase peut être mis en oeuvre in vivo, ledit mécanisme peut également être effectué directement dans des ovocytes ou des œufs avec une efficacité suffisante , et ceci sans compromettre la réalisation du programme de développement dudit organisme . Le procédé des inventeurs permet alors d 'obtenir un œuf ou un ovocyte présentant une modification génomique ciblée, et potentiellement d'obtenir
directement un organisme génétiquement modifié mature présentant une telle modification génomique ciblée, et ceci dans la totalité de ses cellules . Ladite modification génomique ciblée peut alors correspondre à une délétion ou à une insertion, notamment l ' insertion d'une séquence mutée par rapport à la séquence sauvage .
La cellule de l ' oeuf ou de l 'ovocyte contient un cytoplasme important comparé à celui d ' une cellule normale ce qui rend difficile l ' accès au noyau qui contient le matériel génétique . En outre, la présence d ' une membrane ( la membrane vitelline ) et d ' un chorion présents spécifiquement autour des oeufs pour les protéger limite l ' accès à la cellule . Ces barrières nécessitent généralement l ' utilisation de techniques particulières , comme l ' injection directe dans la cellule . La complexité des techniques utilisables limite le nombre d ' oeufs qu ' il est possible de traiter à quelques centaines d'œufs par expérience .
La faisabilité d 'un procédé de modification génomique ciblée au niveau de l 'oeuf ou de l 'ovocyte nécessitait donc que les événements induisant une modification génomique ciblée s ' opèrent avec une fréquence suffisante pour que l ' homme du métier puisse bénéficier d'une espérance raisonnable de réussite dans la mise en œuvre d'un tel procédé .
De toute évidence, une telle espérance raisonnable de réussite n'existait pas préalablement à la mise en œuvre du procédé selon l ' invention. En effet, en l ' absence de méganucléases , le mécanisme de recombinaison homologue est un processus génétique très rare au niveau de l 'œuf . La fréquence d'une telle recombinaison homologue est vraisemblablement inférieure ou égale à celle observée dans les cellules embryonnaires souches , soit environ un événement pour un million de cellules . L 'utilisation de méganucléases pour augmenter la fréquence de recombinaison
homologue , notamment dans des cellules souches embryonnaires (ES ; COHEN-TANNOUDJI et al . , 1998 , précité ) ne permettait pas plus à l ' homme du métier de bénéficier d'une espérance raisonnable de réussite . En effet, même si la fréquence de recombinaison homologue est augmentée dans ce cas , celle-ci atteint tout au plus une fréquence de 6 x 10"6, ce qui rendait de toute évidence ladite technique inapplicable à l 'œuf .
L ' article de COHEN-TANNOUDJI et al . ( 1998 , précité ) suggère au contraire à l ' homme du métier l 'utilisation d' un procédé de recombinaison homologue basé sur des cellules souches embryonnaires en culture , lesquelles présentent l ' avantage de pouvoir être obtenues en nombre important et de permettre l ' obtention d' animaux transgéniques après injection, dans un embryon au stade blastocyste, des rares cellules bénéficiant de la modification génomique ciblée . Pour autant, l ' organisme transgénique obtenu est qualifié de « mosaïque » dans la mesure où il présente à la fois des cellules dérivées de l 'embryon initial et des cellules souches embryonnaires génétiquement modifiées injectées . Il est alors nécessaire d' effectuer des croisements entre les animaux obtenus de façon à obtenir des animaux dont toutes les cellules sont génétiquement modifiées . Le procédé selon l ' invention permet d 'obtenir directement des animaux transgéniques dont toutes les cellules présentent la modification génomique ciblée . En outre, et dans le cas d'organismes dont aucune lignée de cellules souches embryonnaires n' a été isolée, l ' art antérieur suggérait à l ' homme du métier l ' isolement de telles cellules et en aucun cas le procédé selon l ' invention qui permet l ' obtention d' animaux transgéniques directement à partir de l 'œuf pour de tels organismes .
L ' article de SEGAL and CAROLL ( Proc. Natl . Acad. Sci .
USA, vol 92 , p : 806-810 , 1995 ) décrit un mécanisme de recombinaison homologue dans un ovocyte de xénope en présence de méganucléase I-Scel. Pour autant, ladite
recombinaison homologue est effectuée au niveau d'un plasmide circulaire qui présente un site I-Sce-I alors qu' aucun site n' existe dans l 'ADN génomique pour ladite méganucléase . En outre , si cet article montre l ' obtention de recombinaison homologue au niveau dudit plasmide , rien ne permettait de prédire une efficacité suffisante du mécanisme pour l ' appliquer à l 'ADN génomique . Le plasmide a été injecté en quantités très importantes et simultanément à la méganucléase I-Scel , laquelle est peu stable lorsqu' elle n' est pas fixée sur son site . Cette quantité importante de sites I-Sce I et cette co-injection, qui facilitait la stabilisation de la méganucléase, ne permettait en aucun cas de présager de la fréquence de recombinaison homologue obtenue en présence d 'un site rare, car localisé tout au plus à quelques copies dans l 'ADN génomique, et de surcroît difficilement accessible du fait de la structure compacte de l 'ADN génomique . On pouvait légitimement s ' attendre à ce que la structure de la chromatine et la rareté des sites ne permettent pas l ' accès de la méganucléase à l 'un de ses sites avant qu' elle n' ait été dégradée.
En conséquence, un premier objet de l ' invention correspond à un procédé in vitro de production d' ovocytes ou d'œufs de vertébrés non humains possédant une modification génomique ciblée comprenant :
a) une étape d ' expression d 'une endonucléase dans le noyau d'un ovocyte ou d'un œuf , caractérisé en ce que ladite endonucléase est introduite de façon exogène et en ce que l 'ADN génomique dudit œuf ou ovocyte présente au moins un site de reconnaissance pour ladite endonucléase , lequel site de reconnaissance correspond à une séquence d' acides nucléiques spécifique d' au moins 12 paires de bases permettant :
( i ) la fixation séquence spécifique de l 'endonucléase au niveau dudit site de reconnaissance,
( ii ) l ' induction consécutive d'une cassure double brin dans l 'ADN génomique par ladite endonucléase au niveau dudit site de reconnaissance ou dans ses régions avoisinantes , de préférence à moins de 100 paires de base dudit site de reconnaissance, puis
( iϋ ) la réparation de ladite cassure double brin par un mécanisme de recombinaison homologue ; et
b) une étape d' identification des œufs ou des ovocytes présentant la modification génomique ciblée recherchée .
Par œuf , on entend une cellule unique résultant de la fécondation d ' un gamète femelle par un gamète mâle et qui contient toutes les potentialités nécessaires à la formation d ' un nouvel organisme. Plus simplement, l 'œuf correspond à un embryon au stade une cellule .
Par ovocyte , on entend une cellule germinale femelle obtenue lors de la phase de maturation de l ' ovogenèse .
De préférence , le procédé selon l ' invention est un procédé in vitro de production d'œufs de vertébrés non humains possédant une modification génomique ciblée.
À titre d' exemple de vertébrés non humains dont on peut utiliser les œufs ou les ovocytes dans le procédé selon l ' invention, on peut citer les mammifères comme les rongeurs , les ovins , les bovins ou les primates non humains , les reptiles , les amphibiens comme le xénope, les oiseaux comme la poule, les insectes comme la mouche et les poissons comme le poisson zèbre ou Médaka. De préférence, l ' œuf ou l ' ovocyte utilisé dans le procédé de l ' invention est un œuf ou un ovocyte de poisson, comme le saumon, la
truite , le thon, le flétan, le poisson-chat, le poisson zèbre , le médaka, la carpe, l'épinoche, l' astyanax, le tilapia, le poisson rouge, le bar, l ' esturgeon ou la loche . De manière particulièrement préférée l 'œuf ou l 'ovocyte utilisé est un œuf ou un ovocyte de poisson zèbre ( Danio rerio) ou Médaka ( Orizias latipes) .
Le procédé selon l ' invention s ' applique également sans difficulté pour d' autres espèces aquatiques comme la grenouille , le xénope , la crevette, l 'oursin.
Par site de reconnaissance, on entend une séquence d' acide nucléique spécifique qui présente une longueur d ' au moins 12 paires de bases à laquelle ladite endonucléase se fixe spécifiquement et qui permet, après la fixation de 1 'endonucléase sur ce dernier, l ' induction d'une cassure double brin dans l 'ADN par ladite endonucléase . De préférence ledit site de reconnaissance correspond à une séquence d ' acide nucléique spécifique d' au moins 16 paires de base, et de manière particulièrement préférée d' au moins 18 paires de bases .
Par séquence d' acides nucléiques spécifiques , on entend une séquence d'ADN, de préférence une séquence d'ADN double brin.
L 'étape d' identification peut être effectuée en utilisant des techniques bien connues de l ' homme du métier. Cette étape d' identification peut utiliser, à titre d' exemple, les techniques de Southern ou de PCR, sur l 'ADN génomique isolé de l 'œuf ou de l ' ovocyte obtenu, utilisant une sonde ou des amorces spécifiques respectivement. Dans le cas où ladite modification génomique ciblée correspond à une insertion d' une séquence d' acides nucléiques exogènes comprenant un gène rapporteur, ladite étape d' identification peut utiliser des techniques de détection de l ' activité dudit gène rapporteur. De telles techniques de détection sont fonction du gène rapporteur utilisé et sont bien connues de l ' homme du métier. Dans le cas où
ladite modification génomique ciblée correspond à une insertion d'une séquence d' acides nucléiques exogènes comprenant un gène de sélection, ladite étape d' identification correspond à une étape de culture dudit ou ovocyte dans un milieu adapté . Les conditions de culture pour une telle étape sont fonction du gène de sélection utilisé et sont bien connues de l ' homme du métier.
Selon un mode de réalisation particulier, ladite séquence d' acide nucléique spécifique pour ladite endonucléase correspond à la séquence consensus de fixation déterminée pour ladite endonucléase ou à une séquence dérivée de ladite séquence consensus . En effet, certaines endonucléases sont capables de se fixer à des séquences ne présentant pas une identité parfaite avec leur séquence consensus et d ' effectuer, consécutivement à cette fixation, une cassure double brin au niveau de cette dernière ou dans ses régions avoisinantes .
Avantageusement, ladite séquence spécifique présente plus de 90% d' identité avec ladite séquence consensus , de préférence plus de 95% , et de manière particulièrement préférée plus de 98% avec ladite séquence consensus . Par pourcentage d' identité, on entend le pourcentage d ' acides nucléiques de nature et de position identique entre ladite séquence spécifique et ladite séquence consensus de fixation déterminée pour ladite endonucléase .
Selon l ' endonucléase utilisée, il est possible d'obtenir une cassure double brin dans l 'ADN soit au niveau dudit site de reconnaissance spécifiquement, soit dans les séquences avoisinantes dudit site de reconnaissance, de préférence à moins de 100 paires da bases dudit site de reconnaissance , préférentiellement a moins de 50 paires de bases , et de manière particulièrement préférée à moins de 20pb.
Avantageusement, la cassure double brin induite par l ' endonucléase est localisée au niveau de son site de reconnaissance dans l 'ADN génomique .
Ledit site de reconnaissance peut être présent dans l 'ADN génomique des individus sauvages ou il peut avoir été introduit dans ledit ADN génomique par transgénèse .
Selon un mode de réalisation préféré de la présente invention, ledit site de reconnaissance a été introduit par transgénèse dans l 'ADN génomique dudit œuf ou ovocyte . L' introduction de ce site de reconnaissance dans l 'ADN génomique a pu être effectué de façon ciblée ou aléatoire .
Avantageusement, ladite introduction par transgénèse a pu être effectuée soit dans ledit ovocyte ou œuf utilisé dans le procédé selon l ' invention, soit dans un ovocyte , un œuf ou une cellule à partir duquel ou de laquelle un organisme sexuellement mature a pu se développer et dont est issu 1 Ovocyte ou l 'œuf utilisé dans le procédé selon l ' invention.
Selon un mode de réalisation particulier dudit mode de réalisation préféré , l ' introduction dudit site de reconnaissance est effectuée de façon ciblée . Une telle introduction ciblée peut être effectuée par recombinaison homologue selon des techniques bien connues de l ' homme du métier. À titre d' exemple, COHEN-TANNOUDJI et al . ( 1998 , précité ) décrit l ' injection dans le noyau d'un vecteur qui contient un gène de sélection et un site de reconnaissance pour une méganucléase , lesquels sont encadrés par des séquences d' acides nucléiques homologues aux séquences cibles de l 'ADN génomique . Après sélection des cellules ayant intégrées la construction de manière stable , notamment en utilisant un milieu de culture approprié les cellules ayant intégré la construction à la position souhaitée dans l 'ADN génomique sont identifiées , notamment par Southern blot ou par PCR. Les taux de recombinaison
étant faibles dans ces conditions , le nombre de cellules présentant une insertion ciblée est extrêmement réduit .
Avantageusement, l ' introduction ciblée du site de reconnaissance pour ladite endonucléase dans l 'ADN génomigue est effectuée par recombinaison homologue .
Selon un deuxième mode de réalisation particulier dudit mode de réalisation préféré, l ' introduction dudit site de reconnaissance est effectuée de façon aléatoire . À cette fin, différentes technigues peuvent être utilisées . À titre d' exemple, CHOULIKA et al ( 1998 , Mol . CeIl . Biol . , vol .15 ( 4 ) , p : 1968-1973 , 1995 ) décrit l 'utilisation d'un vecteur rétroviral pour l ' intégration de sites de reconnaissance pour la méganucléase I-Sce I dans l 'ADN génomigue . La demande PCT WO 03/025183 décrit un autre procédé d' intégration aléatoire de sites de reconnaissance pour la méganucléase I-Sce I dans l 'ADN génomigue d'un œuf de poisson en micro-injectant simultanément dans son noyau la méganucléase I-Scel et un fragment d'ADN gui présente un gène rapporteur encadré par deux sites de reconnaissance pour I-Sce I. Il est également possible d' utiliser le procédé d' intégration aléatoire de séguences d ' acides nucléigues selon l ' invention décrit dans les exemples .
Avantageusement, l ' introduction aléatoire du site de reconnaissance pour ladite endonucléase dans l 'ADN génomigue est effectuée par le procédé d' intégration aléatoire de séguences d' acides nucléigues décrit dans la demande de brevet WO 03/025183 ou par le procédé d' intégration aléatoire de séguences d' acides nucléigues décrit dans les exemples .
De nombreuses endonucléases susceptibles de se lier à une séguence spécifigue d' au moins 12 paires de bases , d ' induire consécutivement une cassure double brin de l 'ADN au niveau de ladite séguence spécifigue, ou dans ses régions avoisinantes , et finalement d'entraîner la réparation de ladite cassure double brin par un mécanisme
de recombinaison homologue sont connues de l 'homme du métier. À titre d 'exemple de telles endonucléases , on peut citer les méganucléases .
Les méganucléases constituent une famille d' enzymes qui effectuent une coupure double brin de l 'ADN avec une fréquence très faible. En effet, lesdites méganucléases présentent des sites de reconnaissance de 12 à 40 paires de bases alors que les enzymes de restriction classiques présentent des sites de reconnaissance généralement de l ' ordre de 4 à 8 paires de bases . La probabilité de présence d'un tel site de reconnaissance dans l 'ADN génomique est donc extrêmement faible . Les méganucléases sont également bien caractérisées d' un point de vue structurel et mécanistique . Les méganucléases se répartissent en quatre familles distinctes sur la base de motifs d ' acides aminés conservés .
La famille dodécapeptide (dodécamère, DOD, DOD, D1-D2 , LAGLI6DADG, P1-P2 ) est la famille la plus importante avec plus de 150 séquences regroupées selon qu ' elles possèdent une ( I-Ceul, I-Crel) ou deux copies ( I-ChuI, I-Csml, I- Dmol, I-PanI, I-Scel, I-Scell, 1-SceIII, 1-SceIV, F-Scel, F-Scell, PI-Aael, PI-Apel, Pl-Ceul, Pl-CirI, Pl-CtrI, PI- Dral, PI-MavI, PI-MfII, PI-Mgol, PI-Mjal, PI-MkaI, PI-MIeI, PI-MtUl, PI-MtUHI, Pl-PablII, PI-Pful, PI-PhOl, PI-PkOl, Pl-Pspl, PI-Rmal, Pl-Scel, PI-SspI, PI-Tful, PI-TIiI, PI- T1ÎII, PI-TspI, PI-TspII, PI-BSpI, PI-MChI, PI-MfaI, PI- Mgal, PI-MgalI, PI-MinI, PI-Mmal, PI-MshI, PI-MsmII, PI- Mthl, PI- TagI, PI-ThylI) d'un motif conservé de douze acides aminés , le dodécapeptide . Les méganucléases avec un dodécapeptide présentent une masse moléculaire de l ' ordre de 20 kDa et agissent sous forme d' homodimère . Les méganucléases avec deux dodécapeptides présentent une masse moléculaire de 25 à 50 kDa, avec de 70 à 150 résidus entre les deux motifs , et sont actives sous forme de monomères .
La famille GIG présente un motif conservé complet KSGIY-X10/11-YIGS ( I-NcrI, I-NcrII, I-Panll, I-TevI) ou partiel ( I-TevII) et les enzymes de cette famille coupent l 'ADN en un site différent de leur site de reconnaissance .
La famille HC présente des séquences riches en histidines et en cystéines ( I-Popl, I-DirI, I-Emul, I- HmuII) avec généralement une séquence conservée qui correspond approximativement à « SHLC-G-G-H-C » . La méganucléase la mieux caractérisée pour cette famille est l 'enzyme I-Ppol.
La famille HNH présente une séquence consensus « HH-N- H-H » dans une fenêtre de 35 résidus ( I-TevIII) et des propriétés particulières de coupure de l 'ADN.
Toutefois , différentes méganucléases ont également été identifiées qui n' ont pas pu être associées à ces quatre familles . À l ' heure actuelle, ces méganucléases sont au nombre de cinq et correspondent à F-Scel, FSceII (HO) , F-
SuvI, F-TevI et F-TevII.
Pour autant, l ' ensemble de ces méganucléases est capable d' induire une cassure double brin dans l 'ADN présentant un site de reconnaissance , et ceci spécifiquement au niveau de celui-ci ou dans ses régions avoisinantes .
En outre, de nombreuses méganucléases présentent un signal de localisation nucléaire (NLS ) . Cette séquence protéique permet de faciliter l 'entrée de ladite méganucléase dans le noyau et ainsi la recombinaison homologue médiée par celle-ci . La méganucléase I-Scel constitue un exemple d'une telle méganucléase . Pour autant, l ' homme du métier peut construire une méganucléase dérivée présentant un tel signal de localisation nucléaire, dans le cas où un tel signal est absent de la méganucléase sauvage , et ceci selon des techniques bien connues de biologie moléculaire de production de protéines recombinantes .
Selon un deuxième mode de réalisation préféré du procédé de la présente invention, l ' endonucléase utilisée est une méganucléase ou une enzyme dérivée d'une telle méganucléase , lesquelles peuvent être synthétiques .
À titre d'exemple de méganucléases , on peut donc citer les méganucléases I-Ceul, I-Crel, I-ChuI, I-Csml, I-Dmol, I-PanI, I-Scel, I-Scell, 1-SceIII, 1-SceIV, F-Scel, F- Scell, PI-Aael, PI-Apel, Pl-Ceul, PI-CirIf PI-CtrIr PI- Dral, PI-MavI, PI-MfII, PI-Mgol, PI-Mjal, PI-MkaI, PI-MIeI, PI-MtUl, PI-MtUHI, Pl-PablII, PI-Pfui, PI-PhOl, PI-PkOl, PI-PspI, PI-Rmal, Pl-Scel, PI-SspI, PI-TfuI, PI-TlH, PI- TIiII, PI-TspI, PI-TspII, PI-BspI, PI-MchI, PI-MfaI, PI- Mgal, PI-MgalI, PI-MinI, PI-Mmal, PI-MshI, PI-MsmII, Pl- Mthl, PI- Tagl, PI-ThylI, I-NcrI, I-NcrII, I-PanII, I-TevI, I-Popl, I-Dirl, I-Hmul, I-HmuII, I-TevII, I-TevIII, F-Scel, F-Scell (HO) , F-SuvI, F-TevI et F-TevII ou une méganucléase dérivée de l 'une d'elles . Les sites de reconnaissances et les spécificités de ces différentes méganucléases sont bien connues de l ' homme du métier et sont décrites notamment sur le site http: //rebase . neb. com. De préférence, ladite méganucléase est la méganucléase I-Scel décrite dans le brevet US 6 , 238 , 924.
Par méganucléase dérivée ou enzyme dérivée d'une méganucléase , on entend une protéine recombinante présentant des séquences d'une méganucléase sauvage et qui est capable de reconnaître un site de reconnaissance différent de ladite méganucléase sauvage et/ou d' effectuer une cassure double brin de l 'ADN à une position différente ou selon un mécanisme différent de ladite méganucléase sauvage . Ladite méganucléase dérivée permet également d' entraîner la réparation de ladite cassure double brin par un mécanisme de recombinaison homologue . À titre d' exemple de telles méganucléases dérivées , on peut citer notamment des méganucléases recombinantes dont le domaine de liaison à l 'ADN est dérivé d ' autres protéines de liaison à l 'ADN comme les endonucléases de restriction de type IIS ou les
facteurs de transcriptions . À titre d'exemples de telles méganucléases dérivées , on peut également citer des méganucléases recombinantes qui présentent un ou plusieurs sites de localisation nucléaire absents des méganucléases sauvages dont elles sont dérivées .
L' endonucléase peut être introduite de façon exogène dans l 'oeuf ou l'ovocyte sous différentes formes , à savoir sous la forme d'une protéine ou sous la forme d'une séquence d' acides nucléiques permettant l 'expression de ladite endonucléase dans ledit œuf ou ovocyte .
Selon un troisième mode de réalisation préféré du procédé selon l' invention, l 'endonucléase est introduite dans l 'œuf ou l ' ovocyte sous la forme d'une protéine . Des techniques permettant l ' introduction d'une telle endonucléase sous la forme d'une protéine sont connues de l' homme du métier. À titre d'exemple de telles techniques , on peut citer notamment la micro-injection.
Avantageusement, la concentration de ladite endonucléase introduite de façon exogène est comprise entre 0 , 1 et 5 unités par μl et par œuf ou ovocyte, de préférence entre 0 , 5 et 2 , 5 unités par μl, et de manière particulièrement préférée entre 1 et 2 unités par μl .
le volume injecté par œuf ou ovocyte fait partie des connaissances générales de l' homme du métier et est de l 'ordre de 10% du volume de celui-ci .
À titre d'exemple , le volume susceptible d' être injecté dans un œuf ou ovocyte de poisson zèbre ou Médaka est compris entre 300 pi et 1 ni . La quantité d' acides nucléiques introduite par œuf ou ovocyte est alors comprise entre 0 , 3xl0"4 et 5xlO"3 unités , de préférence entre l , 5xlθ"4 et 2 , 5xlO"3 unités et de manière particulièrement préférée entre 0 , 3xl0"3 et 2xlO"3 unités .
Selon un quatrième mode de réalisation préféré du procédé selon la présente invention, l ' endonucléase est introduite sous la forme d'une molécule d' acides nucléiques permettant l ' expression de ladite endonucléase dans ledit œuf ou ovocyte .
Ladite molécule d' acides nucléiques comprend alors une phase ouverte de lecture, codant pour l ' endonucléase, sous le contrôle de séquences de régulation permettant l 'expression de ladite endonucléase dans l 'œuf ou l 'ovocyte .
Par molécule d ' acides nucléiques , on entend aussi bien des molécules d'ADN, d'ARN que des molécules hybrides ADN/ARN, lesquelles peuvent être sous forme simple brin ou double brin.
À titre d'exemple de molécule d' acides nucléiques utilisables dans le procédé selon l ' invention, on peut citer une molécule d'ARNm codant pour l ' endonucléase ou un vecteur d'expression comprenant une phase ouverte de lecture codant pour ladite endonucléase .
Par vecteur d'expression, on entend une molécule d' acides nucléiques capable de transporter et de permettre l 'expression d'une séquence d' acides nucléiques d' intérêt à laquelle elle est liée de façon opérationnelle . Un tel vecteur d' expression contient une séquence promotrice permettant l 'expression de ladite endonucléase dans l 'œuf ou 1 Ovocyte . À titre d' exemple de tels promoteurs , on peut citer notamment le promoteur de l 'o^-tubuline ou de l 'a- actine , ou encore des promoteurs constitutifs forts bien connus de l ' homme du métier tels que le promoteur du cytomégalovirus (CMV) . Ledit vecteur d' expression pourra en outre contenir d' autres séquences de régulation correspondant à une origine de réplication, un site de fixation au ribosome , un ou plusieurs sites d' épissage , un site de polyadénylation ou un site de terminaison de la transcription.
Un vecteur d'expression utilisable dans le procédé selon l ' invention peut correspondre, à titre non limitatif , à un YAC (chromosome de levure artificiel) , à un BAC (chromosome bactérien artificiel ) , à un vecteur viral , à un vecteur plasmidique , à un phagemide, à un cosmide, à un vecteur ARN, à un vecteur dérivé d'un baculovirus , d'un phage, d 'un transposon ou d'une molécule d'ARN ou d'ADN, linéaire ou circulaire . De tels vecteurs sont bien connus de l ' homme du métier. À titre d'exemple de vecteurs viraux, on peut citer notamment les rétrovirus , les adénovirus , les parvovirus , les coronavirus , les orthomyxovirus , les rhabdovirus , les paramyxovirus , les picornavirus , les alphavirus , les adénovirus , les herpèsvirus , les poxvirus .
De préférence, le vecteur d ' expression utilisé est un vecteur plasmidique .
Des techniques pour introduire dans un œuf ou un ovocyte une molécule d ' acides nucléiques sont bien connues de l ' homme du métier. À titre d' exemple de telles techniques , on peut citer la micro-injection, l 'électroporation, la transfection à l ' aide de liposomes ou de lipides modifiés tels que la lipofectamine® ( IN VITROGEN) , ou encore à l ' aide de précipités de phosphate de calcium. De préférence , cette introduction s ' effectue par la technique de micro-injection.
La modification génomique ciblée introduite à la suite de la recombinaison homologue au niveau du site de cassure double brin de l 'ADN peut correspondre soit à une délétion d'une séquence génomique, dans le cas où la recombinaison s ' effectue entre deux séquences homologues de l 'ADN génomique de part et d' autre du site de cassure , soit à une insertion dans le cas où la recombinaison a lieu, au niveau de régions homologues , entre une séquence d' acide nucléique exogène et l 'ADN génomique .
Selon un cinquième mode de réalisation préféré du procédé selon l ' invention, ledit procédé comprend en outre
une étape d' introduction, dans l 'ovocyte ou l 'œuf , d'une séquence d' acide nucléique exogène qui présente une homologie avec les séquences d' acides nucléiques localisées en amont et en aval du site de reconnaissance pour l 'endonucléase qui est présent dans l 'ADN génomique .
Par séquence d' acides nucléiques exogène, on entend une séquence d'ADN double brin qui est introduite dans un œuf ou un ovocyte, laquelle peut se trouver sous forme linéaire ou circulaire. De préférence, ladite séquence d' acides nucléiques exogène se trouve sous forme circulaire .
Avantageusement, la concentration de la séquence d' acides nucléiques administrée par œuf ou ovocyte est comprise entre 1 et 50ng par μl, de préférence entre 5 et 40 ng par μl, et de manière particulièrement préférée entre 10 et 30 ng par μl .
Comme vu précédemment, le volume injecté par œuf ou ovocyte fait partie des connaissances générales de l ' homme du métier et est de l 'ordre de 10% du volume de celui-ci .
À titre d' exemple , le volume susceptible d 'être injecté dans un œuf ou ovocyte de poisson zèbre ou Médaka est compris entre 300 pi et 1 ni . La quantité d' acides nucléiques introduite par œuf ou ovocyte est alors comprise entre 0 , 3 et 50 pg, de préférence entre 1 , 5 et 40 pg et de manière particulièrement préférée entre 3 et 30 pg.
Selon un mode de réalisation particulier dudit mode de réalisation préféré , ladite séquence d' acide nucléique exogène est dérivée de la séquence génomique, notamment une forme mutée de ladite séquence génomique ou une isoforme de ladite séquence génomique laquelle est issue d 'un autre individu ou d'un autre organisme . Dans ce cas , le mécanisme de recombinaison homologue entraîne une insertion de la séquence d' acides nucléiques exogène qui s ' apparente à un « remplacement » de la séquence génomique .
Selon un deuxième mode de réalisation particulier dudit mode de réalisation préféré , ladite séquence d' acides nucléiques exogène comprend une séquence d' acides nucléiques d' intérêt qui est encadrée par deux séquences d' acides nucléiques distinctes , lesquelles présentent une homologie avec les séquences d' acides nucléiques localisées en amont et en aval respectivement du site de reconnaissance pour l ' endonucléase qui est présent dans l 'ADN génomique.
Ladite séquence d ' acides nucléiques d' intérêt peut correspondre à un gène ou à une séquence régulatrice (comme un promoteur ou un activateur) dont on veut déterminer l ' activité et/ou le phénotype associé chez le vertébré transgénique obtenu par le procédé selon l ' invention. La séquence d' acide nucléique d' intérêt peut comprendre un gène rapporteur, comme la béta-galactosidase , la GFP ( green fluorescent protein) , la RFP (red fluorescent protein) , ou un gène de sélection, comme la néomycine phosphotransférase , à l ' hygromycine phosphotransférase, l ' histidinol déshydrogénase ou la thymidine kinase . L 'utilisation d'un tel gène rapporteur de sélection peut permettre de faciliter l ' identification des œufs ou des ovocytes présentant la modification génomique ciblée recherchée . De préférence , ledit gène rapporteur ou de sélection ne comporte pas de séquences promotrices associées de façon à identifier les œufs ou les ovocytes présentant le profil d' expression attendu correspondant à la modification génomique ciblée recherchée .
Avantageusement, la ou les séquences d' acides nucléiques , qui présentent une homologie avec les séquences d' acides nucléiques localisées en amont et en aval du site de reconnaissance pour l ' endonucléase, présentent une longueur d' au moins 50 paire de bases , de préférence d' au moins 100 paire de bases , et de manière particulièrement préférée d' au moins 250 paire de bases . Les dites séquences peuvent présenter une taille supérieure, pour autant une
taille de plus de 1 000 paire de bases n' augmente pas l ' efficacité de la recombinaison homologue .
Avantageusement encore, ladite ou lesdites séquences d' acides nucléiques homologues présentent une identité de séquence d' au moins 80 % avec les séquences d' acides nucléiques localisées en amont et en aval du site de reconnaissance pour l 'endonucléase dans l 'ADN génomique, de préférence une identité d' au moins 90 % , et de manière particulièrement préférée une identité d' au moins 95 % . L' identité entre deux séquences d' acides nucléiques correspond au pourcentage de nucléotides identiques et localisés à une position identique entre deux séquences d' acides nucléiques . De nombreux programmes ou algorithmes permettent de calculer des pourcentages d' identité parmi lesquels FASTA ou BLAST. Ces programmes sont notamment disponibles sur le site NCBI (National Center for Biotechnology Information ; http; //www. ncbi .nlm. nih. gov/ ) . De préférence , l ' homologie est déterminée par le programme BLAST, et de manière particulièrement préférée avec un programme BLAST utilisant la matrice BLOSUM62.
Avantageusement, ladite séquence d ' acides nucléiques exogène est un vecteur. Par vecteur, on entend une séquence d' acides nucléiques capable de transporter une séquence d' acides nucléiques d' intérêt à laquelle elle est liée .
À titre d' exemple de vecteurs utilisables dans le procédé selon l ' invention, on peut citer, à titre non limitatif, un YAC (chromosome de levure artificiel) , un BAC (chromosome bactérien artificiel ) , un vecteur viral adapté , tel qu 'un adénovirus , un vecteur plasmidique, un phagemide ou un cosmide .
De préférence le vecteur utilisé est un vecteur plasmidique .
Avantageusement, ladite séquence d' acide nucléique exogène ne présente aucun site de reconnaissance pour 1 'endonucléase .
Des techniques pour introduire dans un œuf ou un ovocyte une séquence d' acides nucléiques sont bien connues de l ' homme du métier. À titre d' exemple de telles techniques , on peut citer la micro-injection, l 'électroporation, la transfection à l ' aide de liposomes ou de lipides modifiés tels que la lipofectamine® ( IN VITROGEN) , ou encore à l ' aide de précipités de phosphate de calcium. De préférence , cette introduction s ' effectue par la technique de micro-injection.
L ' introduction de ladite séquence d' acides nucléiques exogène peut se faire de façon différée ou simultanée par rapport à celle de l ' endonucléase ou à la molécule d' acides nucléiques permettant l ' expression de ladite endonucléase .
De préférence , leur introduction est simultanée .
Selon un sixième mode de réalisation préféré du procédé selon l ' invention, le procédé selon l ' invention comprend en outre une étape de culture de 1 Ovocyte préalablement fécondé ou de l 'œuf présentant une modification génomique ciblée dans des conditions adaptées pour permettre le développement du vertébré non humain.
Avantageusement, les conditions de culture utilisées permettent le développement à terme du vertébré non humain.
Ces conditions de culture , de même que les techniques de fécondation d'ovocytes sont bien connues de l' homme du métier et sont fonction de l ' organisme utilisé dans le procédé de l ' invention.
À titre d' exemple et pour les œufs de poisson zèbre ou Médaka, cette étape de culture correspond à l ' incubation des œufs à une température de l ' ordre de 28°C, plus ou moins 1 ou 2°C .
Selon un septième mode de réalisation préféré du procédé selon l ' invention, ledit procédé comprend en outre une étape préalable à l ' étape de culture laquelle correspond à une incubation de l 'œuf à une température inférieure de 5 à 2O0C à la température de culture, de préférence inférieure de 10 à 15°C , et pendant un temps permettant de maintenir une viabilité des œufs supérieure à 5% , c ' est à dire le nombre d'œufs arrivant jusqu ' à l ' éclosion, de préférence supérieure à 10% , et de manière particulièrement préférée supérieure à 15% .
Le temps maximum pendant lequel les œufs ou ovocytes peuvent être maintenus peut être déterminé simplement par l ' homme du métier, et est fonction de la résistance à la température des œufs ou ovocytes utilisés .
Avantageusement, une telle incubation est effectuée pendant un temps compris entre 1 et 24 heures , de préférence entre 1 et 20 heures , et de manière particulièrement préférée entre 1 et 10 heures .
À titre d' exemple et dans le cas d'œufs de Médaka, cette étape préalable correspond à une incubation à une température comprise entre 10 et 25°C, de préférence entre
12 et 190C et de manière particulièrement préférée entre 13 et 18°C .
Avantageusement, l ' étape d' identification des œufs ou des ovocytes présentant la modification génomique ciblée recherchée est effectuée sur des cellules issues de l ' organisme vertébré non humain obtenu lors du développement desdits œuf ou des ovocytes après fécondation, de préférence sur des cellules issues de l ' organisme vertébré non humain mature .
D ' autres avantages et caractéristiques de l ' invention apparaîtront au regard des exemples qui suivent .
EXEMPLE 1 : Insertion aléatoire d'un site I-Scel dans le génome de Médaka
1 ) Construction Pa1TI-EGFP-I ;
La construction Pa1TI-GFP-I a été obtenue en insérant, dans le plasmide Pa1TI-EGFP (Goldman et al . , Transgenic Res. , vol.10 ( 1 ) , p: 21-33 , 2001; HIEBER et al. , J. Neurobiol . , vol.37 ( 3 ) , p: 429-440 , 1998 ) ) , un site de reconnaissance pour la méganucléase I-Scel entre le promoteur de l 'o^-tubuline du poisson zèbre et le gène rapporteur de l 'EGFP (Enhanced Green Fluorescent protein) .
Dans une première étape, la construction Pa1TI-EGFP a été digérée par l 'enzyme BamHI (BIOLABS ) et la construction digérée a ensuite été purifiée . La construction Pa1TI-EGFP digérée par BamHI a ensuite été déphosphorylée, puis purifiée de nouveau. Enfin, une réaction de ligature a été effectuée entre la construction Pa1TI-EGFP, digérée par BamHI et déphosphorylée, et un oligonucléotide double brin contenant le site I-Scel (en caractère gras ) ainsi que des extrémités libres cohésives, compatibles avec le site BamHI digéré (oligonucléotide sens (SEQ ID NO : 1 ) : 5 ' - GATCATAGGGATAACAGGGTAATA-3 ' ; oligonucléotide anti-sens (SEQ ID NO : 2 ) : 5 ' -GATCTATTACCCTGTTATCCCTAT-S ' ) . L' insertion et l 'orientation du site de reconnaissance pour I-Scel au niveau du site BamHI , entre la séquence promotrice de I OL1 tubuline et celle de la phase ouverte de lecture de EGFP, et la conservation du cadre de lecture ont été contrôlées par séquençage .
2 ) Construction pact-GFP!2 ;
La construction pact-GFPl2 a été obtenue comme décrit dans THERMES et al . (Mechanisms of Development, vol. 118 , p : 91-98 , 2002 ) . L' insertion et l'orientation des deux sites de reconnaissance fonctionnels pour la méganucléase I-Scel, en amont du promoteur de l'α-actine du poisson-
zèbre et en aval du gène rapporteur de la GFP (Green Fluorescent Protein) respectivement, a été contrôlée par séguençage.
3 ) Linéarisation des constructions Pa1TI-EGFP-I et pact-GFP!2 ;
Le transgène Oc1TI-EGFP-I sous forme linéarisé a été obtenu par digestion de la construction Pa1TI-EGFP-I par les enzymes Xhol et AfIII (BIOLABS) . Le fragment XhoI-AflII contenant le transgène a ensuite été purifié sur colonne QIAEX II® (QIAGEN) , puis filtration sur colonne Elutip-D® ( SCHLEICHER AND SCHUELL) .
Le transgène act-GFPl2 sous forme linéarisé a été obtenu par digestion de la construction pact-GFPl2 par la méganucléase I-Scel (ROCHE DIAGNOSTICS) . Le fragment I- scel-I-Scel contenant le transgène a ensuite été purifié comme précédemment.
4 ) Micro-injection des transgènes et de la méganucléase I-Scel
Différents ADN ont été injecté, en présence ou en l ' absence de méganuléase I-Scel, dans un œuf de médaka au stade une cellule selon le protocole décrit dans Thermes et al . ( 2002 , précité ) .
Dans les expériences réalisées , le transgène O1TI- EGFP-I a été injecté sous forme linéaire ( fragment Xhol- AfIII) et le transgène act-GFPI2 sous forme linéaire ( fragment Iscel-I-Scel) ou circulaire (pact-GFPl2 ) .
5 ) Expression des transgènes dans l 'œuf (FO ) :
Pour suivre l 'expression des transgènes dans les œufs micro-injectés , la fluorescence des embryons a été observée sous une loupe LEICA MZFLIII équipée d'une lampe U.V.
(excitation à 370-420 nm) et d'un filtre d'émission à 455 nm pour la GFP.
Dans des expériences préliminaires dans lesquelles le plasmide Pa1TI-EGFP seul , et sous forme circulaire, a été micro-injecté dans l 'œuf au stade une cellule , les résultats ont montré que la fluorescence de la GFP est détectable dans le SNC pendant la neurogenèse et jusqu ' à l 'éclosion ( 9 jours post-fécondation, st.39 ) . Plus précisément, ces expériences d ' expression transitoire de la construction Pa1TI-EGFP ont révélé que le promoteur de ^a1- tubuline de poisson-zèbre est activé au niveau du système nerveux central chez le médaka, principalement dans des cellules en cours de prolifération. L' activité spécifique de la construction apparaît donc similaire à celle décrite chez le poisson zèbre dans GOLDMAN et al . ( 2001 , précité ) .
Pour le transgène αiTI-EGFP-I , les résultats ont montré un profil d' expression similaire à celui de la construction Pa1TI-EGFP dans l 'œuf . Le profil d' expression du transgène act-GFPl2 est quant à lui similaire à celui observé dans THERMES et al . ( 2002 , précité ) .
La proportion d' embryons exprimant les transgènes dans les différentes expériences de micro-injection est décrite dans le tableau I ci-dessous .
Tableau I
En l' absence de méganucléase , on observe que près de 50% des embryons qui survivent à la micro-injection ne montrent pas de fluorescence . En revanche , lorsque les différents transgènes sont micro-injectés en présence de
méganucléase , on observe une augmentation importante de la proportion d'embryons exprimant la GFP . Ainsi, les résultats montrent, qu 'en présence de méganucléase I-Scel , les embryons négatifs pour l ' expression du transgène Ci1TI- EGFP-I représentaient environ 10 % de l ' ensemble des embryons injectés ( 12 % , n = 116 ) , soit une proportion inférieure à celle obtenue avec le transgène act-GFPI2 ( 16% ) . L' expression transitoire du transgène à la génération FO est donc fortement amélioré par la co- injection de la méganucléase .
6 ) Transmission du transgène à la descendance :
Les poissons de la génération FO exprimant le transgène ont été sélectionnés en tant que potentiel fondateur. Ces derniers ont été élevés jusqu' à leur maturité sexuelle et ont alors été croisés avec des partenaires sauvages . Les embryons de la descendance (Fl ) ont été analysés pour leur expression des transgènes . Les résultats sont présentés dans le tableau II ci-dessous .
Tableau II
Les résultats montrent que, dans le cas des injections contrôles ( sans co-injection avec I-Scel ) , la majorité des poissons testés n' étaient pas positifs pour la GFP . Ceci implique que le transgène était absent des cellules de la lignée germinale en FO .
Dans le cas du transgène act-GFPl2 , lequel est encadré par deux sites de reconnaissance I-Scel, on observe que près de 30% des individus ont intégré le transgène de façon stable dans leur génome . Le mécanisme proposé correspond a celui décrit dans THERMES et al . ( 2002 , précité ) selon lequel la méganucléase permettrait l ' intégration dans le génome d'un transgène encadré par « deux » sites de reconnaissance pour celle-ci . Selon le modèle proposé , le transgène serait excisé par la méganucléase, laquelle protégerait les extrémités libres et permettrait ensuite l ' intégration aléatoire du transgène excisé dans le génome .
De façon surprenante , on observe que parmi les 19 embryons co-injectés avec le transgène (X1TI-EGFP-I et J- Scel, et testés pour la transmission, 4 ( soit 21 % , n = 19 ) généraient des descendants exprimant la GFP . Il semble donc que le modèle proposé dans THERMES et al . ( 2002 , précité ) ne rende pas compte du mécanisme d' insertion du transgène en présence de la méganucléase puisque la présence d'un unique site de reconnaissance pour celle-ci, lequel n' est pas localisé à proximité immédiate des extrémités , permet également une intégration stable du transgène dans le génome avec une fréquence importante .
Les 4 individus fondateurs obtenus par l ' intégration du transgène Ci1TI-EGFP-I ont été nommés FO .191 , FO .251 , FO .341 et FO .361. Les individus Fl issus de ces fondateurs présentaient une fluorescence verte uniforme dans le SNC , alors observable dès le début de la neurogenèse, au stade early-neurula ( 25hpf , st.17 ) . Dans le cas du fondateur FO .251 , les individus Fl issus de celui-ci présentaient plusieurs niveaux d' expressions de la GFP . On a pu distinguer, par ordre de fluorescence croissante , des individus exprimant faiblement, moyennement ou fortement la GFP (nommées FO .25-1 , FO .25-2 et FO .25-3 , respectivement) . De telles variations en Fl peuvent être dues à la ségrégation de différents concatémères du transgène intégrés dans le génome , en FO , en trois sites
d' intégration génétiquement distincts . Ces embryons (Fl ) ont été élevés jusqu' à l 'éclosion et seuls ceux faiblement et moyennement fluorescents ont éclos et ont donné naissance à des poissons adultes sexuellement mâtures . La transmission du transgène aux générations suivantes ( i.e . F2 , F3 et F4 ) est demeurée uniforme ce qui confirme l ' intégration stable du transgène .
Le taux moyen de transmission des individus fondateurs a été estimé en suivant l ' expression des transgènes dans la descendance des individus Fl positifs . Les taux obtenus étaient très variables et inférieurs à 50 % . Dans le cas du transgène U1TI-EGFP-I , la moyenne était de 30 ± 12 , 5 % . Un seul des quatre poissons fondateurs (FO .191 ) atteignait alors de façon significative 50 % de transmission, ce qui correspond au pourcentage d' une transmission hémizygote . Dans ce cas, il est probable que le transgène se soit intégré en FO au niveau d'un site unique et dans toutes les cellules de la lignée germinale. En définitive, les résultats montrent une nette amélioration de l ' efficacité d' intégration du transgène dans la lignée germinale en présence de deux ou d'un seul site I-Scel .
7 ) Analyse de l ' intégration du transgène dans le génome ;
L 'ADN génomique a été extrait à partir de poissons transgéniques adultes Fl , en utilisant de la protéinase K et du phénol selon le protocole décrit dans SAMBROOK et al . ( CSH Laboratory Press, CoId Spring Harbor, 1989 ) .
7-A. transgène Cx1TI-EGFP-I ;
Pour les expériences de Southern-blot avec le transgène (X1TI-EGFP-I , l 'ADN génomique a été digéré par Sacl ou Notl, séparé sur un gel d' agarose 0.8 % (TAE Ix) et transféré par capillarité sur une membrane de nitrocellulose , laquelle a été hybridée avec une sonde spécifique marquée aléatoirement avec des nucléotides
radioactifs ( 32P ) . Cette sonde correspond à la séquence de l 'EGFP . L 'hybridation au transgène a été révélée phospho- imager après plusieurs heures d'exposition à un film d' argent. Les résultats sont présentés dans la figure 1.
Pour la lignée FO .19 , la digestion par Sacl ( site présent à l ' extérieure de la région reconnue par la sonde ) révèle la présence de deux bandes intenses de tailles proches de 4kb et de plusieurs bandes de tailles inférieures ( 2kb et environ 3kb) . Les deux bandes d' environ 4kb correspondent probablement à des insertions du transgène en tandem direct et en tandem inverse de type I respectivement (FIGURE 2A et 2B, respectivement ) . Pour les bandes de taille inférieure ( 2kb et environ 3kb) , celles-ci correspondent très probablement à des fragments de jonction entre l 'ADN intégré et l 'ADN génomique . L' intensité des deux bandes de 4kb, par rapport aux fragments de jonction, indique la présence de ces deux types de tandems en grand nombre dans le génome et dans des proportions comparables .
Pour les lignées FO .25-1 et —2 , les résultats montrent la présence d'une seule des deux bandes diagnostiques à 4kb (FIGURE 1 , flèche ) . La comparaison avec le profil en FO .19 indique qu' il s ' agit vraisemblablement d'une forme de concatémère en tandem inverse de type I (FIGURE 2B) . La faible intensité de ces bandes suggère la présence d'un nombre réduit de copies du transgène dans ces lignées . Ces résultats ont été confirmés pour ces trois lignées par des digestions Agel (extérieur à la région reconnue par la sonde ; données non montrées ) et BamHl (pas de sites dans le transgène ; données non montrées ) .
L ' utilisation de la digestion Notl a permis d' analyser les lignées pour la présence de la forme tandem inverse de type II ( figure 2C ) . Les résultats montrent que seule la lignée FO .19 présente de telles intégrations (FIGURE 1 , étoile ) .
L' analyse de l 'ADN génomique de la lignée FO .36 a révélé un profil de digestion équivalent à celui de l 'ADN de la lignée FO .19 (données non montrées ) .
En conséquence, les deux lignées FO .25 présentent un profil d' insertion avec des concatémères simples et en faible nombre de copie (tandems inverse de type I ) .
7-B. transgène act-GFP!2 :
L' analyse des lignées transgéniques obtenues avec ce transgène est décrite dans THERMES et al . ( 2002 , précité ) .
Les résultats montrent là encore des profils d' insertion avec un faible nombre de copies du transgène (de une à huit copies ) dans l 'ADN génomique des différentes lignées testées .
En conclusion, l ' utilisation de la méganucléase I-Scel et de constructions présentant un ou deux sites de reconnaissance pour celle-ci permet d'obtenir, dans la majorité des lignées analysées , un gène rapporteur intégré de façon stable dans le génome sous forme d'une copie simple ou d'un faible nombre de copies . Ces deux techniques d' insertion aléatoire constituent donc des techniques de premier ordre par rapport aux techniques habituellement utilisées en transgénèse dans lesquelles on observe des insertions en grand nombre dans le génome (HACKETT ,
Biochemistry and Molecular Biology of Fishes, Elsevier, p .207-240 , 1993 ; IYENGAR et al, Transgenic Res. , vol.5 , p : 147-166 , 1996 ) .
8 ) Intégrité des sites I-Scel intégrés ;
Dans le cas où il est envisagé d'utiliser les lignées transgéniques obtenues pour effectuer de la recombinaison homologue avec la méganucléase I-Scel, et permettre notamment l ' intégration ciblée d' un gène d' intérêt, il est important que le ( s ) site ( s ) I-Scel intégré ( s ) dans le génome soi (en)t fonctionnel ( s ) .
Afin de tester in vitro l ' intégrité des sites I-Scel intégrés dans le génome des les lignées FO .25-1 , -2 , FO .19 et FO .36 , l 'ADN génomique de ces lignées a été purifié . Ledit ADN génomique a ensuite été amplifié par PCR à l ' aide d' amorces spécifiques positionnées de part et d' autre du site de reconnaissance pour I-Sce I ( figure 3A) . Le fragment d'ADN amplifié présente une longueur de 500 paires de bases . Les produits de PCR obtenus ont ensuite été digérés par l ' enzyme I-Scel (ROCHE DIAGNOSTICS ) selon les instructions du fabricant, et finalement déposés sur un gel d' électrophorèse . Les résultats sont présentés dans la figure 3B.
La migration sur gel des produits de la réaction révèle la présence d'une bande à environ 500 pb, correspondant à l 'ADN non coupé, et de deux autres bandes de taille inférieures 200 et 300 pb (ADN coupé, FIGURE 3A et 3B) . La présence de la bande à 500pb peut résulter d'une digestion enzymatique incomplète ou bien de la présence de sites I-Scel mutés . Dans tous les cas , les résultats montrent que les 4 lignées analysées possèdent des sites I- Scel fonctionnels non mutés , lesquels sont en nombre variable en fonction de la lignée analysée .
EXEMPLE 2 : Insertion ciblée d'un transgène dans le génome d'une lignée transgénique de médaka présentant un site I-Scel
1 ) Construction de réparation (CR) :
Dans le but d' intégrer un transgène dans le génome de médaka de façon ciblée , nous avons testé la technique de réparation de brèche . Pour cela, nous avons utilisé un deuxième transgène contenant le gène traceur de la InRFP1 (monomeric red fluorescent protein) entouré de part et d ' autre par des séquences d' au moins 500 pb parfaitement homologues aux régions entourant le site I-Scel du transgène (X1TI-EGFP-I (CR, Construction de Réparation) . La région homologue en 5 ' correspond à la séquence intronique
du promoteur Cx1TI , ce qui écarte ainsi toute possibilité d'expression de la HiRPF1 sous forme épisomale .
Pour réaliser cette construction, le fragment Sacl- Notl du plasmide P1TI-EGFP ( 1.7 kb) , correspondant aux régions d' homologie situées de part et d' autre du site I- Scel , a été purifié et clone dans le vecteur pCRII-TOPO® ( Invitrogen) linéarisé par une digestion Sacl-Notl . Le plasmide RH obtenu a été contrôlé par séquençage .
Parallèlement, le fragment BamHI-EcoRI du plasmide InRFP1-PRSETB (Campbell et al . , Proc. Natl . Acad. Sci . USA, vol .99 ( 12 ) , p: 7877-82 , 2002 ) , correspondant à l ' ORF de la HiRFP1, a été sous clone dans le plasmide P1TI-EGFP, entre les sites BamHI et Notl , à la place de l 'EGFP . La construction obtenue a servi de matrice pour amplifier la séquence InRFP1-PoIyA par PCR en y ajoutant un site BgIII à chaque extrémité ( amorce sens ( SEQ ID NO : 3 ) : 5 ' - GAAGATCTCTTAAGCATGGCCTCCTCCGAGGAC-3 ' ; amorce antisens ( SEQ ID NO : 4 ) : 5 ' - CCTAGATCTGCTAGCATACATTGATGAGTTTGGAC-3 ' ) . Le produit de PCR obtenu a été clone dans le plasmide pCRII-TOPO® ( Invitrogen) et la séquence a été contrôlée par séquençage . Le fragment InRFP1-PoIyA a ensuite été isolé en effectuant une digestion SgIII de cette construction.
Finalement, la construction de réparation (CR) a été générée en introduisant le fragment InRFP1-PoIyA (digestion BgIII ) au niveau du site BamHI de la construction RH. Une construction contrôle Pa1TI-InRFPl-EGFP a été générée en introduisant ce même fragment InRFP1-PoIyA dans la construction P1TI-EGFP .
2 ) Micro-injection de la construction de réparation et de la méganucléase I-Scel
La construction de réparation a été co-injectée sous forme circulaire avec de la méganuléase I-Scel dans un œuf de médaka au stade une cellule selon le protocole décrit
dans Thermes et al . ( 2002 , précité ) . Les œufs utilisés étaient issus des lignées de poissons transgéniques (F3 ; FO .25-1 et -2 , FO .19 et FO .36 ) .
La construction de réparation (CR) a été injectée sous forme circulaire à une concentration finale d' environ lOng/μl, après amplification avec un kit Midiprep® (Qiagen) et filtration ( filtre 0.2 μm) , en présence de I-Scel à la concentration de 1 unité par μl .
Après injection des oeufs de médaka au stade une cellule, les oeufs sont placés dans un incubateur à 28°C jusqu ' à éclosion.
Simultanément et afin de vérifier l ' expression correcte de la mRFPl , la construction contrôle Pa1TI-InRFPl- EGFP a été injectée seule dans un œuf de médaka au stade une cellule selon le même protocole . L' injection de celle- ci a conduit à une bonne expression de la InRFP1 dans l 'embryon, sans traces de fluorescence verte .
3 ) Expression de la mRFPl dans l 'œuf (FO ) ;
Pour suivre l ' expression des transgènes au cours dans les œufs micro-injectés , la fluorescence des embryons a été observée sous une loupe LEICA MZFLIII équipée d'une lampe ϋ.V. (excitation à 580-590 nm) et d'un filtre d'émission à
607 nm pour la mRFPl .
Les embryons injectés ont été observés à la loupe pour leur fluorescence verte et rouge (en particulier) , vers les stades 28 ( 30 somites , 64 hpf ) et 32 ( fin de somitogenèse ,
4 jours post-fécondation) . Ces expériences ont permis d' isoler un embryon InRFP1 positif issu de la lignée FO .25-1
(expression faible de la GFP et intégration du transgène sous forme de concatémères simples ) . La fluorescence rouge est détectée uniquement dans le SNC : elle est faible mais uniforme, suggérant une répartition égale du transgène dans les premiers blastomères . Dans la mesure où ( i ) ce profil
d' expression correspond à celui obtenu avec la construction Pa1TI-InRFPl-EGFP et où ( ii ) la construction de réparation ne présente pas un promoteur de l 'Ct1 tubuline fonctionnel, il est possible de conclure que le gène mRFPl s 'est intégré spécifiquement, et par recombinaison homologue , en amont du promoteur de I Ot1 tubuline et au niveau d' au moins un des sites I-Scel préalablement intégrés dans le génome de la lignée FO .25-1.
Les résultats montrent donc qu ' il est possible d 'obtenir l ' insertion spécifique (par recombinaison homologue ) d'un transgène co-injecté avec une méganucléase dans le génome d'un œuf de médaka qui présente quelques copies d'un site de reconnaissance pour une telle méganucléase.
4 ) Modifications des conditions de micro-injection;
À partir des conditions décrites en 2 ) , diverses modifications du protocole ont été testées soit indépendamment l ' une de l ' autre soit ensemble . La liste des modifications testées est la suivante : - Augmentation de la quantité de construction de réparation jusqu ' à un maximum de 50 ng/ml ;
- Augmentation de la quantité de méganucléase jusqu ' à un maximum de 2 unités par μl ;
- Diminution de la température d ' incubation des oeufs après injection jusqu ' à un minimum de 13°C et pour une période variant de 2 à 16 heures avant de placer les œufs à 28°C .
L ' expression de la mRFP a été suivi dans les embryons obtenus comme décrit précédemment . Les résultats sont présentés dans le tableau III .
Tableau III
Les résultats montrent que les conditions les plus favorables pour l ' obtention d'une insertion spécifique sont de 2 unités/ml de méganucléase I-Scel et de 25 ng/ml d ' ADN. En outre, les résultats montrent également que l 'incubation des œufs à une température inférieure à 280C consécutivement à la micro-injection permet d' augmenter drastiquement le taux d' individus présentant un marquage (près de 3% pour une incubation de 4h à 130C suivant la micro-injection) .
EXEMPLE 3 : Insertion ciblée d 'un transgène dans le génome d'une lignée transgénique de médaka à l 'aide d ' autres méganucléases
On réalise dans un premier temps des intégrations aléatoires selon le protocole décrit dans l 'exemple 1 , mais avec les méganucléases I-Crel et I-Ceul et des constructions comprenant respectivement un site de reconnaissance pour la méganucléase I-Crel ( SEQ ID NO : 5 ;
5 ' -CTGGGTTCAAAACGTCGTGAGACAGTTTGG-S ' ) et I-Ceul ( SEQ ID NO : 6 ; 5 ' -CGTAACTATAACGGTCCTAAGGTAGCGAA-B ' ) entre le promoteur de l'cq-tubuline du poisson zèbre et le gène rapporteur de l 'EGFP .
Les constructions et le protocole utilisé pour effectuer l ' insertion ciblée sont les mêmes que précédemment décrit dans l ' exemple 2 mais en utilisant les méganucléases I-Crel et I-Ceul (NEW ENGLAND BIOLABS) .