FR3110576A1

FR3110576A1 - utilisation d’une protéine de fusion déficiente pour l’activité nucléase pour induire des recombinaisons méiotiques

Info

Publication number: FR3110576A1
Application number: FR2005361A
Authority: FR
Inventors: Alexandre Serero; Alain Nicolas
Original assignee: Meiogenix SAS
Current assignee: Meiogenix SAS
Priority date: 2020-05-20
Filing date: 2020-05-20
Publication date: 2021-11-26
Also published as: US20230174960A1; CA3177781A1; AU2021277562A1; WO2021234317A1; BR112022023468A2; WO2021234317A9; EP4153734A1

Abstract

La présente invention concerne une protéine de fusion comprenant un domaine d’une nucléase issue du système CRISPR de classe II, et un domaine Spo11, les deux domaines de la protéine de fusion présentant une activité nucléase déficiente, ainsi que l’utilisation de cette protéine pour induire des recombinaisons méiotiques ciblées dans une cellule eucaryote.

Description

utilisation d’une protéine de fusion déficiente pour l’activité nucléase pour induire des recombinaisons méiotiques

La présente invention relève du domaine des modifications génétiques ciblées chez les eucaryotes. Elle concerne notamment un procédé pour modifier une cellule eucaryote en induisant des recombinaisons méiotiques ciblées.

Arrière-plan technologique de l’invention

La modification du matériel génétique d'organismes eucaryotes s’est grandement développée ces vingt dernières années, et a trouvé une application dans le domaine des plantes, des cellules humaines et animales ainsi que des micro-organismes tels que les levures pour des applications dans les domaines de l'agriculture, de la santé humaine, de l’agro-alimentaire et de la protection de l'environnement.

Les levures trouvent leur application dans des domaines industriels extrêmement variés. Du fait de l’innocuité d’un grand nombre d’espèces, les levures sont notamment utilisées dans l’industrie alimentaire comme agent de fermentation en boulangerie, en brasserie, vinification ou distillerie, ou sous forme d’extraits comme éléments nutritionnels ou agents de sapidité. Elles peuvent également trouver leur usage dans la production industrielle de bioéthanol ou de molécules d’intérêt telles que des vitamines, des antibiotiques, des vaccins, des enzymes ou des hormones stéroïdiennes, ou encore dans les procédés de dégradation des matières cellulosiques. De la même façon, les plantes sont utilisées dans de nombreux domaines industriels, que ce soit dans l’industrie agro-alimentaire, cosmétique ou pharmaceutique.

La diversité des applications industrielles des levures et des plantes implique qu’il existe une demande constante pour des souches de levure et des variétés végétales présentant des caractéristiques améliorées ou, tout au moins, adaptées à une nouvelle utilisation ou de nouvelles conditions de culture. Afin d’obtenir une cellule ou un organisme eucaryote présentant une caractéristique particulière, l’homme du métier peut utiliser la reproduction sexuée et sélectionner une cellule ou un organisme hybride apportant la combinaison recherchée des caractéristiques parentales. Cette méthode est cependant aléatoire et l’étape de sélection peut engendrer des délais conséquents notamment dans le cas des levures et des plantes.

De manière alternative, l’homme du métier peut également modifier le patrimoine génétique d'une cellule ou d'un organisme par une technique d’ADN recombinant. Cette modification peut néanmoins constituer un frein à son exploitation, que ce soit pour des raisons réglementaires, sanitaires ou environnementales, notamment dans le cas des plantes considérées comme organismes génétiquement modifiés (OGM).

Une troisième alternative consiste à provoquer un réassortiment des allèles d’origine paternelle et maternelle dans le génome, au cours de la recombinaison méiotique. La recombinaison méiotique est un échange d’ADN entre chromosomes homologues au cours de la méiose. Après la réplication de l’ADN, la recombinaison est initiée par la formation de cassures double-brin dans l’une (ou l’autre) des chromatides des chromosomes homologues, suivie de la réparation de ces cassures, utilisant comme matrice une chromatide du chromosome homologue. Les recombinaisons méiotiques ont cependant l’inconvénient d’être non-uniformes. En effet, les sites de coupures double-brin à l’origine de ces recombinaisons ne sont pas distribués de façon homogène dans le génome. On distingue ainsi des régions chromosomiques dites ‘chaudes’ où la fréquence de recombinaison est élevée, et des régions chromosomiques dites ‘froides’ où la fréquence de recombinaison peut être jusqu’à 100 fois plus faible.

Spo11 est la protéine catalysant les cassures double-brin au cours de la méiose. Elle agit sous forme de dimère en coopération avec d’autres protéines partenaires. A l’heure actuelle, les facteurs déterminant le choix des sites de coupure double-brin par Spo11 et ses partenaires restent encore mal compris.

Le contrôle de la formation des cassures double-brin et, de fait, des recombinaisons méiotiques, est crucial pour le développement de techniques d’ingénierie génétique. Il a notamment été montré qu’il est possible de modifier les sites de formation de cassures double-brin en fusionnant Spo11 avec le domaine de liaison à l’ADN de l’activateur de transcription Gal4 (Pecina et al, 2002 Cell, 111 pp. 173-184,). Les protéines de fusion Gal4BD-Spo11 et Gal4-Spo11 permettent d’introduire des cassures double-brin dans des régions chromosomiques dites ‘froides’, au niveau des sites de liaison de Gal4 à l’ADN. Cependant, selon le système Spo11-Gal4, l’introduction de cassures double-brin ciblées est conditionnée par la présence de sites de liaison Gal4, rendant impossible d’induire des phénomènes de recombinaisons méiotiques ciblées indépendamment de sites de liaison spécifiques. La stimulation locale de la recombinaison méiotique sur un certain nombre de sites chromosomiques a également été rapportée en utilisant une protéine de fusion comprenant un domaine Spo11 et un domaine Cas9 et dans laquelle l’activité nucléase est portée par l’un ou l’autre de ces domaines (Demande internationale de brevet WO 2016/120480).

Ainsi, il reste un besoin de mettre à disposition des méthodes permettant d'induire facilement et spécifiquement la recombinaison méiotique de régions du génome inaccessibles aux techniques de l'art antérieur et pouvant s’appliquer à une large gamme de cellules eucaryotes.

L’objectif de la présente invention est de proposer une protéine de fusion ainsi qu’un procédé permettant d’induire des recombinaisons méiotiques ciblées dans des cellules eucaryotes, de préférence des cellules de levure ou de plante, dans n’importe quelle région du génome, de préférence plusieurs régions différentes du génome, indépendamment de tout site de liaison connu, et notamment dans des régions chromosomiques dites ‘froides’.

Ainsi, selon un premier aspect, la présente invention concerne une protéine de fusion comprenant (i) une nucléase associée à un système CRISPR, de préférence un système CRISPR de classe 2, et (ii) une protéine Spo11, dans laquelle la nucléase associée au système CRISPR et la protéine Spo11 ont une activité nucléase déficiente.

En particulier, la nucléase associée à un système CRISPR est une nucléase de classe II et de type II, V ou VI, de préférence de type II. De préférence, la nucléase est une nucléase associée à un système CRISPR choisie dans le groupe constitué par Cas1, Cas2, Cas9, Csn2, Cas13, C13a (C2c2), C13b, C13c, Cas12, C12a (Cpf1), C2c1 et C2c3.

Ladite protéine de fusion peut comprendre notamment un variant d’une protéine Spo11 dépourvu d’activité nucléase et/ou un variant d’une nucléase Cas9 dépourvu d’activité nucléase. De préférence, la protéine de fusion comprend un variant d’une protéine Spo11 dépourvu d’activité nucléase et un variant d’une nucléase Cas9 dépourvu d’activité nucléase.

Selon un deuxième aspect, la présente invention concerne un acide nucléique codant pour la protéine de fusion définie ci-dessus.

Selon un troisième aspect, la présente invention concerne également une cassette d’expression ou un vecteur comprenant un acide nucléique tel que défini ci-dessus.

Selon un quatrième aspect, la présente invention concerne également une cellule hôte non humaine comprenant une protéine de fusion, un acide nucléique, une cassette ou un vecteur tel que défini ci-dessus.

De préférence, la cellule hôte est une cellule eucaryote, de manière encore préférée une cellule de levure, de plante, de champignon ou une cellule animale, et de manière tout particulièrement préférée, la cellule hôte est une cellule de plante ou une cellule de levure. En particulier, la cellule hôte est une cellule de plante, la plante étant de préférence d’intérêt agronomique, horticole, pharmaceutique ou cosmétique, notamment les légumes, les fruits, les herbes, les fleurs, arbres et arbustes.

De préférence, la cellule de plante est sélectionnée dans le groupe constitué par du riz, du blé, du soja, du maïs, de la tomate, de l’oignon, du concombre, de la laitue, de l’asperge, de la carotte, du navet, d’Arabidopsis thaliana, de l’orge, du colza, du coton, de la vigne, de la canne à sucre, de la betterave, du coton, du tournesol, de l’olivier à palmes, du café, du thé, du cacao, de la chicorée, du poivron, du piment, du citron, de l’orange, de la nectarine, de la mangue, de la pomme, de la banane, de la pêche, de l’abricot, de la patate douce, des yams, de l’amande, de la noisette, de la fraise, du melon, de la pastèque, de l’olivier, et des plantes horticoles comme par exemple les rosiers, les tulipes, les orchidées et les géraniums. De préférence, la cellule de plante est sélectionnée dans le groupe constitué par le riz, le blé, le soja et le maïs.

Selon un cinquième aspect, l’invention concerne un procédé pour induire des recombinaisons méiotiques ciblées dans une cellule eucaryote non humaine, comprenant

- l’introduction dans ladite cellule :

a) d’une protéine de fusion, d’un acide nucléique, d’une cassette d’expression ou d’un vecteur tels que décris ci-dessus ; et

b) d’un ou plusieurs ARN guides ou d’un ou plusieurs acides nucléiques codant lesdits ARN guides, lesdits ARN guides comprenant une structure ARN de fixation à la nucléase associée à un système CRISPR de la protéine de fusion et une séquence complémentaire de la région chromosomique ciblée ; et

- l’induction de l’entrée en prophase I de méiose de ladite cellule.

La présente invention concerne encore, dans un sixième aspect, un procédé pour générer des variants d’un organisme eucaryote non humain, comprenant :

- l’introduction dans une cellule dudit organisme :

- l’induction de l’entrée en prophase I de méiose de ladite cellule ;

- l’obtention de cellule(s) présentant la ou les recombinaisons recherchées au niveau de la ou des régions chromosomiques ciblées ; et

- la genèse d’un variant de l’organisme à partir de ladite cellule recombinée.

Dans un septième aspect, la présente invention concerne également un procédé pour identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote non humaine, comprenant :

- l’introduction dans la cellule eucaryote :

- l’induction de l’entrée en prophase I de méiose de ladite cellule ;

- l’analyse des génotypes et phénotypes des cellules recombinées afin d’identifier ou de localiser l’information génétique codant pour la caractéristique d’intérêt.

De préférence, la caractéristique d’intérêt est un caractère quantitatif d’intérêt (QTL).

Dans un huitième aspect, la présente invention concerne enfin l’utilisation d’une protéine de fusion, d’un acide nucléique, d’une cassette d’expression ou d’un vecteur pour (i) induire des recombinaisons méiotiques ciblées dans une cellule eucaryote non humaine, (ii) générer des variants d’un organisme eucaryote non humain, et/ou (iii) identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote non humaine.

illustre la formation de molécules recombinantes dans la région du locus GAL2 induite par la protéine de fusion d Cas9-Spo11 ^Y135F .

Description détaillée de l’invention

Le système CRISPR(" Clustered Regularly Interspaced Short Palindromic Repeats ")est un système de défense mis en évidence chez les bactéries et les archées contre les ADN étrangers. Ces courts fragments correspondant à l’agent infectieux sont insérés dans une série de répétitions CRISPR et sont utilisés sous forme de guide ARN CRISPR (crARN) pour cibler l’agent infectieux lors d’infections ultérieures. Ce système repose essentiellement sur l’association d’une protéine endonucléase Cas (CRISPR- associated) et d’un ARN « guide » (ARNg ou sgRNA) responsable de la spécificité du site de clivage. Il permet la réalisation de cassures d’ADN double-brin (CDB) aux sites ciblés par le système CRISPR.

Il existe cinq types principaux de systèmes CRISPR qui se différencient par les répertoires des gènes associés aux CRISPR, l’organisation des opérons Cas et la structure des répétitions au sein des matrices CRISPR. Ces cinq types de systèmes ont été répartis en deux classes : la classe I regroupant les types I, III et IV qui utilisent un module effecteur crRNA multimérique et la classe II regroupant les types II, V et VI qui utilisent un module effecteur crRNA monomérique.

Les systèmes CRISPR de classe II et de type II, majoritairement représentés par les nucléases Cas9 et Csn2, comprennent un petit ARN agissant en trans appelé tracrARN("trans-acting cr RNA ")qui s'apparie avec chaque répétition du pré-crARN («CRISPR ARN ») pour former un ARN double brin [tracrARN:crARN] clivé par la RNase III en présence de l'endonucléase.

Les systèmes CRISPR de classe II et de type VI sont représentés par les protéines C13a (connue précédemment sous le nom C2c2), C13b et C13c. Le système CRISPR-C13 a été découvert chez la bactérieLeptotrichia shahii(Abudayyeh et al., Science 2016 ; 353(6299) : aaf5573) et est analogue au système CRISPR-Cas9. Cependant, contrairement à Cas9 qui cible l'ADN, les protéines C13 ciblent et clivent l'ARN simple brin.

Les systèmes CRISPR-Cas de classe II et de type V, sont entre autres représentés par la nucléase Cpf1 (également appelée Cas12a) récemment découverte chez la bactérieFrancisella novicida(Zetsche B, 2015 Cell, 163 : pp. 759–771), et les nucléases C2c1 (également appelée Cas12b) et C2c3 identifiées chez Alicyclobacillus acidoterrestris (Shmakov et al., 2015 Molecular Cell, 60, pp. 385-397). Cpf1 contient un domaine mixte alpha/bêta, un domaine RuvC-I suivi d'une région hélicoïdale, un domaine RuvC-II et un domaine en doigt de zinc. Un système CRISPR-Cpf1 fonctionnel ne nécessite pas de tracrARN mais seulement un crARN. En particulier, un crRNA de 42-44 nucléotides avec une séquence répétée directe d'environ 19 nucléotides suivie d'une séquence proto-espaceur de 23-25 nucléotides est suffisant pour guider l'endonucléase Cpf1 vers l’acide nucléique cible.

Le complexe Cpf1-crARN clive l'ADN ou l'ARN cible en identifiant un motif PAM 5'-YTN-3’ ou 5'-TTTN-3' adjacent au proto-espaceur (où "Y" est une pyrimidine et "N" est une nucléobase quelconque), par opposition au motif PAM riche en guanine (5'-NGG-3’) ciblé par Cas9. La reconnaissance d’un PAM riche en thymidine permet d’étendre le nombre de sites ciblés par la technique CRISPR aux régions riches en A-T dépourvues des motifs PAM et permet son utilisation dans des cellules présentant un génome riche en G, limitant ainsi la survenue de ciblage aspécifique ou « off-targets ».

Les inventeurs ont démontré qu’il était possible de modifier le système CRISPR afin d’induire des recombinaisons méiotiques ciblées dans une cellule eucaryote, et en particulier dans une levure ou une cellule de plante alors même que la protéine de fusion comprend deux domaines déficients pour l’activité nucléase. Ils ont en effet montré que l’expression combinée d’une protéine de fusion comprenant un domaine CRISPR/Cas et un domaine Spo11 et d’un ARN guide permettait de manière surprenante d’induire des recombinaisons méiotiques ciblées par le biais de cassures double-brin durant la prophase I de méiose et la réparation de ces cassures alors même que les deux domaines de la protéine de fusion sont déficients pour l’activité nucléase. Ce système n’a jamais été utilisé pour cibler des sites de recombinaison méiotique dans quelque organisme que ce soit.

Ainsi, selon un premier aspect la présente invention concerne une protéine de fusion comprenant (i) une nucléase associée à un système CRISPR, de préférence un système CRISPR de classe II, de manière préférée un système CRISPR de classe II et de type II, et (ii) une protéine Spo11, dans laquelle la nucléase associée au système CRISPR et la protéine Spo11 ont une activité nucléase déficiente. La protéine de fusion selon l’invention comprend (i) un domaine comprenant une protéine Spo11 (domaine Spo11) présentant une activité nucléase déficiente et (ii) un domaine comprenant une nucléase associée à un système CRISPR (Domaine CRISPR) présentant une activité nucléase déficiente.

De préférence, la protéine de fusion de la présente invention comprend un domaine CRISPR comprenant un variant d’une nucléase associée à un système CRISPR présentant une activité nucléase déficiente, et un domaine Spo11 comprenant un variant d’une protéine Spo11 présentant une activité nucléase déficiente.

Tel qu’utilisé ici, le terme « activité nucléase » se réfère à l’activité enzymatique d’une endonucléase qui possède un site actif permettant de créer des cassures ou coupures à l'intérieur des chaînes d'ADN ou d'ARN, de préférence des cassures double brin d’ADN. Par « activité nucléase déficiente » d’une protéine, on entend particulièrement une activité nucléase réduite, diminuée ou inexistante notamment par rapport à l’activité nucléase de la protéine sauvage dont est issu le variant. De préférence, l’activité nucléase de la protéine est réduite d’au moins 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 ou de 100%, par rapport à l’activité nucléase de la protéine sauvage.

Tel qu’utilisé ici, le terme « protéine de fusion » se réfère à une protéine chimérique comprenant au moins deux domaines issus de la combinaison de différentes protéines ou fragments de protéines. L’acide nucléique codant cette protéine est obtenu par juxtaposition des régions codant les protéines ou fragments de protéine de façon à ce que ceux-ci soient en phase et transcrits sur le même ARNm. Les différents domaines de la protéine de fusion peuvent être directement adjacents ou être séparés par des séquences de liaison (ou linker) qui introduisent une certaine flexibilité structurale dans la construction. La protéine de fusion selon la présente invention comprend un premier domaine qui est une nucléase associée à un système CRISPR et un second domaine qui est une protéine Spo11.

Spo11 est une protéine apparentée à la sous-unité catalytique A d’une topo-isomérase de type II présente chez les archaebactéries (Bergerat et al, Nature, 386, pp 414-7). Elle catalyse les cassures double-brin de l’ADN initiant les recombinaisons méiotiques. C’est une protéine très conservée au niveau évolutif pour laquelle il existe des homologues chez tous les eucaryotes. Spo11 est active sous forme d’un dimère formé de deux sous-unités, dont chacune clive un brin d’ADN. Spo11 n’agit pas seule. Chez la levureS. cerevisiae,par exemple, elle coopère avec les protéines, Rec102, MTOPVIB/TOPOVIB, Rec103/Sk18, Rec104, Rec114, Mer1, Mer2/Rec107, Mei4, Mre2/Nam8, Mre11, Rad50, Xrs2/Nbs1, Hop1, Red1, Mek1, Set1 et Spp1, comme décrits dans les articles de Keeney et al. (2001 Curr. Top. Dev. Biol, 52, pp. 1-53), Smith et al. (Curr. Opin. Genet. Dev, 1998, 8, pp. 200-211) et Acquaviva et al. (2013 Science, 339, pp. 215-218). Il a été démontré que le ciblage de Spo11 à un site donné est suffisant pour déclencher le processus de recombinaison méiotique (Pecina et al, 2002 Cell, 111, pp.173-184). Il est à noter que plusieurs homologues de la protéine Spo11 peuvent co-exister dans une même cellule, notamment chez les plantes. De préférence, lorsque plusieurs protéines de fusion sont introduites dans la cellule eucaryote, les différents domaines de Spo11 ou homologues de Spo11 introduits dans la cellule eucaryote sont tous déficients pour l’activité nucléase.

La protéine Spo11, le fragment ou domaine de celle-ci tel qu’utilisé dans la présente invention, peut être obtenu à partir de toute protéine Spo11 connue telle que la protéine Spo11 deSaccharomyces cerevisiae(Gene ID: 856364, Numéro d’entrée NCBI : NP_011841 (SEQ ID NO : 1), Esposito and Esposito, Genetics, 1969, 61, pp. 79-89), la protéine AtSpo11-1 et AtSpo11-2 d’Arabidopsis thaliana(Grelon M. et al, 2001, Embo J., 20, pp. 589-600), la protéine murine mSpo11 (Baudat F et al, 2000 Molecular Cell,, 6, pp. 989-998), la protéine Spo11 deC. elegansou encore la protéine Spo11 de drosophile meiW68 (McKim et al, 1998, Genes Dev, 12, pp. 2932-2942), sous réserve de modification rendant l’activité nucléase de Spo11 déficiente. Bien entendu, ces exemples ne sont pas limitatifs et toute protéine Spo11 connue présentant une activité nucléase déficiente peut être utilisée dans la protéine de fusion selon l’invention. De préférence, la protéine Spo11 est obtenue à partir d’une des protéines Spo11 de la cellule eucaryote d’intérêt. En particulier, un domaine Spo11 présentant une activité nucléase déficiente est un domaine Spo11 incapable de générer des cassures double brin.

Selon un mode de réalisation préféré, le domaine Spo11 comprend, ou consiste en, un variant d’une protéine Spo11, de préférence d’une protéine Spo11 deSaccharomyces cerevisiae, telle que par exemple la protéine de séquence NP_011841 (SEQ ID NO :1), comprenant une séquence présentant au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité avec une protéine Spo11, de préférence avec une protéine Spo11 deSaccharomyces cerevisiae, en particulier la protéine de séquence SEQ ID NO : 1, et présentant une activité déficiente.

Selon un mode de réalisation particulier, plusieurs protéines de fusion selon l’invention comprenant différents domaines Spo11 peuvent être introduites dans la même cellule. En particulier, lorsque plusieurs homologues de Spo11 existent dans la cellule eucaryote d’intérêt, les différentes protéines de fusion peuvent comprendre des homologues différents de Spo11. A titre d’exemple, deux protéines de fusion selon l’invention comprenant respectivement des domaines Spo11-1 et Spo11-2 d’Arabidopsis thalianaet modifiées pour rendre leur activité nucléase déficiente peuvent être introduites dans la même cellule, de préférence dans la même cellule d’Arabidopsis thaliana. Toujours à titre d’exemple, une ou plusieurs protéines de fusion selon l’invention comprenant des domaines Spo11-1, Spo11-2, Spo11-3 et/ou Spo11-4 de riz modifiés pour rendre leur activité nucléase déficiente, peuvent être introduits dans la même cellule, de préférence dans la même cellule de riz. De nombreux homologues de Spo11 ont été identifiés dans différentes espèces, en particulier dans les espèces végétales (Sprink T et Hartung F, Frontiers in Plant Science, 2014, Vol. 5, article 214, doi: 10.3389/fpls.2014.00214 ; Shingu Y et al, BMC Mol Biol, 2012, doi: 10.1186/1471-2199-13-1). L’homme du métier peut aisément identifier les homologues de Spo11 dans une espèce donnée, notamment au moyen de techniques bien connues de bio-informatique.

Selon un mode de réalisation préféré, le domaine Spo11 comprend, ou consiste en, une protéine Spo11 de plante, notamment choisie parmi : les protéines Spo11 d’Arabidopsis thaliana, par exemple telles que décrites sous la référence Uniprot Q9M4A2-1 (SEQ ID NO : 10), les protéines Spo11 d’Oryza sativa(riz), par exemple telles que décrite par Fayos I. et al., 2019 Plant Biotechnol J. Nov;17(11):2062-2077 et sous les références UniProt Q2QM00 (SEQ ID NO : 11), Q7Y021 (SEQ ID NO : 12), Q5ZPV8 (SEQ ID NO : 13), A2XFC1 (SEQ ID NO : 14) et Uniprot, Q6ZD95(SEQ ID NO : 46), les protéines Spo11 deBrassica campestris(moutarde), par exemple telles que décrites sous les références UniProt A0A024AGF2 (SEQ ID NO : 15) et A0A024AHI2 (SEQ ID NO : 16), les protéines Spo11 deZea mays(maïs), par exemple telles que décrites sous les références Uniprot B6UAQ8 (SEQ ID NO : 17) et B6TWI5 (SEQ ID NO : 18), A0A1P8W169-1 (SEQ ID NO : 47) et A0A1P8W163 (SEQ ID NO : 48), les protéines Spo11 deCapsicum baccatum(poivrier), par exemple telles que décrites sous les références A0A2G2WFG5 (SEQ ID NO : 19) et A0A2G2WFH4 (SEQ ID NO : 20), la protéine Spo11 deCarica papaya(papaye) par exemple telle que décrite sous la référence Uniprot A0A024AG98 (SEQ ID NO : 21).

En particulier, le domaine Spo11 peut comprendre, ou consister en, un variant d’une protéine Spo11 choisie parmi l’une des protéines Spo11 mentionnées ci-dessus, de préférence les séquences SEQ ID NO : 1 et 10 à 21 et 46-48, ledit variant comprenant une séquence présentant au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité avec l’une de ces séquences et une activité nucléase déficiente.

Un variant d’une protéine Spo11 qui présente une activité nucléase déficiente est encore appelé « dead Spo11 » ou « dSpo11 ». Selon un mode particulier, la capacité de clivage de l’ADN ou de l’ARN et/ou l’activité hydrolase de la nucléase Spo11 est réduite ou diminuée, notamment par rapport à l’activité nucléase de la protéine Spo11 sauvage dont est issu le variant. De préférence, l’activité nucléase du variant de Spo11 compris dans le domaine Spo11 est réduite d’au moins 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 ou de 100%, par rapport à l’activité nucléase de la Spo11 sauvage. De manière tout particulièrement préférée, le variant est dépourvu d’activité nucléase.

En particulier, le domaine Spo11 présentant une activité nucléase déficiente peut comprendre un site catalytique muté, la mutation impactant négativement la capacité nucléasique ou hydrolytique du domaine Spo11. De préférence, le domaine Spo11 peut comprendre, ou consister en, un variant d’une protéine Spo11 dans lequel le résidu correspondant à la tyrosine en position 135 de la SEQ ID NO : 1 est substitué par une phénylalanine, notamment tel que présenté dans la SEQ ID NO : 2. Un variant présentant une telle substitution est incapable d’induire des cassures double-brin de l’ADN (Bergerat et al, Nature, vol. 386, pp 414-7). Ainsi, le domaine Spo11 peut être un variant des séquences SEQ ID NO : 1 et 10 à 21 et 46-48, présentant au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité avec l’un de ces séquences et dans lequel le résidu correspondant à la tyrosine en position 135 de la SEQ ID NO : 1 est substitué par une phénylalanine.

De préférence, le domaine Spo11 présentant une activité nucléase déficiente est toujours capable de recruter un ou plusieurs des partenaires de Spo11, notamment un ou plusieurs des partenaires décrits ci-dessous. Ainsi, bien que l’activité nucléase du domaine Spo11 puisse être altérée, sa capacité à interagir avec les partenaires de Spo11 est de préférence conservée.

En particulier le partenaire peut être choisi parmi les protéines citées dans les articles de Keeney et al. (2001 Curr. Top. Dev. Biol, 52, pp. 1-53), Smith et al. (Curr. Opin. Genet. Dev, 1998, 8, pp. 200-211), Acquaviva et al. (2013 Science, 339, pp. 215-8), Roberts et al. (Science 2016: Vol. 351, pp. 943-949) et Frank R. Blattner (Plant Systematics and Evolution volume 302, pages239–244 (2016). De préférence, la protéine de fusion selon l’invention est toujours capable de recruter un partenaire de Spo11 choisi parmi Rec102, MTOPOVIB/TOPOVIBL, Rec103/Ski8, Rec104, Rec114, TOPOVIB, Mer1, Mer2/Rec107, Mei4, Mre2/Nam8, Mre11, Rad50, Xrs2/Nbs1, Hop1, Red1, Mek1, Set1 et Spp1, et les orthologues de ceux-ci.

La protéine de fusion selon la présente invention comprend également une nucléase associée à un système CRISPR (domaine CRISPR).

Selon un mode de réalisation, la protéine de fusion selon l’invention comprend une nucléase associée à un système CRISPR de classe II, de préférence de type II, V ou VI, préférentiellement de type II, présentant une activité nucléase déficiente. Le type II inclus les types II-A,II-B,II-C,II-C, le type V les types V-A, V-B, V-C, V-D, V-E, V-U1, V-U2, V-U3, V-U4, V-U5 et le type VI les types VI-A,VI-B1,VI-B2,VI-C,VI-D.

Selon un mode de réalisation, la protéine de fusion selon l’invention comprend une nucléase associée à un système CRISPR choisie parmi le groupe constitué par Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (également connu sous le nom de Csn1 et Csx12), Cas10, Cas11 (SS), Cas12a (Cpf1), Cas12b (C2c1), Cas12c (C2c3), Cas12d (CasY), Cas12e (CasX), C2c4, C2c8, C2c5, C2c10, C2c9, Cas13a (C2c2), Cas13b (C2c6), Cas13c (C2c7), Cas13d, Csa5, Csc1, Csc2, Cse1, Cse2, Csy1, Csy2, Csy3, Csf1, Csf2, Csf3, Csf4, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csn2, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx13, Csx1, Csx15, SdCpf1, CmtCpf1, TsCpf1, CmaCpf1, PcCpf1, ErCpf1, FbCpf1, UbcCpf1, AsCpf1, LbCpf1, leurs homologues, leurs orthologues, leurs variantes ou leurs versions modifiées, et présentant une activité nucléase déficiente.

Selon un mode de réalisation, la protéine de fusion selon l’invention comprend une nucléase associée à un système CRISPR choisie parmi le groupe constitué par Cas1, Cas2, Cas9, Csn2, Cas13, C13a (C2c2), C13b, C13c, Cas12, C12a (Cpf1), C2c1 et C2c3, et présentant une activité nucléase déficiente.

En particulier, le domaine CRISPR selon l’invention peut comprendre un variant d’une nucléase associée à un système CRISPR, de préférence choisie parmi le groupe constitué par Cas1, Cas2, Cas9, Csn2, Cas13, C13a (C2c2), C13b, C13c, Cas12, C12a (Cpf1), C2c1 et C2c3, ledit variant présentant une activité nucléase déficiente par rapport à la protéine sauvage.

Selon un mode de réalisation, la protéine de fusion selon l’invention est un variant d’une nucléase associée à un système CRISPR de classe II et de type II, par exemple Cas9 ou Cns2, notamment la nucléase Cns2 deStreptococcus thermophilus,par exemple telle que décrite sous le numéro d’accession GenBank: AEM62890.1, deStreptococcus pyogenes,par exemple telle que décrite sous le numéro d’accession GenBank: ANC25453.1, ou deStreptococcus canispar exemple telle que décrite sous le numéro d’accession GenBank: VTR80107.1

En particulier, le variant d’une nucléase associée à un système CRISPR, de préférence de classe II et de type II, présentant une activité nucléase déficiente, peut comprendre un site catalytique muté, la mutation impactant négativement la capacité nucléasique ou hydrolytique de la protéine mais n’impactant pas sa capacité d’interaction avec l’ARN guide et de reconnaître la région ciblée de l’acide nucléique.

Selon un mode de réalisation particulier, le variant de la nucléase associée à un système CRISPR déficient pour l’activité nucléase peut comprendre, ou consister en, un variant d’une protéine Cas9 déficient pour l’activité nucléase (domaine Cas9).

Le domaine Cas9 peut être constitué d’un variant d’une protéine Cas9 (aussi appelée Csn1 ou Csx12) ou d’un fragment de cette protéine capable d’interagir avec les ARN guides mais déficient pour l’activité nucléase. La protéine Cas9 peut également être tronquée afin de supprimer les domaines de la protéine non-essentiels aux fonctions de la protéine de fusion, en particulier les domaines de la protéine Cas9 qui ne sont pas nécessaires à l’interaction avec les ARN guides.

De manière générale, les protéines Cas9 comprennent deux domaines nucléases : un domaine apparenté à un domaine RuvC et un domaine apparenté à un domaine HNH. Ces deux domaines coopèrent pour créer des cassures double-brin de l’ADN (Jinek et al, Science, 337 : 816-821). Chacun de ces domaines nucléases peut être inactivé par délétion, insertion ou substitution en recourant à des techniques bien connues de l’homme du métier comme la mutagénèse dirigée, la mutagénèse par PCR ou la synthèse totale de gènes. Ainsi, le domaine RuvC peut être inactivé par exemple par la substitution D10A et le domaine HNH peut être inactivé par exemple par la substitution H840A (Jinek et al, 2012 Science, 337 pp. 816-821), les positions indiquées étant celles de la SEQ ID NO : 38. Ainsi, un variant d’une protéine Cas9 déficient pour l’activité nucléase peut être obtenu en inactivant l’un ou les deux domaines nucléases d’une protéine Cas9, par exemple en introduisant deux mutations ponctuelles substituant le résidu correspondant à l’aspartate en position 10 de la SEQ ID NO : 38 et/ou le résidu correspondant à l’histidine 840 de la SEQ ID NO :38 par des alanines, de préférence en introduisant deux mutations ponctuelles substituant le résidu correspondant à l’aspartate en position 10 de la SEQ ID NO :38 et le résidu correspondant à l’histidine 840 de la SEQ ID NO : 38 par des alanines.

Selon un mode de réalisation, le domaine Cas9 est déficient pour au moins une activité nucléase. Ce domaine peut être obtenu en inactivant au moins l’un des domaines nucléases de la protéine Cas9 tels que décrits ci-dessus.

Selon un mode de réalisation particulier, le domaine Cas9 comprend, ou consiste en, un variant d’une protéine Cas9 ou un fragment de protéine Cas9, dépourvu d’activité nucléase (aussi appelé Cas9* ou dCas9).

Le domaine Cas9 tel qu’utilisé dans la présente invention, peut être obtenu à partir de toute protéine Cas9 connue (Makarova et al, 2008, Nat. Rev. Microbiol., 9, pp. 466-477) et qui ont été notamment modifiée pour réduire ou inactiver l’activité nucléase. Des exemples de protéines Cas9 dont peuvent être issues le domaine Cas9 compris dans la protéine de fusion selon la présente invention incluent, sans y être limités, les protéines Cas9 deStreptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp ., Nocardiopsis dassonvillei , Streptomyces pristinaespiralis , Streptomyces viridochromogenes , Streptomyces viridochromogenes , Streptosporangium roseum , Streptosporangium roseum , Alicyclobacillus acidocaldarius , Bacillus pseudomycoides , Bacillus selenitireducens , Exiguobacterium sibiricum , Lactobacillus delbrueckii , Lactobacillus salivarius,Microscilla marina, Burkholderiales bacterium , Polaromonas naphthalenivorans , Polaromonas sp ., Crocosphaera watsonii , Cyanothece sp ., Microcystis aeruginosa , Synechococcus sp ., Acetohalobium arabaticum , Ammonifex degensii , Caldicelulosiruptor becscii , Candidatus Desulforudis , Clostridium botulinum, Clostridium difficile, Finegoldia magna, Natranaerobius thermophilus, Pelotomaculum thermopropionicum , Acidithiobacillus caldus , Acidithiobacillus ferrooxidans , Allochromatium vinosum , Marinobacter sp ., Nitrosococcus halophilus , Nitrosococcus watsoni , Pseudoalteromonas haloplanktis , Ktedonobacter racemifer , Methanohalobium evestigatum , Anabaena variabilis , Nodularia spumigena , Nostoc sp ., Arthrospira maxima, Arthrospira platensis , Arthrospira sp ., Lyngbya sp ., Microcoleus chthonoplastes , Oscillatoria sp ., Petrotoga mobilis , Thermosipho africanus,ouAcaryochloris marina.D’autres protéines Cas9 utilisables dans la présente invention sont également décrites dans l’article de Makarova et al. (Makarova et al, 2008, Nat. Rev. Microbiol., 9, pp. 466-477) et ont largement été décrites dans la littérature telle que les protéines Cas9 de Streptococcus pyogenes (SpCas9, notamment telle que décrite sous la référence Uniprot G3ECR1 ou selon SEQ ID NO : 38), Streptococcus thermophiles (St1Cas9, St3Cas9, notamment telle que décrite sous la référence Uniprot J7RUA5 ou selon la SEQ ID NO : 39), Staphylococcus aureus (SaCas9, notamment telle que décrite sous la SEQ ID NO : 40), Campylobacter jejuni (CjCas9, notamment telle que décrite sous la référence Uniprot Q0P897 ou selon la SEQ ID NO : 41), Francisella novicida (FnCas9, notamment telle que décrite sous la référence Uniprot A0Q5Y3 ou selon la SEQ ID NO : 42) et Neisseria meningitides (NmCas9, notamment telle que décrite sous la référence Uniprot X5EPV9 ou selon la SEQ ID NO : 43). En particulier, le domaine Cas9 peut comprendre un variant comprenant une séquence présentant au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité avec l’un de ces séquences et dans lequel le résidu correspondant à l’aspartate en position 10 de la SEQ ID NO : 38 et/ou le résidu correspondant à l’histidine en position 840 de la SEQ ID NO : 38 ont été substitués par des alanines, de préférence dans lequel le résidu correspondant à l’aspartate en position 10 de la SEQ ID NO : 38 et le résidu correspondant à l’histidine en position 840 de la SEQ ID NO : 38 ont été substitués par des alanines.

Selon un mode de réalisation particulier, le domaine Cas9 est un variant d’une protéine Cas9 entière, de préférence un variant de la protéine Cas9 deStreptococcus pyogenes(spCas9).

De préférence, le domaine Cas9 comprend, ou consiste en, une séquence présentant au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité avec la protéine Cas9 deStreptococcus pyogenes(Numéro d’entrée NCBI : WP_010922251.1, SEQ ID NO : 38) , ledit variant étant déficient pour l’activité nucléase, et de préférence dans lequel le résidu correspondant à l’aspartate en position 10 de la SEQ ID NO : 38 et/ou le résidu correspondant à l’histidine en position 840 de la SEQ ID NO : 38 ont été substitués par des alanines, de préférence dans lequel le résidu correspondant à l’aspartate en position 10 de la SEQ ID NO : 38 et le résidu correspondant à l’histidine en position 840 de la SEQ ID NO : 38 ont été substitués par des alanines. De préférence, le domaine Cas9 comprend, ou consiste en, une séquence comprenant la SEQ ID NO : 38 dans laquelle l’aspartate en position 10 et/ou l’histidine en position 840 ont été substitués par des alanines, dans laquelle l’aspartate en position 10 et l’histidine en position 840 ont été substitués par des alanines.

Selon un autre mode de réalisation, la protéine de fusion selon l’invention comprend une nucléase associée à un système CRISPR de classe II et de type V, de préférence Cpf1 (également appelé Cas12a), C2c1 (également appelé Cas12b) ou C2c3, préférentiellement Cpf1 et présentant une activité nucléase déficiente. En particulier, la nucléase associée à un système CRISPR de classe II et de type V, présentant une activité nucléase déficiente peut être un variant d’une nucléase associée à un système CRISPR de classe II et de type V comprenant un site catalytique muté, la mutation impactant négativement la capacité nucléasique ou hydrolytique de la protéine mais n’impactant pas sa capacité d’interaction avec l’ARN guide et de reconnaître la région ciblée de l’acide nucléique. De préférence, la protéine de fusion comprend un variant d’une nucléase Cpf1 (domaine Cpf1), ledit variant présentant une activité nucléase déficiente.

Le domaineCpf1 peut être issu de protéines Cpf1 des bactéries du genrePrevotella , M o raxella , Leptospira, Lachnospiraceae , Francissela , Candidatus , Eubacterium , Parcubacteria , Peregrinibacteria , AcidmicococcusetProphyromonas .En particulier, le domaine Cpf1 peut être obtenu à partir des protéines Cpf1 des bactériesParcubacteria bacteriumGWC2011_GWC2_44_17 (PbCpf1, par exemple telle que décrit sous le numéro d’accession Genbank KKT48220.1, SEQ ID NO : 22),Peregrinibacteria bacteriumGW2011_GWA_33_10 (PeCpf1, par exemple telle que décrit sous le numéro d’accession Genbank KKP36646.1, SEQ ID NO : 23),Acidaminococcus sp . BVBLG(AsCpf1, par exemple telle que décrit sous le numéro d’accession Genbank WP_021736722.1, SEQ ID NO : 24),Prophyromonas macacae(PmCpf1, par exemple telle que décrit sous le numéro d’accession Genbank WP_018359861.1, SEQ ID NO : 25),Prophyromonas crevioricanis(PcCpf1, par exemple telle que décrit sous le numéro d’accession Genbank WP_036890108.1, SEQ ID NO : 26),Francisella tularensis(UniProtKB : A0Q7Q2, SEQ ID NO : 27)Acidaminococcus sp .(UniProtKB : U2UMQ6, SEQ ID NO : 28),Prevotella disiens(PdCpF1, par exemple telle que décrit sous le numéro d’accession Genbank WP_004356401.1, SEQ ID NO : 29),Moraxellabovoculi 237 (MbCpf1, par exemple telle que décrit sous le numéro d’accession Genbank KDN25524.1, SEQ ID NO : 30),Leptospira inadai(LiCpf1, par exemple telle que décrit sous le numéro d’accession Genbank WP_020988726.1, SEQ ID NO : 31),Lachnospiraceae bacteriumMA2020 (LbCpf1, par exemple telle que décrit sous le numéro d’accession Genbank WP_044919442.1, SEQ ID NO : 32),Francisella novicidaU112 (FnCpf1, par exemple telle que décrit sous le numéro d’accession Genbank WP_003040289.1, SEQ ID NO : 33). Bien entendu, ces exemples ne sont pas limitatifs et toute protéine Cpf1 connue peut être utilisée pour obtenir le domaine Cpf1 de la protéine de fusion selon l’invention. Selon un mode de réalisation particulier, le domaine Cpf1 comprend, ou consiste en, un variant d’une protéine comprenant une séquence choisie parmi les séquences décrites ci-dessus, en particulier choisie parmi les séquences SEQ ID NO : 22 à 33, ledit variant comprenant une séquence présentant au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité avec l’une de ces séquences, ledit variant étant déficient pour l’activité nucléase par rapport à une protéine Cpf1 sauvage, de préférence par rapport à la protéine Cpf1 dont il est issu.

Ce type de variant peut comprendre notamment des mutations dans le domaine nucléase RuvC de Cpf1.

Afin de faciliter le ciblage de différentes régions du génome, le domaine Cpf1 peut également comprendre des mutations altérant la reconnaissance des PAM telles que décrites dans Gao et al., Nat Biotechnol. 2017 Aug; 35(8): 789–792. La protéine Cpf1 peut également être tronquée afin de supprimer les domaines de la protéine non-essentiels aux fonctions de la protéine de fusion, en particulier les domaines de la protéine Cpf1 qui ne sont pas nécessaires à l’interaction avec l’ARN guide. Selon un mode de réalisation particulier, le domaine Cpf1 comprend, ou consiste en, en un variant de la séquence deFnCpf1 (SEQ ID NO : 3) ouLbCp (SEQ ID NO : 4) comprenant une séquence présentant au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité avec la séquence SEQ ID NO : 3 ou 4, et dans lequel l’activité nucléase est réduite par rapport à l’activité nucléase de SEQ ID NO : 3 ou 4, de préférence ledit variant étant dépourvu d’activité nucléase.

De préférence, la nucléase associée à un système CRISPR déficiente pour l’activité nucléase peut comprendre, ou consister en, une protéine Cpf1 mutante par exemple telle que décrite dans Zhang et al., Cell Discov. 2018; 4: 36, comportant la mutation D832A (position correspondant à la SEQ ID NO : 38). Une protéine Cpf1 présentant une telle substitution est incapable d’induire des cassures double-brin de l’ADN, et peut notamment prendre le nom de « dead Cpf1 » ou « dCpf1 ». Le domaine Cpf1 peut être un variant des séquences SEQ ID NO : 3, 4 et 22 à 33 présentant au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité avec l’un de ces séquences et dans lequel le résidu correspondant à l’aspartate en position 832 de la SEQ ID NO : 3 ou 4 est substituée par une alanine. De préférence, le domaine dCpf1 peut comprendre ou consister en la séquence SEQ ID NO :5 ou SEQ ID NO : 6.

Selon un autre mode de réalisation, la protéine de fusion selon l’invention comprend un variant d’une nucléase associée à un système CRISPR de classe II et de type VI, de préférence de Cas13a (C2c2), Cas13b ou Cas13c, par exemple de la nucléase Cas13a deHerbinix hemicellulosilytica, en particulier telle que décrite sous le numéro d’accession GenBank: WP_103203632.1, la nucléase Cas13a deLachnospiraceae bacterium, en particulier telle que décrite sous le numéro d’accession GenBank : WP_022785443.1, ou la nucléase Cas13a deLeptotrichia wadei, en particulier telle que décrite sous le numéro d’accession GenBank : WP_021746003.1, et présentant une activité nucléase déficiente. En particulier, la protéine de fusion peut comprendre un variant de Cas13, en particulier un variant des protéines Cas13 décrites ci-dessus et présentant une activité nucléase déficiente, en particulier une activité nucléase abolie ou réduite. Ce type de variant peut comprendre notamment des mutations dans le domaine nucléase RuvC de Cas13. En particulier, la nucléase associée à un système CRISPR de classe II et de type VI, présentant une activité nucléase déficiente peut comprendre un site catalytique muté, la mutation impactant négativement la capacité nucléasique ou hydrolytique de la protéine mais n’impactant pas sa capacité d’interaction avec l’ARN guide et de reconnaître la région ciblée de l’acide nucléique.

Selon un mode de réalisation, le domaine Spo11 est du côté N-terminal et le domaine CRISPR du côté C-terminal de la protéine de fusion. Selon un autre mode de réalisation, le domaine Spo11 est du côté C-terminal et le domaine CRISPR du côté N-terminal de la protéine de fusion.

La protéine de fusion peut également comprendre une séquence signal de localisation nucléaire (SLN). Les séquences SLN sont bien connues de l’homme du métier et comprennent en général une courte séquence d’acides aminés basiques. A titre d’exemple, la séquence SLN peut comprendre la séquence PKKKRKV (SEQ ID NO : 7). La séquence SLN peut être présente à l’extrémité N-terminale, C-terminale ou dans une région interne de la protéine de fusion.

La protéine de fusion peut également comprendre un domaine supplémentaire de pénétration dans la cellule, c’est-à-dire un domaine facilitant l’entrée de la protéine de fusion dans la cellule. Ce type de domaine est bien connu de l’homme du métier et peut comprendre par exemple une séquence peptidique de pénétration dérivée de la protéine TAT du VIH-1 telle que GRKKRRQRRRPPQPKKKRKV (SEQ ID NO : 8), dérivée de la séquence TLM du virus de l’hépatite B humaine telle que PLSSIFSRIGDPPKKKRKV (SEQ ID NO : 9), ou une séquence peptidique polyarginine. Ce domaine de pénétration dans la cellule peut être présent à l’extrémité N-terminale, C-terminale ou être à l’intérieur de la protéine de fusion.

La protéine de fusion peut comprendre en outre une ou des séquences de liaison (linkers) entre les domaines CRISPR et Spo11, et optionnellement entre ces domaines et les autres domaines de la protéine tels que la séquence signal de localisation nucléaire ou le domaine de pénétration dans la cellule. La longueur de ces séquences de liaison est aisément ajustable par l’homme du métier. En général, ces séquences comprennent entre 10 et 20 acides aminés, de préférence environ 15 acides aminés et de manière encore préférée 12 acides aminés. Les séquences de liaison entre les différents domaines peuvent être de longueurs identiques ou différentes.

Selon un mode de réalisation particulier, la protéine de fusion comprend, ou consiste en, successivement, depuis l’extrémité N-terminale jusqu’à l’extrémité C-terminale : un signal de localisation nucléaire, une première séquence de liaison (linker1), un domaine CRISPR une seconde séquence de liaison (linker2) et un domaine Spo11.

Selon un autre mode de réalisation particulier, la protéine de fusion comprend, ou consiste en, successivement, depuis l’extrémité N-terminale jusqu’à l’extrémité C-terminale : un signal de localisation nucléaire, une première séquence de liaison (linker1), un domaine Spo11, une seconde séquence de liaison (linker2) et un domaine CRISPR, de préférence un domaine Cas9.

La protéine de fusion peut en outre comprendre une étiquette (ou tag) qui est une séquence définie d’acides aminés. Cette étiquette peut notamment être utilisée afin de détecter l’expression de la protéine de fusion, d’identifier les protéines interagissant avec la protéine de fusion ou de caractériser les sites de fixation de la protéine de fusion dans le génome. La détection de l’étiquette attachée à la protéine de fusion peut être réalisée avec un anticorps spécifique de ladite étiquette ou toute autre technique bien connue de l’homme du métier. L’identification des protéines interagissant avec la protéine de fusion peut être réalisée, par exemple, par des techniques de co-immunoprécipitation. La caractérisation des sites de fixation de la protéine de fusion dans le génome peut être réalisée, par exemple, par des techniques d’immunoprécipitation, d’immunoprécipitation de la chromatine couplée à une PCR quantitative en temps réel (ChIP-qPCR), d’immunoprécipitation de la chromatine couplée à des techniques de séquençage (ChIP-Seq), de cartographie à l’aide d’oligonucléotides (oligo mapping) ou toute autre technique bien connue de l’homme du métier.

Cette étiquette peut être présente à l’extrémité N-terminale de la protéine de fusion, à l’extrémité C-terminale de la protéine de fusion ou en position non-terminale dans la protéine de fusion. De préférence, l’étiquette est présente à l’extrémité C-terminale de la protéine de fusion. La protéine de fusion peut comprendre une ou plusieurs étiquettes, identiques ou différentes et dans toutes les combinaisons de localisation, en particulier au niveau de l’extrémité N-terminale, C-terminale, N- et C-terminales ou en positions internes à la protéine de fusion.

Les étiquettes, telles qu’utilisées dans la présente invention, peuvent être choisies parmi les nombreuses étiquettes bien connues de l’homme du métier. En particulier, les étiquettes utilisées dans la présente invention peuvent être des étiquettes peptidiques et/ou des étiquettes protéiques. De préférence, les étiquettes utilisées dans la présente invention sont des étiquettes peptidiques. Des exemples d’étiquettes peptidiques utilisables dans la présente invention incluent, sans y être limités, les étiquettes formées de répétitions d’au moins six Histidines (His), en particulier les étiquettes formées de six ou huit histidines, ainsi que les étiquettes Flag, polyglutamates, hémagglutinine (HA), calmoduline, Strep, E-tag, myc, V5, Xpress, VSV, S-tag, Avi, SBP, Softag 1, Softag 2, Softag 3, isopetag, SpyTag, tétracystéines et des combinaisons de celles-ci. Des exemples d’étiquettes protéiques utilisables dans la présente invention incluent, sans y être limités, les étiquettes Glutathion-S-Transférase (GST), protéine A deStaphlococcus aureus, Nus A, protéine de liaison à la chitine (CBP), thiorédoxine, protéine de liaison au maltose (MBP), protéines transporteuses de biotine carboxylées (BCCP), fragment constant des immunoglobulines (Fc), les étiquettes comprenant une protéine fluorescente telles que les protéines GFP (Green Fluorescent Protein), RFP (Red Fluorescent Protein), CFP (Cyan Fluorescent Protein) ou YFP (Yellow Fluorescent Protein), et des combinaisons de celles-ci.

Selon un mode de réalisation préféré, la protéine de fusion comprend une étiquette formée de six histidines et/ou d’un ou plusieurs motifs Flag, de préférence trois motifs Flag. Selon un mode de réalisation, la protéine de fusion comprend une étiquette formée de trois motifs Flag suivi de 6histine en C-terminal de la protéine de fusion. Additionnellement ou alternativement, la protéine de fusion comprend un motif V5, de préférence du coté N-terminal de la protéine de fusion. Le tag V5 est dérivé d'un petit épitope (Pk) trouvé sur les protéines P et V du paramyxovirus de la famille des virus simiens 5 (SV5). Le tag V5 est généralement utilisé avec 14 acides aminés (GKPIPNPLLGLDST, SEQ ID NO 44) ou 9 acides aminés plus court (IPNPLLGLD, SEQ ID NO : 45). Selon un mode de réalisation particulier, la protéine de fusion comprend une étiquette formée de six histidines et trois motifs Flag, de préférence en C-terminal, et un motif V5 en N-terminal.

La protéine de fusion telle que décrite ci-dessus peut être introduite dans la cellule sous une forme protéique, notamment sous sa forme mature ou sous la forme d’un précurseur, de préférence sous sa forme mature, ou sous la forme d’un acide nucléique codant ladite protéine.

Lorsque la protéine de fusion est introduite dans la cellule sous une forme protéique, des groupements protecteurs peuvent être ajoutés aux extrémités C- et/ou N-terminales afin d’améliorer la résistance de la protéine de fusion aux peptidases. Par exemple, le groupement protecteur à l’extrémité N-terminale peut être une acylation ou une acétylation et le groupement protecteur à l’extrémité C-terminale peut être une amidation ou une estérification. L’action des protéases peut également être contrecarrée par l’utilisation d’acides aminés de configuration D, la cyclisation de la protéine par formation de ponts disulfures, d’anneaux lactames ou de liaisons entre les extrémités N- et C-terminales. La protéine de fusion de l’invention peut également comprendre des liaisons pseudo-peptidiques remplaçant les liaisons peptidiques « classiques » CONH et conférant une résistance accrue aux peptidases, telles que CHOH-CH2, NHCO, CH2-O, CH2CH2, CO-CH2, N-N, CH=CH, CH2NH, et CH2-S. La protéine de fusion peut également comprendre un ou plusieurs acides aminés qui sont des acides aminés rares notamment l'hydroxyproline, l'hydroxylysine, l'allohydroxylysine, la 6-N-méthylysine, la N-éthylglycine, la N-méthylglycine, la N-éthylasparagine, l'allo-isoleucine, la N-méthylisoleucine, la N-méthylvaline, la pyroglutamine, l'acide aminobutyrique ; ou des acides aminés synthétiques notamment l'ornithine, la norleucine, la norvaline et la cyclohexyl-alanine.

La protéine de fusion selon l’invention peut être obtenue par synthèse chimique classique (en phase solide ou en phase homogène liquide) ou par synthèse enzymatique (Kullmann W, Enzymatic peptide synthesis, 1987, CRC Press, Florida). Elle peut également être obtenue par une méthode consistant à cultiver une cellule hôte exprimant un acide nucléique codant la protéine de fusion et récupérer ladite protéine à partir de ces cellules ou du milieu de culture.

La présente invention concerne également un acide nucléique codant la protéine de fusion selon l’invention, en particulier une protéine de fusion comprenant une nucléase de classe II du système CRISPR, de préférence de type II et préférentiellement Cas9, et un domaine Spo11 tous deux présentant une activité nucléase déficiente.

Au sens de l'invention, on entend par « acide nucléique » toute molécule à base d'ADN ou d'ARN. Il peut s'agir de molécules synthétiques ou semi-synthétiques, recombinantes, éventuellement amplifiées ou clonées dans des vecteurs, modifiées chimiquement, comprenant des bases non-naturelles ou des nucléotides modifiés comprenant par exemple une liaison modifiée, une base purique ou pyrimidique modifiée, ou un sucre modifié. De préférence, l’utilisation des codons est optimisée selon la nature de la cellule eucaryote.

L’acide nucléique selon l’invention peut être sous la forme d’ADN et/ou d'ARN, simple brin ou double brin. Selon un mode de réalisation préférée, l’acide nucléique est une molécule d’ADN isolée, synthétisée par des techniques recombinantes bien connues de l'homme du métier. L’acide nucléique selon l’invention peut être déduit de la séquence de la protéine de fusion selon l’invention et l’usage des codons peut être adapté selon la cellule hôte dans laquelle l’acide nucléique doit être transcrit.

La présente invention concerne en outre une cassette d’expression comprenant un acide nucléique selon l’invention lié de manière opérationnelle aux séquences nécessaires à son expression. Notamment, l’acide nucléique peut être sous le contrôle d’un promoteur permettant son expression dans une cellule hôte eucaryote. De manière générale, une cassette d’expression comprend, ou consiste en, un promoteur permettant d’initier la transcription, un acide nucléique selon l’invention, et un terminateur de transcription.

Le terme « cassette d'expression » désigne une construction d'acide nucléique comprenant une région codante et une région régulatrice, liées de manière opérationnelle. L'expression "lié de manière opérationnelle" indique que les éléments sont combinés de manière à ce que l'expression de la séquence codante soit sous le contrôle du promoteur transcriptionnel. Typiquement, la séquence du promoteur est placée en amont du gène d'intérêt, à une distance de celui-ci compatible avec le contrôle de son expression. Des séquences d'espacement peuvent être présentes, entre les éléments régulateurs et le gène, dès lors qu'elles n'empêchent pas l'expression. La cassette d’expression peut également comprendre au moins une séquence activatrice « enhancer » liée de manière opérationnelle au promoteur.

Une large variété de promoteurs utilisables pour l’expression de gènes d’intérêt dans des cellules ou des organismes hôtes sont à la disposition de l’homme du métier. Ils incluent des promoteurs constitutifs ainsi que des promoteurs inductibles qui sont activés ou réprimés par des stimuli physiques ou chimiques exogènes.

De préférence, l’acide nucléique selon l’invention est placé sous le contrôle d’un promoteur constitutif ou d’un promoteur spécifique de la méiose.

Des exemples de promoteurs spécifiques de la méiose utilisables dans le cadre de la présente invention comprennent, sans y être limités, les promoteurs endogènes de Spo11, les promoteurs des partenaires de Spo11 pour la formation des cassures double-brin, le promoteur Rec8 (Murakami & Nicolas, 2009, Mol. Cell. Biol, 29, pp. 3500-3516,), ou le promoteur Spo13 (Malkova et al, 1996, Genetics, 143, pp. 741-754,), des promoteurs méïotiquesd’Arabidopsis thalianapar exemple tels que décrits dans Li et al., BMC Plant Biol. 2012; 12: pp. 104, Eid et al., Plant Cell Rep. 2016, 35(7) pp. 1555-1558, Xu et al., Front. Plant Sci., 13 July 2018, Da Ines et al.,PLoS Genet, 2013, 9, e1003787).

D’autres promoteurs inductibles peuvent également être utilisés tels que le promoteur estradiol (Carlie & Amon, 2008 Cell, 133, 280-91,), le promoteur méthionine (Care et al, 1999, Molecular Microb 34, 792-798,), le système TetO/TetR inductible par la doxycline, les promoteurs induits par les chocs thermiques, les métaux, les stéroïdes, les antibiotiques et l’alcool.

Des promoteurs constitutifs utilisables dans le cadre de la présente invention sont, à titre d’exemples non limitatifs : le promoteur des gènes immédiats précoces du cytomégalovirus (CMV), le promoteur du virus simien (SV40), le promoteur tardif majeur des adénovirus, le promoteur du virus du sarcome de Rous (RSV), le promoteur du virus de la tumeur mammaire de souris (MMTV), le promoteur de la phosphoglycerate kinase (PGK), le promoteur du facteur d’élongation ED1-alpha, les promoteurs de l’ubiquitine, les promoteurs de l’actine, les promoteurs de la tubuline, les promoteurs des immunoglobulines, le promoteur de l’alcool déshydrogénase 1 (ADH1), les promoteurs dépendants de l’ARN polymérase III tels que les promoteurs U6, U3, H1, 7SL, pRPR1 (« Ribonuclease P RNA 1 »), SNR52 (« small nuclear RNA 52 »), ou le promoteur pZmUbi.

De préférence, la cassette d’expression et/ou l’acide nucléique selon l’invention est lié de manière opérationnelle à un promoteur transcriptionnel permettant une expression de cassette d’expression et/ou l’acide nucléique durant la méiose. Par exemple, un tel promoteur peut être pREC8.

Le terminateur de transcription peut être aisément choisi par l’homme du métier. De préférence, ce terminateur est RPR1t, la séquence flanquante du 3’ du gène SUP4 deSaccharomyces cerevisiaeou le terminateur de la nopaline synthase tNOS.

La présente invention concerne en outre un vecteur d’expression comprenant un acide nucléique ou une cassette d’expression selon l’invention. Ce vecteur d’expression peut être utilisé pour transformer une cellule hôte et permettre l’expression de l’acide nucléique selon l’invention dans ladite cellule. Les vecteurs peuvent être construits par des techniques classiques de biologie moléculaire, bien connues de l'homme du métier.

Avantageusement, le vecteur d’expression comprend des éléments régulateurs permettant l’expression de l’acide nucléique selon l’invention. Ces éléments peuvent comporter par exemple des promoteurs de transcription, des activateurs de transcription, des séquences terminatrices, des codons d’initiation et de terminaison. Les méthodes pour sélectionner ces éléments en fonction de la cellule hôte dans laquelle l’expression est souhaitée, sont bien connues de l’homme du métier.

Dans un mode de réalisation particulier, le vecteur d’expression comprend un acide nucléique codant la protéine de fusion selon l’invention, placé sous le contrôle d’un promoteur constitutif, de préférence le promoteur ADH1 (pADH1). Il peut également comprendre une séquence terminatrice telle que le terminateur ADH1 (tADH1).

Le vecteur d’expression peut comprendre une ou plusieurs origines de réplication, bactérienne ou eucaryote. Le vecteur d’expression peut notamment comprendre une origine de réplication bactérienne fonctionnelle chezE.colitelle que l’origine de réplication ColE1. Alternativement, le vecteur peut comprendre une origine de réplication eucaryote, de préférence fonctionnelle chez les plantes et chez les levures, notamment chezS. cerevisiae.

Le vecteur peut comporter en outre des éléments permettant sa sélection dans une cellule hôte bactérienne ou eucaryote comme, par exemple, un gène de résistance à un antibiotique ou un gène de sélection assurant la complémentation du gène respectif délété dans le génome de la cellule hôte. De tels éléments sont bien connus de l'homme du métier et largement décrits dans la littérature.

Dans un mode de réalisation particulier, le vecteur d’expression comprend un ou plusieurs gènes de résistance à des antibiotiques, de préférence un gène de résistance à l’ampicilline, à la kanamycine, à l’hygromycine, à la généticine et/ou la nourséothricine.

Le vecteur d’expression peut également comprendre une ou plusieurs séquences permettant l’insertion ciblée du vecteur, de la cassette d’expression ou de l’acide nucléique dans le génome d’une cellule hôte. De préférence, l’insertion est réalisée au niveau d’un gène dont l’inactivation permet la sélection des cellules hôtes ayant intégré le vecteur, la cassette ou l’acide nucléique, tel que le locusTRP1.

Le vecteur peut être circulaire ou linéaire, simple- ou double-brin. Il est avantageusement choisi parmi les plasmides, phages, phagemides, virus, cosmides et chromosomes artificiels. De manière préférée, le vecteur est un plasmide.

La présente invention concerne en particulier un vecteur, de préférence un plasmide, comprenant une origine de réplication bactérienne, de préférence l’origine ColE1, un acide nucléique tel que défini ci-dessus sous le contrôle d’un promoteur, de préférence un promoteur constitutif tel que le promoteur ADH1, un terminateur, de préférence le terminateur ADH1, un ou plusieurs marqueurs de sélection, de préférence des marqueurs de résistance tels que le gène de résistance à la kanamycine ou à l’ampicilline, et une ou plusieurs séquences permettant l’insertion ciblée du vecteur, de la cassette d’expression ou de l’acide nucléique dans le génome de la cellule hôte, de préférence au niveau du locusTRP1du génome d’une levure.

Selon un mode de réalisation, l’invention concerne en particulier un vecteur, de préférence un plasmide, compatible pour de l’agrotransfection, notamment en utilisantAgrobacterium tumefaciens(Fraley et al. Crit. Rev. Plant. Sci. 1986 4 pp. 1-46; Fromm et al., Biotechnology 1990, 8 pp. 833-844) ouAgrobacterium rhizogenes(Cho et al. 2000 Planta 210 pp. 195-204) et visant à la transformation de plantes. Un exemple de plasmide compatible est le plasmide de type Ti, notamment le pBIN19 (Lee and Gelvin, 2008 Plant Physiology 146(2): pp. 325-332). En particulier, lorsque destiné à une utilisationin planta, le vecteur selon l’invention comprend un marqueur sélectionnable. Les marqueurs sélectionnables les plus couramment utilisés pour la transformation des plantes incluent le gène conférant une résistance à la kanamycine néomycine phosphotransférase II (NPTII), servant à la sélection dans une culture contenant de la kanamycine, le gène du phosphinothricine acetyltransférase (HPH), servant à la sélection dans une culture contenant de l’hygromycine B.

Dans un mode de réalisation particulier, l’acide nucléique selon l’invention porté par le vecteur code pour une protéine de fusion comprenant une ou plusieurs étiquettes, de préférence comprenant une étiquette constituée de six histidines et/ou un ou plusieurs motifs Flag, de préférence trois motifs Flag. De préférence la ou les étiquettes sont en C-terminal.

La présente invention concerne également l’utilisation d’un acide nucléique, d’une cassette d’expression ou d’un vecteur d’expression selon l’invention pour transformer ou transfecter une cellule. La cellule hôte peut être transformée/transfectée de manière transitoire ou stable et l’acide nucléique, la cassette ou le vecteur peut être contenu dans la cellule sous forme d’épisome ou intégré dans le génome de la cellule hôte.

La présente invention concerne ainsi une cellule hôte comprenant une protéine de fusion, un acide nucléique, une cassette ou un vecteur d’expression selon l’invention.

De préférence, la cellule est une cellule eucaryote.

Tel qu’utilisé ici, le terme « cellule eucaryote », se réfère à une cellule de levure, de plante, de champignon ou une cellule animale, en particulier une cellule de mammifère telle qu’une cellule de souris ou de rat, ou une cellule d’insecte. La cellule eucaryote est non-humaine.

Selon des modes de réalisation préférés, la cellule eucaryote exprime une protéine Spo11 douée d’une activité nucléase, c’est-à-dire une protéine Spo11 capable d’induire des cassures double-brin lors de la prophase I de méiose. Cette protéine peut être une protéine Spo11 endogène de la cellule ou une protéine Spo11 hétérologue. De préférence, cette protéine est une protéine Spo11 endogène de la cellule.

Selon un mode de réalisation particulier, la cellule eucaryote est une cellule de levure, en particulier une levure d’intérêt industriel. Des exemples de levures d’intérêt comprennent, sans y être limités, les levures du genreSaccharomyces sensu stricto, Schizosaccharomyces , Yarrowia , Hansenula , Kluyveromyces , PichiaouCandida, ainsi que les hybrides obtenus à partir d’une souche appartenant à l’un de ces genres.

De préférence, la levure d’intérêt appartient au genreSaccharomyces. de préférence une levure sélectionnée dans le groupe constitué deSaccharomyces cerevisiae, Saccharomycesbayanus,Saccharomyces castelli , Saccharomyces eubayanus , Saccharomyces kluyveri , Saccharomyces kudriavzevii , Saccharomyces mikatae , Saccharomyces uvarum , Saccharomycesparadoxus,Saccharomycespastorianus (aussi nomméeSaccharomycescarlsbergensis), et des hybrides obtenus à partir d’au moins une souche appartenant à l’une de ces espèces tel que par exemple un hybrideS. cerevisiae / S. paradoxusou un hybrideS . cerevisiae / S. uvarum., de manière encore préférée ladite cellule hôte eucaryote estSaccharomyces cerevisiae.

Selon un autre mode de réalisation particulier, la cellule eucaryote est une cellule de champignon, en particulier une cellule de champignon d’intérêt industriel. Des exemples de champignons comprennent, sans y être limités, les cellules de champignons filamenteux. Les champignons filamenteux incluent les champignons appartenant aux subdivisionsEumycotaetOomycota. Les cellules de champignons filamenteux peuvent être choisies dans le groupe constitué des cellules deTrichoderma , Acremonium,Aspergillus,Aureobasidium,Bjerkandera,Ceriporiopsis,Chrysosporium,Coprinus,Coriolus,Cryptococcus,Filibasidium,Fusarium,Humicola,Magnaporthe,Mucor,Myceliophthora,Neocallimastix,Neurospora,Paecilomyces,Penicillium,Phanerochaete,Phlebia,Piromyces,Pleurotus,Schizophyllum,Sordaria , Talaromyces,Thermoascus,Thielavia,TolypocladiumouTrametes.

Selon encore un autre mode de réalisation particulier, la cellule eucaryote est une cellule de plante, en particulier une cellule de plante d’intérêt agronomique, horticole, pharmaceutique ou cosmétique, notamment les légumes, les fruits, les herbes, les fleurs, arbres et arbustes.

De préférence la cellule de plante est sélectionnée dans le groupe constitué par du riz, du blé, du soja, du maïs, de la tomate, de l’oignon, du concombre, de la laitue, de l’asperge, de la carotte, du navet, d’Arabidopsis thaliana, de l’orge, du colza, du coton, de la vigne, de la canne à sucre, de la betterave, du coton, du tournesol, de l’olivier à palmes, du café, du thé, du cacao, de la chicorée, du poivron, du piment, du citron, de l’orange, de la nectarine, de la mangue, de la pomme, de la banane, de la pêche, de l’abricot, de la patate douce, des yams, de l’amande, de la noisette, de la fraise, du melon, de la pastèque, de l’olivier, et des plantes horticoles comme par exemple les rosiers, les tulipes, les orchidées et les géraniums.

Chacune des différentes cellules décrites ci-dessus peuvent notamment être utilisées dans les procédés selon l’invention décrits ci-après.

Ainsi, la présente invention concerne également l’utilisation de la protéine de fusion, de l’acide nucléique, de la cassette d’expression ou du vecteur d’expression selon l’invention pour (i) induire des recombinaisons méiotiques ciblées dans une cellule eucaryote, (ii) générer des variants d’un organisme eucaryote, et/ou (iii) identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote.

L’invention concerne également des procédés pour (i) induire des recombinaisons méiotiques ciblées dans une cellule eucaryote, (ii) générer des variants d’un organisme eucaryote, et/ou (iii) identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote tels que décrits ci-après.

Les procédés selon l’invention peuvent être des procédésin vitro, in vivoouex vivo.

L’invention concerne notamment un procédé pour induire des recombinaisons méiotiques ciblées dans une cellule eucaryote non humaine, comprenant

- l’introduction dans ladite cellule :

- l’induction de l’entrée en prophase I de méiose de ladite cellule.

En particulier, la cellule eucaryote est telle que décrite ci-dessus.

Tel qu’utilisé dans la présente demande, le terme « ARN guide » ou « ARNg » désigne une molécule d’ARN capable d’interagir avec le domaine CRISPR, de préférence avec le domaine Cpf1 ou Cas9, de la protéine de fusion afin de la guider vers une région chromosomique cible.

Chaque ARNg comprend une région (communément appelée région « SDS »), à l’extrémité 5’ de l’ARNg, qui est complémentaire de la région chromosomique cible et qui imite l’ARNcr du système CRISPR endogène.

Lorsque le système CRISPR utilisé est une système CRISPR de classe II et de type II, de préférence Cas9, chaque ARNg comprend deux régions :

- une première région (communément appelée région « SDS »), à l’extrémité 5’ de l’ARNg, qui est complémentaire de la région chromosomique cible et qui imite l’ARNcr du système CRISPR endogène, et

- une seconde région (communément appelé région « handle »), à l’extrémité 3’ de l’ARNg, qui mime les interactions d’appariement de bases entre l’ARNtracr (trans-activating crRNA) et l’ARNcr du système CRISPR endogène et présente une structure double brin en tige et boucle s’achevant en 3’ par une séquence essentiellement simple brin. Cette seconde région est essentielle à la fixation de l’ARNg au domaine Cas9 de la protéine de fusion.

La première région de l’ARNg varie selon la séquence chromosomique ciblée. En revanche, les régions « handle » des différents ARNg utilisés peuvent être identiques ou différentes. Selon un mode de réalisation particulier, la région « handle » comprend, ou consiste en, la séquence de 82 nucléotides en 3’ des séquences SEQ ID NO : 10 à 16 (séquence en minuscule sur la Figure 13).

La région « SDS » de l’ARNg qui est complémentaire de la région chromosomique cible, comprend en général entre 10 et 25 nucléotides. De préférence, cette région a une longueur de 19, 20 ou 21 nucléotides, et de manière particulièrement préférée de 20 nucléotides.

La seconde région de l’ARNg a une structure en tige et boucle (ou structure en épingle à cheveux). Les longueurs de la tige et de la boucle peuvent varier. De préférence, la boucle a une longueur de 3 à 10 nucléotides et la tige une longueur de 6 à 20 nucléotides. La tige peut optionnellement présenter des régions désappariées (formant des « bosses ») de 1 à 10 nucléotides. De préférence, la longueur globale de cette région « handle » est de 50 à 100 nucléotides, et de manière plus particulièrement préférée de 82 nucléotides.

La longueur totale d’un ARNg est en général de 50 à 140 nucléotides, de préférence de 80 à 125 nucléotides, et de manière plus particulièrement préférée de 90 à 110 nucléotides. Selon un mode de réalisation particulier, un ARNg tel qu’utilisé dans la présente invention a une longueur de 102 nucléotides.

L’homme du métier peut aisément définir la séquence et la structure des ARNg selon la région chromosomique à cibler en utilisant des techniques bien connues (voir par exemple l’article de Di Carlo et al, 2013 Nucleic Acids Research, pp 1-8).

Dans le procédé selon l’invention, un ou plusieurs ARNg peuvent être utilisés simultanément. Ces ARNg peuvent être différents ou identiques. Ces ARNg peuvent cibler des régions chromosomiques identiques ou différentes, de préférence différentes.

Les ARNg peuvent être introduits dans la cellule eucaryote sous la forme de molécules d’ARNg matures, sous la forme de précurseurs ou sous la forme d’un ou plusieurs acides nucléiques codant lesdits ARNg.

Lorsque le ou les ARNg sont introduits dans la cellule directement sous la forme de molécules d’ARN (matures ou précurseurs), ces ARNg peuvent contenir des nucléotides modifiés ou des modifications chimiques leur permettant, par exemple, d’augmenter leur résistance aux nucléases et ainsi d’augmenter leur durée de vie dans la cellule. Ils peuvent notamment comprendre au moins un nucléotide modifié ou non naturel tel que, par exemple, un nucléotide comportant une base modifiée, telle que l'inosine, la méthyl-5-désoxycytidine, la diméthylarnino-5-désoxyuridine, la désoxyuridine, la diamino-2,6-purine, la bromo-5-désoxyuridine ou toute autre base modifiée permettant l'hybridation. Les ARNg utilisés selon l’invention peuvent également être modifiés au niveau de la liaison internucléotidique comme par exemple les phosphorothioates, les H-phosphonates ou les alkyl-phosphonates, ou au niveau du squelette comme par exemple les alpha-oligonucléotides, les 2'-O-alkyl ribose ou les PNA (Peptid Nucleic Acid) (Egholm et al, 1992 J. Am. Chem. Soc., 114, pp. 1895- 1897).

Les ARNg peuvent être des ARN naturels, synthétiques ou produits par des techniques de recombinaison. Ces ARNg peuvent être préparés par toutes méthodes connues de l’homme du métier telles que, par exemple, la synthèse chimique, la transcriptionin vivoou des techniques d’amplification.

Selon un mode de réalisation, le procédé comprend l’introduction dans la cellule eucaryote de la protéine de fusion et d’un ou plusieurs ARNg capables de cibler l’action de la protéine de fusion vers une région chromosomique donnée. La protéine et les ARNg peuvent être introduits dans le cytoplasme ou le noyau de la cellule eucaryote par toute méthode connue de l’homme du métier, par exemple par microinjection. La protéine de fusion peut notamment être introduite dans la cellule en tant qu’élément d’un complexe protéine-ARN comprenant au moins un ARNg.

Selon un autre mode de réalisation, le procédé comprend l’introduction dans la cellule eucaryote de la protéine de fusion et d’un ou plusieurs acides nucléiques codant un ou plusieurs ARNg.

Selon encore un autre mode de réalisation, le procédé comprend l’introduction dans la cellule eucaryote d’un acide nucléique codant la protéine de fusion et d’un ou plusieurs ARNg.

Selon encore un autre mode de réalisation, le procédé comprend l’introduction dans la cellule eucaryote d’un acide nucléique codant la protéine de fusion et d’un ou plusieurs acides nucléiques codant un ou plusieurs ARNg.

Selon un mode de réalisation, la cellule eucaryote est hétérozygote pour le ou les gène(s) ciblé(s) par le ou les ARN guide(s).

Selon un autre mode de réalisation, la cellule eucaryote est homozygote pour le ou les gène(s) ciblé(s) par le ou les ARN guide(s).

La protéine de fusion, ou l’acide nucléique codant celle-ci, et le ou les ARNg, ou le ou les acides nucléiques codant ceux-ci, peuvent être introduits simultanément ou séquentiellement dans la cellule.

Les techniques de transformation d'une plante sont bien connues et décrites dans la littérature technique et scientifique. Ces techniques visent la transformation de cellules de végétales de plantes entières, de cals ou de protoplastes. Ces techniques incluent l'injection ou la micro-injection (Griesbach (1987) Plant Sci. 50 pp. 69-77), l'électroporation de l'ADN (Fromm et aL (1985), Natl Acad Sci., USA 82, 5pp. 824; Wan et Lemaux, Plant Physiol. 104 (1994), 37-48), la biolistique (Klein et al. (1987) Nature 327 pp. 773), la transfection de vecteur viral (Gelvin, Nature Biotechnology 23, pp. 684-685 (2005)), le bombardement (Sood et al., 2011, Biologia Plantarum, 55, 1pp. -15), la fusion de cellules ou de protoplastes (Willmitzer, L., 1993, Transgenic plants. Biotechnology, vol. 2, pp. 627-659), l’agrotransfection par insertion d'ADN-T, notamment en utilisantAgrobacterium tumefaciens(Fraley et al. Crit. Rev. Plant. Sci. 1986, 4 pp. 1-46; Fromm et al., Biotechnology (1990) 8, pp. 833-844) ouAgrobacterium rhizogenes(Cho et al. (2000) Planta 210: pp. 195-204) ou d'autres hôtes bactériens (Brootghaerts et al. (2005) Nature 433 pp. 629 -633) en utilisant par exemple la technique de trempage floral dite defloral dip(Clough et Bent Plant J. 1998 Dec;16(6):735-43.; Zale et al. Plant Cell Reports volume 28, pages903–913(2009)).

Alternativement, et plus particulièrement concernant les cellules de plante, l’acide nucléique codant pour la protéine de fusion et le ou les acides nucléiques codant pour le ou les ARNg peuvent être introduits dans une cellule par croisement de deux cellules dans lesquelles ont respectivement été introduits l’acide nucléique codant pour la protéine de fusion et le ou les acides nucléiques codant pour le ou les ARNg.

Alternativement, et plus particulièrement concernant les cellules de plante, l’acide nucléique codant pour la protéine de fusion et le ou les acides nucléiques codant pour le ou les ARNg peuvent être introduits dans une cellule par mitose d’une cellule dans laquelle l’acide nucléique codant pour la protéine de fusion et le ou les acides nucléiques codant pour le ou les ARNg ont précédemment été introduits.

Dans les modes de réalisation où la protéine de fusion et/ou le ou les ARNg sont introduits dans la cellule eucaryote sous la forme d’un acide nucléique codant pour ladite protéine et/ou le/lesdits ARNg, l’expression dedits acides nucléiques permet de produire la protéine de fusion et/ou le ou les ARNg dans la cellule.

Les acides nucléiques codant pour la protéine de fusion et ceux codant pour les ARNg peuvent être placés sous le contrôle de promoteurs identiques ou différents, constitutifs ou inductibles, en particulier de promoteurs spécifiques de la méiose. Selon un mode de réalisation préféré, les acides nucléiques sont placés sous le contrôle de promoteurs constitutifs tels que le promoteur ADH1 ou les promoteurs pRPR1 et SNR52 dépendant de l’ARN polymérase III, de manière encore préféré le promoteur pRPR1.

La nature du promoteur peut également dépendre de la nature de la cellule eucaryote. Selon un mode de réalisation particulier, la cellule eucaryote est une cellule de plante, de préférence une cellule de riz, et les acides nucléiques sont placés sous le contrôle d’un promoteur choisi parmi les promoteurs pZmUbi (promoteur de l’ubiquitine de maïs) et les promoteurs de la polymérase III U3 et U6. Selon un mode de réalisation préféré, l’acide nucléique codant pour la protéine de fusion est placé sous le contrôle du promoteur pZmUbi et les acides nucléiques codant pour les ARNg sont placés sous le contrôle du promoteur U3 ou U6, de préférence du promoteur U3.

Selon un aspect particulier, l’expression de l’ARNg est placée sous le contrôle de l’opérateur tetracycline. Le système Tet comprend deux circuits complémentaires : le circuit dépendant du tTA (système Tet-Off) et le circuit dépendant du rtTA (système Tet-On). De préférence, l’expression de l’ARNg est contrôlée par un système Tet-On. L'expression de l’ANRg est ainsi régulée par la présence ou l'absence de tétracycline ou de l'un de ses dérivés tels que la doxycycline.

Les acides nucléiques codant la protéine de fusion et le ou les ARNg peuvent être disposés sur la même construction, en particulier sur le même vecteur d’expression, ou sur des constructions distinctes. De manière alternative, les acides nucléiques peuvent être insérés dans le génome de la cellule eucaryote en des régions identiques ou distinctes. Selon un mode de réalisation préféré, les acides nucléiques codant la protéine de fusion et le ou les ARNg sont disposés sur le même vecteur d’expression.

Les acides nucléiques tels que décrits ci-dessus peuvent être introduits dans la cellule eucaryote par toute méthode connue par l’homme du métier, en particulier par microinjection, transfection, agro-infection, électroporation ou biolistique.

Optionnellement, l’expression ou l’activité de la protéine Spo11 endogène de la cellule eucaryote peut être supprimée afin de mieux contrôler les phénomènes de recombinaison méiotiques. Cette inactivation peut être réalisée par des techniques bien connues de l’homme du métier, notamment en inactivant le gène codant la protéine Spo11 endogène ou en inhibant son expression au moyen d’ARN interférents.

Après l’introduction dans la cellule eucaryote de la protéine de fusion et d’un ou de plusieurs ARNg, ou des acides nucléiques codant ceux-ci, le procédé selon l’invention comprend l’induction de l’entrée en prophase I de méiose de ladite cellule.

Cette induction peut se faire selon différentes méthodes, bien connues de l’homme du métier.

A titre d’exemple, lorsque la cellule eucaryote est une cellule de souris, l’entrée des cellules en prophase I de méiose peut être induite par l’ajout d’acide rétinoïque (Bowles J et al, 2006, Science, 312(5773), pp. 596-600).

Lorsque la cellule eucaryote est une cellule de plante, l’induction de la méiose se fait selon un processus naturel. Selon un mode de réalisation particulier, après transformation d’un cal comprenant une ou des cellules de plante, une plante est régénérée et placée en conditions favorisant l’induction d’une phase reproductive et ainsi du processus de méiose. Ces conditions sont bien connues de l’homme du métier.

Lorsque la cellule eucaryote est une levure, cette induction peut être réalisée par le transfert de la levure dans un milieu de sporulation, en particulier d’un milieu riche à un milieu de sporulation, ledit milieu de sporulation étant de préférence dépourvu de source de carbone fermentescible ou d’azote, et l’incubation des levures dans le milieu de sporulation durant un temps suffisant pour induire des cassures double-brin. L’initiation du cycle méiotique dépend de plusieurs signaux : la présence des deux allèles de type sexuel MATa et MATα, l’absence de source d’azote et de carbone fermentescible.

Tel qu’utilisé dans ce document, le terme « milieu riche » se réfère à un milieu de culture comprenant une source de carbone fermentescible et une source d’azote ainsi que tous les éléments nutritifs nécessaires aux levures pour se multiplier par division mitotique. Ce milieu peut être aisément choisi par l’homme du métier et peut, par exemple, être sélectionné parmi le groupe constitué du milieu YPD (1% extrait de levures, 2% bactopeptone et 2% glucose), du milieu YPG (1% extrait de levures, 2% bactopeptone et 3% glycérol) et d’un milieu synthétique complet (ou milieu SC) (Treco and Lundblad, 2001, Curr. Protocol. Mol. Biol., Chapter 13, Unit 13.1).

Tel qu’utilisé dans ce document, le terme « milieu de sporulation » se réfère à tout milieu induisant l’entrée en prophase de méiose des cellules de levure sans croissance végétative, en particulier à un milieu de culture ne comprenant pas de source de carbone fermentescible ni de source d’azote mais comprenant une source de carbone métabolisable par respiration telle que l’acétate. Ce milieu peut être aisément choisi par l’homme du métier et peut, par exemple, être sélectionné parmi le groupe constitué du milieu KAc 1% (Wu and Lichten, 1994, Science, 263, pp. 515-518), le milieu SPM (Kassir and Simchen, 1991, Meth. Enzymol., 194, pp. 94–110) et des milieux de sporulation décrits dans l’article de Sherman (Sherman, Meth. Enzymol., 1991, 194, 3–21).

Selon un mode de réalisation préféré, avant d’être incubées dans le milieu de sporulation, les cellules sont cultivées durant quelques cycles de division dans un milieu de pré-sporulation de façon à obtenir une sporulation efficace et synchrone. Le milieu de pré-sporulation peut être aisément choisi par l’homme du métier. Ce milieu peut être, par exemple, le milieu SPS (Wu and Lichten, 1994, Science, 263, pp. 515-518).

Le choix des milieux (milieu riche, milieu de pré-sporulation, milieu de sporulation) dépend des caractéristiques physiologiques et génétiques de la souche de levure, notamment si cette souche est auxotrophe pour un ou plusieurs composés.

Une fois la cellule engagée en prophase I de méiose, le processus méiotique peut se poursuivre jusqu’à produire quatre cellules filles présentant les recombinaisons recherchées.

De manière alternative, lorsque la cellule eucaryote est une levure, et en particulier une levure du genreSaccharomyces, les cellules peuvent être replacées en conditions de croissance afin de reprendre un processus mitotique. Ce phénomène appelé « return-to-growth » ou « RTG » a été décrit précédemment dans la demande de brevet WO 2014/083142 et se produit lorsque les cellules entrées en méiose en réponse à une carence nutritionnelle sont remises en présence d’une source de carbone et d’azote après la formation des cassures double-brin Spo11 dépendantes mais avant la première division de méiose (Honigberg and Esposito, Proc. Nat. Acad. Sci USA, 1994, 91, pp. 6559-6563). Dans ces conditions, elles interrompent leur progression dans les stades de différenciation méiotique pour reprendre un mode de croissance mitotique tout en induisant les recombinaisons recherchées lors de la réparation des cassures double-brin (Sherman et Roman, Genetics, 1963, 48,255-261 ; Esposito et Esposito, Proc. Nat. Acad. Sci, 1974, 71, pp. 3172-3176 ; Zenvirth et al, 1997 Genes to Cells, 2, pp. 487-498).

Le procédé peut comprendre en outre l’obtention de la ou des cellules présentant la ou les recombinaisons recherchées. Lorsque la cellule est une levure, le procédé peut en outre comprendre une étape de culture et/ou de multiplication de la ou des cellules présentant la ou les recombinaisons recherchées. Lorsque la cellule est une cellule de plante, le procédé peut en outre comprendre une étape d’embryogénèse somatique, c’est-à-dire la régénération d’un embryon végétal à partir d’un cal comprenant les cellules présentant la ou les recombinaisons recherchées.

Le procédé selon l’invention peut être utilisé dans toutes les applications où il est souhaitable d’améliorer et de contrôler les phénomènes de recombinaison méiotique. En particulier, l’invention permet d’associer, de manière préférentielle, des traits génétiques d’intérêt. Cette association préférentielle permet, d’une part, de réduire le temps nécessaire à leur sélection, d’autre part, de générer des combinaisons naturelles possibles mais improbables. Enfin, selon le mode de réalisation choisi, les organismes obtenus par ce procédé peuvent être considérés comme des organismes non génétiquement modifiés (non-OGM).

Selon un autre aspect, la présente invention concerne un procédé pour générer des variants d’un organisme eucaryote, à l’exception de l’homme, de préférence une levure ou une plante, de manière encore préférée une levure, notamment une souche de levure d’intérêt industriel, comprenant

- l’introduction dans une cellule dudit organisme :

- l’induction de l’entrée en prophase I de méiose de ladite cellule ;

Dans ce procédé, le terme de « variant » doit être compris de façon large, il désigne un organisme ayant au moins une différence génotypique ou phénotypique par rapport aux organismes parents.

Les cellules recombinées peuvent être obtenues en laissant la méiose se poursuivre jusqu’à l’obtention des spores, ou, dans le cas des levures, en replaçant les cellules en conditions de croissance après l’induction des cassures double-brin afin de reprendre un processus mitotique.

Lorsque la cellule eucaryote est une cellule de plante, un variant de la plante peut être généré par fusion des gamètes de plante, au moins l’une des gamètes étant une cellule recombinée par la méthode selon l’invention.

La présente invention concerne également un procédé pour identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote, de préférence une levure ou une plante, comprenant :

- l’introduction dans la cellule eucaryote :

- l’induction de l’entrée en prophase I de méiose de ladite cellule ;

De préférence, la caractéristique d’intérêt est un caractère quantitatif d’intérêt (QTL). Un locus de caractères quantitatifs (LCQ ou QTL pourquantitative trait loci) est une région plus ou moins grande d'ADN qui est étroitement associée à un caractère quantitatif, c'est-à-dire une région chromosomique où sont localisés un ou plusieurs gènes à l'origine du caractère en question. Ces caractères quantitatifs se rapporte généralement à une caractéristique phénotypique. L’analyse des QTL permet d’évaluer le lien entre une variation génétique et une variation phénotypique.

La présente invention concerne finalement une trousse comprenant une protéine de fusion, un acide nucléique, une cassette d’expression ou un vecteur d’expression selon l’invention, ou une cellule hôte transformée ou transfectée avec un acide nucléique, une cassette d’expression ou un vecteur d’expression selon l’invention. Elle concerne également l’utilisation de ladite trousse pour mettre en œuvre un procédé selon l’invention, en particulier pour (i) induire des recombinaisons méiotiques ciblées dans une cellule eucaryote, (ii) générer des variants d’un organisme eucaryote, et/ou (iii) identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote.

Dans les séquences peptidiques décrites dans ce document, les acides aminés sont représentés par leur code à une lettre selon la nomenclature suivante : C : cystéine; D : acide aspartique; E : acide glutamique; F : phénylalanine; G : glycine; H : histidine; I : isoleucine; K : lysine; L : leucine ; M : méthionine ; N : asparagine ; P : proline ; Q : glutamine ; R : arginine ; S : sérine ; T : thréonine ; V : valine ; W : tryptophane et Y : tyrosine.

Les exemples qui suivent sont présentés dans un but illustratif et non limitatif et permettent d’illustrer l’invention.

Exemples

Matériel et Méthode

Construction de la cassette P _ADH1 -NLS-Sp d CAS9-SPO11 ^Y135F -6xHis-3xFlag-T _ADH1

La mutationSPO11-Y135F(Bergerat, et al. 1997 Nature, 386, 4 pp. 14-417) a été introduite par mutagenèse dirigée dans la séquence du gèneSPO11contenue dans le fragmentP _ADH1 -NLS-Sp d CAS9-SPO11-6xHis-3xFlag-T _ADH1 du plasmide pAS504 (Sarno, et al. 2017 Nucleic acids research, 45, e164), créant le plasmide pAS533.

Construction du plasmide d’expression des sgARN pour d Cas9

Le plasmide d’expression des sgARNs (pAS507) dirigeant la protéineSp d Cas9 vers la séquence cible Gal4 _UAS-D/E localisée dans le promoteur du gèneGAL2a été décrit dans la publication (Sarno, et al . 2017 Nucleic acids research, 45, e164).

Construction des souches de levure Saccharomyces cerevisiae .

Génotype des souches de Saccharomyces cerevisiae utilisées :

AND3482 :MATa /α trp1/trp1:: hisG pGAL2_AB ² CD ² E/pGAL2_ab ² cD ² E tGAL2:: HphMX /- pEMP46:: NatMX /- his4/'' leu2/'' ura3/''

AND2549 :MATa / α trp1/trp1:: hisG tGAL2:: HphMX /- pEMP46:: NatMX /- his4/'' leu2/'' ura3/''

AND3596 :MATa / α trp1::pAS533( d CAS9-SPO11 ^Y135F -6xHis-Flag-TRP1-KanMX)/trp1:: hisG tGAL2:: HphMX /- pEMP46:: NatMX /- his4/'' leu2/'' ura3/''

ANT3029 :MATa / α trp1::pAS533( d CAS9-SPO11 ^Y135F -6xHis-Flag-TRP1-KanMX)/trp1:: hisG tGAL2:: HphMX /- pEMP46:: NatMX /- his4/'' leu2/'' ura3/'' +plasmide pAS507-sgARN _UAS-D/E ::LEU2.

L’introduction des cassettesP _ADH1 -Sp d CAS9-SPO11 ^Y135F -6xHis-Flag- T _ADH1- TRP1-KanMXdans le génome de la levureS. cerevisiaea été effectué comme décrit par (Sarno, et al. 2017 Nucleic acids research, 45, e164). Les plasmides pAS533 et pAS628 portant les cassettesP _ADH1 -Sp d CAS9-SPO11 ^Y135F -6xHis-Flag- T _ADH1- TRP1-KanMXont été linéarisés par l’enzyme de restrictionXbaI et intégrées au locusTRP1par électroporation des cellules.

Les plasmides d’expression des sgARN et crARN portant le marqueur de sélectionLEU2ont été introduits dans les cellules AND3535, AND3538, AND3596 deS. cerevisiae, auxotrophes pour la leucine (leu2^-) par électroporation et les transformants sélectionnés sur des boites contenant un milieu synthétique complet dépourvu de Leucine. Les jonctions d’intégration des cassettes d’expression deSp d CAS9-SPO11 ^Y135F au locusTRP1ont été vérifiées par PCR.

La fréquence de recombinaison autour du gèneGAL2(chromosome XII) est mesurée entre la cassetteNatMXintégrée dans le promoteur du gèneEMP46(pEMP46) (position 287 725) et la cassetteHphMXintégrée à la position 292 068 dans le terminateur du gèneGAL2(tGAL2).

Induction de la méiose et de la sporulation

Dans un premier temps, les cellules diploïdes sont inoculées dans un milieu liquide riche (YPD) ou dans un milieu synthétique complet dépourvu de Leucine (SC-Leu) afin de maintenir les plasmides portant le marqueur de sélection LEU2. Les cellules se multiplient sous agitation à 30°C pendant 24 heures (point « Mitotique »). Ensuite les cultures liquides SC-Leu saturées sont diluées dans le milieu de pré-soporulation SPS (2-16 x10⁵cellules/ml) et mises en cultures sous agitation à 30°C pendant ~15 heures. Les cultures ayant atteint une OD₆₀₀entre 2 et 4 sont centrifugées, lavées deux fois avec de l’eau et transférées dans le milieu de sporulation (KAc 1%) avec une OD₆₀₀finale de 1. C’est le point T₀de la progression méiotique. Pour induire l’expression des crRNAs du doxycycline hyclate est ajouté à une concentration finale de 10 µg/ml dans le milieu de sporulation au temps T₀.

Milieux de croissance et de sporulation

Les milieux de croissance YPD, de pré-sporulation SPS et de sporulation KAc 1 % sont décrits dans la référence Murakami et al.,. 2009 Methods Mol Biol, 557, pp. 117-142. Le milieu YPD est constitué d’extrait de levure 1%), de peptone (2%) et de glucose (2%). Le milieu synthétique complet dépourvu de Leucine est composé de Yeast Nitrogen Base (0,17 %), de Sulfate d’Ammonium (0,5 %), de Drop-out Mix Synthetic sans Leucine (0,16 %) et de Glucose (2 %).

Southern blot et quantifications des CDBs et des molécules recombinantes

L’extraction de l’ADN génomique ainsi que la détection des CDBs et des molécules recombinantes par Southern Blot ont été effectués comme décrit dans les références Murakami, et al. 2009 Methods Mol Biol, 557, pp. 117-142.. et Sarno, et al. 2017 Nucleic acids research, 45, e164.

Analyse génétique des tétrades.

Les tétrades à 4 spores ont été disséquées sur des boites YPD après 48 heures d’incubation dans le milieu de sporulation. La ségrégation des marqueurs NatMX et HygMX est visualisée par réplique des colonies sur boites YPD contenant respectivement de la nourseothricine (100mg/l) ou de l’hygromycine. (300mg/l).

Résultats

La fusion d Cas9-Spo11 ^Y135F stimule la formation de molécules recombinantes dans la région du locus GAL2( ).

L’analyse de la recombinaison par Southern blot a été effectuée comme indiqué dans la légende de la . La région cible du sgARN de dCas9 est située dans le promoteur du gène GAL2 au niveau des sites de fixation de Gal4UASD/E.

Le génotype de la souche sauvage (AND2549) estMATa /α trp1/trp1:: hisG tGAL2:: HphMX /- pEMP46:: NatMX /- his4/'' leu2/'' ura3/''

Le génotype de la souche d CAS9-SPO11 ^Y135F (ANT3029) estMATa /α trp1::pAS33( d CAS9-SPO11 ^Y135F -6xHis-Flag-TRP1-KanMX)/trp1:: hisG tGAL2:: HphMX /- pEMP46:: NatMX /- his4/'' leu2/'' ura3/''et contient le plasmide pAS507-sgRNA _UAS-D/E ::LEU2.

Claims

Protéine de fusion comprenant (i) un variant d’une nucléase associée à un système CRISPR, de préférence un système CRISPR de classe II, comprenant une mutation dans le site catalytique qui réduit l’activité nucléase mais n’’impacte pas la capacité de la nucléase à interagir avec l’ARN guide et reconnaître la région ciblée d’un l’acide nucléique, et (ii) un variant d’une protéine Spo11 comprenant une séquence présentant au moins 80% d’identité avec une protéine Spo11, dans laquelle l’activité nucléase desdits variants est réduite d’au moins 50% par rapport à l’activité nucléase de la protéine sauvage.
Protéine de fusion selon la revendication 1, dans laquelle la nucléase est une nucléase associée à un système CRISPR de classe II et de type II, V ou VI.
Protéine de fusion selon la revendication 1, dans laquelle la nucléase est une nucléase associée à un système CRISPR choisie dans le groupe constitué par Cas1, Cas2, Cas9, Csn2, Cas13, C13a (C2c2), C13b, C13c, Cas12, C12a (Cpf1), C2c1 et C2c3.
Protéine de fusion selon la revendication 1, dans laquelle la nucléase est une nucléase associée à un système CRISPR de classe II et de type II.
Protéine de fusion selon l’une quelconque des revendications 1 à 4, ladite protéine comprenant un variant d’une nucléase Cas9 dépourvu d’activité nucléase.
Protéine de fusion selon l’une quelconque des revendications 1 à 5, ladite protéine comprenant un variant d’une protéine Spo11 dépourvu d’activité nucléase.
Acide nucléique codant pour la protéine de fusion selon l’une quelconque des revendications 1 à 6.
Cassette d’expression ou vecteur comprenant un acide nucléique selon la revendication 7 lié de manière opérationnelle à un promoteur transcriptionnel permettant une expression dudit acide nucléique durant la méiose.
Cellule hôte non humaine comprenant une protéine de fusion selon l’une quelconque des revendications 1 à 6, un acide nucléique selon la revendication 7, une cassette d’expression ou un vecteur selon la revendication 8, ladite cellule hôte étant de préférence une cellule de levure, de plante, de champignon ou une cellule animale, de manière préférée une cellule de plante sélectionnée dans le groupe constitué du riz, du blé, du soja, du maïs, de la tomate, de l’oignon, du concombre, de la laitue, de l’asperge, de la carotte, du navet, d’Arabidopsis thaliana,de l’orge, du colza, du coton, de la vigne, de la canne à sucre, de la betterave, du coton, du tournesol, due l’olivier à palmes, du café, du thé, du cacao, de la chicorée, du poivron, du piment, du citron, de l’orange, de la nectarine, de la mangue, de la pomme, de la banane, de la pêche, de l’abricot, de la patate douce, des yams, de l’amande, de la noisette, de la fraise, du melon, de la pastèque, de l’olivier, et des plantes horticoles comme par exemple les rosiers, les tulipes, les orchidées et les géraniums.
Procédé pour induire des recombinaisons méiotiques ciblées dans une cellule eucaryote non humaine, comprenant
- l’introduction dans ladite cellule :
a) d’une protéine de fusion selon l’une quelconque des revendications 1 à 6, d’un acide nucléique selon la revendication 7, d’une cassette d’expression ou d’un vecteur selon la revendication 8; et
b) d’un ou plusieurs ARN guides ou d’un ou plusieurs acides nucléiques codant lesdits ARN guides, lesdits ARN guides comprenant une structure ARN de fixation à la nucléase associée à un système CRISPR de la protéine de fusion et une séquence complémentaire de la région chromosomique ciblée ; et
- l’induction de l’entrée en prophase I de méiose de ladite cellule.
Procédé pour générer des variants d’un organisme eucaryote non humain comprenant :
- l’introduction dans une cellule dudit organisme :
a) d’une protéine de fusion selon l’une quelconque des revendications 1 à 6, d’un acide nucléique selon la revendication 7, d’une cassette d’expression ou d’un vecteur selon la revendication 8; et
b) d’un ou plusieurs ARN guides ou d’un ou plusieurs acides nucléiques codant lesdits ARN guides, lesdits ARN guides comprenant une structure ARN de fixation à la nucléase associée à un système CRISPR de la protéine de fusion et une séquence complémentaire de la région chromosomique ciblée ; et
- l’induction de l’entrée en prophase I de méiose de ladite cellule ;
- l’obtention de cellule(s) présentant la ou les recombinaisons recherchées au niveau de la ou des régions chromosomiques ciblées ; et
- la genèse d’un variant de l’organisme à partir de ladite cellule recombinée.
Procédéin vitropour identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote non humaine, comprenant :
- l’introduction dans la cellule eucaryote :
a) d’une protéine de fusion selon l’une quelconque des revendications 1 à 6, d’un acide nucléique selon la revendication 7, d’une cassette d’expression ou d’un vecteur selon la revendication 8; et
b) d’un ou plusieurs ARN guides ou d’un ou plusieurs acides nucléiques codant lesdits ARN guides, lesdits ARN guides comprenant une structure ARN de fixation à la nucléase associée à un système CRISPR de la protéine de fusion et une séquence complémentaire de la région chromosomique ciblée ; et
- l’induction de l’entrée en prophase I de méiose de ladite cellule ;
- l’obtention de cellule(s) présentant la ou les recombinaisons recherchées au niveau de la ou des régions chromosomiques ciblées ; et
- l’analyse des génotypes et phénotypes des cellules recombinées afin d’identifier ou de localiser l’information génétique codant pour la caractéristique d’intérêt.
Procédéin vitropour identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote non humaine selon la revendication 12, dans lequel la caractéristique d’intérêt est un caractère quantitatif d’intérêt (QTL).
Utilisation d’une protéine de fusion selon l’une quelconque des revendications 1 à 6, d’un acide nucléique selon la revendication 7, d’une cassette d’expression ou d’un vecteur selon la revendication 8 pour (i) induire des recombinaisons méiotiques ciblées dans une cellule eucaryote non humaine, (ii) générer des variants d’un organisme eucaryote non -humain, et/ou (iii) identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote non humaine.