FR3110575A1 - utilisation d’une protéine de fusion pour induire des modifications génétiques par recombinaison méiotique ciblée - Google Patents
utilisation d’une protéine de fusion pour induire des modifications génétiques par recombinaison méiotique ciblée Download PDFInfo
- Publication number
- FR3110575A1 FR3110575A1 FR2005370A FR2005370A FR3110575A1 FR 3110575 A1 FR3110575 A1 FR 3110575A1 FR 2005370 A FR2005370 A FR 2005370A FR 2005370 A FR2005370 A FR 2005370A FR 3110575 A1 FR3110575 A1 FR 3110575A1
- Authority
- FR
- France
- Prior art keywords
- fusion protein
- cell
- spo11
- nuclease
- nucleic acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 141
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 141
- 230000006798 recombination Effects 0.000 title claims abstract description 47
- 238000005215 recombination Methods 0.000 title claims abstract description 47
- 238000012239 gene modification Methods 0.000 title description 2
- 230000005017 genetic modification Effects 0.000 title description 2
- 235000013617 genetically modified food Nutrition 0.000 title description 2
- 101100366466 Caenorhabditis elegans spo-11 gene Proteins 0.000 claims abstract description 117
- 101710163270 Nuclease Proteins 0.000 claims abstract description 112
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 93
- 108091033409 CRISPR Proteins 0.000 claims abstract description 74
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract description 65
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 65
- 210000003527 eukaryotic cell Anatomy 0.000 claims abstract description 56
- 230000001939 inductive effect Effects 0.000 claims abstract description 20
- 210000004027 cell Anatomy 0.000 claims description 141
- 102000039446 nucleic acids Human genes 0.000 claims description 92
- 108020004707 nucleic acids Proteins 0.000 claims description 92
- 150000007523 nucleic acids Chemical class 0.000 claims description 92
- 108020005004 Guide RNA Proteins 0.000 claims description 79
- 238000000034 method Methods 0.000 claims description 65
- 241000196324 Embryophyta Species 0.000 claims description 55
- 230000000694 effects Effects 0.000 claims description 54
- 230000021121 meiosis Effects 0.000 claims description 36
- 239000013598 vector Substances 0.000 claims description 31
- 230000002759 chromosomal effect Effects 0.000 claims description 28
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 22
- 241000282414 Homo sapiens Species 0.000 claims description 21
- 230000001747 exhibiting effect Effects 0.000 claims description 20
- 230000031877 prophase Effects 0.000 claims description 17
- 230000027455 binding Effects 0.000 claims description 16
- 230000002068 genetic effect Effects 0.000 claims description 16
- 230000006698 induction Effects 0.000 claims description 16
- 230000000295 complement effect Effects 0.000 claims description 12
- -1 Mre2/Nam8 Proteins 0.000 claims description 11
- 240000007594 Oryza sativa Species 0.000 claims description 9
- 235000007164 Oryza sativa Nutrition 0.000 claims description 9
- 241000233866 Fungi Species 0.000 claims description 8
- 235000009566 rice Nutrition 0.000 claims description 8
- 241000219195 Arabidopsis thaliana Species 0.000 claims description 7
- 240000008042 Zea mays Species 0.000 claims description 7
- 230000035772 mutation Effects 0.000 claims description 7
- 240000002791 Brassica napus Species 0.000 claims description 6
- 229920000742 Cotton Polymers 0.000 claims description 6
- 244000299507 Gossypium hirsutum Species 0.000 claims description 6
- 102100029768 Histone-lysine N-methyltransferase SETD1A Human genes 0.000 claims description 6
- 101000865038 Homo sapiens Histone-lysine N-methyltransferase SETD1A Proteins 0.000 claims description 6
- 101100113585 Mus musculus Ccnb1ip1 gene Proteins 0.000 claims description 6
- 240000007817 Olea europaea Species 0.000 claims description 6
- 101710168942 Sphingosine-1-phosphate phosphatase 1 Proteins 0.000 claims description 6
- 102100030684 Sphingosine-1-phosphate phosphatase 1 Human genes 0.000 claims description 6
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 6
- 101100339496 Caenorhabditis elegans hop-1 gene Proteins 0.000 claims description 5
- 101150100676 Map2k1 gene Proteins 0.000 claims description 5
- 101150081841 NBN gene Proteins 0.000 claims description 5
- 101000686491 Platymeris rhadamanthus Venom redulysin 1 Proteins 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 5
- 230000003197 catalytic effect Effects 0.000 claims description 5
- 101150071637 mre11 gene Proteins 0.000 claims description 5
- 101150010682 rad50 gene Proteins 0.000 claims description 5
- 210000005253 yeast cell Anatomy 0.000 claims description 5
- 240000004160 Capsicum annuum Species 0.000 claims description 4
- 235000010469 Glycine max Nutrition 0.000 claims description 4
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 4
- 235000002725 Olea europaea Nutrition 0.000 claims description 4
- 240000003768 Solanum lycopersicum Species 0.000 claims description 4
- 235000021307 Triticum Nutrition 0.000 claims description 4
- 244000098338 Triticum aestivum Species 0.000 claims description 4
- 102100029449 WD repeat-containing protein 61 Human genes 0.000 claims description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 4
- 210000004102 animal cell Anatomy 0.000 claims description 4
- 235000005822 corn Nutrition 0.000 claims description 4
- 244000291564 Allium cepa Species 0.000 claims description 3
- 235000002732 Allium cepa var. cepa Nutrition 0.000 claims description 3
- 244000144725 Amygdalus communis Species 0.000 claims description 3
- 244000144730 Amygdalus persica Species 0.000 claims description 3
- 244000003416 Asparagus officinalis Species 0.000 claims description 3
- 235000005340 Asparagus officinalis Nutrition 0.000 claims description 3
- 235000016068 Berberis vulgaris Nutrition 0.000 claims description 3
- 241000335053 Beta vulgaris Species 0.000 claims description 3
- 235000011293 Brassica napus Nutrition 0.000 claims description 3
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 claims description 3
- 235000004977 Brassica sinapistrum Nutrition 0.000 claims description 3
- 235000004936 Bromus mango Nutrition 0.000 claims description 3
- 235000007542 Cichorium intybus Nutrition 0.000 claims description 3
- 244000298479 Cichorium intybus Species 0.000 claims description 3
- 244000241235 Citrullus lanatus Species 0.000 claims description 3
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 claims description 3
- 235000005979 Citrus limon Nutrition 0.000 claims description 3
- 244000131522 Citrus pyriformis Species 0.000 claims description 3
- 240000007154 Coffea arabica Species 0.000 claims description 3
- 235000007466 Corylus avellana Nutrition 0.000 claims description 3
- 241000219112 Cucumis Species 0.000 claims description 3
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 claims description 3
- 240000008067 Cucumis sativus Species 0.000 claims description 3
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 claims description 3
- 235000002767 Daucus carota Nutrition 0.000 claims description 3
- 244000000626 Daucus carota Species 0.000 claims description 3
- 240000009088 Fragaria x ananassa Species 0.000 claims description 3
- 241000208150 Geraniaceae Species 0.000 claims description 3
- 244000020551 Helianthus annuus Species 0.000 claims description 3
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 3
- 240000005979 Hordeum vulgare Species 0.000 claims description 3
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 3
- 244000017020 Ipomoea batatas Species 0.000 claims description 3
- 235000002678 Ipomoea batatas Nutrition 0.000 claims description 3
- 235000003228 Lactuca sativa Nutrition 0.000 claims description 3
- 240000008415 Lactuca sativa Species 0.000 claims description 3
- 235000011430 Malus pumila Nutrition 0.000 claims description 3
- 244000070406 Malus silvestris Species 0.000 claims description 3
- 235000015103 Malus silvestris Nutrition 0.000 claims description 3
- 235000014826 Mangifera indica Nutrition 0.000 claims description 3
- 240000007228 Mangifera indica Species 0.000 claims description 3
- 240000005561 Musa balbisiana Species 0.000 claims description 3
- 235000018290 Musa x paradisiaca Nutrition 0.000 claims description 3
- 241000233855 Orchidaceae Species 0.000 claims description 3
- 240000003889 Piper guineense Species 0.000 claims description 3
- 235000009827 Prunus armeniaca Nutrition 0.000 claims description 3
- 244000018633 Prunus armeniaca Species 0.000 claims description 3
- 235000006029 Prunus persica var nucipersica Nutrition 0.000 claims description 3
- 235000006040 Prunus persica var persica Nutrition 0.000 claims description 3
- 244000017714 Prunus persica var. nucipersica Species 0.000 claims description 3
- 241000109329 Rosa xanthina Species 0.000 claims description 3
- 235000004789 Rosa xanthina Nutrition 0.000 claims description 3
- 240000000111 Saccharum officinarum Species 0.000 claims description 3
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 3
- 235000009184 Spondias indica Nutrition 0.000 claims description 3
- 244000269722 Thea sinensis Species 0.000 claims description 3
- 235000009470 Theobroma cacao Nutrition 0.000 claims description 3
- 244000299461 Theobroma cacao Species 0.000 claims description 3
- 241000722921 Tulipa gesneriana Species 0.000 claims description 3
- 102100032084 Type 2 DNA topoisomerase 6 subunit B-like Human genes 0.000 claims description 3
- 101710131588 Type 2 DNA topoisomerase 6 subunit B-like Proteins 0.000 claims description 3
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 claims description 3
- 235000020224 almond Nutrition 0.000 claims description 3
- 235000016213 coffee Nutrition 0.000 claims description 3
- 235000013353 coffee beverage Nutrition 0.000 claims description 3
- 235000004879 dioscorea Nutrition 0.000 claims description 3
- 238000000338 in vitro Methods 0.000 claims description 3
- 235000013616 tea Nutrition 0.000 claims description 3
- 230000002103 transcriptional effect Effects 0.000 claims description 3
- 235000002566 Capsicum Nutrition 0.000 claims description 2
- 239000006002 Pepper Substances 0.000 claims description 2
- 235000016761 Piper aduncum Nutrition 0.000 claims description 2
- 235000017804 Piper guineense Nutrition 0.000 claims description 2
- 235000008184 Piper nigrum Nutrition 0.000 claims description 2
- 230000003247 decreasing effect Effects 0.000 claims 2
- 235000011437 Amygdalus communis Nutrition 0.000 claims 1
- 240000009226 Corylus americana Species 0.000 claims 1
- 235000001543 Corylus americana Nutrition 0.000 claims 1
- 240000005717 Dioscorea alata Species 0.000 claims 1
- 235000002723 Dioscorea alata Nutrition 0.000 claims 1
- 235000007056 Dioscorea composita Nutrition 0.000 claims 1
- 235000009723 Dioscorea convolvulacea Nutrition 0.000 claims 1
- 235000005362 Dioscorea floribunda Nutrition 0.000 claims 1
- 235000004868 Dioscorea macrostachya Nutrition 0.000 claims 1
- 235000005361 Dioscorea nummularia Nutrition 0.000 claims 1
- 235000005360 Dioscorea spiculiflora Nutrition 0.000 claims 1
- 235000016623 Fragaria vesca Nutrition 0.000 claims 1
- 235000011363 Fragaria x ananassa Nutrition 0.000 claims 1
- 235000006350 Ipomoea batatas var. batatas Nutrition 0.000 claims 1
- 235000018102 proteins Nutrition 0.000 description 61
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 42
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 41
- 230000005782 double-strand break Effects 0.000 description 38
- 239000013612 plasmid Substances 0.000 description 26
- 125000003729 nucleotide group Chemical group 0.000 description 21
- 108020004414 DNA Proteins 0.000 description 20
- 230000002950 deficient Effects 0.000 description 19
- 239000002773 nucleotide Substances 0.000 description 19
- 239000013604 expression vector Substances 0.000 description 15
- 101710187578 Alcohol dehydrogenase 1 Proteins 0.000 description 14
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 14
- 239000007362 sporulation medium Substances 0.000 description 14
- 239000012634 fragment Substances 0.000 description 13
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 12
- 235000001014 amino acid Nutrition 0.000 description 12
- 229940024606 amino acid Drugs 0.000 description 12
- 150000001413 amino acids Chemical class 0.000 description 12
- 239000002609 medium Substances 0.000 description 12
- 101150037782 GAL2 gene Proteins 0.000 description 11
- 230000008439 repair process Effects 0.000 description 11
- 210000004899 c-terminal region Anatomy 0.000 description 10
- 101150032598 hisG gene Proteins 0.000 description 10
- 125000005647 linker group Chemical group 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 8
- 210000000349 chromosome Anatomy 0.000 description 8
- 229920002401 polyacrylamide Polymers 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 101000825217 Homo sapiens Meiotic recombination protein SPO11 Proteins 0.000 description 7
- 102100022253 Meiotic recombination protein SPO11 Human genes 0.000 description 7
- 238000010276 construction Methods 0.000 description 7
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 6
- 229910052799 carbon Inorganic materials 0.000 description 6
- 230000012010 growth Effects 0.000 description 6
- 235000014304 histidine Nutrition 0.000 description 6
- 230000000394 mitotic effect Effects 0.000 description 6
- 229910052757 nitrogen Inorganic materials 0.000 description 6
- 230000028070 sporulation Effects 0.000 description 6
- 101001099308 Homo sapiens Meiotic recombination protein REC8 homolog Proteins 0.000 description 5
- 102100038882 Meiotic recombination protein REC8 homolog Human genes 0.000 description 5
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 150000002411 histidines Chemical class 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 238000005204 segregation Methods 0.000 description 5
- 230000008685 targeting Effects 0.000 description 5
- 108010042407 Endonucleases Proteins 0.000 description 4
- 102000004533 Endonucleases Human genes 0.000 description 4
- 108010001515 Galectin 4 Proteins 0.000 description 4
- 102100039556 Galectin-4 Human genes 0.000 description 4
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 4
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 4
- 241000235070 Saccharomyces Species 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 230000003292 diminished effect Effects 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 101100207082 Arabidopsis thaliana MTOPVIB gene Proteins 0.000 description 3
- 101100365680 Arabidopsis thaliana SGT1B gene Proteins 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 108091060290 Chromatid Proteins 0.000 description 3
- 101100417900 Clostridium acetobutylicum (strain ATCC 824 / DSM 792 / JCM 1419 / LMG 5710 / VKM B-1787) rbr3A gene Proteins 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 230000007018 DNA scission Effects 0.000 description 3
- 102100021735 Galectin-2 Human genes 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 206010020649 Hyperkeratosis Diseases 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- 101150034686 PDC gene Proteins 0.000 description 3
- 102000035195 Peptidases Human genes 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- 238000002105 Southern blotting Methods 0.000 description 3
- 108091028113 Trans-activating crRNA Proteins 0.000 description 3
- NRAUADCLPJTGSF-ZPGVOIKOSA-N [(2r,3s,4r,5r,6r)-6-[[(3as,7r,7as)-7-hydroxy-4-oxo-1,3a,5,6,7,7a-hexahydroimidazo[4,5-c]pyridin-2-yl]amino]-5-[[(3s)-3,6-diaminohexanoyl]amino]-4-hydroxy-2-(hydroxymethyl)oxan-3-yl] carbamate Chemical compound NCCC[C@H](N)CC(=O)N[C@@H]1[C@@H](O)[C@H](OC(N)=O)[C@@H](CO)O[C@H]1\N=C/1N[C@H](C(=O)NC[C@H]2O)[C@@H]2N\1 NRAUADCLPJTGSF-ZPGVOIKOSA-N 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 210000004756 chromatid Anatomy 0.000 description 3
- 239000002537 cosmetic Substances 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 210000001840 diploid cell Anatomy 0.000 description 3
- 235000021186 dishes Nutrition 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 235000003869 genetically modified organism Nutrition 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical class O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 238000000520 microinjection Methods 0.000 description 3
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 3
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 125000006239 protecting group Chemical group 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 239000007320 rich medium Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- SGKRLCUYIXIAHR-AKNGSSGZSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-AKNGSSGZSA-N 0.000 description 2
- UHHHTIKWXBRCLT-VDBOFHIQSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide;ethanol;hydrate;dihydrochloride Chemical compound O.Cl.Cl.CCO.C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O.C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O UHHHTIKWXBRCLT-VDBOFHIQSA-N 0.000 description 2
- 241000093740 Acidaminococcus sp. Species 0.000 description 2
- 241001133760 Acoelorraphe Species 0.000 description 2
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 108010023063 Bacto-peptone Proteins 0.000 description 2
- 101150005393 CBF1 gene Proteins 0.000 description 2
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 2
- 241000223282 Candidatus Peregrinibacteria Species 0.000 description 2
- 235000009467 Carica papaya Nutrition 0.000 description 2
- 240000006432 Carica papaya Species 0.000 description 2
- 108700004991 Cas12a Proteins 0.000 description 2
- 101100329224 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) cpf1 gene Proteins 0.000 description 2
- 241000723382 Corylus Species 0.000 description 2
- 241000701022 Cytomegalovirus Species 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- 102000004157 Hydrolases Human genes 0.000 description 2
- 108090000604 Hydrolases Proteins 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- 108010025815 Kanamycin Kinase Proteins 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- KSPIYJQBLVDRRI-UHFFFAOYSA-N N-methylisoleucine Chemical compound CCC(C)C(NC)C(O)=O KSPIYJQBLVDRRI-UHFFFAOYSA-N 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- 241000235648 Pichia Species 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 102000014450 RNA Polymerase III Human genes 0.000 description 2
- 108010078067 RNA Polymerase III Proteins 0.000 description 2
- 230000007022 RNA scission Effects 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 241001123228 Saccharomyces paradoxus Species 0.000 description 2
- 241001123227 Saccharomyces pastorianus Species 0.000 description 2
- 241000582914 Saccharomyces uvarum Species 0.000 description 2
- 108091027544 Subgenomic mRNA Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 101710183280 Topoisomerase Proteins 0.000 description 2
- 108090000848 Ubiquitin Proteins 0.000 description 2
- 102000044159 Ubiquitin Human genes 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 101150063416 add gene Proteins 0.000 description 2
- 230000009418 agronomic effect Effects 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 101150059443 cas12a gene Proteins 0.000 description 2
- 102000021178 chitin binding proteins Human genes 0.000 description 2
- 108091011157 chitin binding proteins Proteins 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 229960003722 doxycycline Drugs 0.000 description 2
- 229960001172 doxycycline hyclate Drugs 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 210000005254 filamentous fungi cell Anatomy 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 235000008216 herbs Nutrition 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000003301 hydrolyzing effect Effects 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 238000001114 immunoprecipitation Methods 0.000 description 2
- 230000003116 impacting effect Effects 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000012678 infectious agent Substances 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 235000019833 protease Nutrition 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 108010054624 red fluorescent protein Proteins 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- FSYKKLYZXJSNPZ-UHFFFAOYSA-N sarcosine Chemical compound C[NH2+]CC([O-])=O FSYKKLYZXJSNPZ-UHFFFAOYSA-N 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 235000021012 strawberries Nutrition 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 101150024821 tetO gene Proteins 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- 239000007222 ypd medium Substances 0.000 description 2
- BVAUMRCGVHUWOZ-ZETCQYMHSA-N (2s)-2-(cyclohexylazaniumyl)propanoate Chemical compound OC(=O)[C@H](C)NC1CCCCC1 BVAUMRCGVHUWOZ-ZETCQYMHSA-N 0.000 description 1
- NPWMTBZSRRLQNJ-VKHMYHEASA-N (3s)-3-aminopiperidine-2,6-dione Chemical compound N[C@H]1CCC(=O)NC1=O NPWMTBZSRRLQNJ-VKHMYHEASA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- VOXZDWNPVJITMN-ZBRFXRBCSA-N 17β-estradiol Chemical compound OC1=CC=C2[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 VOXZDWNPVJITMN-ZBRFXRBCSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- 108020005065 3' Flanking Region Proteins 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000193412 Alicyclobacillus acidoterrestris Species 0.000 description 1
- 101100438273 Arabidopsis thaliana CAN1 gene Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241000223651 Aureobasidium Species 0.000 description 1
- NTTIDCCSYIDANP-UHFFFAOYSA-N BCCP Chemical compound BCCP NTTIDCCSYIDANP-UHFFFAOYSA-N 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 101710201279 Biotin carboxyl carrier protein Proteins 0.000 description 1
- 101710180532 Biotin carboxyl carrier protein of acetyl-CoA carboxylase Proteins 0.000 description 1
- 241000222490 Bjerkandera Species 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 235000005637 Brassica campestris Nutrition 0.000 description 1
- 235000003351 Brassica cretica Nutrition 0.000 description 1
- 241001301148 Brassica rapa subsp. oleifera Species 0.000 description 1
- 235000003343 Brassica rupestris Nutrition 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 241000243205 Candidatus Parcubacteria Species 0.000 description 1
- 235000008534 Capsicum annuum var annuum Nutrition 0.000 description 1
- 240000001844 Capsicum baccatum Species 0.000 description 1
- 235000007862 Capsicum baccatum Nutrition 0.000 description 1
- 241000146399 Ceriporiopsis Species 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 241000123346 Chrysosporium Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000222511 Coprinus Species 0.000 description 1
- 241000222356 Coriolus Species 0.000 description 1
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 101150092332 EMP46 gene Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 241000589602 Francisella tularensis Species 0.000 description 1
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 241000588088 Francisella tularensis subsp. novicida U112 Species 0.000 description 1
- 241000223218 Fusarium Species 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 1
- 241000613556 Herbinix hemicellulosilytica Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 241000223198 Humicola Species 0.000 description 1
- LCWXJXMHJVIJFK-UHFFFAOYSA-N Hydroxylysine Natural products NCC(O)CC(N)CC(O)=O LCWXJXMHJVIJFK-UHFFFAOYSA-N 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- 108700002232 Immediate-Early Genes Proteins 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical compound CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-UHNVWZDZSA-N L-allo-Isoleucine Chemical compound CC[C@@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-UHNVWZDZSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 1
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 241001112693 Lachnospiraceae Species 0.000 description 1
- 241000904817 Lachnospiraceae bacterium Species 0.000 description 1
- 241000448224 Lachnospiraceae bacterium MA2020 Species 0.000 description 1
- 241000589902 Leptospira Species 0.000 description 1
- 241001148627 Leptospira inadai Species 0.000 description 1
- 241000029603 Leptotrichia shahii Species 0.000 description 1
- 241000029590 Leptotrichia wadei Species 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- 241000588621 Moraxella Species 0.000 description 1
- 241001193016 Moraxella bovoculi 237 Species 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000226677 Myceliophthora Species 0.000 description 1
- OLNLSTNFRUFTLM-UHFFFAOYSA-N N-ethylasparagine Chemical compound CCNC(C(O)=O)CC(N)=O OLNLSTNFRUFTLM-UHFFFAOYSA-N 0.000 description 1
- YPIGGYHFMKJNKV-UHFFFAOYSA-N N-ethylglycine Chemical compound CC[NH2+]CC([O-])=O YPIGGYHFMKJNKV-UHFFFAOYSA-N 0.000 description 1
- 108010065338 N-ethylglycine Proteins 0.000 description 1
- AKCRVYNORCOYQT-YFKPBYRVSA-N N-methyl-L-valine Chemical compound CN[C@@H](C(C)C)C(O)=O AKCRVYNORCOYQT-YFKPBYRVSA-N 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 241001028048 Nicola Species 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 241000233654 Oomycetes Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 241000222385 Phanerochaete Species 0.000 description 1
- 241000222395 Phlebia Species 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 241000222350 Pleurotus Species 0.000 description 1
- 241000605861 Prevotella Species 0.000 description 1
- 241001135219 Prevotella disiens Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101710149951 Protein Tat Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 101150013004 Rec8 gene Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000003661 Ribonuclease III Human genes 0.000 description 1
- 108010057163 Ribonuclease III Proteins 0.000 description 1
- 102000004167 Ribonuclease P Human genes 0.000 description 1
- 108090000621 Ribonuclease P Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000235072 Saccharomyces bayanus Species 0.000 description 1
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 1
- 241000670409 Saccharomyces castelli Species 0.000 description 1
- 101100501291 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) EMP46 gene Proteins 0.000 description 1
- 241001063879 Saccharomyces eubayanus Species 0.000 description 1
- 241000198063 Saccharomyces kudriavzevii Species 0.000 description 1
- 241000198072 Saccharomyces mikatae Species 0.000 description 1
- 108010077895 Sarcosine Proteins 0.000 description 1
- 241000222480 Schizophyllum Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 241000221948 Sordaria Species 0.000 description 1
- 241000194007 Streptococcus canis Species 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 241000228341 Talaromyces Species 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 241000228178 Thermoascus Species 0.000 description 1
- 241001494489 Thielavia Species 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 102000002933 Thioredoxin Human genes 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 241000222354 Trametes Species 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- SHGAZHPCJJPHSC-YCNIQYBTSA-N all-trans-retinoic acid Chemical compound OC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-YCNIQYBTSA-N 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 229940124277 aminobutyric acid Drugs 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical group N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 108010060453 biotin transporter Proteins 0.000 description 1
- QKSKPIVNLNLAAV-UHFFFAOYSA-N bis(2-chloroethyl) sulfide Chemical compound ClCCSCCCl QKSKPIVNLNLAAV-UHFFFAOYSA-N 0.000 description 1
- 125000006367 bivalent amino carbonyl group Chemical group [H]N([*:1])C([*:2])=O 0.000 description 1
- 125000006297 carbonyl amino group Chemical group [H]N([*:2])C([*:1])=O 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 238000000224 chemical solution deposition Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000002487 chromatin immunoprecipitation Methods 0.000 description 1
- 238000000749 co-immunoprecipitation Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- YSMODUONRAFBET-UHFFFAOYSA-N delta-DL-hydroxylysine Natural products NCC(O)CCC(N)C(O)=O YSMODUONRAFBET-UHFFFAOYSA-N 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000007598 dipping method Methods 0.000 description 1
- 238000002224 dissection Methods 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- YSMODUONRAFBET-UHNVWZDZSA-N erythro-5-hydroxy-L-lysine Chemical compound NC[C@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-UHNVWZDZSA-N 0.000 description 1
- 230000032050 esterification Effects 0.000 description 1
- 238000005886 esterification reaction Methods 0.000 description 1
- 229930182833 estradiol Natural products 0.000 description 1
- 229960005309 estradiol Drugs 0.000 description 1
- 125000000816 ethylene group Chemical group [H]C([H])([*:1])C([H])([H])[*:2] 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 229940118764 francisella tularensis Drugs 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 1
- 229920000370 gamma-poly(glutamate) polymer Polymers 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 210000004754 hybrid cell Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- QJHBJHUKURJDLG-UHFFFAOYSA-N hydroxy-L-lysine Natural products NCCCCC(NO)C(O)=O QJHBJHUKURJDLG-UHFFFAOYSA-N 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 150000003951 lactams Chemical group 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000011278 mitosis Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 235000010460 mustard Nutrition 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 238000006902 nitrogenation reaction Methods 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000018343 nutrient deficiency Nutrition 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 230000008775 paternal effect Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 229930002330 retinoic acid Natural products 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 239000007261 sc medium Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000014639 sexual reproduction Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 230000030118 somatic embryogenesis Effects 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 239000003270 steroid hormone Substances 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 108060008226 thioredoxin Proteins 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- YSMODUONRAFBET-WHFBIAKZSA-N threo-5-hydroxy-L-lysine Chemical compound NC[C@@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-WHFBIAKZSA-N 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 229960001727 tretinoin Drugs 0.000 description 1
- 239000003744 tubulin modulator Substances 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 230000009105 vegetative growth Effects 0.000 description 1
- 238000011514 vinification Methods 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000007221 ypg medium Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/40—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
- C07K2319/43—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation containing a FLAG-tag
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y599/00—Other isomerases (5.99)
- C12Y599/01—Other isomerases (5.99.1)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
La présente invention concerne une protéine de fusion comprenant un domaine d’une nucléase issue du système CRISPR de classe 2, en particulier Cpf1, et un domaine Spo11, ainsi que l’utilisation de cette protéine pour induire des recombinaisons méiotiques ciblées dans une cellule eucaryote.
Description
La présente invention relève du domaine des modifications génétiques ciblées chez les eucaryotes. Elle concerne notamment un procédé pour améliorer ou modifier une cellule eucaryote en induisant des recombinaisons méiotiques ciblées.
Arrière-plan technologique de l’invention
La modification du matériel génétique d'organismes eucaryotes s’est grandement développée ces vingt dernières années, et a trouvé une application dans le domaine des plantes, des cellules humaines et animales ainsi que des micro-organismes tels que les levures pour des applications dans les domaines de l'agriculture, de la santé humaine, de l’agro-alimentaire et de la protection de l'environnement.
Les levures trouvent leur application dans des domaines industriels extrêmement variés. Du fait de l’innocuité d’un grand nombre d’espèces, les levures sont notamment utilisées dans l’industrie alimentaire comme agent de fermentation en boulangerie, en brasserie, vinification ou distillerie, ou sous forme d’extraits comme éléments nutritionnels ou agents de sapidité. Elles peuvent également trouver leur usage dans la production industrielle de bioéthanol ou de molécules d’intérêt telles que des vitamines, des antibiotiques, des vaccins, des enzymes ou des hormones stéroïdiennes, ou encore dans les procédés de dégradation des matières cellulosiques. De la même façon, les plantes sont utilisées dans de nombreux domaines industriels, que ce soit dans l’industrie agro-alimentaire, cosmétique ou pharmaceutique.
La diversité des applications industrielles des levures et des plantes implique qu’il existe une demande constante pour des souches de levure et des variétés végétales présentant des caractéristiques améliorées ou, tout au moins, adaptées à une nouvelle utilisation ou de nouvelles conditions de culture. Afin d’obtenir une cellule ou un organisme eucaryote présentant une caractéristique particulière, l’homme du métier peut utiliser la reproduction sexuée et sélectionner une cellule ou un organisme hybride apportant la combinaison recherchée des caractéristiques parentales. Cette méthode est cependant aléatoire et l’étape de sélection peut engendrer des délais conséquents notamment dans le cas des levures et des plantes.
De manière alternative, l’homme du métier peut également modifier le patrimoine génétique d'une cellule ou d'un organisme par une technique d’ADN recombinant. Cette modification peut néanmoins constituer un frein à son exploitation, que ce soit pour des raisons réglementaires, sanitaires ou environnementales, notamment dans le cas des plantes considérées comme organismes génétiquement modifiés (OGM).
Une troisième alternative consiste à provoquer un réassortiment des allèles d’origine paternelle et maternelle dans le génome, au cours de la recombinaison méiotique. La recombinaison méiotique est un échange d’ADN entre chromosomes homologues au cours de la méiose. Après la réplication de l’ADN, la recombinaison est initiée par la formation de cassures double-brin dans l’une (ou l’autre) des chromatides des chromosomes homologues, suivie de la réparation de ces cassures, utilisant comme matrice une chromatide du chromosome homologue. Les recombinaisons méiotiques ont cependant l’inconvénient d’être non-uniformes. En effet, les sites de coupures double-brin à l’origine de ces recombinaisons ne sont pas distribués de façon homogène dans le génome. On distingue ainsi des régions chromosomiques dites ‘chaudes’ où la fréquence de recombinaison est élevée, et des régions chromosomiques dites ‘froides’ où la fréquence de recombinaison peut être jusqu’à 100 fois plus faible.
Spo11 est la protéine catalysant les cassures double-brin au cours de la méiose. Elle agit sous forme de dimère en coopération avec d’autres protéines partenaires. A l’heure actuelle, les facteurs déterminant le choix des sites de coupure double-brin par Spo11 et ses partenaires restent encore mal compris.
Le contrôle de la formation des cassures double-brin et, de fait, des recombinaisons méiotiques, est crucial pour le développement de techniques d’ingénierie génétique. Il a notamment été montré qu’il est possible de modifier les sites de formation de cassures double-brin en fusionnant Spo11 avec le domaine de liaison à l’ADN de l’activateur de transcription Gal4 (Pecina et al, 2002 Cell, 111, pp. 173-184). Les protéines de fusion Gal4BD-Spo11 et Gal4-Spo11 permettent d’introduire des cassures double-brin dans des régions chromosomiques dites ‘froides’, au niveau des sites de liaison de Gal4 à l’ADN. Cependant, selon le système Spo11-Gal4, l’introduction de cassures double-brin ciblées est conditionnée par la présence de sites de liaison Gal4, rendant impossible d’induire des phénomènes de recombinaisons méiotiques ciblées indépendamment de sites de liaison spécifiques.
La stimulation locale de la recombinaison méiotique sur un certain nombre de sites chromosomiques a été rapportée suite à la liaison de Spo11 à la protéine deadCas9 (Sarno et al., Nucleic Acids Research, 45 pp. e164). Cependant, l’endonucléase Cas9 et son guide ARN requiert une séquence spécifique riche en guanines appelée PAM (5‘-NGG-3’), ce qui limite les utilisations potentielles de ce système.
Ainsi, il reste un besoin de mettre à disposition des méthodes permettant d'induire facilement et spécifiquement la recombinaison méiotique de régions du génome inaccessibles aux techniques de l'art antérieur et pouvant s’appliquer à une large gamme de cellules eucaryotes.
L’objectif de la présente invention est de proposer une protéine de fusion ainsi qu’un procédé permettant d’induire des recombinaisons méiotiques ciblées dans des cellules eucaryotes, de préférence des cellules de levure ou de plante, dans n’importe quelle région du génome, de préférence plusieurs régions différentes du génome, indépendamment de tout site de liaison connu, et notamment dans des régions chromosomiques dites ‘froides’.
Ainsi, selon un premier aspect, la présente invention concerne une protéine de fusion comprenant (i) une nucléase associée à un système CRISPR, de préférence un système CRISPR de classe 2, et (ii) une protéine Spo11 ou l’un de ses partenaires impliqués dans la formation et la réparation des cassures double brin lors de la méiose, dans laquelle la nucléase associée au système CRISPR n’est pas une nucléase Cas9.
De préférence, la nucléase associée à un système CRISPR n’est pas une nucléase de classe II et de type II.
De préférence, la nucléase (i) est associée à un système CRISPR de classe II, de préférence de type V, De manière tout particulièrement préférée, la nucléase associée à un système CRISPR est Cpf1.
En particulier, la protéine de fusion peut comprendre une protéine Spo11 déficiente pour l’activité nucléase.
Alternativement, la protéine de fusion peut comprendre un partenaire de Spo11, de préférence choisi dans le groupe constitué par Rec102, MTOPVIB/TOPOVIBL, Rec103/Ski8, Rec104, Rec114, Mer1, Mer2/Rec107, Mei4, Mre2/Nam8, Mre11, Rad50, Xrs2/Nbs1, Hop1, Red1, Mek1, Set1 et Spp1, et les orthologues de ceux-ci.
Selon un deuxième aspect, la présente invention concerne un acide nucléique codant pour la protéine de fusion définie ci-dessus.
Selon un troisième aspect, la présente invention concerne également une cassette d’expression ou un vecteur comprenant un acide nucléique tel que défini ci-dessus.
Selon un quatrième aspect, la présente invention concerne également une cellule hôte non humaine, comprenant une protéine de fusion, un acide nucléique, une cassette ou un vecteur tel que défini ci-dessus.
De préférence, la cellule hôte est une cellule eucaryote, de manière encore préférée une cellule de levure, de plante, de champignon ou une cellule animale, et de manière tout particulièrement préférée, la cellule hôte est une cellule de plante ou une cellule de levure. En particulier, la cellule hôte est une cellule de plante, la plante étant de préférence d’intérêt agronomique, horticole, pharmaceutique ou cosmétique, notamment les légumes, les fruits, les herbes, les fleurs, arbres et arbustes.
De préférence, la cellule de plante est sélectionnée dans le groupe constitué par du riz, du blé, du soja, du maïs, de la tomate, de l’oignon, du concombre, de la laitue, de l’asperge, de la carotte, du navet, d’Arabidopsis thaliana, de l’orge, du colza, du coton, de la vigne, de la canne à sucre, de la betterave, du coton, du tournesol, de l’olivier à palmes, du café, du thé, du cacao, de la chicorée, du poivron, du piment, du citron, de l’orange, de la nectarine, de la mangue, de la pomme, de la banane, de la pêche, de l’abricot, de la patate douce, des yams, de l’amande, de la noisette, de la fraise, du melon, de la pastèque, de l’olivier, et des plantes horticoles comme par exemple les rosiers, les tulipes, les orchidées et les géraniums. De préférence, la cellule de plante est sélectionnée dans le groupe constitué par le riz, le blé, le soja, le maïs et la tomate.
Selon un cinquième aspect, l’invention concerne un procédé pour induire des recombinaisons méiotiques ciblées dans une cellule eucaryote non humaine, comprenant
- l’introduction dans ladite cellule :
a) d’une protéine de fusion, d’un acide nucléique, d’une cassette d’expression ou d’un vecteur tels que décris ci-dessus ; et
b) d’un ou plusieurs ARN guides ou d’un ou plusieurs acides nucléiques codant lesdits ARN guides, lesdits ARN guides comprenant une structure ARN de fixation à la nucléase associée à un système CRISPR de la protéine de fusion et une séquence complémentaire de la région chromosomique ciblée ; et
- l’induction de l’entrée en prophase I de méiose de ladite cellule.
La présente invention concerne encore, dans un sixième aspect, un procédé pour générer des variants d’un organisme eucaryote non humain, comprenant :
- l’introduction dans une cellule dudit organisme :
a) d’une protéine de fusion, d’un acide nucléique, d’une cassette d’expression ou d’un vecteur tels que décris ci-dessus ; et
b) d’un ou plusieurs ARN guides ou d’un ou plusieurs acides nucléiques codant lesdits ARN guides, lesdits ARN guides comprenant une structure ARN de fixation à la nucléase associée à un système CRISPR de la protéine de fusion et une séquence complémentaire de la région chromosomique ciblée ; et
- l’induction de l’entrée en prophase I de méiose de ladite cellule ;
- l’obtention de cellule(s) présentant la ou les recombinaisons recherchées au niveau de la ou des régions chromosomiques ciblées ; et
- la genèse d’un variant de l’organisme à partir de ladite cellule recombinée.
Dans un septième aspect, la présente invention concerne également un procédé pour identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote non humaine, comprenant :
- l’introduction dans la cellule eucaryote :
a) d’une protéine de fusion, d’un acide nucléique, d’une cassette d’expression ou d’un vecteur tels que décris ci-dessus ; et
b) d’un ou plusieurs ARN guides ou d’un ou plusieurs acides nucléiques codant lesdits ARN guides, lesdits ARN guides comprenant une structure ARN de fixation à la nucléase associée à un système CRISPR de la protéine de fusion et une séquence complémentaire de la région chromosomique ciblée ; et
- l’induction de l’entrée en prophase I de méiose de ladite cellule ;
- l’obtention de cellule(s) présentant la ou les recombinaisons recherchées au niveau de la ou des régions chromosomiques ciblées ; et
- l’analyse des génotypes et phénotypes des cellules recombinées afin d’identifier ou de localiser l’information génétique codant pour la caractéristique d’intérêt.
De préférence, la caractéristique d’intérêt est un caractère quantitatif d’intérêt (QTL).
Dans un huitième aspect, la présente invention concerne enfin l’utilisation d’une protéine de fusion, d’un acide nucléique, d’une cassette d’expression ou d’un vecteur pour (i) induire des recombinaisons méiotiques ciblées dans une cellule eucaryote non humaine, (ii) générer des variants d’un organisme eucaryote non humain, et/ou (iii) identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote non humaine.
Description détaillée de l’invention
Le système CRISPR(" Clustered Regularly Interspaced Short Palindromic Repeats ")est un système de défense mis en évidence chez les bactéries et les archées contre les ADN étrangers. Ces courts fragments correspondant à l’agent infectieux sont insérés dans une série de répétitions CRISPR et sont utilisés sous forme de guide ARN CRISPR (crARN) pour cibler l’agent infectieux lors d’infections ultérieures. Ce système repose essentiellement sur l’association d’une protéine endonucléase Cas (CRISPR- associated) et d’un ARN « guide » (ARNg ou sgARN) responsable de la spécificité du site de clivage. Il permet la réalisation de cassures d’ADN double-brin (CDB) aux sites ciblés par le système CRISPR.
Il existe cinq types principaux de systèmes CRISPR qui se différencient par les répertoires des gènes associés aux CRISPR, l’organisation des opérons Cas et la structure des répétitions au sein des matrices CRISPR. Ces cinq types de systèmes ont été répartis en deux classes : la classe I regroupant les types I, III et IV qui utilisent un module effecteur crRNA multimérique et la classe II regroupant les types II, V et VI qui utilisent un module effecteur crRNA monomérique.
Les systèmes CRISPR de classe II et de type II, majoritairement représentés par les nucléases Cas9 et Csn2, comprennent un petit ARN agissant en trans appelé tracrARN("trans-acting cr A RN ")qui s'apparie avec chaque répétition du pré-crARN («CRISPR ARN ») pour former un ARN double brin [tracrARN:crARN] clivé par la RNase III en présence de l'endonucléase.
Les systèmes CRISPR de classe II et de type VI sont représentés par les protéines C13a (connue précédemment sous le nom C2c2), C13b et C13c. Le système CRISPR-C13 a été découvert chez la bactérieLeptotrichia shahii(Abudayyeh et al., Science 2016 ; 353(6299) : aaf5573) et est analogue au système CRISPR-Cas9. Cependant, contrairement à Cas9 qui cible l'ADN, les protéines C13 ciblent et clivent l'ARN simple brin.
Les systèmes CRISPR-Cas de classe II et de type V, sont entre autres représentés par la nucléase Cpf1 (également appelée Cas12a) récemment découverte chez la bactérieFrancisella novicida(Zetsche B, Cell 2015 ; 163 : 759–771), et les nucléases C2c1 (également appelée Cas12b) et C2c3 identifiées chez Alicyclobacillus acidoterrestris (Shmakov et al., Molecular Cell, 2015 Volume 60, Issue 3, P385-397). Cpf1 contient un domaine mixte alpha/bêta, un domaine RuvC-I suivi d'une région hélicoïdale, un domaine RuvC-II et un domaine en doigt de zinc. Un système CRISPR-Cpf1 fonctionnel ne nécessite pas de tracrARN mais seulement un crARN. En particulier, un crRNA de 42-44 nucléotides avec une séquence répétée directe d'environ 19 nucléotides suivie d'une séquence proto-espaceur de 23-25 nucléotides est suffisant pour guider l'endonucléase Cpf1 vers l’acide nucléique cible.
Le complexe Cpf1-crARN clive l'ADN ou l'ARN cible en identifiant un motif PAM 5'-YTN-3’ ou 5'-TTTN-3' adjacent au proto-espaceur (où "Y" est une pyrimidine et "N" est une nucléobase quelconque), par opposition au motif PAM riche en guanine (5'-NGG-3’) ciblé par Cas9. La reconnaissance d’un PAM riche en thymidine permet d’étendre le nombre de sites ciblés par la technique CRISPR aux régions riches en A-T dépourvues des motifs PAM et permet son utilisation dans des cellules présentant un génome riche en G, limitant ainsi la survenue de ciblage aspécifique ou « off-targets ».
Après l'identification du motif PAM, Cpf1 introduit une cassure double brin libérant des extrémités collantes, généralement générant 4 ou 5 nucléotides en surplomb. Ce type de coupure se différencie des cassures générées par les nucléases de classe II et de type II telles que Cas9, qui génèrent des extrémités franches après clivage, et permet de réaliser des insertions directionnelles des gènes, analogues à celles réalisées par les enzymes de restrictions traditionnelles. Cpf1 clive l'ADN 18-23 pb en aval du site PAM, ce qui n'entraîne aucune perturbation de la séquence de reconnaissance après réparation des cassures double-brin (CDB). En conséquence, Cpf1 permet plusieurs cycles de clivage de l'ADN et offre une possibilité accrue d’obtenir la modification génomique souhaitée.
Les inventeurs ont démontré qu’il était possible de modifier le système CRISPR-Cpf1 afin d’induire des recombinaisons méiotiques ciblées dans une cellule eucaryote, et en particulier dans une levure ou une cellule de plante. Ils ont en effet montré que l’expression combinée d’une protéine de fusion comprenant un domaine Cpf1 et un domaine Spo11 et d’un ARN guide permettait de manière surprenante d’induire des recombinaisons méiotiques ciblées par le biais de cassures double-brin durant la prophase I de méiose et la réparation de ces cassures.
Ce système n’a jamais été utilisé pour cibler des sites de recombinaison méiotique dans quelque organisme que ce soit.
Ainsi, selon un premier aspect la présente invention concerne une protéine de fusion comprenant (i) une nucléase associée à un système CRISPR, de préférence un système CRISPR de classe II, et (ii) une protéine Spo11 ou l’un des partenaires de Spo11 impliqués dans la formation et la réparation des cassures double brin lors de la méiose.
Tel qu’utilisé ici, le terme « protéine de fusion » se réfère à une protéine chimérique comprenant au moins deux domaines issus de la combinaison de différentes protéines ou fragments de protéines. L’acide nucléique codant cette protéine est obtenu par juxtaposition des régions codant les protéines ou fragments de protéine de façon à ce que ceux-ci soient en phase et transcrits sur le même ARNm. Les différents domaines de la protéine de fusion peuvent être directement adjacents ou être séparés par des séquences de liaison (ou linker) qui introduisent une certaine flexibilité structurale dans la construction. La protéine de fusion selon la présente invention comprend un premier domaine qui est une nucléase associée à un système CRISPR et un second domaine qui est une protéine Spo11 ou l’un des partenaires de Spo11 impliqués dans la formation et la réparation des cassures double brin lors de la méiose.
Spo11 est une protéine apparentée à la sous-unité catalytique A d’une topo-isomérase de type II présente chez les archaebactéries (Bergerat et al, Nature, vol. 386, pp 414-7). Elle catalyse les cassures double-brin de l’ADN initiant les recombinaisons méiotiques. C’est une protéine très conservée au niveau évolutif pour laquelle il existe des homologues chez tous les eucaryotes. Spo11 est active sous forme d’un dimère formé de deux sous-unités, dont chacune clive un brin d’ADN. Spo11 n’agit pas seule. Chez la levureS. cerevisiae,par exemple, elle coopère avec les protéines, Rec102, MTOPVIB, Rec103/Sk18, Rec104, Rec114, Mer1, Mer2/Rec107, Mei4, Mre2/Nam8, Mre11, Rad50, Xrs2/Nbs1, Hop1, Red1, Mek1, Set1 et Spp1 comme décrits dans les articles de Keeney et al. (2001 Curr. Top. Dev. Biol, 52, pp. 1-53), Smith et al. (Curr. Opin. Genet. Dev, 1998, 8, pp. 200-211) et Acquaviva et al. (2013 Science, 339, pp. 215-218). Il a été démontré que le ciblage de Spo11 à un site donné est suffisant pour déclencher le processus de recombinaison méiotique (Pecina et al, 2002 Cell, 111, pp 173-184; Acquaviva et al. 2013 Science, 339, pp. 215-218)). Il est à noter que plusieurs homologues de la protéine Spo11 peuvent co-exister dans une même cellule, notamment chez les plantes.
La protéine Spo11, le fragment ou domaine de celle-ci tel qu’utilisé dans la présente invention, peut être obtenu à partir de toute protéine Spo11 connue telle que la protéine Spo11 deSaccharomyces cerevisiae(Gene ID: 856364, Numéro d’entrée NCBI : NP_011841 (SEQ ID NO : 1), Esposito and Esposito, Genetics, 1969, 61, pp. 79-89), la protéine AtSpo11-1 et AtSpo11-2 d’Arabidopsis thaliana(Grelon M. et al, 2001, Embo J., 20, pp. 589-600), la protéine murine mSpo11 (Baudat F et al, Molecular Cell, 2000, 6, pp. 989-998), la protéine Spo11 deC. elegansou encore la protéine Spo11 de drosophile meiW68 (McKim et al, 1998, Genes Dev, 12(18), pp. 2932-2942). Bien entendu, ces exemples ne sont pas limitatifs et toute protéine Spo11 connue peut être utilisée dans la protéine de fusion selon l’invention. De préférence, la protéine Spo11 est obtenue à partir d’une des protéines Spo11 de la cellule eucaryote d’intérêt.
Selon un mode de réalisation préféré, le domaine Spo11 comprend, ou consiste en, une protéine Spo11, de préférence une protéine Spo11 deSaccharomyces cerevisiae, telle que par exemple la protéine de séquence NP_011841 (SEQ ID NO :1) ou une séquence présentant au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité avec une protéine Spo11, de préférence avec une protéine Spo11 deSaccharomyces cerevisiaeou encore une protéine apparentée portant des motifs conservés avec la protéine Spo11, en particulier la protéine de séquence SEQ ID NO : 1
Selon un mode de réalisation particulier, plusieurs protéines de fusion selon l’invention comprenant différents domaines Spo11 peuvent être introduites dans la même cellule. En particulier, lorsque plusieurs homologues de Spo11 existent dans la cellule eucaryote d’intérêt, les différentes protéines de fusion peuvent comprendre des homologues différents de Spo11. A titre d’exemple, deux protéines de fusion selon l’invention comprenant respectivement des domaines Spo11-1 et Spo11-2 d’Arabidopsis thalianapeuvent être introduites dans la même cellule, de préférence dans la même cellule d’Arabidopsis thaliana. Toujours à titre d’exemple, une ou plusieurs protéines de fusion selon l’invention comprenant des domaines Spo11-1, Spo11-2, Spo11-3 et/ou Spo11-4 de riz peuvent être introduits dans la même cellule, de préférence dans la même cellule de riz. De nombreux homologues de Spo11 ont été identifiés dans différentes espèces, en particulier dans les espèces végétales (Sprink T et Hartung F, Frontiers in Plant Science, 2014, Vol. 5, article 214, doi: 10.3389/fpls.2014.00214 ; Shingu Y et al, BMC Mol Biol, 2012, doi: 10.1186/1471-2199-13-1). L’homme du métier peut aisément identifier les homologues de Spo11 dans une espèce donnée, notamment au moyen de techniques bien connues de bio-informatique.
Selon un mode de réalisation préféré, le domaine Spo11 comprend, ou consiste en, une protéine Spo11 de plante, notamment choisie parmi : les protéines Spo11 d’Arabidopsis thaliana, par exemple telles que décrites sous la référence Uniprot Q9M4A2-1 (SEQ ID NO : 10), les protéines Spo11 d’Oryza sativa(riz), par exemple telles que décrite par Fayos I. et al., 2019 Plant Biotechnol J. Nov;17(11):2062-2077 et sous les références UniProt Q2QM00 (SEQ ID NO : 11), Q7Y021 (SEQ ID NO : 12), Q5ZPV8 (SEQ ID NO : 13), A2XFC1 (SEQ ID NO : 14) et Uniprot, Q6ZD95(SEQ ID NO : 40), les protéines Spo11 deBrassica campestris(moutarde), par exemple telles que décrites sous les références UniProt A0A024AGF2 (SEQ ID NO : 15) et A0A024AHI2 (SEQ ID NO : 16), les protéines Spo11 deZea mays(maïs), par exemple telles que décrites sous les références Uniprot B6UAQ8 (SEQ ID NO : 17) et B6TWI5 (SEQ ID NO : 18), A0A1P8W169-1 (SEQ ID NO : 41) et A0A1P8W163 (SEQ ID NO : 42),
les protéines Spo11 deCapsicum baccatum(poivrier), par exemple telles que décrites sous les références A0A2G2WFG5 (SEQ ID NO : 19) et A0A2G2WFH4 (SEQ ID NO : 20), la protéine Spo11 deCarica papaya(papaye) par exemple telle que décrite sous la référence Uniprot A0A024AG98 (SEQ ID NO : 21). En particulier, le domaine Spo11 peut comprendre, ou consister en, une protéine Spo11 choisie parmi l’une des protéines Spo11 mentionnées ci-dessus, de préférence les séquences des SEQ ID NO : 1, 2 et 10 à 21 et 40-42, et les variants de celles-ci comprenant une séquence présentant au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité avec l’un de ces séquences et une activité Spo11. Tel qu’utilisé ici, le terme « activité Spo11 » se réfère à la capacité d’une protéine à induire des cassures double-brin durant la prophase I de méiose et/ou la capacité d’une protéine à recruter un ou plusieurs partenaires de Spo11 tels que définis ci-dessous. De préférence, ce terme se réfère à la capacité d’une protéine à recruter un ou plusieurs partenaires de Spo11 et, optionnellement à la capacité d’une protéine à induire des cassures double-brin durant la prophase I de méiose.
Selon un aspect particulier, le domaine Spo11 de la protéine de fusion comprend un variant d’une protéine Spo11, de préférence un variant dont l’activité nucléase a été abolie, réduite ou améliorée par rapport à la protéine Spo11 sauvage.
Dans un mode de réalisation, le domaine Spo11 de la protéine de fusion selon l’invention est doué d’une activité nucléase et responsable des cassures double-brin. Ce domaine peut être constitué d’une protéine Spo11 ou d’un fragment de celle-ci capable d’induire des cassures double brin de l’ADN.
De manière alternative, le domaine Spo11 peut comprendre un variant d’une protéine Spo11 qui présente une activité nucléase déficiente encore appelé « dead Spo11 » ou « dSpo11 ». Ainsi, la protéine de fusion utilisée dans la présente invention peut comprendre un domaine qui est une nucléase associée à un système CRISPR et un domaine Spo11 présentant une activité nucléase déficiente. De préférence, lorsque plusieurs protéines de fusion sont introduites dans la cellule eucaryote, les différents domaines de Spo11 ou homologues de Spo11 sont tous déficients pour l’activité nucléase.
Tel qu’utilisé ici, le terme « activité nucléase » se réfère à l’activité enzymatique d’une endonucléase qui possède un site actif permettant de créer des coupures à l'intérieur des chaînes d'ADN ou d'ARN, de préférence des cassures double brin d’ADN.
Par « activité nucléase déficiente », on entend particulièrement une activité nucléase réduite, diminuée ou inexistante notamment par rapport à l’activité nucléase de la protéine sauvage dont est issu le variant.
Selon un mode particulier, la capacité de clivage de l’ADN ou de l’ARN et/ou l’activité hydrolase de la nucléase est réduite ou diminuée, notamment par rapport à l’activité nucléase de la protéine sauvage. De préférence, l’activité nucléase d’un domaine Spo11 présentant une activité nucléase déficiente est réduite d’au moins 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 ou de 100%, par rapport à l’activité nucléase du domaine Spo11 sauvage. De manière particulièrement préférée, un domaine Spo11 présentant une activité nucléase déficiente est un domaine Spo11 incapable de générer des cassures double brin.
En particulier, le domaine Spo11 présentant une activité nucléase déficiente peut comprendre un site catalytique muté, la mutation impactant négativement la capacité nucléasique ou hydrolytique du domaine Spo11. De préférence, le domaine Spo11 peut comprendre, ou consister en, une protéine Spo11 mutante dans laquelle le résidu correspondant à la tyrosine en position 135 de la SEQ ID NO : 1 est substitué par une phénylalanine. Une protéine Spo11 présentant une telle substitution est incapable d’induire des cassures double-brin de l’ADN (Bergerat et al, Nature, vol. 386, pp 414-417) et peut notamment présenter une séquence telle que décrite dans la SEQ ID NO :2. Ainsi, le domaine Spo11 peut être un variant des séquences SEQ ID NO : 1, 2 et 10 à 21 et 40-42, présentant au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité avec l’un de ces séquences et dans lequel le résidu correspondant à la tyrosine en position 135 de la SEQ ID NO : 1 est substitué par une phénylalanine, comme présenté dans la SEQ ID NO :2.
De préférence, le domaine Spo11 présentant une activité nucléase déficiente est toujours capable de recruter un ou plusieurs des partenaires de Spo11, notamment un ou plusieurs des partenaires décrits ci-dessous. Ainsi, bien que l’activité nucléase du domaine Spo11 puisse être altérée, sa capacité à interagir avec les partenaires de Spo11 est de préférence conservée.
De manière alternative, le domaine Spo11 de la protéine de fusion peut être remplacé par l’un des partenaires de Spo11 impliqués dans la formation et la réparation des cassures double brin lors de la méiose. En particulier, le partenaire de Spo11 tel qu’utilisé dans la protéine de fusion est capable de recruter Spo11, de préférence est une protéine qui forme un complexe avec Spo11 et induit ainsi la formation des cassures double-brin ou leur réparation. Ce partenaire peut être choisi parmi les protéines citées dans les articles de Keeney et al. (2001 Curr. Top. Dev. Biol, 52, pp. 1-53), Smith et al. (Curr. Opin. Genet. Dev, 1998, 8, pp. 200-211), Acquaviva et al. (2013 Science, 339, pp. 215-8), Vrielynck et al., (2016 Science, 351, pp 939-943), Roberts et al. (Science 2016: Vol. 351, Issue 6276, pp. 943-949) et Frank R. Blattner (Plant Systematics and Evolution volume 302, pages 239–244(2016). De préférence, la protéine de fusion selon l’invention comprend un partenaire de Spo11 choisi parmi Rec102, Rec103/Sk18, Rec104, Rec114, MTOPOVIB, Mer1, Mer2/Rec107, Mei4, Mre2/Nam8, Mre11, Rad50, Xrs2/Nbs1, Hop1, Red1, Mek1, Set1, Ski8, et Spp1, et les variants et orthologues de ceux-ci. De manière préférée, le partenaire remplaçant le domaine Spo11 comprend une protéine choisie parmi Mei4, Mer2, Rec102, Rec104, Rec114, Set1, Spp1 et MTOPVIB, et les variants et orthologues de celles-ci. Tels qu’envisagés ici, les variants de ces protéines présentent au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité de séquence avec l’une de ces protéines et sont capables de recruter Spo11. De manière toute préférée, le partenaire de Spo11 est une topoisomérase, de préférence choisie parmi la famille des TOPOVIB et l’un de ces variants et orthologues, de manière préférée une MTOPOVIB ou MTOPOVIBL active en méiose (Vrielynck, et al., (2016 Science 351 pp 939-943).
Tous les modes de réalisation décrits pour la protéine de fusion avec un domaine Spo11 s’appliquent également aux protéines de fusion dans lesquelles le domaine Spo11 est remplacé par l’un des partenaires de Spo11.
La protéine de fusion selon la présente invention comprend également un domaine qui est une nucléase associée à un système CRISPR (domaine CRISPR).
Selon un mode de réalisation, la protéine de fusion selon l’invention comprend une nucléase associée à un système CRISPR de classe II, de préférence de type II, V ou VI, de manière préférée de type V ou de type VI, préférentiellement de type V.
Selon un mode de réalisation, la protéine de fusion selon l’invention comprend une nucléase associée à un système CRISPR de classe II et de type II, en particulier à l’exclusion d’une nucléase de type Cas9, par exemple Cns2, notamment la nucléase Cns2 deStreptococcus thermophilus,par exemple telle que décrite sous le numéro d’accession GenBank: AEM62890.1, deStreptococcus pyogenes,par exemple telle que décrite sous le numéro d’accession GenBank: ANC25453.1, ou deStreptococcus canispar exemple telle que décrite sous le numéro d’accession GenBank: VTR80107.1 De préférence, la nucléase associée à un système CRISPR n’est pas une nucléase Cas9. Selon un mode de réalisation, la protéine de fusion selon l’invention comprend une nucléase associée à un système CRISPR de classe II et de type VI, de préférence Cas13a (C2c2), Cas13b ou Cas13c, par exemple la nucléase Cas13a deHerbinix hemicellulosilytica, en particulier telle que décrite sous le numéro d’accession GenBank: WP_103203632.1, la nucléase Cas13a deLachnospiraceae bacterium, en particulier telle que décrite sous le numéro d’accession GenBank : WP_022785443.1, ou la nucléase Cas13a deLeptotrichia wadei, en particulier telle que décrite sous le numéro d’accession GenBank : WP_021746003.1.
Selon un mode de réalisation, la protéine de fusion selon l’invention comprend une nucléase associée à un système CRISPR de classe II et de type V, de préférence Cpf1 (également appelé Cas12a), C2c1 (également appelé Cas12b) ou C2c3.
Dans un mode de réalisation préférée, la protéine de fusion comprend un domaine CRISPR de classe II, de préférence de type V et préférentiellement un domaine Cpf1.
Les nucléases associées à un système CRISPR telles qu’envisagé, peuvent comprendre, ou consister en, une nucléase choisie parmi l’une des nucléases mentionnées ci-dessus, et les variants de celles-ci comprenant une séquence présentant au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité avec l’un de ces séquences, et une activité de nucléase associée à un système CRISPR. Tel qu’utilisé ici, le terme « activité de nucléase associée à un système CRISPR » se réfère à une activité nucléase et/ou la capacité d’interagir avec l’ARN guide et de reconnaître la région ciblée de l’acide nucléique.
Selon un mode de réalisation préféré, la nucléase associée à un système CRISPR est la nucléase Cpf1.
La nucléase Cpf1 peut être choisie parmi les protéines Cpf1 issues des bactéries du genrePrevotella , M o raxella , Leptospira, Lachnospiraceae , Francissela , Candidatus , Eubacterium , Parcubacteria , Peregrinibacteria , AcidmicococcusetProphyromonas .En particulier, le domaine Cpf1 peut être sélectionné parmi les protéines Cpf1 des bactériesParcubacteria bacteriumGWC2011_GWC2_44_17 (PbCpf1, par exemple telle que décrit sous le numéro d’accession Genbank KKT48220.1, SEQ ID NO : 22),Peregrinibacteria bacteriumGW2011_GWA_33_10 (PeCpf1, par exemple telle que décrit sous le numéro d’accession Genbank KKP36646.1, SEQ ID NO : 23),Acidaminococcus sp. BVBLG(AsCpf1, par exemple telle que décrit sous le numéro d’accession Genbank WP_021736722.1, SEQ ID NO : 24),Prophyromonas macacae(PmCpf1, par exemple telle que décrit sous le numéro d’accession Genbank WP_018359861.1, SEQ ID NO : 25),Prophyromonas crevioricanis(PcCpf1, par exemple telle que décrit sous le numéro d’accession Genbank WP_036890108.1, SEQ ID NO : 26),Francisella tularensis(UniProtKB : A0Q7Q2, SEQ ID NO : 27)Acidaminococcus sp.(UniProtKB : U2UMQ6, SEQ ID NO : 28),Prevotella disiens(PdCpF1, par exemple telle que décrit sous le numéro d’accession Genbank WP_004356401.1, SEQ ID NO : 29),Moraxellabovoculi 237 (MbCpf1, par exemple telle que décrit sous le numéro d’accession Genbank KDN25524.1, SEQ ID NO : 30),Leptospira inadai(LiCpf1, par exemple telle que décrit sous le numéro d’accession Genbank WP_020988726.1, SEQ ID NO : 31),Lachnospiraceae bacteriumMA2020 (LbCpf1, par exemple telle que décrit sous le numéro d’accession Genbank WP_044919442.1, SEQ ID NO : 32),Francisella novicidaU112 (FnCpf1, par exemple telle que décrit sous le numéro d’accession Genbank WP_003040289.1, SEQ ID NO : 33). Bien entendu, ces exemples ne sont pas limitatifs et toute protéine Cpf1 connue peut être utilisée dans la protéine de fusion ou le procédé selon l’invention. Selon un mode de réalisation particulier, le domaine Cpf1 comprend, ou consiste en, une protéine comprenant une séquence choisie parmi les séquences décrites ci-dessus, en particulier choisie parmi les séquences SEQ ID NO : 22 à 33 et les protéines comprenant une séquence présentant au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité avec l’une de ces séquences et une activité Cpf1. Tel qu’utilisé ici, le terme « activité Cpf1 » se réfère à une activité nucléase et/ou la capacité d’interagir avec l’ARN guide et de reconnaître la région ciblée de l’acide nucléique.
Selon un aspect particulier, la protéine de fusion comprend un variant ou un mutant de Cpf1. Par exemple, la protéine de fusion selon l’invention peut comprendre un domaine Cpf1 dont l’activité nucléase a été abolie, réduite ou améliorée. Ce type de mutant comprend notamment des mutations dans le domaine nucléase RuvC de Cpf1. Afin de faciliter le ciblage de différentes régions du génome, le domaine Cpf1 peut également comprendre des mutations altérant la reconnaissance des PAM telles que décrites dans Gao et al., Nat Biotechnol. 2017 Aug; 35(8): 789–792. La protéine Cpf1 peut également être tronquée afin de supprimer les domaines de la protéine non-essentiels aux fonctions de la protéine de fusion, en particulier les domaines de la protéine Cpf1 qui ne sont pas nécessaires à l’interaction avec l’ARN guide.
Selon un mode de réalisation particulier, le domaine Cpf1 comprend, ou consiste en, la séquence deFnCpf1 (SEQ ID NO : 3), ouLbCpf1 (SEQ ID NO : 4) ou encore une séquence présentant au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité avec l’une de ces séquences.
De manière alternative, le domaine qui est une nucléase associée à un système CRISPR peut présenter une activité nucléase déficiente. Par « activité nucléase déficiente » on entend particulièrement une activité nucléase réduite, diminuée ou inexistante notamment par rapport à l’activité nucléase de la protéine sauvage.
Selon un mode particulier, la capacité de clivage de l’ADN ou de l’ARN et/ou l’activité hydrolase de la nucléase est réduite ou diminuée, notamment par rapport à l’activité nucléase de la protéine sauvage. De préférence, l’activité nucléase de la protéine associée à un système CRISPR présentant une activité nucléase déficiente est réduite d’au moins 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 ou de 100%, par rapport à l’activité nucléase de la protéine sauvage.
En particulier, la nucléase associée à un système CRISPR, de préférence de classe II et de type V, présentant une activité nucléase déficiente peut comprendre un site catalytique muté, la mutation impactant négativement la capacité nucléasique ou hydrolytique de la protéine.
De préférence, la nucléase associée à un système CRISPR déficiente pour l’activité nucléase peut comprendre, ou consister en, une protéine Cpf1 mutante par exemple telle que décrite dans Zhang et al., Cell Discov. 2018; 4: 36, comportant la mutation D832A. Une protéine Cpf1 présentant une telle substitution est incapable d’induire des cassures double-brin de l’ADN, et peut notamment prendre le nom de « dead Cpf1 » ou « dCpf1 ». En particulier, le domaine Cpf1 peut être un variant des séquences SEQ ID NO : 3, 4 et 22 à 33 présentant au moins 80, 85, 90, 95, 96, 97, 98, ou 99% d’identité avec l’un de ces séquences et dans lequel le résidu correspondant à l’aspartate en position 832 de la SEQ ID NO : 3 ou 4 est substituée par une alanine. De préférence, le domaine dCpf1 peut comprendre ou consister en la séquence SEQ ID NO : 5 ou SEQ ID NO : 6.
La protéine de fusion comprend, de préférence, au moins un domaine, CRISPR ou Spo11, présentant une activité nucléase. Selon un mode de réalisation, la protéine de fusion comprend un domaine Spo11 présentant une activité nucléase et un domaine qui est une nucléase associée à un système CRISPR, de préférence une nucléase Cpf1, déficient pour l’activité nucléase. Selon un mode de réalisation préféré, la protéine de fusion comprend un domaine Spo11 déficient pour l’activité nucléase et un domaine qui est une nucléase associée à un système CRISPR, de préférence une nucléase Cpf1, présentant une activité nucléase.
De manière alternative, la protéine de fusion comprend (i) un domaine Spo11 présentant une activité nucléase déficiente et (ii) un domaine CRISPR présentant une activité nucléase déficiente. Ainsi, la protéine de fusion de la présente invention peut comprendre un domaine qui est une nucléase associée à un système CRISPR et un domaine Spo11, les deux domaines présentant une activité nucléase déficiente.
L’homme du métier sait comment évaluer l’activité nucléasique de Cpf1, notamment d’après la technique décrite dans l’article de Zetsche, et al. (2015) Cell, 163, 759-771.
Selon un mode de réalisation, le domaine Spo11 est du côté N-terminal et le domaine CRISPR, de préférence le domaine Cpf1, du côté C-terminal de la protéine de fusion. Selon un autre mode de réalisation, le domaine Spo11 est du côté C-terminal et le domaine CRISPR, de préférence le domaine Cpf1, du côté N-terminal de la protéine de fusion.
La protéine de fusion peut également comprendre une séquence signal de localisation nucléaire (SLN). Les séquences SLN sont bien connues de l’homme du métier et comprennent en général une courte séquence d’acides aminés basiques. A titre d’exemple, la séquence SLN peut comprendre la séquence PKKKRKV (SEQ ID NO : 7). La séquence SLN peut être présente à l’extrémité N-terminale, C-terminale ou dans une région interne de la protéine de fusion.
La protéine de fusion peut également comprendre un domaine supplémentaire de pénétration dans la cellule, c’est-à-dire un domaine facilitant l’entrée de la protéine de fusion dans la cellule. Ce type de domaine est bien connu de l’homme du métier et peut comprendre par exemple une séquence peptidique de pénétration dérivée de la protéine TAT du VIH-1 telle que GRKKRRQRRRPPQPKKKRKV (SEQ ID NO : 8), dérivée de la séquence TLM du virus de l’hépatite B humaine telle que PLSSIFSRIGDPPKKKRKV (SEQ ID NO : 9), ou une séquence peptidique polyarginine. Ce domaine de pénétration dans la cellule peut être présent à l’extrémité N-terminale, C-terminale ou être à l’intérieur de la protéine de fusion.
La protéine de fusion peut comprendre en outre une ou des séquences de liaison (linkers) entre les domaines CRISPR de classe II, de préférence de type V et préférentiellement Cpf1, et Spo11, et optionnellement entre ces domaines et les autres domaines de la protéine tels que la séquence signal de localisation nucléaire ou le domaine de pénétration dans la cellule. La longueur de ces séquences de liaison est aisément ajustable par l’homme du métier. En général, ces séquences comprennent entre 10 et 20 acides aminés, de préférence environ 15 acides aminés et de manière encore préférée 12 acides aminés. Les séquences de liaison entre les différents domaines peuvent être de longueurs identiques ou différentes.
Selon un mode de réalisation particulier, la protéine de fusion comprend, ou consiste en, successivement, depuis l’extrémité N-terminale jusqu’à l’extrémité C-terminale : un signal de localisation nucléaire, une première séquence de liaison (linker1), un domaine CRISPR, de préférence un domaine Cpf1, une seconde séquence de liaison (linker2) et un domaine Spo11.
Selon un autre mode de réalisation particulier, la protéine de fusion comprend, ou consiste en, successivement, depuis l’extrémité N-terminale jusqu’à l’extrémité C-terminale : un signal de localisation nucléaire, une première séquence de liaison (linker1), un domaine Spo11, une seconde séquence de liaison (linker2) et un domaine CRISPR, de préférence un domaine Cpf1.
La protéine de fusion peut en outre comprendre une étiquette (ou tag) qui est une séquence définie d’acides aminés. Cette étiquette peut notamment être utilisée afin de détecter l’expression de la protéine de fusion, d’identifier les protéines interagissant avec la protéine de fusion ou de caractériser les sites de fixation de la protéine de fusion dans le génome. La détection de l’étiquette attachée à la protéine de fusion peut être réalisée avec un anticorps spécifique de ladite étiquette ou toute autre technique bien connue de l’homme du métier. L’identification des protéines interagissant avec la protéine de fusion peut être réalisée, par exemple, par des techniques de co-immunoprécipitation. La caractérisation des sites de fixation de la protéine de fusion dans le génome peut être réalisée, par exemple, par des techniques d’immunoprécipitation, d’immunoprécipitation de la chromatine couplée à une PCR quantitative en temps réel (ChIP-qPCR), d’immunoprécipitation de la chromatine couplée à des techniques de séquençage (ChIP-Seq), de cartographie à l’aide d’oligonucléotides (oligo mapping) ou toute autre technique bien connue de l’homme du métier.
Cette étiquette peut être présente à l’extrémité N-terminale de la protéine de fusion, à l’extrémité C-terminale de la protéine de fusion ou en position non-terminale dans la protéine de fusion. De préférence, l’étiquette est présente à l’extrémité C-terminale de la protéine de fusion. La protéine de fusion peut comprendre une ou plusieurs étiquettes, identiques ou différentes et dans toutes les combinaisons de localisation, en particulier au niveau de l’extrémité N-terminale, C-terminale, N- et C-terminales ou en positions internes à la protéine de fusion.
Les étiquettes, telles qu’utilisées dans la présente invention, peuvent être choisies parmi les nombreuses étiquettes bien connues de l’homme du métier. En particulier, les étiquettes utilisées dans la présente invention peuvent être des étiquettes peptidiques et/ou des étiquettes protéiques. De préférence, les étiquettes utilisées dans la présente invention sont des étiquettes peptidiques. Des exemples d’étiquettes peptidiques utilisables dans la présente invention incluent, sans y être limités, les étiquettes formées de répétitions d’au moins six Histidines (His), en particulier les étiquettes formées de six ou huit histidines, ainsi que les étiquettes Flag, polyglutamates, hémagglutinine (HA), calmoduline, Strep, E-tag, myc, V5, Xpress, VSV, S-tag, Avi, SBP, Softag 1, Softag 2, Softag 3, isopetag, SpyTag, tétracystéines et des combinaisons de celles-ci. Des exemples d’étiquettes protéiques utilisables dans la présente invention incluent, sans y être limités, les étiquettes Glutathion-S-Transférase (GST), protéine A deStaphlococcus aureus, Nus A, protéine de liaison à la chitine (CBP), thiorédoxine, protéine de liaison au maltose (MBP), protéines transporteuses de biotine carboxylées (BCCP), fragment constant des immunoglobulines (Fc), les étiquettes comprenant une protéine fluorescente telles que les protéines GFP (Green Fluorescent Protein), RFP (Red Fluorescent Protein), CFP (Cyan Fluorescent Protein) ou YFP (Yellow Fluorescent Protein), et des combinaisons de celles-ci.
Selon un mode de réalisation préféré, la protéine de fusion comprend une étiquette formée de six histidines et/ou d’un ou plusieurs motifs Flag, de préférence trois motifs Flag. Selon un mode de réalisation, la protéine de fusion comprend une étiquette formée de trois motifs Flag suivi de 6histine en C-terminal de la protéine de fusion. Additionnellement ou alternativement, la protéine de fusion comprend un motif V5, de préférence du coté N-terminal de la protéine de fusion. Le tag V5 est dérivé d'un petit épitope (Pk) trouvé sur les protéines P et V du paramyxovirus de la famille des virus simiens 5 (SV5). Le tag V5 est généralement utilisé avec 14 acides aminés (GKPIPNPLLGLDST, SEQ ID NO 38) ou 9 acides aminés plus court (IPNPLLGLD, SEQ ID NO : 39). Selon un mode de réalisation particulier, la protéine de fusion comprend une étiquette formée de six histidines et trois motifs Flag, de préférence en C-terminal, et un motif V5 en N-terminal.
La protéine de fusion telle que décrite ci-dessus peut être introduite dans la cellule sous une forme protéique, notamment sous sa forme mature ou sous la forme d’un précurseur, de préférence sous sa forme mature, ou sous la forme d’un acide nucléique codant ladite protéine.
Lorsque la protéine de fusion est introduite dans la cellule sous une forme protéique, des groupements protecteurs peuvent être ajoutés aux extrémités C- et/ou N-terminales afin d’améliorer la résistance de la protéine de fusion aux peptidases. Par exemple, le groupement protecteur à l’extrémité N-terminale peut être une acylation ou une acétylation et le groupement protecteur à l’extrémité C-terminale peut être une amidation ou une estérification. L’action des protéases peut également être contrecarrée par l’utilisation d’acides aminés de configuration D, la cyclisation de la protéine par formation de ponts disulfures, d’anneaux lactames ou de liaisons entre les extrémités N- et C-terminales. La protéine de fusion de l’invention peut également comprendre des liaisons pseudo-peptidiques remplaçant les liaisons peptidiques « classiques » CONH et conférant une résistance accrue aux peptidases, telles que CHOH-CH2, NHCO, CH2-O, CH2CH2, CO-CH2, N-N, CH=CH, CH2NH, et CH2-S. La protéine de fusion peut également comprendre un ou plusieurs acides aminés qui sont des acides aminés rares notamment l'hydroxyproline, l'hydroxylysine, l'allohydroxylysine, la 6-N-méthylysine, la N-éthylglycine, la N-méthylglycine, la N-éthylasparagine, l'allo-isoleucine, la N-méthylisoleucine, la N-méthylvaline, la pyroglutamine, l'acide aminobutyrique ; ou des acides aminés synthétiques notamment l'ornithine, la norleucine, la norvaline et la cyclohexyl-alanine.
La protéine de fusion selon l’invention peut être obtenue par synthèse chimique classique (en phase solide ou en phase homogène liquide) ou par synthèse enzymatique (Kullmann W, Enzymatic peptide synthesis, 1987, CRC Press, Florida). Elle peut également être obtenue par une méthode consistant à cultiver une cellule hôte exprimant un acide nucléique codant la protéine de fusion et récupérer ladite protéine à partir de ces cellules ou du milieu de culture.
La présente invention concerne également un acide nucléique codant la protéine de fusion selon l’invention, en particulier une protéine de fusion comprenant une nucléase de classe II du système CRISPR, de préférence de type V et préférentiellement Cpf1, et un domaine Spo11 ou partenaire de Spo11 tels que décrits ci-dessus.
Au sens de l'invention, on entend par « acide nucléique » toute molécule à base d'ADN ou d'ARN. Il peut s'agir de molécules synthétiques ou semi-synthétiques, recombinantes, éventuellement amplifiées ou clonées dans des vecteurs, modifiées chimiquement, comprenant des bases non-naturelles ou des nucléotides modifiés comprenant par exemple une liaison modifiée, une base purique ou pyrimidique modifiée, ou un sucre modifié. De préférence, l’utilisation des codons est optimisée selon la nature de la cellule eucaryote.
L’acide nucléique selon l’invention peut être sous la forme d’ADN et/ou d'ARN, simple brin ou double brin. Selon un mode de réalisation préférée, l’acide nucléique est une molécule d’ADN isolée, synthétisée par des techniques recombinantes bien connues de l'homme du métier. L’acide nucléique selon l’invention peut être déduit de la séquence de la protéine de fusion selon l’invention et l’usage des codons peut être adapté selon la cellule hôte dans laquelle l’acide nucléique doit être transcrit.
La présente invention concerne en outre une cassette d’expression comprenant un acide nucléique selon l’invention lié de manière opérationnelle aux séquences nécessaires à son expression. Notamment, l’acide nucléique peut être sous le contrôle d’un promoteur permettant son expression dans une cellule hôte eucaryote. De manière générale, une cassette d’expression comprend, ou consiste en, un promoteur permettant d’initier la transcription, un acide nucléique selon l’invention, et un terminateur de transcription.
Le terme « cassette d'expression » désigne une construction d'acide nucléique comprenant une région codante et une région régulatrice, liées de manière opérationnelle. L'expression "lié de manière opérationnelle" indique que les éléments sont combinés de manière à ce que l'expression de la séquence codante soit sous le contrôle du promoteur transcriptionnel. Typiquement, la séquence du promoteur est placée en amont du gène d'intérêt, à une distance de celui-ci compatible avec le contrôle de son expression. Des séquences d'espacement peuvent être présentes, entre les éléments régulateurs et le gène, dès lors qu'elles n'empêchent pas l'expression. La cassette d’expression peut également comprendre au moins une séquence activatrice « enhancer » liée de manière opérationnelle au promoteur.
Une large variété de promoteurs utilisables pour l’expression de gènes d’intérêt dans des cellules ou des organismes hôtes sont à la disposition de l’homme du métier. Ils incluent des promoteurs constitutifs ainsi que des promoteurs inductibles qui sont activés ou réprimés par des stimuli physiques ou chimiques exogènes.
De préférence, l’acide nucléique selon l’invention est placé sous le contrôle d’un promoteur constitutif ou d’un promoteur spécifique de la méiose.
Des exemples de promoteurs spécifiques de la méiose utilisables dans le cadre de la présente invention comprennent, sans y être limités, les promoteurs endogènes de Spo11, les promoteurs des partenaires de Spo11 pour la formation des cassures double-brin, le promoteur Rec8 (Murakami & Nicolas, 2009, Mol. Cell. Biol, 29, 3500-16,), ou le promoteur Spo13 (Malkova et al, 1996, Genetics, 143, 741-754,), des promoteurs méïotiquesd’Arabidopsis thalianapar exemple tels que décrits dans Li et al., BMC Plant Biol. 2012; 12: 104, Eid et al., Plant Cell Rep. 2016 Jul;35(7):1555-8, Xu et al., Front. Plant Sci., 13 July 2018e, Da Ines et al.,PLoS Genet, 2013, 9, e1003787.).
D’autres promoteurs inductibles peuvent également être utilisés tels que le promoteur estradiol (Carlie & Amon, 2008 Cell, 133, 280-91,), le promoteur méthionine (Care et al, 1999, Molecular Microb 34, 792-798,), le système TetO/TetR inductible par la doxycline, les promoteurs induits par les chocs thermiques, les métaux, les stéroïdes, les antibiotiques et l’alcool.
Des promoteurs constitutifs utilisables dans le cadre de la présente invention sont, à titre d’exemples non limitatifs : le promoteur des gènes immédiats précoces du cytomégalovirus (CMV), le promoteur du virus simien (SV40), le promoteur tardif majeur des adénovirus, le promoteur du virus du sarcome de Rous (RSV), le promoteur du virus de la tumeur mammaire de souris (MMTV), le promoteur de la phosphoglycerate kinase (PGK), le promoteur du facteur d’élongation ED1-alpha, les promoteurs de l’ubiquitine, les promoteurs de l’actine, les promoteurs de la tubuline, les promoteurs des immunoglobulines, le promoteur de l’alcool déshydrogénase 1 (ADH1), les promoteurs dépendants de l’ARN polymérase III tels que les promoteurs U6, U3, H1, 7SL, pRPR1 (« Ribonuclease P RNA 1 »), SNR52 (« small nuclear RNA 52 »), ou le promoteur pZmUbi.
De préférence, la cassette d’expression et/ou l’acide nucléique selon l’invention est lié de manière opérationnelle à un promoteur transcriptionnel permettant une expression de cassette d’expression et/ou l’acide nucléique durant la méiose. Par exemple, un tel promoteur peut être pREC8.
Le terminateur de transcription peut être aisément choisi par l’homme du métier. De préférence, ce terminateur est RPR1t, la séquence flanquante du 3’ du gène SUP4 deSaccharomyces cerevisiaeou le terminateur de la nopaline synthase tNOS.
La présente invention concerne en outre un vecteur d’expression comprenant un acide nucléique ou une cassette d’expression selon l’invention. Ce vecteur d’expression peut être utilisé pour transformer une cellule hôte et permettre l’expression de l’acide nucléique selon l’invention dans ladite cellule. Les vecteurs peuvent être construits par des techniques classiques de biologie moléculaire, bien connues de l'homme du métier.
Avantageusement, le vecteur d’expression comprend des éléments régulateurs permettant l’expression de l’acide nucléique selon l’invention. Ces éléments peuvent comporter par exemple des promoteurs de transcription, des activateurs de transcription, des séquences terminatrices, des codons d’initiation et de terminaison. Les méthodes pour sélectionner ces éléments en fonction de la cellule hôte dans laquelle l’expression est souhaitée, sont bien connues de l’homme du métier.
Dans un mode de réalisation particulier, le vecteur d’expression comprend un acide nucléique codant la protéine de fusion selon l’invention, placé sous le contrôle d’un promoteur constitutif, de préférence le promoteur ADH1 (pADH1). Il peut également comprendre une séquence terminatrice telle que le terminateur ADH1 (tADH1).
Le vecteur d’expression peut comprendre une ou plusieurs origines de réplication, bactérienne ou eucaryote. Le vecteur d’expression peut notamment comprendre une origine de réplication bactérienne fonctionnelle chezE.colitelle que l’origine de réplication ColE1. Alternativement, le vecteur peut comprendre une origine de réplication eucaryote, de préférence fonctionnelle chez les plantes et chez les levures, notamment chezS. cerevisiae.
Le vecteur peut comporter en outre des éléments permettant sa sélection dans une cellule hôte bactérienne ou eucaryote comme, par exemple, un gène de résistance à un antibiotique ou un gène de sélection assurant la complémentation du gène respectif inactivé dans le génome de la cellule hôte. De tels éléments sont bien connus de l'homme du métier et largement décrits dans la littérature.
Dans un mode de réalisation particulier, le vecteur d’expression comprend un ou plusieurs gènes de résistance à des antibiotiques, de préférence un gène de résistance à l’ampicilline, à la kanamycine, à l’hygromycine, à la généticine et/ou la nourséothricine.
Le vecteur d’expression peut également comprendre une ou plusieurs séquences permettant l’insertion ciblée du vecteur, de la cassette d’expression ou de l’acide nucléique dans le génome d’une cellule hôte. De préférence, l’insertion est réalisée au niveau d’un gène dont l’inactivation permet la sélection des cellules hôtes ayant intégré le vecteur, la cassette ou l’acide nucléique, tel que le locusTRP1.
Le vecteur peut être circulaire ou linéaire, simple- ou double-brin. Il est avantageusement choisi parmi les plasmides, phages, phagemides, virus, cosmides et chromosomes artificiels. De manière préférée, le vecteur est un plasmide.
La présente invention concerne en particulier un vecteur, de préférence un plasmide, comprenant une origine de réplication bactérienne, de préférence l’origine ColE1, un acide nucléique tel que défini ci-dessus sous le contrôle d’un promoteur, de préférence un promoteur constitutif tel que le promoteur ADH1, un terminateur, de préférence le terminateur ADH1, un ou plusieurs marqueurs de sélection, de préférence des marqueurs de résistance tels que le gène de résistance à la kanamycine ou à l’ampicilline, et une ou plusieurs séquences permettant l’insertion ciblée du vecteur, de la cassette d’expression ou de l’acide nucléique dans le génome de la cellule hôte, de préférence au niveau du locusTRP1du génome d’une levure.
Selon un mode de réalisation, l’invention concerne en particulier un vecteur, de préférence un plasmide, compatible pour de l’agrotransfection, notamment en utilisantAgrobacterium tumefaciens(Fraley et al. Crit. Rev. Plant. Sci. 4 pp1-46; Fromm et al., (1990) Biotechnology 8, pp 833-844) ouAgrobacterium rhizogenes(Cho et al. (2000) Planta 210 pp 195-204) et visant à la transformation de plantes. Un exemple de plasmide compatible est le plasmide de type Ti, notamment le pBIN19 (Lee and Gelvin,(2008) Plant Physiology 146(2) pp 325-332). En particulier, lorsque destiné à une utilisationin planta, le vecteur selon l’invention comprend un marqueur sélectionnable. Les marqueurs sélectionnables les plus couramment utilisés pour la transformation des plantes incluent le gène conférant une résistance à la kanamycine néomycine phosphotransférase II (NPTII), servant à la sélection dans une culture contenant de la kanamycine, le gène du phosphinothricine acetyltransférase (HPH), servant à la sélection dans une culture contenant de l’hygromycine B.
Dans un mode de réalisation particulier, l’acide nucléique selon l’invention porté par le vecteur code pour une protéine de fusion comprenant une ou plusieurs étiquettes, de préférence comprenant une étiquette constituée de six histidines et/ou un ou plusieurs motifs Flag, de préférence trois motifs Flag. De préférence la ou les étiquettes sont en C-terminal.
La présente invention concerne également l’utilisation d’un acide nucléique, d’une cassette d’expression ou d’un vecteur d’expression selon l’invention pour transformer ou transfecter une cellule. La cellule hôte peut être transformée/transfectée de manière transitoire ou stable et l’acide nucléique, la cassette ou le vecteur peut être contenu dans la cellule sous forme d’épisome ou intégré dans le génome de la cellule hôte.
La présente invention concerne ainsi une cellule hôte comprenant une protéine de fusion, un acide nucléique, une cassette ou un vecteur d’expression selon l’invention.
De préférence, la cellule est une cellule eucaryote.
Tel qu’utilisé ici, le terme « cellule eucaryote », se réfère à une cellule de levure, de plante, de champignon ou une cellule animale, en particulier une cellule de mammifère telle qu’une cellule de souris ou de rat, ou une cellule d’insecte. La cellule eucaryote est non-humaine.
Selon des modes de réalisation préférés, la cellule eucaryote exprime une protéine Spo11 douée d’une activité nucléase, c’est-à-dire une protéine Spo11 capable d’induire des cassures double-brin lors de la prophase I de méiose. Cette protéine peut être une protéine Spo11 endogène de la cellule ou une protéine Spo11 hétérologue. De préférence, cette protéine est une protéine Spo11 endogène de la cellule.
Selon un mode de réalisation particulier, la cellule eucaryote est une cellule de levure, en particulier une levure d’intérêt industriel. Des exemples de levures d’intérêt comprennent, sans y être limités, les levures du genreSaccharomyces sensu stricto, Schizosaccharomyces , Yarrowia , Hansenula , Kluyveromyces , PichiaouCandida, ainsi que les hybrides obtenus à partir d’une souche appartenant à l’un de ces genres.
De préférence, la levure d’intérêt appartient au genreSaccharomyces. de préférence une levure sélectionnée dans le groupe constitué deSaccharomyces cerevisiae, Saccharomycesbayanus,Saccharomyces castelli , Saccharomyces eubayanus , Saccharomyces kluyveri , Saccharomyces kudriavzevii , Saccharomyces mikatae , Saccharomyces uvarum , Saccharomycesparadoxus,Saccharomycespastorianus (aussi nomméeSaccharomycescarlsbergensis), et des hybrides obtenus à partir d’au moins une souche appartenant à l’une de ces espèces tel que par exemple un hybrideS. cerevisiae / S. paradoxusou un hybrideS . cerevisiae / S. uvarum., de manière encore préférée ladite cellule hôte eucaryote estSaccharomyces cerevisiae.
Selon un autre mode de réalisation particulier, la cellule eucaryote est une cellule de champignon, en particulier une cellule de champignon d’intérêt industriel. Des exemples de champignons comprennent, sans y être limités, les cellules de champignons filamenteux. Les champignons filamenteux incluent les champignons appartenant aux subdivisionsEumycotaetOomycota. Les cellules de champignons filamenteux peuvent être choisies dans le groupe constitué des cellules deTrichoderma , Acremonium,Aspergillus,Aureobasidium,Bjerkandera,Ceriporiopsis,Chrysosporium,Coprinus,Coriolus,Cryptococcus,Filibasidium,Fusarium,Humicola,Magnaporthe,Mucor,Myceliophthora,Neocallimastix,Neurospora,Paecilomyces,Penicillium,Phanerochaete,Phlebia,Piromyces,Pleurotus,Schizophyllum,Sordaria , Talaromyces,Thermoascus,Thielavia,TolypocladiumouTrametes.
Selon encore un autre mode de réalisation particulier, la cellule eucaryote est une cellule de plante, en particulier une cellule de plante d’intérêt agronomique, horticole, pharmaceutique ou cosmétique, notamment les légumes, les fruits, les herbes, les fleurs, arbres et arbustes.
De préférence la cellule de plante est sélectionnée dans le groupe constitué par du riz, du blé, du soja, du maïs, de la tomate, de l’oignon, du concombre, de la laitue, de l’asperge, de la carotte, du navet, d’Arabidopsis thaliana, de l’orge, du colza, du coton, de la vigne, de la canne à sucre, de la betterave, du coton, du tournesol, de l’olivier à palmes, du café, du thé, du cacao, de la chicorée, du poivron, du piment, du citron, de l’orange, de la nectarine, de la mangue, de la pomme, de la banane, de la pêche, de l’abricot, de la patate douce, des yams, de l’amande, de la noisette, de la fraise, du melon, de la pastèque, de l’olivier, et des plantes horticoles comme par exemple les rosiers, les tulipes, les orchidées et les géraniums.
Chacune des différentes cellules décrites ci-dessus peuvent notamment être utilisées dans les procédés selon l’invention décrits ci-après.
Ainsi, la présente invention concerne également l’utilisation de la protéine de fusion, de l’acide nucléique, de la cassette d’expression ou du vecteur d’expression selon l’invention pour (i) induire des recombinaisons méiotiques ciblées dans une cellule eucaryote, (ii) générer des variants d’un organisme eucaryote, et/ou (iii) identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote.
L’invention concerne également des procédés pour (i) induire des recombinaisons méiotiques ciblées dans une cellule eucaryote, (ii) générer des variants d’un organisme eucaryote, et/ou (iii) identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote tels que décrits ci-après.
Les procédés selon l’invention peuvent être des procédésin vitro, in vivoouex vivo.
L’invention concerne notamment un procédé pour induire des recombinaisons méiotiques ciblées dans une cellule eucaryote non humaine, comprenant
- l’introduction dans ladite cellule :
a) d’une protéine de fusion, d’un acide nucléique, d’une cassette d’expression ou d’un vecteur tels que décris ci-dessus ; et
b) d’un ou plusieurs ARN guides ou d’un ou plusieurs acides nucléiques codant lesdits ARN guides, lesdits ARN guides comprenant une structure ARN de fixation à la nucléase associée à un système CRISPR de la protéine de fusion et une séquence complémentaire de la région chromosomique ciblée ; et
- l’induction de l’entrée en prophase I de méiose de ladite cellule.
En particulier, la cellule eucaryote est telle que décrite ci-dessus.
Tel qu’utilisé dans la présente demande, le terme « ARN guide » ou « ARNg » désigne une molécule d’ARN capable d’interagir avec le domaine CRISPR, de préférence avec le domaine Cpf1, de la protéine de fusion afin de la guider vers une région chromosomique cible.
Chaque ARNg comprend une région (communément appelée région « SDS »), à l’extrémité 3’ de l’ARNg, qui est complémentaire de la région chromosomique cible et qui imite l’ARNcr du système CRISPR endogène. Contrairement à d’autre système tel que CRISPR-Cas9, l’ARNg de Cpf1 ne nécessite pas une seconde région (communément appelé région « handle »), à l’extrémité 3’ de l’ARNg, qui mime les interactions d’appariement de bases entre l’ARNtracr et l’ARNcr du système CRISPR endogène.
La séquence de l’ARNg varie selon la séquence chromosomique ciblée. En particulier, la région « SDS » de l’ARNg qui est complémentaire de la région chromosomique cible, comprend en général entre 10 et 25 nucléotides. De préférence, cette région a une longueur de 19, 20 ou 21 nucléotides, et de manière particulièrement préférée de 25 nucléotides.
La longueur totale d’un ARNg est en général de 30 à 140 nucléotides, de préférence de 30 à 125 nucléotides, et de manière plus particulièrement préférée de 40 à 100 nucléotides. Selon un mode de réalisation particulier, un ARNg tel qu’utilisé dans la présente invention a une longueur de 30 à 75 nucléotides, de préférence de 35 à 65 nucléotides, de manière préférée de 44 à 63 nucléotides.
L’homme du métier peut aisément définir la séquence et la structure des ARNg selon la région chromosomique à cibler en utilisant des techniques bien connues.
Dans le procédé selon l’invention, un ou plusieurs ARNg peuvent être utilisés simultanément. Ces ARNg peuvent être différents ou identiques. Ces ARNg peuvent cibler des régions chromosomiques identiques ou différentes, de préférence différentes.
Les ARNg peuvent être introduits dans la cellule eucaryote sous la forme de molécules d’ARNg matures, sous la forme de précurseurs ou sous la forme d’un ou plusieurs acides nucléiques codant lesdits ARNg.
Lorsque le ou les ARNg sont introduits dans la cellule directement sous la forme de molécules d’ARN (matures ou précurseurs), ces ARNg peuvent contenir des nucléotides modifiés ou des modifications chimiques leur permettant, par exemple, d’augmenter leur résistance aux nucléases et ainsi d’augmenter leur durée de vie dans la cellule. Ils peuvent notamment comprendre au moins un nucléotide modifié ou non naturel tel que, par exemple, un nucléotide comportant une base modifiée, telle que l'inosine, la méthyl-5-désoxycytidine, la diméthylarnino-5-désoxyuridine, la désoxyuridine, la diamino-2,6-purine, la bromo-5-désoxyuridine ou toute autre base modifiée permettant l'hybridation. Les ARNg utilisés selon l’invention peuvent également être modifiés au niveau de la liaison internucléotidique comme par exemple les phosphorothioates, les H-phosphonates ou les alkyl-phosphonates, ou au niveau du squelette comme par exemple les alpha-oligonucléotides, les 2'-O-alkyl ribose ou les PNA (Peptid Nucleic Acid) (Egholm et al, 1992 J. Am. Chem. Soc., 114, pp 1895- 1897).
Les ARNg peuvent être des ARN naturels, synthétiques ou produits par des techniques de recombinaison. Ces ARNg peuvent être préparés par toutes méthodes connues de l’homme du métier telles que, par exemple, la synthèse chimique, la transcriptionin vivoou des techniques d’amplification.
Selon un mode de réalisation, le procédé comprend l’introduction dans la cellule eucaryote de la protéine de fusion et d’un ou plusieurs ARNg capables de cibler l’action de la protéine de fusion vers une région chromosomique donnée. La protéine et les ARNg peuvent être introduits dans le cytoplasme ou le noyau de la cellule eucaryote par toute méthode connue de l’homme du métier, par exemple par microinjection. La protéine de fusion peut notamment être introduite dans la cellule en tant qu’élément d’un complexe protéine-ARN comprenant au moins un ARNg.
Selon un autre mode de réalisation, le procédé comprend l’introduction dans la cellule eucaryote de la protéine de fusion et d’un ou plusieurs acides nucléiques codant un ou plusieurs ARNg.
Selon encore un autre mode de réalisation, le procédé comprend l’introduction dans la cellule eucaryote d’un acide nucléique codant la protéine de fusion et d’un ou plusieurs ARNg.
Selon encore un autre mode de réalisation, le procédé comprend l’introduction dans la cellule eucaryote d’un acide nucléique codant la protéine de fusion et d’un ou plusieurs acides nucléiques codant un ou plusieurs ARNg.
Selon un mode de réalisation, la cellule eucaryote est hétérozygote pour le ou les gène(s) ciblé(s) par le ou les ARN guide(s).
Selon un autre mode de réalisation, la cellule eucaryote est homozygote pour le ou les gène(s) ciblé(s) par le ou les ARN guide(s).
La protéine de fusion, ou l’acide nucléique codant celle-ci, et le ou les ARNg, ou le ou les acides nucléiques codant ceux-ci, peuvent être introduits simultanément ou séquentiellement dans la cellule.
Les techniques de transformation d'une plante sont bien connues et décrites dans la littérature technique et scientifique. Ces techniques visent la transformation de cellules de végétales de plantes entières, de cals ou de protoplastes. Ces techniques incluent l'injection ou la micro-injection (Griesbach (1987) Plant Sci. 50 69-77), l'électroporation de l'ADN (Fromm et autres (1985), Natl Acad Sci., USA 82 : 5824; Wan et Lemaux, Plant Physiol. 104 (1994), 37-48), la biolistique (Klein et al. (1987) Nature 327 : 773), la transfection de vecteur viral (Gelvin, Nature Biotechnology 23, 684-685 (2005)), le bombardement (Sood et al., 2011, Biologia Plantarum, 55, 1-15), la fusion de cellules ou de protoplastes (Willmitzer, L., 1993, Transgenic plants. Biotechnology, vol. 2, 627-659), l’agrotransfection par insertion d'ADN-T, notamment en utilisantAgrobacterium tumefaciens(Fraley et al. Crit. Rev. Plant. Sci. 4 1-46; Fromm et al., Biotechnology 8 (1990), 833-844) ouAgrobacterium rhizogenes(Cho et al. (2000) Planta 210: 195-204) ou d'autres hôtes bactériens (Brootghaerts et al. (2005) Nature 433: 629 -633) en utilisant par exemple la technique de trempage floral dite defloral dip(Clough et Bent 1998; Zale et al. 2009).
Alternativement, et plus particulièrement concernant les cellules de plante, l’acide nucléique codant pour la protéine de fusion et le ou les acides nucléiques codant pour le ou les ARNg peuvent être introduits dans une cellule par croisement de deux cellules dans lesquelles ont respectivement été introduits l’acide nucléique codant pour la protéine de fusion et le ou les acides nucléiques codant pour le ou les ARNg.
Alternativement, et plus particulièrement concernant les cellules de plante, l’acide nucléique codant pour la protéine de fusion et le ou les acides nucléiques codant pour le ou les ARNg peuvent être introduits dans une cellule par mitose d’une cellule dans laquelle l’acide nucléique codant pour la protéine de fusion et le ou les acides nucléiques codant pour le ou les ARNg ont précédemment été introduits.
Dans les modes de réalisation où la protéine de fusion et/ou le ou les ARNg sont introduits dans la cellule eucaryote sous la forme d’un acide nucléique codant pour ladite protéine et/ou le/lesdits ARNg, l’expression dedits acides nucléiques permet de produire la protéine de fusion et/ou le ou les ARNg dans la cellule.
Les acides nucléiques codant pour la protéine de fusion et ceux codant pour les ARNg peuvent être placés sous le contrôle de promoteurs identiques ou différents, constitutifs ou inductibles, en particulier de promoteurs spécifiques de la méiose. Selon un mode de réalisation préféré, les acides nucléiques sont placés sous le contrôle de promoteurs constitutifs tels que le promoteur ADH1 ou les promoteurs pRPR1 et SNR52 dépendant de l’ARN polymérase III, de manière encore préféré le promoteur pRPR1.
La nature du promoteur peut également dépendre de la nature de la cellule eucaryote. Selon un mode de réalisation particulier, la cellule eucaryote est une cellule de plante, de préférence une cellule de riz, et les acides nucléiques sont placés sous le contrôle d’un promoteur choisi parmi les promoteurs pZmUbi (promoteur de l’ubiquitine de maïs) et les promoteurs de la polymérase III U3 et U6. Selon un mode de réalisation préféré, l’acide nucléique codant pour la protéine de fusion est placé sous le contrôle du promoteur pZmUbi et les acides nucléiques codant pour les ARNg sont placés sous le contrôle du promoteur U3 ou U6, de préférence du promoteur U3.
Selon un aspect particulier, l’expression de l’ARNg est placée sous le contrôle de l’opérateur tetracycline. Le système Tet comprend deux circuits complémentaires : le circuit dépendant du tTA (système Tet-Off) et le circuit dépendant du rtTA (système Tet-On). De préférence, l’expression de l’ARNg est contrôlée par un système Tet-On. L'expression de l’ANRg est ainsi régulée par la présence ou l'absence de tétracycline ou de l'un de ses dérivés tels que la doxycycline.
Les acides nucléiques codant la protéine de fusion et le ou les ARNg peuvent être disposés sur la même construction, en particulier sur le même vecteur d’expression, ou sur des constructions distinctes. De manière alternative, les acides nucléiques peuvent être insérés dans le génome de la cellule eucaryote en des régions identiques ou distinctes. Selon un mode de réalisation préféré, les acides nucléiques codant la protéine de fusion et le ou les ARNg sont disposés sur le même vecteur d’expression.
Les acides nucléiques tels que décrits ci-dessus peuvent être introduits dans la cellule eucaryote par toute méthode connue par l’homme du métier, en particulier par microinjection, transfection, agro-infection, électroporation ou biolistique.
Optionnellement, l’expression ou l’activité de la protéine Spo11 endogène de la cellule eucaryote peut être supprimée afin de mieux contrôler les phénomènes de recombinaison méiotiques. Cette inactivation peut être réalisée par des techniques bien connues de l’homme du métier, notamment en inactivant le gène codant la protéine Spo11 endogène ou en inhibant son expression au moyen d’ARN interférents.
Après l’introduction dans la cellule eucaryote de la protéine de fusion et d’un ou de plusieurs ARNg, ou des acides nucléiques codant ceux-ci, le procédé selon l’invention comprend l’induction de l’entrée en prophase I de méiose de ladite cellule.
Cette induction peut se faire selon différentes méthodes, bien connues de l’homme du métier.
A titre d’exemple, lorsque la cellule eucaryote est une cellule de souris, l’entrée des cellules en prophase I de méiose peut être induite par l’ajout d’acide rétinoïque (Bowles J et al, 2006, Sciences, 312(5773), pp. 596-600).
Lorsque la cellule eucaryote est une cellule de plante, l’induction de la méiose se fait selon un processus naturel. Selon un mode de réalisation particulier, après transformation d’un cal comprenant une ou des cellules de plante, une plante est régénérée et placée en conditions favorisant l’induction d’une phase reproductive et ainsi du processus de méiose. Ces conditions sont bien connues de l’homme du métier.
Lorsque la cellule eucaryote est une levure, cette induction peut être réalisée par le transfert de la levure dans un milieu de sporulation, en particulier d’un milieu riche à un milieu de sporulation, ledit milieu de sporulation étant de préférence dépourvu de source de carbone fermentescible ou d’azote, et l’incubation des levures dans le milieu de sporulation durant un temps suffisant pour induire des cassures double-brin. L’initiation du cycle méiotique dépend de plusieurs signaux : la présence des deux allèles de type sexuel MATa et MATα, l’absence de source d’azote et de carbone fermentescible.
Tel qu’utilisé dans ce document, le terme « milieu riche » se réfère à un milieu de culture comprenant une source de carbone fermentescible et une source d’azote ainsi que tous les éléments nutritifs nécessaires aux levures pour se multiplier par division mitotique. Ce milieu peut être aisément choisi par l’homme du métier et peut, par exemple, être sélectionné parmi le groupe constitué du milieu YPD (1% extrait de levures, 2% bactopeptone et 2% glucose), du milieu YPG (1% extrait de levures, 2% bactopeptone et 3% glycérol) et d’un milieu synthétique complet (ou milieu SC) (Treco and Lundblad, 2001, Curr. Protocol. Mol. Biol., Chapter 13, Unit 13.1).
Tel qu’utilisé dans ce document, le terme « milieu de sporulation » se réfère à tout milieu induisant l’entrée en prophase de méiose des cellules de levure sans croissance végétative, en particulier à un milieu de culture ne comprenant pas de source de carbone fermentescible ni de source d’azote mais comprenant une source de carbone métabolisable par respiration telle que l’acétate. Ce milieu peut être aisément choisi par l’homme du métier et peut, par exemple, être sélectionné parmi le groupe constitué du milieu KAc 1% (Wu and Lichten, 1994, Science, 263, pp. 515-518), le milieu SPM (Kassir and Simchen, 1991, Meth. Enzymol., 194, pp. 94–110) et des milieux de sporulation décrits dans l’article de Sherman (Sherman, Meth. Enzymol., 1991, 194, pp. 3–21).
Selon un mode de réalisation préféré, avant d’être incubées dans le milieu de sporulation, les cellules sont cultivées durant quelques cycles de division dans un milieu de pré-sporulation de façon à obtenir une sporulation efficace et synchrone. Le milieu de pré-sporulation peut être aisément choisi par l’homme du métier. Ce milieu peut être, par exemple, le milieu SPS (Wu and Lichten, 1994, Science, 263, pp. 515-518).
Le choix des milieux (milieu riche, milieu de pré-sporulation, milieu de sporulation) dépend des caractéristiques physiologiques et génétiques de la souche de levure, notamment si cette souche est auxotrophe pour un ou plusieurs composés.
Une fois la cellule engagée en prophase I de méiose, le processus méiotique peut se poursuivre jusqu’à produire quatre cellules filles portant les recombinaisons recherchées.
De manière alternative, lorsque la cellule eucaryote est une levure, et en particulier une levure du genreSaccharomyces, les cellules peuvent être replacées en conditions de croissance afin de reprendre un processus mitotique. Ce phénomène appelé « return-to-growth » ou « RTG » a été décrit précédemment dans la demande de brevet WO 2014/083142 et se produit lorsque les cellules entrées en méiose en réponse à une carence nutritionnelle sont remises en présence d’une source de carbone et d’azote après la formation des cassures double-brin Spo11 dépendantes mais avant la première division de méiose (Honigberg and Esposito, Proc. Nat. Acad. Sci USA, 1994, 91, pp. 6559-6563). Dans ces conditions, elles interrompent leur progression dans les stades de différenciation méiotique pour reprendre un mode de croissance mitotique tout en induisant les recombinaisons recherchées lors de la réparation des cassures double-brin (Sherman et Roman, Genetics, 1963, 48, pp. 255-261 ; Esposito et Esposito, Proc. Nat. Acad. Sci, 1974, 71, pp. 3172-3176 ; Zenvirth et al, Genes to Cells, 1997, 2, pp. 487-498).
Le procédé peut comprendre en outre l’obtention de la ou des cellules présentant la ou les recombinaisons recherchées. Lorsque la cellule est une levure, le procédé peut en outre comprendre une étape de culture et/ou de multiplication de la ou des cellules présentant la ou les recombinaisons recherchées. Lorsque la cellule est une cellule de plante, le procédé peut en outre comprendre une étape d’embryogénèse somatique, c’est-à-dire la régénération d’un embryon végétal à partir d’un cal comprenant les cellules présentant la ou les recombinaisons recherchées.
Le procédé selon l’invention peut être utilisé dans toutes les applications où il est souhaitable d’améliorer et de contrôler les phénomènes de recombinaison méiotique. En particulier, l’invention permet d’associer, de manière préférentielle, des traits génétiques d’intérêt. Cette association préférentielle permet, d’une part, de réduire le temps nécessaire à leur sélection, d’autre part, de générer des combinaisons naturelles possibles mais improbables. Enfin, selon le mode de réalisation choisi, les organismes obtenus par ce procédé peuvent être considérés comme des organismes non génétiquement modifiés (non-OGM).
Selon un autre aspect, la présente invention concerne un procédé pour générer des variants d’un organisme eucaryote, à l’exception de l’homme, de préférence une levure ou une plante, de manière encore préférée une levure, notamment une souche de levure d’intérêt industriel, comprenant
- l’introduction dans une cellule dudit organisme :
a) d’une protéine de fusion, d’un acide nucléique, d’une cassette d’expression ou d’un vecteur tels que décris ci-dessus ; et
b) d’un ou plusieurs ARN guides ou d’un ou plusieurs acides nucléiques codant lesdits ARN guides, lesdits ARN guides comprenant une structure ARN de fixation à la nucléase associée à un système CRISPR de la protéine de fusion et une séquence complémentaire de la région chromosomique ciblée ; et
- l’induction de l’entrée en prophase I de méiose de ladite cellule ;
- l’obtention de cellule(s) présentant la ou les recombinaisons recherchées au niveau de la ou des régions chromosomiques ciblées ; et
- la genèse d’un variant de l’organisme à partir de ladite cellule recombinée.
Dans ce procédé, le terme de « variant » doit être compris de façon large, il désigne un organisme ayant au moins une différence génotypique ou phénotypique par rapport aux organismes parents.
Les cellules recombinées peuvent être obtenues en laissant la méiose se poursuivre jusqu’à l’obtention des spores, ou, dans le cas des levures, en replaçant les cellules en conditions de croissance après l’induction des cassures double-brin afin de reprendre un processus mitotique.
Lorsque la cellule eucaryote est une cellule de plante, un variant de la plante peut être généré par fusion des gamètes de plante, au moins l’une des gamètes étant une cellule recombinée par la méthode selon l’invention.
La présente invention concerne également un procédé pour identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote, de préférence une levure ou une plante, comprenant :
- l’introduction dans la cellule eucaryote :
a) d’une protéine de fusion, d’un acide nucléique, d’une cassette d’expression ou d’un vecteur tels que décris ci-dessus ; et
b) d’un ou plusieurs ARN guides ou d’un ou plusieurs acides nucléiques codant lesdits ARN guides, lesdits ARN guides comprenant une structure ARN de fixation à la nucléase associée à un système CRISPR de la protéine de fusion et une séquence complémentaire de la région chromosomique ciblée ; et
- l’induction de l’entrée en prophase I de méiose de ladite cellule ;
- l’obtention de cellule(s) présentant la ou les recombinaisons recherchées au niveau de la ou des régions chromosomiques ciblées ; et
- l’analyse des génotypes et phénotypes des cellules recombinées afin d’identifier ou de localiser l’information génétique codant pour la caractéristique d’intérêt.
De préférence, la caractéristique d’intérêt est un caractère quantitatif d’intérêt (QTL). Un locus de caractères quantitatifs (LCQ ou QTL pourquantitative trait loci) est une région plus ou moins grande d'ADN qui est étroitement associée à un caractère quantitatif, c'est-à-dire une région chromosomique où sont localisés un ou plusieurs gènes à l'origine du caractère en question. Ces caractères quantitatifs se rapporte généralement à une caractéristique phénotypique. L’analyse des QTL permet d’évaluer le lien entre une variation génétique et une variation phénotypique.
La présente invention concerne finalement une trousse comprenant une protéine de fusion, un acide nucléique, une cassette d’expression ou un vecteur d’expression selon l’invention, ou une cellule hôte transformée ou transfectée avec un acide nucléique, une cassette d’expression ou un vecteur d’expression selon l’invention. Elle concerne également l’utilisation de ladite trousse pour mettre en œuvre un procédé selon l’invention, en particulier pour (i) induire des recombinaisons méiotiques ciblées dans une cellule eucaryote, (ii) générer des variants d’un organisme eucaryote, et/ou (iii) identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote.
Dans les séquences peptidiques décrites dans ce document, les acides aminés sont représentés par leur code à une lettre selon la nomenclature suivante : C : cystéine; D : acide aspartique; E : acide glutamique; F : phénylalanine; G : glycine; H : histidine; I : isoleucine; K : lysine; L : leucine ; M : méthionine ; N : asparagine ; P : proline ; Q : glutamine ; R : arginine ; S : sérine ; T : thréonine ; V : valine ; W : tryptophane et Y : tyrosine.
Les exemples qui suivent sont présentés dans un but illustratif et non limitatif et permettent d’illustrer l’invention.
Exemples
Matériel et Méthode
Construction de la cassette
P
REC8
-
NLS
-
FnCPF1
-
SPO11
Y135F
-6xHis-3xFlag-T
ADH1
La version humanisée du gèneCPF1issue deFrancisella novicidaportée par le plasmide pY004 (pcDNA3.1-hFnCpf1) a été obtenu de la plateforme Addgene (http://n2t.net/addgene:69976; RRID:Addgene_69976) Zetsche, B., et al., 2015, Cell, 163, 759-771. Le plasmide pAS604 contenant le fragmentP ADH1 -NLS-FnCPF1-T ADH1 a été construit par clonage de la séquence deFnCPF1 (amplifiée par PCR à partir de pY004) dans le plasmide pAS565 linéarisé avec les enzymesApaI-NdeI. Pour fusionner le fragment C-terminus deFnCpf1 avec l’extrémité N-terminale de la protéine Spo11 Y135F ,le fragmentSpeI-XmaI du plasmide pAS532 a été remplacé par le fragmentSpeI-XmaI du plasmide pAS604 contenant la séquenceNLS(Nuclear Localization Signal ; GGMAAPKKKRKVDGG SEQ ID NO : 34) et la partie codant de la protéineFnCPF1. Ainsi, leplasmide résultant, pAS608, contient la cassetteP ADH1 -NLS-FnCPF1-SPO11 Y135F -6xHis-3xFlag-T ADH1 . Ensuite, le promoteurP ADH1 a été remplacé par le promoteur méiose spécifiqueP REC8 cloné par réaction de Gibson dans le vecteur pAS604 digéré parSpeI-XhoI. Ainsi le plasmide final, pAS628, contient la cassetteP REC8 -NLS-FnCPF1-SPO11 Y135F -6xHis-3xFlag-T ADH1 dans laquelle le NLS et l’extrémité N-terminus deFnCpf1 sont séparés par un linker (GIHGVPAA, SEQ ID NO : 35). De plus, les domainesFnCpf1 etSpo11 Y135F sont séparés par un autre linker (PEFMAMEAPGIR SEQ ID NO : 36). Enfin, l’étiquette 6xHis-3xFlag (HHHHHHGDYKDDDDKDYKDDDDKDYKDDDDK* SEQ ID NO : 37) est placée à l’extrémité C-terminale de la partie codanteSPO11 Y135F .
Construction du plasmide d’expression des
crARNs
pour Cpf1
La cassette d’expression des crARNs deFnCpf1 a été conçue à partir du plasmide pUD628 ( Swiat, et al., 2017Nucleic acids research, 45, 12585-12598) ; l’expression des crARNs y est contrôlée par le promoteurSNR52(P SNR52 ) et par le terminateurSUP4(T SUP4 ). Le fragmentP SNR52 -DR-DR-T SUP4 dans lequel les DRs sont les « Direct Repeats » de 19 nucléotides entourant la séquence guide, a été synthétisé par GenScript. Ensuite le fragmentSacI-XhoI du plasmideP RPR1 -gARN_handle-T RPR1 (Farzadfard, et al. (2013) ACS synthetic biology, 2, pp. 604-613) a été remplacé par la séquenceP SNR52 -DR-DR-T SUP4 pour créer le plasmide pAS603. Afin d’obtenir un système d’expression des crARNs inductible à la doxycycline, la séquence tetO (assemblée avec un couple d’oligonucléotides) a été insérée dans le promoteurP SNR52 pour obtenir le plasmide pAS622. En se basant sur l’analyse de l’architecture deP SNR52 (Guffanti, et al (2006). J Biol Chem, 281, pp. 23945-23957) la séquence de 17 nucléotides située en position -160,-176 du site de démarrage de la transcription et l’élément A-Box du promoteur, a été remplacée par la séquence tetO de 19 nucléotides comme décrit précédemment pour le promoteurRPR1(Bak, et al (2010) BMB Rep, 43, pp. 110-114). La construction d’un système d’expression des crARNs inductible à la doxycycline a été achevée par clonage « Gibson » du gèneTetRamplifié par PCR à partir du plasmide pRS416gt (Smith et al. (2016) Genome Biol, 17, pp. 45) dans le vecteur pAS622 linéarisé parXhoI. Le plasmide final pAS631 contient donc le système d’expression des crARNsP SNR52 -tetO-DR-DR-T SUP4 -TetRinductible à la doxycycline. La séquence guide de 25 nucléotides (5’ GTCCGTGCGGAGATATCTGCGCCGT 3’ SEQ ID NO : 38) ciblant le site Gal4 UAS-B,C dans le promoteur du gèneGAL2a été insérée entre les séquences DR par réaction de Gibson dans le plasmide pAS631 linéarisé parBglII.
Construction des souches de levure Saccharomyces cerevisiae .
Génotype des souches de Saccharomyces cerevisiae utilisées :
AND3482 :MATa /α trp1/trp1:: hisG pGAL2_AB 2 CD 2 E/pGAL2_ab 2 cD 2 E tGAL2:: HphMX /- pEMP46:: NatMX /- his4/'' leu2/'' ura3/''
AND3538 :MATa /α trp1::pAS628(CPF1-SPO11 Y135F -6xHis-Flag-TRP1-KanMX)/trp1:: hisG pGAL2_AB 2 CD 2 E/pGAL2_ab 2 cD 2 E tGAL2:: HphMX /-pEMP46 pEMP4:NatMX/- his4/'' leu2/'' ura3/''
ANT2951 :MATa /α trp1::pAS628(CPF1-SPO11 Y135F -6xHis-Flag-TRP1-KanMX)/trp1:: hisG pGAL2_AB 2 CD 2 E/pGAL2_ab 2 cD 2 E tGAL2 :: HphMX /- pEMP46:: NatMX /- his4/'' leu2/'' ura3/''+ plasmide pAS632-crARN UAS-B,C ::LEU2.
AND3535 :MATa /α trp1::pAS628(CPF1-SPO11 Y135F -6xHis-Flag-TRP1-KanMX)/trp1:: hisG pGAL2_AB 2 CD 2 E/pGAL2_ab 2 cd 2 e tGAL2:: HphMX /- pEMP46:: NatMX /- his4/'' leu2/'' ura3/''
ANT2945 :MATa /α trp1::pAS628(CPF1-SPO11 Y135F -6xHis-Flag-TRP1-KanMX)/trp1:: hisG pGAL2_AB 2 CD 2 E/pGAL2_ab 2 cd 2 e tGAL2:: HphMX /- pEMP46:: NatMX /- his4/'' leu2/'' ura3/''+ plasmide pAS632-crARN UAS-B,C ::LEU2.
AND2549 :MATa / α trp1/trp1:: hisG tGAL2:: HphMX /- pEMP46:: NatMX /- his4/'' leu2/'' ura3/''
L’introduction des cassettesP REC8 -Fn CPF1-SPO11 Y135F -6xHis-Flag- T ADH1- TRP1-KanMXdans le génome de la levureS. cerevisiaea été effectué comme décrit par Sarno, R et al (2017) Nucleic acids research, 45, e164. Les plasmides pAS533 et pAS628 portant respectivement les cassettesP REC8 -Fn CPF1-SPO11 Y135F -6xHis-Flag- T ADH1- TRP1-KanMXont été linéarisés par l’enzyme de restrictionXbaI et intégrées au locusTRP1par électroporation des cellules.
Les plasmides d’expression des sgARN et crARN portant le marqueur de sélectionLEU2ont été introduits dans les cellules AND3535, AND3538, AND3596 deSaccharomyces . cerevisiae, auxotrophes pour la leucine (leu2-) par électroporation et les transformants sélectionnés sur des boites contenant un milieu synthétique complet dépourvu de Leucine. Les jonctions d’intégration des cassettes d’expression deFnCPF1 -SPO11 Y135F au locusTRP1ont été vérifiées par PCR.
La fréquence de recombinaison autour du gèneGAL2(chromosome XII) est mesurée entre la cassetteNatMXintégrée à la position 287 725 dans le promoteur du gèneEMP46(pEMP46) et la cassetteHphMXintégrée à la position 292 068 dans le terminateur du gèneGAL2(tGAL2).
Induction de la méiose et de la sporulation
Dans un premier temps, les cellules diploïdes sont inoculées dans un milieu liquide riche (YPD) ou dans un milieu synthétique complet dépourvu de Leucine (SC-Leu) afin de maintenir les plasmides portant le marqueur de sélection LEU2. Les cellules se multiplient sous agitation à 30°C pendant 24 heures (point « Mitotique »). Ensuite les cultures liquides SC-Leu saturées sont diluées dans le milieu de pré-sporulation SPS (2-16 x105cellules/ml) et mises en cultures sous agitation à 30°C pendant ~15 heures. Les cultures ayant atteint une OD600entre 2 et 4 sont centrifugées, lavées deux fois avec de l’eau et transférées dans le milieu de sporulation (KAc 1%) avec une OD600finale de 1. C’est le point T0de la progression méiotique. Pour induire l’expression des crRNAs du doxycycline hyclate est ajouté à une concentration finale de 10 µg/ml dans le milieu de sporulation au temps T0.
Milieux de croissance et de sporulation
Les milieux de croissance YPD, de pré-sporulation SPS et de sporulation KAc 1 % sont décrits dans la référence Murakami et al., (2009) Methods Mol Biol, 557, pp 117-142. Le milieu YPD est constitué d’extrait de levure 1%), de peptone (2%) et de glucose (2%). Le milieu synthétique complet dépourvu de Leucine est composé de Yeast Nitrogen Base (0,17 %), de Sulfate d’Ammonium (0,5 %), de Drop-out Mix Synthetic sans Leucine (0,16 %) et de Glucose (2 %).
Southern
blot et quantifications des
CDBs
et des molécules recombinantes
L’extraction de l’ADN génomique ainsi que la détection des CDBs et des molécules recombinantes par Southern Blot ont été effectués comme décrit dans les références Murakami, et al., (2009) Methods Mol Biol, 557, pp 117-142.. et Sarno, et al. (2017) Nucleic acids research, 45, e164.
Analyse génétique des tétrades.
Les tétrades à 4 spores ont été disséquées sur des boites YPD après 48 heures d’incubation dans le milieu de sporulation. La ségrégation des marqueurs NatMX et HygMX est visualisée par réplique des colonies sur boites YPD contenant respectivement de la nourseothricine (100 mg/l) ou de l’hygromycine (300 mg/l).
RESULTATS
La fusion Cpf1-Spo11Y135F stimule la formation des CDBs méiotiques et leur réparation par recombinaison homologue dans la région du promoteur du gène GAL2 ( ). Analyse par Southern blot des cassures doubles brins (CDBs) et des molécules recombinantes dans les cellules exprimant la fusion Cpf1-Spo11Y135F. Les cellules sont récoltées durant la croissance mitotique et durant la progression méiotique (t=0, 2, 4, 6 et 8 heures). Le gène codant la protéine de fusion Cpf1-Spo11Y135F est induit dans des cellules diploïdes SPO11/SPO11 qui contiennent la séquence cible sauvage pGAL2B,C (5’ ACGGCGCAGATATCTCCGCACGGAC 3’, SEQ ID NO :43) sur le chromosome parental P1 et une séquence cible pGAL2b,c mutée résistante aux coupures de Cpf1 sur le chromosome parental P2 (5’ AttcCGCAGATATCTCCGCAtatAC 3’, SEQ ID NO :44). Pour induire l’expression des crRNAs du doxycycline hyclate est ajoutée à la culture méiotique (1% KAc) au temps 0 pour une concentration finale de 10 µg/ml. L’ADN génomique est extrait des cellules de levure, digéré par l’enzyme de restriction XbaI, déposé sur un gel d’agarose (0.6%) et séparé par électrophorèse, puis transféré sur une membrane de nitrocellulose et hybridée avec une sonde radioactive située en dans la région codante du gène GAL2. La position des fragments d’ADN correspondant aux chromosomes parentaux (P1 et P2) ainsi qu’aux molécules recombinantes (R1 et R2) est indiquée sur la gauche du gel. La flèche noire épaisse indique les CDBs induites par Cpf1-Spo11Y135F dans le promoteur du gène cible GAL2 au niveau des sites Gal4UAS-B,C sur le chromosomes P1. La carte de la région GAL2 montre les phases ouvertes de lecture (les flèches indiquant le sens de la transcription), les marqueurs génétiques hétérozygotes NatMX et HphMX situés en trans du site cible GAL2B,C ainsi que la position de la sonde (rectangle hachuré). La fréquence de CDBs ainsi que la somme des fréquences des molécules recombinantes R1 et R2 sont indiquées sous le gel. Le seuil minimal de détection des molécules d’ADN est de 0,3%.
Génotype des souches :
- AND3482 :MATa / α trp1/trp1:: hisG pGAL2_AB 2 CD 2 E/pGAL2_ab 2 cd 2 e tGAL2:: HphMX /- pEMP46:: NatMX /- his4/'' leu2/'' ura3/''
-ANT2951 :MATa / α trp1::pAS628(CPF1-SPO11 Y135F -6xHis-Flag-TRP1-KanMX)/trp1:: hisG pGAL2_AB 2 CD 2 E/pGAL2_ab 2 cD 2 E tGAL2:: HphMX /- pEMP46:: NatMX /- his4/'' leu2/'' ura3/''+ plasmide pAS632-crRNA UAS-B,C ::LEU2.
La fusion Cpf1-Spo11Y135F stimule la recombinaison méiotique dans la région cible du promoteur du gène GAL2 ( ). Les cellules diploïdes SPO11 possèdent les marqueurs hétérozygotes NatMX et HphMX de chaque côté des régions ciblées. Leur ségrégation a été suivie dans les produits de méiose par dissection des tétrades à 4 spores. Le gène NatMX confère la résistance à la nourseothricin (NatR) et le gène HphMX la résistance à l’hygromycine (HygR). En absence de recombinaison entre les marqueurs NatMX et HygMX, les quatre produits de méiose sont de type parental : 2 NatR HygS, 2 NatS HygR (ditypes parentaux PD). Par contre, un évènement de crossing-over entre les marqueurs va conduire à une tétrade de type tétratype (TT) (1 NatR HygS: 1 NatS HygS , NatR HygR, 1 NatS HygR) tandis que deux évènements de crossing-over impliquant les 4 chromatides dans la même cellule méiotique vont conduire à une tétrade de type ditype non-parental (NPD) (2 NatS HygS , 2 NatR HygR). D’autres types de ségrégation (appelées Autres) ont été observés. Ils correspondent à des évènements complexes où les marqueurs ségrégent de manière non-mendélienne avec des combinaisons de ségrégation de type 4:0 et/ou 0:4 révélant l’existence de recombinaisons ayant eu lieu avant la méiose et de ségrégations 3:1 et 1:3 révélant la conversions génique des cassettes NatMX et/ou HygMX. Respectivement, 235 et 295 tétrades à 4 spores ont été disséquées à partir des cellules WT et CPF1-SPO11Y135F. La fréquence de recombinaison entre les marqueurs correspond au ratio (TT+NPD)*100/(PD+TT+NPD).
Génotype de la souche AND3482 :MATa /α trp1/trp1:: hisG pGAL2_AB 2 CD 2 E/pGAL2_ab 2 cd 2 e tGAL2:: HphMX /- pEMP46:: NatMX /- his4/'' leu2/'' ura3/''
Génotype de la souche ANT2945 :MATa /α trp1::pAS628(CPF1-SPO11 Y135F -6xHis-Flag-TRP1-KanMX)/trp1:: hisG pGAL2_AB 2 CD 2 E/pGAL2_ab 2 cd 2 e tGAL2:: HphMX /- pEMP46:: NatMX /- his4/'' leu2/'' ura3/''et contient le plasmide pAS632-crRNA UAS-B,C ::LEU2.
Les cassettesNatMXetHphMXont été respectivement intégrées dans le terminateur deGAL2(tGAL2) entre les positions 292 068 et 292069, et dans le promoteur deEMP46(pEMP46) entre les positions 287 725 et 287 726.
Claims (14)
- Protéine de fusion comprenant (i) une nucléase associée à un système CRISPR, de préférence un système CRISPR de classe II, et (ii) une protéine Spo11 ou l’un des partenaires de Spo11 choisi dans le groupe constitué des protéines Rec102, MTOPOVIB/TOPOVIBL, Rec103/Ski8, Rec104, Rec114, Mer1, Mer2/Rec107, Mei4, Mre2/Nam8, Mre11, Rad50, Xrs2/Nbs1, Hop1, Red1, Mek1, Set1 et Spp1, et des orthologues de celles-ci, dans laquelle la nucléase associée au système CRISPR n’est pas une nucléase Cas9.
- Protéine de fusion selon la revendication 1, dans laquelle la nucléase est une nucléase associée à un système CRISPR de classe II et de type V.
- Protéine de fusion selon la revendication 1 ou 2, dans laquelle la protéine de fusion comprend une protéine Spo11 ayant une mutation dans le site catalytique qui induit une activité nucléase diminuée par rapport à l’activité nucléase de la protéine sauvage.
- Protéine de fusion selon l’une quelconque des revendications 1 à 3, dans laquelle la protéine de fusion comprend une nucléase associée à un système CRISPR ayant une mutation dans le site catalytique qui induit une activité nucléase diminuée par rapport à l’activité nucléase de la protéine sauvage.
- Protéine de fusion selon l’une quelconque des revendications 1 à 4, dans laquelle la nucléase est une nucléase Cpf1.
- Protéine de fusion selon la revendication 1-5, dans laquelle la protéine de fusion comprend un partenaire de Spo11 choisi dans le groupe constitué des protéines Rec102, MTOPOVIB/TOPOVIBL, Rec103/Ski8, Rec104, Rec114, Mer1, Mer2/Rec107, Mei4, Mre2/Nam8, Mre11, Rad50, Xrs2/Nbs1, Hop1, Red1, Mek1, Set1 et Spp1, et des orthologues de celles-ci.
- Acide nucléique codant pour la protéine de fusion selon l’une quelconque des revendications 1 à 6.
- Cassette d’expression ou vecteur comprenant un acide nucléique selon la revendication 7 lié de manière opérationnelle à un promoteur transcriptionnel permettant une expression dudit acide nucléique durant la méiose.
- Cellule hôte non humaine comprenant une protéine de fusion selon l’une quelconque des revendications 1 à 6, un acide nucléique selon la revendication 7, une cassette d’expression ou un vecteur selon la revendication 8, ladite cellule hôte étant une cellule de levure, de plante, de champignon ou une cellule animale, de manière préférée une cellule de plante sélectionnée dans le groupe constitué du riz, du blé, du soja, du maïs, de la tomate, de l’oignon, du concombre, de la laitue, de l’asperge, de la carotte, du navet, d’Arabidopsis thaliana, de l’orge, du colza, du coton, de la vigne, de la canne à sucre, de la betterave, du coton, du tournesol, due l’olivier à palmes, du café, du thé, du cacao, de la chicorée, du poivron, du piment, du citron, de l’orange, de la nectarine, de la mangue, de la pomme, de la banane, de la pêche, de l’abricot, de la patate douce, des yams, de l’amande, de la noisette, de la fraise, du melon, de la pastèque, de l’olivier, et des plantes horticoles comme par exemple les rosiers, les tulipes, les orchidées et les géraniums.
- Procédé pour induire des recombinaisons méiotiques ciblées dans une cellule eucaryote non humaine, comprenant
- l’introduction dans ladite cellule :
a) d’une protéine de fusion selon l’une quelconque des revendications 1 à 6, d’un acide nucléique selon la revendication 7, d’une cassette d’expression ou d’un vecteur selon la revendication 8; et
b) d’un ou plusieurs ARN guides ou d’un ou plusieurs acides nucléiques codant lesdits ARN guides, lesdits ARN guides comprenant une structure ARN de fixation à la nucléase associée à un système CRISPR de la protéine de fusion et une séquence complémentaire de la région chromosomique ciblée ; et
- l’induction de l’entrée en prophase I de méiose de ladite cellule. - Procédé pour générer des variants d’un organisme eucaryote non humain comprenant :
- l’introduction dans une cellule dudit organisme :
a) d’une protéine de fusion selon l’une quelconque des revendications 1 à 6, d’un acide nucléique selon la revendication 7, d’une cassette d’expression ou d’un vecteur selon la revendication 8; et
b) d’un ou plusieurs ARN guides ou d’un ou plusieurs acides nucléiques codant lesdits ARN guides, lesdits ARN guides comprenant une structure ARN de fixation à la nucléase associée à un système CRISPR de la protéine de fusion et une séquence complémentaire de la région chromosomique ciblée ; et
- l’induction de l’entrée en prophase I de méiose de ladite cellule ;
- l’obtention de cellule(s) présentant la ou les recombinaisons recherchées au niveau de la ou des régions chromosomiques ciblées ; et
- la genèse d’un variant de l’organisme à partir de ladite cellule recombinée. - Procédéin vitropour identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote non humaine, comprenant :
- l’introduction dans la cellule eucaryote :
a) d’une protéine de fusion selon l’une quelconque des revendications 1 à 6, d’un acide nucléique selon la revendication 7, d’une cassette d’expression ou d’un vecteur selon la revendication 8; et
b) d’un ou plusieurs ARN guides ou d’un ou plusieurs acides nucléiques codant lesdits ARN guides, lesdits ARN guides comprenant une structure ARN de fixation à la nucléase associée à un système CRISPR de la protéine de fusion et une séquence complémentaire de la région chromosomique ciblée ; et
- l’induction de l’entrée en prophase I de méiose de ladite cellule ;
- l’obtention de cellule(s) présentant la ou les recombinaisons recherchées au niveau de la ou des régions chromosomiques ciblées ; et
- l’analyse des génotypes et phénotypes des cellules recombinées afin d’identifier ou de localiser l’information génétique codant pour la caractéristique d’intérêt. - Procédéin vitropour identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote non humaine selon la revendication 12, dans lequel la caractéristique d’intérêt est un caractère quantitatif d’intérêt (QTL).
- Utilisation d’une protéine de fusion selon l’une quelconque des revendications 1 à 6, d’un acide nucléique selon la revendication 7, d’une cassette d’expression ou d’un vecteur selon la revendication 8 pour (i) induire des recombinaisons méiotiques ciblées dans une cellule eucaryote non humaine, (ii) générer des variants d’un organisme eucaryote non -humain, et/ou (iii) identifier ou localiser l’information génétique codant pour une caractéristique d’intérêt dans un génome de cellule eucaryote non humaine.
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR2005370A FR3110575A1 (fr) | 2020-05-20 | 2020-05-20 | utilisation d’une protéine de fusion pour induire des modifications génétiques par recombinaison méiotique ciblée |
PCT/FR2021/050917 WO2021234315A1 (fr) | 2020-05-20 | 2021-05-20 | Utilisation d'une proteine de fusion pour induire des modifications genetiques par recombinaison meiotique ciblee |
EP21733496.0A EP4153733A1 (fr) | 2020-05-20 | 2021-05-20 | Utilisation d'une proteine de fusion pour induire des modifications genetiques par recombinaison meiotique ciblee |
US17/926,160 US20240263157A1 (en) | 2020-05-20 | 2021-05-20 | Use of a fusion protein for inducing genetic modifications by targeted meiotic recombination |
AU2021274109A AU2021274109A1 (en) | 2020-05-20 | 2021-05-20 | Use of a fusion protein for inducing genetic modifications by targeted meiotic recombination |
BR112022023471A BR112022023471A2 (pt) | 2020-05-20 | 2021-05-20 | Uso de uma proteína de fusão para induzir modificações genéticas por recombinação meiótica direcionada |
CA3177793A CA3177793A1 (fr) | 2020-05-20 | 2021-05-20 | Utilisation d'une proteine de fusion pour induire des modifications genetiques par recombinaison meiotique ciblee |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR2005370A FR3110575A1 (fr) | 2020-05-20 | 2020-05-20 | utilisation d’une protéine de fusion pour induire des modifications génétiques par recombinaison méiotique ciblée |
FR2005370 | 2020-05-20 |
Publications (1)
Publication Number | Publication Date |
---|---|
FR3110575A1 true FR3110575A1 (fr) | 2021-11-26 |
Family
ID=74045449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR2005370A Pending FR3110575A1 (fr) | 2020-05-20 | 2020-05-20 | utilisation d’une protéine de fusion pour induire des modifications génétiques par recombinaison méiotique ciblée |
Country Status (7)
Country | Link |
---|---|
US (1) | US20240263157A1 (fr) |
EP (1) | EP4153733A1 (fr) |
AU (1) | AU2021274109A1 (fr) |
BR (1) | BR112022023471A2 (fr) |
CA (1) | CA3177793A1 (fr) |
FR (1) | FR3110575A1 (fr) |
WO (1) | WO2021234315A1 (fr) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022171736A1 (fr) | 2021-02-10 | 2022-08-18 | Limagrain Europe | Recombinaisons ciblées multiplex pour des applications d'introgression de caractères |
AR129708A1 (es) | 2022-06-24 | 2024-09-18 | Meiogenix | Inducción de la recombinación meiótica mediante un sistema crispr |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014083142A1 (fr) | 2012-11-30 | 2014-06-05 | Institut Curie | Procédé d'amélioration de souches de levure |
WO2016120480A1 (fr) * | 2015-01-29 | 2016-08-04 | Meiogenix | Procede pour induire des recombinaisons meiotiques ciblees |
-
2020
- 2020-05-20 FR FR2005370A patent/FR3110575A1/fr active Pending
-
2021
- 2021-05-20 AU AU2021274109A patent/AU2021274109A1/en active Pending
- 2021-05-20 WO PCT/FR2021/050917 patent/WO2021234315A1/fr unknown
- 2021-05-20 BR BR112022023471A patent/BR112022023471A2/pt unknown
- 2021-05-20 EP EP21733496.0A patent/EP4153733A1/fr active Pending
- 2021-05-20 CA CA3177793A patent/CA3177793A1/fr active Pending
- 2021-05-20 US US17/926,160 patent/US20240263157A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014083142A1 (fr) | 2012-11-30 | 2014-06-05 | Institut Curie | Procédé d'amélioration de souches de levure |
WO2016120480A1 (fr) * | 2015-01-29 | 2016-08-04 | Meiogenix | Procede pour induire des recombinaisons meiotiques ciblees |
US20180023091A1 (en) * | 2015-01-29 | 2018-01-25 | Meiogenix | Method for inducing targeted meiotic recombinations |
Non-Patent Citations (63)
Title |
---|
"Genbank", Database accession no. WP_003040289.1 |
"GenBank", Database accession no. WP_021746003.1 |
"NCBI", Database accession no. NP_011841 |
"Uniprot", Database accession no. A0A024AG98 |
"UniProt", Database accession no. A0A024AGF2 |
"UniProtKB", Database accession no. U2UMQ6 |
ACQUAVIVA ET AL., SCIENCE, vol. 339, 2013, pages 215 - 218 |
BAK ET AL., BMB REP, vol. 43, 2010, pages 110 - 114 |
BAUDAT F ET AL., MOLECULAR CELL, vol. 6, 2000, pages 989 - 998 |
BERGERAT ET AL., NATURE, vol. 327, 1987, pages 773 - 417 |
BOWLES J ET AL., SCIENCES, vol. 312, no. 5773, 2006, pages 596 - 600 |
BROOTGHAERTS ET AL., NATURE, vol. 433, 2005, pages 629 - 633 |
CARE ET AL., MOLECULAR MICROB, vol. 34, 1999, pages 792 - 798 |
CARLIEAMON, CELL, vol. 133, 2008, pages 280 - 91 |
CHO ET AL., PLANTA, vol. 210, 2000, pages 195 - 204 |
DA INES ET AL., PLOS GENET, vol. 9, 2013, pages e1003787 |
EGHOLM ET AL., J. AM. CHEM. SOC., vol. 114, 1992, pages 1895 - 1897 |
EID ET AL., PLANT CELL REP, vol. 35, no. 7, July 2016 (2016-07-01), pages 1555 - 8 |
ESPOSITOESPOSITO, GENETICS, vol. 61, 1969, pages 79 - 89 |
ESPOSITOESPOSITO, PROC. NAT. ACAD. SCI, vol. 71, 1974, pages 3172 - 3176 |
FARZADFARD ET AL., ACS SYNTHETIC BIOLOGY, vol. 2, 2013, pages 604 - 613 |
FAYOS I ET AL., PLANT BIOTECHNOL J. NOV, vol. 17, no. ll, 2019, pages 2062 - 2077 |
FRALEY ET AL., CRIT. REV. PLANT. SCI., vol. 4, pages 46 - 46 |
FRANK R. BLATTNER, PLANT SYSTEMATICS AND EVOLUTION, vol. 302, 2016, pages 239 - 244 |
FROMM ET AL., BIOTECHNOLOGY, vol. 8, 1990, pages 833 - 844 |
FROMM, NATL ACAD SCI., USA, vol. 82, 1985, pages 5824 |
GAO ET AL., NAT BIOTECHNOL, vol. 35, no. 8, August 2017 (2017-08-01), pages 789 - 792 |
GELVIN, NATURE BIOTECHNOLOGY, vol. 23, 2005, pages 684 - 685 |
GRELON M. ET AL., EMBO J., vol. 20, 2001, pages 589 - 600 |
GRIESBACH, PLANT SCI, vol. 50, 1987, pages 69 - 77 |
GUFFANTI ET AL., J BIOL CHEM, vol. 281, 2006, pages 23945 - 23957 |
HONIGBERGESPOSITO, PROC. NAT. ACAD. SCI USA, vol. 91, 1994, pages 6559 - 6563 |
KASSIRSIMCHEN, METH. ENZYMOL., vol. 194, 1991, pages 94 - 110 |
KEENEY ET AL., CURR. TOP. DEV. BIOL, vol. 52, 2001, pages 1 - 53 |
LEEGELVIN, PLANT PHYSIOLOGY, vol. 146, no. 2, 2008, pages 325 - 332 |
LI ET AL., BMC PLANT BIOL, vol. 12, 2012, pages 104 |
MALKOVA ET AL., GENETICS, vol. 143, 1996, pages 741 - 754 |
MCKIM ET AL., GENES DEV, vol. 12, no. 18, 1998, pages 2932 - 2942 |
MURAKAMI ET AL., METHODS MOL BIOL, vol. 557, 2009, pages 117 - 142 |
MURAKAMINICOLAS, MOL. CELL. BIOL, vol. 29, 2009, pages 3500 - 16 |
PECINA ET AL., CELL, vol. 111, 2002, pages 173 - 184 |
ROBERTA SARNO ET AL: "Programming sites of meiotic crossovers using Spo11 fusion proteins", NUCLEIC ACIDS RESEARCH, 2 November 2017 (2017-11-02), England, pages e164 - e164, XP055769976, Retrieved from the Internet <URL:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5737382/pdf/gkx739.pdf> DOI: 10.1093/nar/gkx739 * |
SARNO ET AL., NUCLEIC ACIDS RESEARCH, vol. 45, pages e164 |
SARNO, R ET AL., NUCLEIC ACIDS RESEARCH, vol. 45, 2017, pages 12585 - 12598 |
SHERMANROMAN, GENETICS, vol. 48, 1963, pages 255 - 261 |
SHINGU Y ET AL., BMC MOL BIOL, 2012 |
SHMAKOV ET AL., MOLECULAR CELL, vol. 60, 2015, pages 385 - 397 |
SIMIN SHAO ET AL: "Enhancing CRISPR/Cas9-mediated homology-directed repair in mammalian cells by expressing Saccharomyces cerevisiae Rad52", INTERNATIONAL JOURNAL OF BIOCHEMISTRY AND CELL BIOLOGY, vol. 92, 18 September 2017 (2017-09-18), GB, pages 43 - 52, XP055627157, ISSN: 1357-2725, DOI: 10.1016/j.biocel.2017.09.012 * |
SMITH ET AL., CURR. OPIN. GENET. DEV, vol. 8, 1998, pages 200 - 211 |
SMITH ET AL., GENOME BIOL, vol. 17, 2016, pages 45 |
SOOD ET AL., BIOLOGIA PLANTARUM, vol. 55, 2011, pages 1 - 15 |
SPRINK THARTUNG F, FRONTIERS IN PLANT SCIENCE, vol. 5, 2014 |
TANG XI-DIAN ET AL: "Methods for Enhancing Clustered Regularly Interspaced Short Palindromic Repeats/Cas9-Mediated Homology-Directed Repair Efficiency", FRONTIERS IN GENETICS, vol. 10, 1 January 2019 (2019-01-01), Switzerland, XP055799593, ISSN: 1664-8021, DOI: 10.3389/fgene.2019.00551 * |
TRECOLUNDBLAD: "Curr. Protocol. Mol. Biol.", 2001 |
VRIELYNCK ET AL., SCIENCE, vol. 351, no. 6299, 2016, pages aaf5573 - 949 |
WANLEMAUX, PLANT PHYSIOL, vol. 104, 1994, pages 37 - 48 |
WILLMITZER, L., TRANSGENIC PLANTS. BIOTECHNOLOGY, vol. 2, 1993, pages 627 - 659 |
WULICHTEN, SCIENCE, vol. 263, 1994, pages 515 - 518 |
XU ET AL., FRONT. PLANT SCI., 13 July 2018 (2018-07-13) |
YELINA NATALIYA E ET AL: "CRISPR targeting of MEIOTIC-TOPOISOMERASE VIB-dCas9 to a recombination hotspot is insufficient to increase crossover frequency in Arabidopsis", 2 February 2021 (2021-02-02), XP055799396, Retrieved from the Internet <URL:https://www.biorxiv.org/content/10.1101/2021.02.01.429210v1.full.pdf> DOI: 10.1101/2021.02.01.429210 * |
ZENVIRTH ET AL., GENES TO CELLS, vol. 2, 1997, pages 487 - 498 |
ZETSCHE, B. ET AL., CELL, vol. 163, 2015, pages 759 - 771 |
ZHANG ET AL., CELL DISCOV, vol. 4, 2018, pages 36 |
Also Published As
Publication number | Publication date |
---|---|
BR112022023471A2 (pt) | 2023-01-24 |
AU2021274109A1 (en) | 2022-12-08 |
WO2021234315A1 (fr) | 2021-11-25 |
CA3177793A1 (fr) | 2021-11-25 |
US20240263157A1 (en) | 2024-08-08 |
EP4153733A1 (fr) | 2023-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3250688B1 (fr) | Procede pour induire des recombinaisons meiotiques ciblees | |
EA031322B1 (ru) | Клетка или клеточная линия для экспрессии экзогенных нуклеотидных последовательностей и применение клетки или клеточной линии | |
FR2821855A1 (fr) | Genes synthetiques et plasmides bacteriens depourvus de cpg | |
AU2018216169B2 (en) | Expression of nitrogenase polypeptides in plant cells | |
CN114269933B (zh) | 通过使用grf1加强基因实现的增强的植物再生及转化 | |
JPWO2018043219A1 (ja) | Casタンパク質発現カセット | |
WO2021234315A1 (fr) | Utilisation d'une proteine de fusion pour induire des modifications genetiques par recombinaison meiotique ciblee | |
WO2021234317A9 (fr) | Utilisation d'une proteine de fusion deficiente pour l'activite nuclease pour induire des recombinaisons meiotiques | |
AU2008332275C1 (en) | Genes that increase plant oil and method for using the same | |
CN102065680A (zh) | 能生物合成辣椒素酯类物质的基因修饰植物 | |
WO2023247773A1 (fr) | Induction de recombinaison méiotique à l'aide d'un système crispr | |
CA2947506C (fr) | Augmentation de la recombinaison meiotique chez les plantes par inhibition d'une proteine recq4 ou top3a du complexe rtr | |
US20240360465A1 (en) | Expression of nitrogenase polypeptides in plant cells | |
FR3032203A1 (fr) | Procede pour induire des recombinaisons meiotiques ciblees | |
BR122024004319A2 (pt) | Proteína de fusão compreendendo uma proteína cas9 e uma proteína spo11, e célula hospedeira compreendendo a proteína de fusão | |
US20210388335A1 (en) | Southern green stink bug pheromone synthesis enzymes and uses thereof | |
CA2187170A1 (fr) | Procede de selection de cellules eucaryotes transformees et cellules obtenues | |
EP1194558A2 (fr) | Nouveau gene sgs3 de plante et son utilisation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PLFP | Fee payment |
Year of fee payment: 2 |
|
PLSC | Publication of the preliminary search report |
Effective date: 20211126 |
|
PLFP | Fee payment |
Year of fee payment: 3 |
|
PLFP | Fee payment |
Year of fee payment: 4 |
|
PLFP | Fee payment |
Year of fee payment: 5 |