WO2024053677A1 - 重複遺伝子のゲノム編集方法 - Google Patents
重複遺伝子のゲノム編集方法 Download PDFInfo
- Publication number
- WO2024053677A1 WO2024053677A1 PCT/JP2023/032542 JP2023032542W WO2024053677A1 WO 2024053677 A1 WO2024053677 A1 WO 2024053677A1 JP 2023032542 W JP2023032542 W JP 2023032542W WO 2024053677 A1 WO2024053677 A1 WO 2024053677A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- sequence
- genome editing
- target sequence
- mismatch
- genome
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 158
- 238000010362 genome editing Methods 0.000 title claims abstract description 82
- 238000000034 method Methods 0.000 title claims abstract description 75
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 45
- 239000002773 nucleotide Substances 0.000 claims abstract description 31
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 31
- 230000014509 gene expression Effects 0.000 claims description 38
- 125000006850 spacer group Chemical group 0.000 claims description 29
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 22
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 claims description 13
- 230000008685 targeting Effects 0.000 claims description 12
- 108700039964 Duplicate Genes Proteins 0.000 claims description 9
- 239000013604 expression vector Substances 0.000 claims description 7
- 230000001052 transient effect Effects 0.000 claims description 4
- 108020005004 Guide RNA Proteins 0.000 abstract description 17
- 238000005516 engineering process Methods 0.000 abstract description 7
- 210000004027 cell Anatomy 0.000 description 38
- 239000013598 vector Substances 0.000 description 36
- 239000013612 plasmid Substances 0.000 description 35
- 241000196324 Embryophyta Species 0.000 description 27
- 108020004414 DNA Proteins 0.000 description 26
- 210000001938 protoplast Anatomy 0.000 description 17
- 108091033319 polynucleotide Proteins 0.000 description 16
- 102000040430 polynucleotide Human genes 0.000 description 16
- 239000002157 polynucleotide Substances 0.000 description 16
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 15
- 244000061176 Nicotiana tabacum Species 0.000 description 15
- 241000219194 Arabidopsis Species 0.000 description 14
- 108091033409 CRISPR Proteins 0.000 description 14
- 230000035772 mutation Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 11
- 239000000243 solution Substances 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- 239000000872 buffer Substances 0.000 description 9
- 238000003776 cleavage reaction Methods 0.000 description 9
- 108091028043 Nucleic acid sequence Proteins 0.000 description 8
- 230000007017 scission Effects 0.000 description 8
- 238000010354 CRISPR gene editing Methods 0.000 description 7
- 108091026890 Coding region Proteins 0.000 description 7
- 108700005081 Overlapping Genes Proteins 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 102000053602 DNA Human genes 0.000 description 6
- 239000006142 Luria-Bertani Agar Substances 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 230000009437 off-target effect Effects 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 238000012258 culturing Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 210000004940 nucleus Anatomy 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 241000589158 Agrobacterium Species 0.000 description 4
- 241000219195 Arabidopsis thaliana Species 0.000 description 4
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 4
- 101150056203 SGS3 gene Proteins 0.000 description 4
- 229960000723 ampicillin Drugs 0.000 description 4
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 239000000725 suspension Substances 0.000 description 4
- 108700004991 Cas12a Proteins 0.000 description 3
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 3
- 102000012410 DNA Ligases Human genes 0.000 description 3
- 108010061982 DNA Ligases Proteins 0.000 description 3
- 238000007702 DNA assembly Methods 0.000 description 3
- 229930195725 Mannitol Natural products 0.000 description 3
- 108010066154 Nuclear Export Signals Proteins 0.000 description 3
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 244000062793 Sorghum vulgare Species 0.000 description 3
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 239000000594 mannitol Substances 0.000 description 3
- 235000010355 mannitol Nutrition 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 235000019713 millet Nutrition 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 229960000268 spectinomycin Drugs 0.000 description 3
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 241000234282 Allium Species 0.000 description 2
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 2
- 101100301219 Arabidopsis thaliana RDR6 gene Proteins 0.000 description 2
- 238000010453 CRISPR/Cas method Methods 0.000 description 2
- 235000008534 Capsicum annuum var annuum Nutrition 0.000 description 2
- 244000205754 Colocasia esculenta Species 0.000 description 2
- 235000006481 Colocasia esculenta Nutrition 0.000 description 2
- 241000723655 Cowpea mosaic virus Species 0.000 description 2
- 240000008067 Cucumis sativus Species 0.000 description 2
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 2
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 2
- 244000281702 Dioscorea villosa Species 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 101001094048 Homo sapiens Pendrin Proteins 0.000 description 2
- 241000723784 Plum pox virus Species 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 101150069600 RDR6 gene Proteins 0.000 description 2
- 101100532680 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MCD1 gene Proteins 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 108700005078 Synthetic Genes Proteins 0.000 description 2
- 241000723873 Tobacco mosaic virus Species 0.000 description 2
- 241000723854 Zucchini yellow mosaic virus Species 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- OJOBTAOGJIWAGB-UHFFFAOYSA-N acetosyringone Chemical compound COC1=CC(C(C)=O)=CC(OC)=C1O OJOBTAOGJIWAGB-UHFFFAOYSA-N 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 238000002869 basic local alignment search tool Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000001851 biosynthetic effect Effects 0.000 description 2
- 235000021466 carotenoid Nutrition 0.000 description 2
- 150000001747 carotenoids Chemical class 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000011536 extraction buffer Substances 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 230000008595 infiltration Effects 0.000 description 2
- 238000001764 infiltration Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 108010001545 phytoene dehydrogenase Proteins 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 239000001054 red pigment Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000008223 sterile water Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- 230000002087 whitening effect Effects 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 101150090724 3 gene Proteins 0.000 description 1
- 241000724328 Alfalfa mosaic virus Species 0.000 description 1
- 240000002234 Allium sativum Species 0.000 description 1
- 241000234270 Amaryllidaceae Species 0.000 description 1
- 241000208173 Apiaceae Species 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 241000205585 Aquilegia canadensis Species 0.000 description 1
- 101100201106 Arabidopsis thaliana RPS5A gene Proteins 0.000 description 1
- 241000209524 Araceae Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 240000008100 Brassica rapa Species 0.000 description 1
- 235000010149 Brassica rapa subsp chinensis Nutrition 0.000 description 1
- 235000000536 Brassica rapa subsp pekinensis Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 241000499436 Brassica rapa subsp. pekinensis Species 0.000 description 1
- 241000219193 Brassicaceae Species 0.000 description 1
- 240000008384 Capsicum annuum var. annuum Species 0.000 description 1
- 235000002568 Capsicum frutescens Nutrition 0.000 description 1
- 229920000298 Cellophane Polymers 0.000 description 1
- 244000241235 Citrullus lanatus Species 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 241000207782 Convolvulaceae Species 0.000 description 1
- 235000005956 Cosmos caudatus Nutrition 0.000 description 1
- 235000009849 Cucumis sativus Nutrition 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 241000219130 Cucurbita pepo subsp. pepo Species 0.000 description 1
- 235000003954 Cucurbita pepo var melopepo Nutrition 0.000 description 1
- 241000219104 Cucurbitaceae Species 0.000 description 1
- 235000007129 Cuminum cyminum Nutrition 0.000 description 1
- 244000304337 Cuminum cyminum Species 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 235000002723 Dioscorea alata Nutrition 0.000 description 1
- 235000007056 Dioscorea composita Nutrition 0.000 description 1
- 235000009723 Dioscorea convolvulacea Nutrition 0.000 description 1
- 235000005362 Dioscorea floribunda Nutrition 0.000 description 1
- 240000008955 Dioscorea japonica Species 0.000 description 1
- 235000005251 Dioscorea japonica Nutrition 0.000 description 1
- 235000004868 Dioscorea macrostachya Nutrition 0.000 description 1
- 235000005361 Dioscorea nummularia Nutrition 0.000 description 1
- 235000005360 Dioscorea spiculiflora Nutrition 0.000 description 1
- 235000000504 Dioscorea villosa Nutrition 0.000 description 1
- 241000234272 Dioscoreaceae Species 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 241000221017 Euphorbiaceae Species 0.000 description 1
- 235000009419 Fagopyrum esculentum Nutrition 0.000 description 1
- 240000008620 Fagopyrum esculentum Species 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000702463 Geminiviridae Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 238000012404 In vitro experiment Methods 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 235000006350 Ipomoea batatas var. batatas Nutrition 0.000 description 1
- 241000207923 Lamiaceae Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 244000070406 Malus silvestris Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 235000010676 Ocimum basilicum Nutrition 0.000 description 1
- 240000007926 Ocimum gratissimum Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 101150108119 PDS gene Proteins 0.000 description 1
- 235000004347 Perilla Nutrition 0.000 description 1
- 244000124853 Perilla frutescens Species 0.000 description 1
- 244000062780 Petroselinum sativum Species 0.000 description 1
- 206010057249 Phagocytosis Diseases 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 229920001030 Polyethylene Glycol 4000 Polymers 0.000 description 1
- 241000219050 Polygonaceae Species 0.000 description 1
- 240000005809 Prunus persica Species 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 241000220324 Pyrus Species 0.000 description 1
- 101710133476 RNA-dependent RNA polymerase 6 Proteins 0.000 description 1
- 244000088415 Raphanus sativus Species 0.000 description 1
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 1
- 241000220222 Rosaceae Species 0.000 description 1
- 244000178231 Rosmarinus officinalis Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 101100201109 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rps5 gene Proteins 0.000 description 1
- 241001247145 Sebastes goodei Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 244000082988 Secale cereale Species 0.000 description 1
- 241000208292 Solanaceae Species 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 108091026822 U6 spliceosomal RNA Proteins 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- MTHSVFCYNBDYFN-UHFFFAOYSA-N diethylene glycol Chemical compound OCCOCCO MTHSVFCYNBDYFN-UHFFFAOYSA-N 0.000 description 1
- 235000004879 dioscorea Nutrition 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- DNJIEGIFACGWOD-UHFFFAOYSA-N ethyl mercaptane Natural products CCS DNJIEGIFACGWOD-UHFFFAOYSA-N 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 235000004611 garlic Nutrition 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 210000000473 mesophyll cell Anatomy 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 230000005937 nuclear translocation Effects 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 235000021017 pears Nutrition 0.000 description 1
- 235000011197 perejil Nutrition 0.000 description 1
- 230000008782 phagocytosis Effects 0.000 description 1
- 235000021018 plums Nutrition 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 235000021012 strawberries Nutrition 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 235000020138 yakult Nutrition 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
Definitions
- the present invention relates to genome editing of duplicated genes.
- Genome editing is a technology that introduces (edits) mutations into targeted locations in the genome of a target organism. Therefore, compared to existing mutagenesis methods such as radiation, the efficiency of obtaining the desired strain from a significantly smaller number of mutants is an advantage, and it is used for a variety of purposes.
- CRISPR/Cas9 and CRISPR/Cas12a which are typical genome editing technologies
- the sequences to be edited are mainly defined by sites called spacer sequences of the gRNAs or crRNAs that constitute them.
- spacer sequence for gRNA or crRNA 20 to 24 bases are usually used as a target sequence that can be changed arbitrarily.
- a base sequence of about 2 to 4 bases called a PAM sequence is required for the nucleases Cas9 and Cas12a to function. Therefore, genome editing is performed by specifically recognizing base sequences of about 22 to 28 bases in total, including the PAM sequence and spacer sequence. This recognition length is said to be long enough to specify a single region of the human genome.
- Another method for editing multiple genes at the same time is to utilize the off-target effects of CRISPR.
- This method utilizes the property of CRISPR/Cas9 gRNA or crRNA to cleave mismatched sequences.
- CRISPR/Cas9 gRNA or crRNA to cleave mismatched sequences.
- a gRNA sequence that targets 20 to 24 bases is designed to edit multiple different genes with 1 to 2 base mismatches
- multiple genes can be edited simultaneously with a single gRNA or crRNA. be.
- methods that utilize these off-target effects have the advantage that they require less effort to construct vectors because they can edit a large number of genes with fewer gRNAs or crRNAs. There is.
- SpyCas9 Streptococcus pyogenes Cas9
- Non-Patent Document 1 Nat Biotechnol. 2014 Mar; 32(3): 279-284. Therefore, currently, there is no choice but to choose between simultaneously editing the mismatched sequence by recognizing the PAM sequence + 20 bases, or simultaneously editing the homologous gene in which the PAM sequence + 17 bases completely match.
- Non-patent document 2 Science (2020) 369, 333-337
- Non-patent document 3 Nature Communications (2021) volume 12, Article number: 4476.
- Reas ⁇ based on crystal structure analysis, and the reaction rate increases in vCas ⁇ in which positions 155 to 176, which correspond to the helix that is predicted to interact with the non-target chain, are deleted.
- Non-Patent Document 4 Nature Structural & Molecular Biology (2021) vol.28, pp.652-661). Genome editing in plants using Cas ⁇ has also been reported (Non-Patent Document 5: Int. J. Mol. Sci. (2022), 23, 5755).
- the inventors analyzed the genome sequence information of Arabidopsis thaliana, which is a typical example of a plant where functional redundancy is a problem, and analyzed the extent to which the sequences of genes with functional redundancy contiguously match each other. . As a result, it was found that nearly half of the genes had consecutive matching base sequences of less than 24 bases in length. Therefore, we found that CRISPR/Cas9 and CRISPR/Cas12a have problems in that the recognition length is too long or the off-target effect is too small in order to destroy homologous gene groups with functional redundancy.
- the present invention was made to solve this problem, and aims to provide a technology for simultaneously editing a large number of genes with overlapping functions using a small number of gRNAs or crRNAs.
- the invention therefore relates to: [1] A method for genome editing a duplicated gene in a cell, wherein the duplicated gene has only a 16 nucleotide long target sequence to be genome edited, or a 16 or 17 nucleotide long target sequence and the target.
- the genome editing method according to item 1 wherein the Cas ⁇ protein includes an amino acid sequence having at least 80% sequence homology to an amino acid sequence selected from the group consisting of SEQ ID NOs: 1, 2, 3, and 4. .
- the duplicated gene is a duplicated sequence with functional redundancy.
- the duplicated gene includes a PAM sequence in the vicinity of the target sequence.
- the spacer sequence is determined to completely match the target sequence.
- the duplicated gene has a target sequence with a length of 16 or more nucleotides, and optionally a mismatch sequence containing a mismatch of 1 to 2 bases with respect to the target sequence. Genome editing methods described. [8] The genome according to any one of items 1 to 7, wherein the duplicated gene has a target sequence with a length of 17 or more nucleotides and a mismatch sequence containing a 1 to 2 base mismatch with the target sequence. How to edit. [9] The genome editing method according to any one of items 1 to 8, wherein the duplicated gene is present in 2 to 100 copies in the genome of the cell.
- a kit for genome editing of a duplicated gene in a cell wherein the duplicated gene has only a 16 nucleotide long target sequence to be subjected to genome editing, or a 16 or 17 nucleotide long target sequence and the and a mismatch sequence containing a mismatch of 1 to 2 bases with respect to the target sequence, and the kit has; (a) an expression cassette for crRNA into which a spacer sequence targeting the target sequence and the mismatch sequence can be introduced; and (b) The kit is derived from a huge phage and includes an expression cassette for a Cas ⁇ protein capable of cleaving the target sequence and the mismatch sequence.
- a large number of homologous genes can be edited simultaneously using a small number of crRNAs.
- FIG. 1A shows a graph in which duplicated genes in Arabidopsis are divided into groups and classified according to the length of contiguous base sequences that match within each group. 1383 overlapping gene groups were extracted from PTGbase. The horizontal axis represents the length of matching continuous base sequences, and the vertical axis represents the number of groups.
- FIG. 1B shows a graph in which the length of consecutive base sequences that match on the horizontal axis in FIG. 1A is enlarged from 1 to 60 residues. There are 818 groups of duplicated genes with consecutive matches of less than 30 bases, and when PAM is included, there is a low probability that many duplicated genes will be targeted simultaneously.
- Figure 2A shows the vector map of pEX-35S-HPT.
- FIG. 2B shows the vector map of pEX-CasPhi2-HPT.
- FIG. 3 is a graph showing the editing efficiency when the nucleotide length of the spacer sequence is changed when genome editing is performed using Cas ⁇ 2 and vCas ⁇ .
- FIG. 4 shows an analysis of the results of genome editing at the site where a gene was introduced by performing agroinfiltration on tobacco leaves.
- FIG. 4(A) shows the mutations introduced when targeting NbPDS-1.
- FIG. 4 shows an analysis of the results of genome editing at the site where a gene was introduced by performing agroinfiltration on tobacco leaves.
- FIG. 4(B) shows the mutations introduced when targeting NbPDS-2.
- FIG. 4 shows an analysis of the results of genome editing at the site where a gene was introduced by performing agroinfiltration on tobacco leaves.
- FIG. 4(C) shows the mutations introduced when targeting NbRDR6-1.
- FIG. 4 shows an analysis of the results of genome editing at the site where a gene was introduced by performing agroinfiltration on tobacco leaves.
- FIG. 4(D) shows the mutations introduced when targeting NbRDR6-2.
- FIG. 4 shows an analysis of the results of genome editing at the site where a gene was introduced by performing agroinfiltration on tobacco leaves.
- FIG. 4(E) shows the mutations introduced when targeting NbSGS3-1.
- FIG. 4 shows an analysis of the results of genome editing at the site where a gene was introduced by performing agroinfiltration on tobacco leaves.
- FIG. 4(C) shows the mutations introduced when targeting NbRDR6-1.
- FIG. 4 shows an analysis of the results of genome editing at the site where a gene was introduced by performing agroinfiltration on tobacco leaves
- FIG. 5(A) shows the amino acid sequence of Cas ⁇ 2 (SEQ ID NO: 1).
- FIG. 5(B) shows the amino acid sequence of Cas ⁇ 1 (SEQ ID NO: 2).
- FIG. 5(C) shows the amino acid sequence of Cas ⁇ 3 (SEQ ID NO: 3).
- FIG. 5(D) shows the DNA sequence (uppercase letters) of Arabidopsis thaliana codon-optimized Cas ⁇ 2 + the DNA sequence encoding the nuclear export signal and FLAG tag (SEQ ID NO: 9).
- FIG. 5(E) shows the base sequence (SEQ ID NO: 10) of the coding region of Cas ⁇ 2 on the constructed plasmid.
- FIG. 5(A) shows the amino acid sequence of Cas ⁇ 2 (SEQ ID NO: 1).
- FIG. 5(B) shows the amino acid sequence of Cas ⁇ 1 (SEQ ID NO: 2).
- FIG. 5(C) shows the amino acid sequence of Cas ⁇ 3 (SEQ ID NO: 3).
- FIG. 5(F) shows the amino acid sequence (SEQ ID NO: 5) of the coding region of Cas ⁇ 2 on the constructed plasmid.
- FIG. 5(G) shows the DNA sequence (uppercase letters) of Arabidopsis codon-optimized vCas ⁇ + the DNA sequence (lowercase letters) encoding the nuclear export signal and FLAG tag (SEQ ID NO: 11).
- FIG. 5(H) shows the amino acid sequence (SEQ ID NO: 6) of the coding region of vCas ⁇ on the constructed plasmid.
- FIG. 5(I) shows the crRNA sequences (SEQ ID NO: 12) of Cas ⁇ 2 and vCas ⁇ (uppercase letters indicate direct repeat sequence; spacer sequence is on the 3' side).
- FIG. 5(J) shows the crRNA sequence (SEQ ID NO: 13) of Cas ⁇ 1 (uppercase letters indicate direct repeat sequence; spacer sequence is on the 3' side).
- FIG. 5(K) shows the crRNA sequence (SEQ ID NO: 14) of Cas ⁇ 3 (uppercase letters indicate direct repeat sequence; spacer sequence is on the 3' side).
- FIG. 5(L) shows the amino acid sequence of vCas ⁇ (SEQ ID NO: 4).
- the duplicated gene to be edited in the duplicated gene genome editing method of the present invention has a 16 or 17 nucleotide long target sequence to be genome edited, and/or a 1 to 2 nucleotide long target sequence with respect to the target sequence. It is characterized by having a mismatched sequence containing a mismatch.
- the genome editing method for a duplicated gene of the present invention provides a method for editing a cell containing such a duplicated gene by: (a) crRNA containing a spacer sequence targeting the target sequence and the mismatch sequence; (b) a Cas ⁇ protein derived from a huge phage and capable of cleaving the target sequence and the mismatch sequence;
- the method includes the step of expressing in the cells.
- crRNA and Cas ⁇ are expressed in cells, so that the target sequence of the duplicated gene can be recognized and cleaved, thereby making genome editing possible.
- the method of the present invention is preferably used for cells of organisms that contain many duplicated genes. Such organisms include plants, animals, and fungi.
- grasses such as rice, wheat, barley, oats, rye, millet, millet, millet, corn, and sugarcane
- Legumes such as soybeans, Polygonaceae such as buckwheat, Cucurbitaceae such as cucumbers, watermelons, pumpkins, and zucchini, Solanaceae such as eggplants, tomatoes, potatoes, chili peppers, green peppers, and tobacco, Convolvulaceae such as sweet potatoes , Araceae plants such as taro and taro; Dioscoreaceae plants such as wild yam, yam, and Japanese yam; Cruciferae plants such as cabbage, Chinese cabbage, turnip, radish, and Arabidopsis; Lamiaceae plants such as perilla, basil, and rosemary; Sakura; Industrial plants include Rosaceae plants such as plums, peaches, strawberries, apples, and
- a duplicate gene refers to two or more homologous genes contained in one genome.
- Homologous genes refer to, for example, genes that are derived from the same ancestral gene and have the same structure and function.
- overlapping genes can be defined as genes having nucleotide sequences having sequence homology (preferably sequence identity) of 60% or more, preferably 70% or more, more preferably 80% or more with each other. can.
- a duplicate gene is defined as a gene that includes a common base sequence of a predetermined length or longer and/or a base sequence that has a mismatch of one or two bases with respect to a base sequence of a predetermined length or longer. You can also.
- the predetermined length here may be selected as appropriate, and is, for example, 16 bases or more, 17 bases or more, or 18 bases or more.
- Duplicate genes are preferably genes with functional redundancy.
- a group containing multiple homologous genes is called a duplicate gene group.
- Duplicated genes mainly exist repeatedly on one chromosome, but may also be translocated and exist on different chromosomes.
- the group of duplicated genes to be genome edited includes a plurality of genes that share a target sequence and/or a mismatch sequence containing a 1 to 2 base mismatch with the target sequence. From the perspective of achieving genome editing in all duplicated gene groups targeted for genome editing in one round of genome editing, the target sequence and/or mismatch sequence must be shared among all genes included in the duplicated gene group.
- the number of duplicated genes included in the group of duplicated genes to be genome edited is not particularly limited, but usually 2 to 100 copies may exist.
- the number of duplicated genes included in the group of duplicated genes to be genome edited may be 3 or more copies, or 5 or more copies, as long as the duplicated genes originate from whole-genome duplication, and The number may be 50 copies or less, 20 copies or less, and more preferably 10 copies or less.
- the genome editing method of the present invention causes cleavage in part or all of the target sequences and/or mismatched sequences of multiple genes in the overlapping gene group, making genome editing possible. It is desirable that the genes included in the group of duplicated genes to be genome edited have high sequence similarity to each other.
- the target sequence is a sequence corresponding to the crRNA spacer sequence in the genome editing method of the present invention, and relates to a sequence that is cleaved and genome edited by the genome editing method of the present invention.
- the target sequence is a common sequence included in duplicated genes in the duplicated gene group, and can be composed of a continuous sequence of 16 or 17 nucleotides in length.
- a target sequence is a perfectly matched sequence within a group of overlapping genes.
- a mismatch sequence containing one or two mismatches with respect to the target sequence can also be cleaved and genome edited by the genome editing method of the present invention.
- the spacer sequence in crRNA needs to be set so that the PAM sequence is included in the vicinity of the target sequence, particularly on the 5' side.
- the PAM sequence may be any PAM sequence recognized by Cas ⁇ , and examples thereof include TTN and NTN.
- the target sequence and the mismatched sequence are cleaved by the genome editing method, making genome editing possible. Thereby, genome editing becomes possible for all or part of the target sequence and the mismatched sequence included in the duplicated gene group.
- Arabidopsis has 1383 overlapping gene groups, of which 818 have consecutive matches of less than 30 bases (Fig. 1A). Therefore, when conventional Cas9 is used, it is difficult to perform genome editing with one crRNA spacer sequence for many duplicated genes.
- Arabidopsis thaliana about 70% of the overlapped gene groups have a continuous common sequence of 16 or more nucleotides in length.
- genome editing becomes possible with a spacer sequence of one crRNA for a gene group with over about 80% overlap.
- about 65% of the overlapping gene groups have a contiguous common sequence of 17 or more nucleotides in length.
- genome editing is possible with a spacer sequence of one crRNA for a gene group with over about 75% overlap.
- the nucleotide length of the target sequence can vary depending on the Cas ⁇ used.
- the target sequence may be set so that the duplicated gene group targeted for genome editing consists of genes containing only the target sequence, or may include mismatched sequences.
- the target sequence may be set to further include the gene.
- the target sequence is a 17 nucleotide long sequence
- the target sequence should be set so that the duplicated gene group targeted for genome editing includes genes containing the target sequence and genes containing mismatched sequences. Can be done.
- crRNA is RNA that includes a spacer sequence consisting of the same base sequence as the target sequence. crRNA forms a complex with Cas protein, guides it to the target sequence or mismatch sequence of genomic DNA, and can cleave the DNA between the target sequence or mismatch sequence and PAM by the action of Cas protein.
- the crRNA sequence can be selected and used depending on the type of Cas protein used. Known crRNA sequences for Cas ⁇ protein can be used, but examples include SEQ ID NO: 12, SEQ ID NO: 13, and SEQ ID NO: 14 (RNA sequences SEQ ID NO: 167, SEQ ID NO: 168, and SEQ ID NO: 169). A sequence selected from the following can be used depending on the type of Cas ⁇ protein.
- the arrangement of SEQ ID NO: 12 can be used.
- the array of SEQ ID NO: 13 can be used.
- the arrangement of SEQ ID NO: 14 can be used.
- crRNA can be expressed transiently or constitutively using the expression cassettes described below.
- Cas ⁇ protein is a Cas family protein derived from huge phage.
- Cas ⁇ protein has the activity of cleaving a target sequence with a length of 16 or more nucleotides, as well as cleaving a mismatched sequence containing a 1 to 2 base mismatch with the target sequence.
- the upper limit of the length of the target sequence to be cleaved by the Cas ⁇ protein is not particularly limited, but from the viewpoint of cleavage activity, it is usually 20 or less, preferably 18 or less, more preferably 17 or less.
- Cas ⁇ may be selected from the group consisting of Cas ⁇ 1, Cas ⁇ 2, and Cas ⁇ 3, but it is particularly preferred to use Cas ⁇ 2 (also referred to as Cas12j2), particularly from the viewpoint of off-target activity.
- Cas ⁇ may have amino acid sequence mutations (eg, substitutions, deletions, additions, etc.) as long as the activity is not completely impaired.
- Cas ⁇ protein has an amino acid sequence selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, and SEQ ID NO: 4, or 60% or more, 70% or more, 80% or more of the sequence.
- Non-Patent Document 3 the rate of cleavage reaction is It is more preferable because it improves.
- the "homology" of two amino acid sequences is the ratio at which the same or similar amino acid residues appear at each corresponding position when both amino acid sequences are aligned
- the “homology” of two amino acid sequences is “Identity” is the ratio at which the same amino acid residue appears at each corresponding position when both amino acid sequences are aligned.
- “homology” and “identity” between two amino acid sequences can be determined using, for example, the BLAST (Basic Local Alignment Search Tool) program (Altschul et al., J. Mol. Biol., (1990), 215(3): 403-10 etc.
- Cas ⁇ proteins having sequences specified by sequence homology or identity are further specified by a desired cleavage activity.
- Such cleavage activity can be specified by the cleavage activity of a target sequence of 16 nucleotides or more in length and a mismatched sequence containing a 1 to 2 base mismatch with the target sequence in vitro or in vivo.
- the cleavage activity of Cas ⁇ protein can be evaluated in vitro according to known methods.
- the RMSD value between the skeleton of Cas ⁇ 2 and the skeleton of Cas ⁇ 3 is less than 1.135A when calculated with PyMOL software align when using PDB_ID: 7odf (Cas ⁇ 3), 7lys (Cas ⁇ 2), and when nucleic acid is further included.
- the Ca root mean square deviation (RMSD) between the backbone of at least one Cas protein selected from the group consisting of Cas ⁇ 1, Cas ⁇ 2, Cas ⁇ 3, and vCas ⁇ and the backbone of the mutant is less than 2.5A, preferably less than 1.5A. , more preferably less than 1A, it can be said that there is a high probability of producing an effect equivalent to that exerted by the original Cas protein.
- the TM-score between the backbone of at least one Cas protein selected from the group consisting of Cas ⁇ 1, Cas ⁇ 2, Cas ⁇ 3, and vCas ⁇ and the backbone of the mutant is 0.8 or more, preferably 0.85 or more, more preferably When it is 0.9 or more, it can be said that there is a high probability that an effect equivalent to that exerted by the original Cas protein will be produced.
- the Cas ⁇ protein may contain additional sequences such as a signal sequence, a tag sequence, a reporter sequence, etc., as long as the desired activity is not impaired. From the viewpoint of ensuring that the expressed protein acts in the nucleus, it is desirable that a nuclear localization signal be added to the signal sequence.
- the nuclear localization signal may include one or more nuclear localization signals arranged in series.
- the nuclear translocation signal can be appropriately selected depending on the plant species, and as an example, KRPAATKKAGQAKKKK (SEQ ID NO: 7) and/or GSDYKDHDGDYKDHDIDYKDDDDKPKKKRKV (SEQ ID NO: 8) can be used. As a result, the Cas ⁇ protein expressed within the cell can migrate into the nucleus and cleave the target sequence in cooperation with crRNA within the nucleus.
- a crRNA or expression cassette usually includes a promoter sequence, and can be created by placing a sequence encoding the crRNA under the control of the promoter sequence.
- the crRNA expression cassette may be contained on one polynucleotide or on different polynucleotides.
- the crRNA may be used as a crRNA expression cassette by placing a sequence encoding a single-stranded guide RNA linked to multiple crRNAs under the control of a promoter sequence.
- the Cas ⁇ protein can also be expressed transiently or permanently in cells according to standard methods.
- a Cas ⁇ expression cassette is prepared by placing a polynucleotide of a Cas ⁇ protein-encoding sequence under the control of a promoter in an expression cassette containing a promoter sequence that allows transient or constant expression. Can be done. Placed under the control of a promoter refers to placed so that expression is controlled by the promoter, and placed an appropriate number of bases, for example, 10 to 200 bases, from the 3' end of the promoter. Good too.
- the crRNA expression cassette and the Cas ⁇ expression cassette may be contained on one polynucleotide or on different polynucleotides. These expression cassettes may contain other elements as necessary. Such elements may include elements necessary for expression, such as terminators, and elements necessary for plasmid or vector preparation, such as multi-cloning sites, drug resistance genes, reporter genes, and origins of replication.
- the promoter used in the crRNA expression cassette and the Cas ⁇ expression cassette can be appropriately selected depending on the species of organism to be expressed.
- a pol II promoter can be used, but a pol III promoter is preferred from the viewpoint of more accurate transcription of relatively short RNAs.
- pol II promoters include CaMV35S promoter, RPS5A promoter, UBQ promoter, DD45 promoter, NOS promoter, and the like.
- Examples of the polIII promoter include U6-snRNA (eg, U6.1-snRNA, U6.26-snRNA, etc.) promoter, U3-snRNA promoter, and the like.
- the terminator used in the crRNA expression cassette and the Cas ⁇ expression cassette terminates transcription from the Cas protein coding sequence (preferably, can further add a polyA sequence to the mRNA transcribed from the Cas protein coding sequence).
- a polyT sequence can also be added to the guide RNA.
- the termination signal include heat shock protein termination signal (HspT), NosT (Noparin synhase Terminator), 35sT (CaMV 35S Terminator), Pea3A (Pea Rubisco subunit 3A), and the like.
- the present invention may relate to a method for producing a crRNA expression cassette, which includes a step of determining a target sequence in a group of overlapping genes to be genome edited.
- the target sequence in the duplicated gene group may be selected from genome information such that in the duplicated gene group to be genome edited, a continuous sequence of 16 nucleotides in length near the PAM sequence of Cas ⁇ does not contain any mismatch, or Alternatively, it may be selected to allow two mismatches.
- the target sequence in the duplicated gene group is determined from the genome information that in the duplicated gene group to be genome edited, there is a continuous sequence of 17 nucleotides in length near the PAM sequence of Cas ⁇ , and a sequence that does not contain a mismatch, or A mismatch sequence containing two mismatches is selected.
- a crRNA sequence can be designed by using the determined target sequence as a spacer sequence and linking it with the remaining sequences.
- a polynucleotide consisting of the crRNA sequence designed in this way can be easily created according to known genetic engineering techniques.
- the polynucleotide consisting of the crRNA sequence or guide RNA sequence thus prepared is incorporated into a crRNA expression cassette using known genetic engineering methods, such as PCR, restriction enzyme treatment, DNA ligation, in vitro transcription technology, etc. Can be done.
- kits for genome editing of duplicate genes in cells the duplicated gene to be genome edited has only a 16 nucleotide long target sequence, or a 16 or 17 nucleotide long target sequence and a mismatched sequence containing a 1 to 2 base mismatch with respect to the target sequence. It is characterized by having the following.
- kits include: (a) an expression cassette for crRNA into which a spacer sequence targeting the target sequence and the mismatch sequence can be introduced; and (b) an expression cassette for a Cas ⁇ protein derived from a huge phage and capable of cleaving the target sequence and the mismatch sequence; including.
- the crRNA expression cassette and the Cas ⁇ protein expression cassette are incorporated into a plasmid or a vector, and the genes are introduced into cells.
- the genome editing kit according to the present invention may further contain other materials, reagents, instruments, etc. necessary for carrying out the genome editing method of the present invention, such as nucleic acid introduction reagents and buffer solutions, as necessary. good.
- other materials necessary for carrying out the genome editing method of the present invention include a donor polynucleotide. By introducing the donor polynucleotide into the nucleus, it is possible to knock the donor polynucleotide into the cleavage site created by the CRISPR/Cas system.
- the present invention may also relate to a method for genome editing a duplicated gene in a cell, which includes the step of introducing into a cell a Cas ⁇ expression cassette that encodes a Cas ⁇ protein capable of cleaving the cassette.
- the crRNA expression cassette and the Cas ⁇ expression cassette may be introduced onto two polynucleotides separately or simultaneously, or may be introduced simultaneously onto one polynucleotide.
- a donor polynucleotide In addition to introducing the expression cassette of crRNA and/or the expression cassette of Cas ⁇ protein into cells, it is possible to introduce a donor polynucleotide. By introducing the donor polynucleotide into the nucleus, it is possible to knock the donor polynucleotide into the cleavage site created by the CRISPR/Cas system.
- Gene introduction can be performed using techniques known in the technical field.
- the method of introduction is not particularly limited, and can be selected as appropriate depending on the type of substance to be introduced and the target to be introduced.
- Introduction methods are broadly classified into direct methods and methods using viral vectors.
- Direct methods that can be used include the PEG method that utilizes the phagocytosis of protoplasts from which the cell wall of plant cells has been removed, the electroporation method, the particle gun method in which gold particles are injected together, and the whisker method.
- Methods using viral vectors include Agrobacterium, tobacco mosaic virus (TMV), plum pox virus (PPV), potato X virus (PVX), alfalfa mosaic virus (AIMV), and cucumber, depending on the host plant species.
- CMV cowpea mosaic virus
- ZYMV zucchini yellow mosaic virus
- gemini virus etc.
- the Agrobacterium method is preferred from the viewpoint of simplicity and safety.
- vectors suitable for introduction into plants or plant cells such as the above-mentioned vectors
- vectors for transferring the polynucleotide of the present invention to such vectors for example, Gateway (registered trademark)
- Gateway registered trademark
- Entry clone vector, etc. can also be mentioned as an example.
- the cells to be introduced may be cells cultured in vitro or cells constituting a plant body.
- introduction sites in plants include flowers (particularly egg cells, pollen, etc. within flowers), leaves, roots, seeds, embryos, and the like.
- the target for introduction is preferably the shoot tip from the viewpoint of performing genome editing more efficiently in germ cells.
- a method of obtaining a genome-edited individual by redifferentiating cells into which a gene has been introduced, or a method of obtaining a genome-edited individual by utilizing a gene that induces a shoot apex from somatic cells may be used.
- Example 1 Preparation of vectors for Huge phage-derived Cas ⁇ 2 and vCas ⁇ (1) Preparation of Huge phage-derived Cas ⁇ 2 gene Based on the amino acid sequence information (SEQ ID NO: 1) derived from Huge phage, a codon-optimized vector for Arabidopsis was A DNA sequence encoding a C-terminal nuclear export signal sequence-FLAG tag was added to a DNA sequence encoding the Cas protein obtained by adding a DNA sequence encoding the FLAG tag (SEQ ID NO: 9). Sanger method or next generation sequencing method was used to determine the base sequence. The amino acid sequence of SEQ ID NO: 1 can be found in well-known databases such as GenBank of NCBI (National Center for Biotechnology Information).
- coli DH5a was transformed with the obtained circular plasmid, and transformants were selected by culturing on LB agar plates containing 50 ⁇ g/mL ampicillin. Several colonies were picked up, a clone containing the circular plasmid of interest was selected, and the plasmid was purified. The base sequence (SEQ ID NO: 10) and amino acid sequence (SEQ ID NO: 5) of the Cas ⁇ coding sequence of the constructed vector are shown. Next, the vector was digested with BsaI and NruI to obtain linear DNA. At the same time, the following array: A double-stranded DNA annealed with an oligonucleotide having the following was prepared.
- Each type of double-stranded DNA annealed with the cut vector was made into a circular plasmid using T4 DNA ligase.
- a circular plasmid was purified using the procedure described above. This vector is designated as pEX_35S-Cas ⁇ 2_HPT ( Figure 2B).
- coli DH5a was transformed with the obtained circular plasmid, and transformants were selected by culturing on LB agar plates containing 50 ⁇ g/mL ampicillin. Several colonies were picked up, a clone containing the circular plasmid of interest was selected, and the plasmid was purified.
- the base sequence (SEQ ID NO: 11) and amino acid sequence (SEQ ID NO: 6) of the vCas ⁇ coding sequence of the constructed vector are shown, respectively. This vector is designated as pEX_35S-vCas ⁇ _HPT.
- This vector is designated as pCA_35S-Cas ⁇ 2_HPT and pCA_35S-vCas ⁇ _HPT.
- Example 2 Mutation introduction with Cas ⁇ 2 and vCas ⁇ in Arabidopsis protoplast cells (1) Preparation of plasmid for genome editing experiments of Arabidopsis genes The pEX_35S-Cas ⁇ 2_HPT vector or pEX_35S-vCas ⁇ _HPT vector was cut with BsaI-HF. First, in order to investigate whether genome editing is possible using these vectors, we used the following method to clone the spacer sequence of Cas ⁇ crRNA for genome editing experiments of the Arabidopsis-derived PDS3 gene (a single copy gene in the Arabidopsis genome).
- a total of three types of double-stranded DNA were prepared by annealing oligonucleotides having the following for each set.
- the PDS3 gene is the phytoene desaturase 3 gene, which is a carotenoid biosynthetic enzyme, and is known to cause whitening of plant cells when knocked out. This makes it possible to identify the location of the knockout in the plant.
- Each type of double-stranded DNA annealed with the cut vector was made into a circular plasmid using T4 DNA ligase.
- E. coli DH5a was transformed with the obtained circular plasmid, and transformants were selected by culturing on LB agar plates containing 50 ⁇ g/mL ampicillin. Several colonies were picked up, a clone containing the circular plasmid of interest was selected, and the plasmid was purified.
- the protoplasts were filtered through a nylon filter with a pore size of 70 ⁇ m, collected in a 50 ml tube, centrifuged at 100 x g for 10 minutes to collect the protoplasts, the supernatant was discarded, and the mixture was incubated with 150 mM NaCl, 125 mM CaCl 2 , 5 mM KCl, 2 mM MES ( pH 5.7) buffer (W5 buffer).
- W5 buffer 150 mM NaCl, 125 mM CaCl 2 , 5 mM KCl, 2 mM MES ( pH 5.7) buffer
- W5 buffer 150 mM NaCl, 125 mM CaCl 2 , 5 mM KCl, 2 mM MES ( pH 5.7) buffer
- W5 buffer 150 mM NaCl, 125 mM CaCl 2 , 5 mM KCl, 2 mM MES ( pH 5.7) buffer
- the protoplasts were centrifuged at 100 ⁇ g for 5 minutes, and then resuspended in a 400 mM mannitol, 15 mM MgCl 2 , 4 mM MES (pH 5.7) buffer. After that, the protoplasts were collected by centrifugation at 100 x g for 5 minutes, and the cell concentration was adjusted to 2.0 to 3.0 x 10 5 cells/ml using the same buffer, and the protoplasts for transformation were suspended. I got the liquid.
- Genomic DNA was recovered from the heat-treated protoplast suspension by isopropanol precipitation. The recovered genomic DNA was suspended in sterile water, and a DNA fragment of approximately 300 bp was amplified using a primer set with the sequence listed in Table 4 below.
- FIG. 3 shows the results of analyzing the editing efficiency using CRISPResso2 software when the target sequence length was changed to 15, 16, and 18, respectively, when vCas ⁇ was introduced.
- a group in which the fluorescent protein GFP expression vector was introduced was used as a control.
- editing efficiency was investigated when SpyCas9 was used for a target sequence length of 18.
- vCas ⁇ in FIG. 3 was used, gene editing was possible when the target sequence length was 16 and 18, but when the target sequence length was 15, genome editing did not occur.
- the genome editing efficiency when using SpyCas9 was about 0.02, but when using vCas ⁇ , it was about 0.09 at maximum.
- Example 3 Mutation introduction using vCas ⁇ in tobacco leaf cells (1) Preparation of plasmid for genome editing experiments of tobacco genes The pEX_35S-vCas ⁇ _HPT vector was cut with BsaI-HF. In order to clone a spacer sequence for forming Cas ⁇ crRNA for genome editing experiments of tobacco-derived PDS, RDR6, and SGS3 genes, oligonucleotides having the sequences listed in Table 5 below were annealed for each set. A total of 21 types of double-stranded DNA were prepared: The PDS gene is a phytoene desaturase gene, which is a carotenoid biosynthetic enzyme, and is known to cause whitening of plant cells when knocked out.
- the RDR6 gene is an RNA-dependent RNA polymerase 6 that is involved in distinguishing between foreign RNA and normal mRNA, and is known to have the effect of reducing resistance to viruses when knocked out. There is. It is known that in tobacco there are two duplicate genes of the RDR6 gene.
- the SGS3 gene is gene silencing suppressor 3, which cooperates with RDR6 and functions as a defense against viruses. It is known that when the SGS3 gene is knocked out, resistance to viruses is reduced. It is known that there are two duplicated SGS3 genes in tobacco.
- E. coli DH5a was transformed with the obtained circular plasmid, and transformants were selected by culturing on LB agar plates containing 50 ⁇ g/mL spectinomycin. Several colonies were picked up, a clone containing the circular plasmid of interest was selected, and the plasmid was purified.
- the purified plasmid was introduced into Agrobacterium GV3101 strain by electroporation, and the transformant was cultured on an LB agar plate containing 50 ⁇ g/mL spectinomycin, 50 ⁇ g/mL gendamicin, and 50 ⁇ g/mL rifampicillin. were selected.
- the agroinfiltrated area of the plant is colored red.
- the cultured bacterial solution was centrifuged at 3000 rpm for 20 minutes to collect bacteria, suspended in about 5 ml of infiltration buffer (composition: 10 mM MgCl 2 , 10 mM MES, 100 ⁇ M acetosyringone, pH 5.7), and adjusted to an OD600 of about 1. .
- infiltration buffer composition: 10 mM MgCl 2 , 10 mM MES, 100 ⁇ M acetosyringone, pH 5.7
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
少数のgRNA又はcrRNAを用いて、機能重複している多数の遺伝子を同時に編集する技術を提供することを目的とする。ヒュージファージ由来のCasΦタンパク質が、16以上のヌクレオチド長であるターゲット配列、及び当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列を切断可能であることを見出し、斯かるCasΦタンパク質を用いた重複遺伝子のゲノム編集方法を提供する。
Description
本発明は、重複遺伝子のゲノム編集に関する。
ゲノム編集は、対象生物のゲノムの狙った箇所に変異を導入する(編集する)技術である。そのため、放射線などの既存の変異導入方法に比べて圧倒的に少ない数の変異体から望みの株を取得できる効率性がメリットとなり、様々な用途に使用されている。
典型的なゲノム編集技術であるCRISPR/Cas9やCRISPR/Cas12aでは、編集対象の配列はおもにそれらを構成するgRNAまたはcrRNAのスペーサー配列とよばれる部位によって規定される。gRNAまたはcrRNAのスペーサー配列としては、通常、20~24塩基を任意に変更可能な標的配列として使用する。このスペーサー配列に加えて、ヌクレアーゼであるCas9やCas12aが機能するには、PAM配列と呼ばれる2~4塩基程度の塩基配列が必要となる。したがって、PAM配列とスペーサー配列を合わせた総計22~28塩基ほどの塩基配列を特異的に認識してゲノム編集が行われている。この認識長は、ヒトゲノムのうちの単一の領域を指定するのに十分な長さであるとされる。
しかしながら、植物をはじめとした多くの生物では、ゲノム中に存在する相同遺伝子が機能を補償する現象(機能冗長性)が存在するため、ひとつの遺伝子を破壊しただけでは、目的とした表現型が現れないことがある。したがって、目的とした表現型を発現させるには、配列類似性がある複数の相同遺伝子を同時に編集する必要がある場合が多い。
複数の遺伝子を同時に編集するために、多くの場合、gRNA又はcrRNAを複数発現させて、それぞれのgRNA又はcrRNAで互いに異なる遺伝子を指定する、という方法がとられている。この方法では、編集対象の遺伝子が増えれば増えるほど、gRNA又はcrRNAを多数発現させる必要があるためにベクター構築などに労力がかかるという問題がある。
複数の遺伝子を同時に編集する他の方法として、CRISPRのオフターゲット効果を利用するという手段がある。この方法では、CRISPR/Cas9のgRNA又はcrRNAがミスマッチ配列を切断する性質を利用する。すなわち、20~24塩基をターゲットするgRNAの配列を、異なる複数の遺伝子をそれぞれ1~2塩基ミスマッチで編集するように設計すれば、ひとつのgRNA又はcrRNAで複数の遺伝子を同時に編集できるというものである。こうしたオフターゲット効果を利用した方法には、ひとつの遺伝子にひとつのgRNA又はcrRNAを使用する方法に比べて、少ないgRNA又はcrRNAで多数の遺伝子を編集できるために、ベクター構築に労力がかからないというメリットがある。
一方で、オフターゲット効果を利用する方法には、制約もあることが知られている。CRISPR/Cas9ではスペーサー配列を短くするほどオフターゲット効果が少なくなることが報告されている。ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)のCas9(以下、SpyCas9と呼ぶ)においては、20塩基認識のスペーサー配列をもつgRNA又はcrRNAを使用すると、1-2ミスマッチの配列も切断するが、17塩基認識のスペーサー配列をもつgRNA又はcrRNAを使用するとミスマッチ配列を切断し、変異を入れる効率は劇的に低下する(非特許文献1:Nat Biotechnol. 2014 Mar; 32(3): 279-284)。したがって、現状では、PAM配列+20塩基の認識でミスマッチ配列も同時に編集するか、PAM配列+17塩基が完全に一致する相同遺伝子を同時に編集するか、どちらかの方法を選択せざるを得なかった。
新たなCasとして、ヒュージファージが有するCasΦという小型のCasファミリーが存在することが報告されており、その中のCasΦ2が、試験管内の実験において、16残基という短いターゲット配列を切断することが報告された(非特許文献2:Science (2020)369, 333-337、非特許文献3:Nature Communications (2021) volume 12, Article number: 4476)。さらにCasΦについては、結晶構造解析に基づく研究が行われており、非標的鎖と相互作用することが予測されるヘリックスに対応する155位~176位を欠失させたvCasΦにおいて、反応速度が増大することが開示された(非特許文献4:Nature Structural & Molecular Biology (2021) vol.28, pp.652-661)。CasΦを用いた植物におけるゲノム編集についても報告されている(非特許文献5:Int. J. Mol. Sci. (2022), 23, 5755)。
Nat Biotechnol. 2014 Mar; 32(3): 279-284
Science (2020)369, 333-337
Nature Communications (2021) volume 12, Article number: 4476
Nature Structural & Molecular Biology (2021) vol. 28, pp. 652-661
Int. J. Mol. Sci. (2022), 23, 5755
Plant Biotechnology (2016) 33, 235-243
上述した多数の遺伝子を同時に編集する技術、とくに、オフターゲットを活用する技術は、機能冗長性をもつ遺伝子同士がある程度の配列類似性を持つことを前提とする。しかしながら、実際には機能重複する遺伝子の配列類似度は十分に高くない、という問題があることが経験的に知られていた。
発明者らは、とくに機能冗長性が問題となる植物の代表例であるシロイヌナズナのゲノム配列情報を解析し、機能冗長性を持つ遺伝子同士の配列がどの程度連続して一致しているかを解析した。その結果、塩基配列が連続して一致する長さが24塩基未満であるような遺伝子が、過半数に近いことが分かった。したがって、機能冗長性を有する相同遺伝子群を破壊するためには、CRISPR/Cas9やCRISPR/Cas12aでは認識長が長すぎるか、またはオフターゲット効果が少なすぎるという問題があることを見出した。
そこで、本発明は、かかる問題を解決すべくなされたものであって、少数のgRNA又はcrRNAを用いて、機能重複している多数の遺伝子を同時に編集する技術を提供することを目的とする。
本発明の上記目的を解決すべく鋭意研究を行ったところ、ヒュージファージ由来のCasΦタンパク質が、16以上のヌクレオチド長であり、0~2個のミスマッチを含むターゲット配列を、細胞内で切断可能であることを見出し、重複遺伝子のゲノム編集方法についての発明に至った。
そこで本発明は以下に関する:
[1] 細胞の重複遺伝子のゲノム編集方法であって、前記重複遺伝子が、ゲノム編集の対象となる16ヌクレオチド長のターゲット配列のみを有するか、或いは16又は17ヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有し;ここで前記方法が、
(a)前記ターゲット配列及びミスマッチ配列を標的とするスペーサー配列を含むcrRNA;及び、
(b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質;
を、前記細胞内で発現させる工程を含む、重複遺伝子のゲノム編集方法。
[2]前記CasΦタンパク質が、CasΦ1、CasΦ2、vCasΦ及びCasΦ3からなる群から選ばれる少なくとも1のタンパク質である、項目1に記載のゲノム編集方法。
[3] 前記CasΦタンパク質が、配列番号1、2、3及び4からなる群から選ばれるアミノ酸配列に対し、少なくとも80%の配列相同性を有するアミノ酸配列を含む、項目1に記載のゲノム編集方法。
[4] 前記重複遺伝子が、機能冗長性を有する重複配列である、項目1~3に記載のゲノム編集方法。
[5] 前記重複遺伝子が、ターゲット配列の近傍にPAM配列を含む、項目1~4のいずれか一項に記載のゲノム編集方法。
[6] 前記スペーサー配列が、前記ターゲット配列と、完全一致するように決定される、項目1~5のいずれか一項に記載のゲノム編集方法。
[7] 前記重複遺伝子が、16以上のヌクレオチド長のターゲット配列と、場合により当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有する、項目1~6のいずれか一項に記載のゲノム編集方法。
[8] 前記重複遺伝子が、17以上のヌクレオチド長のターゲット配列と当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有する、項目1~7のいずれか一項に記載のゲノム編集方法。
[9] 前記重複遺伝子が、前記細胞のゲノム中に2~100コピー存在する、項目1~8のいずれか一項に記載のゲノム編集方法。
[10] 前記細胞のゲノム中に含まれる重複遺伝子のうち、一部又は全ての重複遺伝子を編集する、項目1~9のいずれか一項に記載のゲノム編集方法。
[11] 前記細胞が、植物細胞である、項目1~10のいずれか一項に記載のゲノム編集方法。
[12] 前記crRNA及び/又は前記CasΦタンパク質を、発現ベクターにより前記細胞内に導入して発現させる、項目1~11のいずれか一項に記載のゲノム編集方法。
[13] 前記発現ベクターが、一過性又は恒常性発現ベクターである、項目12に記載のゲノム編集方法。
[14] 細胞の重複遺伝子のゲノム編集用キットであって、前記重複遺伝子が、ゲノム編集の対象となる16ヌクレオチド長のターゲット配列のみを有するか、或いは16又は17ヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有し、前記キットが;
(a)前記ターゲット配列及び前記ミスマッチ配列を標的とするスペーサー配列を導入可能なcrRNAの発現カセット;及び、
(b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質の発現カセット
を含む、前記キット。
そこで本発明は以下に関する:
[1] 細胞の重複遺伝子のゲノム編集方法であって、前記重複遺伝子が、ゲノム編集の対象となる16ヌクレオチド長のターゲット配列のみを有するか、或いは16又は17ヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有し;ここで前記方法が、
(a)前記ターゲット配列及びミスマッチ配列を標的とするスペーサー配列を含むcrRNA;及び、
(b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質;
を、前記細胞内で発現させる工程を含む、重複遺伝子のゲノム編集方法。
[2]前記CasΦタンパク質が、CasΦ1、CasΦ2、vCasΦ及びCasΦ3からなる群から選ばれる少なくとも1のタンパク質である、項目1に記載のゲノム編集方法。
[3] 前記CasΦタンパク質が、配列番号1、2、3及び4からなる群から選ばれるアミノ酸配列に対し、少なくとも80%の配列相同性を有するアミノ酸配列を含む、項目1に記載のゲノム編集方法。
[4] 前記重複遺伝子が、機能冗長性を有する重複配列である、項目1~3に記載のゲノム編集方法。
[5] 前記重複遺伝子が、ターゲット配列の近傍にPAM配列を含む、項目1~4のいずれか一項に記載のゲノム編集方法。
[6] 前記スペーサー配列が、前記ターゲット配列と、完全一致するように決定される、項目1~5のいずれか一項に記載のゲノム編集方法。
[7] 前記重複遺伝子が、16以上のヌクレオチド長のターゲット配列と、場合により当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有する、項目1~6のいずれか一項に記載のゲノム編集方法。
[8] 前記重複遺伝子が、17以上のヌクレオチド長のターゲット配列と当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有する、項目1~7のいずれか一項に記載のゲノム編集方法。
[9] 前記重複遺伝子が、前記細胞のゲノム中に2~100コピー存在する、項目1~8のいずれか一項に記載のゲノム編集方法。
[10] 前記細胞のゲノム中に含まれる重複遺伝子のうち、一部又は全ての重複遺伝子を編集する、項目1~9のいずれか一項に記載のゲノム編集方法。
[11] 前記細胞が、植物細胞である、項目1~10のいずれか一項に記載のゲノム編集方法。
[12] 前記crRNA及び/又は前記CasΦタンパク質を、発現ベクターにより前記細胞内に導入して発現させる、項目1~11のいずれか一項に記載のゲノム編集方法。
[13] 前記発現ベクターが、一過性又は恒常性発現ベクターである、項目12に記載のゲノム編集方法。
[14] 細胞の重複遺伝子のゲノム編集用キットであって、前記重複遺伝子が、ゲノム編集の対象となる16ヌクレオチド長のターゲット配列のみを有するか、或いは16又は17ヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有し、前記キットが;
(a)前記ターゲット配列及び前記ミスマッチ配列を標的とするスペーサー配列を導入可能なcrRNAの発現カセット;及び、
(b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質の発現カセット
を含む、前記キット。
本発明によれば、少数のcrRNAを用いて多数の相同な遺伝子を同時に編集することができる。
本発明の一の態様は、重複遺伝子のゲノム編集方法に関する。より具体的に、本発明の重複遺伝子のゲノム編集方法において編集される重複遺伝子は、ゲノム編集の対象となる16又は17ヌクレオチド長のターゲット配列、及び/又は当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列を有することにより特徴づけられる。本発明の重複遺伝子のゲノム編集方法は、かかる重複遺伝子を含む細胞に
(a)前記ターゲット配列及びミスマッチ配列を標的とするスペーサー配列を含むcrRNA;及び、
(b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質;
を、前記細胞内で発現させる工程を含む。本発明の方法により、crRNAとCasΦとが細胞内で発現することにより、重複遺伝子のターゲット配列が認識されて切断が可能になり、それによりゲノム編集が可能になる。本発明の方法は、重複遺伝子を多く含む生物の細胞に対して使用されることが好ましい。そのような生物として、植物、動物、菌類が挙げられる。植物の中でも特に、穀物、園芸作物、観賞用植物、又は飼料植物において用いられることが好ましく、特にイネ、コムギ、オオムギ、カラスムギ、ライムギ、キビ、アワ、ヒエ、トウモロコシ、サトウキビなどのイネ科植物、ダイズなどのマメ科植物、そばなどのタデ科植物、キュウリ、スイカ、カボチャ、ズッキーニなどのウリ科植物、ナス、トマト、ジャガイモ、トウガラシ、ピーマン、タバコなどのナス科植物、サツマイモなどのヒルガオ科植物、タロイモ、サトイモなどのサトイモ科植物、自然薯、ヤマイモ、ナガイモなどのヤマノイモ科植物、キャベツ、ハクサイ、カブ、ダイコン、シロイヌナズナなどのアブラナ科植物、シソ、バジル、ローズマリーなどのシソ科植物、サクラ、ウメ、モモ、イチゴ、リンゴ、ナシなどのバラ科植物、ニンジン、セロリ、クミン、ミツバ、パセリなどのセリ科植物、タマネギ、ネギ、ニンニクなどのヒガンバナ科植物、キャッサバなどのトウダイクサ科植物など、産業上有用な任意の植物が挙げられる。
(a)前記ターゲット配列及びミスマッチ配列を標的とするスペーサー配列を含むcrRNA;及び、
(b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質;
を、前記細胞内で発現させる工程を含む。本発明の方法により、crRNAとCasΦとが細胞内で発現することにより、重複遺伝子のターゲット配列が認識されて切断が可能になり、それによりゲノム編集が可能になる。本発明の方法は、重複遺伝子を多く含む生物の細胞に対して使用されることが好ましい。そのような生物として、植物、動物、菌類が挙げられる。植物の中でも特に、穀物、園芸作物、観賞用植物、又は飼料植物において用いられることが好ましく、特にイネ、コムギ、オオムギ、カラスムギ、ライムギ、キビ、アワ、ヒエ、トウモロコシ、サトウキビなどのイネ科植物、ダイズなどのマメ科植物、そばなどのタデ科植物、キュウリ、スイカ、カボチャ、ズッキーニなどのウリ科植物、ナス、トマト、ジャガイモ、トウガラシ、ピーマン、タバコなどのナス科植物、サツマイモなどのヒルガオ科植物、タロイモ、サトイモなどのサトイモ科植物、自然薯、ヤマイモ、ナガイモなどのヤマノイモ科植物、キャベツ、ハクサイ、カブ、ダイコン、シロイヌナズナなどのアブラナ科植物、シソ、バジル、ローズマリーなどのシソ科植物、サクラ、ウメ、モモ、イチゴ、リンゴ、ナシなどのバラ科植物、ニンジン、セロリ、クミン、ミツバ、パセリなどのセリ科植物、タマネギ、ネギ、ニンニクなどのヒガンバナ科植物、キャッサバなどのトウダイクサ科植物など、産業上有用な任意の植物が挙げられる。
一態様によれば、重複遺伝子とは、1つのゲノム内に2つ以上含まれる相同遺伝子のことをいう。相同遺伝子とは、例えば、同一の祖先遺伝子に由来し、同じ構造・機能を持つ遺伝子のことをいう。一態様によれば、重複遺伝子は、互いに60%以上、好ましくは70%以上、さらに好ましくは80%以上の配列相同性(好ましくは配列同一性)を有する塩基配列を有する遺伝子として定義することができる。一態様によれば、重複遺伝子は、所定長以上の共通する塩基配列を含むか、及び/又は所定長以上の塩基配列に対し、1塩基又は2塩基のミスマッチを有する塩基配列を含む遺伝子として定義することもできる。ここでいう所定長は、適宜選択されてよいが、一例として16塩基以上、17塩基以上、又は18塩基以上である。重複遺伝子は、好ましくは機能冗長性を有する遺伝子である。複数の相同遺伝子を含むグループを重複遺伝子群という。重複遺伝子は、主に1つの染色体上で繰り返し存在しているが、転座して異なる染色体上に存在していてもよい。ゲノム編集対象となる重複遺伝子群には、ターゲット配列、及び/又は当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列を共有する遺伝子が複数存在する。1回のゲノム編集でゲノム編集対象となる重複遺伝子群の全てにおいてゲノム編集を達成する観点からは、重複遺伝子群に含まれるすべての遺伝子において、ターゲット配列及び/又はミスマッチ配列が共有されていることが好ましい。ゲノム編集対象となる重複遺伝子群に含まれる重複遺伝子の数は、特に限定されないが、通常2~100コピー存在しうる。ゲノム編集対象となる重複遺伝子群に含まれる重複遺伝子の数は、全ゲノム重複を起源として持つ重複遺伝子であれば、3コピー以上であってもよいし、5コピー以上であってもよく、かつ50コピー以下であってもよいし、20コピー以下であってもよいし、10コピー以下がより好ましい。ターゲット配列を共有することにより、本発明のゲノム編集方法によって、重複遺伝子群内の複数の遺伝子のターゲット配列及び/又はミスマッチ配列の一部又は全てにおいて切断が生じ、ゲノム編集が可能になる。ゲノム編集対象となる重複遺伝子群に含まれる遺伝子は、互いに高い配列類似性を有することが望ましい。
本発明において、ターゲット配列とは、本発明に係るゲノム編集方法におけるcrRNAのスペーサー配列に対応する配列であり、本発明に係るゲノム編集方法より切断されて、ゲノム編集される配列に関する。ターゲット配列は、重複遺伝子群内の重複遺伝子に含まれる共通する配列であって、16又は17ヌクレオチド長の連続する配列から構成されうる。ターゲット配列は、重複遺伝子群内で完全に一致する配列である。一方、ターゲット配列に対して、1又は2個のミスマッチが含まれているミスマッチ配列も、本発明に係るゲノム編集方法より切断されて、ゲノム編集されうる。crRNAにおけるスペーサー配列は、ターゲット配列の近傍、特に5’側に隣接してPAM配列が含まれるようにターゲット配列を設定することが必要となる。PAM配列としては、CasΦが認識するPAM配列であればよく、一例としてTTN、NTNが挙げられる。
1つのcrRNAスペーサー配列により、ターゲット配列とミスマッチ配列とがゲノム編集方法により切断されて、ゲノム編集が可能になる。これにより、重複遺伝子群に含まれるターゲット配列とミスマッチ配列の全て又は一部について、ゲノム編集が可能になる。シロイヌナズナは1383個の重複遺伝子群を有しており、そのうち、30塩基未満の連続一致を有する重複遺伝子群は818個である(図1A)。したがって、従来のCas9を用いた場合には、多くの重複遺伝子では、1つのcrRNAスペーサー配列でゲノム編集を行うことは困難である。一方、シロイヌナズナにおいて16以上のヌクレオチド長の連続する共通配列を有する重複遺伝子群は、約70%となる。さらに、1又は2個のミスマッチを許容することで、約80%超の重複遺伝子群について、1つのcrRNAのスペーサー配列によって、ゲノム編集が可能になる。シロイヌナズナにおいて17以上のヌクレオチド長の連続する共通配列を有する重複遺伝子群は、約65%となる。さらに、1又は2個のミスマッチを許容することで、約75%超の重複遺伝子群について、1つのcrRNAのスペーサー配列によって、ゲノム編集が可能になる。ターゲット配列のヌクレオチド長は、使用するCasΦに応じて変化しうる。
ターゲット配列が16ヌクレオチド長の配列である場合、ゲノム編集対象となる重複遺伝子群には、ターゲット配列のみを含む遺伝子から構成されるように、ターゲット配列を設定してもよいし、ミスマッチ配列を含む遺伝子をさらに含むようにターゲット配列を設定してもよい。
一方、ターゲット配列が17ヌクレオチド長の配列である場合、ゲノム編集対象となる重複遺伝子群には、ターゲット配列を含む遺伝子と、ミスマッチ配列を含む遺伝子とが含まれるように、ターゲット配列を設定することができる。
crRNAは、ターゲット配列と同一の塩基配列からなるスペーサー配列を含むRNAである。crRNAは、Casタンパク質と複合体を形成し、ゲノムDNAのターゲット配列又はミスマッチ配列に誘導し、Casタンパク質の作用によりターゲット配列又はミスマッチ配列とPAMとの間でDNAを切断することができる。crRNA配列は、利用するCasタンパク質の種類に応じて選択して使用することができる。CasΦタンパク質に対するcrRNA配列は公知のものを使用することができるが、一例として、配列番号12、配列番号13、及び配列番号14(RNA配列として配列番号167、配列番号168、及び配列番号169)からなる配列から選ばれる配列をCasΦタンパク質の種類に応じて、使用することができる。一例として、CasΦ2及びvCasを使用する場合には、配列番号12の配列を用いることができる。CasΦ1を用いる場合には、配列番号13の配列を用いることができる。CasΦ3を使用する場合には、配列番号14の配列を用いることができる。crRNAは、以下に説明する発現カセットを用いて、一過的又は恒常的で発現することができる。
CasΦタンパク質とは、ヒュージファージ由来のCasファミリーのタンパク質である。CasΦタンパク質は、16以上のヌクレオチド長のターゲット配列を切断するとともに、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列を切断する活性を有する。CasΦタンパク質が切断するターゲット配列の長さの上限は、特に限定されないが、切断活性の観点から、通常20以下、好ましくは18以下、さらに好ましくは17以下である。CasΦは、CasΦ1、CasΦ2、及びCasΦ3からなる群から選ばれうるが、特にオフターゲット活性の観点から特にCasΦ2(Cas12j2とも呼ばれる)を使用することが好ましい。CasΦに対しては、活性を完全に損なわない限りにおいて、アミノ酸配列の変異(例えば、置換、欠失、付加など)を有していてもよい。この観点から、CasΦタンパク質は、配列番号1、配列番号2、配列番号3、及び配列番号4からなる群から選ばれるアミノ酸配列、又は当該配列に対し、60%以上、70%以上、80%以上、90%以上、93%以上、95%以上、97%以上、98%以上、又は99%以上の配列相同性(好ましくは配列同一性)を有する配列を有しうる。特にCasΦ2において、非ターゲット鎖と相互作用するとされるヘリックス領域(配列番号1の155位~176位)を削除した変異型CasΦ2(vCasΦとも呼ばれる:アミノ酸配列:配列番号4)において、切断反応の速度が向上することから、より好ましい(非特許文献3)。
なお、本明細書において、2つのアミノ酸配列の「相同性」とは、両アミノ酸配列をアラインメントした際に各対応箇所に同一又は類似のアミノ酸残基が現れる比率であり、2つのアミノ酸配列の「同一性」とは、両アミノ酸配列をアラインメントした際に各対応箇所に同一のアミノ酸残基が現れる比率である。なお、2つのアミノ酸配列の「相同性」及び「同一性」は、例えばBLAST(Basic Local Alignment Search Tool)プログラム(Altschul et al., J. Mol. Biol., (1990), 215(3):403-10)等を用いて求めることが可能である。
配列相同性又は同一性により特定された配列を有するCasΦタンパク質は、さらに所望される切断活性により特定される。このような切断活性としては、インビトロ又はインビボにおける、16ヌクレオチド長以上のターゲット配列及び当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列の切断活性により特定されうる。CasΦタンパク質の切断活性については、in vitroにおいて公知の方法に従い評価することができる。CasΦ2の骨格と、CasΦ3の骨格との間でRMSD値は、PDB_ID:7odf(CasΦ3)、7lys(CasΦ2)を用いた場合に、PyMOLソフトウェアalignにて計算すると1.135A未満、核酸をさらに含めると0.97であることから、CasΦ2と、CasΦ3との間の構造はかなり類似している。加えて、および、独自ソフトウェアにてTM-score=0.85以上であったことからも、構造が類似していることが支持される。したがって、変異体については、配列同一性又は相同性で特定に加えて、又は代えてRMSD値により特定することができる。CasΦ1、CasΦ2、CasΦ3、vCasΦからなる群から選ばれる、少なくとも1のCasタンパク質の骨格と、変異体の骨格との間のCα平均二乗偏差(RMSD)が2.5A未満、好ましくは1.5A未満、さらに好ましくは1A未満である場合に、元のCasタンパク質が奏する作用と同等の作用を生じる蓋然性が高いといえる。あるいは、TM-score値により特定することができる。CasΦ1、CasΦ2、CasΦ3、vCasΦからなる群から選ばれる、少なくとも1のCasタンパク質の骨格と、変異体の骨格との間のTM-scoreが0.8以上、好ましくは0.85以上、さらに好ましくは0.9以上である場合に、元のCasタンパク質が奏する作用と同等の作用を生じる蓋然性が高いといえる。
CasΦタンパク質には、所望される活性が損なわれない限りにおいて、シグナル配列、タグ配列、レポーター配列などの追加の配列が含まれてもよい。発現されたタンパク質が、核内で作用することを担保する観点から、シグナル配列としては、核移行シグナルが付加されていることが望ましい。核移行シグナルは、1つ又は複数の核移行シグナルを直列に配置してもよい。核移行シグナルとしては、植物種に応じて適宜選択することができ、一例として、KRPAATKKAGQAKKKK(配列番号7)、及び/又はGSDYKDHDGDYKDHDIDYKDDDDKPKKKRKV(配列番号8)を使用することができる。これにより細胞内で発現されたCasΦタンパク質は、核内に移行し、核内にてcrRNAと協働してターゲット配列を切断することができる。
crRNA又は発現用カセットとしては、通常、プロモーター配列を含み、その制御下に、crRNAをコードする配列を配置することで作成することができる。crRNA発現用カセットは、1のポリヌクレオチド上に含まれてもよいし、異なるポリヌクレオチド上に含まれてもよい。crRNAとして、crRNAと複数連結して一本鎖としたガイドRNAをコードする配列をプロモーター配列の制御下に配置することで、crRNA発現用カセットとしてもよい。
CasΦタンパク質についても、定法に従い、一過的又は恒常的に細胞内で発現させることができる。一例として、CasΦタンパク質をコードする配列のポリヌクレオチドを、一過的又は恒常的に発現を許容するプロモーター配列を含む発現カセット中に、プロモーターの制御下に配置してCasΦ発現用カセットを調製することができる。プロモーターの制御下に配置するとは、プロモーターにより発現が制御されるように配置されることを言い、プロモーターの3’末端から、適切な塩基数、例えば10bp~200bpの塩基数を空けて配置されてもよい。
crRNA発現用カセットとCasΦ発現用カセットは、1のポリヌクレオチド上に含まれてもよいし、異なるポリヌクレオチド上に含まれてもよい。これらの発現用カセットは、必要に応じて他の要素を含んでもよい。このような要素としては、ターミネーターなど発現に必要な要素や、マルチクローニングサイト、薬剤耐性遺伝子、レポーター遺伝子、複製起点など、プラスミド又はベクターの調製に必要な要素が含まれていてもよい。
crRNA発現用カセット及びCasΦ発現用カセットにおいて使用されるプロモーターとしては、発現させる生物種に応じて適宜選択することができる。植物において発現さ
せる場合、一例として、polII系プロモーターを使用することもできるが、比較的短いRNAの転写をより正確に行わせるという観点から、polIII系プロモーターが好ましい。polII系プロモーターとしては、例えばCaMV35Sプロモーター、RPS5Aプロモーター、UBQプロモーター、DD45プロモーター、NOSプロモーター等が挙げられる。polIII系プロモーターとしては、U6-snRNA(例えばU6.1-snRNA、U6.26-snRNA等)プロモーター、U3-snRNAプロモーター等が挙げられる。
せる場合、一例として、polII系プロモーターを使用することもできるが、比較的短いRNAの転写をより正確に行わせるという観点から、polIII系プロモーターが好ましい。polII系プロモーターとしては、例えばCaMV35Sプロモーター、RPS5Aプロモーター、UBQプロモーター、DD45プロモーター、NOSプロモーター等が挙げられる。polIII系プロモーターとしては、U6-snRNA(例えばU6.1-snRNA、U6.26-snRNA等)プロモーター、U3-snRNAプロモーター等が挙げられる。
crRNA発現用カセット及びCasΦ発現用カセットにおいて使用されるターミネーターとしては、Casタンパク質コード配列からの転写を終結させ(好ましくは、さらにCasタンパク質コード配列から転写されるmRNAにpolyA配列を付加でき)ることができる塩基配列である限り特に制限されない。またガイドRNAについては、polyT配列を付加することもできる。終結シグナルとしては、例えば、ヒートショックタンパク質終結シグナル(HspT:Heat shock protein Terminator)、NosT(Noparin synhase Terminator)、35sT(CaMV 35S Terminator)、Pea3A(Pea Rubisco subunit 3A)等が挙げられる。
別の態様では、本発明はゲノム編集対象となる重複遺伝子群におけるターゲット配列を決定する工程を含む、crRNA発現用カセットの製造方法に関してもよい。重複遺伝子群におけるターゲット配列は、ゲノム情報から、ゲノム編集対象となる重複遺伝子群において、CasΦのPAM配列近傍に16ヌクレオチド長の連続配列が、ミスマッチを含まないように選択されてもよいし、1又は2個のミスマッチを許容するように選択されてもよい。別の態様では、重複遺伝子群におけるターゲット配列は、ゲノム情報から、ゲノム編集対象となる重複遺伝子群において、CasΦのPAM配列近傍に17ヌクレオチド長の連続配列が、ミスマッチを含まない配列と、1又は2個のミスマッチを含むミスマッチ配列とから構成されるように選択される。決定されたターゲット配列をスペーサー配列とし、その余の配列と連結することで、crRNA配列を設計することができる。こうして設計されたcrRNA配列からなるポリヌクレオチドを、公知の遺伝子工学的手法に従って容易に作成することができる。こうして作製されたcrRNA配列又はガイドRNA配列からなるポリヌクレオチドを、公知の遺伝子工学的手法、例えばPCR、制限酵素処理、DNA連結、in vitro転写技術などを利用して、crRNA発現用カセットに組み込むことができる。
本発明の別の態様では、細胞の重複遺伝子のゲノム編集用キットに関していてもよい。かかるキットにおいて、ゲノム編集される重複遺伝子は、16ヌクレオチド長のターゲット配列のみを有するか、或いは16又は17ヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有することを特徴とする。かかるキットは以下の:
(a)前記ターゲット配列及び前記ミスマッチ配列を標的とするスペーサー配列を導入可能なcrRNAの発現カセット;及び、
(b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質の発現カセット;
を含む。crRNAの発現カセットとCasΦタンパク質の発現カセットは、一例としてプラスミドやベクターなどに組み込み、細胞へと遺伝子導入される。本発明に係るゲノム編集用キットには、さらに、必要に応じて核酸導入試薬、緩衝液等、本発明のゲノム編集方法の実施に必要な他の材料、試薬、器具等を適宜含んでいてもよい。本発明のゲノム編集方法の実施に必要な他の材料としては、crRNAの発現カセット及び/又はCasΦタンパク質の発現カセットに加えて、ドナーポリヌクレオチドが挙げられる。ドナーポリヌクレオチドを核内へと導入することにより、CRISPR/Casシステムにより生じた切断箇所に、ドナーポリヌクレオチドのノックインが可能となる。
(a)前記ターゲット配列及び前記ミスマッチ配列を標的とするスペーサー配列を導入可能なcrRNAの発現カセット;及び、
(b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質の発現カセット;
を含む。crRNAの発現カセットとCasΦタンパク質の発現カセットは、一例としてプラスミドやベクターなどに組み込み、細胞へと遺伝子導入される。本発明に係るゲノム編集用キットには、さらに、必要に応じて核酸導入試薬、緩衝液等、本発明のゲノム編集方法の実施に必要な他の材料、試薬、器具等を適宜含んでいてもよい。本発明のゲノム編集方法の実施に必要な他の材料としては、crRNAの発現カセット及び/又はCasΦタンパク質の発現カセットに加えて、ドナーポリヌクレオチドが挙げられる。ドナーポリヌクレオチドを核内へと導入することにより、CRISPR/Casシステムにより生じた切断箇所に、ドナーポリヌクレオチドのノックインが可能となる。
本発明の別の態様では、以下の:
(a)crRNA発現用カセットの製造方法により製造されたcrRNA発現用カセットを細胞に導入する工程、及び
(b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質の発現カセットを切断可能なCasΦタンパク質をコードする、CasΦ発現用カセットを細胞に導入する工程
を含む、細胞の重複遺伝子のゲノム編集方法に関してもよい。crRNA発現用カセット及びCasΦ発現用カセットは、2つのポリヌクレオチド上で別個に又は同時に導入されてもよいし、1のポリヌクレオチド上で同時に導入されてもよい。crRNAの発現カセット及び/又はCasΦタンパク質の発現カセットの細胞への導入に加えて、ドナーポリヌクレオチドを導入することが挙げられる。ドナーポリヌクレオチドを核内へと導入することにより、CRISPR/Casシステムにより生じた切断箇所に、ドナーポリヌクレオチドのノックインが可能となる。
(a)crRNA発現用カセットの製造方法により製造されたcrRNA発現用カセットを細胞に導入する工程、及び
(b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質の発現カセットを切断可能なCasΦタンパク質をコードする、CasΦ発現用カセットを細胞に導入する工程
を含む、細胞の重複遺伝子のゲノム編集方法に関してもよい。crRNA発現用カセット及びCasΦ発現用カセットは、2つのポリヌクレオチド上で別個に又は同時に導入されてもよいし、1のポリヌクレオチド上で同時に導入されてもよい。crRNAの発現カセット及び/又はCasΦタンパク質の発現カセットの細胞への導入に加えて、ドナーポリヌクレオチドを導入することが挙げられる。ドナーポリヌクレオチドを核内へと導入することにより、CRISPR/Casシステムにより生じた切断箇所に、ドナーポリヌクレオチドのノックインが可能となる。
遺伝子導入は、本技術分野に公知の手法を用いて行うことができる。導入方法は、特に制限されず、導入する物の種類や導入対象に応じて、適宜選択することができる。導入方法としては、直接法とウイルスベクターを用いた方法とに大別される。直接法としては、植物細胞の細胞壁を取り除いたプロトプラストの貪食作用を利用するPEG法やエレクトロポレーション法、金粒子とともに打ち込むパーティクル・ガン法、ウイスカー法などが利用されうる。ウイルスベクターを用いた方法としては、宿主の植物種に応じて、アグロバクテリウム、タバコモザイクウイルス(TMV)、プラムポックスウイルス(PPV)、ジャガイモXウイルス(PVX)、アルファルファモザイクウイルス(AIMV)、キュウリモザイクウイルス(CMV)、カウピーモザイク ウイルス(CPMV)、ズッキーニイエローモザイクウイルス(ZYMV)、ジェミニウイルスなどをベクターとして使用することができる。これらの中でも、簡便性や安全性等の観点から、好ましくはアグロバクテリウム法が挙げられる。また、上記のベクターのように、植物体又は植物細胞への導入に適したベクター以外にも、このようなベクターに本発明のポリヌクレオチドを移し替えるためのベクター(例えば、ゲートウェイ(登録商標)のエントリークローンベクター等)も一例として挙げることができる。
導入される細胞は、インビトロで培養された細胞であってもよいし、植物体を構成する細胞であってもよい。植物体における導入部位としては、例えば花(特に、花の中の、卵細胞、花粉等)、葉、根、種子、胚等が挙げられる。ゲノム編集による変異を次世代に伝えるべく、生殖細胞においてより効率的にゲノム編集を行うという観点から、導入対象としては、好ましくは茎頂が挙げられる。また、好ましくは、遺伝子導入した細胞から再分化を行ってゲノム編集個体を得る方法、もしくは、体細胞から茎頂を誘導する遺伝子を活用してゲノム編集個体を得る方法を用いてもよい。
本明細書において言及される全ての文献はその全体が引用により本明細書に取り込まれる。
以下、本発明を実施例に則して更に詳細に説明するが、これらの実施例はあくまでも説明のために便宜的に示す例に過ぎず、本発明は如何なる意味でもこれらの実施例に限定されるものではない。
実施例1:ヒュージファージ(Huge phage)由来CasΦ2、vCasΦのベクターの調製
(1)ヒュージファージ由来CasΦ2遺伝子の調製
ヒュージファージ由来のアミノ酸配列情報(配列番号1)を基に、シロイヌナズナにコドン最適化されたCasタンパク質をコードするDNA配列に、C末端核移行シグナル配列-FLAGタグをコードするDNA配列を付加したものを人工合成した(配列番号9)。塩基配列の決定にはサンガー法あるいは次世代シーケンス法を用いた。配列番号1のアミノ酸配列はNCBI(国立バイオテクノロジー情報センター)のGenBankなどのよく知られたデータベースにおいて見出すことができる。
(1)ヒュージファージ由来CasΦ2遺伝子の調製
ヒュージファージ由来のアミノ酸配列情報(配列番号1)を基に、シロイヌナズナにコドン最適化されたCasタンパク質をコードするDNA配列に、C末端核移行シグナル配列-FLAGタグをコードするDNA配列を付加したものを人工合成した(配列番号9)。塩基配列の決定にはサンガー法あるいは次世代シーケンス法を用いた。配列番号1のアミノ酸配列はNCBI(国立バイオテクノロジー情報センター)のGenBankなどのよく知られたデータベースにおいて見出すことができる。
(2)植物における一過的CasΦ2発現用ベクターの構築
核移行シグナル-FLAGタグを付与したシロイヌナズナコドン最適化CasΦ遺伝子(配列番号9)をpEX_35S_vector(ユーロフィンジェノミクス株式会社にて遺伝子合成:図2A)に組み込んだ。配列番号9の合成遺伝子断片と、NcoIとHindIIIで切断したリニア化pEX_35S_vectorを混合し、NEBuilder HiFi DNA Assembly Master Mixにより、DNA断片を環状プラスミド化した。得られた環状プラスミドで大腸菌DH5aを形質転換し、50μg/mLアンピシリンを含むLB寒天プレート上で培養することにより形質転換体を選択した。数個のコロニーをピックアップし、目的の環状プラスミドを有するクローンを選択し、プラスミドを精製した。作製されたベクターのCasΦコード配列の塩基配列(配列番号10)、アミノ酸配列(配列番号5)をそれぞれ示す。次に、そのベクターについて、BsaIとNruIで切断し、線状DNAを得た。同時に、以下の配列:
を有するオリゴヌクレオチドをアニーリングした2本鎖DNAを準備した。切断したベクターとアニーリングした2本鎖DNAを一種類ずつT4 DNA ligaseを用いて環状プラスミド化した。上記の手順で環状プラスミドを精製した。本ベクターはpEX_35S-CasΦ2_HPTと表記する(図2B)。
核移行シグナル-FLAGタグを付与したシロイヌナズナコドン最適化CasΦ遺伝子(配列番号9)をpEX_35S_vector(ユーロフィンジェノミクス株式会社にて遺伝子合成:図2A)に組み込んだ。配列番号9の合成遺伝子断片と、NcoIとHindIIIで切断したリニア化pEX_35S_vectorを混合し、NEBuilder HiFi DNA Assembly Master Mixにより、DNA断片を環状プラスミド化した。得られた環状プラスミドで大腸菌DH5aを形質転換し、50μg/mLアンピシリンを含むLB寒天プレート上で培養することにより形質転換体を選択した。数個のコロニーをピックアップし、目的の環状プラスミドを有するクローンを選択し、プラスミドを精製した。作製されたベクターのCasΦコード配列の塩基配列(配列番号10)、アミノ酸配列(配列番号5)をそれぞれ示す。次に、そのベクターについて、BsaIとNruIで切断し、線状DNAを得た。同時に、以下の配列:
(3)植物における一過的vCasΦ発現用ベクターの構築
核移行シグナル-FLAGタグを付与したシロイヌナズナコドン最適化CasΦ遺伝子(配列番号9)をPCRにて分割した。
以下の配列:
それぞれのプライマーセットをもちいて、配列番号9の合成遺伝子断片を鋳型としてPCR反応により増幅した。PCR反応により増幅できた2本のリニアDNAと、NcoIとHindIIIで切断したリニア化pEX_Cas9ベクターを混合し、NEBuilder HiFi DNA Assembly Master Mixにより、DNA断片を環状プラスミド化した。得られた環状プラスミドで大腸菌DH5aを形質転換し、50μg/mLアンピシリンを含むLB寒天プレート上で培養することにより形質転換体を選択した。数個のコロニーをピックアップし、目的の環状プラスミドを有するクローンを選択し、プラスミドを精製した。作製されたベクターのvCasΦコード配列の塩基配列(配列番号11)、アミノ酸配列(配列番号6)をそれぞれ示す。本ベクターはpEX_35S-vCasΦ_HPTと表記する。
核移行シグナル-FLAGタグを付与したシロイヌナズナコドン最適化CasΦ遺伝子(配列番号9)をPCRにて分割した。
以下の配列:
(4)植物個体用CasΦ2,vCasΦベクターの構築
pCAMBIA105.1R(コスモバイオ)をPmlIとAseIで切断して線状バイナリーベクターを取得した。同時に、pEX_35S-CasΦ2_HPT、pEX_35S-vCasΦ_HPTそれぞれをPaqCIで切断して線状DNAを取得した。それぞれのDNAを線状バイナリーベクターと混合し、NEBuilder HiFi DNA Assembly Master Mixにより、DNA断片を環状プラスミド化した。得られた環状プラスミドで大腸菌DH5aを形質転換し、50μg/mLアンピシリンを含むLB寒天プレート上で培養することにより形質転換体を選択した。数個のコロニーをピックアップし、目的の環状プラスミドを有するクローンを選択し、プラスミドを精製した。本ベクターはpCA_35S-CasΦ2_HPT、pCA_35S-vCasΦ_HPTと表記する。
pCAMBIA105.1R(コスモバイオ)をPmlIとAseIで切断して線状バイナリーベクターを取得した。同時に、pEX_35S-CasΦ2_HPT、pEX_35S-vCasΦ_HPTそれぞれをPaqCIで切断して線状DNAを取得した。それぞれのDNAを線状バイナリーベクターと混合し、NEBuilder HiFi DNA Assembly Master Mixにより、DNA断片を環状プラスミド化した。得られた環状プラスミドで大腸菌DH5aを形質転換し、50μg/mLアンピシリンを含むLB寒天プレート上で培養することにより形質転換体を選択した。数個のコロニーをピックアップし、目的の環状プラスミドを有するクローンを選択し、プラスミドを精製した。本ベクターはpCA_35S-CasΦ2_HPT、pCA_35S-vCasΦ_HPTと表記する。
実施例2:シロイヌナズナプロトプラスト細胞におけるCasΦ2、vCasΦによる変異導入
(1)シロイヌナズナ遺伝子のゲノム編集実験用のプラスミドの調整
pEX_35S-CasΦ2_HPTベクターもしくはpEX_35S-vCasΦ_HPTベクターをBsaI-HFで切断した。まずは、これらのベクターによりゲノム編集が可能かを調べるために、シロイヌナズナ由来PDS3遺伝子(シロイヌナズナゲノム中にシングルコピーの遺伝子)のゲノム編集実験用のCasΦのcrRNAのスペーサー配列をクローニングするために、以下の表3に記載の配列:
を有するオリゴヌクレオチドをそれぞれのSetごとにアニーリングした2本鎖DNAを合計3種類準備した。PDS3遺伝子は、カロテノイド生合成酵素である フィトエン不飽和化酵素(phytoene desaturase)3遺伝子であり、ノックアウトされると植物細胞が白化することが知られている。これにより、植物体でノックアウトされている箇所の特定が可能になる。切断したベクターとアニーリングした2本鎖DNAを一種類ずつT4 DNA ligaseを用いて環状プラスミド化した。得られた環状プラスミドで大腸菌DH5aを形質転換し、50μg/mLアンピシリンを含むLB寒天プレート上で培養することにより形質転換体を選択した。数個のコロニーをピックアップし、目的の環状プラスミドを有するクローンを選択し、プラスミドを精製した。
(1)シロイヌナズナ遺伝子のゲノム編集実験用のプラスミドの調整
pEX_35S-CasΦ2_HPTベクターもしくはpEX_35S-vCasΦ_HPTベクターをBsaI-HFで切断した。まずは、これらのベクターによりゲノム編集が可能かを調べるために、シロイヌナズナ由来PDS3遺伝子(シロイヌナズナゲノム中にシングルコピーの遺伝子)のゲノム編集実験用のCasΦのcrRNAのスペーサー配列をクローニングするために、以下の表3に記載の配列:
(2)シロイヌナズナプロトプラストの調製
約20~30日間生育させたシロイヌナズナの葉を、セロハンテープにより表皮を剥ぎとり葉肉細胞を露出させた後、その葉を適量の1.0%セルラーゼ-オノズカR10(ヤクルト社製)、0.25%マセロザイム R-10(ヤクルト社製)、10mMメルカプトエタノール、400mMマンニトール、20mM KCl、10mM CaCl2、20mM MES(pH5.7)溶液に浸し、22℃、50rpmで振とうしながら、1時間インキュベートし、プロトプラストを遊離させた。プロトプラストは孔径70μmのナイロンフィルターで濾した後、50ml容チューブに集め、100×g、10分間遠心しプロトプラストを回収した後、上清を捨て、150mM NaCl、125mM CaCl2、5mM KCl、2mM MES(pH5.7)緩衝液(W5緩衝液)で再懸濁した。再懸濁したプロトプラストは18%スクロース溶液に重層し、400xg、5分遠心して、健全な細胞のみを濃縮した。濃縮した細胞は、W5緩衝液で再度懸濁した。W5緩衝液による洗浄を2度繰り返した後、4℃で10分間インキュベートした。インキュベート後のプロトプラストは、100×g、5分間遠心後、400mMマンニトール、15mM MgCl2、4mM MES(pH5.7)緩衝液で再懸濁した。その後、100×g、5分間遠心することでプロトプラストを回収した後、2.0~3.0×105cells/mlになるよう同緩衝液で細胞濃度を調製し、形質転換用プロトプラスト懸濁液を得た。
約20~30日間生育させたシロイヌナズナの葉を、セロハンテープにより表皮を剥ぎとり葉肉細胞を露出させた後、その葉を適量の1.0%セルラーゼ-オノズカR10(ヤクルト社製)、0.25%マセロザイム R-10(ヤクルト社製)、10mMメルカプトエタノール、400mMマンニトール、20mM KCl、10mM CaCl2、20mM MES(pH5.7)溶液に浸し、22℃、50rpmで振とうしながら、1時間インキュベートし、プロトプラストを遊離させた。プロトプラストは孔径70μmのナイロンフィルターで濾した後、50ml容チューブに集め、100×g、10分間遠心しプロトプラストを回収した後、上清を捨て、150mM NaCl、125mM CaCl2、5mM KCl、2mM MES(pH5.7)緩衝液(W5緩衝液)で再懸濁した。再懸濁したプロトプラストは18%スクロース溶液に重層し、400xg、5分遠心して、健全な細胞のみを濃縮した。濃縮した細胞は、W5緩衝液で再度懸濁した。W5緩衝液による洗浄を2度繰り返した後、4℃で10分間インキュベートした。インキュベート後のプロトプラストは、100×g、5分間遠心後、400mMマンニトール、15mM MgCl2、4mM MES(pH5.7)緩衝液で再懸濁した。その後、100×g、5分間遠心することでプロトプラストを回収した後、2.0~3.0×105cells/mlになるよう同緩衝液で細胞濃度を調製し、形質転換用プロトプラスト懸濁液を得た。
(3)シロイヌナズナプロトプラストへのプラスミドDNA導入
得られた形質転換用プロトプラスト懸濁液35μLと10uMのプラスミド溶液10μLを混合後、40%(w/v)PEG4000、200mMマンニトール、100mMCaCl2溶液を45μLずつ、それぞれ96穴プレート(ヌンク社製、丸底)に入れ、900rpm、15秒間振とうし、溶液を混合した。混合液は10分間室温で静置した。静置後の混合液にW5緩衝液を200μL勢いよく加えることでプロトプラストを懸濁させた後、100×g、5分間遠心し、プロトプラスト細胞をプレート底に集め、上清を200μL捨てることで、プロトプラスト懸濁液を洗浄した。この作業を計4回行った後、各ウェルをパラフィルムでシールし、22℃で36時間静置した。
得られた形質転換用プロトプラスト懸濁液35μLと10uMのプラスミド溶液10μLを混合後、40%(w/v)PEG4000、200mMマンニトール、100mMCaCl2溶液を45μLずつ、それぞれ96穴プレート(ヌンク社製、丸底)に入れ、900rpm、15秒間振とうし、溶液を混合した。混合液は10分間室温で静置した。静置後の混合液にW5緩衝液を200μL勢いよく加えることでプロトプラストを懸濁させた後、100×g、5分間遠心し、プロトプラスト細胞をプレート底に集め、上清を200μL捨てることで、プロトプラスト懸濁液を洗浄した。この作業を計4回行った後、各ウェルをパラフィルムでシールし、22℃で36時間静置した。
(4)ゲノムDNAのAmplicon-seq解析
プラスミドDNAを導入後22℃で36時間静置したプロトプラスト懸濁液を200μL容チューブに回収し、ゲノム抽出バッファー(200mM Tris-HCl、pH7.5、250mM NaCl、25mM EDTA、0.5%SDS)と混合後、95℃で10分間インキュベートした後、氷上で5分間静置した。熱処理後のプロトプラスト懸濁液からイソプロパノール沈殿によりゲノムDNAを回収した。回収したゲノムDNAは滅菌水で懸濁し、以下の表4に記載の配列のプライマーセットを使用して増幅した約300bpのDNA断片を、iSeq100システム(Illmina社)によりAmplicon-seqを行い、ゲノム編集を検出した。vCasΦを導入した場合の、標的配列長をそれぞれ15、16、18と変化させた場合の編集の編集効率を、CRISPResso2ソフトで分析した結果を図3に示す。Controlは、蛍光タンパク質GFP発現ベクターの導入区を対照として用いた。さらにvCasΦのさらなる対照として、SpyCas9を標的配列長18に対して用いた場合の編集効率を調べた。図3のvCasΦを用いた場合、標的配列長が16及び18である場合に、遺伝子編集が可能であった一方で、標的配列長が15になると、ゲノム編集が生じなかった。SpyCas9を用いた場合のゲノム編集効率は0.02程度であったが、vCasΦを用いた場合は最大で0.09程度であった。
プラスミドDNAを導入後22℃で36時間静置したプロトプラスト懸濁液を200μL容チューブに回収し、ゲノム抽出バッファー(200mM Tris-HCl、pH7.5、250mM NaCl、25mM EDTA、0.5%SDS)と混合後、95℃で10分間インキュベートした後、氷上で5分間静置した。熱処理後のプロトプラスト懸濁液からイソプロパノール沈殿によりゲノムDNAを回収した。回収したゲノムDNAは滅菌水で懸濁し、以下の表4に記載の配列のプライマーセットを使用して増幅した約300bpのDNA断片を、iSeq100システム(Illmina社)によりAmplicon-seqを行い、ゲノム編集を検出した。vCasΦを導入した場合の、標的配列長をそれぞれ15、16、18と変化させた場合の編集の編集効率を、CRISPResso2ソフトで分析した結果を図3に示す。Controlは、蛍光タンパク質GFP発現ベクターの導入区を対照として用いた。さらにvCasΦのさらなる対照として、SpyCas9を標的配列長18に対して用いた場合の編集効率を調べた。図3のvCasΦを用いた場合、標的配列長が16及び18である場合に、遺伝子編集が可能であった一方で、標的配列長が15になると、ゲノム編集が生じなかった。SpyCas9を用いた場合のゲノム編集効率は0.02程度であったが、vCasΦを用いた場合は最大で0.09程度であった。
実施例3: タバコ葉細胞におけるvCasΦによる変異導入
(1)タバコ遺伝子のゲノム編集実験用のプラスミドの調整
pEX_35S-vCasΦ_HPTベクターをBsaI-HFで切断した。タバコ由来PDS、RDR6、SGS3遺伝子のゲノム編集実験用のCasΦのcrRNAを形成するためのスペーサー配列をクローニングするために、以下の表5に記載の配列を有するオリゴヌクレオチドをそれぞれのSetごとにアニーリングした2本鎖DNAを合計21種類準備した:
PDS遺伝子は、カロテノイド生合成酵素であるフィトエン不飽和化酵素(phytoene desaturase)遺伝子であり、ノックアウトされると植物細胞が白化することが知られている。これにより、植物体でノックアウトされている箇所の特定が可能になる。タバコにおいて、PDS遺伝子の重複遺伝子が2個存在することが知られている。RDR6遺伝子は、RNA依存性RNAポリメラーゼ6であり、外来RNAと正常なmRNAとの識別に関与しており、ノックアウトされることで、ウイルスへの抵抗性が減じるという作用が生じることが知られている。タバコにおいて、RDR6遺伝子の重複遺伝子が2個存在することが知られている。SGS3遺伝子は、遺伝子サイレンシングサプレッサー3であり、RDR6と協働し、ウイルスに対する防御機能として機能する。SGS3遺伝子は、ノックアウトされると、ウイルスへの抵抗性が減じるという作用が生じることが知られている。タバコにおいて、SGS3遺伝子の重複遺伝子が2個存在することが知られている。切断したベクターとアニーリングした2本鎖DNAを一種類ずつT4 DNA ligaseを用いて環状プラスミド化した。得られた環状プラスミドで大腸菌DH5aを形質転換し、50μg/mLスペクチノマイシンを含むLB寒天プレート上で培養することにより形質転換体を選択した。数個のコロニーをピックアップし、目的の環状プラスミドを有するクローンを選択し、プラスミドを精製した。精製したプラスミドを、アグロバクテリウムGV3101株にエレクトロポレーション法で導入し、50μg/mLスペクチノマイシン、50μg/mLゲンダマイシン、50μg/mLリファンピシリンを含むLB寒天プレート上で培養することにより形質転換体を選抜した。
(1)タバコ遺伝子のゲノム編集実験用のプラスミドの調整
pEX_35S-vCasΦ_HPTベクターをBsaI-HFで切断した。タバコ由来PDS、RDR6、SGS3遺伝子のゲノム編集実験用のCasΦのcrRNAを形成するためのスペーサー配列をクローニングするために、以下の表5に記載の配列を有するオリゴヌクレオチドをそれぞれのSetごとにアニーリングした2本鎖DNAを合計21種類準備した:
(2)タバコの葉へのアグロインフィルトレーション実験
目的の環状プラスミドを有するアグロバクテリウムGV3101株(非特許文献6:Plant Biotechnology 33, 235-243 (2016)のMaterials and Methods 参照)のコロニーを、50μg/mLスペクチノマイシン、50μg/mLゲンダマイシン、50μg/mLリファンピシリンを含む液体LB培地に植菌し、28℃、2日間振盪培養した。導入後に赤色色素を発現するpDEST_35S_RUBY_HSP(Ab28) コンストラクトを有するGV3101株を培養した。pDEST_35S_RUBY_HSP(Ab28) コンストラクトを用いることで、アグロインフィルトレーションがされた植物体の領域が赤色に着色する。
培養した菌液を3000rpm、20min遠心して集菌し、インフィルトレーションバッファー(組成:10mM MgCl2、10mM MES、100μMアセトシリンゴン、pH5.7)5ml程度に懸濁し、OD600=1程度に調整した。目的ゲノム編集ベクターを含有するアグロバクテリア溶液2ml、Ab28含有アグロバクテリア溶液0.5ml、インフィルトレーションバッファー2mlを混合し、アグロインフィルトレーション溶液とした。
目的の環状プラスミドを有するアグロバクテリウムGV3101株(非特許文献6:Plant Biotechnology 33, 235-243 (2016)のMaterials and Methods 参照)のコロニーを、50μg/mLスペクチノマイシン、50μg/mLゲンダマイシン、50μg/mLリファンピシリンを含む液体LB培地に植菌し、28℃、2日間振盪培養した。導入後に赤色色素を発現するpDEST_35S_RUBY_HSP(Ab28) コンストラクトを有するGV3101株を培養した。pDEST_35S_RUBY_HSP(Ab28) コンストラクトを用いることで、アグロインフィルトレーションがされた植物体の領域が赤色に着色する。
培養した菌液を3000rpm、20min遠心して集菌し、インフィルトレーションバッファー(組成:10mM MgCl2、10mM MES、100μMアセトシリンゴン、pH5.7)5ml程度に懸濁し、OD600=1程度に調整した。目的ゲノム編集ベクターを含有するアグロバクテリア溶液2ml、Ab28含有アグロバクテリア溶液0.5ml、インフィルトレーションバッファー2mlを混合し、アグロインフィルトレーション溶液とした。
27℃、長日条件で生育させた播種後3週間目のタバコ植物体を用意し、1mlシリンジで、アグロインフィルトレーション溶液を吸い取り、葉の裏側に打ち込み、3日間ほど27℃、長日条件でインキュベートし、目的のプラスミドを発現させた(結果の一部を図4に示す)。
(3)ゲノムDNAのAmplicon-seq解析
赤色色素が発現した領域から1cm角程度の切片を切り出して2ml容チューブに回収し、ゲノム抽出バッファー(200mM Tris-HCl、pH7.5、250mM NaCl、25mM EDTA、0.5%SDS)と混合して組織片を破砕したのち、95℃で5分間インキュベートした後、イソプロパノール沈殿によりゲノムDNAを回収した。回収したゲノムDNAは滅菌水で懸濁し、以下の表6に記載の配列のプライマーセットを使用して増幅した約300bpのDNA断片を、iSeq100システム(Illmina社)によりAmplicon-seqを行い、ゲノム編集を検出した。
CRISPResso2ソフトで分析した結果を図4に示す。それぞれの結果を、各標的毎にまとめたのが以下の表7である。
赤色色素が発現した領域から1cm角程度の切片を切り出して2ml容チューブに回収し、ゲノム抽出バッファー(200mM Tris-HCl、pH7.5、250mM NaCl、25mM EDTA、0.5%SDS)と混合して組織片を破砕したのち、95℃で5分間インキュベートした後、イソプロパノール沈殿によりゲノムDNAを回収した。回収したゲノムDNAは滅菌水で懸濁し、以下の表6に記載の配列のプライマーセットを使用して増幅した約300bpのDNA断片を、iSeq100システム(Illmina社)によりAmplicon-seqを行い、ゲノム編集を検出した。
各標的遺伝子について、標的長16又は17のいずれでも編集がされており、またミスマッチを含んだ配列でも編集が生じることが示された。
Claims (14)
- 細胞の重複遺伝子のゲノム編集方法であって、前記重複遺伝子が、ゲノム編集の対象となる16ヌクレオチド長のターゲット配列のみを有するか、或いはゲノム編集の対象となる16又は17ヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有し;ここで前記方法が、
(a)前記ターゲット配列及びミスマッチ配列を標的とするスペーサー配列を含むcrRNA;及び、
(b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質;
を、前記細胞内で発現させる工程を含む、重複遺伝子のゲノム編集方法。 - 前記CasΦタンパク質が、CasΦ1、CasΦ2、vCasΦ及びCasΦ3からなる群から選ばれる少なくとも1のタンパク質である、請求項1に記載のゲノム編集方法。
- 前記CasΦタンパク質が、配列番号1、2、3及び4からなる群から選ばれるアミノ酸配列に対し、少なくとも80%の配列相同性を有するアミノ酸配列を含む、請求項1に記載のゲノム編集方法。
- 前記重複遺伝子が、機能冗長性を有する重複配列である、請求項1に記載のゲノム編集方法。
- 前記重複遺伝子が、ターゲット配列の近傍にPAM配列を含む、請求項1に記載のゲノム編集方法。
- 前記スペーサー配列が、前記ターゲット配列と完全一致するように決定される、請求項1に記載のゲノム編集方法。
- 前記重複遺伝子が、16以上のヌクレオチド長のターゲット配列のみを有するか、或いは16以上のヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有する、請求項1に記載のゲノム編集方法。
- 前記重複遺伝子が、17以上のヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有する、請求項1に記載のゲノム編集方法。
- 前記重複遺伝子が、前記細胞のゲノム中に2~100コピー存在する、請求項1に記載のゲノム編集方法。
- 前記細胞のゲノム中に含まれる重複遺伝子のうち、一部又は全ての重複遺伝子を編集する、請求項9に記載のゲノム編集方法。
- 前記細胞が、植物細胞である、請求項1に記載のゲノム編集方法。
- 前記crRNA及び/又は前記CasΦタンパク質を、発現ベクターにより前記細胞内に導入して発現させる、請求項1に記載のゲノム編集方法。
- 前記発現ベクターが、一過性又は恒常性発現ベクターである、請求項12に記載のゲノム編集方法。
- 細胞の重複遺伝子のゲノム編集用キットであって、前記重複遺伝子が、ゲノム編集の対象となる16ヌクレオチド長のターゲット配列のみを有するか、或いは16又は17ヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有し、前記キットが;
(a)前記ターゲット配列及び前記ミスマッチ配列を標的とするスペーサー配列を導入可能なcrRNAの発現カセット;及び、
(b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質の発現カセット;
を含む、前記キット。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022-141724 | 2022-09-06 | ||
JP2022141724A JP2024037076A (ja) | 2022-09-06 | 2022-09-06 | 重複遺伝子のゲノム編集方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2024053677A1 true WO2024053677A1 (ja) | 2024-03-14 |
Family
ID=90191286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2023/032542 WO2024053677A1 (ja) | 2022-09-06 | 2023-09-06 | 重複遺伝子のゲノム編集方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2024037076A (ja) |
WO (1) | WO2024053677A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021216512A1 (en) * | 2020-04-20 | 2021-10-28 | The Regents Of The University Of California | Crispr systems in plants |
WO2021236651A1 (en) * | 2020-05-19 | 2021-11-25 | The Regents Of The University Of California | Compositions and methods of a nuclease chain reaction for nucleic acid detection |
-
2022
- 2022-09-06 JP JP2022141724A patent/JP2024037076A/ja active Pending
-
2023
- 2023-09-06 WO PCT/JP2023/032542 patent/WO2024053677A1/ja unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021216512A1 (en) * | 2020-04-20 | 2021-10-28 | The Regents Of The University Of California | Crispr systems in plants |
WO2021236651A1 (en) * | 2020-05-19 | 2021-11-25 | The Regents Of The University Of California | Compositions and methods of a nuclease chain reaction for nucleic acid detection |
Non-Patent Citations (4)
Title |
---|
CAI QINAN, GUO DONGMEI, CAO YUJUN, LI YUAN, MA RUI, LIU WENPING: "Application of CRISPR/CasΦ2 System for Genome Editing in Plants", INTERNATIONAL JOURNAL OF MOLECULAR SCIENCES, MOLECULAR DIVERSITY PRESERVATION INTERNATIONAL (MDPI), BASEL, CH, vol. 23, no. 10, 20 May 2022 (2022-05-20), Basel, CH , pages 5755, XP093147813, ISSN: 1422-0067, DOI: 10.3390/ijms23105755 * |
ISHIHARA, RYOSUKE ET AL.: "P-1711 Application of multiplex genome editing technology using RNA processing to plants", PROCEEDINGS OF THE 80TH ANNUAL MEETING OF THE BOTANICAL SOCIETY OF JAPAN, SEPTEMBER 16-19, 2016, BOTANICAL SOCIETY OF JAPAN, JP, 1 January 2016 (2016-01-01) - 19 September 2016 (2016-09-19), JP, pages 241, XP009553760 * |
PAUSCH PATRICK, AL-SHAYEB BASEM, BISOM-RAPP EZRA, TSUCHIDA CONNOR A., LI ZHENG, CRESS BRADY F., KNOTT GAVIN J., JACOBSEN STEVEN E.: "CRISPR-CasΦ from huge phages is a hypercompact genome editor", SCIENCE, AMERICAN ASSOCIATION FOR THE ADVANCEMENT OF SCIENCE, US, vol. 369, no. 6501, 17 July 2020 (2020-07-17), US , pages 333 - 337, XP055862891, ISSN: 0036-8075, DOI: 10.1126/science.abb1400 * |
PAUSCH PATRICK; SOCZEK KATARZYNA M.; HERBST DOMINIK A.; TSUCHIDA CONNOR A.; AL-SHAYEB BASEM; BANFIELD JILLIAN F.; NOGALES EVA; DOU: "DNA interference states of the hypercompact CRISPR–CasΦ effector", NATURE STRUCTURAL & MOLECULAR BIOLOGY, NATURE PUBLISHING GROUP US, NEW YORK, vol. 28, no. 8, 1 August 2021 (2021-08-01), New York , pages 652 - 661, XP037536569, ISSN: 1545-9993, DOI: 10.1038/s41594-021-00632-3 * |
Also Published As
Publication number | Publication date |
---|---|
JP2024037076A (ja) | 2024-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107164347B (zh) | 控制水稻茎秆粗度、分蘖数、穗粒数、千粒重和产量的理想株型基因npt1及其应用 | |
CN104846010B (zh) | 一种删除转基因水稻筛选标记基因的方法 | |
CN108130342A (zh) | 基于Cpf1的植物基因组定点编辑方法 | |
CN110891965A (zh) | 植物中使用的抗crispr蛋白的方法和组合物 | |
CN110283843B (zh) | 一种基于CRISPRCas9介导CsWRKY22定点编辑提高柑橘溃疡病抗性的方法 | |
US20210348179A1 (en) | Compositions and methods for regulating gene expression for targeted mutagenesis | |
JP7011327B2 (ja) | 植物ウイルスベクターを利用したゲノム編集植物の生産方法 | |
CN108034671B (zh) | 一种质粒载体及利用其建立植物群体的方法 | |
CN115315516B (zh) | 一种提高植物遗传转化和基因编辑效率的方法 | |
CN110892074A (zh) | 用于增加香蕉的保质期的组成物及方法 | |
CN111902541A (zh) | 增加细胞中感兴趣的核酸分子表达水平的方法 | |
JPWO2019103034A1 (ja) | ゲノム編集植物の生産方法 | |
WO2024053677A1 (ja) | 重複遺伝子のゲノム編集方法 | |
CN112126652A (zh) | 水稻OsAUX3基因在调控水稻种子粒长中的应用 | |
KR102551064B1 (ko) | 포도에서 분리된 신규 u6 프로모터 및 이의 용도 | |
JP7353602B1 (ja) | ゲノム編集方法およびゲノム編集用組成物 | |
CN113462661B (zh) | 从玉米中分离的siz1蛋白及其编码基因和在品种改良中的应用 | |
WO2024040874A1 (zh) | 突变的Cas12j蛋白及其应用 | |
CN107022566B (zh) | 一种表达载体及其在植物基因功能研究中的应用 | |
Tang et al. | Genome editing in rice and tomato with a small Un1Cas12f1 nuclease | |
KR101962902B1 (ko) | 칠리잎말림바이러스를 접종할 수 있는 감염성 클론 및 이의 용도 | |
KR101925466B1 (ko) | 토마토잎말림방글라데시바이러스 베타 위성 dna를 접종할 수 있는 감염성 클론 및 이의 용도 | |
JP2007529991A (ja) | ポリヌクレオチド配列改変体 | |
CN107709551A (zh) | 无t‑dna整合的农杆菌介导的基因组修饰 | |
CN117025661A (zh) | 大豆花粉致死基因表达盒及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 23863215 Country of ref document: EP Kind code of ref document: A1 |