JP2024039190A - ゲノム編集技術 - Google Patents
ゲノム編集技術 Download PDFInfo
- Publication number
- JP2024039190A JP2024039190A JP2022143554A JP2022143554A JP2024039190A JP 2024039190 A JP2024039190 A JP 2024039190A JP 2022143554 A JP2022143554 A JP 2022143554A JP 2022143554 A JP2022143554 A JP 2022143554A JP 2024039190 A JP2024039190 A JP 2024039190A
- Authority
- JP
- Japan
- Prior art keywords
- tale
- rvd
- recognizes
- protein
- gene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000010362 genome editing Methods 0.000 title description 11
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 179
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 77
- 108020004414 DNA Proteins 0.000 claims abstract description 62
- 150000001413 amino acids Chemical class 0.000 claims abstract description 58
- 230000027455 binding Effects 0.000 claims abstract description 15
- 239000003607 modifier Substances 0.000 claims abstract description 14
- 229910052739 hydrogen Inorganic materials 0.000 claims abstract description 10
- 210000004027 cell Anatomy 0.000 claims description 69
- 210000002706 plastid Anatomy 0.000 claims description 13
- 108010042407 Endonucleases Proteins 0.000 claims description 7
- 238000004519 manufacturing process Methods 0.000 claims description 7
- 108020005196 Mitochondrial DNA Proteins 0.000 claims description 4
- 102000052510 DNA-Binding Proteins Human genes 0.000 claims description 3
- 101710096438 DNA-binding protein Proteins 0.000 claims description 3
- 102100031780 Endonuclease Human genes 0.000 claims 1
- 108700026220 vif Genes Proteins 0.000 claims 1
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 75
- 241000196324 Embryophyta Species 0.000 description 40
- 239000013598 vector Substances 0.000 description 30
- 108010076504 Protein Sorting Signals Proteins 0.000 description 26
- 230000035772 mutation Effects 0.000 description 20
- 101100152563 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) tbg gene Proteins 0.000 description 18
- 101150048293 TUB4 gene Proteins 0.000 description 17
- 101150062459 TUBB4 gene Proteins 0.000 description 17
- 108090000704 Tubulin Proteins 0.000 description 16
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 16
- 230000006870 function Effects 0.000 description 16
- 230000004568 DNA-binding Effects 0.000 description 15
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 14
- 238000010459 TALEN Methods 0.000 description 13
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 13
- 108020001507 fusion proteins Proteins 0.000 description 13
- 102000037865 fusion proteins Human genes 0.000 description 13
- 230000032965 negative regulation of cell volume Effects 0.000 description 13
- 241000219194 Arabidopsis Species 0.000 description 12
- 230000004927 fusion Effects 0.000 description 12
- 108090000765 processed proteins & peptides Proteins 0.000 description 12
- 239000013604 expression vector Substances 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 10
- 102000004196 processed proteins & peptides Human genes 0.000 description 10
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 9
- 108091028043 Nucleic acid sequence Proteins 0.000 description 9
- 230000037429 base substitution Effects 0.000 description 9
- 101100098873 Chondrus crispus TUBB gene Proteins 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- 101150114468 TUB1 gene Proteins 0.000 description 8
- 101150025182 TUBB1 gene Proteins 0.000 description 8
- 229940104302 cytosine Drugs 0.000 description 8
- 229940088598 enzyme Drugs 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 102100026846 Cytidine deaminase Human genes 0.000 description 7
- 108010031325 Cytidine deaminase Proteins 0.000 description 7
- 229940113082 thymine Drugs 0.000 description 7
- 102000004533 Endonucleases Human genes 0.000 description 6
- 101100098899 Epichloe typhina TUBB gene Proteins 0.000 description 6
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 6
- 101100424636 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) TUB3 gene Proteins 0.000 description 6
- 101150083762 TUBB2 gene Proteins 0.000 description 6
- 101150026222 TUBB3 gene Proteins 0.000 description 6
- 210000003763 chloroplast Anatomy 0.000 description 6
- 210000004748 cultured cell Anatomy 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 229920001184 polypeptide Polymers 0.000 description 6
- 239000011347 resin Substances 0.000 description 6
- 229920005989 resin Polymers 0.000 description 6
- 238000007480 sanger sequencing Methods 0.000 description 6
- 101150048667 tub-2 gene Proteins 0.000 description 6
- 101710163270 Nuclease Proteins 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 229910052697 platinum Inorganic materials 0.000 description 5
- 241000589158 Agrobacterium Species 0.000 description 4
- 240000007124 Brassica oleracea Species 0.000 description 4
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 4
- 108091033409 CRISPR Proteins 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 230000008836 DNA modification Effects 0.000 description 4
- 101150063416 add gene Proteins 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 150000007523 nucleic acids Chemical class 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 3
- 108091006112 ATPases Proteins 0.000 description 3
- 102000057290 Adenosine Triphosphatases Human genes 0.000 description 3
- 102000055025 Adenosine deaminases Human genes 0.000 description 3
- 235000011331 Brassica Nutrition 0.000 description 3
- 241000219198 Brassica Species 0.000 description 3
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 3
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 3
- 101000884048 Burkholderia cenocepacia (strain H111) Double-stranded DNA deaminase toxin A Proteins 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 240000007594 Oryza sativa Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- 101100483128 Solanum tuberosum TUB8 gene Proteins 0.000 description 3
- 101150005767 TUBB5 gene Proteins 0.000 description 3
- 101150064393 TUBB6 gene Proteins 0.000 description 3
- 101150007783 TUBB7 gene Proteins 0.000 description 3
- 101150073866 TUBB8 gene Proteins 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 210000004671 cell-free system Anatomy 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 210000003470 mitochondria Anatomy 0.000 description 3
- 238000002715 modification method Methods 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 125000003607 serino group Chemical class [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 241000234282 Allium Species 0.000 description 2
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 101100480727 Arabidopsis thaliana TUBB9 gene Proteins 0.000 description 2
- 240000003291 Armoracia rusticana Species 0.000 description 2
- 235000011330 Armoracia rusticana Nutrition 0.000 description 2
- 244000221633 Brassica rapa subsp chinensis Species 0.000 description 2
- 235000010149 Brassica rapa subsp chinensis Nutrition 0.000 description 2
- 241000371430 Burkholderia cenocepacia Species 0.000 description 2
- 238000010354 CRISPR gene editing Methods 0.000 description 2
- 244000205754 Colocasia esculenta Species 0.000 description 2
- 235000006481 Colocasia esculenta Nutrition 0.000 description 2
- 102000000634 Cytochrome c oxidase subunit IV Human genes 0.000 description 2
- 108700039964 Duplicate Genes Proteins 0.000 description 2
- 101000889900 Enterobacteria phage T4 Intron-associated endonuclease 1 Proteins 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 108010066154 Nuclear Export Signals Proteins 0.000 description 2
- 208000020584 Polyploidy Diseases 0.000 description 2
- 102000055027 Protein Methyltransferases Human genes 0.000 description 2
- 108700040121 Protein Methyltransferases Proteins 0.000 description 2
- 241000589180 Rhizobium Species 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 241000589634 Xanthomonas Species 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 239000012228 culture supernatant Substances 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 230000002438 mitochondrial effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 102220198631 rs1057520111 Human genes 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000004114 suspension culture Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 108091006106 transcriptional activators Proteins 0.000 description 2
- 108091006107 transcriptional repressors Proteins 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- 101150084750 1 gene Proteins 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 102100033731 40S ribosomal protein S9 Human genes 0.000 description 1
- 102100025643 60S ribosomal protein L12 Human genes 0.000 description 1
- 229940121819 ATPase inhibitor Drugs 0.000 description 1
- 241000228431 Acremonium chrysogenum Species 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000256118 Aedes aegypti Species 0.000 description 1
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 1
- 240000002234 Allium sativum Species 0.000 description 1
- 241000234270 Amaryllidaceae Species 0.000 description 1
- 244000247812 Amorphophallus rivieri Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 101000717956 Arabidopsis thaliana Aldehyde dehydrogenase family 2 member B4, mitochondrial Proteins 0.000 description 1
- 101100201106 Arabidopsis thaliana RPS5A gene Proteins 0.000 description 1
- 241000209524 Araceae Species 0.000 description 1
- 229930091051 Arenine Natural products 0.000 description 1
- RJUHZPRQRQLCFL-IMJSIDKUSA-N Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O RJUHZPRQRQLCFL-IMJSIDKUSA-N 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- MQLZLIYPFDIDMZ-HAFWLYHUSA-N Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O MQLZLIYPFDIDMZ-HAFWLYHUSA-N 0.000 description 1
- 241000208838 Asteraceae Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000007294 Brassica nipposinica Nutrition 0.000 description 1
- 244000026811 Brassica nipposinica Species 0.000 description 1
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 1
- 235000012905 Brassica oleracea var viridis Nutrition 0.000 description 1
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 1
- 240000008100 Brassica rapa Species 0.000 description 1
- 235000000536 Brassica rapa subsp pekinensis Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 241000219193 Brassicaceae Species 0.000 description 1
- 101100011365 Caenorhabditis elegans egl-13 gene Proteins 0.000 description 1
- 241000217446 Calystegia sepium Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 235000008534 Capsicum annuum var annuum Nutrition 0.000 description 1
- 240000008384 Capsicum annuum var. annuum Species 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108050001186 Chaperonin Cpn60 Proteins 0.000 description 1
- 241000207782 Convolvulaceae Species 0.000 description 1
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 1
- 241000186226 Corynebacterium glutamicum Species 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000219112 Cucumis Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 235000009849 Cucumis sativus Nutrition 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 108090000365 Cytochrome-c oxidases Proteins 0.000 description 1
- 108020001738 DNA Glycosylase Proteins 0.000 description 1
- 102000028381 DNA glycosylase Human genes 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 229940113491 Glycosylase inhibitor Drugs 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- MDCTVRUPVLZSPG-BQBZGAKWSA-N His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 MDCTVRUPVLZSPG-BQBZGAKWSA-N 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 108090000353 Histone deacetylase Proteins 0.000 description 1
- 102000003964 Histone deacetylase Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000657066 Homo sapiens 40S ribosomal protein S9 Proteins 0.000 description 1
- 101000575173 Homo sapiens 60S ribosomal protein L12 Proteins 0.000 description 1
- 101000726355 Homo sapiens Cytochrome c Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- 229920002752 Konjac Polymers 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- 108010047357 Luminescent Proteins Proteins 0.000 description 1
- 102000006830 Luminescent Proteins Human genes 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- 241000282560 Macaca mulatta Species 0.000 description 1
- 102100025169 Max-binding protein MNT Human genes 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- 241000233855 Orchidaceae Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 244000271379 Penicillium camembertii Species 0.000 description 1
- 235000002245 Penicillium camembertii Nutrition 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 235000006089 Phaseolus angularis Nutrition 0.000 description 1
- 241000758706 Piperaceae Species 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 241000282405 Pongo abelii Species 0.000 description 1
- 241000589776 Pseudomonas putida Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 101100201109 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rps5 gene Proteins 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 241000607717 Serratia liquefaciens Species 0.000 description 1
- 241000208292 Solanaceae Species 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 240000003829 Sorghum propinquum Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 241000592344 Spermatophyta Species 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 240000001949 Taraxacum officinale Species 0.000 description 1
- 235000005187 Taraxacum officinale ssp. officinale Nutrition 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 241000579872 Upupa epops Species 0.000 description 1
- 240000007098 Vigna angularis Species 0.000 description 1
- 235000010711 Vigna angularis Nutrition 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000000362 adenosine triphosphatase inhibitor Substances 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 125000000266 alpha-aminoacyl group Chemical group 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- -1 and as necessary Substances 0.000 description 1
- 244000000005 bacterial plant pathogen Species 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- GPRBEKHLDVQUJE-VINNURBNSA-N cefotaxime Chemical compound N([C@@H]1C(N2C(=C(COC(C)=O)CS[C@@H]21)C(O)=O)=O)C(=O)/C(=N/OC)C1=CSC(N)=N1 GPRBEKHLDVQUJE-VINNURBNSA-N 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 229940088530 claforan Drugs 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- 238000007598 dipping method Methods 0.000 description 1
- 244000013123 dwarf bean Species 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000006718 epigenetic regulation Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 235000004611 garlic Nutrition 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 235000021331 green beans Nutrition 0.000 description 1
- 125000005842 heteroatom Chemical group 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 108091006086 inhibitor proteins Proteins 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000001155 isoelectric focusing Methods 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 241001515942 marmosets Species 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000001035 methylating effect Effects 0.000 description 1
- 230000026326 mitochondrial transport Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000012223 nuclear import Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000029553 photosynthesis Effects 0.000 description 1
- 238000010672 photosynthesis Methods 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 210000002377 thylakoid Anatomy 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
- A01H5/10—Seeds
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Botany (AREA)
- Physiology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Environmental Sciences (AREA)
- Developmental Biology & Embryology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Peptides Or Proteins (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
【課題】本発明は、同一または類似のタンパク質をコードするDNAが複数存在する場合に、TALEを用いて、当該複数のDNAを改変する方法の提供を課題とする。【解決手段】本発明は、同一または類似のタンパク質をコードする複数のDNAを改変する方法であって、N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVD(repeat variable di-residue)を含むリピート配列を少なくとも1つ含む1種類のTALE-改変因子複合体のTALE部分を、当該複数のDNAの結合領域に結合させることを含む方法である。【選択図】なし
Description
本発明は、TALE(transcription activator-like effector)を用いたゲノム編集技術に関する。
TALEは、植物病原細菌のキサントモナス(Xanthomonas)が宿主である植物に感染した際に、宿主細胞内に導入される転写因子として同定された。TALEが宿主細胞内に導入されると、当該細胞内における転写を制御し、免疫応答の抑制やキサントモナスの増殖に適した環境を誘導する機能を有している(非特許文献1、非特許文献2)。TALEのDNA結合ドメインは、約34アミノ酸残基からなるアミノ酸のリピート(繰り返し)配列がタンデムに10~30個配置された構造を有しており、ゲノム上の標的塩基配列に結合する。約34アミノ酸からなるリピート配列を構成するアミノ酸配列中には、Repeat Variable Diresidue(RVD)と称される2アミノ酸残基からなる可変領域がある。このRVDを構成する2アミノ酸残基が、標的DNA配列中のどの塩基を認識または許容するかを決定している(非特許文献3、非特許文献4)。RVDは、TALEタンパク質のリピート配列のN端側から、12番目と13番目、または13番目と14番目のアミノ酸がこれに相当する。
TALEの特異的なDNA結合性を利用して、これまでにいくつかのゲノム編集ツールが開発されている。例えば、TALEのDNA結合ドメインにエンドヌクレアーゼを連結させた人工のエンドヌクレアーゼは、RVDを所望の塩基配列を認識または許容するようにデザインすることで、配列特異的なエンドヌクレアーゼ、TALEN(transcription activator-like effector nuclease)として使用することができる(例えば、非特許文献5)。また、二重鎖DNAの修飾が可能なシチジンデアミナーゼ(cytidine deaminase:CD)もしくはアデノシンデアミナーゼ(adenosine deaminase:ADA)とTALEの融合体は、所望の塩基を特異的に改変[CDはC(シトシン)をU(ウリジン)、ADAはA(アデニン)をI(イノシン)に改変]するために使用することができる(非特許文献7、非特許文献12、特許文献1)。
TALEを用いたゲノム編集ツールは、その後も様々な改良が行われてきた。TALENが開発された当初は、TALENのヌクレアーゼドメインとして、二量体化することでヌクレアーゼ活性を示すFokIのDNA切断ドメインが用いられていたため、センス鎖およびアンチセンス鎖の各々に結合する1対のTALENを準備する必要があった。その後、FokIヌクレアーゼドメインに替えて、バクテリオファージ由来のI-TevIの触媒領域をTALEに連結させることで、単量体で標的配列を認識および切断できるコンパクトTALENが開発された(非特許文献8、特許文献2)。また、Sakumaらは、TALEのDNA結合モジュールのRVD以外のアミノ酸配列を改変して、従来のTALENよりも高い活性もったTALEN(Platinum TALEN)を開発した(非特許文献9)。その他、TALEのDNAとの結合安定性を向上させるためにRVD領域のアミノ酸の組み合わせに関する報告もいくつか行われている(非特許文献10、非特許文献11、特許文献2)。
ゲノム編集技術としては、TALE以外に、CRISPR/Cas9を用いた技術もよく使用されている。CRISPR/Cas9は、20塩基の配列を認識して標的配列の編集を行うが、オフターゲットと呼ばれる標的配列に似た配列を誤って編集することがある。これに対し、TALEは約40塩基の配列を認識するため、オフターゲットの編集は少ない。しかしながら、その反面、TALEを用いた場合には、複数の類似配列を同時に編集することは困難である。
VoytasおよびJoung, Science, 326: 1491-1492 2009
Bogdanoveら, Current Opinion in Plant Biology, 13: 394-401 2010
Bochら, Science, 326: 1509-1512 2009
MoscouおよびBogdanove, Science, 326: 1501 2009
Millerら, Nature Biotechnology, 29: 143-148 2011
Mokら, Nature, 583: 631-637 2020
Mokら, Nature Communications, 13: 4038 doi.org/10.1038/s41467-022-31745-y 2022
Beurdeleyら, Nature Communications, 4: 1762 DOI: 10.1038/ncomms2782 2013
Sakumaら, Scientific Reports, 3: 3379 DOI: 10.1038/strep03379 2013
Congら, Nature Communications, 3: 968 DOI: 10.1038/ncomms1962 2012
Christianら, PLoS One, 7: e45383 2012
Choら, Cell, 185: 1764-1776 2022
多くの生物のゲノムには、あるタンパク質をコードする遺伝子は1つだけではなく、複数存在しており、かつ、その塩基配列も完全に同一ではない類似配列であることが多い。例えば、多重遺伝子やコピー遺伝子において、各遺伝子がコードするタンパク質中の同一のアミノ酸に対するコドンの3番目の塩基が、多重遺伝子毎またはコピー遺伝子毎に異なることがしばしば見出されている。また、植物ではゲノムは2 n だけでなく、3 nからそれ以上の多倍数体のものも多く、さらにそれぞれのゲノムに標的遺伝子が複数コードされていることも多い。この機能的冗長性が原因となり、これまでのゲノム編集技術で特定の一つの遺伝子配列をゲノム編集しても、その機能改変の表現型が明確に現れないことが多いという点が問題になっていた。
本発明は、上記事情に鑑み、同一遺伝子または類似遺伝子が複数存在する場合に、TALE(1種類のTALE)を用いて、当該複数の遺伝子を同時に改変するためのゲノム編集技術の提供を課題とする。
本発明は、上記事情に鑑み、同一遺伝子または類似遺伝子が複数存在する場合に、TALE(1種類のTALE)を用いて、当該複数の遺伝子を同時に改変するためのゲノム編集技術の提供を課題とする。
本発明者らは、Repeat Variable Di-residues(RVD)を特定のアミノ酸の組み合わせに改変したTALE(transcription activator-like effector)を用いて、上記課題の解決を試みた。
多倍数体ゲノムに存在する相同遺伝子(ホモログ)あるいは相似遺伝子(ホメオログ)、遺伝子ファミリーとして存在する遺伝子群は、同様の機能を持つタンパク質をコードする場合でも、同義置換および非同義置換のSNP(Single Nucleotide Polymorphism)により、互いの塩基配列は完全一致しないことがある。そのため、当該遺伝子群の複数の遺伝子の特定の共通領域を、TALEを用いて同時に編集する場合、TALEを結合させる塩基配列中に、当該遺伝子群の各遺伝子間で異なる塩基が存在することがある。このような場合に、当該塩基をA、T、GもしくはCの全ての塩基、または複数の塩基を認識または許容できるRVDを有するTALEを構築すれば、1つのゲノム編集酵素による1回の操作で、同様の機能をもつタンパク質、つまり相同もしくは類似するアミノ酸配列をもつタンパク質をコードする複数遺伝子であって、僅かに塩基配列が相違する複数の遺伝子を同時に改変するゲノム編集が可能となる。
多倍数体ゲノムに存在する相同遺伝子(ホモログ)あるいは相似遺伝子(ホメオログ)、遺伝子ファミリーとして存在する遺伝子群は、同様の機能を持つタンパク質をコードする場合でも、同義置換および非同義置換のSNP(Single Nucleotide Polymorphism)により、互いの塩基配列は完全一致しないことがある。そのため、当該遺伝子群の複数の遺伝子の特定の共通領域を、TALEを用いて同時に編集する場合、TALEを結合させる塩基配列中に、当該遺伝子群の各遺伝子間で異なる塩基が存在することがある。このような場合に、当該塩基をA、T、GもしくはCの全ての塩基、または複数の塩基を認識または許容できるRVDを有するTALEを構築すれば、1つのゲノム編集酵素による1回の操作で、同様の機能をもつタンパク質、つまり相同もしくは類似するアミノ酸配列をもつタンパク質をコードする複数遺伝子であって、僅かに塩基配列が相違する複数の遺伝子を同時に改変するゲノム編集が可能となる。
シロイヌナズナゲノムのβチューブリン遺伝子TUB4は、Ser351Pheを引き起こす塩基置換が生じると、表層細胞列および一次根のねじれの表現型が生じることが知られている(Ishidaら, Proceedings of the National Academy of Sciences, 104:8544-8549 2007)。シロイヌナズナには9つのβチューブリン遺伝子が存在しており、これら9遺伝子全てにおいて、Ser351が保存されている。本発明者らは、nuclear-targeted TALE cytidine deaminase(nTALECD)(WO2022/158561などを参照のこと)を用いて、9遺伝子のうち、TUB1、TUB2、TUB3およびTUB4のSer351をコードするコドン配列に、シトシンからチミンへの塩基置換を導入することにより、351番目のSerをPhe、またはLeuへの変異を引き起こすことを試みた。TUB1、TUB2、TUB3およびTUB4のTALE認識配列(TALE leftのリピート配列が結合する配列)のうち、3箇所の塩基の構成が遺伝子間で異なっていた。そこで、本発明者らは、これらの3箇所の塩基を認識または許容するRVDを、N認識、すなわち、A、T、GまたはCを認識または許容するアミノ酸の組み合わせになるように、TALEドメインを設計した。
N認識のRVDを有するnTALECDで、シロイヌナズナのβチューブリン遺伝子のSer351をコードするコドン配列にシトシンからチミンへの塩基置換を導入したところ、T1世代で、標的とした4つのβチューブリン遺伝子(すなわちTUB1、TUB2、TUB3、TUB4)について複数の個体で変異が導入されていた。さらに、標的ではない5つのβチューブリン遺伝子のうち、TUB5、TUB6およびTUB7についても変異が導入されている個体が見出された。これに対し、TUB4特異的に塩基置換を導入するように設計したnTALECDを用いた場合には、標的のTUB4には高効率で変異が導入されたのに対し、他の8つのβチューブリン遺伝子では1個体を除き、変異の導入は検出されなかった。
以上のように、本発明者らは、TALEのRVD領域であって、同一機能を有する複数の遺伝子配列同士で相違する塩基を認識または許容するRVDにNを対応させるようにアミノ酸を配置することで、当該複数の遺伝子の編集が可能であることを初めて見出し、本発明を完成させた。上記知見から、Nの他、V(A、CまたはG)、H(A、CまたはT)、D(A、GまたはT)、B(C、GまたはT)、R(GまたはA)、Y(CまたはT)、M(AまたはC)、W(AまたはT)、S(CまたはG)またはK(GまたはT)を認識または許容するRVDを配置したリピート配列を適宜使用することで、遺伝子の編集の標的対象の幅を広げることが可能となる。
以上のように、本発明者らは、TALEのRVD領域であって、同一機能を有する複数の遺伝子配列同士で相違する塩基を認識または許容するRVDにNを対応させるようにアミノ酸を配置することで、当該複数の遺伝子の編集が可能であることを初めて見出し、本発明を完成させた。上記知見から、Nの他、V(A、CまたはG)、H(A、CまたはT)、D(A、GまたはT)、B(C、GまたはT)、R(GまたはA)、Y(CまたはT)、M(AまたはC)、W(AまたはT)、S(CまたはG)またはK(GまたはT)を認識または許容するRVDを配置したリピート配列を適宜使用することで、遺伝子の編集の標的対象の幅を広げることが可能となる。
すなわち、本発明は以下の(1)~(14)である。
(1)同一または類似のタンパク質をコードする複数のDNAを改変する方法であって、
N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVD(repeat variable di-residue)を含むリピート配列を少なくとも1つ含む1種類のTALE-改変因子複合体のTALE部分を、当該複数のDNAの結合領域に結合させることを含む、前記方法。
(2)細胞内における同一または類似のタンパク質をコードする複数の遺伝子を改変する方法であって、
N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVDを含むリピート配列を少なくとも1つ含む1種類のTALE-改変因子複合体を、細胞内に導入することを含む、前記方法。
(3)細胞内における同一または類似のタンパク質をコードする複数の遺伝子が改変された細胞の作製方法であって、
N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVDを含むリピート配列を少なくとも1つ含む1種類のTALE-改変因子複合体を、細胞内に導入することを含む、前記方法。
(4)前記RVDが認識または許容する塩基が、前記複数のDNAまたは遺伝子の塩基配列をアライメントしたときに、同じ位置に存在する塩基の1または複数が他のDNAまたは遺伝子の塩基と異なる塩基である、上記(1)から(3)までのいずれかに記載の方法。
(5)前記RVDのアミノ酸が、
Nを認識または許容するRV、CS、VR、NA、S*、RH、RLもしくはRTで構成されており、
Mを認識するHCもしくはKCで構成されており、
Vを認識するHS、HT、HV、KVもしくはRCで構成されており、または、
RもしくはVを認識するNTで構成されている、上記(1)から(3)までのいずれかに記載の方法。ただし、S*の「*」は、RVDの第2位値がギャップであることを示す。
(6)前記改変因子が、エンドヌクレアーゼの全部もしくは一部、デアミナーゼの全部もしくは一部である、上記(1)から(3)までのいずれかに記載の方法。
(7)前記遺伝子が、核遺伝子、ミトコンドリア遺伝子または色素体遺伝子である、上記(2)または(3)に記載の方法。
(8)前記細胞が植物細胞である、上記(2)に記載の方法。
(9)前記細胞が植物細胞である、上記(3)に記載の方法。
(10)上記(9)に記載の方法で作製された植物細胞。
(11)上記(10)に記載の植物細胞を含む種子または植物。
(12)TALEのリピート配列を少なくとも1つ含むDNA結合タンパク質であって、当該リピート配列に含まれるRVDが、
Nを認識または許容するRV、CS、VR、NA、S*、RH、RLもしくはRTで構成されており、
Mを認識するHCもしくはKCで構成されており、
Vを認識するHS、HT、HV、KVもしくはRCで構成されており、または、
RもしくはVを認識するNTで構成されている、前記タンパク質。ただし、S*の「*」は、RVDの第2位値がギャップであることを示す。
(13)前記RVDがNを認識または許容するRVである、上記(12)に記載のタンパク質。
(14)機能性タンパク質が融合していることを特徴とする、上記(13)に記載のタンパク質。
なお、本明細書において「~」の符号は、その左右の値を含む数値範囲を示す。
(1)同一または類似のタンパク質をコードする複数のDNAを改変する方法であって、
N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVD(repeat variable di-residue)を含むリピート配列を少なくとも1つ含む1種類のTALE-改変因子複合体のTALE部分を、当該複数のDNAの結合領域に結合させることを含む、前記方法。
(2)細胞内における同一または類似のタンパク質をコードする複数の遺伝子を改変する方法であって、
N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVDを含むリピート配列を少なくとも1つ含む1種類のTALE-改変因子複合体を、細胞内に導入することを含む、前記方法。
(3)細胞内における同一または類似のタンパク質をコードする複数の遺伝子が改変された細胞の作製方法であって、
N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVDを含むリピート配列を少なくとも1つ含む1種類のTALE-改変因子複合体を、細胞内に導入することを含む、前記方法。
(4)前記RVDが認識または許容する塩基が、前記複数のDNAまたは遺伝子の塩基配列をアライメントしたときに、同じ位置に存在する塩基の1または複数が他のDNAまたは遺伝子の塩基と異なる塩基である、上記(1)から(3)までのいずれかに記載の方法。
(5)前記RVDのアミノ酸が、
Nを認識または許容するRV、CS、VR、NA、S*、RH、RLもしくはRTで構成されており、
Mを認識するHCもしくはKCで構成されており、
Vを認識するHS、HT、HV、KVもしくはRCで構成されており、または、
RもしくはVを認識するNTで構成されている、上記(1)から(3)までのいずれかに記載の方法。ただし、S*の「*」は、RVDの第2位値がギャップであることを示す。
(6)前記改変因子が、エンドヌクレアーゼの全部もしくは一部、デアミナーゼの全部もしくは一部である、上記(1)から(3)までのいずれかに記載の方法。
(7)前記遺伝子が、核遺伝子、ミトコンドリア遺伝子または色素体遺伝子である、上記(2)または(3)に記載の方法。
(8)前記細胞が植物細胞である、上記(2)に記載の方法。
(9)前記細胞が植物細胞である、上記(3)に記載の方法。
(10)上記(9)に記載の方法で作製された植物細胞。
(11)上記(10)に記載の植物細胞を含む種子または植物。
(12)TALEのリピート配列を少なくとも1つ含むDNA結合タンパク質であって、当該リピート配列に含まれるRVDが、
Nを認識または許容するRV、CS、VR、NA、S*、RH、RLもしくはRTで構成されており、
Mを認識するHCもしくはKCで構成されており、
Vを認識するHS、HT、HV、KVもしくはRCで構成されており、または、
RもしくはVを認識するNTで構成されている、前記タンパク質。ただし、S*の「*」は、RVDの第2位値がギャップであることを示す。
(13)前記RVDがNを認識または許容するRVである、上記(12)に記載のタンパク質。
(14)機能性タンパク質が融合していることを特徴とする、上記(13)に記載のタンパク質。
なお、本明細書において「~」の符号は、その左右の値を含む数値範囲を示す。
本発明によれば、同一の機能を有する複数の遺伝子の遺伝子配列に対し、当該複数の遺伝子配列同士が完全に同一ではない場合であっても、同時に、同一の改変を行うことが可能となる。
以下に本発明の実施形態について説明する。
第1の実施形態は、同一のタンパク質または類似のタンパク質をコードする複数のDNAを改変する方法であって、N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVD(repeat variable di-residue)を含むリピート配列を少なくとも1つ含む1種類のTALE-改変因子複合体のTALE部分を、当該複数のDNAの結合領域(TALE部分が結合するDNA領域)に結合させることを含む方法である(以下「本実施形態にかかるDNAの改変方法」とも記載する)。「TALE-改変因子複合体」は、TALEと改変因子の融合体(または結合体もしくは連結体)のことである。ここで、DNAの「改変」には、DNA配列の構造を変化させることの他、タンパク質をコードするDNAの転写活性を制御すること、例えば、プロモーター、エンハンサーまたはサイレンサーなどの機能を活性化または抑制すること、およびエピジェネティクス制御なども含まれる。また、「DNA配列の構造を変化させること」には、特に限定はしないが、例えば、DNA配列に対し、1または複数の塩基の置換(変化)、挿入、欠失または付加を導入すること、あるいは、DNA鎖の二重鎖切断、二重鎖切断および結合等を導入することによりDNA配列の構造を変化させることが含まれる他、DNAを構成する塩基を修飾することで配列の構造を変化させること、例えば、DNA配列中の1または複数の塩基をメチル化すること、DNA鎖にニックを導入するなど、DNA鎖またはDNAを構成する塩基に修飾を加えることも含まれる。
第1の実施形態は、同一のタンパク質または類似のタンパク質をコードする複数のDNAを改変する方法であって、N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVD(repeat variable di-residue)を含むリピート配列を少なくとも1つ含む1種類のTALE-改変因子複合体のTALE部分を、当該複数のDNAの結合領域(TALE部分が結合するDNA領域)に結合させることを含む方法である(以下「本実施形態にかかるDNAの改変方法」とも記載する)。「TALE-改変因子複合体」は、TALEと改変因子の融合体(または結合体もしくは連結体)のことである。ここで、DNAの「改変」には、DNA配列の構造を変化させることの他、タンパク質をコードするDNAの転写活性を制御すること、例えば、プロモーター、エンハンサーまたはサイレンサーなどの機能を活性化または抑制すること、およびエピジェネティクス制御なども含まれる。また、「DNA配列の構造を変化させること」には、特に限定はしないが、例えば、DNA配列に対し、1または複数の塩基の置換(変化)、挿入、欠失または付加を導入すること、あるいは、DNA鎖の二重鎖切断、二重鎖切断および結合等を導入することによりDNA配列の構造を変化させることが含まれる他、DNAを構成する塩基を修飾することで配列の構造を変化させること、例えば、DNA配列中の1または複数の塩基をメチル化すること、DNA鎖にニックを導入するなど、DNA鎖またはDNAを構成する塩基に修飾を加えることも含まれる。
本実施形態におけるTALE-改変因子複合体のうち、「改変因子」は、上述したDNAの「改変」を行う機能または活性を有する因子のことで、DNAの配列構造の改変を誘導する因子として、特に限定はしないが、例えば、エンドヌクレアーゼ、デアミナーゼなどのDNAの配列構造を変化させる酵素の他、塩基に修飾を加える因子として、特に限定はしないが、例えば、DNAメチラーゼ、DNAグリコシラーゼ、ニッカーゼなどの酵素が例示される。エンドヌクレアーゼとしては、例えば、FokIヌクレアーゼドメインやバクテリオファージ由来のI-TevIなどを例示することができる。デアミナーゼとして、例えば、DNA中のシトシン(C)をウリジン(U)に改変する、バークホルデリア・セノセパシアのDddA(Burkholderia
cenocepacia DddA)のシチジンデアミナーゼドメイン(以下DddAtoxとも記載する)(詳細は、WO2022/158561を参照のこと)、アデニン(A)をイノシン(I)に改変する、アデノシンデアミナーゼ(Choら, Cell, 185:1764-1776 2022などを参照のこと)などを例示することができる。さらに、タンパク質をコードするDNAの転写活性を制御する因子として、転写活性化因子および転写抑制因子やその一部ドメインなどの他、DNAメチラーゼ、ヒストン修飾酵素(例えば、ヒストンアセチル化酵素、ヒストン脱アセチル化酵素、ヒストンメチル化酵素など)などのエピジェネティクス制御因子やその一部ドメインなどを挙げることができる。
本実施形態にかかるDNA改変方法は、細胞内に存在する遺伝子の改変のみならず、無細胞系(Cell-free)におけるDNA改変にも使用することができる。本実施形態における「DNA」には、例えば、ゲノムDNAの他、cDNAなどが含まれ、無細胞系でDNA改変を行う場合、「複数のDNA」として、例えば、ゲノムDNAライブラリーやcDNAライブラリーなどに含まれるDNAを用いてもよい。「標的配列」とは、TALE部分が結合するDNA領域のことである。無細胞系で実施する場合、TALE-改変因子複合体と複数のDNAの集合体(例えば、ゲノムDNAライブラリーおよびcDNAライブラリーなど)とを混合し、TALE-改変因子複合体のTALE部分と当該DNAが接触可能な状態にする。TALE-改変因子複合体のTALE部分がDNAの標的領域に結合することにより、その近傍に存在する標的塩基が改変因子によって改変される。
本実施形態における「タンパク質」は、全長タンパク質の他に、全長タンパク質の一部であって特定の機能を有するタンパク質の一部、例えば、タンパク質ドメイン(タンパク質の配列、構造の一部で、機能を持った部分;例えば、EFハンドタンパク質ドメイン、ジンクフィンガードメインなど)が含まれる。また、「同一のタンパク質」とは、機能および活性が同じであってアミノ酸配列が100%同一である「タンパク質」のことで、「類似のタンパク質」とは、その機能および活性が同じであってアミノ酸配列が90%以上、95%以上または99%以上同一である「タンパク質」のことである。
また、「複数のDNA」とは、当該複数のDNAの全てが、「同一のタンパク質」または「類似のタンパク質」をコードするDNAのことである。ここで、同一のタンパク質または類似のタンパク質をコードする「DNA」が遺伝子(ゲノムDNA)の場合には、当該複数の遺伝子(ゲノムDNA)から転写されるmRNA配列が同一ではない複数の遺伝子(ゲノムDNA)のことである。当該複数の遺伝子(ゲノムDNA)としては、特に限定はしないが、例えは、遺伝子ファミリーを構成する遺伝子、重複遺伝子、コピー遺伝子などが挙げられる。
本実施形態におけるRVD(すなわち、TALEの少なくとも1つのリピート配列に含まれるRVD)が認識または許容する塩基は、当該複数のDNAの塩基配列をアライメントしたときに、同じ位置に存在する塩基の1または複数が他のDNAの塩基(同じ位置に存在する塩基)と異なる塩基である。
また、「複数のDNA」とは、当該複数のDNAの全てが、「同一のタンパク質」または「類似のタンパク質」をコードするDNAのことである。ここで、同一のタンパク質または類似のタンパク質をコードする「DNA」が遺伝子(ゲノムDNA)の場合には、当該複数の遺伝子(ゲノムDNA)から転写されるmRNA配列が同一ではない複数の遺伝子(ゲノムDNA)のことである。当該複数の遺伝子(ゲノムDNA)としては、特に限定はしないが、例えは、遺伝子ファミリーを構成する遺伝子、重複遺伝子、コピー遺伝子などが挙げられる。
本実施形態におけるRVD(すなわち、TALEの少なくとも1つのリピート配列に含まれるRVD)が認識または許容する塩基は、当該複数のDNAの塩基配列をアライメントしたときに、同じ位置に存在する塩基の1または複数が他のDNAの塩基(同じ位置に存在する塩基)と異なる塩基である。
本実施形態にかかるDNA改変方法を、細胞内の遺伝子(ゲノムDNA)に適用する場合、第1の実施形態は、細胞内における同一または類似のタンパク質をコードする遺伝子(ゲノムDNA)を改変する方法であって、N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVDを含むリピート配列を少なくとも1つ含む1種類のTALE-改変因子複合体を、細胞内に導入することを含む方法(以下「本実施形態にかかる遺伝子改変方法」とも記載する)である。
前述の通り、生物は、同一のタンパク質をコードする複数の遺伝子を有しており、かつ、複数の遺伝子配列同士が完全に同一でないことがある。そのため、このような複数の遺伝子を、TALEを用いて改変する場合に、TALEが結合する認識配列が遺伝子コピー間で相違することがある。以下の事例により本実施形態について説明を行う。
遺伝子Aには、遺伝子A-1~A-6の6つの塩基配列が存在するとする。遺伝子Aを改変するためのTALEの結合領域を、遺伝子A-1~遺伝子A-6でアライメントすると、下記のようになるとする。
遺伝子A-1・・・GGA TCT TAT CAT GGT(配列番号1)・・・
遺伝子A-2・・・GGA TCC TAT CAT GGT(配列番号2)・・・
遺伝子A-3・・・GGA TCA TAT CAT GGT(配列番号3)・・・
遺伝子A-4・・・GGA TCG TAT CAT GGT(配列番号4)・・・
遺伝子A-5・・・GGA TCC TAT CAT GGT(配列番号5)・・・
遺伝子A-6・・・GGA TCT TAT CAT GGT(配列番号6)・・・
上記6つの遺伝子配列中、下線の塩基が異なっているが、この配列がコードするアミノ酸配列は、いずれも、GSYHG(配列番号7)で同一である。このような場合に、細胞内の遺伝子Aまたは遺伝子A産物(タンパク質)に、TALEを用いて同一の改変を導入する場合、従来の方法によると、下線を付した塩基を認識するリピート配列のRVDが、例えば、Tを認識するNG(Asn-Gly)、Cを認識するHD(His-Asp)、Aを認識するNI(Asn-Ile)またはGを認識するNN(Asn-Asn)で構成される4つのTALEを準備する必要があった。これに対し、本実施形態にかかる方法のように、下線を付した塩基を認識するRVDを、N(ここで、「N」はA、T、GまたはCを表す)を認識または許容するアミノ酸構成にすれば、遺伝子A-1~A-6の全ての認識配列に結合するTALEを作製することができる。また、下線の塩基を認識するRVDを、R(ここで、「R」はAまたはGを表す)を認識するアミノ酸構成にすれば、遺伝子A-3と遺伝子A-4の認識配列に結合するTALEを作製することができ、Y(ここで、「Y」はTまたはCを表す)を認識するアミノ酸構成にすれば、遺伝子A-1、遺伝子A-2、遺伝子A-5および遺伝子A-6の標的配列に結合するTALEを作製することができる。このように、上記事例において、本実施形態のRVDは、遺伝子A-1、遺伝子A-2、遺伝子A-3、遺伝子A-4、遺伝子A-5および遺伝子A-6をアライメントした場合、配列番号1~6の6番目の塩基、すなわち、遺伝子A-1、遺伝子A-2、遺伝子A-3、遺伝子A-4、遺伝子A-5および遺伝子A-6間で異なる塩基を認識することを特徴とする。
遺伝子A-1・・・GGA TCT TAT CAT GGT(配列番号1)・・・
遺伝子A-2・・・GGA TCC TAT CAT GGT(配列番号2)・・・
遺伝子A-3・・・GGA TCA TAT CAT GGT(配列番号3)・・・
遺伝子A-4・・・GGA TCG TAT CAT GGT(配列番号4)・・・
遺伝子A-5・・・GGA TCC TAT CAT GGT(配列番号5)・・・
遺伝子A-6・・・GGA TCT TAT CAT GGT(配列番号6)・・・
上記6つの遺伝子配列中、下線の塩基が異なっているが、この配列がコードするアミノ酸配列は、いずれも、GSYHG(配列番号7)で同一である。このような場合に、細胞内の遺伝子Aまたは遺伝子A産物(タンパク質)に、TALEを用いて同一の改変を導入する場合、従来の方法によると、下線を付した塩基を認識するリピート配列のRVDが、例えば、Tを認識するNG(Asn-Gly)、Cを認識するHD(His-Asp)、Aを認識するNI(Asn-Ile)またはGを認識するNN(Asn-Asn)で構成される4つのTALEを準備する必要があった。これに対し、本実施形態にかかる方法のように、下線を付した塩基を認識するRVDを、N(ここで、「N」はA、T、GまたはCを表す)を認識または許容するアミノ酸構成にすれば、遺伝子A-1~A-6の全ての認識配列に結合するTALEを作製することができる。また、下線の塩基を認識するRVDを、R(ここで、「R」はAまたはGを表す)を認識するアミノ酸構成にすれば、遺伝子A-3と遺伝子A-4の認識配列に結合するTALEを作製することができ、Y(ここで、「Y」はTまたはCを表す)を認識するアミノ酸構成にすれば、遺伝子A-1、遺伝子A-2、遺伝子A-5および遺伝子A-6の標的配列に結合するTALEを作製することができる。このように、上記事例において、本実施形態のRVDは、遺伝子A-1、遺伝子A-2、遺伝子A-3、遺伝子A-4、遺伝子A-5および遺伝子A-6をアライメントした場合、配列番号1~6の6番目の塩基、すなわち、遺伝子A-1、遺伝子A-2、遺伝子A-3、遺伝子A-4、遺伝子A-5および遺伝子A-6間で異なる塩基を認識することを特徴とする。
本実施形態のTALE-改変因子融合体のTALE部分と改変因子との結合は、ペプチド結合などによる直接結合であっても、リンカーなどを介した間接結合のいずれであってもよい。また、TALE-改変因子融合体のTALE部分、すなわち、DNA結合ドメインには、約34アミノ酸からなるアミノ酸配列の繰り返し構造が含まれている(以下、約34アミノ酸からなるアミノ酸配列を「リピート配列」とも記載する)。本実施形態で使用されるTALE部分に、通常2個以上、好ましくは、6個以上、より好ましくは、16個以上、かつ、通常36個以下、好ましくは24個以下、より好ましくは20個以下のリピート配列が含まれていてもよい。
ここで、「リピート配列」としては、例えば、以下の配列番号8、配列番号9、配列番号10、配列番号11、配列番号12もしくは配列番号13で表されるアミノ酸配列、または、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12もしくは配列番号13で表されるアミノ酸配列に欠失、置換または付加が起こったアミノ酸配列であって、各々、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12もしくは配列番号13で表されるアミノ酸配列と80%以上の配列同一性、好ましくは、90%以上の配列同一性を有するアミノ酸配列を挙げることができる。
リピート配列の例
LTPDQVVAIASXXGGKQALETVQRLLPVLCQDHG(配列番号8;「XX」はRVDを構成する2アミノ酸である。)
LTP(D/E/A)QVVAIASXXGGKQALETVQRLLPVLCQ(D/A)HG(配列番号9;「XX」はRVDを構成する2アミノ酸である。また、「D/E/A」はD、EまたはAであることを、「D/A」はDまたはAであることを示す。)
LTPDQVVAIASXXGGKQAL (E/A) T (V/M) Q (R/A) LLPVLCQDHG(配列番号10;「XX」はRVDを構成する2アミノ酸である。また、「E/A」はEまたはAであることを、「V/M」はVまたはMであることを、「R/A」はRまたはAであることを示す。)
LTPEQVVAIASXXGGRPALE(配列番号11;「XX」はRVDを構成する2アミノ酸である。)
LTPDQVVAIASXXGGKQALES(配列番号12;「XX」はRVDを構成する2アミノ酸である。)
LTPNQVVAIASXXGGKQALE(配列番号13;「XX」はRVDを構成する2アミノ酸である。)
なお、配列番号9、配列番号10または配列番号11のいずれかで表されるリピート配列は、TALEのDNA結合ドメインのうちC末端の単一のリピートとして用いられることがあり、他のリピート配列よりも短い配列(約20アミノ酸)である(例えば、WO2011/072246などを参照のこと)。
LTPDQVVAIASXXGGKQALETVQRLLPVLCQDHG(配列番号8;「XX」はRVDを構成する2アミノ酸である。)
LTP(D/E/A)QVVAIASXXGGKQALETVQRLLPVLCQ(D/A)HG(配列番号9;「XX」はRVDを構成する2アミノ酸である。また、「D/E/A」はD、EまたはAであることを、「D/A」はDまたはAであることを示す。)
LTPDQVVAIASXXGGKQAL (E/A) T (V/M) Q (R/A) LLPVLCQDHG(配列番号10;「XX」はRVDを構成する2アミノ酸である。また、「E/A」はEまたはAであることを、「V/M」はVまたはMであることを、「R/A」はRまたはAであることを示す。)
LTPEQVVAIASXXGGRPALE(配列番号11;「XX」はRVDを構成する2アミノ酸である。)
LTPDQVVAIASXXGGKQALES(配列番号12;「XX」はRVDを構成する2アミノ酸である。)
LTPNQVVAIASXXGGKQALE(配列番号13;「XX」はRVDを構成する2アミノ酸である。)
なお、配列番号9、配列番号10または配列番号11のいずれかで表されるリピート配列は、TALEのDNA結合ドメインのうちC末端の単一のリピートとして用いられることがあり、他のリピート配列よりも短い配列(約20アミノ酸)である(例えば、WO2011/072246などを参照のこと)。
RVDを構成するアミノ酸と認識塩基の対応関係については、いくつか報告がある(例えば、特許文献2、非特許文献3、非特許文献4など)。例えば、HDはCを認識し、NGはTを認識し、NIはAを認識し、NNはGまたはAを認識し、NSはA、T、CまたはGを認識し、HGはTを認識し、IGはTを認識し、HAはCを認識し、NDはCを認識し、NKはGを認識し、HIはCを認識し、HNはGを認識し、NAはGを認識し、SNはGまたはAを認識し、YGはTを認識することが報告されている。
また、RVDは、Nを認識または許容するRV、CS、VR、NA、S*(「*」はRVDの第2位値がギャップであることを示す。)、RH、RLまたはRTで構成されており、Mを認識するHCまたはKCで構成されており、Vを認識するHS、HT、HV、KVまたはRCで構成されており、RまたはVを認識するNTで構成されていてもよい。
また、RVDは、Nを認識または許容するRV、CS、VR、NA、S*(「*」はRVDの第2位値がギャップであることを示す。)、RH、RLまたはRTで構成されており、Mを認識するHCまたはKCで構成されており、Vを認識するHS、HT、HV、KVまたはRCで構成されており、RまたはVを認識するNTで構成されていてもよい。
本実施形態にかかる遺伝子改変方法および細胞の作製方法(後述)は、原核生物、真核生物いずれの遺伝子または細胞についても適用することができる。
遺伝子に関し、真核生物においては、核遺伝子のみならず、ミトコンドリア遺伝子や植物の色素体(例えば、葉緑体)遺伝子に対しても適用することができる。核遺伝子、ミトコンドリア遺伝子または色素体遺伝子中のDNAの標的塩基を特異的に改変するためには、改変因子に標的塩基を認識させる必要がある。そのために、TALE-改変因子融合体を核、ミトコンドリアまたは色素体へ導入する。より具体的には、例えば、TALE-改変因子融合体タンパク質をコードするDNAを核ゲノムDNAに導入し(核ゲノムDNAに組込み)、細胞質で発現したTALE-改変因子融合体タンパク質を、核、色素体またはミトコンドリア内に輸送(導入)してもよい。この場合、TALE-改変因子融合体タンパク質に、各種シグナルペプチド(核移行シグナルペプチド、ミトコンドリア移行シグナルペプチドまたは色素体移行シグナルペプチド)を付加(結合)させた融合体をコードするDNAを核ゲノムDNAに導入することが望ましい。
遺伝子に関し、真核生物においては、核遺伝子のみならず、ミトコンドリア遺伝子や植物の色素体(例えば、葉緑体)遺伝子に対しても適用することができる。核遺伝子、ミトコンドリア遺伝子または色素体遺伝子中のDNAの標的塩基を特異的に改変するためには、改変因子に標的塩基を認識させる必要がある。そのために、TALE-改変因子融合体を核、ミトコンドリアまたは色素体へ導入する。より具体的には、例えば、TALE-改変因子融合体タンパク質をコードするDNAを核ゲノムDNAに導入し(核ゲノムDNAに組込み)、細胞質で発現したTALE-改変因子融合体タンパク質を、核、色素体またはミトコンドリア内に輸送(導入)してもよい。この場合、TALE-改変因子融合体タンパク質に、各種シグナルペプチド(核移行シグナルペプチド、ミトコンドリア移行シグナルペプチドまたは色素体移行シグナルペプチド)を付加(結合)させた融合体をコードするDNAを核ゲノムDNAに導入することが望ましい。
TALE-改変因子融合体タンパク質を核内に輸送する方法として、TALE-改変因子融合タンパク質に核移行(局在)シグナル(nuclear localization signal/sequence:NLS)ペプチドを融合させて発現させる方法を挙げることができる。本実施形態において使用可能な核移行シグナルペプチドは、限定はしないが、例えば、SV40ラージT抗原のNLSペプチド(PKKKRKV、配列番号14)、ヌクレオプラズミンのNLSペプチド(AVKRPAATKKAGQAKKKKLD、配列番号15)、EGL-13のNLSペプチド(MSRRRKANPTKLSENAKKLAKEVEN、配列番号16)、c-MycのNLSペプチド(PAAKRVKLD、配列番号17)、TUSタンパク質のNLSペプチド(KLKIKRPVK、配列番号18)などを挙げることができる。これら以外にも使用可能な核移行シグナルペプチドは存在しており、例えば、核移行シグナルのデータベースであるNLSdb(https://rostlab.org/services/nlsdb/browse/signals)などを参照のこと。
TALE-改変因子融合体タンパク質をミトコンドリア内に輸送する方法として、TALE-改変因子融合体タンパク質にミトコンドリア移行シグナルペプチド(明確な高次構造や配列相同性をもたないが、例えば、塩基性アミノ酸と複数の疎水性アミノ酸が交互に現れる特徴を示すペプチドなど)を融合させて発現させる方法を挙げることができる。本実施形態において使用可能なミトコンドリア移行シグナルペプチドは、動物細胞の場合、ヒトのATPase Fb1サブユニット由来のシグナルペプチド(Payamら, EMBO Mol Med, 6:458-466 2014)、ヒトのシトクロームcオキシダーゼ 第8サブユニット(Bacmanら, Gene Therapy, 17:713-720 2010) などを例示することができ、植物細胞の場合、例えば、シロイヌナズナのATPase δ’サブユニット由来のシグナルペプチド(MFKQASRLLS RSVAAASSKS VTTRAFSTEL PSTLDS、配列番号19)、イネのALDH2a遺伝子産物由来のシグナルペプチド(MAARRAASSL LSRGLIARPS AASSTGDSAI LGAGSARGFL PGSLHRFSAA PAAAATAAAT EEPIQPPVDV KYTKLLINGN FVDAASGKTF ATVDP、配列番号20)およびエンドウのシトクロームcオキシダーゼVb-3由来のシグナルペプチド(MWRRLFTSPH LKTLSSSSLS RPRSAVAGIR CVDLSRHVAT QSAASVKKRV EDVV、配列番号21)の他、シロイヌナズナのATPase βサブユニット由来のシグナルペプチドおよびchaperonin CPN-60由来のシグナルペプチド(Loganら, Journal of Experimental Botany, 50 865-871 2000およびイネのF1F0-ATPase inhibitor proteinのシグナルペプチド(Nakazonoら, Plant, 210 188-194 2000)などを挙げることができる。
TALE-改変因子融合体タンパク質を色素体内に輸送する方法として、TALE-改変因子融合体タンパク質に色素体移行シグナルペプチド(明確な高次構造や配列相同性をもたないが、例えば、塩基性アミノ酸と複数の疎水性アミノ酸に富み酸性アミノ酸が少なく、タンパク質アミノ酸配列のN末端に付加することで葉緑体や色素体に特異的に選別輸送される機能を示すペプチドなど)を融合させて発現させる方法を挙げることができる。本実施形態において使用可能な色素体移行シグナルペプチドは、例えば、植物色素体に局在するタンパク質が持つシグナルペプチドが好ましい。好ましいシグナルペプチドとしては、限定はしないが、例えば、RECA1、RBCS、CAB、NEP、SIG1~5、GUN2~5などのタンパク質由来のシグナルペプチドの他、RPL12およびRPS9などの核コード葉緑体リボソームタンパク質由来のシグナルペプチド、核コード葉緑体tRNAアミノアシル転移因子由来のシグナルペプチド、核コード葉緑体ヒートショックタンパク質由来のシグナルペプチド、FtsZ、FtsH、MinC、MinD、MinEなどタンパク質由来のシグナルペプチド、核コード葉緑体光合成関連酵素複合体酵素群由来のシグナルペプチド、核コード色素体脂質代謝酵素群由来のシグナルペプチド、核コードチラコイド構成タンパク質群由来のシグナルペプチドなどがある。色素体移行シグナルペプチドについては、例えば、von HEIJNEら, European Journal of Biochemistry, 180, 535-545 1989などを参照のこと。
場合によっては、TALE-改変因子融合体タンパク質をコードするプラスミドDNA、mRNAおよびTALE-改変因子融合体タンパク質自体を直接細胞内へ導入する方法(導入方法としては、例えば、ウィルス法、パーティクルガン法、PEG法、細胞膜透過性ペプチド法など)も使用可能である。
本実施形態にかかるTALE-改変因子融合体タンパク質(シグナルペプチドが結合されたタンパク質も含んでもよい)をコードするDNAは、当該技術分野において公知の方法により作製することができる。あるいは、市販のキットを使用して作製してもよい。より具体的には、TALE部分の作製に関しては、例えば、Golden Gate法(Cermakら, Nucleic Acids Res. 39:e82 2011)に基づくキット、その改変法(Sakumaら, Genes Cells 18:315-326 2013)に基づくキット、例えば、FusX TALEN assembly system(Addgene kit #1000000063)などを挙げることができる。これらのキットは、例えば、Addgeneなどから入手可能である。
第2の実施形態は、細胞内における同一のタンパク質をコードする複数の遺伝子が改変された細胞の作製方法であって、N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVDを含むリピート配列を少なくとも1つ含む1種類のTALE-改変因子融合体を、細胞内に導入することを含む方法(以下「本実施形態にかかる細胞の作製方法」とも記載する)である。第2の実施形態で作製された細胞は、当該細胞が由来する生物の変異個体または変異系統の作製のために使用してもよい。従って、本実施形態には、第2の実施形態にかかる方法で作製された細胞が含まれる他、当該細胞を含む生物個体も含まれる。例えば、植物を例にすると、第2の実施形態にかかる方法で作製された植物細胞、当該植物細胞を含む種子もしくは植物(植物成体)も本実施形態に含まれる。
本実施形態(第1および第2の実施形態)における「細胞」は、原核生物の細胞および真核生物の細胞のいずれであってもよい。原核生物の細胞としては、特に限定はしないが、例えば、エシェリヒア属菌(エシェリヒア・コリ(Escherichia coli)など)、バチルス属菌(バチルス・サブチルス(Bacillus subtilis)など)、アグロバクテリウム(例えば、リゾビウム属菌(例えば、Rhizobium tumefacience、Rhizobium rhizogenes)など)を用いてもよい。真核生物の細胞としては、特に限定はしないが、例えば、酵母[サッカロマイセス セレビシエ(Saccharomyces cerevisiae)など]、ほ乳動物細胞の株化された細胞、ほ乳動物の生体から採取した初代培養細胞(マウス胎児線維芽細胞MEF、初代培養神経細胞など)、ES細胞、iPS細胞、さらに、植物細胞としては、植物由来の培養細胞の他、植物由来の細胞(例えば、胚珠由来の細胞など)であってもよく、さらに、種々の形態の植物由来の植物細胞、例えば、懸濁培養細胞、プロトプラスト、葉の切片、カルス、未熟胚、花粉等が含まれる。
ほ動物としては、特に限定されず、例えば、マウス、ラット、ハムスター、モルモット、ウサギ、ブタ、ウシ、ヤギ、ウマ、ヒツジ、イヌ、ネコ、ヒトもしくは非ヒトの霊長類(例えば、サル、カニクイザル、アカゲザル、マーモセット、オランウータン、チンパンジーなど)などを挙げることができる。ほ乳動物以外では、例えば、線虫(C. elegans)、魚類(ゼブラフィッシュ)、両生類(アフリカツメガエル、ネッタイツメガエル)などを挙げることができる。
また、植物としては、特に限定されず、種子植物であれば、いかなるものであってもよい。あえて例示するならば、例えば、イネ科植物、例えば、イネ、コムギ、トウモロコシ、オオムギ、ライムギ、ソルガムなど、あるいは、アブラナ科の植物、例えば、ミヤマナズナ属、シロイヌナズナ属(シロイヌナズナなど)、セイヨウワサビ属(セイヨウワサビなど)、イワナズナ属、アブラナ属[タアサイ、カラシナ、タカナ、セイヨウアブラナ、ミズナ、ハゴロモカンラン(ケール)、ハボタン、カリフラワー、キャベツ、メキャベツ(コモチカンラン)、ブロッコリー、チンゲンサイ、ノザワナ、アブラナ、ハクサイ、コマツナ、カブなど]、アマナズナ属、ナズナ属、タネツケバナ属、カラクサナズナ属、エダウチナズナ属、イヌナズナ属、キバナスズシロ属(ルッコラなど)、ハナダイコン属、ダイコンモドキ属、マガリバナ属、イオノプシディウム属、マメグンバイナズナ属、ニワナズナ属、ゴウダソウ属、マルコルミア属、アラセイトウ属、オランダガラシ属、オオアラセイトウ属、ダイコン属(ダイコン、ハツカダイコンなど)、ミヤガラシ属、イヌガラシ属、キハナハタザオ属、グンバイナズナ属、ワサビ属(ワサビなど)などに属する植物を使用することができる。さらに、トマト、ジャガイモ、ピーマン、シシトウ、ペチュニアなどのナス科植物、ヒマワリ、タンポポなどのキク科植物、ヒルガオ、サツマイモなどのヒルガオ科植物、コンニャク、タロイモ、サトイモ、ヤツガシラなどのサトイモ科植物、ダイズ、アズキ、インゲンなどマメ科植物、カボチャ、キュウリ、メロンなどのウリ科植物、タマネギ、ネギ、ニンニクなどのヒガンバナ科植物などを例示することができる。植物由来の培養細胞の他、植物体中の細胞も含まれる。さらに、種々の形態の植物由来の植物細胞、例えば、懸濁培養細胞、プロトプラスト、葉の切片、カルス、未熟胚、花粉等が含まれる。
第3の実施形態は、TALEのリピート配列を少なくとも1つ含むDNA結合タンパク質であって、当該リピート配列に含まれるRVDが、
Nを認識または許容するRV、CS、VR、NA、S*、RH、RLまたはRTで構成されており、
Mを認識するHCまたはKCで構成されており、
Vを認識するHS、HT、HV、KVまたはRCで構成されており、または、
RまたはVを認識するNTで構成されている、前記タンパク質である。
第3の実施形態にかかるタンパク質は、複数種の塩基を認識または許容する新規のRVDを少なくとも1つ含むことを特徴とする。本実施形態におけるタンパク質のTALE部分、すなわち、DNA結合ドメインには、約34アミノ酸からなるアミノ酸配列の繰り返し構造が含まれている(以下、約34アミノ酸からなるアミノ酸配列を「リピート配列」とも記載する)。本実施形態で使用されるTALE部分に、通常2個以上、好ましくは、6個以上、より好ましくは、16個以上、かつ、通常36個以下、好ましくは24個以下、より好ましくは20個以下のリピート配列が含まれていてもよい。
Nを認識または許容するRV、CS、VR、NA、S*、RH、RLまたはRTで構成されており、
Mを認識するHCまたはKCで構成されており、
Vを認識するHS、HT、HV、KVまたはRCで構成されており、または、
RまたはVを認識するNTで構成されている、前記タンパク質である。
第3の実施形態にかかるタンパク質は、複数種の塩基を認識または許容する新規のRVDを少なくとも1つ含むことを特徴とする。本実施形態におけるタンパク質のTALE部分、すなわち、DNA結合ドメインには、約34アミノ酸からなるアミノ酸配列の繰り返し構造が含まれている(以下、約34アミノ酸からなるアミノ酸配列を「リピート配列」とも記載する)。本実施形態で使用されるTALE部分に、通常2個以上、好ましくは、6個以上、より好ましくは、16個以上、かつ、通常36個以下、好ましくは24個以下、より好ましくは20個以下のリピート配列が含まれていてもよい。
ここで、「リピート配列」としては、例えば、以下の配列番号8、配列番号9、配列番号10、配列番号11、配列番号12もしくは配列番号13で表されるアミノ酸配列、または、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12もしくは配列番号13で表されるアミノ酸配列に欠失、置換または付加が起こったアミノ酸配列であっ、各々、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12もしくは配列番号13で表されるアミノ酸配列と80%以上の配列同一性、好ましくは、90%以上の配列同一性を有するアミノ酸配列を挙げることができる。
第3の実施形態にかかるタンパク質は、他の機能性タンパク質、すなわち、TALEとは異なる機能または活性を有するタンパク質(またはポリペプチド)と融合(または結合)していてもよい。第3の実施形態にかかるタンパク質と機能性タンパク質との結合は、ペプチド結合などによる直接結合であっても、リンカーなどを介した間接結合のいずれであってもよい。当該機能性タンパク質は、核酸配列を改変する機能を有するタンパク質の全部または一部分であってもよい。当該機能性タンパク質の他の例としては、例えば、転写活性調節因子(転写活性化因子または転写抑制因子など)などの全部または一部、エピゲノム制御因子の全部または一部、蛍光タンパク質、発光タンパク質、色素タンパク質の全体または一部分などを挙げることができる。ここで「一部分」とは、例えば、それ自体で目的の機能を発揮するか、または二量体を形成することによって目的の機能を発揮する部分のことである。
第4の実施形態は、第1の実施形態および第2の実施形態で使用される、TALE-改変因子融合体または第3の実施形態にかかるタンパク質もしくは当該タンパク質と機能性タンパク質との融合体(以下これらの融合体またはタンパク質を「本実施形態にかかるタンパク質」とも記載する)をコードする核酸(DNAなど)である。第1の実施形態および第2の実施形態で使用されるTALE-改変因子融合体、ならびに、第3の実施形態にかかるタンパク質および当該タンパク質と機能性タンパク質との融合体は、これをコードする核酸(第4の実施形態にかかる核酸)を適当な発現用ベクターに組込み、該発現用ベクターによって適当な宿主細胞を形質転換または形質移入し、これを適当な培地中で培養し、これらのタンパク質を発現させ、精製することで調製することができる。
本実施形態にかかるタンパク質発現させる宿主細胞としては、例えば、細菌細胞(例えば、Escherichia coli B strain、E. coli Kl2 strain、Corynebacterium ammoniagenes、C. glutamicum、Serratia liquefaciens、Streptomyces lividans、Pseudomonas putidaなど)、カビ(例えば、Penicillium camembertii、Acremonium chrysogenumなど)、動物細胞、植物細胞、バキュロウイルス/昆虫細胞または酵母細胞(例えば、Saccharomyces cerevisiae およびPichia pastorisなど)を使用し、これらの細胞内で発現させることができる。
本実施形態にかかるタンパク質を発現させるための発現用ベクターは、各種宿主細胞に適したベクターを用いることができる。当該発現用ベクターは、第1および第2の実施形態にかかる方法において、細胞内でタンパク質を発現させる場合にも使用することができる。発現用ベクターとしては、例えば、pBR322、pBR325、pUC118、pETなど(大腸菌宿主)、pEGF-C、pEGF-Nなど(動物細胞宿主)、pVL1392、pVL1393など(昆虫細胞宿主、バキュロウイルスベクター)、pG-1、Yep13またはpPICZなど(酵母細胞宿主)、植物細胞用のバイナリーベクター(pBG、pBI、pGreen、pCAMBIA、pLC、pSB11、pSB200、pRI)などを使用することができる。これらの発現ベクターは、各々のベクターに適した、複製開始点、選択マーカーおよびプロモーターを有しており、必要に応じて、エンハンサー、転写終結配列(ターミネーター)、リボソーム結合部位およびポリアデニル化シグナル等を有していてもよい。さらに、発現ベクターには、発現したポリペプチドの精製を容易にするため、FLAGタグ、Hisタグ、HAタグおよびGSTタグなどを融合させて発現させるための塩基配列が挿入されていてもよい。
発現用ベクターの作製は、当業者に公知の手法により実施することができ、適宜、市販のキットなどを使用して行うこともできる。また、本実施形態にかかる発現ベクターは単離または精製されていることが好ましい。
発現用ベクターの作製は、当業者に公知の手法により実施することができ、適宜、市販のキットなどを使用して行うこともできる。また、本実施形態にかかる発現ベクターは単離または精製されていることが好ましい。
発現させたタンパク質を培養菌体または培養細胞から抽出する際には、培養後、公知の方法で菌体または培養細胞を集め、これを適当な緩衝液に懸濁し、超音波、リゾチームおよび/または凍結融解などによって菌体または細胞を破壊したのち、遠心分離や濾過により、可溶性抽出液を取得する。特に、培養細胞を宿主として用いる場合は、培養上清中に発現させたタンパク質を、上清を回収する事により取得する方が望ましい。得られた抽出液または培養上清から、公知の分離・精製法を適切に組み合わせて目的のタンパク質を取得することができる。公知の分離、精製法としては、塩析や溶媒沈澱法などの溶解度を利用する方法、透析法、限外ろ過法、ゲルろ過法、SDS-PAGE等の主として分子量の差を利用する方法、イオン交換クロマトグラフィーなどの電荷の差を利用する方法、アフィニティクロマトグラフィーなどの特異的親和性を利用する方法(例えば、GSTタグと共にポリペプチドを発現させた場合にはグルタチオンを担体に結合させた樹脂を、Hisタグと共にポリペプチドを発現させた場合にはNi-NTA樹脂やCoベースの樹脂を、HAタグと共にポリペプチドを発現させた場合には抗HA抗体樹脂を、FLAGタグと共にポリペプチドを発現させた場合には、抗FLAG抗体結合樹脂などを使用する方法)、逆相高速液体クロマトグラフィーなどの疎水性の差を利用する方法または等電点電気泳動法などの等電点の差を利用する方法などが用いられる。
本明細書において引用されたすべての文献の開示内容は、全体として明細書に参照により組み込まれる。また、本明細書全体において、単数形の「a」、「an」、および「the」の単語が含まれる場合、文脈から明らかにそうでないことが示されていない限り、単数のみならず複数のものを含むものとする。
以下に実施例を示してさらに本発明の説明を行うが、実施例は、あくまでも本発明の実施形態の例示にすぎず、本発明の範囲を限定するものではない。
以下に実施例を示してさらに本発明の説明を行うが、実施例は、あくまでも本発明の実施形態の例示にすぎず、本発明の範囲を限定するものではない。
1.材料と方法
1-1.N認識モジュールプラスミドの作製
Platinum Gate TALEN kit(Addgene, Kit # 1000000043)に含まれるモジュールプラスミド(p1HD/#50664、p2HD/#50668、p3HD/#50672、p4HD/#50676)をテンプレートとして、表1に記載のプライマーセットを用いてPCRすることで、HDコードをRVコードに変化させたアンプリコンを作製し、Pvu Iで切断した元のベクターとともに、In-Fusion HD Cloning反応(Takara)を行うことでp1-4のRVモジュールプラスミドを作製した。また、DNA結合ドメインのC末端のRVDリピート配列を持つエントリーベクター(E1_pENTR_L1-L4_NI_G1397-DddtoxA-N/#171727)を鋳型に同様のPCRを行い、同じベクターをKpn IおよびXba Iで制限酵素処理後、精製した線状化ベクターおよび精製したPCR産物を用いてIn-Fusion HD Cloning反応を行った。得られたp1RV、p2RV、p3RV、p4RVモジュールプラスミドおよびC末端のRVリピート配列を持つエントリーベクター(E1_pENTR_L1-L4_RV_G1397-DddtoxA-N)について、RVDリピート部分のDNA配列をサンガーシーケンス (Eurofins Genomicsに委託) で確認した。
1-1.N認識モジュールプラスミドの作製
Platinum Gate TALEN kit(Addgene, Kit # 1000000043)に含まれるモジュールプラスミド(p1HD/#50664、p2HD/#50668、p3HD/#50672、p4HD/#50676)をテンプレートとして、表1に記載のプライマーセットを用いてPCRすることで、HDコードをRVコードに変化させたアンプリコンを作製し、Pvu Iで切断した元のベクターとともに、In-Fusion HD Cloning反応(Takara)を行うことでp1-4のRVモジュールプラスミドを作製した。また、DNA結合ドメインのC末端のRVDリピート配列を持つエントリーベクター(E1_pENTR_L1-L4_NI_G1397-DddtoxA-N/#171727)を鋳型に同様のPCRを行い、同じベクターをKpn IおよびXba Iで制限酵素処理後、精製した線状化ベクターおよび精製したPCR産物を用いてIn-Fusion HD Cloning反応を行った。得られたp1RV、p2RV、p3RV、p4RVモジュールプラスミドおよびC末端のRVリピート配列を持つエントリーベクター(E1_pENTR_L1-L4_RV_G1397-DddtoxA-N)について、RVDリピート部分のDNA配列をサンガーシーケンス (Eurofins Genomicsに委託) で確認した。
1-2.TALECDのDNA結合ドメインの設計
シロイヌナズナゲノムのβチューブリン遺伝子tub4では、Ser351Pheを引き起こす塩基置換により表層細胞列および一次根のねじれの表現型が生じることが知られている(Ishidaら, Proceedings of the National Academy of Sciences, 104: 8544-8549 2007)。このセリン残基はシロイヌナズナゲノムに存在するβチューブリン遺伝子9つの全てで保存されており、この該当するセリン残基を標的として一斉塩基置換変異導入を目指した。シトシンからチミンへの塩基置換によって、このセリン残基についてSerからPhe、またはSerからLeuへの変異を引き起こす標的シトシン塩基を含む15塩基長の標的ウィンドウ(TALE leftおよびTALE rightの認識配列に挟まれた配列)を設定した(図1a)。
この実験で用いたTALECDは、platinum TALENのscaffoldを改変して作製し (Nakazatoら, Nature Plants 7:906-913 2021)、このscaffoldはTALEのDNA結合ドメインの認識配列の5'に隣接する塩基がチミンのときに認識配列との親和性が高くなる傾向を示す(Millerら, Nature Biotechnology, 29:143-148 2011)。認識配列の5'にチミンが隣接するように、左右それぞれ16、19塩基長の認識配列を設定し、認識配列を構成する塩基に対応するリピート配列を配する左右のTALE結合ドメインを設計した(図1aおよびa)。
シロイヌナズナゲノムのβチューブリン遺伝子tub4では、Ser351Pheを引き起こす塩基置換により表層細胞列および一次根のねじれの表現型が生じることが知られている(Ishidaら, Proceedings of the National Academy of Sciences, 104: 8544-8549 2007)。このセリン残基はシロイヌナズナゲノムに存在するβチューブリン遺伝子9つの全てで保存されており、この該当するセリン残基を標的として一斉塩基置換変異導入を目指した。シトシンからチミンへの塩基置換によって、このセリン残基についてSerからPhe、またはSerからLeuへの変異を引き起こす標的シトシン塩基を含む15塩基長の標的ウィンドウ(TALE leftおよびTALE rightの認識配列に挟まれた配列)を設定した(図1a)。
この実験で用いたTALECDは、platinum TALENのscaffoldを改変して作製し (Nakazatoら, Nature Plants 7:906-913 2021)、このscaffoldはTALEのDNA結合ドメインの認識配列の5'に隣接する塩基がチミンのときに認識配列との親和性が高くなる傾向を示す(Millerら, Nature Biotechnology, 29:143-148 2011)。認識配列の5'にチミンが隣接するように、左右それぞれ16、19塩基長の認識配列を設定し、認識配列を構成する塩基に対応するリピート配列を配する左右のTALE結合ドメインを設計した(図1aおよびa)。
1-3.nTALECD発現コンストラクト作製
nTALECDのDNA結合ドメインのアセンブリーにはPlatinum Gate TALEN kit(Addgene、ID: #1000000043、Sakumaら, Scientific Reports, 3:3379 2013)を用い、2段階のクローニングを行った。最初のステップでは、Platinum Gate TALENの16種類のモジュールプラスミド、および前項で作製したp1-4のRVモジュールプラスミドを組み合わせてアレイプラスミドにBsaI-HFv2(NEB)存在下でライゲーション反応し、連続する4つのRVDリピート配列を任意の組み合わせで持つプラスミドをクローニングした(図5a左)。2つ目のステップでは、DNA結合ドメインのC末端のRVDリピート、シチジンデアミナーゼのN末端またはC末端およびウラシルグリコシラーゼインヒビターが連結したタンパク質(あるいは、Fok Iヌクレアーゼ等)のコード配列を有するエントリーベクター(例えば、E1_pENTR_L1-L4_NI_G1397-DddtoxA-N/#171727、pENTR_E1_pF5A_L1-L4/#158728)に、最初のステップで作製した複数のアレイプラスミドをEsp3I(Thermo Fisher)存在下でライゲーション反応を行うことで組み込んだ(図5a右)。
左右のTALECDのタンパク質全長コード配列を持つそれぞれのエントリーベクター(図5b、Entry vector 1およびEntry vector 3)を、シロイヌナズナRPS5Aプロモーター・核局在化シグナル(SV40NLS)・HSPターミネーター配列を有するエントリーベクター(Entry vector 2)とデスティネーションベクターおよびLR Clonase II Plus enzyme(Thermo Fisher)を混合し、multisite Gateway LR反応(Thermo Fisher)で左右TALECDタンパク質をタンデムに発現するバイナリーベクターを作製した(図5b)。
nTALECDのDNA結合ドメインのアセンブリーにはPlatinum Gate TALEN kit(Addgene、ID: #1000000043、Sakumaら, Scientific Reports, 3:3379 2013)を用い、2段階のクローニングを行った。最初のステップでは、Platinum Gate TALENの16種類のモジュールプラスミド、および前項で作製したp1-4のRVモジュールプラスミドを組み合わせてアレイプラスミドにBsaI-HFv2(NEB)存在下でライゲーション反応し、連続する4つのRVDリピート配列を任意の組み合わせで持つプラスミドをクローニングした(図5a左)。2つ目のステップでは、DNA結合ドメインのC末端のRVDリピート、シチジンデアミナーゼのN末端またはC末端およびウラシルグリコシラーゼインヒビターが連結したタンパク質(あるいは、Fok Iヌクレアーゼ等)のコード配列を有するエントリーベクター(例えば、E1_pENTR_L1-L4_NI_G1397-DddtoxA-N/#171727、pENTR_E1_pF5A_L1-L4/#158728)に、最初のステップで作製した複数のアレイプラスミドをEsp3I(Thermo Fisher)存在下でライゲーション反応を行うことで組み込んだ(図5a右)。
左右のTALECDのタンパク質全長コード配列を持つそれぞれのエントリーベクター(図5b、Entry vector 1およびEntry vector 3)を、シロイヌナズナRPS5Aプロモーター・核局在化シグナル(SV40NLS)・HSPターミネーター配列を有するエントリーベクター(Entry vector 2)とデスティネーションベクターおよびLR Clonase II Plus enzyme(Thermo Fisher)を混合し、multisite Gateway LR反応(Thermo Fisher)で左右TALECDタンパク質をタンデムに発現するバイナリーベクターを作製した(図5b)。
1-4.形質転換および形質転換体のスクリーニング
nTALECD発現カセットを持つバイナリーベクターを、エレクトロポレーション法でアグロバクテリウム菌株C58C1(pMP90)に導入した。シロイヌナズナ野生型Col-0にバイナリーベクターを導入したアグロバクテリウムを花序浸し法で感染させ(CloughおよびBent, The Plant Journal, 16:735-743 1998)、形質転換した。形質転換したバイナリーベクターは種子で特異的に発現するOle1プロモーター::Ole1-GFPの発現カセットを持つため、このバイナリーベクターの形質転換種子はGFP蛍光を発する(Shimadaら, The Plant Journal, 61:519-528 2010)。アグロバクテリウムに感染させた個体の自殖後代種子のうち、GFP蛍光を呈する種子を125 μg/mLクラフォラン、10 mg/mLスクロース入り1/2MS培地に播種し、得られたT1実生を解析に用いた。
nTALECD発現カセットを持つバイナリーベクターを、エレクトロポレーション法でアグロバクテリウム菌株C58C1(pMP90)に導入した。シロイヌナズナ野生型Col-0にバイナリーベクターを導入したアグロバクテリウムを花序浸し法で感染させ(CloughおよびBent, The Plant Journal, 16:735-743 1998)、形質転換した。形質転換したバイナリーベクターは種子で特異的に発現するOle1プロモーター::Ole1-GFPの発現カセットを持つため、このバイナリーベクターの形質転換種子はGFP蛍光を発する(Shimadaら, The Plant Journal, 61:519-528 2010)。アグロバクテリウムに感染させた個体の自殖後代種子のうち、GFP蛍光を呈する種子を125 μg/mLクラフォラン、10 mg/mLスクロース入り1/2MS培地に播種し、得られたT1実生を解析に用いた。
1-5.生育条件およびジェノタイピング
T1種子は4℃で低温処理後、人工気象器に移し22℃、長日条件(16時間明期/8時間暗期)で育成した。種子低温処理後14日目の実生について本葉1枚からトータルDNAを抽出した。このトータルDNAを鋳型にPCRサンガーシーケンスを行い、標的配列のシーケンス波形データをGeneious Prime(v. 2022. 1.1)上で解析し、標的塩基についてジェノタイピングした。PCRアンプリコンの増幅およびサンガーシーケンスに使用したプライマーを表2に示す。
T1種子は4℃で低温処理後、人工気象器に移し22℃、長日条件(16時間明期/8時間暗期)で育成した。種子低温処理後14日目の実生について本葉1枚からトータルDNAを抽出した。このトータルDNAを鋳型にPCRサンガーシーケンスを行い、標的配列のシーケンス波形データをGeneious Prime(v. 2022. 1.1)上で解析し、標的塩基についてジェノタイピングした。PCRアンプリコンの増幅およびサンガーシーケンスに使用したプライマーを表2に示す。
2.結果
2-1.複数のSNPを有する遺伝子配列を同時に認識または許容するTALEの設計
本明細書に開示する一連の実験では、実際の植物体において、通常使われていないRVDを有するリピート配列に、複数の異なる塩基を認識させることを試みた。また、同じ遺伝子ファミリーに分類されるが、若干、塩基配列が異なるいわゆる多重遺伝子について、複数塩基認識性のRVDリピートを用いてSNPを許容することで、ゲノム編集による一塩基変異を複数遺伝子座(若干塩基配列が異なる遺伝子座)に一斉導入できるか検証した。
シロイヌナズナゲノムに存在するβチューブリン遺伝子9つの全てにおいて保存されているTUB2、TUB3、TUB4、TUB6、TUB7、TUB8、TUB9のSer351、およびTUB1、TUB5のSer352において、nTALECDを用いてPheまたはLeuへの変異を引き起こすことを試みた(図1a)。図1aの右図には、各TALE(TALE+およびTUB4-specific TALE)によって認識される標的配列の塩基のうち、各遺伝子の配列がどれくらいミスマッチなく認識されるか(ただしTALE+でのN認識RVDリピート認識塩基は除く)を示している。
2-1.複数のSNPを有する遺伝子配列を同時に認識または許容するTALEの設計
本明細書に開示する一連の実験では、実際の植物体において、通常使われていないRVDを有するリピート配列に、複数の異なる塩基を認識させることを試みた。また、同じ遺伝子ファミリーに分類されるが、若干、塩基配列が異なるいわゆる多重遺伝子について、複数塩基認識性のRVDリピートを用いてSNPを許容することで、ゲノム編集による一塩基変異を複数遺伝子座(若干塩基配列が異なる遺伝子座)に一斉導入できるか検証した。
シロイヌナズナゲノムに存在するβチューブリン遺伝子9つの全てにおいて保存されているTUB2、TUB3、TUB4、TUB6、TUB7、TUB8、TUB9のSer351、およびTUB1、TUB5のSer352において、nTALECDを用いてPheまたはLeuへの変異を引き起こすことを試みた(図1a)。図1aの右図には、各TALE(TALE+およびTUB4-specific TALE)によって認識される標的配列の塩基のうち、各遺伝子の配列がどれくらいミスマッチなく認識されるか(ただしTALE+でのN認識RVDリピート認識塩基は除く)を示している。
TALE+ 8NのTALE leftのリピート配列の構成を例に、複数のSNPが存在する配列を同時に認識するDNA結合ドメインの設計を説明する(図1b)。標的であるTUB1、TUB2、TUB3、TUB4の該当のTALE認識配列(リピート配列が結合する16塩基長+5'に隣接する1塩基)のうち、1、4、13番目の塩基の構成が遺伝子間で異なっている。TALE leftのDNA結合ドメインは、この3箇所を従来用いられないRVというRVDを含むリピートで認識するように設計した。
2-2.変異を導入したT1個体の解析
nTALECDの発現ベクターを核ゲノムに導入した形質転換第一世代 (T1世代) について、種子低温処理後14日目の時点で標的ウィンドウに変異が導入されているかをPCRサンガーシーケンスで確認した。図2は、代表個体 (#17) のサンガーシーケンスの波形であり、TUB1、TUB2、TUB3およびTUB4の4つの標的遺伝子座で標的塩基への部分的、もしくは完全(ホモ)な塩基置換 (C > T) が生じたことを示している。
nTALECDの発現ベクターを核ゲノムに導入した形質転換第一世代 (T1世代) について、種子低温処理後14日目の時点で標的ウィンドウに変異が導入されているかをPCRサンガーシーケンスで確認した。図2は、代表個体 (#17) のサンガーシーケンスの波形であり、TUB1、TUB2、TUB3およびTUB4の4つの標的遺伝子座で標的塩基への部分的、もしくは完全(ホモ)な塩基置換 (C > T) が生じたことを示している。
TALE+ 8Nペア、またはTUB4-specificペアのコンストラクトを導入したT1世代で、各βチューブリン遺伝子の標的塩基に対して、変異が導入された個体数とその割合をまとめた(図3)。TUB4-specificペアによって標的のTUB4には高効率で変異が導入されたのに対し、他の8つのβチューブリン遺伝子ではTUB8に変異が導入された1個体を除き、変異が検出されなかった(図3b)。これに対してTALE+ 8Nペアの場合、標的とした4つのβチューブリン遺伝子について複数の個体で変異が導入されており、また、標的ではない5つのβチューブリン遺伝子のうち、TUB5、TUB6およびTUB7についても変異が導入されている個体が見られた(図3a)。
次に、変異が導入されたβチューブリン遺伝子の数を各T1個体で調べ、編集された遺伝子数に対する個体数の割合をまとめた(図4)。TUB4-specificペアによって変異が導入された遺伝子数は、TUB4単独の1遺伝子、およびTUB4とTUB8の2遺伝子であったのに対し、TALE+ 8Nペアでは1遺伝子~6遺伝子の間でばらつきがあった。
以上、図2~図4に示す結果より、N認識RVDリピートを用いた単独のTALECDペアが、従来の各塩基特異的RVDリピートのみを用いる場合と比較して認識配列内にあるSNPを許容し、複数の類似配列を同時に標的可能であることが示された。
以上、図2~図4に示す結果より、N認識RVDリピートを用いた単独のTALECDペアが、従来の各塩基特異的RVDリピートのみを用いる場合と比較して認識配列内にあるSNPを許容し、複数の類似配列を同時に標的可能であることが示された。
本発明にかかる方法またはタンパク質を使用することにより、複数の遺伝子の同時改変が可能となる。従って、医療分野、農業分野および畜産分野における利用が期待される。
Claims (14)
- 同一または類似のタンパク質をコードする複数のDNAを改変する方法であって、
N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVD(repeat variable di-residue)を含むリピート配列を少なくとも1つ含む1種類のTALE-改変因子複合体のTALE部分を、当該複数のDNAの結合領域に結合させることを含む、前記方法。 - 細胞内における同一または類似のタンパク質をコードする複数の遺伝子を改変する方法であって、
N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVDを含むリピート配列を少なくとも1つ含む1種類のTALE-改変因子複合体を、細胞内に導入することを含む、前記方法。 - 細胞内における同一または類似のタンパク質をコードする複数の遺伝子が改変された細胞の作製方法であって、
N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVDを含むリピート配列を少なくとも1つ含む1種類のTALE-改変因子複合体を、細胞内に導入することを含む、前記方法。 - 前記RVDが認識または許容する塩基が、前記複数のDNAまたは遺伝子の塩基配列をアライメントしたときに、同じ位置に存在する塩基の1または複数が他のDNAまたは遺伝子の塩基と異なる塩基である、請求項1から請求項3までのいずれか1項に記載の方法。
- 前記RVDのアミノ酸が、
Nを認識または許容するRV、CS、VR、NA、S*、RH、RLもしくはRTで構成されており、
Mを認識するHCもしくはKCで構成されており、
Vを認識するHS、HT、HV、KVもしくはRCで構成されており、または、
RもしくはVを認識するNTで構成されている、請求項1から請求項3までのいずれか1項に記載の方法。ただし、S*の「*」は、RVDの第2位値がギャップであることを示す。 - 前記改変因子が、エンドヌクレアーゼの全部もしくは一部、デアミナーゼの全部もしくは一部である、請求項1から請求項3までのいずれか1項に記載の方法。
- 前記遺伝子が、核遺伝子、ミトコンドリア遺伝子または色素体遺伝子である、請求項2または3に記載の方法。
- 前記細胞が植物細胞である、請求項2に記載の方法。
- 前記細胞が植物細胞である、請求項3に記載の方法。
- 請求項9に記載の方法で作製された植物細胞。
- 請求項10に記載の植物細胞を含む種子または植物。
- TALEのリピート配列を少なくとも1つ含むDNA結合タンパク質であって、当該リピート配列に含まれるRVDが、
Nを認識または許容するRV、CS、VR、NA、S*、RH、RLもしくはRTで構成されており、
Mを認識するHCもしくはKCで構成されており、
Vを認識するHS、HT、HV、KVもしくはRCで構成されており、または、
RもしくはVを認識するNTで構成されている、前記タンパク質。ただし、S*の「*」は、RVDの第2位値がギャップであることを示す。 - 前記RVDがNを認識または許容するRVである、請求項12に記載のタンパク質。
- 機能性タンパク質が融合していることを特徴とする、請求項13に記載のタンパク質。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022143554A JP2024039190A (ja) | 2022-09-09 | 2022-09-09 | ゲノム編集技術 |
PCT/JP2023/031785 WO2024053550A1 (ja) | 2022-09-09 | 2023-08-31 | ゲノム編集技術 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022143554A JP2024039190A (ja) | 2022-09-09 | 2022-09-09 | ゲノム編集技術 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024039190A true JP2024039190A (ja) | 2024-03-22 |
Family
ID=90190995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022143554A Pending JP2024039190A (ja) | 2022-09-09 | 2022-09-09 | ゲノム編集技術 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2024039190A (ja) |
WO (1) | WO2024053550A1 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103435691A (zh) * | 2013-08-13 | 2013-12-11 | 北京大学 | Tale蛋白及其应用 |
WO2022158561A1 (ja) * | 2021-01-22 | 2022-07-28 | 国立大学法人東京大学 | 植物ゲノムの編集方法 |
-
2022
- 2022-09-09 JP JP2022143554A patent/JP2024039190A/ja active Pending
-
2023
- 2023-08-31 WO PCT/JP2023/031785 patent/WO2024053550A1/ja unknown
Also Published As
Publication number | Publication date |
---|---|
WO2024053550A1 (ja) | 2024-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11946040B2 (en) | Adenine DNA base editor variants with reduced off-target RNA editing | |
US10227576B1 (en) | Engineered cascade components and cascade complexes | |
Townsend et al. | High-frequency modification of plant genes using engineered zinc-finger nucleases | |
JP6923205B2 (ja) | 標的化したdna配列の核酸塩基を特異的に変換する、単子葉植物のゲノム配列の変換方法、及びそれに用いる分子複合体 | |
DE69636637T2 (de) | Auf basis ihrer struktur entworfene herbizid-resistente produkte | |
WO2017043656A1 (ja) | 標的化したdna配列の核酸塩基を特異的に変換する、グラム陽性菌のゲノム配列の変換方法、及びそれに用いる分子複合体 | |
WO2021042062A2 (en) | Combinatorial adenine and cytosine dna base editors | |
TW200815593A (en) | Zinc finger nuclease-mediated homologous recombination | |
TW200925276A (en) | Engineered zinc finger proteins targeting 5-enolpyruvyl shikimate-3-phosphate synthase genes | |
JPH03503599A (ja) | 人工染色体ベクター | |
CN110526993B (zh) | 一种用于基因编辑的核酸构建物 | |
WO2013045480A1 (en) | Chimeric nucleases for gene targeting | |
WO2021082830A1 (zh) | 靶向性修饰植物基因组序列的方法 | |
EP1183346A1 (en) | Method for generating split, non-transferable genes that are able to express an active protein product | |
US20240336905A1 (en) | Class ii, type v crispr systems | |
Kopischke et al. | TALEN-mediated genome-editing approaches in the liverwort Marchantia polymorpha yield high efficiencies for targeted mutagenesis | |
Wong | The ABCs of gene cloning | |
CN110892074A (zh) | 用于增加香蕉的保质期的组成物及方法 | |
Li et al. | TALEN utilization in rice genome modifications | |
CN113025597B (zh) | 改进的基因组编辑系统 | |
KR20240053585A (ko) | 카고 뉴클레오티드 서열을 전이시키기 위한 시스템 및 방법 | |
US6858775B1 (en) | Method for generating split, non-transferable genes that are able to express an active protein product | |
WO2024053550A1 (ja) | ゲノム編集技術 | |
CN105367628A (zh) | 一对高效编辑水稻waxy基因的talen其识别打靶位点及其应用 | |
CN114686456B (zh) | 基于双分子脱氨酶互补的碱基编辑系统及其应用 |