KR20190122595A - 식물의 염기 교정용 유전자 구조체, 이를 포함하는 벡터 및 이를 이용한 염기 교정 방법 - Google Patents
식물의 염기 교정용 유전자 구조체, 이를 포함하는 벡터 및 이를 이용한 염기 교정 방법 Download PDFInfo
- Publication number
- KR20190122595A KR20190122595A KR1020190046807A KR20190046807A KR20190122595A KR 20190122595 A KR20190122595 A KR 20190122595A KR 1020190046807 A KR1020190046807 A KR 1020190046807A KR 20190046807 A KR20190046807 A KR 20190046807A KR 20190122595 A KR20190122595 A KR 20190122595A
- Authority
- KR
- South Korea
- Prior art keywords
- target
- gene construct
- plant
- sequence
- vector
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 124
- 239000013598 vector Substances 0.000 title claims abstract description 47
- 238000000034 method Methods 0.000 title claims abstract description 21
- 101710163270 Nuclease Proteins 0.000 claims abstract description 72
- 108091033409 CRISPR Proteins 0.000 claims description 63
- 102000004169 proteins and genes Human genes 0.000 claims description 46
- 108020005004 Guide RNA Proteins 0.000 claims description 36
- 210000001938 protoplast Anatomy 0.000 claims description 35
- 108091079001 CRISPR RNA Proteins 0.000 claims description 31
- 150000001413 amino acids Chemical class 0.000 claims description 28
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 27
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 claims description 23
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 16
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 claims description 16
- 102000055025 Adenosine deaminases Human genes 0.000 claims description 16
- 108020004999 messenger RNA Proteins 0.000 claims description 16
- 230000004927 fusion Effects 0.000 claims description 14
- 239000002126 C01EB10 - Adenosine Substances 0.000 claims description 12
- 229960005305 adenosine Drugs 0.000 claims description 12
- 241000193996 Streptococcus pyogenes Species 0.000 claims description 11
- 101710199622 tRNA-specific adenosine deaminase Proteins 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 7
- 125000000539 amino acid group Chemical group 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 150000004985 diamines Chemical class 0.000 claims description 3
- 108010029988 AICDA (activation-induced cytidine deaminase) Proteins 0.000 claims description 2
- 101710095342 Apolipoprotein B Proteins 0.000 claims description 2
- 102100040202 Apolipoprotein B-100 Human genes 0.000 claims description 2
- 230000009977 dual effect Effects 0.000 claims description 2
- 230000030648 nucleus localization Effects 0.000 claims description 2
- 150000004891 diazines Chemical class 0.000 claims 2
- 241000196324 Embryophyta Species 0.000 description 93
- 108020004414 DNA Proteins 0.000 description 53
- 235000018102 proteins Nutrition 0.000 description 43
- 238000006243 chemical reaction Methods 0.000 description 38
- 230000000694 effects Effects 0.000 description 33
- 239000002773 nucleotide Substances 0.000 description 32
- 230000035772 mutation Effects 0.000 description 30
- 125000003729 nucleotide group Chemical group 0.000 description 30
- 235000001014 amino acid Nutrition 0.000 description 28
- 229940024606 amino acid Drugs 0.000 description 26
- 230000008685 targeting Effects 0.000 description 23
- 210000004027 cell Anatomy 0.000 description 18
- 230000009466 transformation Effects 0.000 description 17
- 238000012350 deep sequencing Methods 0.000 description 16
- 150000007523 nucleic acids Chemical class 0.000 description 16
- 108091093088 Amplicon Proteins 0.000 description 15
- 241000219194 Arabidopsis Species 0.000 description 15
- 101100532680 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MCD1 gene Proteins 0.000 description 14
- 229930024421 Adenine Natural products 0.000 description 13
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 13
- 108010042407 Endonucleases Proteins 0.000 description 13
- 102000004533 Endonucleases Human genes 0.000 description 13
- 229960000643 adenine Drugs 0.000 description 13
- 108020004511 Recombinant DNA Proteins 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 12
- 238000006467 substitution reaction Methods 0.000 description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 description 11
- 230000001404 mediated effect Effects 0.000 description 11
- 108091000080 Phosphotransferase Proteins 0.000 description 9
- 101150038500 cas9 gene Proteins 0.000 description 9
- 102000020233 phosphotransferase Human genes 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical group O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 8
- 102000039446 nucleic acids Human genes 0.000 description 8
- 108020004707 nucleic acids Proteins 0.000 description 8
- 240000002791 Brassica napus Species 0.000 description 7
- 102000053602 DNA Human genes 0.000 description 7
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 7
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 6
- 229930010555 Inosine Natural products 0.000 description 6
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 229960003786 inosine Drugs 0.000 description 6
- 230000010474 transient expression Effects 0.000 description 6
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 5
- 101001055189 Arabidopsis thaliana Acetolactate synthase, chloroplastic Proteins 0.000 description 5
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 5
- 238000010195 expression analysis Methods 0.000 description 5
- 244000005700 microbiome Species 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 241000589158 Agrobacterium Species 0.000 description 4
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 4
- 241000219195 Arabidopsis thaliana Species 0.000 description 4
- 101100201106 Arabidopsis thaliana RPS5A gene Proteins 0.000 description 4
- 239000004475 Arginine Substances 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- 101100201109 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rps5 gene Proteins 0.000 description 4
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 4
- 125000003275 alpha amino acid group Chemical group 0.000 description 4
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 4
- 235000003704 aspartic acid Nutrition 0.000 description 4
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 4
- 230000027455 binding Effects 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 229940088598 enzyme Drugs 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 230000009261 transgenic effect Effects 0.000 description 4
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 3
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 241000589601 Francisella Species 0.000 description 3
- 206010020649 Hyperkeratosis Diseases 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- 241000904817 Lachnospiraceae bacterium Species 0.000 description 3
- 241000194017 Streptococcus Species 0.000 description 3
- -1 adenosine diamines Chemical class 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 230000037429 base substitution Effects 0.000 description 3
- 235000013339 cereals Nutrition 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 230000009437 off-target effect Effects 0.000 description 3
- 239000013600 plasmid vector Substances 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 229920002477 rna polymer Polymers 0.000 description 3
- 238000007480 sanger sequencing Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 235000011293 Brassica napus Nutrition 0.000 description 2
- 241000605902 Butyrivibrio Species 0.000 description 2
- 101100240528 Caenorhabditis elegans nhr-23 gene Proteins 0.000 description 2
- 241000223282 Candidatus Peregrinibacteria Species 0.000 description 2
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 2
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 2
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 101000832777 Drosophila melanogaster Double-stranded RNA-specific editase Adar Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 102100029880 Glycodelin Human genes 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 229930195725 Mannitol Natural products 0.000 description 2
- 241000605894 Porphyromonas Species 0.000 description 2
- 241000605861 Prevotella Species 0.000 description 2
- 102100033279 Prostaglandin-H2 D-isomerase Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 241000194022 Streptococcus sp. Species 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 230000009615 deamination Effects 0.000 description 2
- 238000006481 deamination reaction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 235000004554 glutamine Nutrition 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 235000010355 mannitol Nutrition 0.000 description 2
- 239000000594 mannitol Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 230000006780 non-homologous end joining Effects 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 102200068591 rs28940274 Human genes 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000003584 silencer Effects 0.000 description 2
- 230000035882 stress Effects 0.000 description 2
- 238000010189 synthetic method Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 2
- 229940045145 uridine Drugs 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 235000014393 valine Nutrition 0.000 description 2
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- 241000093740 Acidaminococcus sp. Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 101100313365 Arabidopsis thaliana TFL1 gene Proteins 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 241001502303 Candidatus Methanoplasma Species 0.000 description 1
- 241001040999 Candidatus Methanoplasma termitum Species 0.000 description 1
- 241001437378 Candidatus Paceibacter Species 0.000 description 1
- 241000243205 Candidatus Parcubacteria Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- IMXSCCDUAFEIOE-UHFFFAOYSA-N D-Octopin Natural products OC(=O)C(C)NC(C(O)=O)CCCN=C(N)N IMXSCCDUAFEIOE-UHFFFAOYSA-N 0.000 description 1
- IMXSCCDUAFEIOE-RITPCOANSA-N D-octopine Chemical compound [O-]C(=O)[C@@H](C)[NH2+][C@H](C([O-])=O)CCCNC(N)=[NH2+] IMXSCCDUAFEIOE-RITPCOANSA-N 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 244000062175 Fittonia argyroneura Species 0.000 description 1
- 241000702463 Geminiviridae Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 241001134638 Lachnospira Species 0.000 description 1
- 241001148627 Leptospira inadai Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000542065 Moraxella bovoculi Species 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 241000606860 Pasteurella Species 0.000 description 1
- 241000606856 Pasteurella multocida Species 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 235000011613 Pinus brutia Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 229920001030 Polyethylene Glycol 4000 Polymers 0.000 description 1
- 241000878522 Porphyromonas crevioricanis Species 0.000 description 1
- 241001135241 Porphyromonas macacae Species 0.000 description 1
- 241001135219 Prevotella disiens Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 101710149951 Protein Tat Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 241001531273 [Eubacterium] eligens Species 0.000 description 1
- 230000036579 abiotic stress Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 102000004139 alpha-Amylases Human genes 0.000 description 1
- 108090000637 alpha-Amylases Proteins 0.000 description 1
- 229940024171 alpha-amylase Drugs 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical group N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 230000032798 delamination Effects 0.000 description 1
- 238000001784 detoxification Methods 0.000 description 1
- MTHSVFCYNBDYFN-UHFFFAOYSA-N diethylene glycol Chemical compound OCCOCCO MTHSVFCYNBDYFN-UHFFFAOYSA-N 0.000 description 1
- 230000005059 dormancy Effects 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Natural products O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000013028 medium composition Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 230000004660 morphological change Effects 0.000 description 1
- 239000006870 ms-medium Substances 0.000 description 1
- 108091005763 multidomain proteins Proteins 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 229940051027 pasteurella multocida Drugs 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04004—Adenosine deaminase (3.5.4.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 식물의 염기 교정용 유전자 구조체, 구체적으로 디아미네이즈 및/또는 표적 특이적 뉴클레아제를 코딩하는 유전자 구조체, 상기 유전자 구조체를 포함하는 벡터, 상기 유전자 구조체 및/또는 벡터를 도입하여 식물의 염기를 교정하는 방법에 관한 것이다.
Description
본 발명은 식물의 염기 교정용 유전자 구조체, 구체적으로 디아미네이즈 및/또는 표적 특이적 뉴클레아제를 코딩하는 유전자 구조체, 상기 유전자 구조체를 포함하는 벡터, 상기 유전자 구조체 및/또는 벡터를 도입하여 식물의 염기를 교정하는 방법에 관한 것이다.
ZFN (zinc finger nuclease), TALLEN (transcription activator-like effector DNA binding protein) 및 RGENs (RNA-guided endonucleases) 등의 유전자 가위(programmable nucleases)는 박테리아, 조류 등의 CRISPR-Cas (type II clustered, regularly-interspaced palindromic repeat-CRISPR-associated) 획득 면역 시스템으로부터 목적에 맞게 만들어졌으며, 다양한 식물 종으로부터 유래한 세포 및 유기체의 유전체 교정에 사용되고 있으며, 생물의약 연구, 의약품 및 생명공학 분야에서 신규한 활용 방법으로 인식되고 있다(Kim, H. etc., Nat Rev Genet, 2014, 15: 321-334). 상술한 유전자 가위 중에서도, CRISPR RGENs는 가장 최근에 개발된 것으로서, 프로그래밍의 용이성 때문에 ZFNs, TALENs를 빠른 속도로 대체하고 있다.
식물 분야에서도 CRISPR 시스템을 이용한 게놈 편집은 기초 연구와 생명 공학을 위한 혁신적인 도구로서 기대되고 있다. CRISPR 뉴클레아제는 염색체 DNA를 표적화 방법으로 절단하여 DNA 이중 가닥 절단을 일으키고, 이것은 내인성 오류 빈발 비상동 말단 연결 (error-prone non-homologous end joining, NHEJ) 에 의해 복구되어, 표적 부위에 작은 삽입 및 결실 (인델)을 야기한다.
그러나, 식물의 연구와 농업에의 응용은 식물에서 점 돌연변이 유발이 작물 개량을 달성하고, 자연의 게놈 변이를 해독하기 위한 중요한 전략의 하나임에도 불구하고, 인델보다는 점 돌연변이를 유발하는 것이 과제가 되고 있다. 식물의 점 돌연변이 유발을 위해 현재 사용 가능한 방법은 거의 독점적으로 EMS 유도 TILLING7 같은 C/G에서 T/A로 변환 방법, 및 보다 최근에는 시토신 디아미네이즈 단백질에 융합된 S. pyogenes Cas9 (D10A) 니케이즈를 이용한 시토신 염기 편집에 의존하고 있다.
최근 Cas9 니케이즈 (nickase) 및 유전자 조작된 대장균 유래의 tRNA 아데노신 디아미네이즈로 구성된 ABE (adenine base editors)가 포유 동물 세포에서의 A / T에서 G / C로 변환을 유도하기 위해 개발되었다.
이러한 기술적 배경하에서, 본 출원의 발명자들은 ABE를 변형하여 식물에서 효율적인 아데닌 염기 편집을 달성할 수 있음을 확인하고, 본 발명을 완성하였다.
본 발명의 목적은 식물의 염기 교정용 유전자 구조체를 제공하는 데 있다.
본 발명의 다른 목적은 상기 유전자 구조체가 작동 가능하게 연결된 염기 교정용 벡터를 제공하는 데 있다.
본 발명의 다른 목적은 상기 유전자 구조체 또는 상기 벡터를 도입하는 단계를 포함하는 식물의 염기 교정 방법을 제공하는 데 있다.
상기 목적을 달성하기 위하여, 본 발명은 야생형 디아미네이즈 (deaminase) 및 변이 디아미네이즈를 포함하는 디아미네이즈 융합체를 코딩하는 유전자 구조체 (construct)를 제공한다.
본 발명은 또한, 야생형 디아미네이즈 (deaminase)와 변이 디아미네이즈를 포함하는 디아미네이즈 융합체를 코딩하는 유전자 및 표적 특이적 뉴클레아제를 코딩하는 유전자를 포함하는 유전자 구조체를 제공한다.
본 발명은 또한, 상기 유전자 구조체가 작동 가능하도록 연결된 식물의 염기 교정용 벡터를 제공한다.
본 발명은 또한, 식물 원형질체에 상기 유전자 구조체 또는 상기 벡터를 도입하는 단계; 및 표적을 특이적으로 인식하는 가이드 RNA를 식물 원형질체에 처리하는 단계를 포함하는 식물의 염기 교정 방법을 제공한다.
본 발명은 또한, 야생형 디아미네이즈 및 변이 디아미네이즈를 포함하는 디아미네이즈 융합체를 코딩하는 유전자 구조체를 포함하는 벡터를 식물 원형질체에 도입하는 단계; 표적 특이적 뉴클레아제를 코딩하는 유전자 구조체를 포함하는 벡터를 식물 원형질체에 도입하는 단계; 및 표적을 특이적으로 인식하는 가이드 RNA를 식물 원형질체에 처리하는 단계를 포함하는 식물의 염기 교정 방법을 제공한다.
본 발명에 따르면, 타겟 부위에서 목적하지 않은 인델 없이 효율적으로 목적한 염기를 변환시킬 수 있고, 식물 중 정확한 염기 편집으로부터 아미노산 변화 또는 mRNA 미스-스플라이싱 중 하나에 의해 표현형이 변화한 형질전환 식물을 제작할 수 있다.
도 1은 게놈 표적에서 4 개 pcABE의 A에서 G로의 변환 효율을 비교한 결과를 나타낸 것이다. ALS, PDS, FT 및 LFY 유전자의 아데닌 위치에서 얻어진 효율을 결정하고, 염기 수 10에 의해 대수 측정하였다.
도 2는 6 부위를 표적으로 하는 4 개의 pcABE 관련 인델 빈도 분석 결과를 나타낸 것이다.
도 3은 1 ~ 12 위치에서 표적 아데닌에 대한 pcABE7.10의 A에서 G로의 상대적인 변환 효율에 의해 정의되는 Arabidopsis의 염기 편집 창을 나타낸 것이다. Arabidopsis 게놈 중 4 부위를 사용하였고, 2 개는 홀수 번호의 위치에서 A가 반복하고 (표적 1 및 표적 3), 2 개는 A가 짝수 위치에서 반복한다 (표적 2 및 표적 4). 효율은 각 표적에 대한 최대값으로 정규화 하였다.
도 4는 상대적 A-G 변환 빈도를 나타낸다. 상대적 A-G 변환 빈도는 각 대상에 대하여 A7 변환 효율로 및 A - G 변환의 평균 효율에 의해 정규화하였다. A5에 선행하여 다른 염기 조성을 포함하는 A5와 A7을 가지는 Arabidopsis 게놈 중 다섯 가지 표적을 무작위로 선택하고, 이어서 아데닌 위치에서 상대적인 A에서 G로의 변환 효율을 계산하였다. 모든 데이터는 Arabidopsis와 유채 원형질체를 이용한 일시적 발현 분석 (transient assay)에 대하여 3 개 이상의 생물학적 복제에서의 앰플리콘 딥 시퀀싱에서 얻었다. 오차 막대는 표준 편차를 나타낸다.
도 5는 본 발명에 따라 사용된 바이너리 벡터 시스템의 개요도를 나타낸 것이다.
도 6은 3 가지의 벡터 각각을 아그로박테리움 매개 형질전환에 의해 생성된 트랜스제닉 집단 유래 FT 타겟 T1 식물에서의 염기 편집 효율을 나타낸 것이다.
도 7은 식물 내 ABE 적용을 위한 타겟의 상세 내용을 나타낸 것이다. 상세도는 FT에서 A-G 로의 변환에 의해 일어난 아미노산 변형 및 PDS3에서 AG 스플라이싱 어셉터의 변화에 의해 일어난 것으로 예상되는 결과를 나타낸다.
도 8은 RPS5A-ABE를 통해 생성된 염기 편집된 T1 식물의 개화시기와 야생형 Col-0 식물 및 CRISPR/Cas9 시스템을 통해 생성된 ft 변이 식물의 개화 시기를 비교한 결과를 나타낸 것이다.
도 9는 RPS5A-ABE를 통해 생성된 염기 편집된 T1 식물과 CRISPR/Cas9을 통해 생성된 pds3 변이 식물의 모자이크 알비노 표현형의 다양한 패턴을 비교한 것이다.
도 10은 FT-#3, PDS3 #4, 및 PDS3 #5 Arabidopsis T1 seedlings 유래의 대표적 생어 시퀀싱 (Sanger sequencing) 결과를 나타낸 것이다. 흑색 화살표 부분이 염기 치환을 나타낸다.
도 11은 FT-#3, PDS3 #4, 및 PDS3 #5 Arabidopsis T1 seedlings 유래의 앰플리콘 딥 시퀀싱 결과를 나타낸 것이다. 각 패널의 맨 윗줄은 20bp의 sgRNA 타겟팅 배열을 나타낸다. 노란색 상자는 염기 치환의 "목적"하는 위치를 나타내는 반면, 주황색 상자는 인접한 "목적하지 않은"위치를 나타낸다. 각 위치에서 호출된 각 염기의 빈도는 컬럼에 표시된다. 녹색 셀은 시퀀스 결과에서 호출된 주요 염기를 나타낸다. 오른쪽 별도의 테이블은 단일 잔기 치환을 갖는 서열 및 이중 잔기 치환을 갖는 서열의 리드(read)를 나타내며, 편집 창에서 명확한 아데닌 우선성을 나타낸다.
도 12는 미스 스플라이싱된 mRNA 변이를 검출하기 위한 전략의 개략도 및 mRNA 돌연변이에 대한 앰플리콘 딥 시퀀싱 리드 결과를 나타낸 것이다.
도 13은 4개의 변이체를 포함하는 벡터 구축물을 보여주는 모식도이다.
도 14는 AtALS, BnALS를 표적하는 pcABE를 제작하여 앰플리콘 딥 시퀀싱 분석으로부터 염기 요구 (base-calling) 빈도를 확인한 결과를 나타낸 것이다.
도 15는 AtPDS, BnPDS를 표적하는 pcABE를 제작하여 앰플리콘 딥 시퀀싱 분석으로부터 염기 요구 (base-calling) 빈도를 확인한 결과를 나타낸 것이다.
도 16은 AtFT, AtLFY를 표적하는 pcABE를 제작하여 앰플리콘 딥 시퀀싱 분석으로부터 염기 요구 (base-calling) 빈도를 확인한 결과를 나타낸 것이다.
도 17은 ABE 활성 창 분석 (ABE activity window analysis)에 대한 표적화 딥 시퀀싱 리드를 나타낸 것으로, Arabidopsis thaliana 게놈 중 홀수 위치에서 2개의 부위 (표적 1: Chr3: 951090 및 표적 3: Chr3: 2564286)가 반복되는 아데닌 표적을 포함하고, 짝수 위치에서 2개의 다른 부위 (표적 2: Chr4: 2123981 및 표적 4: Chr4: 18302231)가 반복되는 아데닌 표적을 포함한다. 표적 아데닌은 붉은색으로 표시되어 있고, ABE에 의해 치환된 구아닌은 녹색으로 표시되어 있다.
도 18은 AtFT 및 AtALS를 표적하는 pcABE7.10의 오프-타겟 효과를 분석한 결과를 나타낸 것이다. 열거된 서열은 14개 및 6개의 오프-타겟 부위로, AtFT 및 AtALS 각각의 부위에 대하여 4개까지의 뉴클레오티드를 포함하며, Cas-OFFinder를 사용하여 확인하였다. 표적 부위 내 A-G로의 변환 빈도는 앰플리콘 딥 시퀀싱 결과로부터 수집된 대수 변환 값이다. 각 표적에 대하여, 생물학적 3회 실험의 평균값에 대한 데이터이다. 오차 막대는 표준편차를 나타낸다.
도 19는 pcABE7.10를 표적하는 내인성 유전자에 대한 일시적 발현 분석에서 변환 빈도를 나타낸 것이다. 원형질체 일시적 발현 분석에서 a) AtFT 및 b) AtPDS3 유전자에 대한 A-G 변환 빈도를 나타낸 것이다. 표적 A (붉은색)에서 G (녹색) 변환을 설계하였고, 분석에서 확인하고자 하는 패턴 (파란색 상자)을 관찰하였다. 각 표적에 대하여, 생물학적 4회 실험의 평균값에 대한 데이터이다. 오차 막대는 표준편차를 나타낸다.
도 2는 6 부위를 표적으로 하는 4 개의 pcABE 관련 인델 빈도 분석 결과를 나타낸 것이다.
도 3은 1 ~ 12 위치에서 표적 아데닌에 대한 pcABE7.10의 A에서 G로의 상대적인 변환 효율에 의해 정의되는 Arabidopsis의 염기 편집 창을 나타낸 것이다. Arabidopsis 게놈 중 4 부위를 사용하였고, 2 개는 홀수 번호의 위치에서 A가 반복하고 (표적 1 및 표적 3), 2 개는 A가 짝수 위치에서 반복한다 (표적 2 및 표적 4). 효율은 각 표적에 대한 최대값으로 정규화 하였다.
도 4는 상대적 A-G 변환 빈도를 나타낸다. 상대적 A-G 변환 빈도는 각 대상에 대하여 A7 변환 효율로 및 A - G 변환의 평균 효율에 의해 정규화하였다. A5에 선행하여 다른 염기 조성을 포함하는 A5와 A7을 가지는 Arabidopsis 게놈 중 다섯 가지 표적을 무작위로 선택하고, 이어서 아데닌 위치에서 상대적인 A에서 G로의 변환 효율을 계산하였다. 모든 데이터는 Arabidopsis와 유채 원형질체를 이용한 일시적 발현 분석 (transient assay)에 대하여 3 개 이상의 생물학적 복제에서의 앰플리콘 딥 시퀀싱에서 얻었다. 오차 막대는 표준 편차를 나타낸다.
도 5는 본 발명에 따라 사용된 바이너리 벡터 시스템의 개요도를 나타낸 것이다.
도 6은 3 가지의 벡터 각각을 아그로박테리움 매개 형질전환에 의해 생성된 트랜스제닉 집단 유래 FT 타겟 T1 식물에서의 염기 편집 효율을 나타낸 것이다.
도 7은 식물 내 ABE 적용을 위한 타겟의 상세 내용을 나타낸 것이다. 상세도는 FT에서 A-G 로의 변환에 의해 일어난 아미노산 변형 및 PDS3에서 AG 스플라이싱 어셉터의 변화에 의해 일어난 것으로 예상되는 결과를 나타낸다.
도 8은 RPS5A-ABE를 통해 생성된 염기 편집된 T1 식물의 개화시기와 야생형 Col-0 식물 및 CRISPR/Cas9 시스템을 통해 생성된 ft 변이 식물의 개화 시기를 비교한 결과를 나타낸 것이다.
도 9는 RPS5A-ABE를 통해 생성된 염기 편집된 T1 식물과 CRISPR/Cas9을 통해 생성된 pds3 변이 식물의 모자이크 알비노 표현형의 다양한 패턴을 비교한 것이다.
도 10은 FT-#3, PDS3 #4, 및 PDS3 #5 Arabidopsis T1 seedlings 유래의 대표적 생어 시퀀싱 (Sanger sequencing) 결과를 나타낸 것이다. 흑색 화살표 부분이 염기 치환을 나타낸다.
도 11은 FT-#3, PDS3 #4, 및 PDS3 #5 Arabidopsis T1 seedlings 유래의 앰플리콘 딥 시퀀싱 결과를 나타낸 것이다. 각 패널의 맨 윗줄은 20bp의 sgRNA 타겟팅 배열을 나타낸다. 노란색 상자는 염기 치환의 "목적"하는 위치를 나타내는 반면, 주황색 상자는 인접한 "목적하지 않은"위치를 나타낸다. 각 위치에서 호출된 각 염기의 빈도는 컬럼에 표시된다. 녹색 셀은 시퀀스 결과에서 호출된 주요 염기를 나타낸다. 오른쪽 별도의 테이블은 단일 잔기 치환을 갖는 서열 및 이중 잔기 치환을 갖는 서열의 리드(read)를 나타내며, 편집 창에서 명확한 아데닌 우선성을 나타낸다.
도 12는 미스 스플라이싱된 mRNA 변이를 검출하기 위한 전략의 개략도 및 mRNA 돌연변이에 대한 앰플리콘 딥 시퀀싱 리드 결과를 나타낸 것이다.
도 13은 4개의 변이체를 포함하는 벡터 구축물을 보여주는 모식도이다.
도 14는 AtALS, BnALS를 표적하는 pcABE를 제작하여 앰플리콘 딥 시퀀싱 분석으로부터 염기 요구 (base-calling) 빈도를 확인한 결과를 나타낸 것이다.
도 15는 AtPDS, BnPDS를 표적하는 pcABE를 제작하여 앰플리콘 딥 시퀀싱 분석으로부터 염기 요구 (base-calling) 빈도를 확인한 결과를 나타낸 것이다.
도 16은 AtFT, AtLFY를 표적하는 pcABE를 제작하여 앰플리콘 딥 시퀀싱 분석으로부터 염기 요구 (base-calling) 빈도를 확인한 결과를 나타낸 것이다.
도 17은 ABE 활성 창 분석 (ABE activity window analysis)에 대한 표적화 딥 시퀀싱 리드를 나타낸 것으로, Arabidopsis thaliana 게놈 중 홀수 위치에서 2개의 부위 (표적 1: Chr3: 951090 및 표적 3: Chr3: 2564286)가 반복되는 아데닌 표적을 포함하고, 짝수 위치에서 2개의 다른 부위 (표적 2: Chr4: 2123981 및 표적 4: Chr4: 18302231)가 반복되는 아데닌 표적을 포함한다. 표적 아데닌은 붉은색으로 표시되어 있고, ABE에 의해 치환된 구아닌은 녹색으로 표시되어 있다.
도 18은 AtFT 및 AtALS를 표적하는 pcABE7.10의 오프-타겟 효과를 분석한 결과를 나타낸 것이다. 열거된 서열은 14개 및 6개의 오프-타겟 부위로, AtFT 및 AtALS 각각의 부위에 대하여 4개까지의 뉴클레오티드를 포함하며, Cas-OFFinder를 사용하여 확인하였다. 표적 부위 내 A-G로의 변환 빈도는 앰플리콘 딥 시퀀싱 결과로부터 수집된 대수 변환 값이다. 각 표적에 대하여, 생물학적 3회 실험의 평균값에 대한 데이터이다. 오차 막대는 표준편차를 나타낸다.
도 19는 pcABE7.10를 표적하는 내인성 유전자에 대한 일시적 발현 분석에서 변환 빈도를 나타낸 것이다. 원형질체 일시적 발현 분석에서 a) AtFT 및 b) AtPDS3 유전자에 대한 A-G 변환 빈도를 나타낸 것이다. 표적 A (붉은색)에서 G (녹색) 변환을 설계하였고, 분석에서 확인하고자 하는 패턴 (파란색 상자)을 관찰하였다. 각 표적에 대하여, 생물학적 4회 실험의 평균값에 대한 데이터이다. 오차 막대는 표준편차를 나타낸다.
다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로, 본 명세서에서 사용된 명명법은 본 기술분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.
본 발명은 일 관점에서, 야생형 디아미네이즈 (deaminase) 및 변이 디아미네이즈를 포함하는 디아미네이즈 융합체를 코딩하는 유전자 구조체 (construct)에 관한 것이다.
상기 디아미네이즈는 아데노신 디아미네이즈 또는 시티딘 디아미네이즈를 포함하고, 아데노신(A)을 이노신(I)으로 전환하거나 시티딘(C)을 우리딘(U)으로 전환시킬 수 있다. 상기 디아미네이즈는 예를 들어, APOBEC1 (apolipoprotein B editing complex 1), AID (activation-induced deaminase) 및 tadA (tRNA-specific adenosine deaminase)으로 구성된 군에서 선택될 수 있다.
하나의 실시예에서, 상기 디아미네이즈는 아데노신 디아미네이즈 (adenosine deaminase)일 수 있으며, 본 발명에 따른 유전자 구조체는 야생형 아데노신 디아미네이즈 및 변이 아데노신 디아미네이즈를 포함하는 아데노신 디아미네이즈 융합체 코딩 유전자를 포함할 수 있다.
본 발명에서 디아미네이즈를 사용한 염기 교정 반응은 식물 세포에서 표적 RNA 서열을 변화시키고 편집 반응을 통해 수행될 수 있다. 아데노신 디아미네이즈를 사용한 편집 반응은 아데노신 탈아민화이며, 아데노신을 이노신으로 전환시킬 수 있다. 시티딘 디아미네이즈를 사용한 편집 반응은 시티딘 탈아민화이며, 시티딘을 우리딘으로 전환시킬 수 있다.
상기 아데노신 디아미네이즈는 아데노신(A)을 이노신(I)으로 전환하는 것에 관여하는 효소로, 효소에 따라 2 내지 3개의 이중 가닥 RNA 인식 도메인 및 촉매 활성 도메인을 포함하는 다중 도메인 단백질이다. 인식 도메인은 특정한 이중 가닥 RNA(dsRNA) 서열 및/또는 형상을 인식하는 반면, 촉매 활성 도메인은 뉴클레오베이스의 탈아민에 의해 표적 RNA의 인근 또는 미리 예정된 위치에서 아데노신(A)을 이노신(I)으로 전환시킬 수 있는 것이다. 이노신은 세포의 번역화 과정에 의해 구아닌으로 판독되고 이는 만약 편집된 아데노신이 mRNA 또는 프리-mRNA의 코딩 영역에 존재한다면 이는 단백질 서열을 암호화시킬 수 있는 것이다.
아데노신(A)에서 이노신(I)으로의 전환은 또한 표적 mRNA의 5' 비코딩 서열에서 발생할 수 있고, N 말단 상에 연장된 단백질 또는 3'UTR 또는 다른 전사체 내의 비코딩 부위 내에서 생성될 수 있도록 원래의 출발 위치의 업스트림에 새로운 번역 시작 부위를 생성시킬 수 있다. 이는 RNA의 프로세싱 및/또는 안정성에 영향을 미칠 수 있다. 또한, 아데노신(A)에서 이노신(I)으로의 전환은 pre-mRNA 내의 인트론 또는 엑손의 스플라이스 구성에서 일어날 수 있으며 이는 스플라이싱 패턴의 변화를 야기할 수 있다. 그 결과로서 엑손이 포함되거나 스킵핑될 수 있다. 아데노신 디아미네이즈는 인간 디아미네이즈 hADAR1, hADAR2 및 hADAR3을 포함하여 RNA(ADAR)에 작용하는 아데노신 디아미나제라고 불리는 효소 패밀리의 일부이다.
상기 아데노신 디아미네이즈 융합체는 야생형 아데노신 디아미네이즈 및 변이 아데노신 디아미네이즈를 포함한다. 하나의 실시예에서, 상기 아데노신 디아미네이즈는 예를 들어 tadA (tRNA-specific adenosine deaminase)일 수 있다. 상기 융합체는 야생형 tadA 및 변이 tadA 예를 들어, TadA 6.3,7.8,7.9 또는 7.10를 포함할 수 있다. 상기 아데노신 디아미네이즈는 단백질 또는 이를 암호화하는 DNA, 또는 이를 암호화하는 mRNA 형태로 사용될 수 있다. 상기 디아미네이즈는 식물 세포 또는 식물에서의 발현에 대해 최적화된 유전자 서열에 의해 암호화될 수 있으며, 예를 들어, 서열번호 3 내지 서열번호 6로 구성된 군에서 선택되는 유전자에 의해 코딩될 수 있다.
하나의 실시예에서, 야생형 아데노신 디아미네이즈 및 변이 아데노신 디아미네이즈는 링커로 연결될 수 있다. 상기 링커는 펩타이드 링커로 1 내지 40개의 아미노산 잔기, 구체적으로 2 내지 35개의 아미노산 잔기를 포함할 수 있다. 상기 링커는 예를 들어, (Gly)n (n은 2-40의 정수), (GGGGS)n (n은 1-10의 정수)일 수 있으나, 이에 제한되는 것은 아니다.
본 발명은 다른 관점에서 야생형 디아미네이즈 (deaminase)와 변이 디아미네이즈를 포함하는 디아미네이즈 융합체를 코딩하는 유전자 및 표적 특이적 뉴클레아제를 코딩하는 유전자를 포함하는 유전자 구조체에 관한 것이다. 야생형 디아미네이즈 (deaminase) 및 변이 디아미네이즈를 포함하는 디아미네이즈 융합체 코딩 유전자, 표적 특이적 뉴클레아제 코딩 유전자를 포함하는 식물의 염기 교정용 조성물에 관한 것이다.
상기 디아미네이즈에 대하여는 앞서 설명한 바와 같으며, 이하에서도 동일하게 적용될 수 있다. 상기 디아미네이즈 융합체를 코딩하는 유전자 구조체에 표적 특이적 뉴클레아제를 코딩하는 유전자가 연결될 수 있다.
상기 표적 특이적 뉴클레아제는 유전자 가위 (programmable nuclease)라고도 불리며, 목적하는 유전체 DNA 상의 특정 위치를 인식하여 절단할 수 있는 모든 형태의 뉴클레아제를 통칭한다.
본 명세서에서 사용된 표적 특이적 뉴클레아제는 DNA 이중가닥 중 한 가닥을 절단하는 활성을 갖는 모든 뉴클레아제일 수 있다.
일 구체예에서, 상기 표적 특이적 뉴클레아제는 Cas 단백질 (예컨대, Cas9 단백질(CRISPR (Clustered regularly interspaced short palindromic repeats) associated protein 9)), Cpf1 단백질 (CRISPR from Prevotella and Francisella 1) 등과 같은 타입 Ⅱ 및/또는 타입 V의 CRISPR 시스템에 수반되는 뉴클레아제 (예컨대, 엔도뉴클레아제) 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 이 경우, 상기 표적 특이적 뉴클레아제는 유전체 DNA의 표적 부위로 안내하기 위한 표적 DNA 특이적 가이드 RNA를 추가로 포함할 수 있다. 상기 가이드 RNA는 생체 외 (in vitro)에서 전사된(transcribed) 것일 수 있고, 예컨대 올리고뉴클레오티드 이중가닥 또는 플라스미드 주형으로부터 전사된 것일 수 있으나, 이에 제한되지 않는다. 상기 표적 특이적 뉴클레아제는 가이드 RNA에 결합된 리보핵산-단백질 복합체를 형성(RNA-Guided Engineered Nuclease)하여 리보핵산 단백질 (RNP) 형태로 작용할 수 있다.
Cas 단백질은 CRISPR/Cas 시스템의 주요 단백질 구성 요소로, 활성화된 엔도뉴클레아제 또는 니케이즈를 형성할 수 있는 단백질이다.
Cas 단백질 또는 유전자 정보는 NCBI (National Center for Biotechnology Information)의 GenBank와 같은 공지의 데이터 베이스에서 얻을 수 있다. 예컨대, 상기 Cas 단백질은,
스트렙토코커스 sp. (Streptococcus sp.), 예컨대, 스트렙토코커스 피요게네스 (Streptococcus pyogenes) 유래의 Cas 단백질, 예컨대, Cas9 단백질 (예컨대, SwissProt Accession number Q99ZW2(NP_269215.1));
캄필로박터 속, 예컨대, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas 단백질, 예컨대, Cas9 단백질;
스트렙토코커스 속, 예컨대, 스트렙토코커스 써모필러스 (Streptococcus thermophiles) 또는 스트렙토코커스 아우레우스 (Streptocuccus aureus) 유래의 Cas 단백질, 예컨대, Cas9 단백질;
네이세리아 메닝기디티스 (Neisseria meningitidis) 유래의 Cas 단백질, 예컨대, Cas9 단백질;
파스테우렐라 (Pasteurella) 속, 예컨대, 파스테우렐라 물토시다 (Pasteurella multocida) 유래의 Cas 단백질, 예컨대 Cas9 단백질;
프란시셀라 (Francisella) 속, 예컨대, 프란시셀라 노비시다 (Francisella novicida) 유래의 Cas 단백질, 예컨대 Cas9 단백질
등으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다.
Cpf1 단백질은 상기 CRISPR/Cas 시스템과는 구별되는 새로운 CRISPR 시스템의 엔도뉴클레아제로서, Cas9에 비해 상대적으로 크기가 작고 tracrRNA가 필요 없으며, 단일 가이드 RNA에 의해 작용할 수 있다. 또한, 티민 (thymine)이 풍부한 PAM (protospacer-adjacent motif) 서열을 인식하고 DNA의 이중 사슬을 잘라 점착종단 (cohesive end; cohesive double-strand break)을 생성한다.
예컨대, 상기 Cpf1 단백질은 캔디다투스 (Candidatus) 속, 라치노스피라 (Lachnospira) 속, 뷰티리비브리오 (Butyrivibrio) 속, 페레그리니박테리아 (Peregrinibacteria), 액시도미노코쿠스 (Acidominococcus) 속, 포르파이로모나스 (Porphyromonas) 속, 프레보텔라 (Prevotella) 속, 프란시셀라 (Francisella) 속, 캔디다투스 메타노플라스마 (Candidatus Methanoplasma), 또는 유박테리움 (Eubacterium) 속 유래의 것일 수 있고, 예컨대, Parcubacteria bacterium (GWC2011_GWC2_44_17), Lachnospiraceae bacterium (MC2017), Butyrivibrio proteoclasiicus, Peregrinibacteria bacterium (GW2011_GWA_33_10), Acidaminococcus sp. (BV3L6), Porphyromonas macacae, Lachnospiraceae bacterium (ND2006), Porphyromonas crevioricanis, Prevotella disiens, Moraxella bovoculi (237), Smiihella sp. (SC_KO8D17), Leptospira inadai, Lachnospiraceae bacterium (MA2020), Francisella novicida (U112), Candidatus Methanoplasma termitum, Candidatus Paceibacter, Eubacterium eligens 등의 미생물 유래의 것일 수 있으나, 이에 제한되는 것은 아니다.
상기 표적 특이적 뉴클레아제는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법 등과 같이 인위적 또는 비자연적 생산된 것(non-naturally occurring)일 수 있다. 일 예에서, 상기 표적 특이적 뉴클레아제 (예컨대, Cas9, Cpf1, 등)은 재조합 DNA에 의하여 만들어진 재조합 단백질일 수 있다. 재조합 DAN(Recombinant DNA; rDNA)는 다양한 유기체로부터 얻어진 이종 또는 동종 유전 물질을 포함하기 위하여 분자 클로닝과 같은 유전자 재조합 방법에 의하여 인공적으로 만들어진 DNA 분자를 의미한다. 예컨대, 재조합 DNA를 적절한 유기체에서 발현시켜 표적 특이적 뉴클레아제를 생산 (in vivo 또는 in vitro)하는 경우, 재조합 DNA는 제조하고자 하는 단백질을 암호화 하는 코돈들 중에서 상기 유기체에 발현하기에 최적화된 코돈을 선택하여 재구성된 뉴클레오타이드 서열을 갖는 것일 수 있다.
상기 표적 특이적 뉴클레아제는 변이된 형태의 변이 표적 특이적 뉴클레아제일 수 있다. 상기 변이 표적 특이적 뉴클레아제는 DNA 이중 가닥을 절단하는 엔도뉴클레아제 활성을 상실하도록 변이된 것을 의미할 수 있으며, 예컨대, 엔도뉴클레아제 활성을 상실하고 니카아제 활성을 갖도록 변이된 변이 표적 특이적 뉴클레아제 및 엔도뉴클레아제 활성과 니카아제 활성을 모두 상실하도록 변이된 변이 표적 특이적 뉴클레아제 중에서 선택된 1종 이상일 수 있다. 상기 변이 표적 특이적 뉴클레아제가 니카아제 활성을 갖는 것인 경우, 상기 디아미나제에 의한 염기변환(예컨대, 시티딘이 우라딘으로 변환)과 동시 또는 순서와 무관하게 순차적으로, 상기 염기 변환이 일어난 가닥 또는 그 반대 가닥 (예컨대, 염기 변환이 일어난 가닥의 반대 가닥)에서 nick이 도입될 수 있다 (예컨대, PAM이 위치하는 가닥의 반대가닥에서, PAM 서열의 5' 말단 방향으로 3번째 뉴클레오타이드와 4번째 뉴클레오타이드 사이에 해당하는 위치에 nick이 도입됨). 이와 같은 표적 특이적 뉴클레아제의 변이 (예컨대, 아미노산 치환 등)는 적어도 뉴클레아제의 촉매 활성 도메인 (예컨대, Cas9의 경우 RuvC 촉매 도메인)에서 일어나는 것일 수 있다. 일 예에서, 상기 표적 특이적 뉴클레아제가 스트렙토코커스 피요젠스 유래 Cas9 단백질 (SwissProt Accession number Q99ZW2(NP_269215.1))인 경우, 상기 변이는 촉매 활성을 갖는 아스파르트산 잔기 (catalytic aspartate residue; 10번째 위치의 아스파르트산 (D10) 등), 762번째 위치의 글루탐산 (E762), 840번째 위치의 히스티딘 (H840), 854번째 위치의 아스파라긴 (N854), 863번째 위치의 아스파라긴 (N863), 986번째 위치의 아스파르트산 (D986) 등으로 이루어진 군에서 선택된 하나 이상 임의의 다른 아미노산으로 치환된 돌연변이를 포함할 수 있다. 이 때, 치환되는 임의의 다른 아미노산은 알라닌 (alanine)일 수 있지만, 이에 제한되지 않는다.
다른 예에서, 상기 변이 표적 특이적 뉴클레아제는 야생형 Cas9 단백질과 상이한 PAM 서열을 인식하도록 변이된 것일 수 있다. 예컨대, 상기 변이 표적 특이적 뉴클레아제는 스트렙토코커스 피요젠스 유래 Cas9 단백질의 1135번째 위치의 아스파르트산 (D1135), 1335번째 위치의 아르기닌 (R1335), 및 1337번째 위치의 트레오닌 (T1337) 중 하나 이상, 예컨대 3개 모두가 다른 아미노산으로 치환되어, 야생형 Cas9의 PAM 서열 (NGG)와 상이한 NGA (N은 A, T, G, 및 C 중에서 선택된 임의의 염기임)을 인식하도록 변이된 것일 수 있다.
일 예에서, 상기 변이 표적 특이적 뉴클레아제는 스트렙토코커스 피요젠스 유래 Cas9 단백질의 아미노산 서열 중,
(1) D10, H840, 또는 D10 + H840;
(2) D1135, R1335, T1337, 또는 D1135 + R1335 + T1337; 또는
(3) (1)과 (2) 잔기 모두
에서 아미노산 치환이 일어난 것일 수 있다.
본 명세서에 사용된 바로서, 상기 '다른 아미노산'은, 알라닌, 이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 트립토판, 발린, 아스파라긴산, 시스테인, 글루타민, 글리신, 세린, 트레오닌, 티로신, 아스파르트산, 글루탐산, 아르기닌, 히스티딘, 라이신, 상기 아미노산들의 공지된 모든 변형체 중에서, 야생형 단백질이 원래 변이 위치에 갖는 아미노산을 제외한 아미노산들 중에서 선택된 아미노산을 의미한다. 일 예에서, 상기 '다른 아미노산'은 알라닌, 발린, 글루타민, 또는 아르기닌일 수 있다.
일 예에서, 상기 변이 표적 특이적 뉴클레아제는 엔도뉴클레아제 활성을 상실(예컨대, 니카아제 활성을 갖거나, 엔도뉴클레아제 활성 및 니카아제 활성을 모두 상실)한 변형 Cas9 단백질, 또는 야생형 Cas9과 상이한 PAM 서열을 인식하는 것일 수 있다. 예컨대, 상기 변형 Cas9 단백질은, 스트렙토코커스 피요제네스 (Streptococcus pyogenes) 유래의 Cas9 단백질에 있어서,
(1) D10 또는 H840 위치에 돌연변이 (예컨대, 다른 아미노산으로의 치환)가 도입되어 엔도뉴클레아제 활성이 상실되고 니카아제 활성을 갖는 변형 Cas9, 또는 스트렙토코커스 피요젠스 (Streptococcus pyogenes) 유래의 Cas9 단백질에 D10 및 H840 위치에 모두 돌연변이 (예컨대, 다른 아미노산으로의 치환)가 도입되어 엔도뉴클레아제 활성 및 니카아제 활성을 모두 상실한 변형 Cas9 단백질;
(2) D1135, R1335 및 T1337 중에서 하나 이상 또는 이들 모두에 돌연변이(예컨대, 다른 아미노산으로의 치환)가 도입되어 야생형과 상이한 PAM 서열을 인식하는 변형 Cas9 단백질; 또는
(3) (1) 및 (2)의 돌연변이가 모두 도입되어 니카아제 활성을 갖고 야생형과 상이한 PAM 서열을 인식하거나, 엔도뉴클레아제 활성 및 니카아제 활성을 모두 상실하고 야생형과 상이한 PAM 서열을 인식하는 변형 Cas9 단백질일 수 있다.
예컨대, 상기 CAs9 단백질의 D10 위치에서의 돌연변이는 D10A 돌연변이 (Cas9 단백질의 아미노산 중 10번째 아미노산인 D가 A로 치환된 돌연변이를 의미함; 이하, Cas9에 도입된 돌연변이는 동일한 방법으로 표기됨)일 수 있고, 상기 H840 위치에서의 돌연변이는 H840A 돌연변이일 수 있으며, D1135, R1335, 및 T1337 위치에서의 돌연변이는 각각 D1135V, R1335Q, 및T1337R일 수 있다.
일 예에서, 본 명세서에서 사용되는 표적 특이적 뉴클레아제는 스트렙토코커스 피요젠스 (Streptococcus pyogenes) 유래의 Cas9 단백질(예컨대, SwissProt Accession number Q99ZW2(NP_269215.1))에 (1) D10 위치에서의 돌연변이 (예컨대, 다른 아미노산으로의 치환) 가 도입되어 엔도뉴클레아제 활성이 상실되고 니케이즈 활성을 갖는 변형 Cas9, (2) H840 위치에서의 돌연변이 (예컨대, 다른 아미노산으로의 치환) 가 도입되어 엔도뉴클레아제 활성이 상실되고 니케이즈 활성을 갖는 변형 Cas9, (3) D10 위치에서의 돌연변이(예컨대, 다른 아미노산으로의 치환)와 H840 위치에 돌연변이 (예컨대, 다른 아미노산으로의 치환)가 모두 도입되어 엔도뉴클레아제 활성 및 니케이즈 활성을 모두 상실한 변형 Cas9 단백질 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 예컨대, 상기 CAs9 단백질의 D10 위치에서의 돌연변이는 D10A 돌연변이 (Cas9 단백질의 아미노산 중 10번째 아미노산인 D가 A로 치환된 돌연변이를 의미함; 이하, Cas9에 도입된 돌연변이는 동일한 방법으로 표기됨)일 수 있고, 상기 H840 위치에서의 돌연변이는 H840A 돌연변이일 수 있다.
상기 뉴클레아제는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법 등과 같이 인위적 또는 비자연적 생산된 것(non-naturally occurring)일 수 있다. 일 예에서, 상기 뉴클레아제는 재조합 DNA에 의하여 만들어진 재조합 단백질일 수 있다. 재조합 DAN(Recombinant DNA; rDNA)는 다양한 유기체로부터 얻어진 이종 또는 동종 유전 물질을 포함하기 위하여 분자 클로닝과 같은 유전자 재조합 방법에 의하여 인공적으로 만들어진 DNA 분자를 의미한다. 예컨대, 재조합 DNA를 적절한 유기체에서 발현시켜 단백질을 생산 (in vivo 또는 in vitro)하는 경우, 재조합 DNA는 제조하고자 하는 단백질을 암호화 하는 코돈들 중에서 상기 유기체에 발현하기에 최적화된 코돈을 선택하여 재구성된 뉴클레오타이드 서열을 갖는 것일 수 있다.
상기 뉴클레아제는 단백질, 이를 암호화하는 핵산 분자 (DNA 또는 mRNA), 가이드 RNA와 결합된 리보핵산 단백질, 상기 리보핵산 단백질을 암호화하는 핵산 분자, 또는 상기 핵산 분자를 포함하는 재조합 벡터의 형태로 사용될 수 있다.
상기 뉴클레아제 또는 이를 코딩하는 핵산 분자는 핵 내로 전달, 작용, 및/또는 발현될 수 있는 형태일 수 있다.
상기 뉴클레아제는 세포 내로 도입되기에 용이한 형태일 수 있다. 일 예로, 상기 뉴클레아제는 세포 침투 펩타이드 및/또는 단백질 전달 도메인 (protein transduction domain)과 연결될 수 있다. 상기 단백질 전달 도메인은 폴리-아르기닌 또는 HIV 유래의 TAT 단백질일 수 있으나, 이에 제한되지 않는다. 세포 침투 펩타이드 또는 단백질 전달 도메인은 상기 기술된 예 외에도 다양한 종류가 당업계에 공지되어 있으므로, 당업자는 상기 예에 제한되지 않고 다양한 예를 적용할 수 있다.
또한, 상기 뉴클레아제 또는 암호화하는 핵산 분자는 핵 위치 신호 (nuclear localization signal, NLS) 서열 또는 이를 암호화하는 서열을 추가로 포함할 수 있다. 따라서, 상기 뉴클레아제를 암호화하는 핵산 분자를 포함하는 발현 카세트는 상기 뉴클레아제를 발현시키기 위한 프로모터 서열 등의 조절 서열, 또는 여기에 더하여, NLS 서열을 포함할 수 있다. 상기 NLS 서열은 당업계에 잘 알려져 있다.
상기 뉴클레아제 또는 이를 암호화하는 핵산 분자는 분리 및/또는 정제를 위한 태그 또는 상기 태그를 암호화하는 핵산 서열과 연결될 수 있다. 일 예로, 상기 태그는 His 태그, Flag 태그, S 태그 등과 같은 작은 펩타이드 태그, GST (Glutathione S-transferase) 태그, MBP (Maltose binding protein) 태그 등으로 이루어진 군에서 적절하게 선택될 수 있으나, 이에 제한되지 않는다.
하나의 실시예에서, 디아미네이즈 융합체 중 일 말단은 표적 특이적 뉴클레아제와 링커로 연결될 수 있다. 상기 링커는 펩타이드 링커로 1 내지 40개의 아미노산 잔기, 구체적으로 2 내지 35개의 아미노산 잔기를 포함할 수 있다. 상기 링커는 예를 들어, (Gly)n (n은 2-40의 정수), (GGGGS)n (n은 1-10의 정수)일 수 있으나, 이에 제한되는 것은 아니다.
본 발명에서, 용어 "가이드 RNA (guide RNA)"는 표적 DNA 특이적인 RNA (예컨대, DNA의 표적 부위와 혼성화 가능한 RNA)를 의미하며, Cas 단백질, Cpf1 등과 같은 뉴클레오타이드와 결합하여 표적 DNA로 인도하는 역할을 한다.
상기 가이드 RNA는 복합체를 형성할 뉴클레아제의 종류 및/또는 그 유래 미생물에 따라서 적절히 선택될 수 있다. 예컨대, 상기 가이드 RNA는
DNA 표적 부위와 혼성화 가능한 부위를 포함하는 CRISPR RNA (crRNA);
Cas 단백질, Cpf1 등과 같은 엔도뉴클레오타이드와 상호작용하는 부위를 포함하는 trans-activating crRNA (tracrRNA); 및
상기 crRNA 및 tracrRNA의 주요 부위 (예컨대, crRNA의 혼성화 부위 및 tracrRNA의 상호작용 부위)가 융합된 형태의 단일 가이드 RNA (single guide RNA; sgRNA)로 이루어진 군에서 선택된 1종 이상일 수 있으며,
구체적으로 CRISPR RNA (crRNA) 및 trans-activating crRNA (tracrRNA)를 포함하는 이중 RNA (dual RNA), 또는 crRNA 및 tracrRNA의 주요 부위를 포함하는 단일 가이드 RNA (sgRNA)일 수 있다.
상기 sgRNA는 표적 DNA 내 서열과 상보적인 서열을 가지는 부분 (이를 Spacer region, Target DNA recognition sequence, base pairing region 등으로도 명명함) 및 Cas 단백질 결합을 위한 hairpin 구조를 포함할 수 있다. 보다 구체적으로, 표적 DNA 내 서열과 상보적인 서열을 가지는 부분, Cas 단백질 결합을 위한 hairpin 구조 및 Terminator 서열을 포함할 수 있다. 상기 기술된 구조는 5'에서 3' 순으로 순차적으로 존재하는 것일 수 있으나, 이에 제한되는 것은 아니다. 상기 가이드 RNA가 crRNA 및 tracrRNA의 주요 부분 및 표적 DNA의 상보적인 부분을 포함하는 경우라면 어떠한 형태의 가이드 RNA도 본 발명에서 사용될 수 있다.
예컨대, Cas9 단백질을 타겟 유전자 교정을 위하여 두 개의 가이드 RNA, 즉, 표적 유전자의 표적 서열 부위와 혼성화 가능한 뉴클레오타이드 서열을 갖는 CRISPR RNA (crRNA)와 Cas9 단백질와 상호작용하는 trans-activating crRNA (tracrRNA; Cas9 단백질과 상호작용함)를 필요로 하며, 이들 crRNA와 tracrRNA는 서로 결합된 이중 가닥 crRNA:tracrRNA 복합체 형태, 또는 링커를 통하여 연결되어 단일 가이드 RNA (single guide RNA; sgRNA) 형태로 사용될 수 있다. 일 예에서, Streptococcus pyogenes 유래의 Cas9 단백질을 사용하는 경우, sgRNA는 상기 Cas9의 crRNA의 혼성화 가능한 뉴클레오타이드 서열을 적어도 포함하는 crRNA 일부 또는 전부와 상기 Cas9의 tracrRNA의 Cas9 단백질와 상호작용하는 부위를 적어도 포함하는 tracrRNA 일부 또는 전부가 뉴클레오타이드 링커를 통하여 헤어핀 구조 (stem-loop 구조)를 형성하는 것일 수 있다 (이 때 뉴클레오타이드 링커가 루프 구조에 해당할 수 있음).
상기 가이드 RNA, 구체적으로 crRNA 또는 sgRNA는 표적 DNA 내 서열과 상보적인 서열을 포함하며, crRNA 또는 sgRNA의 업스트림 부위, 구체적으로 sgRNA 또는 dualRNA의 crRNA의 5' 말단에 하나 이상, 예컨대, 1-10개, 1-5개, 또는 1-3개의 추가의 뉴클레오티드를 포함할 수 있다. 상기 추가의 뉴클레오티드는 구아닌 (guanine, G)일 수 있으나, 이에 제한되는 것은 아니다.
다른 예에서, 상기 뉴클레아제가 Cpf1인 경우, 상기 가이드 RNA는 crRNA을 포함하는 것일 수 있으며, 복합체를 형성할 Cpf1 단백질 종류 및/또는 그 유래 미생물에 따라서 적절히 선택될 수 있다.
상기 가이드 RNA의 구체적 서열은 뉴클레아제 (Cas9 단백질 또는 Cpf1) 의 종류 (즉, 유래 미생물)에 따라서 적절히 선택할 수 있으며, 이는 이 발명이 속하는 기술 분야의 통상의 지식을 가진 자가 용이하게 알 수 있는 사항이다.
일 예에서, 표적 특이적 뉴클레아제로서 Streptococcus pyogenes 유래의 Cas9 단백질을 사용하는 경우, crRNA는 다음의 일반식 1로 표현될 수 있다:
5'-(Ncas9)l-(GUUUUAGAGCUA)-(Xcas9)m-3' (일반식 1)
상기 일반식 1에서,
Ncas9는 표적화 서열, 즉 표적 유전자(target gene)의 표적 부위(target site)의 서열에 따라서 결정되는 부위 (즉, 표적 부위의 서열과 혼성화 가능한 서열임)이며, l은 상기 표적화 서열에 포함된 뉴클레오타이드 수를 나타내는 것으로 17 내지 23 또는 18 내지 22의 정수, 예컨대 20일 수 있고;
상기 표적 서열의 3' 방향으로 인접하여 위치하는 연속하는 12개의 뉴클레오타이드(GUUUUAGAGCUA)를 포함하는 부위는 crRNA의 필수적 부분이고,
Xcas9는 crRNA의 3' 말단쪽에 위치하는 (즉, 상기 crRNA의 필수적 부분의 3' 방향으로 인접하여 위치하는) m개의 뉴클레오타이드를 포함하는 부위로, m은 8 내지 12의 정수, 예컨대 11일 수 있으며, 상기 m개의 뉴클레오타이드들은 서로 같거나 다를 수 있으며, 각각 독립적으로 A, U, C 및 G로 이루어진 군에서 선택될 수 있다.
일 예에서, 상기 Xcas9는 UGCUGUUUUG를 포함할 수 있으나 이에 제한되지 않는다.
또한, 상기 tracrRNA는 다음의 일반식 2로 표현될 수 있다:
5'-(Ycas9)p-(UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC)-3' (일반식 2)
상기 일반식 2에서, 60개의 뉴클레오타이드 (UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC)로 표시된 부위는 tracrRNA의 필수적 부분이고,
Ycas9는 상기 tracrRNA의 필수적 부분의 5' 말단에 인접하여 위치하는 p개의 뉴클레오타이드를 포함하는 부위로, p는 6 내지 20의 정수, 예컨대 8 내지 19의 정수일 수 있으며, 상기 p개의 뉴클레오타이드들은 서로 같거나 다를 수 있고, A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있다.
또한, sgRNA는 상기 crRNA의 표적화 서열과 필수적 부위를 포함하는 crRNA 부분과 상기 tracrRNA의 필수적 부분 (60개 뉴클레오타이드)를 포함하는 tracrRNA 부분이 올리고뉴클레오타이드 링커를 통하여 헤어핀 구조 (stem-loop 구조)를 형성하는 것일 수 있다 (이 때, 올리고뉴클레오타이드 링커가 루프 구조에 해당함). 보다 구체적으로, 상기 sgRNA는 crRNA의 표적화 서열과 필수적 부분을 포함하는 crRNA 부분과 tracrRNA의 필수적 부분을 포함하는 tracrRNA 부분이 서로 결합된 이중 가닥 RNA 분자에서, crRNA 부위의 3' 말단과 tracrRNA 부위의 5' 말단이 올리고뉴클레오타이드 링커를 통하여 연결된 헤어핀 구조를 갖는 것일 수 있다.
일 예에서, sgRNA는 다음의 일반식 3으로 표현될 수 있다:
5'-(Ncas9)l-(GUUUUAGAGCUA)-(올리고뉴클레오타이드 링커)-(UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC)-3' (일반식 3) 상기 일반식 3에서, (Ncas9)l는 표적화 서열로서 앞서 일반식 1에서 설명한 바와 같다.
상기 sgRNA에 포함되는 올리고뉴클레오타이드 링커는 3 내지 5개, 예컨대 4개의 뉴클레오타이드를 포함하는 것일 수 있으며, 상기 뉴클레오타이드들은 서로 같거나 다를 수 있고, A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있다.
상기 crRNA 또는 sgRNA는 5' 말단 (즉, crRNA의 타겟팅 서열 부위의 5' 말단)에 1 내지 3개의 구아닌(G)을 추가로 포함할 수 있다.
상기 tracrRNA 또는 sgRNA는 tracrRNA의 필수적 부분(60nt)의 3' 말단에 5개 내지 7개의 우라실 (U)을 포함하는 종결부위를 추가로 포함할 수 있다.
상기 가이드 RNA의 표적 서열은 표적 DNA 상의 PAM (Protospacer Adjacent Motif 서열(S. pyogenes Cas9의 경우, 5'-NGG-3' (N은 A, T, G, 또는 C임))의 5'에 인접하여 위치하는 약 17개 내지 약 23개 또는 약 18개 내지 약22개, 예컨대 20개의 연속하는 핵산 서열일 수 있다.
상기 가이드 RNA의 표적 서열과 혼성화 가능한 가이드 RNA의 표적화 서열은 상기 표적 서열이 위치하는 DNA 가닥 (즉, PAM 서열(5'-NGG-3' (N은 A, T, G, 또는 C임)이 위치하는 DNA 가닥)의 상보적인 가닥의 뉴클레오타이드 서열과 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 99% 이상, 또는 100%의 서열 상보성을 갖는 뉴클레오타이드 서열을 의미하는 것으로, 상기 상보적 가닥의 뉴클레오타이드 서열과 상보적 결합이 가능하다.
본 명세서에서, 표적 부위의 핵산 서열은 표적 유전자의 해당 유전자 부위의 두 개의 DNA 가닥 중 PAM 서열이 위치하는 가닥의 핵산 서열로 표시된다. 이 때, 실제로 가이드 RNA가 결합하는 DNA 가닥은 PAM 서열이 위치하는 가닥의 상보적 가닥이므로, 상기 가이드 RNA에 포함된 표적화 서열은, RNA 특성상 T를 U로 변경하는 것을 제외하고, 표적 부위의 서열과 동일한 핵산 서열을 갖게 된다. 따라서, 본 명세서에서, 가이드 RNA의 표적화 서열과 표적 부위의 서열 (또는 절단 부위의 서열)은 T와 U가 상호 변경되는 것을 제외하고 동일한 핵산 서열로 표시된다.
상기 가이드 RNA는 RNA 형태로 사용되거나, 이를 암호화하는 DNA를 포함하는 플라스미드 형태로 사용될 수 있다.
본 발명에서 용어 "표적 위치 (on-target site)" 란, 상기 표적 특이적 뉴클레아제를 이용하여 변이(절단, 삽입, 및/또는 결실)를 도입하고자 하는 위치를 의미하며, 그 목적에 따라 임의로 선택될 수 있는 것으로 특정 유전자의 코딩 서열 내부에 존재할 수 있을 뿐만 아니라, 단백질을 생성하지 않는 비-코딩 DNA 서열에 존재할 수도 있다.
상기 표적 특이적 뉴클레아제는 서열 특이성 (specificity)을 가지므로 표적 위치에 작용하는 것이나, 표적 서열에 따라 비표적 위치 (off-target site)에 작용하는 부작용이 발생할 수도 있다.
본 명세서에서, 비표적 위치 (off-target site)라 함은 표적 특이적 뉴클레아제의 표적 서열과 동일하지 않은 서열을 갖지만 상기 표적 특이적 뉴클레아제가 활성을 가지는 위치를 말한다. 즉, 표적 위치 이외의, 표적 특이적 뉴클레아제에 의해 절단되는 위치를 말한다. 일 예에서, 상기 비표적 위치는 특정 표적 특이적 뉴클레아제에 대한 실제 비표적 위치뿐만 아니라 비표적 위치가 될 가능성이 있는 위치까지 포함하는 개념으로 사용될 수 있다. 상기 비표적 위치는 이에 제한되는 것은 아니나, 시험관 내 (in vitro)에서 표적 특이적 뉴클레아제에 의해 절단되는 표적 위치 이외의 모든 위치일 수 있다.
유전자 가위가 표적 위치 이외의 위치에서도 활성을 가지는 것은 다양한 원인에 의해 야기될 수 있다. 예컨대, 표적 위치에 대하여 설계된 표적 서열과 뉴클레오티드 불일치 (mismatch)를 가지는, 표적 위치와 서열 상동성이 높은 비표적 서열의 경우 유전자 가위가 작동할 가능성이 있다. 상기 비표적 위치는 이에 제한되는 것은 아니나, 표적 서열과 1 이상의 뉴클레오티드 불일치 (mismatch)를 가지는 위치일 수 있다.
이는 유전체 내에서 원치 않는 유전자의 돌연변이를 야기할 수 있어 상기 표적 특이적 뉴클레아제를 사용하는데 심각한 문제가 될 수 있다. 이에, 표적 특이적 뉴클레아제의 표적 위치에서의 활성 못지 않게 비표적 위치를 정확히 검출하여 분석하는 과정 또한 매우 중요할 수 있으며, 이는 비표적 효과 없이 표적 위치에만 특이적으로 작동하는 표적 특이적 뉴클레아제를 개발하는데 유용하게 사용될 수 있을 것이다.
본 발명의 목적상 상기 뉴클레아제는 생체 내 (in vivo) 및 시험관 내 (in vitro)에서 뉴클레아제 활성을 가질 수 있으므로, 시험관 내에서 유전체 DNA의 비표적 위치를 검출하는데 사용될 수 있으며, 이를 생체 내에서 적용하였을 때 상기 검출된 비표적 위치와 동일한 위치에도 활성을 가질 것을 예상할 수 있다.
염기 교정에 의해 암호화 스플라이싱 부위 내, 엑손 스플라이싱 사일런서 또는 인핸서를 변경하거나 시작 또는 정지 코돈의 도입 또는 제거를 통해 코돈 용도 또는 스플라이싱 행태로 표적 RNA에서 번역된 단백질내의 아미노산을 변경시킴으로써 엑손 내, 또는 인트론 스플라이싱 사일런서 또는 인트론 스플라이싱 인핸서 브랜치 포인트를 변경하여 스플라이싱을 변화시킴으로써 인트론 내에서 일반적으로 RNA 안정성, 구조 또는 기능에 영향을 미치는 임의의 영역 내에서 변경이 일어남으로써, 표적의 아미노산 변화 또는 mRNA 미스-스플라이싱 (mis-splicing)에 의해 식물의 표현형이 변화할 수 있다.
이와 같은 염기 변환에 의하여 식물세포에서 단일 뉴클레오타이드 치환을 유도할 수 있다. 표적 RNA 서열은 점 변이(전이 또는 형질 전환)와 같은 교정 또는 변경하고자 하는 변이를 포함할 수 있다. 선택적으로 표적 RNA 서열을 변형된 표현형(또는 RNA 바이러스와 같은 RNA 기반 유기체의 경우에는 유전자형)을 생성하기 위해 이전에 변이가 없었던 곳에서 의도적으로 변이를 창출할 수 있다.
본 명세서에 사용된 코딩 유전자는 cDNA, rDNA 또는 이를 포함하는 재조합 벡터, 또는 mRNA 형태로 사용될 수 있다. 당업자는 그 목적에 따라, 제조하고자 하는 유전체 교정 식물체에 대하여 원하는 변이에 따라 교정하고자 하는 식물체의 유전체 내에 있는 일부 DNA인 표적 유전자를 선별할 수 있다. 상기 표적 유전자는 예를 들어, AtalS, AtPDS, AtFT, AtLFY 유전자 또는 BnALS, BnPDS 유전자 각각일 수 있다.
표적 유전자의 변환과 관련하여, 표적 아데닌에 선행하는 뉴클레오타이드에 대한 변환의 우선성과 관련하여, T가 타겟 A에 선행하는 경우에 변환 효율이 높을 수 있음을 확인하였다. 구체적으로, A, G 또는 C가 타겟 A에 선행하는 경우에 비해 T가 타겟 A에 선행하는 경우에 변환 효율이 높을 수 있다.
다른 관점에서, 본 발명은 유전자 구조체가 작동 가능하도록 연결된 식물의 염기 교정용 벡터에 관한 것이다.
"작동 가능하게 연결된"은 유전자 발현과 관련된 조절서열(예: 프로모터, 시그널 서열, 또는 전사조절인자 등)과 다른 유전자 사이의 기능적인 결합을 의미하며, 이에 의해 상기 조절서열은 상기 다른 유전자의 전사 및/또는 해독을 조절하게 된다.
유전자의 과발현을 위하여 사용되는 벡터는 당업계에 공지된 발현 벡터가 사용될 수 있다. "벡터"는 세포 내로 전달하는 DNA 단편(들), 핵산 분자를 지칭할 때 사용된다. 벡터는 DNA를 복제시키고, 숙주세포에서 독립적으로 재생산될 수 있다. 용어 "전달체"는 흔히 "벡터"와 호환하여 사용된다. 용어 "발현 벡터"는 목적한 코딩 서열과, 특정 숙주 생물에서 작동가능하게 연결된 코딩 서열을 발현하는데 필수적인 적정 핵산 서열을 포함하는 재조합 DNA 분자를 의미한다.
상기 벡터는 Agrobacterium tumefaciens와 같은 숙주에 존재할 때 그 자체의 일부, 소위 T-영역을 식물 세포로 전이시킬 수 있는 Ti-플라스미드 벡터일 수 있다. Ti-플라스미드 벡터는 식물세포, 또는 외부 DNA를 식물의 게놈 내에 적당하게 삽입시켜, 새로운 식물이 생산될 수 있는 원형질체로 외부 DNA 서열을 전이시키는데 이용될 수 있다.
Ti-플라스미드 벡터의 특히 바람직한 형태는 바이너리(binary) 벡터이다. DNA를 식물 숙주에 도입시키는데 이용될 수 있는 다른 적합한 벡터는 이중 가닥 식물 바이러스(예를 들면, CaMV) 및 단일 가닥 바이러스, 게미니 바이러스 등으로부터 유래될 수 있는 것과 같은 바이러스 벡터, 예를 들면 비완전성 식물 바이러스 벡터로부터 선택될 수 있다. 이러한 벡터의 사용은 특히 식물 숙주를 적당하게 형질전환하는 것이 어려울 때 유리할 수 있다.
발현 벡터는 바람직하게는 하나 이상의 선택성 마커를 포함할 수 있다. 상기 마커는 통상적으로 화학적인 방법으로 선택될 수 있는 특성을 갖는 핵산 서열로, 형질전환된 세포를 비형질전환 세포로부터 구별할 수 있는 모든 유전자가 해당될 수 있다. 예를 들어, 글리포세이트(glyphosate) 또는 포스피노트리신(phosphinothricin)과 같은 제초제 저항성 유전자, 카나마이신(Kanamycin), G418, 블레오마이신(Bleomycin), 하이그로마이신(hygromycin), 클로람페니콜(chloramphenicol)과 같은 항생제 내성 유전자가 있으나, 이에 한정되는 것은 아니다.
상기 벡터는 프로모터, NLS (nucleus localization protein sequence) 또는 터미네이터 (terminator)를 포함할 수 있다.
프로모터는 예를 들어, CaMV 35S, Yao, 액틴, 유비퀴틴, pEMU, MAS 또는 히스톤 프로모터일 수 있으나, 이에 제한되지 않는다. "프로모터"는 구조 유전자로부터의 DNA 업스트림의 영역을 의미하며 전사를 개시하기 위하여 RNA 폴리머라아제가 결합하는 DNA 분자를 말한다. "식물 프로모터"는 식물 세포에서 전사를 개시할 수 있는 프로모터이다. "구성적(constitutive) 프로모터"는 대부분의 환경 조건 및 발달 상태 또는 세포 분화하에서 활성이 있는 프로모터이다.
상기 벡터는 NLS를 추가로 포함할 수 있으며, 식물 세포의 핵에서 검출 가능한 양으로 단백질의 축적을 유도하기에 충분한 강도를 가지는 아미노산 서열을 포함할 수 있다. NLS는 염기성의, 양으로 하전된 잔기(예를 들어, 라이신 및/또는 아르기닌)의 하나 이상을 포함하는 짧은 서열(예를 들어, 2개 내지 20개의 잔기)을 포함할 수 있으며, 표적 특이적 뉴클레아제의 N 말단 또는 C 말단에 작동 가능하게 연결될 수 있다.
상기 벡터는 터미네이터를 추가로 포함할 수 있으며, 식물 세포에서의 전사의 확실성 및 효율을 증가시키기 위해 포함될 수 있다. 상기 터미네이터는 예를 들어 CaMV 35S 터미네이터, 노팔린 신타아제(NOS), 벼 α-아밀라아제 RAmy1 A 터미네이터, 파세올린(phaseoline) 터미네이터, 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)의 옥토파인(Octopine) 유전자의 터미네이터, 대장균의 rrnB1/B2 터미네이터 등을 포함할 수 있으나, 이에 한정되는 것은 아니다.
다른 관점에서, 본 발명은 식물 원형질체에 상기 유전자 구조체 또는 벡터를 도입하는 단계; 및 표적을 특이적으로 인식하는 가이드 RNA를 식물 원형질체에 처리하는 단계를 포함하는 식물의 염기 교정 방법에 관한 것이다.
경우에 따라서, 야생형 디아미네이즈 및 변이 디아미네이즈를 포함하는 디아미네이즈 융합체를 코딩하는 유전자 구조체를 포함하는 벡터를 식물 원형질체에 도입하는 단계; 표적 특이적 뉴클레아제를 코딩하는 유전자 구조체를 포함하는 벡터를 식물 원형질체에 도입하는 단계; 및 표적을 특이적으로 인식하는 가이드 RNA를 식물 원형질체에 처리하는 단계를 포함하여 식물의 염기를 교정할 수 있다.
상기 유전자 구조체 또는 벡터는 박테리아-매개 식물 형질전환을 통해 식물 원형질체에 도입될 수 있다. 상기 박테리아-매개 형질전환은 아그로박테리움-매개 식물 형질전환일 수 있다.
미세주입법 (microinjection), 전기천공법 (electroporation), DEAE-덱스트란 처리, 리포펙션 (lipofection), 나노파티클-매개 형질주입, 단백질 전달 도메인 매개 도입, 및 PEG-매개 형질주입 등과 같은 당업계의 다양한 방법에 의해 원형질체로 도입될 수 있다.
상기 유전자 구조체 또는 벡터를 통해, 코딩 유전자가 식물 원형질체 중 일시적으로 발현(Transient Expression)되거나, 안정적 형질전환(stable transformation)될 수 있다. 코딩 유전자가 식물 원형질체 중에 도입되어 일시적으로 발현되거나, 식물의 게놈에 도입되어 염색체 상 인자로 존재함으로써 안정적으로 형질전환될 수 있다.
또 다른 관점에서, 본 발명은 상기 유전자 구조체 또는 벡터가 도입된 염기 교정 식물체에 관한 것이다.
상기 식물체는 원형질체를 수득할 수 있는 식물이라면 제한되지 않는다. 상기 염기 교정 식물체는 야생형 식물에 비해 하나 이상의 변경, 변형, 또는 개선된 형질을 포함하는 유전적으로 개선된 식물을 의미한다. 개선된 외관, 열매, 잎 또는 임의의 다른 식물 부분이 바람직한 모양으로 개선되는 형태학적 형질 변화를 유도하거나, 영양적 품질 (종자 또는 곡물 품질 특성 및/또는 식물의 생장관련영양적 또는 기호적 품질을 포함); 스트레스 내성, 예를 들어, 가뭄이나 염 내성과 같은 비생물성 스트레스 내성; 식물 수확량 (곡물 수확량 및/또는 식물의 생장관련 부분의 수확량을 포함); 종자 또는 곡물 휴면기; 병해 저항성과 같은 생물성 스트레스 저항성 등의 형질 변화를 유도할 수 있다.
상기 유전체가 교정된 식물 원형질체를 재생시켜 유전체 교정 식물체를 제조할 수 있다. 예를 들어, 상기 식물 원형질체를 배양하여 캘러스 (callus)를 형성시킴으로써, 재생된 식물체를 제조할 수 있다. 상기 캘러스 형성 단계 및 캘러스로부터 재생된 식물체를 제조하는 단계에서 사용되는 배지 조성은 식물의 종류 및 상태에 따라 당업자에 의해 적절하게 수행될 수 있으며, 이러한 배양 조건은 당업계에 공지되어 있다.
실시예
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지는 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예 1. 플라스미드 구축 및 도입
식물 코돈 (Arabidopsis thaliana) 최적화 코딩 서열을 가지는 4 종류의 tRNA 아데노신 디아미나아제 이량체 구조물 (다음의 요소를 포함 : 야생형 ecTadA - 32aa 링커 - 변이 ecTadA (6.3,7.8,7.9 및 7.10: 표 1)-32aa 링커를 Integrated DNA technology (아이오와, 미국)에 의해 합성하였다. TadA 이량체 구조물 및 식물 Cas9 바이너리 벡터 조각을 15-bp 중복 프라이머 세트 (표 2)를 사용하여 증폭하고 인퓨전 클로닝법에 의해 (Takara, Japan) pcABE 바이너리 벡터를 제작하였다.
식물세포에서 ABE 활성을 시험하기 위해, 먼저 식물 코돈 최적화 대장균 유래의 4 개의 '후기' ABE (ABE6.3, 7.8, 7.9 및 7.10)로부터 유전자 조작된 TadA 단백질 (ecTadAs) 세트의 각 구성을 Cas9 니케이즈와 조합하여 네 가지 식물 적합성 ABE 바이너리 벡터 (이후 " pcABE "이라 함)을 구축하였다. 벡터는 다음의 요소를 포함한다 (Gaudelli, N. M. et al. Nature 551, 464-471 (2017) 참조): 35S 프로모터/Yao 프로모터/RPS5A - wtEcTadA - 32aa 링커-변이 EcTadA (6.3,7.8,7.9 및 7.10) -32aa 링커 - 니카아제 Cas9 - NLS - 35S 터미네이터 (도 1 및 도 13).
[표 1]
[표 2]
실시예 2. 원형질체 형질감염
AtalS, AtPDS, AtFT 및 AtLFY 유전자를 타겟하기 위하여 Arabidopsis thaliana의 원형질체 및 BnALS 및 BnPDS 유전자 자리를 표적으로 하여 Brassica napus (rapeseed)의 원형질체에 이러한 pcABE를 일시적으로 전달하였다.
3 주된 Arabidopsis thaliana 생태형 Columbia-0 (Col-0)의 잎 및 Brassica napus cv. Tammi 자엽을 원형질체 일시적 발현 분석에 사용하였다. 원형질체의 분리 및 형질감염은 이전에 기재된 것에서 다음과 같이 변형하여 수행하였다. 두가지 종류의 잎 유래 원형질체를 분리하여 효소 용액 (1 % 비스코자임 0.5 % 셀 크러스트 0.5 % 노보자임, 3mM MES 9 % 만니톨 및 CPW 소금, pH5.8)에 적셔서 어두운 곳에서 실온 중 1.5 시간 (A. thaliana) 또는 1 시간 (B. napus) 동안 진탕시켰다 (40rpm). 20μg의 pcABE 플라스미드를, PEG (40 % [w / v] PEG4000, 0.2M 만니톨 및 0.1M CaCl2) 매개 형질감염에 의해 1 X 105 원형질체에 도입하였다. 72 시간 후 원형질체를 수확하여 앰플리콘 딥 시퀀싱 및 오프 타겟 분석을 위해 게놈 DNA를 추출하였다.
딥 시퀀싱 결과는 pcABE이 두 종의 모든 표적 부위에서 활성이며, A에서 G로 변환을 촉매하는 것으로 나타났다. 4 개의 pcABE 프로토 타입에서 pcABE7.10이 가장 효율적이며, A에서 G까지의 염기 편집 빈도는 Arabidopsis에서 4.7 %까지이고, 8.9 %, 유채의 A5~A9 지점에서 8.9 %까지이었다 (도 1 및 도 14 내지 16). 바람직하지 않은 인델은 서열 결정의 노이즈 레벨 범위의 빈도 (<0.1 %) 빈도로 거의 관찰되지 않았다 (도 2 및 도 14 내지 16). 식물 시스템의 아데닌 염기 편집 창은 인간 세포에서 관찰된 것과 유사하고 Arabidopsis 게놈 중 4개의 추가 A 반복 표적에 대하여 시험되었다 (도 3, 도 17).
실시예 3. 오프-타겟 분석
Cas-OFFinder13를 사용하여 식별된 최대 4 뉴클레오티드 불일치와 함께, 14 및 6의 잠재적 오프 타겟 부위에서 AtFT 및 AtALS 부위 각각을 표적으로 한 pcABE7.10의 오프 타겟 효과를 분석하였다. 딥 시퀀스의 결과는 이러한 부위에서 거의 무시할 수 있는 오프 타겟 활성을 보이고, A에서 G에 상당한 오프 타겟 변환은 보이지 않은 반면, 2개의 온 타겟 부위에서 편집 효율은 AtFT 부위에서 9.0 %, AtALS 부위에서 1.8 %이었다 (도 18).
ABE가 표적 아데닌에 선행하는 뉴클레오타이드 조성물에 대해 어떠한 잠재적인 우선성을 나타낼지 여부를 조사하였다. pcABE7.10 일시적 발현 분석에서의 표적화된 앰플리콘 시퀀싱 결과를 분석하여 A5 변환 효율을 측정하고, 선행하는 A4, G4, C4, 또는 T4에 따라 동일한 표적 서열에서 A7 변환 효율로 정규화하였다.
흥미롭게도, A5와 A3의 변환 효율에 나타낸 바와 같이 A에서 G로의 변환 효율은 T가 타겟 A에 선행하는 경우에 높은 것으로 밝혀졌다 (도 4). T4-A5 부위 (AT5G07740 및 AT5G61580)에서 염기 편집 빈도는 A4-A5 (Chr1 : 28753259) G4-A5 (FT) 및 C4-A5 (AT5G16750) 부위 보다 더 높았다. 마찬가지로 T2-A3 부위 (AT5G61580)의 염기 편집 빈도는 G2-A3 부위 (AT5G07740)의 염기 편집 빈도 보다 높았다.
실시예 4. 형질전환
Agrobacterium tumefaciens 매개 형질전환의 플로랄 딥 방법(floral dip method)은 Arabidopsis Col-0을 사용하여 수행되었다. Agrobacterium tumefaciens 균주 GV3101을 전기천공에 의해 pcABE7.10 바이너리 벡터로 형질전환하였다. pcABE7.10을 발현하는 바이너리 벡터 시스템과 일시적 발현 분석 중 원하는 염기 위치에서 특이성을 시험한 FT 및 PDS3 유전자 자리를 표적으로 하는 sgRNA (small-guide RNAs)를 이용하여 아그로박테리움 매개 Arabidopsis 형질전환을 수행하였다 (도 19).
플로랄 딥 형질전환 후 얻어진 Arabidopsis T1 씨앗을 25mg/L PPT (phosphinotricin)와 혼합한 반 강도 MS 배지에 심었다. 모든 유전자 변형 식물을 23℃에서 16 시간 광조건 및 8 시간의 암조건에서 성장시켰다. Aar1 매개 sgRNA 클로닝은 식물 형질 전환 벡터로 수행하였다. 사용된 sgRNA 복제 프라이머 세트는 gRNA cloning F: GATTGNNNNNNNNNNNNNNNNNNNN (N= target sequence, 5'-3') 및 gRNA cloning R" AAACNNNNNNNNNNNNNNNNNNNNC (N= target sequence, 5'-3')이다.
일시적 발현 분석에서 이미 사용된 35S 프로모터 의존성 발현 시스템 이외에, Arabidopsis 초기 발생 단계에서 YAO 및 RPS5A 프로모터가 효율적인 Cas9 발현을 보장할 수 있으므로, Arabidopsis에서 YAO 프로모터 및 RPS5A 프로모터 의존성 ABE 발현 시스템을 구축하고 시험하였다 (도 5). FT 부위를 표적으로 한 ABE를 포함하여, 35S, YAO 및 RPS5A 프로모터-ABE 시스템 각각에서 52,44 및 20개의 T1 형질전환체를 얻었다 (도 6). 얻어진 T1 식물에 대하여 표적화 딥 시퀀싱을 실시함으로써, FT 표적 부위에서 상당한 수준의 염기 치환을 갖는 T1 모종의 수를 확인하였다 (도 6). 시험한 3 개의 프로모터-ABE 시스템 중에서 RPS5A 프로모터 시스템이 가장 효율적인 것으로 나타났다 : T1 식물의 85 %가 50%를 초과하는 편집 효율을 나타내었다 (도 6).
RPS5A-ABE를 이용한 아데닌 염기 편집을 통해 Arabidopsis에 변형된 표현형을 도입하기 위해, 염기 편집 창에서 FT의 A7 및 PDS3의 A6에서 A에서 G로의 변환을 달성하여 FT 단백질에서 아미노산 변화(Y85H)를 유도하거나 PDS3 유전자에서 3번째 인트론의 스플라이싱 수용체 부위를 변형시킬 수 있는 각각의 sgRNA를 설계하였다 (도 7). 원하는 표현형과 함께 일부 T1 식물이 출현하였다 (도 8 및 도 9). FT가 표적화된 T1 식물은 보통 길이의 날짜 조건에서 생육하는 경우 Col-0 식물에 비해 늦은 개화 표현형을 보였으며 (도 8), 이것은 Y85H 아미노산 변화가 FT에서 TFL1 기능으로 전환되는 것을 유도한다는 이전 보고와 일치한다.
PDS3가 표적화된 T1 식물은 일련의 왜소 및 모자이크 알비노 표현형을 보이고 (도 9), 이것은 인트론 / 엑손 접합부를 타겟하는 ABE가 mRNA 미스 스플라이싱에 의해 기능적 PDS 녹아웃 대립 유전자를 야기하였음을 시사한다. 흥미롭게도, 일부 알비노 표현형은 젊은 로제트 잎에서 보였지만, 다른 것은 코린 잎의 가장자리에 있었으며 (도 9), 이것은 RPS5A-ABE 활성이 초기 발생 단계에 엄격하게 한정되지 않음을 나타낸다.
예상되는 표현형을 갖는 이러한 T1 식물의 생거 시퀀싱 및 / 또는 앰플리콘 딥 시퀀싱 분석을 통해, FT 및 PDS3에서 A에서 G로 변환이 효율적으로 유도됨을 밝혔다 (도 10~도 11). 생어 시퀀싱은 정제된 PCR 산물을 이용하여 상업 회사 (Macrogen 한국)에 의해 이루어졌다. 부위 특이적 프라이머를 사용하여 3 단계의 PCR (네스티드 PCR, 2nd PCR 및 인덱스 PCR)을 실시하여, 표적화 딥 시퀀싱을 수행하였다. PCR 앰플리콘의 표적화 딥 시퀀싱은 Illumina Mini-seq (Illumina, USA)로 수행하였다. A에서 G로 변환 및 인델 빈도는 Cas-analyzer 20을 사용하여 결정하였다.
FT # 3 T1 식물은 T에서 C로 변환에 대해 하나의 크로마토그램 피크를 나타내었고, A7 위에서만 우선적으로 A에서 G로 변환이 일어났다는 것을 보여준 반면 (도 10), 앰플리콘 딥 시퀀싱 결과를 통해 A에서 G 변환 효율이 84%임을 보여주었다 (도 11). PDS3 # 4 및 PDS3 # 5 식물에서 알비노 잎의 분석을 통해 원하는 A6 위치에서 각각 52 % 및 66 %의 빈도로 염기 편집을 보였다 (도 11). 흥미롭게도 두 알비노 모자이크 식물로부터 녹색 잎의 분석을 통해, 각각 19 %와 12 %의 A에서 G로의 변환 효율을 밝혔으며 (도 11), 모자이크 현상의 범위는 알비노 표현형 없이 조직 전체에넓게 분포할 수도 있음을 시사한다 (도 11).
ABE 의해 유도된 PDS3 mRNA의 미스-스플라이싱이 PDS3 타겟 식물에서 모자이크 알비노 표현형 유도하는지 확인하고자 하였다. 인트론 / 엑손 접합부를 타겟한 ABE가 모자이크 알비노 잎에서 임의의 미스-스플라이싱된 mRNA 변이체를 생산하는지 여부를 시험하기 위해 엑손 3에서 엑손 5에 이르는 cDNA 앰플리콘에 대하여 딥 시퀀싱 분석을 실시하였다 (도 12). 251-bp 야생형 리드(read) 이외에 다른 247-bp cDNA의 앰플리콘 리드를 발견하였다(도 12). 서열 분석을 통해 247 bp의 앰플리콘이 조기 종결 코돈을 갖는 미스-스플라이싱에 대응한다는 것이 밝혀졌다.
요약하면, 우리는 pcABE을 사용하여 A. thaliana (13 부위) 및 B. napus (2 부위)의 15개 타겟 부위 모두에서 목적하지 않은 인델 또는 A에서 G로 변환되지 않은 것 없이, 원형질체 중 효율적으로 A에서 G로 변환을 달성하였고, 식물 중 정확한 염기 편집으로부터 아미노산 변화 또는 mRNA 미스-스플라이싱 중 하나에 의해 표현형이 변화한 Arabidopsis 형질전환 식물을 얻었다.
이상으로 본 발명의 내용의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서, 이러한 구체적 기술은 단지 바람직한 실시양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의하여 정의된다고 할 것이다.
<110> Institute for Basic Science
<120> Gene Construct for Base Editing in Plant, Vector Comprising the
Same and Method for Base Editing Using the Same
<130> 060
<160> 17
<170> PatentIn version 3.5
<210> 1
<211> 1666
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 1
gatccctcaa cttttgattc gctatttgca gtgcacctgt ggcgttcatc acatcttttg 60
tgacactgtt tgcactggtc attgctatta caaaggacct tcctgatgtt gaaggagatc 120
gaaagtaagt aactgcacgc ataaccattt tctttccgct ctttggctca atccatttga 180
cagtcaaaga caatgtttaa ccagctccgt ttgatatatt gtctttatgt gtttgttcaa 240
gcatgtttag ttaatcatgc ctttgattga tcttgaatag gttccaaata tcaaccctgg 300
caacaaaact tggagtgaga aacattgcat tcctcggttc tggacttctg ctagtaaatt 360
atgtttcagc catatcacta gctttctaca tgcctcaggt gaattcatct atttccgtct 420
taactatttc ggttaattaa agcacgaaca ccattactgc atgtagaagc ttgataaact 480
atcgccacca atttattttt gttgcgatat tgttactttc ctcagtatgc agctttgaaa 540
agaccaaccc tcttatcctt taacaatgaa caggttttta gaggtagctt gatgattcct 600
gcacatgtga tcttggcttc aggcttaatt ttccaggtaa agcattatga gatactctta 660
tatctcttac atacttttga gataatgcac aagaacttca taactatatg ctttagtttc 720
tgcatttgac actgccaaat tcattaatct ctaatatctt tgttgttgat ctttggtaga 780
catgggtact agaaaaagca aactacacca aggtaaaata cttttgtaca aacataaact 840
cgttatcacg gaacatcaat ggagtgtata tctaacggag tgtagaaaca tttgattatt 900
gcaggaagct atctcaggat attatcggtt tatatggaat ctcttctacg cagagtatct 960
gttattcccc ttcctctagc tttcaatttc atggtgagga tatgcagttt tctttgtata 1020
tcattcttct tcttctttgt agcttggagt caaaatcggt tccttcatgt acatacatca 1080
aggatatgtc cttctgaatt tttatatctt gcaataaaaa tgcttgtacc aattgaaaca 1140
ccagcttttt gagttctatg atcactgact tggttctaac caaaaaaaaa aaatgtttaa 1200
tttacatatc taaaagtagg tttagggaaa cctaaacagt aaaatatttg tatattattc 1260
gaatttcact catcataaaa acttaaattg caccataaaa ttttgtttta ctattaatga 1320
tgtaatttgt gtaacttaag ataaaaataa tattccgtaa gttaaccggc taaaaccacg 1380
tataaaccag ggaacctgtt aaaccggttc tttactggat aaagaaatga aagcccatgt 1440
agacagctcc attagagccc aaaccctaaa tttctcatct atataaaagg agtgacatta 1500
gggtttttgt tcgtcctctt aaagcttctc gttttctctg ccgtctctct cattcgcgcg 1560
acgcaaacga tcttcaggtg atcttctttc tccaaatcct ctctcataac tctgatttcg 1620
tacttgtgta tttgagctca cgctctgttt ctctcaccac agcccc 1666
<210> 2
<211> 1092
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 2
agtgaagtgg aattctccca cgagtattgg atgagacacg cattgacgct cgcaaaaaga 60
gcgtgggacg agagggaagt acccgtcgga gcagtcctcg tgcataacaa tcgggtgata 120
ggcgagggct ggaatcgacc tatcggccga catgacccga ccgcccatgc agaaattatg 180
gctctgcgac agggagggtt ggtgatgcag aactatcggc ttatcgatgc cacactctac 240
gttacgcttg aaccgtgcgt tatgtgtgcg ggggcgatga tacatagtag aatagggagg 300
gtcgtgttcg gggcgcgaga tgcgaaaacc ggggccgcag gctcattgat ggacgtcctg 360
caccaccccg gcatgaacca tcgggtcgag ataaccgaag gcatattggc agacgaatgt 420
gctgcgctcc tttccgattt ctttaggatg cgacgccagg agatcaaggc gcaaaaaaaa 480
gcccagtcta gtaccgactc cgggggcagc agtggggggt ctagtggcag tgagacgccc 540
ggtacgagcg agagcgccac gcctgaatca tcaggtggaa gcagtggtgg ctcttctgaa 600
gtcgaatttt cccacgagta ctggatgaga cacgcactta cgcttgccaa gagggcaaga 660
gatgaacgcg aggtcccggt cggagcagtg cttgtcctta ataatagagt gataggcgaa 720
ggctggaatc gagctatcgg cctccacgat cctaccgcgc atgctgagat catggcgctg 780
cgacaagggg ggctggtaat gcaaaactat agactcatcg atgcgacgct gtatgtgacc 840
tttgagccct gtgttatgtg tgctggggct atgatacata gcagaattgg cagggtagtc 900
ttcggcgtcc gcaatgccaa aaccggggca gctggatcct tgatggatgt tttgcattac 960
cctggaatga atcatagggt tgagattaca gaaggtatct tggcggatga atgcgccgca 1020
cttctctgtt atttttttcg gatgccgagg caagtcttca atgcccagaa aaaagcgcag 1080
tctagtacag ac 1092
<210> 3
<211> 1182
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 3
atgtccgagg tagagttcag ccatgaatat tggatgagac acgctctaac acttgccaaa 60
agagcatggg acgaaagaga ggtacctgtg ggcgctgttt tagtacataa caatcgagtc 120
ataggagagg gtggaacaga cccattggac gacatgaccc aaccgctcac gcggagataa 180
tggcgttgcg acagggagga ctcgttatgc aaaattatcg actgatagat gcaactttat 240
acgtaacgct ggaaccggcg taatgtgcgc aggcgcaatg atacactcta ggattgggag 300
ggtcgtcttt ggagccagag acgccaaaac gggtgcggcg ggcagcctta tggacgtact 360
acatcaccca gggatgaacc acagagtgag ataacagaag gaattttggc ggacgagtgc 420
gcggctttgc tgagcgactt ctttagaatg cgacgtcaag agattaaggc acagaaaaaa 480
gctcagtcca gcacggatag tggcgggtcc tcaggtgctc aagcggatca gaaacccctg 540
gtacctctga atctgcaact ccggagagca gcggaggatc tagtggaggt tcatctgagg 600
tcgagttctc acacgaatac tggatgagac acgcgcttac cctcgccagc gtgcgtggga 660
cgagcgagag gtccctgtgg gcgcggtcct agtattgaac aaccgtgtca taggtgaggg 720
ttggaaccga tctataggac tccacgaccc caccgcacac gcggagataa tggccctaga 780
caaggcggtt tggtaatgca aaactaccga ctaattgatg ctacattgta cgtcacgttt 840
gagccttgcg taatgtgcgc gggcgcgatg atccatagca ggatcgggag agtcgttttt 900
ggcgtgcaaa cgctaagaca ggtgcagcag gatccctgat ggatgtactt cactatccag 960
gcatgaatca ccgtgtcgaa ataaccgagg gaattctcgc agatgaatgt gcggcgttat 1020
tgtgttattt cttccgttgc gtagacaagt gttcaacgcg caaaagaagg cgcaatcatc 1080
taccgactcc ggtggcagta gtggaggcag ctcagggtcc gaaacacccg gtacaagcga 1140
gtccgccaca ccagaaagta gtggcggagc tctggtgggt ca 1182
<210> 4
<211> 1182
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 4
atgagcgaag tggagttttc tcacgagtat tggatgagac atgctttgac tcttgctaaa 60
agggcatggg acgaacgaga ggtaccggtc ggtgcagttt tagtgcacaa caatcgtgtc 120
ataggggggg ttggaatagg cctattggga ggcatgaccc aactgcacac gctgaaataa 180
tggctttgag gcagggtggg ctcgtaatgc agaactacag gctgatagac gctacgctgt 240
atgtaaccct agaaccagcg tcatgtgcgc tggtgctatg attcacagta gaattggccg 300
tgtagttttc ggagccaggg atgccaagac cggggcagca ggttccctca tggatgtcct 360
acaccacccc ggaatgaacc acagggtgaa atcacggaag gtatcttagc ggacgagtgt 420
gcagctctgc tctccgactt ctttcgtatg agacgacagg agatcaaggc acagaaaaag 480
gcacaaagtt caactgactc aggcggctct agtgggggag tagtggcagc gagaccccag 540
ggacatccga gtctgccact cctgagagtt caggaggcag tagtggaggg tcctcagagg 600
tcgagttcag tcacgagtat tggatgcgtc atgcccttac attggctagc gagctttgga 660
cgaaagagaa gtcccagtcg gagcggtgtt ggttttgaac aaccgagtaa ttggcgaggg 720
gtggaacaga gcaatcggac tccatgaccc caccgcccat gctgaaataa tggcgctcga 780
caaggtggac tcgtaatgca aaactacaga cttattgacg cgactttata tgtaactttt 840
gaaccctgtg tgatgtgcgc tggggcaatg atccattcac gtatcggtcg tgtagtgttt 900
ggggtcctaa tgcgaaaacg ggtgcggcgg ggagtctaat ggacgttctt cactacccag 960
gtatgaatca tcgtgtagag ataactgagg gcatcctcgc tgacgagtgt aacgccctgt 1020
tatgctactt tttccgatgc gtagacaagt gtttaatgct cagaagaagg ctcagtcttc 1080
tacggattca ggaggatctt ccggtggcag ctctggaagc gagacccccg gcacgtccga 1140
atcagcgacg ccagagtcat caggtggtca tctggtggga gc 1182
<210> 5
<211> 1182
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 5
atgagcgaag tggagttttc tcacgagtat tggatgagac atgctttgac tcttgctaaa 60
agggcatggg acgaacgaga ggtaccggtc ggtgcagttt tagtgcacaa caatcgtgtc 120
ataggggggg ttggaatagg cctattggga ggcatgaccc aactgcacac gctgaaataa 180
tggctttgag gcagggtggg ctcgtaatgc agaactacag gctgatagac gctacgctgt 240
atgtaaccct agaaccagcg tcatgtgcgc tggtgctatg attcacagta gaattggccg 300
tgtagttttc ggagccaggg atgccaagac cggggcagca ggttccctca tggatgtcct 360
acaccacccc ggaatgaacc acagggtgaa atcacggaag gtatcttagc ggacgagtgt 420
gcagctctgc tctccgactt ctttcgtatg agacgacagg agatcaaggc acagaaaaag 480
gcacaaagtt caactgactc aggcggctct agtgggggag tagtggcagc gagaccccag 540
ggacatccga gtctgccact cctgagagtt caggaggcag tagtggaggg tcctcagagg 600
tcgagttcag tcacgagtat tggatgcgtc atgcccttac attggctagc gagctttgga 660
cgaaagagaa gtcccagtcg gagcggtgtt ggttttgaac aaccgagtaa ttggcgaggg 720
gtggaacaga gcaatcggac tccatgaccc caccgcccat gctgaaataa tggcgctcga 780
caaggtggac tcgtaatgca aaactacaga cttattgacg cgactttata tgtaactttt 840
gaaccctgtg tgatgtgcgc tggggcaatg atccattcac gtatcggtcg tgtagtgttt 900
ggggtcctaa tgcgaaaacg ggtgcggcgg ggagtctaat ggacgttctt cactacccag 960
gtatgaatca tcgtgtagag ataactgagg gcatcctcgc tgacgagtgt aacgccctgt 1020
tatgctactt tttccgatgc caagacaagt gtttaatgct cagaagaagg ctcagtcttc 1080
tacggattca ggaggatctt ccggtggcag ctctggaagc gagacccccg gcacgtccga 1140
atcagcgacg ccagagtcat caggtggtca tctggtggga gc 1182
<210> 6
<211> 1182
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 6
atgagcgagg tcgagtttag ccatgaatac tggatgagac atgctcttac tttagcgaaa 60
cgtgcgtggg acgagagaga ggttccggtg ggcgcggtgt tagtacacaa taacagggtt 120
atcggcgagg gtggaacagg cctattggca ggcacgatcc gactgcacat gcggagatca 180
tggcgctacg acaggggggg ctcgtcatgc agaattatcg attgatagac gccacgctgt 240
acgtcactct ggaaccagcg taatgtgtgc aggagcgatg atccactcta gaattggaag 300
agtagtcttc ggcgcgaggg atgcaaagac cggggcggcg gggtccctaa tggacgtgct 360
tcaccaccct ggcatgaacc atagagtgag atcaccgagg gcatacttgc tgatgaatgt 420
gcagcacttc tatccgattt ctttcgaatg agaaggcagg aaattaaagc ccagaagaag 480
gctcaatcta gtacagactc tggagggtcc agtggcgctc atccgggagc gaaacaccag 540
ggacgtcaga atccgctacg cccgaatcta gtggtggctc cagcggagga agtagtgagg 600
tggagttctc tcacgaatac tggatgcgac atgctctaac gctagcaaac gagcgaggga 660
tgaacgagag gttcctgtag gagcagtgtt ggttctgaac aacagagtta ttggtgaagg 720
ttggaatcgt gctattgggc ttcacgaccc aacagcccat gccgaaataa tggcgctagg 780
caaggaggct tagtaatgca aaactacaga ttaatcgacg cgaccctgta tgtcacgttc 840
gagccatgcg ttatgtgcgc gggcgcgatg attcattcta gaattggaag ggttgttttt 900
ggggtgaaaa tgccaaaact ggtgcggctg ggagtcttat ggacgttctc cactaccctg 960
gtatgaacca tcgagtggaa atcacggagg ggattttggc ggacgaatgt gcagcattgt 1020
tatgctattt cttccgttgc ctaggcaggt cttcaacgct cagaagaagg cgcaaagttc 1080
aaccgattca ggggggtctt ctggcggatc ttctggttca gagacgcccg gtacctcaga 1140
atcagctacg cctgagagtt caggtggtct tctggcggca gc 1182
<210> 7
<211> 4106
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 7
gacaagaagt acagcatcgg cctggacatc ggtaccaaca gcgtgggctg ggccgtgatc 60
accgacgagt acaaggtgcc cagcaagaag ttcaaggtgc tgggcaacac cgaccgccac 120
agcatcagaa gaacctgatc ggcgccctgc tgttcgacag cggcgagacc gccgaggcca 180
cccgcctgaa gcgcaccgcc cgccgccgct acacccgccg caagaaccgc atctgctacc 240
tgcaggagat cttcagcacg agatggccaa ggtggacgac agcttcttcc accgcctgga 300
ggagagcttc ctggtggagg aggacaagaa gcacgagcgc caccccatct tcggcaacat 360
cgtggacgag gtggcctacc acgagaatac cccaccatct accacctgcg caagaagctg 420
gtggacagca ccgacaaggc cgacctgcgc ctgatctacc tggccctggc ccacatgatc 480
aagttccgcg gccacttcct gatcgagggc gacctgaccc cgacaacagc gacgtggaca 540
agctgttcat ccagctggtg cagacctaca accagctgtt cgaggagaac cccatcaacg 600
ccagcggcgt ggacgccaag gccatcctga gcgcccgcct gagcaaggcc gccgcctgga 660
gaacctgatc gcccagctgc ccggcgagaa gaagaacggc ctgttcggca acctgatcgc 720
cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggacgcaag 780
ctgcagctga gcaaggacac ctacgacgac gacctggaca acctgctggc ccagatcggc 840
gaccagtacg ccgacctgtt cctggccgcc aagaacctga gcgacgccat cctgctgagc 900
gacatccgcg cgtgaacacc gagatcacca aggcccccct gagcgccagc atgatcaagc 960
gctacgacga gcaccaccag gacctgaccc tgctgaaggc cctggtgcgc cagcagctgc 1020
ccgagaagta caaggagtct tcttcgacca gagcaagaac ggctacgccg gctacatcga 1080
cggcggcgcc agccaggagg agttctacaa gttcatcaag cccatcctgg agaagatgga 1140
cggcaccgag gagctgctgg tgaagctaac cgcgaggacc tgctgcgcaa gcagcgcacc 1200
ttcgacaacg gcagcatccc ccaccagatc cacctgggcg agctgcacgc catcctgcgc 1260
cgccaggagg acttctaccc cttcctgaag gacaacccga gaagatcgag aagatcctga 1320
ccttccgcat cccctactac gtgggccccc tggcccgcgg caacagccgc ttcgcctgga 1380
tgacccgcaa gagcgaggag accatcaccc cctggaactt cgaggagtgg tggacaaggg 1440
cgccagcgcc cagagcttca tcgagcgcat gaccaacttc gacaagaacc tgcccaacga 1500
gaaggtgctg cccaagcaca gcctgctgta cgagtacttc accgtgtaca acgagctacc 1560
aaggtgaagt acgtgaccga gggcatgcgc aagcccgcct tcctgagcgg cgagcagaag 1620
aaggccatcg tggacctgct gttcaagacc aaccgcaagg tgaccgtgaa gcagctgaag 1680
gaggactctt caagaagatc gagtgcttcg acagcgtgga gatcagcggc gtggaggacc 1740
gcttcaacgc cagcctgggc acctaccacg acctgctgaa gatcatcaag gacaaggact 1800
tcctggacaa cgaggagacg aggacatcct ggaggacatc gtgctgaccc tgaccctgtt 1860
cgaggaccgc gagatgatcg aggagcgcct gaagacctac gcccacctgt tcgacgacaa 1920
ggtgatgaag cagctgaagc gccgccgtac accggctggg gccgcctgag ccgcaagctt 1980
atcaacggca tccgcgacaa gcagagcggc aagaccatcc tggacttcct gaagagcgac 2040
ggcttcgcca accgcaactt catgcagctg atccacgcga cagcctgacc ttcaaggagg 2100
acatccagaa ggcccaggtg agcggccagg gcgacagcct gcacgagcac atcgccaacc 2160
tggccggcag ccccgccatc aagaagggca tcctgcagac cgtgaagtgg tggacgagct 2220
ggtgaaggtg atgggccgcc acaagcccga gaacatcgtg atcgagatgg cccgcgagaa 2280
ccagaccacc cagaagggcc agaagaacag ccgcgagcgc atgaagcgca tcgaggaggc 2340
atcaaggagc tgggcagcca gatcctgaag gagcaccccg tggagaacac ccagctgcag 2400
aacgagaagc tgtacctgta ctacctgcag aacggccgcg acatgtacgt ggaccaggag 2460
ctggacacaa ccgcctgagc gactacgacg tggaccacat cgtgccccag agcttcctga 2520
aggacgacag catcgacaac aaggtgctga cccgcagcga caagaaccgc ggcaagagcg 2580
acaacgtgcc cagcgagagg tggtgaagaa gatgaagaac tactggcgcc agctgctgaa 2640
cgccaagctg atcacccagc gcaagttcga caacctgacc aaggccgagc gcggcggcct 2700
gagcgagctg gacaaggccg gcttcataag cgccagctgg tggagacccg ccagatcacc 2760
aagcacgtgg cccagatcct ggacagccgc atgaacacca agtacgacga gaacgacaag 2820
ctgatccgcg aggtgaaggt gatcaccctg aagagcagct ggtgagcgac ttccgcaagg 2880
acttccagtt ctacaaggtg cgcgagatca acaactacca ccacgcccac gacgcctacc 2940
tgaacgccgt ggtgggcacc gccctgatca agaagtaccc caagctgaga gcgagttcgt 3000
gtacggcgac tacaaggtgt acgacgtgcg caagatgatc gccaagagcg agcaggagat 3060
cggcaaggcc accgccaagt acttcttcta cagcaacatc atgaacttct tcaagacgag 3120
atcaccctgg ccaacggcga gatccgcaag cgccccctga tcgagaccaa cggcgagacc 3180
ggcgagatcg tgtgggacaa gggccgcgac ttcgccaccg tgcgcaaggt gctgagcatg 3240
ccccagggaa catcgtgaag aagaccgagg tgcagaccgg cggcttcagc aaggagagca 3300
tcctgcccaa gcgcaacagc gacaagctga tcgcccgcaa gaaggactgg gaccccaaga 3360
agtacggcgg cttcgacgcc ccaccgtggc ctacagcgtg ctggtggtgg ccaaggtgga 3420
gaagggcaag agcaagaagc tgaagagcgt gaaggagctg ctgggcatca ccatcatgga 3480
gcgcagcagc ttcgagaaga accccatgac ttcctggagg ccaagggcta caaggaggtg 3540
aagaaggacc tgatcatcaa gctgcccaag tacagcctgt tcgagctgga gaacggccgc 3600
aagcgcatgc tggccagcgc cggcgagctg cagaaggcaa cgagctggcc ctgcccagca 3660
agtacgtgaa cttcctgtac ctggccagcc actacgagaa gctgaagggc agccccgagg 3720
acaacgagca gaagcagctg ttcgtggagc agcacaagca ctacctgacg agatcatcga 3780
gcagatcagc gagttcagca agcgcgtgat cctggccgac gccaacctgg acaaggtgct 3840
gagcgcctac aacaagcacc gcgacaagcc catccgcgag caggccgaga acatcatcac 3900
ctgttcaccc tgaccaacct gggcgccccc gccgccttca agtacttcga caccaccatc 3960
gaccgcaagc gctacaccag caccaaggag gtgctggacg ccaccctgat ccaccagagc 4020
atcaccgtct gtacgagacc cgcatcgacc tgagccagct gggcggcgac tctggtggtt 4080
ctccaaagaa aaagagaaaa gtataa 4106
<210> 8
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 8
aaaaaagcag gcttcatgtc cgaggtagag ttcagcc 37
<210> 9
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 9
gctgtacttc ttgtctgacc caccagagct gcc 33
<210> 10
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 10
aaaaaagcag gcttcatgag cgaagtggag ttttct 36
<210> 11
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 11
gctgtacttc ttgtcgctcc caccagatga ccc 33
<210> 12
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 12
aaaaaagcag gcttcatgag cgaggtcgag tttagcc 37
<210> 13
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 13
gctgtacttc ttgtcgctgc cgccagaaga ccc 33
<210> 14
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 14
gacaagaagt acagcatcgg 20
<210> 15
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 15
acttttctct ttttctttgg agaaccacca gagtcgcc 38
<210> 16
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 16
gaaaaagaga aaagtataac acccagcttt cttgtacaaa g 41
<210> 17
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 17
gaagcctgct tttttgtaca aac 23
Claims (16)
- 야생형 디아미네이즈 (deaminase) 및 변이 디아미네이즈를 포함하는 디아미네이즈 융합체를 코딩하는 유전자 구조체 (construct).
- 제1항에 있어서, 표적 특이적 뉴클레아제를 코딩하는 유전자가 추가로 연결되어 있는 유전자 구조체.
- 제1항에 있어서, 상기 디아미네이즈는 APOBEC1 (apolipoprotein B editing complex 1), AID (activation-induced deaminase) 또는 tadA (tRNA-specific adenosine deaminase)인 것을 특징으로 하는 유전자 구조체.
- 제1항에 있어서, 상기 디아미네이즈는 아데노신 디아미네이즈 (adenosine deaminase)인 것을 특징으로 하는 유전자 구조체.
- 제4항에 있어서, 상기 아데노신 디아미네이즈는 tadA (tRNA-specific adenosine deaminase)인 것을 특징으로 하는 유전자 구조체.
- 제1항에 있어서, 상기 변이 디아미네이즈는 TadA 6.3,7.8,7.9 또는 7.10인 것을 특징으로 하는 유전자 구조체.
- 제1항에 있어서, 상기 변이 디아미네이즈 코딩 유전자는 서열번호 3 내지 서열번호 6으로 구성된 군에서 선택되는 변이 아데노신 디아미네이즈인 것을 특징으로 하는 유전자 구조체.
- 제1항에 있어서, 상기 야생형 디아미네이즈와 변이 디아미네이즈는 링커로 연결되는 것을 특징으로 하는 유전자 구조체.
- 제2항에 있어서, 상기 표적 특이적 뉴클레아제는 RNA-가이드 뉴클레아제 및 가이드 RNA를 포함하는 것을 특징으로 하는 유전자 구조체.
- 제9항에 있어서, 상기 RNA-가이드 뉴클레아제는 스트렙토코커스 피요젠스 (Streptococcus pyogenes) 유래 Cas9 단백질의 (1) D10, H840, 또는 D10 및 H840; (2) D1135, R1335, 및 T1337로 이루어진 군에서 선택된 하나 이상; 또는 (3) 상기 (1) 및 (2)의 아미노산 잔기 모두가 야생형과 다른 아미노산으로 치환된 것을 특징으로 하는 유전자 구조체.
- 제9항에 있어서, 상기 가이드 RNA는 CRISPR RNA (crRNA) 및 trans-activating crRNA (tracrRNA)를 포함하는 이중 RNA, 또는 단일 가이드 RNA (sgRNA)인 것을 특징으로 하는 유전자 구조체.
- 제2항에 있어서, 상기 염기 교정에 의해 표적의 아미노산 변화 또는 mRNA 미스-스플라이싱 (mis-splicing)에 의해 식물의 표현형이 변화하는 것을 특징으로 하는 유전자 구조체.
- 제1항 내지 제12항 중 어느 한 항의 유전자 구조체가 작동 가능하도록 연결된 식물의 염기 교정용 벡터.
- 제13항에 있어서, 프로모터, NLS (nucleus localization protein sequence) 또는 터미네이터 (terminator)를 추가로 포함하는 벡터.
- 야생형 디아미네이즈 및 변이 디아미네이즈를 포함하는 디아미네이즈 융합체를 코딩하는 유전자 구조체를 포함하는 벡터를 식물 원형질체에 도입하는 단계;
표적 특이적 뉴클레아제를 코딩하는 유전자 구조체를 포함하는 벡터를 식물 원형질체에 도입하는 단계; 및
표적을 특이적으로 인식하는 가이드 RNA를 식물 원형질체에 처리하는 단계를 포함하는 식물의 염기 교정 방법.
- 식물 원형질체에 제13항의 벡터를 도입하는 단계; 및
표적을 특이적으로 인식하는 가이드 RNA를 식물 원형질체에 처리하는 단계를 포함하는 식물의 염기 교정 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862660296P | 2018-04-20 | 2018-04-20 | |
US62/660,296 | 2018-04-20 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190122595A true KR20190122595A (ko) | 2019-10-30 |
Family
ID=68462997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190046807A KR20190122595A (ko) | 2018-04-20 | 2019-04-22 | 식물의 염기 교정용 유전자 구조체, 이를 포함하는 벡터 및 이를 이용한 염기 교정 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20190122595A (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114058639A (zh) * | 2021-10-29 | 2022-02-18 | 中国种子集团有限公司 | 利用单碱基基因编辑技术突变OsWaxy基因改良水稻直链淀粉含量的方法 |
-
2019
- 2019-04-22 KR KR1020190046807A patent/KR20190122595A/ko not_active Application Discontinuation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114058639A (zh) * | 2021-10-29 | 2022-02-18 | 中国种子集团有限公司 | 利用单碱基基因编辑技术突变OsWaxy基因改良水稻直链淀粉含量的方法 |
CN114058639B (zh) * | 2021-10-29 | 2023-11-07 | 中国种子集团有限公司 | 利用单碱基基因编辑技术突变OsWaxy基因改良水稻直链淀粉含量的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7170807B2 (ja) | オリゴヌクレオチド仲介型遺伝子修復を使用した標的遺伝子修飾の効率を高めるための方法および組成物 | |
JP7293441B2 (ja) | オリゴヌクレオチド仲介型遺伝子修復を使用した標的遺伝子修飾の効率を高めるための方法および組成物 | |
JP6916188B2 (ja) | プロトプラストからの全植物体の製造方法 | |
CN110157726B (zh) | 植物基因组定点替换的方法 | |
US20210403901A1 (en) | Targeted mutagenesis using base editors | |
CN112852791B (zh) | 腺嘌呤碱基编辑器及其相关生物材料与应用 | |
CN110526993B (zh) | 一种用于基因编辑的核酸构建物 | |
Kopischke et al. | TALEN-mediated genome-editing approaches in the liverwort Marchantia polymorpha yield high efficiencies for targeted mutagenesis | |
KR20230021743A (ko) | 이형접합 cenh3 외떡잎식물 및 반수체 유도 및 동시 게놈 편집을 위한 이의 사용 방법 | |
CN114480391B (zh) | 用于提高CRISPR/Cas9系统基因编辑效率的启动子及其应用 | |
EP3356537B1 (en) | Recombinant maize b chromosome sequence and uses thereof | |
CN114591977A (zh) | 通过精准编辑内源epsps基因获得抗草甘膦水稻的方法及其所用系统 | |
US20220315938A1 (en) | AUGMENTED sgRNAS AND METHODS FOR THEIR USE TO ENHANCE SOMATIC AND GERMLINE PLANT GENOME ENGINEERING | |
KR20190122595A (ko) | 식물의 염기 교정용 유전자 구조체, 이를 포함하는 벡터 및 이를 이용한 염기 교정 방법 | |
WO2019234132A1 (en) | Base editing in polymerase theta deficient plants | |
US11981900B2 (en) | Increasing gene editing and site-directed integration events utilizing meiotic and germline promoters | |
Karcher et al. | Faithful editing of a tomato-specific mRNA editing site in transgenic tobacco chloroplasts | |
CN112080513A (zh) | 一套编辑范围扩展的水稻人工基因组编辑系统及其应用 | |
CA3131193A1 (en) | Methods and compositions for generating dominant short stature alleles using genome editing | |
JP7452884B2 (ja) | Dnaが編集された植物細胞を製造する方法、及びそれに用いるためのキット | |
Geng et al. | Data-driven optimization yielded a highly-efficient CRISPR/Cas9 system for gene editing in Arabidopsis | |
US20200377909A1 (en) | Directed genome engineering using enhanced targeted editing technologies | |
US20230392160A1 (en) | Compositions and methods for increasing genome editing efficiency | |
CN118127073A (zh) | 水稻烷基嘌呤糖基化酶及其突变体在植物A-to-K单碱基编辑中的应用 | |
CA3131194A1 (en) | Methods and compositions for generating dominant short stature alleles using genome editing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
WITB | Written withdrawal of application |