WO2024063538A1 - 식물세포 소기관 dna의 염기 교정 - Google Patents
식물세포 소기관 dna의 염기 교정 Download PDFInfo
- Publication number
- WO2024063538A1 WO2024063538A1 PCT/KR2023/014300 KR2023014300W WO2024063538A1 WO 2024063538 A1 WO2024063538 A1 WO 2024063538A1 KR 2023014300 W KR2023014300 W KR 2023014300W WO 2024063538 A1 WO2024063538 A1 WO 2024063538A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- composition
- dna
- deaminase
- terminus
- cytosine deaminase
- Prior art date
Links
- 210000003463 organelle Anatomy 0.000 title claims abstract description 40
- 239000000203 mixture Substances 0.000 claims abstract description 42
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims abstract description 33
- 238000000034 method Methods 0.000 claims abstract description 29
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims abstract description 18
- 229940104302 cytosine Drugs 0.000 claims abstract description 16
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims abstract description 14
- 229960000643 adenine Drugs 0.000 claims abstract description 13
- 229930024421 Adenine Natural products 0.000 claims abstract description 11
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims abstract description 11
- 229940113082 thymine Drugs 0.000 claims abstract description 9
- 102000000311 Cytosine Deaminase Human genes 0.000 claims description 104
- 108010080611 Cytosine Deaminase Proteins 0.000 claims description 104
- 108020004414 DNA Proteins 0.000 claims description 68
- 238000012937 correction Methods 0.000 claims description 63
- 101710185494 Zinc finger protein Proteins 0.000 claims description 57
- 102100023597 Zinc finger protein 816 Human genes 0.000 claims description 57
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 claims description 48
- 150000007523 nucleic acids Chemical class 0.000 claims description 47
- 239000012634 fragment Substances 0.000 claims description 46
- 102000052510 DNA-Binding Proteins Human genes 0.000 claims description 40
- 101710096438 DNA-binding protein Proteins 0.000 claims description 38
- 108090000623 proteins and genes Proteins 0.000 claims description 37
- 102000039446 nucleic acids Human genes 0.000 claims description 36
- 108020004707 nucleic acids Proteins 0.000 claims description 36
- 210000004027 cell Anatomy 0.000 claims description 35
- 108010052875 Adenine deaminase Proteins 0.000 claims description 26
- 102000053602 DNA Human genes 0.000 claims description 19
- 238000003776 cleavage reaction Methods 0.000 claims description 16
- 230000007017 scission Effects 0.000 claims description 16
- 230000008685 targeting Effects 0.000 claims description 15
- 210000001938 protoplast Anatomy 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 11
- 238000002347 injection Methods 0.000 claims description 10
- 239000007924 injection Substances 0.000 claims description 10
- 238000001890 transfection Methods 0.000 claims description 10
- 102000004169 proteins and genes Human genes 0.000 claims description 9
- 230000001404 mediated effect Effects 0.000 claims description 8
- 101710172430 Uracil-DNA glycosylase inhibitor Proteins 0.000 claims description 7
- 238000004520 electroporation Methods 0.000 claims description 6
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 6
- 241000589158 Agrobacterium Species 0.000 claims description 5
- 125000000539 amino acid group Chemical group 0.000 claims description 4
- 238000000520 microinjection Methods 0.000 claims description 4
- 230000002438 mitochondrial effect Effects 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 3
- 241000589156 Agrobacterium rhizogenes Species 0.000 claims description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 claims description 2
- 108700020911 DNA-Binding Proteins Proteins 0.000 claims description 2
- 108010031100 chloroplast transit peptides Proteins 0.000 claims description 2
- 230000003612 virological effect Effects 0.000 claims 1
- 241000196324 Embryophyta Species 0.000 description 81
- -1 promoters Proteins 0.000 description 25
- 108091028043 Nucleic acid sequence Proteins 0.000 description 21
- 125000003729 nucleotide group Chemical group 0.000 description 21
- 101150043479 psaA gene Proteins 0.000 description 19
- 210000003763 chloroplast Anatomy 0.000 description 18
- 239000002773 nucleotide Substances 0.000 description 18
- 235000001014 amino acid Nutrition 0.000 description 17
- 101100130893 Alkalihalobacillus halodurans (strain ATCC BAA-125 / DSM 18197 / FERM 7344 / JCM 9153 / C-125) mntA gene Proteins 0.000 description 16
- 101100084597 Dictyostelium discoideum pspA gene Proteins 0.000 description 16
- 230000009261 transgenic effect Effects 0.000 description 16
- 229940024606 amino acid Drugs 0.000 description 15
- 150000001413 amino acids Chemical class 0.000 description 15
- 230000001915 proofreading effect Effects 0.000 description 15
- 239000002105 nanoparticle Substances 0.000 description 14
- 239000013598 vector Substances 0.000 description 14
- 230000035772 mutation Effects 0.000 description 12
- 230000001580 bacterial effect Effects 0.000 description 10
- 108020005004 Guide RNA Proteins 0.000 description 9
- 229920002873 Polyethylenimine Polymers 0.000 description 9
- 229920000642 polymer Polymers 0.000 description 9
- 125000002091 cationic group Chemical group 0.000 description 8
- 229920001223 polyethylene glycol Polymers 0.000 description 8
- 101150074945 rbcL gene Proteins 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 108020001507 fusion proteins Proteins 0.000 description 7
- 102000037865 fusion proteins Human genes 0.000 description 7
- 239000002502 liposome Substances 0.000 description 7
- 210000003470 mitochondria Anatomy 0.000 description 7
- 235000018102 proteins Nutrition 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- 101100301006 Allochromatium vinosum (strain ATCC 17899 / DSM 180 / NBRC 103801 / NCIMB 10441 / D) cbbL2 gene Proteins 0.000 description 6
- 108091033409 CRISPR Proteins 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 240000008415 Lactuca sativa Species 0.000 description 6
- 235000003228 Lactuca sativa Nutrition 0.000 description 6
- 101150004101 cbbL gene Proteins 0.000 description 6
- 239000003623 enhancer Substances 0.000 description 6
- 239000013604 expression vector Substances 0.000 description 6
- 239000013612 plasmid Substances 0.000 description 6
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 6
- 229960000268 spectinomycin Drugs 0.000 description 6
- 239000013603 viral vector Substances 0.000 description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 5
- 101150029019 ATP6 gene Proteins 0.000 description 5
- 108091079001 CRISPR RNA Proteins 0.000 description 5
- 230000004568 DNA-binding Effects 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- 108091028113 Trans-activating crRNA Proteins 0.000 description 5
- 125000003275 alpha amino acid group Chemical group 0.000 description 5
- 235000003704 aspartic acid Nutrition 0.000 description 5
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 5
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 5
- 150000002632 lipids Chemical class 0.000 description 5
- 102000040430 polynucleotide Human genes 0.000 description 5
- 108091033319 polynucleotide Proteins 0.000 description 5
- 239000002157 polynucleotide Substances 0.000 description 5
- 241000191879 Barley yellow striate mosaic cytorhabdovirus Species 0.000 description 4
- 241000371430 Burkholderia cenocepacia Species 0.000 description 4
- 241000701022 Cytomegalovirus Species 0.000 description 4
- 241000710017 Foxtail mosaic virus Species 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- 241000712465 Sonchus yellow net nucleorhabdovirus Species 0.000 description 4
- 241000723573 Tobacco rattle virus Species 0.000 description 4
- 241000723613 Tomato mosaic virus Species 0.000 description 4
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 4
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 239000004009 herbicide Substances 0.000 description 4
- 238000003259 recombinant expression Methods 0.000 description 4
- 229920002477 rna polymer Polymers 0.000 description 4
- 101710199622 tRNA-specific adenosine deaminase Proteins 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 108020004465 16S ribosomal RNA Proteins 0.000 description 3
- 101710095342 Apolipoprotein B Proteins 0.000 description 3
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 3
- 101100201106 Arabidopsis thaliana RPS5A gene Proteins 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 3
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 3
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 3
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 3
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- 108020005196 Mitochondrial DNA Proteins 0.000 description 3
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 3
- 241000714474 Rous sarcoma virus Species 0.000 description 3
- 101100201109 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rps5 gene Proteins 0.000 description 3
- 241000193996 Streptococcus pyogenes Species 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 235000009697 arginine Nutrition 0.000 description 3
- MXWJVTOOROXGIU-UHFFFAOYSA-N atrazine Chemical compound CCNC1=NC(Cl)=NC(NC(C)C)=N1 MXWJVTOOROXGIU-UHFFFAOYSA-N 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- 229920001400 block copolymer Polymers 0.000 description 3
- 230000009615 deamination Effects 0.000 description 3
- 238000006481 deamination reaction Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000010362 genome editing Methods 0.000 description 3
- 230000002363 herbicidal effect Effects 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 230000029553 photosynthesis Effects 0.000 description 3
- 238000010672 photosynthesis Methods 0.000 description 3
- 101150075980 psbA gene Proteins 0.000 description 3
- MWRBNPKJOOWZPW-NYVOMTAGSA-N 1,2-dioleoyl-sn-glycero-3-phosphoethanolamine zwitterion Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@H](COP(O)(=O)OCCN)OC(=O)CCCCCCC\C=C/CCCCCCCC MWRBNPKJOOWZPW-NYVOMTAGSA-N 0.000 description 2
- LDGWQMRUWMSZIU-LQDDAWAPSA-M 2,3-bis[(z)-octadec-9-enoxy]propyl-trimethylazanium;chloride Chemical compound [Cl-].CCCCCCCC\C=C/CCCCCCCCOCC(C[N+](C)(C)C)OCCCCCCCC\C=C/CCCCCCCC LDGWQMRUWMSZIU-LQDDAWAPSA-M 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 231100000699 Bacterial toxin Toxicity 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 2
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 241000702463 Geminiviridae Species 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 239000000232 Lipid Bilayer Substances 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- HIHOWBSBBDRPDW-PTHRTHQKSA-N [(3s,8s,9s,10r,13r,14s,17r)-10,13-dimethyl-17-[(2r)-6-methylheptan-2-yl]-2,3,4,7,8,9,11,12,14,15,16,17-dodecahydro-1h-cyclopenta[a]phenanthren-3-yl] n-[2-(dimethylamino)ethyl]carbamate Chemical compound C1C=C2C[C@@H](OC(=O)NCCN(C)C)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HIHOWBSBBDRPDW-PTHRTHQKSA-N 0.000 description 2
- 125000001931 aliphatic group Chemical group 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 2
- 239000000688 bacterial toxin Substances 0.000 description 2
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 2
- 102000023732 binding proteins Human genes 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 150000001767 cationic compounds Chemical class 0.000 description 2
- 235000012000 cholesterol Nutrition 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 229920001577 copolymer Polymers 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- PSLWZOIUBRXAQW-UHFFFAOYSA-M dimethyl(dioctadecyl)azanium;bromide Chemical compound [Br-].CCCCCCCCCCCCCCCCCC[N+](C)(C)CCCCCCCCCCCCCCCCCC PSLWZOIUBRXAQW-UHFFFAOYSA-M 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 235000004554 glutamine Nutrition 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 235000014304 histidine Nutrition 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 238000001638 lipofection Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002082 metal nanoparticle Substances 0.000 description 2
- 101150077280 mt-atp6 gene Proteins 0.000 description 2
- 230000009437 off-target effect Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 108010079892 phosphoglycerol kinase Proteins 0.000 description 2
- 230000000243 photosynthetic effect Effects 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 2
- 229920000962 poly(amidoamine) Polymers 0.000 description 2
- 229920000744 poly(arginines) Polymers 0.000 description 2
- 108010011110 polyarginine Proteins 0.000 description 2
- 229920000656 polylysine Polymers 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000001814 protein method Methods 0.000 description 2
- 230000007398 protein translocation Effects 0.000 description 2
- 235000004400 serine Nutrition 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 235000008521 threonine Nutrition 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 2
- 229940045145 uridine Drugs 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 235000014393 valine Nutrition 0.000 description 2
- 239000013154 zeolitic imidazolate framework-8 Substances 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- DSLBDPPHINVUID-REOHCLBHSA-N (2s)-2-aminobutanediamide Chemical compound NC(=O)[C@@H](N)CC(N)=O DSLBDPPHINVUID-REOHCLBHSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- NRJAVPSFFCBXDT-HUESYALOSA-N 1,2-distearoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCCCC NRJAVPSFFCBXDT-HUESYALOSA-N 0.000 description 1
- KSXTUUUQYQYKCR-LQDDAWAPSA-M 2,3-bis[[(z)-octadec-9-enoyl]oxy]propyl-trimethylazanium;chloride Chemical compound [Cl-].CCCCCCCC\C=C/CCCCCCCC(=O)OCC(C[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC KSXTUUUQYQYKCR-LQDDAWAPSA-M 0.000 description 1
- 125000000022 2-aminoethyl group Chemical group [H]C([*])([H])C([H])([H])N([H])[H] 0.000 description 1
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000055025 Adenosine deaminases Human genes 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 1
- 108020004998 Chloroplast DNA Proteins 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- XULFJDKZVHTRLG-JDVCJPALSA-N DOSPA trifluoroacetate Chemical compound [O-]C(=O)C(F)(F)F.CCCCCCCC\C=C/CCCCCCCCOCC(C[N+](C)(C)CCNC(=O)C(CCCNCCCN)NCCCN)OCCCCCCCC\C=C/CCCCCCCC XULFJDKZVHTRLG-JDVCJPALSA-N 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 229940126656 GS-4224 Drugs 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 206010020460 Human T-cell lymphotropic virus type I infection Diseases 0.000 description 1
- 241000714260 Human T-lymphotropic virus 1 Species 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 206010021929 Infertility male Diseases 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 208000007466 Male Infertility Diseases 0.000 description 1
- KWYHDKDOAIKMQN-UHFFFAOYSA-N N,N,N',N'-tetramethylethylenediamine Chemical compound CN(C)CCN(C)C KWYHDKDOAIKMQN-UHFFFAOYSA-N 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 206010057249 Phagocytosis Diseases 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 101710097247 Ribulose bisphosphate carboxylase large chain Proteins 0.000 description 1
- 101710104360 Ribulose bisphosphate carboxylase large chain, chromosomal Proteins 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 description 1
- HMNZFMSWFCAGGW-XPWSMXQVSA-N [3-[hydroxy(2-hydroxyethoxy)phosphoryl]oxy-2-[(e)-octadec-9-enoyl]oxypropyl] (e)-octadec-9-enoate Chemical compound CCCCCCCC\C=C\CCCCCCCC(=O)OCC(COP(O)(=O)OCCO)OC(=O)CCCCCCC\C=C\CCCCCCCC HMNZFMSWFCAGGW-XPWSMXQVSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical group N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 1
- 239000013602 bacteriophage vector Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 229920006317 cationic polymer Polymers 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 210000001787 dendrite Anatomy 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000012202 endocytosis Effects 0.000 description 1
- 210000001163 endosome Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 235000018977 lysine Nutrition 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 150000002734 metacrylic acid derivatives Chemical class 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 239000002071 nanotube Substances 0.000 description 1
- 229940042880 natural phospholipid Drugs 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 230000008782 phagocytosis Effects 0.000 description 1
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 244000000003 plant pathogen Species 0.000 description 1
- 229920000083 poly(allylamine) Polymers 0.000 description 1
- 108010056869 poly(ethylene glycol)-poly(N'-(N-(2-aminoethyl)-2-aminoethyl)aspartamide) block copolymer Proteins 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 108020001775 protein parts Proteins 0.000 description 1
- 230000010837 receptor-mediated endocytosis Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 235000002374 tyrosine Nutrition 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
- C07K2319/81—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04001—Cytosine deaminase (3.5.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04002—Adenine deaminase (3.5.4.2)
Definitions
- the present invention relates to a composition for base correction of plant cell organelle DNA, particularly to a composition and proofreading method for simultaneously proofreading adenine to guanine and cytosine to thymine in plant cell organelle DNA.
- the fusion protein in which a DNA-binding protein and a deaminase are linked, does not generate DNA double-strand breaks (DSBs) and performs targeted nucleotide substitution or base editing in the genome, corrects point mutations that cause genetic disorders, or is used in prokaryotic cells. , enabling single nucleotide conversions in a targeted manner to introduce desired single nucleotide mutations into humans and other eukaryotic cells.
- DLBs DNA double-strand breaks
- ZFN zinc-finger nuclease
- TALEN transcription activator-like effector nuclease
- CRISPR clustered regularly interspaced short palindromic repeat
- Cas9 CRISPR-related protein 9 variants and base deaminase proteins that are inefficient in nucleic acid degradation.
- Program (setting) genome editing tools such as base editing technology have been developed for plant genetic research and crop trait improvement through changes in base sequence. However, these tools are not suitable for correcting the DNA sequences of plant organelles, including mitochondria and chloroplasts, mainly because it is difficult to deliver a guide RNA to the organelle or to express both compounds simultaneously in the organelle.
- Plant cell organelles encode several essential genes required for photosynthesis and respiration.
- Targeted mutations in the mitochondrial atp6 gene can cause male sterility, a reproductively useful trait, and specific point mutations in the 16S rRNA gene of the chloroplast genome can cause antibiotic resistance.
- the bacterial toxin DddA tox is the enzymatic part of the bacterial toxin derived from Burkholderia cenocepacia and can deaminated cytosine in double-stranded DNA.
- DddA tox is toxic to cells.
- DddA tox is divided into two inactivated splits, each half capable of binding to DNA. It can be used as a functional DdCBE pair by linking to a DNA-binding protein designed to do so.
- the object of the present invention is to provide a composition for base correction of plant cell organelle DNA containing DNA binding protein, cytosine deaminase or isolated form of cytosine deaminase and adenine deaminase or nucleic acid encoding the same. there is.
- the purpose of the present invention is to provide a method for editing plant cell organelle DNA.
- the present invention provides a DNA binding protein or a nucleic acid encoding the same; Cytosine deaminase or a first and second fragment derived from cytosine deaminase or a nucleic acid encoding the same; and adenine deaminase or a nucleic acid encoding the same. It provides a composition for base correction of plant cell organelle DNA.
- the present invention also provides a method for correcting the bases of plant cell organelle DNA, comprising treating plant cells with the composition.
- Figure 1 is a schematic diagram of DNA cloning for producing transgenic plants using Agrobacterium.
- Figure 2 shows a transformant plant targeting the psaA gene.
- a Base proofreading efficiency and location of each plant.
- b Plant phenotype.
- c Shows the results of changes in amino acid base sequence due to DNA base correction.
- Figure 3 shows a transformant plant targeting the rbcL gene.
- a Base proofreading efficiency and location of each plant.
- b Shows the results of changes in amino acid base sequence due to DNA base correction.
- Figure 4 shows the results of confirming the base correction efficiency and location of transgenic plants targeting the rrn16S gene.
- Figure 5 shows the base correction efficiency and phenotype of the first generation transformant targeting the psaA , rbcL and rrn16S genes in the chloroplast of Arabidopsis thaliana.
- a Base correction efficiency and location of psaA #1, 2, and 3. Base correction of adenine and cytosine occur simultaneously.
- b Phenotype of psaA #3 showing green, chimeric, and pale green traits.
- c Base proofreading efficiency, location and phenotype of rbcL #1 and 2.
- d Shows the results of confirming the base correction efficiency of the first generation transformant targeting the rrn16S gene.
- Figure 6 shows base correction efficiency and phenotype of second-generation transgenic plants. Phenotype and (a) of the second generation of psaA #3 transgenics, and base correction efficiency and location (b). Phenotype (c) and base correction efficiency and location (d) of the second generation of rrn16S transgenics resistant to spectinomycin. e, As a result of confirming the presence or absence of foreign genes introduced into the transgenic plants by PCR, it was confirmed that rrn16S #9-1 and 3 had no foreign genes.
- Figure 7 shows the results of confirming the base correction location and efficiency of plants resistant and sensitive to Spectinomycin among rrn16S transgenic second generation plants.
- Figure 8 shows the full-length chloroplast genomes of psaA #1 (a), psaA #3 chimeric (b), psaA #3 pale green (c), rrn16s #1 (d), 6 (e), and wild type Col-0 (f).
- Off-target base mutations through analysis. No obvious off-target base mutations were observed in transgenic plants compared to wild type.
- Figure 9 shows the efficiency of base correction of the lettuce mitochondrial gene atp6.
- the inventors of the present application linked DddAtox cytosine deaminase and adenine deaminase to a TALE or ZFP protein that can bind to DNA to create a base editor that performs both A to G base correction and C to T base correction. Produced.
- the present invention is a composition for base correction of plant cell organelle DNA, comprising: a DNA binding protein or a nucleic acid encoding the same; Cytosine deaminase or the first and second fragments derived from cytosine deaminase or nucleic acids encoding them; and adenine deaminase or a nucleic acid encoding the same, and is characterized in that it simultaneously corrects adenine into guanine and cytosine into thymine of the plant cell organelle DNA.
- proofreading can be used interchangeably with “editing” and refers to a method of altering a nucleic acid sequence by selective deletion of a specific genomic target.
- specific genomic targets include, but are not limited to, chromosomal regions, genes, promoters, open reading frames, or any nucleic acid sequence.
- single base means one and only one nucleotide in a nucleic acid sequence. When used in the context of single base correction, this means that a base at a specific position within a nucleic acid sequence is replaced with a different base. Such substitutions can occur by many mechanisms, including but not limited to substitution or modification.
- target or “target site” refers to a previously identified nuclear sequence of any composition and/or length. Such target sites include, but are not limited to, chromosomal regions, genes, promoters, open reading frames, or any nucleic acid sequence.
- on-target refers to a subsequence of a specific genomic target that may be completely complementary to a programmable DNA binding region and/or a single guide RNA sequence.
- off-target refers to a subsequence of a specific genomic target that may be partially complementary to a programmable DNA binding region and/or a single guide RNA sequence.
- the present invention includes a first fragment and a second fragment derived from cytosine deaminase or a variant thereof, and the cytosine deaminase is bound to a DNA binding protein or the first fragment and the second fragment are each of the DNA. It has a form that binds to a binding protein.
- the cytosine deaminase is a deamination enzyme that can convert cytosine (C) into uridine (U).
- cytosine deaminase it may be the cytosine deaminase.
- cytosine deaminase there are forms of cytosine deaminase such as APOBEC1 (apolipoprotein B editing complex 1) and AID (activation-induced deaminase), but most DNA deaminase acts only on single-stranded DNA and connects to DNA binding protein. Therefore, it may not be suitable for base correction.
- the cytosine deaminase may be derived from a deaminase (DddA) that acts on double-stranded DNA or an orthologue thereof. More specifically, the cytosine deaminase may be a double-stranded DNA-specific bacterial cytosine deaminase.
- the cytosine deaminase is in a split form, and the cytosine deaminase includes a separated first split body and a second split body, and each of the first split body and the second split body has no deaminase activity. will be.
- the cytosine deaminase includes a first split body and a second split body, and each of the first split body and the second split body has no deaminase activity.
- the first or second fragment of the cytosine deaminase is selected from the group consisting of G33, G44, A54, N68, G82, N98, and G108 at the N terminus of the sequence of SEQ ID NO: 1. It may contain up to one or more sequences.
- the first or second fragment of the cytosine deaminase is a sequence of at least one selected from the group consisting of G34, P45, G55, N69, T83, A99, and A109 in the sequence of SEQ ID NO: 1 to the C-terminus. may include.
- the cytosine deaminase includes the first fragment of SEQ ID NO: 2 (G1333-N) and the second fragment of SEQ ID NO: 3 (G1333-C), or the first fragment of SEQ ID NO: 4 (G1397) -N) and the second fragment of SEQ ID NO: 5 (G1397-C), or the first fragment of SEQ ID NO: 2 (G1333-N) and the second fragment of SEQ ID NO: 5 (G1397-C) Alternatively, it may include the first fragment of SEQ ID NO: 4 (G1397-N) and the second fragment of SEQ ID NO: 2 (G1333-C).
- the inventors of the present application linked DddAtox cytosine deaminase and adenine deaminase to a TALE or ZFP protein that can bind to DNA to create a base editor that performs both A to G base correction and C to T base correction. Produced.
- the present invention is a composition for base correction of plant cell organelle DNA, comprising: a DNA binding protein or a nucleic acid encoding the same; Cytosine deaminase or the first and second fragments derived from cytosine deaminase or nucleic acids encoding them; and adenine deaminase or a nucleic acid encoding the same, and is characterized in that it simultaneously corrects adenine into guanine and cytosine into thymine of the plant cell organelle DNA.
- proofreading can be used interchangeably with “editing” and refers to a method of altering a nucleic acid sequence by selective deletion of a specific genomic target.
- specific genomic targets include, but are not limited to, chromosomal regions, genes, promoters, open reading frames, or any nucleic acid sequence.
- single base means one and only one nucleotide in a nucleic acid sequence. When used in the context of single base correction, this means that a base at a specific position within a nucleic acid sequence is replaced with a different base. Such substitutions can occur by many mechanisms, including but not limited to substitution or modification.
- target or “target site” refers to a previously identified nuclear sequence of any composition and/or length. Such target sites include, but are not limited to, chromosomal regions, genes, promoters, open reading frames, or any nucleic acid sequence.
- on-target refers to a subsequence of a specific genomic target that may be completely complementary to a programmable DNA binding region and/or a single guide RNA sequence.
- off-target refers to a subsequence of a specific genomic target that may be partially complementary to a programmable DNA binding region and/or a single guide RNA sequence.
- the present invention includes a first fragment and a second fragment derived from cytosine deaminase or a variant thereof, and the cytosine deaminase is bound to a DNA binding protein or the first fragment and the second fragment are each of the DNA. It has a form that binds to a binding protein.
- the cytosine deaminase is a deamination enzyme that can convert cytosine (C) into uridine (U).
- cytosine deaminase it may be the cytosine deaminase.
- cytosine deaminase there are forms of cytosine deaminase such as APOBEC1 (apolipoprotein B editing complex 1) and AID (activation-induced deaminase), but most DNA deaminase acts only on single-stranded DNA and connects to DNA binding protein. Therefore, it may not be suitable for base correction.
- the cytosine deaminase may be derived from a deaminase (DddA) that acts on double-stranded DNA or an orthologue thereof. More specifically, the cytosine deaminase may be a double-stranded DNA-specific bacterial cytosine deaminase.
- the cytosine deaminase is in a split form, and the cytosine deaminase includes a separated first split body and a second split body, and each of the first split body and the second split body has no deaminase activity. will be.
- the cytosine deaminase includes a first split body and a second split body, and each of the first split body and the second split body has no deaminase activity.
- G1333N, G1333C, G1397N and G1397C can be combined and used as a split deaminase. Specifically, Left-G1333-N + Right-G133-C, Left-G1397-N + Right-G1397-C, Left-G1397-N + Right-G1333-C, or Left-G1333-N + Right-G1397- It can be used in the form of C.
- the DNA binding protein may be, for example, a zinc finger protein, a transcription activator-like effector (TALE) array, or a combination thereof.
- TALE transcription activator-like effector
- the zinc finger motif of the zinc finger protein has a DNA binding domain, and the c-terminal portion of the finger specifically recognizes DNA sequences.
- DNA binding proteins containing 3 to 6 zinc finger motifs recognize DNA sequences.
- each of the first fragment of cytosine deaminase and the second fragment of cytosine deaminase may bind to the N-terminus or C-terminus of the zinc finger protein.
- the C-terminus of the zinc finger protein (ZF-Left) binds to the N-terminus of the first segment of cytosine deaminase, and the zinc finger protein (ZF-Right) C is bound to the N-terminus of the second segment of cytosine deaminase.
- ZF-Left The C-terminus of the zinc finger protein
- ZF-Right the zinc finger protein
- the N-terminus of the zinc finger protein (ZF-Left) is bound to the C-terminus of the first segment of cytosine deaminase, and the zinc finger protein (ZF-Right) C is bound to the N-terminus of the second segment of cytosine deaminase.
- -Ends joined NC configuration
- the C-terminus of the zinc finger protein (ZF-Left) binds to the N-terminus of the first segment of cytosine deaminase, and the zinc finger protein (ZF-Right) N binds to the C-terminus of the second segment of cytosine deaminase.
- ZF-Left The C-terminus of the zinc finger protein
- ZF-Right the zinc finger protein
- the N-terminus of the zinc finger protein (ZF-Left) is bound to the C-terminus of the first segment of cytosine deaminase, and the zinc finger protein (ZF-Right) N is bound to the C-terminus of the second segment of cytosine deaminase.
- the terminals can be combined (NN configuration).
- the ZF-Left may include the sequence of SEQ ID NO: 6:
- the ZF-Right may include the sequence of SEQ ID NO: 7:
- the sequence of ZF may vary depending on the DNA target.
- ZF can be customized according to the DNA target sequence. Since ZF recognizes 3 bp of DNA, usually 3 to 6 ZFs can be connected to create a ZF combination that recognizes 9 to 18 bp of DNA. For example, it can be produced using a library that includes modules such as GNN, TNN, CNN, or ANN.
- the zinc finger protein may be connected to the deaminase through a linker.
- the linker may be a peptide linker containing 2 to 40 amino acid residues.
- the linker may be, for example, a linker with a length of 2aa, 5aa, 10aa, 16aa, 24aa or 32aa, but is not limited thereto.
- the linker may include:
- the split deaminase and the zinc finger protein may be linked through a linker, and the zinc finger protein is bound to the N-terminus of the half deaminase containing the first split body, and the second split body A zinc finger protein binds to the N-terminus of the half deaminase containing sieve.
- a base conversion from C to T may occur in the spacer between the left and right ZFP attachment points. It was confirmed that both the left and right ZFPs showed high proofreading efficiency when linked to each of the half deaminase containing the first segment and the half deaminase containing the second segment through a 24 a.a linker.
- the TAL effector (TALE) consists of 33 to 34 repeated amino acid sequences, and has about 9 repeated domain (RVD, Repeated variant domain). It can recognize one nucleotide per domain and can bind to a specific DNA sequence depending on the 12th-13th amino acid sequence (HD->Cytosine, NI->Adenine, NG -> Thymine, NN -> Guanine). TALE recognizes a single DNA strand within the target site. The distance between target sites can be 12-14 nucleotides.
- the TALE domain refers to a protein domain that binds to a nucleotide in a sequence-specific manner by combining one or more TALE-Repeat. It includes, but is not limited to, at least one TALE-Repeat, specifically 1 to 30 TALE-Repeats. TALE-Repeat is a site that recognizes a specific nucleotide sequence within the TALE domain.
- the TALE domain includes a TALE N-terminal containing region and a TALE C-terminal containing region as a backbone structure.
- a single TALE array or a first TALE array and a second TALE array may each bind.
- a first TALE may be bound to the first cleavage body of the cytosine deaminase (left TALE), and a second TALE (right TALE) may be bound to the second cleavage body of the cytosine deaminase.
- They have the structures N’-TALE-First Split-C’ and N’-TALE-Second Split-C’, respectively.
- TALE arrays can be customized according to the target DNA sequence.
- TALE arrays are composed of modules consisting of 33 to 35 amino acid residues, which are repeatedly arranged. These are derived from the plant pathogen Xanthmonas, and each module recognizes one A, C, G, and T base and binds to DNA. The base specificity of each module is determined by the 12th and 13th amino acid residues, which are called RVD (repeat variable di-residue). For example, a module with an RVD of NN recognizes G, NI recognizes A, HD recognizes C, and NG recognizes T.
- the TALE array consists of a minimum of 14 to a maximum of 18 modules and can be designed to recognize target DNA sequences of 15bp to 20bp.
- It may contain a mutated form of Cas protein. It may mean mutated to lose endonuclease activity to cut DNA double strands, for example, target-specific nucleases and endonucleases mutated to lose endonuclease activity and have nickase activity. It may be one or more of the forms that have been mutated to lose both enzyme activity and nickase activity.
- nickase activity In the case of one having nickase activity, the strand on which the base conversion occurred or the opposite strand (e.g., the strand on which the base conversion occurred) simultaneously with the base conversion (e.g., conversion of cytosine to uradine) by the cytosine deaminase or sequentially regardless of the order.
- a nick may be introduced in the strand opposite to the strand on which the base conversion occurred (e.g., in the strand opposite to the strand where the PAM is located, between the 3rd and 4th nucleotides in the 5' end direction of the PAM sequence). nick is introduced).
- mutations may occur in the catalytically active domain (eg, the RuvC catalytic domain in the case of Cas9).
- mutations include catalytic aspartate residues (aspartic acid at position 10 (D10), etc.), glutamic acid at position 762 (E762), and histidine at position 840 (H840). ), asparagine at position 854 (N854), asparagine at position 863 (N863), aspartic acid at position 986 (D986), etc. It may include a mutation in which one or more amino acids are substituted with any other amino acid. . At this time, any other amino acid to be substituted may be alanine, but is not limited thereto.
- one or more of the aspartic acid at position 1135 (D1135), the arginine at position 1335 (R1335), and the threonine at position 1337 (T1337) of the Cas9 protein from Streptococcus pyogenes, such as all three are different. It may be substituted with an amino acid and mutated to recognize NGA (N is any base selected from A, T, G, and C) that is different from the PAM sequence (NGG) of wild-type Cas9.
- the 'other amino acids' include alanine, isoleucine, leucine, methionine, phenylalanine, proline, tryptophan, valine, aspartic acid, cysteine, glutamine, glycine, serine, threonine, tyrosine, aspartic acid, glutamic acid, arginine, histidine, lysine, and the above amino acids.
- it refers to an amino acid selected from among amino acids excluding the amino acid that the wild-type protein has at the original mutation position.
- the ‘other amino acid’ may be alanine, valine, glutamine, or arginine.
- guide RNA may be additionally included.
- the guide RNA may be one or more selected from the group consisting of CRISPR RNA (crRNA), trans-activating crRNA (tracrRNA), and single guide RNA (sgRNA).
- crRNA and tracrRNA are It may be a double-stranded crRNA:tracrRNA complex linked to each other, or a single-stranded guide RNA (sgRNA) in which crRNA or part thereof and tracrRNA or part thereof are linked by an oligonucleotide linker.
- the present invention includes adenine deaminase.
- the adenine deaminase may be selected from the group consisting of, for example, APOBEC1 (apolipoprotein B editing complex 1), AID (activation-induced deaminase), and tadA (tRNA-specific adenosine deaminase), and specifically, tadA (tRNA-specific adenosine deaminase).
- APOBEC1 apolipoprotein B editing complex 1
- AID activation-induced deaminase
- tadA tRNA-specific adenosine deaminase
- tadA tRNA-specific adenosine deaminase
- -specific adenosine deaminase adenine deaminase
- the adenine deaminase may be deoxy-adenine deaminas
- deoxy-adenine deaminase was used as a variant of E. coli TadA, and may specifically be TadA8e or ABE 8.0.
- the cytosine deaminase is contained in a split form, the DNA binding protein is a zinc finger protein, and the N-terminus of the zinc finger protein (ZF-Left) is bound to the C-terminus of the first fragment of the cytosine deaminase, In the structure where the C-terminus of the zinc finger protein (ZF-Right) is bound to the N-terminus of the second segment of cytosine deaminase (NC configuration), adenine deaminase is connected to the C-terminus of the zinc finger protein (ZF-Left).
- the N-terminus or C-terminus of the first fragment of cytosine deaminase can bind to the N-terminus or C-terminus of the first fragment of cytosine deaminase, the N-terminus of zinc finger protein (ZF-Right), and the N-terminus or C-terminus of the second fragment of cytosine deaminase.
- Adenine deaminase binds the C-terminus of a zinc finger protein (ZF-Left) to the N-terminus of the first split of cytosine deaminase, and a zinc finger protein (ZF-Left) binds to the N-terminus of the second split of cytosine deaminase.
- ZF-Right) C-terminus bonded (CC configuration) The C-terminus of the zinc finger protein (ZF-Left) binds to the N-terminus of the first segment of cytosine deaminase, and the zinc finger protein (ZF-Right) N binds to the C-terminus of the second segment of cytosine deaminase.
- the N-terminus of the zinc finger protein (ZF-Left) is bound to the C-terminus of the first split fragment of cytosine deaminase, and the zinc finger protein (ZF-Right) is bound to the C-terminus of the second split fragment of cytosine deaminase.
- the C terminus of the zinc finger protein (ZF-Left), the N terminus or C terminus of the first cleavage of cytosine deaminase, the N terminus of the zinc finger protein (ZF-Right), It can bind to the N-terminus or C-terminus of the second fragment of cytosine deaminase.
- the first TALE is bound to the first split of the cytosine deaminase
- the first TALE is bound to the second split of the cytosine deaminase.
- 2 TALEs can be combined and have the structures N'-TALE-first split DDDA-C' and N'-TALE-second split DDDA-C', respectively.
- Adenine deaminase may bind to the N-terminus or C-terminus of the first cleavage of cytosine deaminase or to the N-terminus or C-terminus of the second cleavage of cytosine deaminase.
- the present invention relates to the A-to-G base of plant cell organelle DNA, including 1) DNA binding protein, 2) split double-stranded DNA-specific bacterial cytosine deaminase, and 3) deoxyadenin deaminase from E. coli TadA.
- a proofreading composition (without uracil DNA-glycosylase inhibitor (UGI)), wherein the DNA binding protein is a zinc finger protein (ZFP) or a transcription activator-like effector (TALE) array; It is a composition that is DddAtox derived from Burkholderia cenocepacia, a split double-stranded DNA-specific bacterial cytosine deaminase.
- the cytosine deaminase is contained in a split form, the DNA binding protein is a zinc finger protein, and the N-terminus of the zinc finger protein (ZF-Left) is bound to the C-terminus of the first fragment of the cytosine deaminase, In the structure where the C-terminus of the zinc finger protein (ZF-Right) is bound to the N-terminus of the second segment of cytosine deaminase (NC configuration), adenine deaminase is connected to the C-terminus of the zinc finger protein (ZF-Left).
- the N-terminus or C-terminus of the first fragment of cytosine deaminase can bind to the N-terminus or C-terminus of the first fragment of cytosine deaminase, the N-terminus of zinc finger protein (ZF-Right), and the N-terminus or C-terminus of the second fragment of cytosine deaminase.
- Adenine deaminase binds the C-terminus of a zinc finger protein (ZF-Left) to the N-terminus of the first split of cytosine deaminase, and a zinc finger protein (ZF-Left) binds to the N-terminus of the second split of cytosine deaminase.
- ZF-Right) C-terminus bonded (CC configuration) The C-terminus of the zinc finger protein (ZF-Left) binds to the N-terminus of the first segment of cytosine deaminase, and the zinc finger protein (ZF-Right) N binds to the C-terminus of the second segment of cytosine deaminase.
- the N-terminus of the zinc finger protein (ZF-Left) is bound to the C-terminus of the first split fragment of cytosine deaminase, and the zinc finger protein (ZF-Right) is bound to the C-terminus of the second split fragment of cytosine deaminase.
- the C terminus of the zinc finger protein (ZF-Left), the N terminus or C terminus of the first cleavage of cytosine deaminase, the N terminus of the zinc finger protein (ZF-Right), It can bind to the N-terminus or C-terminus of the second fragment of cytosine deaminase.
- the cytosine deaminase When the cytosine deaminase is contained in a split form and the DNA-binding protein is a TALE, the first TALE is bound to the first fragment of the cytosine deaminase, and the second TALE is bound to the second fragment of the cytosine deaminase.
- 2 TALEs can be combined and have the structures N'-TALE-first split DDDA-C' and N'-TALE-second split DDDA-C', respectively.
- Adenine deaminase may bind to the N-terminus or C-terminus of the first cleavage of cytosine deaminase or to the N-terminus or C-terminus of the second cleavage of cytosine deaminase.
- the present invention is a composition for A-to-G base correction of plant cell organelles, wherein the DNA binding protein is a zinc finger protein, or TALE array, and the first cleavage body derived from the cytosine deaminase and the second split is derived from bacteria and is specific for double-stranded DNA.
- the DNA binding protein is a zinc finger protein, or TALE array
- the first cleavage body derived from the cytosine deaminase and the second split is derived from bacteria and is specific for double-stranded DNA.
- the present invention is a composition for A-to-G base correction of plant cell organelles, wherein the DNA binding protein is a zinc finger protein or a TALE array, and the first fragment derived from the cytosine deaminase and The second split is derived from bacteria, is specific for double-stranded DNA, and has a DNA-binding protein bound to the N-terminus of the first split, and a DNA-binding protein is bound to the C-terminus of adenine deaminase. It's about.
- the present invention is for A-to-G base proofreading of plant cell organelles, including 1) DNA binding protein, 2) split double-stranded DNA-specific bacterial cytosine deaminase, and 3) deoxyadenin deaminase from E. coli TadA.
- the composition does not include a UGI, wherein the DNA binding protein is a zinc finger protein (ZFP) or transcription activator-like effector (TALE) array; It is a composition that is DddAtox derived from Burkholderia cenocepacia, a split double-stranded DNA-specific bacterial cytosine deaminase.
- the present invention is a plant cell organelle A-to-G base correction method, which includes a DNA binding protein or a nucleic acid encoding the same; First and second fragments derived from cytosine deaminase or nucleic acids encoding them; And a step of treating plant cells with adenine deaminase or a nucleic acid encoding the same, wherein the DNA binding protein is a zinc finger protein, or a TALE array, and the cytosine deaminase-derived
- the first and second splits are of bacterial origin and are specific for double-stranded DNA.
- the present invention is a plant cell organelle A-to-G base correction method, which includes a DNA binding protein or a nucleic acid encoding the same; First and second fragments derived from cytosine deaminase or nucleic acids encoding them; And a step of treating plant cells with adenine deaminase or a nucleic acid encoding the same, wherein the DNA binding protein is a zinc finger protein, or a TALE array, and the cytosine deaminase-derived
- the first and second splits are of bacterial origin and are specific for double-stranded DNA, and a DNA binding protein is bound to the N terminus of the first split, and a DNA binding protein is bound to the C terminus of adenine deaminase. It's about how things are done.
- the present invention is a plant cell organelle A-to-G base correction method, which includes a DNA binding protein or a nucleic acid encoding the same; First and second fragments derived from cytosine deaminase or nucleic acids encoding them; And a step of treating plant cells with adenine deaminase or a nucleic acid encoding the same, 1) DNA binding protein 2) split double-stranded DNA-specific bacterial cytosine deaminase, and 3) deoxygenase derived from E. coli TadA.
- ZFP zinc finger protein
- TALE transcription activator-like effector
- TALED which does not contain UGI, did not cause C-to-T editing in animal cell mitochondria, but only A-to-G editing.
- the present invention may further include a chloroplast transit peptide or a mitochondrial targeting signal (MTS).
- MTS mitochondrial targeting signal
- Chloroplast Transit Peptide CTP
- Mitochondrial Targeting Signal MTS
- CTP Chloroplast Transit Peptide
- MTS Mitochondrial Targeting Signal
- polynucleotide With reference to the above nucleic acids, the terms “polynucleotide,” “nucleotide,” “nucleotide sequence,” and “oligonucleotide” are used interchangeably. It may include polymeric forms of nucleotides of any length, deoxyribonucleotides or ribonucleotides, or analogs thereof. Polynucleotides can have any three-dimensional structure and can perform any function, known or unknown. A polynucleotide may include one or more modified nucleotides, such as methylated nucleotides and nucleotide analogs. Modifications to the nucleotide structure may be possible before or after assembly of the polymer.
- the polynucleotide may be an RNA sequence, a DNA sequence, or a combination thereof (RNA-DNA combination sequence).
- known expression vectors such as plasmid vectors, cosmid vectors, and bacteriophage vectors can be used, and vectors can be easily prepared by those skilled in the art according to any known method using DNA recombination technology. You can.
- the vector may be a plasmid vector or a viral vector, and the viral vector may specifically be an Adenovirus, Adeno-associated virus, Lentivirus, or Retrovirus vector. It is not limited to this.
- a recombinant expression vector may contain a nucleic acid in a form suitable for expression of the nucleic acid in a host cell, which is selected based on the host cell such that the recombinant expression vector is used for expression, i.e., is operably linked to the nucleic acid sequence to be expressed. means that it contains one or more control elements that can be
- operably linked means that the nucleotide sequence of interest is linked in a manner that allows expression of the nucleotide sequence (e.g., in an in vitro transcription/translation system or in a host cell if the vector is introduced into the host cell). ) means that it is connected to a regulatory element.
- the recombinant expression vector may contain a form suitable for messenger RNA synthesis, including the T7 promoter, which allows for in situ mRNA synthesis, i.e., contains one or more regulatory elements that allow messenger RNA to be synthesized by T7 polymerase. It means that
- Regulatory elements may include promoters, enhancers, internal ribosome entry sites (IRES), and other expression control elements (e.g., transcription termination signals such as polyadenylation signals and poly-U sequences). Regulatory elements include elements that direct the induction or constitutive expression of a nucleotide sequence in many types of host cells and elements that direct expression of a nucleotide sequence only in specific host cells (e.g., tissue-specific regulatory sequences). Tissue-specific promoters direct expression primarily in the desired tissue of interest, such as muscle, neurons, bone, skin, blood, specific organs (e.g., liver, pancreas), or specific cell types (e.g., lymphocytes). can do. Regulatory elements can also direct expression in a temporally-dependent manner, such as a cell-cycle dependent or developmental stage-dependent manner, which may or may not be tissue or cell-type specific.
- the vector includes one or more pol III promoters, one or more pol II promoters, one or more pol I promoters, or combinations thereof.
- pol III promoters include, but are not limited to, the U6 and H1 promoters.
- pol II promoters include, but are not limited to, the retroviral Rous sarcoma virus (RSV) LTR promoter (optionally with an RSV enhancer), the cytomegalovirus (CMV) promoter (optionally with a CMV enhancer) (e.g., Boshart et al.
- RSV Rous sarcoma virus
- CMV cytomegalovirus
- SV40 promoter dihydrofolate reductase promoter
- ⁇ -actin promoter phosphoglycerol kinase (PGK) promoter
- PGK phosphoglycerol kinase
- Regulatory elements include enhancers such as WPRE; CMV enhancer; R-U5' segment in the LTR of HTLV-I; SV40 enhancer; and an intron sequence between exons 2 and 3 of rabbit ⁇ -globin.
- a vector can be introduced into a host cell to produce a transcript, protein or peptide comprising a fusion protein or peptide encoded by a nucleic acid as described herein (e.g., clustered regularly spaced short palindromic repeats ( CRISPR) transcripts, proteins, enzymes, mutants thereof, fusion proteins, etc.).
- Beneficial vectors include lentiviruses and adeno-associated viruses, and these types of vectors can also be selected to target specific types of cells.
- the vectors can be administered through local injection (e.g., direct injection into lesions or target areas), electroporation, lipofection, viral vectors, nanoparticles, as well as PTD (Protein translocation domain) fusion protein methods. It can be delivered in vivo or intracellularly.
- the nucleic acid is injected in the form of ribonucleic acid, for example, messenger ribonucleic acid (mRNA), enabling gene base correction in cells, for example, gene base correction without limitation in animal cells or plant cells.
- ribonucleic acid for example, messenger ribonucleic acid (mRNA)
- mRNA messenger ribonucleic acid
- the nucleic acid according to the present invention may be in the form of mRNA, and when delivered in the form of mRNA, the initiation of gene editing can be faster because the transcription process into mRNA is not necessary compared to delivery in the form of a vector using DNA. There is a high possibility of transient protein expression.
- the inventors of the present application found that when a cytosine base editor was injected into plant cells in the form of ribonucleic acid, for example, messenger ribonucleic acid, for gene editing of plant cell organelles, the off-target effect was reduced compared to delivery with a plasmid. was confirmed.
- ribonucleic acid for example, messenger ribonucleic acid
- the off-target effect was reduced compared to delivery with a plasmid. was confirmed.
- editing the genes of plant cell organelles it was demonstrated for the first time that when a cytosine base corrector was transformed into plant cells in the form of mRNA, it had an advantage in off-target effects compared to plasmids.
- the mRNA can be delivered directly or via a carrier.
- the mRNA of the nucleic acid cleavage enzyme and/or cleavage factor may be chemically modified or directly delivered in the form of synthetic self-replicating RNA.
- Methods that can deliver mRNA molecules to cells in vitro or in vivo can be considered, including methods of delivering mRNA to cells or delivering mRNA in vivo to cells of organisms such as humans and animals.
- they contain lipids (e.g., liposomes, micelles, etc.), contain nanoparticles or nanotubes, contain cationic compounds (e.g., polyethyleneimine or PEI), or contain cationic compounds (e.g.
- polyethyleneimine or PEI can be used to deliver mRNA molecules into cells.
- ballistics methods such as gene guns or biolistic particle delivery systems, can be used to deliver mRNA to cells.
- the carrier may include, for example, cell penetrating peptide (CPP), nanoparticles, or polymers, but is not limited thereto.
- CPP cell penetrating peptide
- nanoparticles or polymers, but is not limited thereto.
- the CPP is a short peptide that facilitates cellular uptake of a variety of molecular cargo (from nanosized particles to small chemical molecules and large fragments of DNA).
- the composition according to the present invention can be delivered via polymer nanoparticles, metal nanoparticles, metal/inorganic nanoparticles or lipid nanoparticles.
- the polymer nanoparticles may be, for example, DNA nanoclews or thread-like DNA nanoparticles synthesized by rolling circle amplification.
- DNA nanoclews and thread-like DNA nanoparticles can be loaded with mRNA and coated with PEI to improve endosomal escape ability. These complexes can bind to the cell membrane, be internalized, and then move to the nucleus through endosome escape, allowing them to be delivered.
- gold particles can be connected to form a complex with a cationic endosomal escape polymer (endosomal disruptive polymer) and delivered to cells.
- the cationic endosomal escape polymer (endosomal disruptive polymer) is, for example, polyethylene imine, poly(arginine), poly(lysine), poly(histidine), poly-[2- ⁇ (2-aminoethyl)amino ⁇ -ethyl -aspartamide] (pAsp(DET)), block co-polymer of poly(ethylene glycol) (PEG) and poly(arginine), block co-polymer of PEG and poly(lysine), or PEG and poly ⁇ N -[ N It may be a block co-polymer of -(2-aminoethyl)-2-aminoethyl]aspartamide ⁇ (PEG-pAsp(DET)).
- mRNA can be encapsulated through ZIF-8 (zeolitic imidazolate framework-8).
- the mRNA is negatively charged and can combine with cationic substances to form nanoparticles, which undergo receptor-mediated endocytosis into cells. It can penetrate through endocytosis or phagocytosis.
- Cationic polymers include polyallylamine (PAH); polyethyleneimine (PEI); poly(L-lysine) (PLL); poly(L-arginine) (PLA); polyvinylamine homo- or copolymer; poly(vinylbenzyl-tri-C1-C4-alkylammonium salt); polymers of aliphatic or araliphatic dihalides and aliphatic N,N,N',N'-tetra-C1-C4-alkyl-alkylenediamines; poly(vinylpyridine) or poly(vinylpyridinium salt); poly(N,N-diallyl-N,N-di-C1-C4-alkyl-ammonium halide); Homo- or copolymers of quaternized di-C1-C4-alkyl-aminoethyl acrylates or methacrylates; POLYQUADTM; Polyaminoamide, etc. may be included.
- Cationic lipids may include cationic liposome preparations.
- the lipid bilayer of the liposome protects the encapsulated nucleic acid from degradation and can prevent specific neutralization by antibodies that can bind to the nucleic acid.
- the endosomal membrane and liposomes fuse, allowing efficient endosomal escape of cationic lipid-nucleic acid cleavage enzymes.
- Cationic lipids include polyethyleneimine, polyamidoamine (PAMAM) dendrite, lipofectin (combination of DOTMA and DOPE), lipofectase, LIPOFECTAMINE® (e.g.
- Representative cationic liposomes are N-[1-(2,3-dioleoloxy)-propyl]-N,N,N-trimethylammonium chloride (DOTMA), N-[1-(2,3-dioleoloxy) -Propyl]-N,N,N-trimethylammonium methylsulfate (DOTAP), 3 ⁇ -[N-(N',N'-dimethylaminoethane)carbamoyl]cholesterol (DC-Chol), 2,3- Dioleyloxy-N-[2(sperminecarboxamido)ethyl]-N,N-dimethyl-1-propanaminium trifluoroacetate (DOSPA), 1,2-dimyristyloxypropyl-3 -dimethyl-hydroxyethyl ammonium bromide; or dimethyldioctadecylammonium bromide (DDAB).
- DOTMA N-[1-(2,3
- Liposomes are spherical vesicular structures composed of a single or multilamellar lipid bilayer surrounding an internal aqueous compartment and a relatively impermeable outer lipophilic phospholipid bilayer.
- Liposomal formulations may primarily include natural phospholipids and lipids, such as 1,2-distearolyl-sn-glycero-3-phosphatidyl choline (DSPC), sphingomyelin, phosphatidylcholine, or monosialoganglioside.
- DSPC 1,2-distearolyl-sn-glycero-3-phosphatidyl choline
- sphingomyelin phosphatidylcholine
- monosialoganglioside monosialoganglioside.
- cholesterol or 1,2-dioleoyl-sn-glycero-3-phosphoethanolamine may be added to the lipid membrane to resolve instability in plasma.
- the addition of cholesterol reduces the rapid release of the encapsulated bioactive compound into the plasma or 1,2-dioleoyl-sn-glycero-3-phosphoethanolamine (DOPE) increases its stability.
- composition can be delivered to plant cells via:
- the polynucleotide sequence encoding the fusion protein according to the present invention may be an RNA sequence, a DNA sequence, or a combination thereof (RNA-DNA combination sequence).
- the nucleic acid can be delivered to plant cells via:
- Agrobacterium such as Agrobacterium tumefaciens, Agrobacterium rhizogene, etc.
- Viral vector Geminivirus, tobacco rattle virus (TRV), tomato mosaic virus (ToMV), foxtail mosaic virus (FoMV), barley yellow striate mosaic virus (BYSMV), Sonchus yellow net rhabdovirus (SYNV), etc.;
- the virus is, for example, viral vector: Geminivirus, tobacco rattle virus (TRV), tomato mosaic virus (ToMV), foxtail mosaic virus (FoMV), barley yellow striate mosaic virus (BYSMV), Sonchus yellow net rhabdovirus (SYNV), etc.
- TRV tobacco rattle virus
- ToMV tomato mosaic virus
- FoMV foxtail mosaic virus
- BYSMV barley yellow striate mosaic virus
- SYNV Sonchus yellow net rhabdovirus
- the vectors can be administered through local injection (e.g., direct injection into lesions or target areas), electroporation, lipofection, viral vectors, nanoparticles, as well as PTD (Protein translocation domain) fusion protein methods. Can be delivered intracellularly.
- the present invention relates to a method for correcting the bases of plant cell organelle DNA, comprising the step of treating plant cells with the composition.
- the present invention relates to atrazine herbicide-resistant plants in which the base of the chloroplast psbA gene containing the GTTGAAAGC sequence has been corrected by the above method.
- the present invention relates to spectinomycin-resistant plants in which the base of 16s rRNA containing the CGTCATCCTCA sequence has been corrected by the above method.
- the present invention relates to plants in which the base of the atp6 gene has been corrected by the above method.
- the present invention relates to a plant with an albino phenotype in which the base of the psaA gene including ATG has been corrected by the above method.
- Phenylalanine By base-correcting Phenylalanine, the 295th amino acid of psbA in chloroplast DNA, to Serine, plants resistant to Atrazine, one of the herbicides, can be developed. Spectinomycin-resistant plants and albino-type plants can be developed through base correction of 16s rRNA and psaA, as well as psbA of chloroplasts.
- the present invention relates to a plant in which the base of the chloroplast rubisco (ribulose bisphosphate carboxylase) coding gene has been corrected by the above method. Since base correction of the rubisco large unit involved in photosynthesis is possible, it is possible to increase plant production by controlling photosynthetic efficiency.
- chloroplast rubisco ribulose bisphosphate carboxylase
- the chloroplast base sequence has high homology between plants, so not only lettuce (Lactuca sativa cv. Cheongchima) used in the present invention, but also plants such as rice, wheat, potato, and tomato are resistant to atrazine. can be developed
- the plasmid was delivered to lettuce protoplasts, and after 7 days, it was confirmed that the adenine base had been corrected at the target within the atp6 gene of mitochondrial DNA.
- FIG. 1 A schematic diagram of DNA cloning for producing transgenic plants using Agrobacterium is shown in Figure 1.
- RPS5A promoter-PTP-3xFlag-Left TALE-1397N and RPS5A promoter-PTP-3xFlag-Right TALE-1397C are placed in vectors with different Aat II and Pme I sites.
- -ABE8.0 was cloned respectively.
- Base correction efficiency and phenotype of first-generation transformants targeting psaA , rbcL , and rrn16S genes in Arabidopsis chloroplasts are shown.
- a Base correction efficiency and location of psaA #1, 2, and 3 are shown. Base correction of adenine and cytosine occur simultaneously.
- b The phenotype of psaA #3 can show green, chimeric, and pale green traits.
- c Base proofreading efficiency, location and phenotype of rbcL #1 and 2.
- d The base correction efficiency of the first generation transformant targeting the rrn16S gene is shown in Figure 5.
- Figure 6 confirms that chloroplast base correction is passed on to the next generation, and in the case of b, it is confirmed that A to G and C to T base correction are passed on to the next generation.
- chloroplasts of psaA #1 (a), psaA #3 chimeric (b), psaA #3 pale green (c), rrn16s #1 (d), 6 (e) and wild type Col-0 (f).
- Off-target base mutations through whole-genome analysis. No obvious off-target base mutations were observed in the transgenic plants compared to the wild type.
- a total of 30ug of -1397C-ABE8.0-Pea3A terminator, PcUBi promoter-MTS-3xFlag-Right TALE-1397N-Pea3A terminator were delivered at 15ug each, and the adenine base proofreading efficiency was measured after 7 days, A6 0.99%, A9 1.12 % base correction efficiency was shown.
- the only base proofreading method for plant cell organelle DNA was deamination of cytosine to thymine using DddAtox.
- the scope of DNA base correction in small organs has been expanded by correcting adenine to guanine. A to G base correction and C to T base correction can occur together.
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Botany (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
Abstract
본 발명은 식물세포 소기관 DNA의 염기 교정용 조성물, 특히 식물세포 소기관 DNA의 아데닌을 구아닌 및 시토신을 티민으로 교정하기 위한 조성물 및 교정방법에 관한 것이다.
Description
본 발명은 식물세포 소기관 DNA의 염기 교정용 조성물, 특히 식물세포 소기관 DNA의 아데닌을 구아닌 및 시토신을 티민으로 동시에 교정하기 위한 조성물 및 교정방법에 관한 것이다.
DNA 결합 단백질과 탈아미노효소가 연결된 융합단백질은 DNA 이중 가닥 절단 (DSBs)을 생성하지 않고 유전체에서 표적화된 뉴클레오타이드 치환 또는 염기 교정(base editing), 유전적 장애를 유발하는 점 돌연변이를 교정하거나 원핵세포, 인간 및 다른 진핵세포에 목적하는 단일 뉴클레오타이드 변이를 도입하도록 표적화된 방식(targeted manner)으로 단일 뉴클레오타이드 전환을 가능하게 한다.
ZFN (zinc-finger nuclease), TALEN (transcription activator-like effector nuclease), CRISPR (clustered regularly interspaced short palindromic repeat) 시스템 및 핵산분해 효율이 없는 크리스퍼 연관 단백질 9 (Cas9) 변이체와 염기 탈아미노효소 단백질의 염기 교정 기술 등의 프로그램 (설정) 유전체 교정 도구들은 염기 서열의 변화를 통하여 식물의 유전적 연구와 작물 형질 개선에 발전되어 왔다. 그러나 이러한 도구들은 미토콘드리아와 엽록체를 포함한 식물 기관의 DNA 서열을 교정하기에는 적합하지 않은데, 그 주된 이유는 가이드 RNA를 소기관으로 전달하거나, 두 화합물을 소기관에서 동시에 발현하는 것이 어렵기 때문이다. 식물세포 소기관은 광합성 및 호흡에 필요한 여러 필수적인 유전자를 암호화하고 있다. 이러한 소기관의 유전자를 교정하는 방법이나 도구는 이러한 유전자의 기능 연구나 작물 생산성과 형질 개선에 매우 필요하다. 예를 들어, 미토콘드리아 atp6 유전자의 표적 돌연변이는 번식에 유용한 특성인 웅성불임을 유발할 수 있고, 엽록체 게놈의 16S rRNA 유전자의 특정 점 돌연변이는 항생제 내성을 유발할 수 있다.
박테리아 독소 DddAtox는 Burkholderia cenocepacia에서 유래된 박테리아 독소의 효소 기능을 맡는 부분으로, 이중 나선 DNA의 시토신을 탈아미노화 할 수 있다. 탈아미노효소의 예시로, DddAtox는 세포에 독성이 있기 때문에 숙주세포에서의 독성을 피하기 위해, DddAtox는 두 개의 비활성화된 분할체(split)로 나누어 사용하는데, 각각의 반체는 DNA에 결합할 수 있도록 고안된 DNA 결합 단백질에 연결하여 기능을 갖춘 DdCBE 쌍으로써 사용할 수 있다.
이러한 기술적 배경하에서, 식물세포 소기관 DNA의 A to G 염기 교정과 C to T 염기 교정이 같이 일어날 수 있음을 확인하고, 본 발명을 완성하였다.
발명의 요약
본 발명의 목적은 DNA 결합 단백질, 시토신 탈아미노효소 또는 분리된 형태의 시토신 탈아미노효소 (deaminase) 및 아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 포함하는 식물세포 소기관 DNA의 염기 교정용 조성물을 제공하는데 있다.
본 발명의 목적은 식물세포 소기관 DNA를 교정하는 방법을 제공하는데 있다.
상기 목적을 달성하기 위하여, 본 발명은 DNA 결합 단백질 또는 이를 코딩하는 핵산; 시토신 탈아미노효소 (deaminase) 또는 시토신 탈아미노효소 유래의 제1분할체 및 제2분할체 또는 이를 코딩하는 핵산; 및 아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 포함하는, 식물세포 소기관 DNA의 염기 교정용 조성물을 제공한다.
본 발명은 또한, 상기 조성물을 식물세포에 처리하는 단계를 포함하는 식물세포 소기관 DNA의 염기를 교정하는 방법을 제공한다.
도 1은 Agrobacterium을 이용한 형질전환 식물 제작을 위한 DNA cloning 모식도이다.
도 2는 psaA 유전자를 타겟하는 형질전화체 식물. a, 각 식물체의 염기 교정 효율과 위치. b, 식물의 표현형. c, DNA염기교정으로 인한 아미노산 염기 서열의 변화 결과를 나타낸 것이다.
도 3은 rbcL 유전자를 타겟하는 형질전화체 식물. a, 각 식물체의 염기 교정 효율과 위치. b, DNA염기교정으로 인한 아미노산 염기 서열의 변화 결과를 나타낸 것이다.
도 4는 rrn16S 유전자를 타겟하는 형질전환 식물의 염기 교정 효율과 위치 확인한 결과를 나타낸 것이다.
도 5는 애기 장대의 엽록체에 있는 psaA, rbcL과 rrn16S 유전자를 타겟 하는 1세대 형질전환체의 염기 교정 효율과 표현형. a, psaA #1, 2, 3의 염기 교정 효율과 위치. Adenine의 염기 교정뿐 아니라 Cytosine의 염기 교정이 동시에 일어남. b, psaA #3의 표현형으로 green, chimeric, pale green의 형질을 나타냄. c, rbcL #1, 2의 염기 교정 효율, 위치와 표현형. d, rrn16S 유전자를 타겟하는 1세대 형질전환체의 염기 교정 효율을 확인한 결과를 나타낸 것이다.
도 6은 형질전환 2세대 식물의 염기 교정 효율과 표현형. psaA #3의 형질전환 2세대의 표현형과 (a), 염기 교정 효율과 위치 (b). Spectinomycin에 저항성을 가지는 rrn16S 형질전환 2세대의 표현형 (c)과 염기 교정 효율과 위치 (d). e, 형질전환 식물에 도입된 외부 유전자의 유무를 PCR로 확인한 결과 rrn16S #9-1, 3은 외부 유전자가 없는 것을 확인하였다.
도 7은 rrn16S 형질전환 2세대 식물 중 Spectinomycin에 저항성과 민감성을 가지는 식물의 염기 교정 위치와 효율을 확인한 결과를 나타낸 것이다.
도 8은 psaA #1 (a), psaA #3 chimeric (b), psaA #3 pale green (c), rrn16s #1 (d), 6 (e)과 야생형 Col-0 (f)의 엽록체 전장 유전체 분석을 통한 표적 외 염기 변이. 야생형과 비교했을 때 형질전환 식물에서 뚜렷한 표적 외 염기 변이가 관찰되지 않음.
도 9는 상추 미토콘드리아 유전자 atp6의 염기교정을 효율을 나타낸 것이다.
발명의 상세한 설명 및 바람직한 구현예
다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로, 본 명세서에서 사용된 명명법은 본 기술분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.
식물세포의 소기관 DNA의 염기 교정은 DddAtox를 TALE과 결합하여 시토신을 티민으로 교정하는 방법만 존재하였다. 본 발명에 따른 기술적 과제인 DddAtox와 Adenine deaminase를 TALE에 결합하여 세포 소 기관 DNA의 염기를 교정하려 한다. 기존에는 불가능하였던 세포 소기관 DNA의 염기 교정함으로써 제초제 저항성을 가지는 식물 등 기능성 식물을 개발할 수 있다.
본 출원의 발명자들은 DNA에 결합할 수 있는 TALE 또는 ZFP 단백질에 DddAtox 시토신 탈아미노효소와 아데닌 탈아미노효소를 연결하여 A to G 염기 교정과 C to T 염기 교정이 같이 일어나는 염기 교정기 (base editor)를 제작하였다.
이를 바탕으로 일 관점에서, 본 발명은 식물세포 소기관 DNA의 염기 교정용 조성물로, DNA 결합 단백질 또는 이를 코딩하는 핵산; 시토신 탈아미노효소 또는 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체 또는 이를 코딩하는 핵산; 및 아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 포함하며, 상기 식물세포 소기관 DNA의 아데닌을 구아닌으로, 시토신을 티민으로 동시에 교정하는 것을 특징으로 하는 조성물에 관한 것이다.
본 명세서에서 사용되는 “교정”은 “편집”과 상호 호환적으로 사용 가능하고, 특이적 게놈 표적의 선택적 결실에 의해서 핵산 서열을 변경시키는 방법을 의미한다. 이러한 특이적 게놈 표적은 염색체 영역, 유전자, 프로모터, 오픈 리딩 프레임 또는 임의의 핵산 서열을 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는 "단일 염기"는 핵산 서열 내 하나, 및 오직 하나의 뉴클레오티드를 의미한다. 단일 염기 교정의 맥락에서 사용될 때, 이것은 핵산 서열 내 특이적 위치의 염기가 상이한 염기로 치환되는 것을 의미한다. 이러한 치환은 제한없이 치환 또는 변형을 포함한, 많은 기전에 의해 일어날 수 있다.
본 명세서에서 사용되는 "표적" 또는 "표적 부위"는 임의 조성 및/또는 길이의 사전에 확인된 핵선 서열을 의미한다. 이러한 표적 부위는 염색체 영역, 유전자, 프로모터, 오픈 리딩 프레임 또는 임의의 핵산 서열을 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는 "온-타겟”은 프로그램 가능한 DNA 결합 영역 및/또는 단일 가이드 RNA 서열과 완전하게 상보성일 수 있는 특이적 게놈 표적의 하위 서열을 의미한다.
본 명세서에서 사용되는 “오프-타겟”은 프로그램 가능한 DNA 결합 영역 및/또는 단일 가이드 RNA 서열과 부분적으로 상보성일 수 있는 특이적 게놈 표적의 하위 서열을 의미한다.
본 발명에서 시토신 탈아미노효소 또는 이의 변이체 유래인 제1분할체 및 제2분할체를 포함하고, 상기 시토신 탈아미노효소가 DNA 결합 단백질에 결합되거나 상기 제1분할체 및 제2분할체가 각각 상기 DNA 결합 단백질에 결합되는 형태를 가진다.
상기 시토신 탈아미노효소는 아미노기 이탈 효소로, 시토신(C)을 우리딘(U)으로 전환시킬 수 있다.
상기 시토신 탈아미노효소일 수 있다. 상기 시토신 탈아미노효소로 예를 들어, APOBEC1 (apolipoprotein B editing complex 1), AID (activation-induced deaminase)의 형태가 존재하나, 대부분의 DNA 탈아미노효소들은 단일 가닥 DNA에만 작동해서 DNA 결합 단백질에 연결하여 염기 교정하는 데에는 적합하지 않을 수 있다. 구체적으로, 상기 시토신 탈아미노효소는 상기 시토신 탈아미노효소는 이중 가닥 DNA에 작용하는 탈아미노효소 (DddA) 또는 이의 오솔로그 (orthologue)에서 유래한 것일 수 있다. 더욱 구체적으로, 상기 시토신 탈아미노효소는 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소일 수 있다.
상기 시토신 탈아미노효소는 분할된 형태로, 상기 시토신 탈아미노효소는 분리된 제1분할체 및 제2분할체를 포함하고, 상기 제1분할체와 제2분할체 각각은 탈아미노효소 활성이 없는 것이다.
전장 시토신 탈아미노효소 중 tox 분할체에 해당하는 서열번호 1의 서열을 포함할 수 있다. 상기 시토신 탈아미노효소는 제1분할체 및 제2분할체를 포함하고, 상기 제1분할체와 제2분할체 각각은 탈아미노효소 활성이 없다.
하나의 실시예에서, 상기 시토신 탈아미노효소의 제1분할체 또는 제2분할체는 서열번호 1의 서열 중 N 말단에서 G33, G44, A54, N68, G82, N98, G108로 구성된 군에서 선택되는 하나 이상까지의 서열을 포함할 수 있다. 상기 시토신 탈아미노효소의 제1분할체 또는 제2분할체는 서열번호 1의 서열 중 G34, P45, G55, N69, T83, A99, A109로 구성된 군에서 선택되는 하나 이상에서 C-말단까지의 서열을 포함할 수 있다.
구체적으로, 상기 시토신 탈아미노효소는 서열번호 2의 제1분할체 (G1333-N) 및 서열번호 3의 제2분할체 (G1333-C)을 포함하거나, 서열번호 4의 제1분할체 (G1397-N) 및 서열번호 5의 제2분할체 (G1397-C)을 포함하거나, 서열번호 2의 제1분할체 (G1333-N) 및 서열번호 5의 제2분할체 (G1397-C)을 포함하거나, 서열번호 4의 제1분할체 (G1397-N) 및 서열번호 2의 제2분할체 (G1333-C)을 포함할 수 있다.
다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로, 본 명세서에서 사용된 명명법은 본 기술분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.
식물세포의 소기관 DNA의 염기 교정은 DddAtox를 TALE과 결합하여 시토신을 티민으로 교정하는 방법만 존재하였다. 본 발명에 따른 기술적 과제인 DddAtox와 Adenine deaminase를 TALE에 결합하여 세포 소 기관 DNA의 염기를 교정하려 한다. 기존에는 불가능하였던 세포 소기관 DNA의 염기 교정함으로써 제초제 저항성을 가지는 식물 등 기능성 식물을 개발할 수 있다.
본 출원의 발명자들은 DNA에 결합할 수 있는 TALE 또는 ZFP 단백질에 DddAtox 시토신 탈아미노효소와 아데닌 탈아미노효소를 연결하여 A to G 염기 교정과 C to T 염기 교정이 같이 일어나는 염기 교정기 (base editor)를 제작하였다.
이를 바탕으로 일 관점에서, 본 발명은 식물세포 소기관 DNA의 염기 교정용 조성물로, DNA 결합 단백질 또는 이를 코딩하는 핵산; 시토신 탈아미노효소 또는 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체 또는 이를 코딩하는 핵산; 및 아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 포함하며, 상기 식물세포 소기관 DNA의 아데닌을 구아닌으로, 시토신을 티민으로 동시에 교정하는 것을 특징으로 하는 조성물에 관한 것이다.
본 명세서에서 사용되는 “교정”은 “편집”과 상호 호환적으로 사용 가능하고, 특이적 게놈 표적의 선택적 결실에 의해서 핵산 서열을 변경시키는 방법을 의미한다. 이러한 특이적 게놈 표적은 염색체 영역, 유전자, 프로모터, 오픈 리딩 프레임 또는 임의의 핵산 서열을 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는 "단일 염기"는 핵산 서열 내 하나, 및 오직 하나의 뉴클레오티드를 의미한다. 단일 염기 교정의 맥락에서 사용될 때, 이것은 핵산 서열 내 특이적 위치의 염기가 상이한 염기로 치환되는 것을 의미한다. 이러한 치환은 제한없이 치환 또는 변형을 포함한, 많은 기전에 의해 일어날 수 있다.
본 명세서에서 사용되는 "표적" 또는 "표적 부위"는 임의 조성 및/또는 길이의 사전에 확인된 핵선 서열을 의미한다. 이러한 표적 부위는 염색체 영역, 유전자, 프로모터, 오픈 리딩 프레임 또는 임의의 핵산 서열을 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는 "온-타겟”은 프로그램 가능한 DNA 결합 영역 및/또는 단일 가이드 RNA 서열과 완전하게 상보성일 수 있는 특이적 게놈 표적의 하위 서열을 의미한다.
본 명세서에서 사용되는 “오프-타겟”은 프로그램 가능한 DNA 결합 영역 및/또는 단일 가이드 RNA 서열과 부분적으로 상보성일 수 있는 특이적 게놈 표적의 하위 서열을 의미한다.
본 발명에서 시토신 탈아미노효소 또는 이의 변이체 유래인 제1분할체 및 제2분할체를 포함하고, 상기 시토신 탈아미노효소가 DNA 결합 단백질에 결합되거나 상기 제1분할체 및 제2분할체가 각각 상기 DNA 결합 단백질에 결합되는 형태를 가진다.
상기 시토신 탈아미노효소는 아미노기 이탈 효소로, 시토신(C)을 우리딘(U)으로 전환시킬 수 있다.
상기 시토신 탈아미노효소일 수 있다. 상기 시토신 탈아미노효소로 예를 들어, APOBEC1 (apolipoprotein B editing complex 1), AID (activation-induced deaminase)의 형태가 존재하나, 대부분의 DNA 탈아미노효소들은 단일 가닥 DNA에만 작동해서 DNA 결합 단백질에 연결하여 염기 교정하는 데에는 적합하지 않을 수 있다. 구체적으로, 상기 시토신 탈아미노효소는 상기 시토신 탈아미노효소는 이중 가닥 DNA에 작용하는 탈아미노효소 (DddA) 또는 이의 오솔로그 (orthologue)에서 유래한 것일 수 있다. 더욱 구체적으로, 상기 시토신 탈아미노효소는 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소일 수 있다.
상기 시토신 탈아미노효소는 분할된 형태로, 상기 시토신 탈아미노효소는 분리된 제1분할체 및 제2분할체를 포함하고, 상기 제1분할체와 제2분할체 각각은 탈아미노효소 활성이 없는 것이다.
전장 시토신 탈아미노효소 중 tox 분할체에 해당하는 서열번호 1의 서열을 포함할 수 있다. 상기 시토신 탈아미노효소는 제1분할체 및 제2분할체를 포함하고, 상기 제1분할체와 제2분할체 각각은 탈아미노효소 활성이 없다.
상기 G1333N, G1333C, G1397N 및 G1397C가 조합되어 분할 형태의 탈아미노효소로 사용될 수 있다. 구체적으로, Left-G1333-N + Right-G133-C, Left-G1397-N + Right-G1397-C, Left-G1397-N + Right-G1333-C, 또는 Left-G1333-N + Right-G1397-C의 형태로 사용될 수 있다.
상기 DNA 결합 단백질은 예를 들어, 징크 핑커 단백질 (zinc finger protein), TALE (Transcription activator-like effector) 어레이 또는 이들의 조합일 수 있다.
상기 징크 핑커 단백질의 징크 핑거 모티프는 DNA 결합 도메인을 가지고, 핑거의 c-말단 부분은 DNA 서열을 특이적으로 인식한다. 3 ~ 6 개의 징크 핑거 모티프를 포함하는 DNA 결합 단백질이 DNA 서열을 인식한다.
하나의 실시예에서, 상기 시토신 탈아미노효소의 제1분할체 및 시토신 탈아미노효소의 제2분할체 각각은 징크 핑거 단백질의 N-말단 또는 C-말단에 결합할 수 있다.
시토신 탈아미노효소의 제1분할체 N-말단에 징크 핑거 단백질 (ZF-Left)의 C-말단이 결합하고 시토신 탈아미노효소의 제2분할체 N-말단에 징크 핑거 단백질 (ZF-Right) C-말단이 결합 (CC configuration);
시토신 탈아미노효소의 제1분할체 C-말단에 징크 핑거 단백질 (ZF-Left)의 N-말단이 결합하고 시토신 탈아미노효소의 제2분할체 N-말단에 징크 핑거 단백질 (ZF-Right) C-말단이 결합 (NC configuration);
시토신 탈아미노효소의 제1분할체 N-말단에 징크 핑거 단백질 (ZF-Left)의 C-말단이 결합하고 시토신 탈아미노효소의 제2분할체 C-말단에 징크 핑거 단백질 (ZF-Right) N-말단이 결합 (CN configuration); 또는
시토신 탈아미노효소의 제1분할체 C-말단에 징크 핑거 단백질 (ZF-Left)의 N-말단이 결합하고 시토신 탈아미노효소의 제2분할체 C-말단에 징크 핑거 단백질 (ZF-Right) N-말단이 결합 (NN configuration)할 수 있다.
상기 ZF-Left은 다음의 서열번호 6의 서열을 포함할 수 있다:
[서열번호 6]
상기 ZF-Right는 다음의 서열번호 7의 서열을 포함할 수 있다:
[서열번호 7]
ZF은 DNA 타겟에 따라 서열이 달라질 수 있다. ZF은 DNA 타겟 서열에 따라 맞춤형 제작될 수 있다. ZF는 DNA 3bp를 인식하기 때문에 보통 3~6개의 ZF를 이어 붙여 9~18bp DNA를 인식하는 ZF 조합을 제작할 수 있다. 예를 들어, GNN, TNN, CNN 또는 ANN 등의 모듈이 포함된 라이브러리를 이용하여 제작할 수 있다.
경우에 따라서, 상기 징크 핑거 단백질은 링커를 통해 탈아미노효소와 연결될 수 있다. 상기 링커는 2 내지 40개 아미노산 잔기를 포함하는 펩타이드 링커일 수 있다. 상기 링커는 예를 들어, 2aa, 5aa, 10aa, 16aa, 24aa 또는 32aa 길이의 링커 등일 수 있으나, 이에 제한되는 것은 아니다.
하나의 실시예에서, 상기 링커는 다음을 포함할 수 있다:
본 발명에 따른 구체적 실시예에서, 분할 탈아미노효소와 징크 핑거 단백질이 링커를 통해 연결될 수 있고, 제1분할체를 포함하는 반쪽 탈아미노효소 N-말단에 징크 핑거 단백질이 결합하고, 제2분할체를 포함하는 반쪽 탈아미노효소 N-말단에 징크 핑거 단백질이 결합한다. 이 때, 왼쪽과 오른쪽 ZFP가 붙는 곳 사이인 스페이서에서 C에서 T로의 염기 전환이 일어날 수 있다. 왼쪽과 오른쪽 ZFP 모두 24 a.a 링커를 통해 제1분할체를 포함하는 반쪽 탈아미노효소 및 제2분할체를 포함하는 반쪽 탈아미노효소 각각과 연결되는 경우, 높은 교정 효율을 보임을 확인하였다.
상기 TAL 이펙터 (TALE)는 33개에서 34개의 반복된 아미노산 서열이 반복된 형태로 이루어져 있으며, 도메인(RVD, Repeated variant domain)이 약 9개 정도 반복된다. 도메인 하나당 한 개의 뉴클레오타이드를 인지 할 수 있으며, 12-13번째 아미노산 서열 에 따라 특이적인 DNA 서열과 결합 할 수 있다(HD->Cytosine, NI->Adenine, NG -> Thymine, NN -> Guanine). 탈이펙터(TALE)는 표적부위 내의 단일 DNA 가닥을 인식한다. 표적 부위 사이의 거리는 12-14 뉴클레오타이드일 수 있다.
상기 TALE 도메인은 하나 이상의 TALE-Repeat의 조합에 의해 서열-특이적 방식으로 뉴클레오티드에 결합하는 단백질 도메인을 의미한다. 적어도 하나 이상의 TALE-Repeat, 구체적으로 1 내지 30개의 TALE-Repeat를 포함하나 이에 한정되지 않는다. TALE-Repeat는 TALE 도메인 내 특정 뉴클레오티드 서열을 인식하는 부위이다.
상기 TALE 도메인에 백본 구조로 TALE의 N-말단 포함 영역 및 TALE의 C-말단 포함 영역이 포함된다.
절단 부위를 기준으로 상기 TALE 도메인이 결합하는 위치에 따라, 단일 TALE 어레이 (array) 또는 제 1 TALE 어레이 및 제 2 TALE 어레이가 각각 결합할 수 있다.
상기 시토신 탈아미노효소의 제1분할체에 제 1 TALE이 결합 (left TALE)되고, 상기 시토신 탈아미노효소의 제2분할체에 제 2 TALE (right TALE)이 결합될 수 있다. 각각 N’-TALE-제1분할체-C’ 및 N’-TALE-제2분할체-C’ 구조를 가진다.
TALE 어레이는 타겟 DNA 서열에 따라 맞춤 제작할 수 있다. TALE 어레이는 33~35 개의 아미노산 잔기로 구성된 모듈이 반복적으로 배열되어 구성되는 데 이들은 식물 병원균 Xanthmonas에서 유래한 것으로 모듈 하나가 A, C, G, T 염기 하나씩을 각각 인식하여 DNA에 결합한다. 각각의 모듈의 염기 특이성은 12, 13번째 아미노산 잔기에 의해 결정되는데 이들을 RVD (repeat variable di-residue)라고 한다. 예를 들어 RVD가 NN인 모듈은 G를 인식하고 NI는 A, HD는 C, NG는 T를 인식한다. TALE array는 최소 14 개에서 최대 18 개 이상의 모듈로 구성되어 타겟 DNA 서열 15bp~20bp를 인식할 수 있도록 설계할 수 있다.
변이된 형태의 Cas 단백질을 포함할 수 있다. DNA 이중 가닥을 절단하는 엔도뉴클레아제 활성을 상실하도록 변이된 것을 의미할 수 있으며, 예컨대, 엔도뉴클레아제 활성을 상실하고 니카아제 활성을 갖도록 변이된 변이 표적 특이적 뉴클레아제 및 엔도뉴클레아제 활성과 니카아제 활성을 모두 상실하도록 변이된 형태 중 1종 이상일 수 있다.
니카아제 활성을 갖는 것인 경우, 상기 시토신 탈아미노효소에 의한 염기변환(예컨대, 시토신이 우라딘으로 변환)과 동시 또는 순서와 무관하게 순차적으로, 상기 염기 변환이 일어난 가닥 또는 그 반대 가닥 (예컨대, 염기 변환이 일어난 가닥의 반대 가닥)에서 nick이 도입될 수 있다 (예컨대, PAM이 위치하는 가닥의 반대가닥에서, PAM 서열의 5' 말단 방향으로 3번째 뉴클레오타이드와 4번째 뉴클레오타이드 사이에 해당하는 위치에 nick이 도입됨). 이와 같은 변이 (예컨대, 아미노산 치환 등)는 촉매 활성 도메인 (예컨대, Cas9의 경우 RuvC 촉매 도메인)에서 일어나는 것일 수 있다. 스트렙토코커스 피요젠스 유래 Cas9의 경우 변이는 촉매 활성을 갖는 아스파르트산 잔기 (catalytic aspartate residue; 10번째 위치의 아스파르트산 (D10) 등), 762번째 위치의 글루탐산 (E762), 840번째 위치의 히스티딘 (H840), 854번째 위치의 아스파라긴 (N854), 863번째 위치의 아스파라긴 (N863), 986번째 위치의 아스파르트산 (D986) 등으로 이루어진 군에서 선택된 하나 이상 임의의 다른 아미노산으로 치환된 돌연변이를 포함할 수 있다. 이 때, 치환되는 임의의 다른 아미노산은 알라닌 (alanine)일 수 있지만, 이에 제한되지 않는다.
경우에 따라서, 스트렙토코커스 피요젠스 유래 Cas9 단백질의 1135번째 위치의 아스파르트산 (D1135), 1335번째 위치의 아르기닌 (R1335), 및 1337번째 위치의 트레오닌 (T1337) 중 하나 이상, 예컨대 3개 모두가 다른 아미노산으로 치환되어, 야생형 Cas9의 PAM 서열 (NGG)와 상이한 NGA (N은 A, T, G, 및 C 중에서 선택된 임의의 염기임)을 인식하도록 변이된 것일 수 있다.
예를 들어, 스트렙토코커스 피요젠스 유래 Cas9 단백질의 아미노산 서열 중,
(1) D10, H840, 또는 D10 + H840;
(2) D1135, R1335, T1337, 또는 D1135 + R1335 + T1337; 또는
(3) (1)과 (2) 잔기 모두에서 아미노산 치환이 일어난 것일 수 있다.
상기 '다른 아미노산'은, 알라닌, 이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 트립토판, 발린, 아스파라긴산, 시스테인, 글루타민, 글리신, 세린, 트레오닌, 티로신, 아스파르트산, 글루탐산, 아르기닌, 히스티딘, 라이신, 상기 아미노산들의 공지된 모든 변형체 중에서, 야생형 단백질이 원래 변이 위치에 갖는 아미노산을 제외한 아미노산들 중에서 선택된 아미노산을 의미한다. 일 예에서, 상기 '다른 아미노산'은 알라닌, 발린, 글루타민, 또는 아르기닌일 수 있다.
경우에 따라서, 가이드 RNA를 추가로 포함할 수 있다. 상기 가이드 RNA는 예를 들어, CRISPR RNA (crRNA), trans-activating crRNA (tracrRNA), 및 단일 가이드 RNA (single guide RNA; sgRNA)로 이루어진 군에서 선택된 1종 이상일 수 있으며, 구체적으로 crRNA와 tracrRNA가 서로 결합된 이중 가닥 crRNA:tracrRNA 복합체, 또는 crRNA 또는 그 일부와 tracrRNA 또는 그 일부가 올리고뉴클레오타이드 링커로 연결된 단일 가닥 가이드 RNA (sgRNA)일 수 있다.
본 발명은 아데닌 탈아미노효소를 포함한다. 상기 아데닌 탈아미노효소는 예를 들어, APOBEC1 (apolipoprotein B editing complex 1), AID (activation-induced deaminase) 및 tadA (tRNA-specific adenosine deaminase)으로 구성된 군에서 선택될 수 있으며, 구체적으로는 tadA (tRNA-specific adenosine deaminase)일 수 있다. 상기 아데닌 탈아미노효소는 예를 들어, 대장균 TadA의 변이체로서 디옥시-아데닌 탈아미노효소 (deoxy-adenine deaminase)일 수 있다.
본 발명에 따른 구체적 실시예에서, 대장균 TadA의 변이체로서 디옥시-아데닌 탈아미노효소 (deoxy-adenine deaminase)를 사용하였고, 구체적으로 TadA8e 또는 ABE 8.0일 수 있다.
상기 시토신 탈아미노효소가 분할 형태로 포함되고, 상기 DNA 결합 단백질이 징크 핑거 단백질로, 시토신 탈아미노효소의 제1분할체 C-말단에 징크 핑거 단백질 (ZF-Left)의 N-말단이 결합하고 시토신 탈아미노효소의 제2분할체 N-말단에 징크 핑거 단백질 (ZF-Right) C-말단이 결합 (NC configuration)한 구조에서, 아데닌 탈아미노효소는 징크 핑거 단백질 (ZF-Left)의 C 말단, 시토신 탈아미노효소의 제1분할체의 N 말단 또는 C 말단, 징크 핑거 단백질 (ZF-Right)의 N 말단, 시토신 탈아미노효소의 제2분할체의 N 말단 또는 C 말단에 결합할 수 있다.
아데닌 탈아미노효소는 시토신 탈아미노효소의 제1분할체 N-말단에 징크 핑거 단백질 (ZF-Left)의 C-말단이 결합하고 시토신 탈아미노효소의 제2분할체 N-말단에 징크 핑거 단백질 (ZF-Right) C-말단이 결합 (CC configuration); 시토신 탈아미노효소의 제1분할체 N-말단에 징크 핑거 단백질 (ZF-Left)의 C-말단이 결합하고 시토신 탈아미노효소의 제2분할체 C-말단에 징크 핑거 단백질 (ZF-Right) N-말단이 결합 (CN configuration); 또는 시토신 탈아미노효소의 제1분할체 C-말단에 징크 핑거 단백질 (ZF-Left)의 N-말단이 결합하고 시토신 탈아미노효소의 제2분할체 C-말단에 징크 핑거 단백질 (ZF-Right) N-말단이 결합 (NN configuration)에서도 징크 핑거 단백질 (ZF-Left)의 C 말단, 시토신 탈아미노효소의 제1분할체의 N 말단 또는 C 말단, 징크 핑거 단백질 (ZF-Right)의 N 말단, 시토신 탈아미노효소의 제2분할체의 N 말단 또는 C 말단에 결합할 수 있다.
상기 시토신 탈아미노효소가 분할 형태로 포함되고, 상기 DNA 결합 단백질이 TALE인 경우 상기 시토신 탈아미노효소의 제1분할체에 제1 TALE 이 결합되고, 상기 시토신 탈아미노효소의 제2분할체에 제2 TALE이 결합될 수 있으며, 각각 N’-TALE-제1분할체DDDA-C’ 및 N’-TALE-제2분할체DDDA-C’ 구조를 가진다. 아데닌 탈아미노효소는 시토신 탈아미노효소의 제1분할체의 N 말단 또는 C 말단 또는 시토신 탈아미노효소의 제2분할체 N 말단 또는 C 말단에 결합할 수 있다.
본 발명은 1) DNA 결합 단백질 2) 분할된 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소 및 3) E. coli TadA 유래 디옥시아데닌 탈아미노효소를 포함하는 식물세포 소기관 DNA의 A-to-G 염기 교정용 조성물(UGI (uracil DNA-glycosylase inhibitor) 없음)로, 상기 DNA 결합 단백질은 징크 핑거 단백질 (ZFP) 또는 전사 활성화 인자 유사 이펙터 (TALE) 어레이이고; 분할된 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소 Burkholderia cenocepacia 유래 DddAtox인 조성물이다.
상기 시토신 탈아미노효소가 분할 형태로 포함되고, 상기 DNA 결합 단백질이 징크 핑거 단백질로, 시토신 탈아미노효소의 제1분할체 C-말단에 징크 핑거 단백질 (ZF-Left)의 N-말단이 결합하고 시토신 탈아미노효소의 제2분할체 N-말단에 징크 핑거 단백질 (ZF-Right) C-말단이 결합 (NC configuration)한 구조에서, 아데닌 탈아미노효소는 징크 핑거 단백질 (ZF-Left)의 C 말단, 시토신 탈아미노효소의 제1분할체의 N 말단 또는 C 말단, 징크 핑거 단백질 (ZF-Right)의 N 말단, 시토신 탈아미노효소의 제2분할체의 N 말단 또는 C 말단에 결합할 수 있다.
아데닌 탈아미노효소는 시토신 탈아미노효소의 제1분할체 N-말단에 징크 핑거 단백질 (ZF-Left)의 C-말단이 결합하고 시토신 탈아미노효소의 제2분할체 N-말단에 징크 핑거 단백질 (ZF-Right) C-말단이 결합 (CC configuration); 시토신 탈아미노효소의 제1분할체 N-말단에 징크 핑거 단백질 (ZF-Left)의 C-말단이 결합하고 시토신 탈아미노효소의 제2분할체 C-말단에 징크 핑거 단백질 (ZF-Right) N-말단이 결합 (CN configuration); 또는 시토신 탈아미노효소의 제1분할체 C-말단에 징크 핑거 단백질 (ZF-Left)의 N-말단이 결합하고 시토신 탈아미노효소의 제2분할체 C-말단에 징크 핑거 단백질 (ZF-Right) N-말단이 결합 (NN configuration)에서도 징크 핑거 단백질 (ZF-Left)의 C 말단, 시토신 탈아미노효소의 제1분할체의 N 말단 또는 C 말단, 징크 핑거 단백질 (ZF-Right)의 N 말단, 시토신 탈아미노효소의 제2분할체의 N 말단 또는 C 말단에 결합할 수 있다.
상기 시토신 탈아미노효소가 분할 형태로 포함되고, 상기 DNA 결합 단백질이 TALE인 경우 상기 시토신 탈아미노효소의 제1분할체에 제1 TALE 이 결합되고, 상기 시토신 탈아미노효소의 제2분할체에 제2 TALE이 결합될 수 있으며, 각각 N’-TALE-제1분할체DDDA-C’ 및 N’-TALE-제2분할체DDDA-C’ 구조를 가진다. 아데닌 탈아미노효소는 시토신 탈아미노효소의 제1분할체의 N 말단 또는 C 말단 또는 시토신 탈아미노효소의 제2분할체 N 말단 또는 C 말단에 결합할 수 있다.
본 발명은 식물세포 소기관 A-to-G 염기 교정용 조성물로, 상기 DNA 결합 단백질은 징크 핑커 단백질 (zinc finger protein), 또는 TALE 어레이이고, 상기 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체는 박테리아 유래이고, 이중 가닥 DNA 특이적인 것을 특징으로 하는 조성물에 관한 것이다.
본 발명은 식물세포 소기관 A-to-G 염기 교정용 조성물로, 상기 DNA 결합 단백질은 징크 핑커 단백질 (zinc finger protein) 또는 TALE 어레이이고, 상기 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체는 박테리아 유래이고, 이중 가닥 DNA 특이적인 것이며, 상기 제1분할체 N 말단에 DNA 결합 단백질이 결합되어 있고, 아데닌 탈아미노효소의 C 말단에 DNA 결합 단백질이 결합되어 있는, 조성물에 관한 것이다.
본 발명은 1) DNA 결합 단백질 2) 분할된 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소 및 3) E. coli TadA 유래 디옥시아데닌 탈아미노효소를 포함하는 식물세포 소기관 A-to-G 염기 교정용 조성물로, UGI를 포함하지 않으며, 상기 DNA 결합 단백질은 징크 핑거 단백질 (ZFP) 또는 전사 활성화 인자 유사 이펙터 (TALE) 어레이 이고; 분할된 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소 Burkholderia cenocepacia 유래 DddAtox인 조성물이다.
본 발명은 식물세포 소기관 A-to-G 염기 교정방법으로, DNA 결합 단백질 또는 이를 코딩하는 핵산; 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체 또는 이를 코딩하는 핵산; 및 아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 식물세포에 처리하는 단계를 포함하고, 상기 DNA 결합 단백질은 징크 핑커 단백질 (zinc finger protein), 또는 TALE 어레이이고, 상기 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체는 박테리아 유래이고, 이중 가닥 DNA 특이적인 것을 특징으로 하는 방법에 관한 것이다.
본 발명은 식물세포 소기관 A-to-G 염기 교정방법으로, DNA 결합 단백질 또는 이를 코딩하는 핵산; 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체 또는 이를 코딩하는 핵산; 및 아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 식물세포에 처리하는 단계를 포함하고, 상기 DNA 결합 단백질은 징크 핑커 단백질 (zinc finger protein), 또는 TALE 어레이이고, 상기 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체는 박테리아 유래이고, 이중 가닥 DNA 특이적인 것이며, 상기 제1분할체 N 말단에 DNA 결합 단백질이 결합되어 있고, 아데닌 탈아미노효소의 C 말단에 DNA 결합 단백질이 결합되어 있는, 방법에 관한 것이다.
본 발명은 식물세포 소기관 A-to-G 염기 교정방법으로, DNA 결합 단백질 또는 이를 코딩하는 핵산; 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체 또는 이를 코딩하는 핵산; 및 아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 식물세포에 처리하는 단계를 포함하고, 1) DNA 결합 단백질 2) 분할된 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소 및 3) E. coli TadA 유래 디옥시아데닌 탈아미노효소를 포함하는 식물세포 소기관 A-to-G 염기 교정용 조성물로, UGI를 포함하지 않으며, 상기 DNA 결합 단백질은 징크 핑거 단백질 (ZFP) 또는 전사 활성화 인자 유사 이펙터 (TALE) 어레이 이고; 분할된 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소 Burkholderia cenocepacia 유래 DddAtox인 방법이다.
기존에는 UGI를 포함하지 않는 TALED가 동물세포 미토콘드리아에서 C-to-T 에디팅을 일으키지 않고 A-to-G 에디팅만 일으켰다.
본 발명은 엽록체 전달 펩타이드(chloroplast transit peptide) 또는 미토콘드리아 전달 단백질 (Mitochondrial Targeting Signal, MTS)을 추가로 포함할 수 있다.
예를 들어, 엽록체 전달 단백질 (Chloroplast Transit Peptide, CTP) 또는 미토콘드리아 전달 신호 단백질 (Mitochondrial Targeting Signal, MTS)이 결합하여 식물 세포 내 엽록체와 미토콘드리아에 전달된다. 엽록체와 미토콘드리아로 전달될 때 N-말단의 CTP 또는 MTS 단백질을 제외한 나머지 부분은 전-단백질 (preprotein) 형태로 엽록체와 미토콘드리아 내부로 전달된다. 엽록체와 미토콘드리아 내부로 진입 과정에서 전달 단백질 부분이 떨어져 나가게 되고 엽록체와 미토콘드리아를 타겟팅하여 특정 부분을 염기 교정할 수 있다.
상기 핵산과 관련하여, "폴리뉴클레오티드", "뉴클레오티드", "뉴클레오티드 서열", 및 "올리고뉴클레오티드"는 상호교환적으로 사용된다. 임의의 길이의 뉴클레오티드의 폴리머 형태, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드, 또는 이들의 유사체를 포함할 수 있다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있으며, 공지된 또는 비공지된 임의의 기능을 수행할 수 있다. 폴리뉴클레오티드는 하나 이상의 변형된 뉴클레오티드 예컨대, 메틸화된 뉴클레오티드 및 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드 구조에 대한 변형은 폴리머의 어셈블리 전 또는 후에 가능할 수 있다.
상기 폴리뉴클레오티드는 RNA 서열, DNA 서열, 또는 이의 조합(RNA-DNA 조합 서열)일 수 있다.
상기 융합단백질을 발현시키기 위한 수단으로서, 플라스미드 벡터, 코즈미드 벡터, 박테리오파아지 벡터 등 공지의 발현 벡터를 사용할 수 있으며, 백터는 DNA 재조합 기술을 이용한 임의의 공지된 방법에 따라 당업자가 용이하게 제조할 수 있다.
상기 벡터는 플라스미드 벡터 또는 바이러스 벡터일 수 있으며, 상기 바이러스 벡터는 구체적으로 아데노바이러스(Adenovirus), 아데노부속 바이러스(Adeno-associated virus), 렌티바이러스(Lentivirus), 레트로바이러스(Retrovirus) 벡터일 수 있으나, 이에 한정된 것은 아니다.
재조합 발현 벡터는 숙주세포에서 핵산의 발현에 적합한 형태로 핵산을 포함할 수 있으며, 이는 재조합 발현 벡터가 발현을 위해 사용되도록 즉, 발현될 핵산 서열에 작동 가능하게-연결되도록 숙주세포를 기반을 선택될 수 있는 하나 이상의 조절 요소를 포함함을 의미한다.
재조합 발현 벡터 내에서, "작동 가능하게 연결된"은 관심 뉴클레오티드 서열이 뉴클레오티드 서열의 발현을 허용하는 방식으로(예를 들어, 시험관내 전사/번역 시스템에서 또는 벡터가 숙주세포 내로 도입되는 경우 숙주세포에서) 조절 요소에 연결됨을 의미한다.
재조합 발현 벡터는 T7 promoter를 포함하여 메신저 RNA 합성에 적합한 형태를 포함할 수 있으며, 이는 기내에서 mRNA 합성을 할 수 있도록, 즉, T7 polymerase에 의해 메신저 RNA가 합성될 수 있는 하나 이상의 조절 요소를 포함함을 의미한다.
"조절 요소"는 프로모터, 인핸서, 내부 리보솜 진입 부위(IRES), 및 기타 발현 조정 요소(예를 들어, 전사 종결 신호 예컨대, 폴리아데닐화 신호 및 폴리-U 서열)을 포함할 수 있다. 조절 요소는 많은 유형의 숙주세포에서 뉴클레오티드 서열의 유도 또는 항상 발현을 지시하는 요소 및 특정 숙주세포에서만 뉴클레오티드 서열의 발현을 지시하는 요소(예를 들어, 조직-특이적 조절 서열)를 포함한다. 조직-특이적 프로모터는 요망되는 관심 조직 예컨대, 근육, 뉴런, 뼈, 피부, 혈액, 특정 기관(예를 들어, 간, 췌장), 또는 특정 세포 유형(예를 들어, 림프구)에서 주로 발현을 지시할 수 있다. 조절 요소는 또한 조직 또는 세포-유형 특이적일 수 있거나 아닐 수 있는 세포-주기 의존성 또는 발달 단계-의존적 방식과 같은 일시적-의존적 방식으로 발현을 지시할 수 있다.
경우에 따라서 벡터는 하나 이상의 pol III 프로모터, 하나 이상의 pol II 프로모터, 하나 이상의 pol I 프로모터, 또는 이들의 조합을 포함한다. pol III 프로모터의 예는 비제한적으로 U6 및 H1 프로모터를 포함한다. pol II 프로모터의 예는 비제한적으로, 레트로바이러스 라우스 육종 바이러스(RSV) LTR 프로모터(임의로 RSV 인핸서를 가짐), 사이토메갈로바이러스(CMV) 프로모터(선택적으로 CMV 인핸서를 가짐)(예를 들어, Boshart et al(1985) Cell 41:521-530), SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제(PGK) 프로모터 및 EF1α 프로모터를 포함한다.
"조절 요소"에는 인핸서 예를 들어, WPRE; CMV 인핸서; HTLV-I의 LTR에서 R-U5' 세그먼트; SV40 인핸서; 및 토끼 β-글로빈의 엑손 2 및 3 사이의 인트론 서열 등이 포함될 수 있다. 발현 벡터의 디자인은 형질전환될 숙주세포의 선택, 요망되는 발현 수준 등과 같은 인자에 좌우될 수 있음이 당업자에 의해 인식될 것이다. 벡터는 숙주세포 내로 도입되어 본원에 기재된 바와 같은 핵산에 의해 인코딩되는 융합 단백질 또는 펩티드를 포함하는 전사물, 단백질 또는 펩티드를 생성할 수 있다(예를 들어, 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR) 전사물, 단백질, 효소, 이의 돌연변이체, 이의 융합 단백질 등). 유익한 벡터는 렌티바이러스 및 아데노-관련 바이러스를 포함하고, 이러한 벡터의 유형은 또한 특정 유형의 세포를 표적화하기 위해 선택될 수 있다.
상기 벡터는 각각 국소주입법 (예컨대, 병변 또는 표적 부위 직접 주입), 전기천공법 (electroporation), 리포펙션, 바이러스 벡터, 나노파티클 (nanoparticles) 뿐만 아니라, PTD (Protein translocation domain) 융합 단백질 방법 등을 통해 생체 내 또는 세포 내로 전달될 수 있다.
상기 핵산은 리보핵산, 예를 들어 메신저 리보핵산 mRNA 형태로 주입하여 세포의 유전자 염기 교정, 예를 들어 동물세포 또는 식물세포에 제한없이 유전자 염기 교정이 가능하다.
본 발명에 따른 핵산은 mRNA 형태일 수 있고, mRNA 형태로 전달하는 경우 DNA를 이용한 벡터 형태로 전달하는 것에 비해, mRNA로의 전사 과정이 불필요하여 유전자 교정 개시가 빠를 수 있다. 일시적 단백질 발현 (transient protein expression) 가능성이 높다.
본 출원의 발명자들은 식물세포 소기관 유전자 교정을 위해 시토신 염기 교정기 (cytosine base editor)를 리보핵산, 예를 들어 메신저 리보핵산 형태로 식물 세포에 주입하였을 때 플라스미드로 전달하는 것에 비해 비표적 효과가 감소함을 확인하였다. 식물세포 소기관 유전자 교정에 있어 시토신 염기 교정기를 mRNA 형태로 식물세포에 형질전환 하였을 때, 플라스미드에 비해 비표적 효과에서 장점이 있음을 최초로 입증하였다.
상기 mRNA는 직접 전달되거나, 캐리어를 통해 전달될 수 있다. 경우에 따라서, 핵산절단효소 및/또는 절단인자의 mRNA를 화학변형 (chemical modification) 하거나, 합성 자기-복제 RNA (synthetic self-replicative RNA) 형태로 직접 전달할 수 있다.
세포로 mRNA를 전달하는 방법 또는 생체 내에서 mRNA를 인간, 동물과 같은 유기체의 세포로 전달하는 방법을 포함하여, 시험관 내 또는 생체 내에서 mRNA 분자를 세포로 전달할 수 있는 방법을 고려할 수 있다. 예를 들어, 지질(예를 들어, 리포좀, 마이셀 등)을 포함하거나, 나노파티클 또는 나노튜브를 포함하거나, 양이온성 화합물(예를 들어, 폴리에틸렌이민 또는 PEI)을 포함하거나, 양이온성 화합물(예를 들어, 폴리에틸렌이민 또는 PEI)을 포함하여, mRNA 분자를 세포로 전달할 수 있다. 경우에 따라서, mRNA를 세포로 전달하기 위해서 유전자 총 또는 바이오리스틱(biolistic) 입자 전달 시스템과 같은 볼리스틱 방법(bolistics method)을 사용할 수 있다.
상기 캐리어는 예를 들어, 세포 투과성 펩타이드(CPP), 나노입자, 또는 중합체를 포함할 수 있으나, 이에 제한되는 것은 아니다.
상기 CPP는 다양한 분자 카고(나노크기 입자로부터 작은 화학 분자 및 DNA의 큰 단편까지)의 세포 흡수를 용이하게 하는 짧은 펩타이드이다.
상기 나노입자와 관련하여, 본 발명에 따른 조성물은 고분자 나노입자, 금속 나노입자, 금속/무기 나노입자 또는 지질 나노입자를 통해 전달될 수 있다. 상기 고분자 나노입자는 예를 들어, 롤링 써클 증폭에 의해 합성된 DNA nanoclew, 실 유사 DNA 나노입자일 수 있다. DNA nanoclew, 실 유사 DNA 나노입자에 mRNA를 로딩하고, 엔도좀 탈출능을 향상시키기 위해 PEI를 코팅할 수 있다. 이러한 복합체가 세포막에 결합하여, 내재화된 다음 엔도좀 탈출을 통해 핵으로 이동하여, 전달되도록 할 수 있다.
상기 금속 나노입자와 관련하여, 금입자를 연결시키고 양이온성 엔도좀 탈출 폴리머 (endosomal disruptive polymer)와 복합체를 형성하여 세포에 전달할 수 있다. 상기 양이온성 엔도좀 탈출 폴리머 (endosomal disruptive polymer)는 예를 들어, polyethylene imine, poly(arginine), poly(lysine), poly(histidine), poly-[2-{(2-aminoethyl)amino}-ethyl-aspartamide] (pAsp(DET)), poly(ethylene glycol) (PEG)와 poly(arginine)의 block co-polymer, PEG와 poly(lysine)의 block co-polymer, 또는 PEG와 poly{N-[N-(2-aminoethyl)-2-aminoethyl]aspartamide} (PEG-pAsp(DET))의 block co-polymer일 수 있다.
상기 금속/무기 나노입자와 관련하여, 예를 들어 ZIF-8 (zeolitic imidazolate framework-8)를 통해 mRNA를 캡슐화할 수 있다.
경우에 따라서, 상기 mRNA는 음이온을 띠고(negatively charged), 양이온을 띠는(cationic) 물질들과 결합하여 나노입자 (nanoparticles)를 형성할 수 있고, 이는 세포로 수용체 매개 엔도사이토시스 (receptor-mediated endocytosis) 혹은 파고사이토시스 (phagocytosis) 등을 통해 침투할 수 있다.
양이온성 중합체로 폴리알릴아민 (PAH); 폴리에틸렌이민 (PEI); 폴리(L-리신) (PLL); 폴리(L-아르기닌) (PLA); 폴리비닐아민 단일- 또는 공중합체; 폴리(비닐벤질-트리-C1-C4-알킬암모늄염); 지방족 또는 방향지방족 디할로겐화물 및 지방족 N,N,N',N'-테트라-C1-C4-알킬-알킬렌디아민의 중합체; 폴리(비닐피리딘) 또는 폴리(비닐피리디늄염); 폴리(N,N-디알릴-N,N-디-C1-C4-알킬-암모늄할로겐화물); 4차화된 디-C1-C4-알킬-아미노에틸 아크릴레이트 또는 메타크릴레이트의 단일- 또는 공중합체; 폴리쿠아드(POLYQUAD)™; 폴리아미노아미드 등이 포함될 수 있다.
양이온성 지질로 양이온성 리포솜 제제를 포함할 수 있다. 리포솜의 지질 이중층은 캡슐화된 핵산을 분해로부터 보호하며, 핵산에 결합할 수 있는 항체에 의한 특이적 중화를 방지할 수 있다. 엔도좀 성숙 동안 엔도좀 멤브레인과 리포좀이 융합되어, 양이온성 지질-핵산절단효소의 효율적인 엔도좀 탈출이 가능하다. 양이온성 지질로 폴리에틸렌이민, 폴리아미도아민 (PAMAM) 성화 수지상체, 리포펙틴 (DOTMA와 DOPE의 조합), 리포펙타제, 리포펙타민(LIPOFECTAMINE)® (예컨대 리포펙타민® 2000, 리포펙타민® 3000, 리포펙타민® RNAiMAX, 리포펙타민® LTX), 세인트-레드(SAINT-RED) (시노볼룩스 세라퓨틱스(Synvolux Therapeutics)사, 네덜란드 그로닝겐 소재), DOPE, 시토펙틴 (길레드 사이언시즈(Gilead Sciences) 사, 캘리포니아 포스터 시티 소재), 및 유펙틴 (JBL사, 캘리포니아 산 루이스 오비스포 소재)가 포함될 수 있다. 대표적인 양이온성 리포솜은 N-[1-(2,3-디올레올옥시)-프로필]-N,N,N-트리메틸암모늄 클로라이드 (DOTMA), N-[1-(2,3-디올레올옥시)-프로필]-N,N,N-트리메틸암모늄 메틸술페이트 (DOTAP), 3β-[N-(N',N'-디메틸아미노에탄)카르바모일]콜레스테롤 (DC-Chol), 2,3-디올레일옥시-N-[2(스페르민카르복스아미도)에틸]-N,N-디메틸-1-프로판아미늄 트리플루오로아세테이트 (DOSPA), 1,2-디미리스틸옥시프로필-3-디메틸-히드록시에틸 암모늄 브로마이드; 또는 디메틸디옥타데실암모늄 브로마이드 (DDAB)으로부터 제조될 수 있다.
지질 나노입자와 관련하여, 캐리어로 리포좀을 이용하여 전달할 수 있다. 리포좀은 내부 수성 구획을 둘러싸는 단일 또는 다중 라멜라 지질 이중층 및 상대적으로 불투과성인 외측 친지성 인지질 이중층으로 구성된 구체 소낭 구조이다. 리포좀 제형은 주로 천연 인지질 및 지질, 예컨대 1,2-디스테아로릴-sn-글리세로-3-포스파티딜 콜린(DSPC), 스핑고미엘린, 포스파티딜콜린 또는 모노시알로강글리오사이드 등을 포함할 수 있다. 경우에 따라서, 혈장 내 불안정성을 해소하기 위하여, 지질막에 콜레스테롤 또는 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE)을 추가할 수 있다. 콜레스테롤의 첨가는 캡슐화된 생활성 화합물의 혈장 내로의 신속한 방출을 감소시키거나 또는 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE)은 안정성을 증가시킨다.
상기 조성물은 다음을 통해 식물세포에 전달될 수 있다:
Gene gun을 이용한 주입 (Bombardment);
PEG-매개 원형질체 형질감염 (Protoplast transfection, PEG-mediated);
전기천공에 의한 원형질체 형질감염 (Protoplast transfection, electroporation); 또는
미세주사에 의한 원형질체 주사 (Protoplast injection, microinjection).
본 발명에 따른 융합단백질을 코딩하는 폴리뉴클레오티드 서열은 RNA 서열, DNA 서열, 또는 이의 조합(RNA-DNA 조합 서열)일 수 있다.
상기 핵산은 다음을 통해 식물세포에 전달될 수 있다:
Agrobacterium, 예를 들어 Agrobacterium tumefaciens, Agrobacterium rhizogene 등을 이용한 형질전환
- binary vector,
- Viral vector: Geminivirus, tobacco rattle virus (TRV), tomato mosaic virus (ToMV), foxtail mosaic virus (FoMV), barley yellow striate mosaic virus (BYSMV), Sonchus yellow net rhabdovirus (SYNV) 등;
바이러스를 이용한 형질감염;
주입 (Bombardment, Gene gun);
PEG-매개 원형질체 형질감염 (Protoplast transfection, PEG-mediated);
전기천공에 의한 원형질체 형질감염 (Protoplast transfection, electroporation); 또는
미세주사에 의한 원형질체 주사 (Protoplast injection, microinjection).
상기 바이러스는 예를 들어, viral vector: Geminivirus, tobacco rattle virus (TRV), tomato mosaic virus (ToMV), foxtail mosaic virus (FoMV), barley yellow striate mosaic virus (BYSMV), Sonchus yellow net rhabdovirus (SYNV) 등을 예로 들 수 있다.
상기 벡터는 각각 국소주입법 (예컨대, 병변 또는 표적 부위 직접 주입), 전기천공법 (electroporation), 리포펙션, 바이러스 벡터, 나노파티클 (nanoparticles) 뿐만 아니라, PTD (Protein translocation domain) 융합 단백질 방법 등을 통해 세포내로 전달될 수 있다.
본 발명은 상기 조성물을 식물세포에 처리하는 단계를 포함하는 식물세포 소기관 DNA의 염기를 교정하는 방법에 관한 것이다.
본 발명은 상기 방법에 의해 GTTGAAAGC 서열을 포함하는 엽록체 psbA 유전자의 염기가 교정된, 아트라진 (Atrazine) 제초제 저항성 식물에 관한 것이다.
본 발명은 상기 방법에 의해 CGTCATCCTCA 서열을 포함하는 16s rRNA의 염기가 교정된 스펙티노마이신 (Spectinomycine) 저항성 식물에 관한 것이다.
본 발명은 상기 방법에 의해 atp6 유전자의 염기가 교정된 식물에 관한 것이다.
본 발명은 상기 방법에 의해 ATG를 포함하는 psaA 유전자의 염기가 교정된 알비노 표현형을 가지는 식물에 관한 것이다.
엽록체 DNA 중 psbA의 295번재 아미노산인 페닐알라닌 (Phenylalanine)을 세린 (Serine)으로 염기교정함으로 제초제 중 하나인 아트라진 (Atrazine)에 저항성을 가지는 식물을 개발할 수 있다. 엽록체의 psbA뿐 아니라 16s rRNA, psaA의 염기 교정을 통해 스펙티노마이신 (Spectinomycine) 저항성 식물, 알비노 형태의 식물을 개발할 수 있다.
광합성에 관여하는 rbcL (Rubisco large subunit) 유전자의 염기 교정이 가능 함으로 광합성 효율을 조절하여 식물의 생산량 증대 또는 이산화탄소 흡수의 효율이 높은 식물체 제작을 기대 할 수 있다.
본 발명은 상기 방법에 의해 엽록체 루비스코 (rubisco: ribulose bisphosphate carboxylase) 코딩 유전자의 염기가 교정된 식물에 관한 것이다. 광합성에 관여하는 루비스코 라지 유닛 (rubisco Large unit)의 염기 교정이 가능 함으로 광합성 효율을 조절하여 식물의 생산량 증대를 기대할 수 있다.
엽록체의 염기서열은 식물 간 상동관계 (homology)가 높아, 본 발명에 사용한 양상추 (Lactuca sativa cv. Cheongchima) 뿐만 아니라 벼, 밀, 감자, 토마토 등의 식물도 아트라진 (Atrazine)에 저항성을 가지는 식물을 개발할 수 있다.
상추 원형질체 (Lettuce protoplast)에 플라스미드를 전달하여 7일 후 미토콘드리아 DNA의 atp6 유전자 내 타겟에서 아데닌 염기 교정되었음을 확인하였다.
실시예
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지는 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예 1.
아그로박테리움 (agrobacterium)을 이용한 형질전환 식물 제작을 위한 DNA 클로닝 (cloning) 모식도를 도 1에 나타내었다. 염기서열이 반복되는 TALE 쌍을 하나의 벡터에 클로닝하기 위해 Aat II, Pme I site의 위치가 다른 벡터에 RPS5A promoter-PTP-3xFlag-Left TALE-1397N와 RPS5A promoter-PTP-3xFlag-Right TALE-1397C-ABE8.0을 각각 클로닝 하였다. 두개의 플라스미드 (plasmid)를 각각 Aat II, Pme I으로 digestion 후 Left TALE이 있는 플라스미드에 RPS5A promoter-PTP-3xFlag-Right TALE-1397C-ABE8.0-35S terminator를 ligation하여 하나의 플라스미드에 모두 클로닝 하였다. 위의 도 1은 모식도 일 뿐이고, Left TALE에 1397C-ABE8.0을, Right TALE에 1397N을 클로닝 할 수 있다.
아그로박테리움을 이용한 형질 전환을 통해, 애기 장대의 엽록체에 있는 psaA, rbcL과 rrn16S 유전자를 타겟하는 1세대 형질전환체를 각각 20개, 6개, 그리고 37개의 식물체를 확보하였다. psaA유전자를 타겟하는 형질전화체 식물. a, 각 식물체의 염기 교정 효율과 위치. b, 식물의 표현형. c, DNA염기교정으로 인한 아미노산 염기 서열의 변화를 도 2에 나타내었다. 도 2의 a에 따르면 염기서열 표시 중 C-12, C-11, C2 (표기는 G2로 되어 있음)이 교정되는 것을 확인할 수 있다.
rbcL 유전자를 타겟하는 형질전화체 식물. a, 각 식물체의 염기 교정 효율과 위치. b, DNA염기교정으로 인한 아미노산 염기 서열의 변화를 도 3에 나타내었다.
rrn16S 유전자를 타겟하는 형질전환 식물의 염기 교정 효율과 위치를 도 4에 나타내었다.
애기 장대의 엽록체에 있는 psaA, rbcL과 rrn16S 유전자를 타겟 하는 1세대 형질전환체의 염기 교정 효율과 표현형. a, psaA #1, 2, 3의 염기 교정 효율과 위치를 나타내었다. 아데닌의 염기 교정뿐 아니라 시토신의 염기 교정이 동시에 일어난다. b, psaA #3의 표현형으로 green, chimeric, pale green의 형질을 나타낼 수 있다. c, rbcL #1, 2의 염기 교정 효율, 위치와 표현형. d, rrn16S 유전자를 타겟 하는 1세대 형질전환체의 염기 교정 효율을 도 5에 나타내었다.
도 4의 C-2, 도 5의 a, d도 각각 C2, C-2가 교정되는 것을 확인할 수 있다.
도 6에 따르면, 형질전환 2세대 식물의 염기 교정 효율과 표현형을 나타내었다. psaA #3의 형질전환 2세대의 표현형과 (a), 염기 교정 효율과 위치 (b). Spectinomycin에 저항성을 가지는 rrn16S 형질전환 2세대의 표현형 (c)과 염기 교정 효율과 위치 (d). e, 형질전환 식물에 도입된 외부 유전자의 유무를 PCR로 확인한 결과 rrn16S #9-1, 3은 외부 유전자가 없는 것을 확인하였다.
도 6은 엽록체 염기 교정이 다음 세대로 전달되는 것을 확인한 것이고, b의 경우 A to G, C to T 염기 교정이 다음 세대로 같이 전달되는 것을 확인한 것이다.
이를 토대로 식물에서는 동물에서와 다르게 A to G 염기 교정과 C to T 염기 교정이 같이 일어나는 것을 확인하였다.
rrn16S 형질전환 2세대 식물 중 스펙티노마이신 (Spectinomycin)에 저항성과 민감성을 가지는 식물의 염기 교정 위치와 효율을 도 7에 나타내었다.
도 8에 따르면, psaA #1 (a), psaA #3 chimeric (b), psaA #3 pale green (c), rrn16s #1 (d), 6 (e)과 야생형 Col-0 (f) 의 엽록체 전장 유전체 분석을 통한 표적 외 염기 변이. 야생형과 비교했을 때 형질전환 식물에서 뚜렷한 표적 외 염기 변이가 관찰되지 않았다.
도 9에 따르면 상추 미토콘드리아 유전자 atp6의 염기교정을 효율을 나타내었다. 상추 원형질체 (Lettuce protoplast)에 PcUBi promoter-MTS-3xFlag-Left TALE-1397N-Pea3A terminator, PcUBi promoter-MTS-3xFlag-Right TALE-1397C-ABE8.0-Pea3A terminator과 PcUBi promoter-MTS-3xFlag-Left TALE-1397C-ABE8.0-Pea3A terminator, PcUBi promoter-MTS-3xFlag-Right TALE-1397N-Pea3A terminator을 각각 15ug 씩 총 30ug을 전달하여 7일 후 아데닌 염기 교정 효율을 측정하였고, A6 0.99%, A9 1.12%의 염기 교정 효율을 나타내었다.
실시예 중 사용된 각 구성에 대한 서열은 다음과 같다.
식물세포 소기관 DNA의 염기 교정은 DddAtox를 이용한 시토신을 티민으로 디아미네이션 (deamination)하는 염기 교정만 존재하였다. 이번 발명으로 아데닌을 구아닌으로 염기 교정함으로 소 기관 DNA 염기 교정의 범위가 넓어졌다. A to G 염기 교정과 C to T 염기 교정이 같이 일어날 수 있다.
이상으로 본 발명의 내용의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서, 이러한 구체적 기술은 단지 바람직한 실시양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의하여 정의된다고 할 것이다.
전자파일 첨부하였음.
Claims (18)
- 다음을 포함하는 식물세포 소기관 DNA의 염기 교정용 조성물로,DNA 결합 단백질 또는 이를 코딩하는 핵산;시토신 탈아미노효소 (deaminase) 또는 시토신 탈아미노효소 유래의 제1분할체 및 제2분할체 또는 이를 코딩하는 핵산; 및아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 포함하고,상기 제1분할체 및 제2분할체는 각각 상기 DNA 결합 단백질에 결합되며,상기 식물세포 소기관 DNA의 아데닌을 구아닌으로, 시토신을 티민으로 동시에 교정하는 것을 특징으로 하는 조성물.
- 제1항에 있어서, 상기 제1분할체와 제2분할체 각각은 시토신 탈아미노효소 활성이 없는 것을 특징으로 하는, 조성물.
- 제1항에 있어서 상기 시토신 탈아미노효소는 이중 가닥 DNA에 작용하는 탈아미노효소 (DddA) 또는 이의 오솔로그 (orthologue)에서 유래된 것을 특징으로 하는 조성물.
- 제1항에 있어서, 상기 제1분할체는 서열번호 1의 서열 중 N 말단에서 G33, G44, A54, N68, G82, N98, G108로 구성된 군에서 선택되는 하나 이상까지의 서열을 포함하는 조성물.
- 제1항에 있어서, 상기 제2분할체는 서열번호 1의 서열 중 G34, P45, G55, N69, T83, A99, A109로 구성된 군에서 선택되는 하나 이상에서 C-말단까지의 서열을 포함하는 조성물.
- 제1항에 있어서, 상기 DNA 결합 단백질은 ZF 단백질 (zinc-finger protein), 또는 TALE 어레이 (transcription activator-like effector array)인 조성물.
- 제1항에 있어서, 상기 DNA 결합 단백질은 2 내지 40개 아미노산 잔기를 포함하는 펩타이드 링커를 통해 연결되는 것을 특징으로 하는 조성물.
- 제7항에 있어서, 상기 링커는 다음을 포함하는 조성물:2a.a 링커: GS5a.a 링커: TGEKQ10a.a 링커: SGAQGSTLDF16a.a 링커: SGSETPGTSESATPES;24 a.a 링커: SGTPHEVGVYTLSGTPHEVGVYTL; 또는32a.a 링커: GSGGSSGGSSGSETPGTSESATPESSGGSSGGS.
- 제1항에 있어서, 상기 DNA 결합 단백질은 징크 핑거 단백질이고, 상기 제1분할체 및 제2분할체 각각은 상기 징크 핑거 단백질의 N-말단 또는 C-말단에 결합되어 있는 형태인 조성물.
- 제1항에 있어서, 상기 DNA 결합 단백질은 TALE array이고 단일 TALE 어레이 (array)가 분할체의 일 말단에 결합 또는 제 1 TALE 어레이 및 제 2 TALE 어레이가 제1분할체 및 제2분할체에 결합된 형태인 조성물.
- 제1항에 있어서, 상기 아데닌 탈아미노효소는 DNA 결합 단백질 또는 시토신 탈아미노효소의 N 또는 C 말단에 결합된 조성물.
- 제1항에 있어서, 상기 아데닌 탈아미노효소는 TadA 유래 디옥시아데닌 탈아미노효소인 조성물.
- 제1항에 있어서, 엽록체 전달 펩타이드(chloroplast transit peptide) 또는 이를 코딩하는 핵산을 포함하는 조성물.
- 제1항에 있어서, 미토콘드리아 전달 단백질 (Mitochondrial Targeting Signal, MTS) 또는 이를 코딩하는 핵산을 포함하는 조성물.
- 제1항에 있어서, UGI(uracil DNA-glycosylase inhibitor)를 포함하지 않는 조성물.
- 제1항에 있어서, 다음을 통해 식물세포에 전달되는 것을 특징으로 하는 조성물:진건 (Gene gun)을 이용한 주입 (Bombardment);PEG-매개 원형질체 형질감염 (Protoplast transfection, PEG-mediated);전기천공에 의한 원형질체 형질감염 (Protoplast transfection, electroporation); 또는미세주사에 의한 원형질체 주사 (Protoplast injection, microinjection).
- 제1항에 있어서, 상기 핵산은 다음을 통해 식물세포에 전달되는 것을 특징으로 하는 조성물:Agrobacterium tumefaciens 또는 Agrobacterium rhizogene의 아그로박테리움을 이용한 형질전환;바이러스 형질감염;진건 (Gene gun)을 이용한 주입 (Bombardment);PEG-매개 원형질체 형질감염 (Protoplast transfection, PEG-mediated);전기천공에 의한 원형질체 형질감염 (Protoplast transfection, electroporation); 또는미세주사에 의한 원형질체 주사 (Protoplast injection, microinjection).
- 제1항 내지 제17항 중 어느 한 항의 조성물을 식물세포에 처리하는 단계를 포함하는 식물세포 소기관 DNA의 염기 교정방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20220119363 | 2022-09-21 | ||
KR10-2022-0119363 | 2022-09-21 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2024063538A1 true WO2024063538A1 (ko) | 2024-03-28 |
Family
ID=90454985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2023/014300 WO2024063538A1 (ko) | 2022-09-21 | 2023-09-20 | 식물세포 소기관 dna의 염기 교정 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20240041835A (ko) |
WO (1) | WO2024063538A1 (ko) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190025565A (ko) * | 2016-06-02 | 2019-03-11 | 시그마-알드리치 컴퍼니., 엘엘씨 | 프로그램가능한 dna 결합 단백질을 사용한, 표적화된 게놈 변형의 개선 |
KR20190034628A (ko) * | 2016-08-03 | 2019-04-02 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 아데노신 핵염기 편집제 및 그의 용도 |
KR20190044157A (ko) * | 2017-10-20 | 2019-04-30 | 경상대학교산학협력단 | 아데닌 또는 아데노신 탈아미노효소를 유효성분으로 포함하는 단일 염기 편집용 조성물 및 이의 용도 |
KR20210049124A (ko) * | 2018-08-23 | 2021-05-04 | 상가모 테라퓨틱스, 인코포레이티드 | 조작된 표적 특이적 염기 편집기 |
WO2022060185A1 (ko) * | 2020-09-18 | 2022-03-24 | 기초과학연구원 | 표적화된 탈아미노효소 및 이를 이용한 염기 교정 |
-
2023
- 2023-09-20 KR KR1020230125717A patent/KR20240041835A/ko unknown
- 2023-09-20 WO PCT/KR2023/014300 patent/WO2024063538A1/ko unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190025565A (ko) * | 2016-06-02 | 2019-03-11 | 시그마-알드리치 컴퍼니., 엘엘씨 | 프로그램가능한 dna 결합 단백질을 사용한, 표적화된 게놈 변형의 개선 |
KR20190034628A (ko) * | 2016-08-03 | 2019-04-02 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 아데노신 핵염기 편집제 및 그의 용도 |
KR20190044157A (ko) * | 2017-10-20 | 2019-04-30 | 경상대학교산학협력단 | 아데닌 또는 아데노신 탈아미노효소를 유효성분으로 포함하는 단일 염기 편집용 조성물 및 이의 용도 |
KR20210049124A (ko) * | 2018-08-23 | 2021-05-04 | 상가모 테라퓨틱스, 인코포레이티드 | 조작된 표적 특이적 염기 편집기 |
WO2022060185A1 (ko) * | 2020-09-18 | 2022-03-24 | 기초과학연구원 | 표적화된 탈아미노효소 및 이를 이용한 염기 교정 |
Also Published As
Publication number | Publication date |
---|---|
KR20240041835A (ko) | 2024-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220170013A1 (en) | T:a to a:t base editing through adenosine methylation | |
EP3365356B1 (en) | Nucleobase editors and uses thereof | |
WO2019103442A2 (ko) | CRISPR/Cpf1 시스템을 이용한 유전체 편집용 조성물 및 이의 용도 | |
US20200140842A1 (en) | Bipartite base editor (bbe) architectures and type-ii-c-cas9 zinc finger editing | |
WO2019042284A1 (en) | FUSION PROTEINS FOR ENHANCED PRECISION IN THE BASIC EDITION | |
US20180265859A1 (en) | Modification of the dystrophin gene and uses thereof | |
WO2022060185A1 (ko) | 표적화된 탈아미노효소 및 이를 이용한 염기 교정 | |
WO2016021973A1 (ko) | 캄필로박터 제주니 crispr/cas 시스템 유래 rgen을 이용한 유전체 교정 | |
US20150166981A1 (en) | Methods for nucleic acid editing | |
JP2020516255A (ja) | ゲノム編集のためのシステム及び方法 | |
KR20190005801A (ko) | 표적 특이적 crispr 변이체 | |
WO2018156824A1 (en) | Methods of genetic modification of a cell | |
WO2023182858A1 (ko) | 식물세포 소기관 dna의 아데닌을 구아닌으로 염기 교정하는 방법 | |
Bancroft et al. | Characterization of an insertion sequence (IS891) of novel structure from the cyanobacterium Anabaena sp. strain M-131 | |
WO2018231018A2 (ko) | 간에서 목적하는 단백질 발현하기 위한 플랫폼 | |
IL301139A (en) | Enzymes from secondary DNA and active fragments and their variants and methods of use | |
EP4180460A1 (en) | System and method for editing nucleic acid | |
JP2022512868A (ja) | C2c1ヌクレアーゼに基づくゲノム編集のためのシステムおよび方法 | |
WO2024063538A1 (ko) | 식물세포 소기관 dna의 염기 교정 | |
WO2021215827A1 (ko) | Cas9 또는 cas9 변이체를 이용한 유전체 교정 | |
WO2021125840A1 (ko) | Cpf1 및 키메릭 dna-rna 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물 | |
KR20180128864A (ko) | 매칭된 5' 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법 | |
WO2024085674A1 (ko) | Cas 단백질 및 박테리아 톡신을 포함하는 융합 단백질 및 이의 용도 | |
WO2023008887A1 (ko) | 염기 편집기 및 이의 용도 | |
WO2024063273A1 (en) | Novel adenine deaminase variants and a method for base editing using the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 23868590 Country of ref document: EP Kind code of ref document: A1 |