KR20200004382A - 전이유전자성 마커 서열을 이용하지 않는 세포 단리 방법 - Google Patents
전이유전자성 마커 서열을 이용하지 않는 세포 단리 방법 Download PDFInfo
- Publication number
- KR20200004382A KR20200004382A KR1020197036090A KR20197036090A KR20200004382A KR 20200004382 A KR20200004382 A KR 20200004382A KR 1020197036090 A KR1020197036090 A KR 1020197036090A KR 20197036090 A KR20197036090 A KR 20197036090A KR 20200004382 A KR20200004382 A KR 20200004382A
- Authority
- KR
- South Korea
- Prior art keywords
- plant
- targeted
- tolerance
- modified
- site
- Prior art date
Links
- 239000003550 marker Substances 0.000 title claims abstract description 84
- 108700019146 Transgenes Proteins 0.000 title claims abstract description 42
- 238000002955 isolation Methods 0.000 title claims description 4
- 238000000034 method Methods 0.000 claims abstract description 228
- 239000000126 substance Substances 0.000 claims abstract description 23
- 241000196324 Embryophyta Species 0.000 claims description 632
- 210000004027 cell Anatomy 0.000 claims description 342
- 238000012986 modification Methods 0.000 claims description 330
- 230000004048 modification Effects 0.000 claims description 330
- 108090000623 proteins and genes Proteins 0.000 claims description 236
- 101710163270 Nuclease Proteins 0.000 claims description 133
- 210000001519 tissue Anatomy 0.000 claims description 126
- 150000007523 nucleic acids Chemical group 0.000 claims description 112
- 108020004414 DNA Proteins 0.000 claims description 107
- 239000012636 effector Substances 0.000 claims description 100
- 108091033409 CRISPR Proteins 0.000 claims description 99
- 239000003112 inhibitor Substances 0.000 claims description 96
- 239000004009 herbicide Substances 0.000 claims description 83
- 210000000056 organ Anatomy 0.000 claims description 80
- 125000003729 nucleotide group Chemical group 0.000 claims description 78
- 230000035772 mutation Effects 0.000 claims description 77
- 239000002773 nucleotide Substances 0.000 claims description 77
- 102000039446 nucleic acids Human genes 0.000 claims description 73
- 108020004707 nucleic acids Proteins 0.000 claims description 73
- 239000000463 material Substances 0.000 claims description 64
- 230000002363 herbicidal effect Effects 0.000 claims description 60
- 238000012216 screening Methods 0.000 claims description 57
- 230000014509 gene expression Effects 0.000 claims description 55
- 238000010362 genome editing Methods 0.000 claims description 55
- 238000012217 deletion Methods 0.000 claims description 51
- 230000037430 deletion Effects 0.000 claims description 51
- 230000009466 transformation Effects 0.000 claims description 49
- 108020004705 Codon Proteins 0.000 claims description 44
- 239000012634 fragment Substances 0.000 claims description 42
- 230000008685 targeting Effects 0.000 claims description 41
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 38
- 150000001413 amino acids Chemical class 0.000 claims description 37
- 150000001875 compounds Chemical class 0.000 claims description 37
- 238000006467 substitution reaction Methods 0.000 claims description 33
- 230000015572 biosynthetic process Effects 0.000 claims description 32
- 230000004568 DNA-binding Effects 0.000 claims description 29
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 29
- 230000008439 repair process Effects 0.000 claims description 25
- 230000009261 transgenic effect Effects 0.000 claims description 25
- 244000098338 Triticum aestivum Species 0.000 claims description 23
- 230000012010 growth Effects 0.000 claims description 22
- 230000030589 organelle localization Effects 0.000 claims description 22
- 241000234282 Allium Species 0.000 claims description 21
- 108010031325 Cytidine deaminase Proteins 0.000 claims description 21
- 102100026846 Cytidine deaminase Human genes 0.000 claims description 21
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 21
- 241000219194 Arabidopsis Species 0.000 claims description 19
- 230000008901 benefit Effects 0.000 claims description 17
- 235000021466 carotenoid Nutrition 0.000 claims description 17
- 241000610258 Arabidopsis lyrata Species 0.000 claims description 16
- 235000021533 Beta vulgaris Nutrition 0.000 claims description 16
- 241000335053 Beta vulgaris Species 0.000 claims description 16
- 241000490499 Cardamine Species 0.000 claims description 16
- 241000209219 Hordeum Species 0.000 claims description 16
- 235000014787 Vitis vinifera Nutrition 0.000 claims description 16
- 240000006365 Vitis vinifera Species 0.000 claims description 16
- 235000002532 grape seed extract Nutrition 0.000 claims description 16
- 241000208125 Nicotiana Species 0.000 claims description 15
- 102000018120 Recombinases Human genes 0.000 claims description 15
- 108010091086 Recombinases Proteins 0.000 claims description 15
- 150000001747 carotenoids Chemical class 0.000 claims description 15
- 231100000208 phytotoxic Toxicity 0.000 claims description 15
- 230000000885 phytotoxic effect Effects 0.000 claims description 15
- 241001520750 Arabidopsis arenosa Species 0.000 claims description 14
- 241000219195 Arabidopsis thaliana Species 0.000 claims description 14
- 240000008067 Cucumis sativus Species 0.000 claims description 14
- 241001441858 Genlisea aurea Species 0.000 claims description 14
- 235000006508 Nelumbo nucifera Nutrition 0.000 claims description 14
- 240000002853 Nelumbo nucifera Species 0.000 claims description 14
- 235000006510 Nelumbo pentapetala Nutrition 0.000 claims description 14
- 244000184734 Pyrus japonica Species 0.000 claims description 14
- 229940100389 Sulfonylurea Drugs 0.000 claims description 14
- 230000037433 frameshift Effects 0.000 claims description 14
- 238000003786 synthesis reaction Methods 0.000 claims description 14
- 235000011303 Brassica alboglabra Nutrition 0.000 claims description 13
- 240000007124 Brassica oleracea Species 0.000 claims description 13
- 235000011302 Brassica oleracea Nutrition 0.000 claims description 13
- 230000007018 DNA scission Effects 0.000 claims description 13
- 150000002632 lipids Chemical class 0.000 claims description 13
- 235000013830 Eruca Nutrition 0.000 claims description 12
- 241000801434 Eruca Species 0.000 claims description 12
- -1 LbCpf1 Proteins 0.000 claims description 12
- 210000003763 chloroplast Anatomy 0.000 claims description 12
- 230000010354 integration Effects 0.000 claims description 12
- 238000000844 transformation Methods 0.000 claims description 12
- 244000061176 Nicotiana tabacum Species 0.000 claims description 11
- 241000209051 Saccharum Species 0.000 claims description 11
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 claims description 11
- 235000021307 Triticum Nutrition 0.000 claims description 11
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 10
- 241000209149 Zea Species 0.000 claims description 10
- 239000003795 chemical substances by application Substances 0.000 claims description 10
- 238000013519 translation Methods 0.000 claims description 10
- 102000008682 Argonaute Proteins Human genes 0.000 claims description 9
- 108010088141 Argonaute Proteins Proteins 0.000 claims description 9
- 235000011331 Brassica Nutrition 0.000 claims description 9
- 241000219198 Brassica Species 0.000 claims description 9
- 240000002791 Brassica napus Species 0.000 claims description 9
- 235000011291 Brassica nigra Nutrition 0.000 claims description 9
- 244000180419 Brassica nigra Species 0.000 claims description 9
- 240000008100 Brassica rapa Species 0.000 claims description 9
- 241001233195 Eucalyptus grandis Species 0.000 claims description 9
- 235000010469 Glycine max Nutrition 0.000 claims description 9
- 244000068988 Glycine max Species 0.000 claims description 9
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 9
- 244000020551 Helianthus annuus Species 0.000 claims description 9
- 241000209229 Hordeum marinum Species 0.000 claims description 9
- 240000005979 Hordeum vulgare Species 0.000 claims description 9
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 9
- 244000081841 Malus domestica Species 0.000 claims description 9
- 235000011430 Malus pumila Nutrition 0.000 claims description 9
- 235000007238 Secale cereale Nutrition 0.000 claims description 9
- 244000082988 Secale cereale Species 0.000 claims description 9
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 9
- 244000061456 Solanum tuberosum Species 0.000 claims description 9
- 240000006394 Sorghum bicolor Species 0.000 claims description 9
- 235000007264 Triticum durum Nutrition 0.000 claims description 9
- 241000209143 Triticum turgidum subsp. durum Species 0.000 claims description 9
- 230000032258 transport Effects 0.000 claims description 9
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 claims description 8
- 241001522110 Aegilops tauschii Species 0.000 claims description 8
- 241000490494 Arabis Species 0.000 claims description 8
- 241000213948 Astragalus sinicus Species 0.000 claims description 8
- 241000743776 Brachypodium distachyon Species 0.000 claims description 8
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 claims description 8
- 235000011305 Capsella bursa pastoris Nutrition 0.000 claims description 8
- 240000008867 Capsella bursa-pastoris Species 0.000 claims description 8
- 240000002319 Citrus sinensis Species 0.000 claims description 8
- 235000005976 Citrus sinensis Nutrition 0.000 claims description 8
- 241000607074 Crucihimalaya himalaica Species 0.000 claims description 8
- 241001310865 Crucihimalaya wallichii Species 0.000 claims description 8
- 235000009849 Cucumis sativus Nutrition 0.000 claims description 8
- 244000000626 Daucus carota Species 0.000 claims description 8
- 235000002767 Daucus carota Nutrition 0.000 claims description 8
- 235000002196 Daucus pusillus Nutrition 0.000 claims description 8
- 240000007190 Daucus pusillus Species 0.000 claims description 8
- 235000003230 Helianthus tuberosus Nutrition 0.000 claims description 8
- 240000008892 Helianthus tuberosus Species 0.000 claims description 8
- 241001048891 Jatropha curcas Species 0.000 claims description 8
- 241000208136 Nicotiana sylvestris Species 0.000 claims description 8
- 241000511006 Oryza alta Species 0.000 claims description 8
- 241000209103 Oryza australiensis Species 0.000 claims description 8
- 240000000125 Oryza minuta Species 0.000 claims description 8
- 244000088415 Raphanus sativus Species 0.000 claims description 8
- 240000003768 Solanum lycopersicum Species 0.000 claims description 8
- 235000002560 Solanum lycopersicum Nutrition 0.000 claims description 8
- 235000007230 Sorghum bicolor Nutrition 0.000 claims description 8
- 238000010459 TALEN Methods 0.000 claims description 8
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims description 8
- 235000019714 Triticale Nutrition 0.000 claims description 8
- 108010017070 Zinc Finger Nucleases Proteins 0.000 claims description 8
- 235000011655 cotton Nutrition 0.000 claims description 8
- 230000006378 damage Effects 0.000 claims description 8
- 241000228158 x Triticosecale Species 0.000 claims description 8
- 239000005631 2,4-Dichlorophenoxyacetic acid Substances 0.000 claims description 7
- 235000005255 Allium cepa Nutrition 0.000 claims description 7
- 244000291564 Allium cepa Species 0.000 claims description 7
- 235000008553 Allium fistulosum Nutrition 0.000 claims description 7
- 244000257727 Allium fistulosum Species 0.000 claims description 7
- 240000002234 Allium sativum Species 0.000 claims description 7
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 claims description 7
- 241000446614 Cajanus cajanifolius Species 0.000 claims description 7
- 241000637848 Cajanus scarabaeoides Species 0.000 claims description 7
- 241000769888 Canephora <angiosperm> Species 0.000 claims description 7
- 235000014546 Cicer bijugum Nutrition 0.000 claims description 7
- 241000296403 Cicer bijugum Species 0.000 claims description 7
- 235000011692 Cicer judaicum Nutrition 0.000 claims description 7
- 241000319340 Cicer judaicum Species 0.000 claims description 7
- 235000014515 Cicer reticulatum Nutrition 0.000 claims description 7
- 241000296404 Cicer reticulatum Species 0.000 claims description 7
- 235000011690 Cicer yamashitae Nutrition 0.000 claims description 7
- 241000319339 Cicer yamashitae Species 0.000 claims description 7
- 241000723377 Coffea Species 0.000 claims description 7
- 239000005504 Dicamba Substances 0.000 claims description 7
- 239000005561 Glufosinate Substances 0.000 claims description 7
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 7
- 244000046052 Phaseolus vulgaris Species 0.000 claims description 7
- 235000005775 Setaria Nutrition 0.000 claims description 7
- 241000232088 Setaria <nematode> Species 0.000 claims description 7
- 244000201702 Torenia fournieri Species 0.000 claims description 7
- 239000001913 cellulose Substances 0.000 claims description 7
- 229920002678 cellulose Polymers 0.000 claims description 7
- IWEDIXLBFLAXBO-UHFFFAOYSA-N dicamba Chemical compound COC1=C(Cl)C=CC(Cl)=C1C(O)=O IWEDIXLBFLAXBO-UHFFFAOYSA-N 0.000 claims description 7
- 235000004611 garlic Nutrition 0.000 claims description 7
- MTNDZQHUAFNZQY-UHFFFAOYSA-N imidazoline Chemical compound C1CN=CN1 MTNDZQHUAFNZQY-UHFFFAOYSA-N 0.000 claims description 7
- 230000005764 inhibitory process Effects 0.000 claims description 7
- 229930000184 phytotoxin Natural products 0.000 claims description 7
- JYEUMXHLPRZUAT-UHFFFAOYSA-N 1,2,3-triazine Chemical compound C1=CN=NN=C1 JYEUMXHLPRZUAT-UHFFFAOYSA-N 0.000 claims description 6
- QMNWYGTWTXOQTP-UHFFFAOYSA-N 1h-triazin-6-one Chemical compound O=C1C=CN=NN1 QMNWYGTWTXOQTP-UHFFFAOYSA-N 0.000 claims description 6
- 241000482638 Amaranthus tuberculatus Species 0.000 claims description 6
- 229930192334 Auxin Natural products 0.000 claims description 6
- 238000010446 CRISPR interference Methods 0.000 claims description 6
- KXDHJXZQYSOELW-UHFFFAOYSA-M Carbamate Chemical compound NC([O-])=O KXDHJXZQYSOELW-UHFFFAOYSA-M 0.000 claims description 6
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 claims description 6
- 101710150423 DNA nickase Proteins 0.000 claims description 6
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 claims description 6
- 241000220225 Malus Species 0.000 claims description 6
- 102000029749 Microtubule Human genes 0.000 claims description 6
- 108091022875 Microtubule Proteins 0.000 claims description 6
- 101710147059 Nicking endonuclease Proteins 0.000 claims description 6
- 241000218976 Populus trichocarpa Species 0.000 claims description 6
- 240000005498 Setaria italica Species 0.000 claims description 6
- 235000007226 Setaria italica Nutrition 0.000 claims description 6
- 239000002363 auxin Substances 0.000 claims description 6
- 230000001851 biosynthetic effect Effects 0.000 claims description 6
- 230000032823 cell division Effects 0.000 claims description 6
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 6
- 150000004668 long chain fatty acids Chemical class 0.000 claims description 6
- 210000004688 microtubule Anatomy 0.000 claims description 6
- 230000026326 mitochondrial transport Effects 0.000 claims description 6
- HXKWSTRRCHTUEC-UHFFFAOYSA-N 2,4-Dichlorophenoxyaceticacid Chemical compound OC(=O)C(Cl)OC1=CC=C(Cl)C=C1 HXKWSTRRCHTUEC-UHFFFAOYSA-N 0.000 claims description 5
- 241000743774 Brachypodium Species 0.000 claims description 5
- 235000010523 Cicer arietinum Nutrition 0.000 claims description 5
- 244000045195 Cicer arietinum Species 0.000 claims description 5
- 244000182213 Lepidium virginicum Species 0.000 claims description 5
- 235000003611 Lepidium virginicum Nutrition 0.000 claims description 5
- 241000219823 Medicago Species 0.000 claims description 5
- 239000003153 chemical reaction reagent Substances 0.000 claims description 5
- 210000005061 intracellular organelle Anatomy 0.000 claims description 5
- YVLPJIGOMTXXLP-UHFFFAOYSA-N 15-cis-phytoene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC(C)=CC=CC=C(C)CCC=C(C)CCC=C(C)CCC=C(C)C YVLPJIGOMTXXLP-UHFFFAOYSA-N 0.000 claims description 4
- 241000208175 Daucus Species 0.000 claims description 4
- 241001050326 Daucus glochidiatus Species 0.000 claims description 4
- 241001337281 Daucus muricatus Species 0.000 claims description 4
- 206010027476 Metastases Diseases 0.000 claims description 4
- 108010081996 Photosystem I Protein Complex Proteins 0.000 claims description 4
- 235000019057 Raphanus caudatus Nutrition 0.000 claims description 4
- 235000011380 Raphanus sativus Nutrition 0.000 claims description 4
- 241000916757 Tuberculatus Species 0.000 claims description 4
- 230000013020 embryo development Effects 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 claims description 4
- 108010001545 phytoene dehydrogenase Proteins 0.000 claims description 4
- 239000000049 pigment Substances 0.000 claims description 4
- 241000219318 Amaranthus Species 0.000 claims description 3
- 230000008836 DNA modification Effects 0.000 claims description 3
- 108010028143 Dioxygenases Proteins 0.000 claims description 3
- 102000016680 Dioxygenases Human genes 0.000 claims description 3
- 241000801118 Lepidium Species 0.000 claims description 3
- 241000219828 Medicago truncatula Species 0.000 claims description 3
- 241000208138 Nicotiana tomentosiformis Species 0.000 claims description 3
- 241000219000 Populus Species 0.000 claims description 3
- 230000001172 regenerating effect Effects 0.000 claims description 3
- YVLPJIGOMTXXLP-UUKUAVTLSA-N 15,15'-cis-Phytoene Natural products C(=C\C=C/C=C(\CC/C=C(\CC/C=C(\CC/C=C(\C)/C)/C)/C)/C)(\CC/C=C(\CC/C=C(\CC/C=C(\C)/C)/C)/C)/C YVLPJIGOMTXXLP-UUKUAVTLSA-N 0.000 claims description 2
- YVLPJIGOMTXXLP-BAHRDPFUSA-N 15Z-phytoene Natural products CC(=CCCC(=CCCC(=CCCC(=CC=C/C=C(C)/CCC=C(/C)CCC=C(/C)CCC=C(C)C)C)C)C)C YVLPJIGOMTXXLP-BAHRDPFUSA-N 0.000 claims description 2
- 102100028626 4-hydroxyphenylpyruvate dioxygenase Human genes 0.000 claims description 2
- 108010068327 4-hydroxyphenylpyruvate dioxygenase Proteins 0.000 claims description 2
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 claims description 2
- 235000010521 Cicer Nutrition 0.000 claims description 2
- 241000220455 Cicer Species 0.000 claims description 2
- 241000207746 Nicotiana benthamiana Species 0.000 claims description 2
- 235000011765 phytoene Nutrition 0.000 claims description 2
- 210000001525 retina Anatomy 0.000 claims description 2
- 238000010354 CRISPR gene editing Methods 0.000 claims 19
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 claims 6
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 claims 3
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 claims 3
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 claims 3
- 235000005338 Allium tuberosum Nutrition 0.000 claims 2
- 244000003377 Allium tuberosum Species 0.000 claims 2
- 235000011293 Brassica napus Nutrition 0.000 claims 2
- 235000011292 Brassica rapa Nutrition 0.000 claims 2
- OVSKIKFHRZPJSS-UHFFFAOYSA-N 2,4-D Chemical compound OC(=O)COC1=CC=C(Cl)C=C1Cl OVSKIKFHRZPJSS-UHFFFAOYSA-N 0.000 claims 1
- 102100040397 C->U-editing enzyme APOBEC-1 Human genes 0.000 claims 1
- 241000207199 Citrus Species 0.000 claims 1
- 244000016593 Coffea robusta Species 0.000 claims 1
- 235000002187 Coffea robusta Nutrition 0.000 claims 1
- 241000219112 Cucumis Species 0.000 claims 1
- 235000010071 Cucumis prophetarum Nutrition 0.000 claims 1
- 244000024675 Eruca sativa Species 0.000 claims 1
- 235000014755 Eruca sativa Nutrition 0.000 claims 1
- 241000221089 Jatropha Species 0.000 claims 1
- 241000209140 Triticum Species 0.000 claims 1
- 235000020971 citrus fruits Nutrition 0.000 claims 1
- 239000003517 fume Substances 0.000 claims 1
- 230000019612 pigmentation Effects 0.000 claims 1
- 102000053602 DNA Human genes 0.000 description 104
- 108020005004 Guide RNA Proteins 0.000 description 74
- 102000004169 proteins and genes Human genes 0.000 description 61
- 235000018102 proteins Nutrition 0.000 description 55
- 241000700605 Viruses Species 0.000 description 54
- 108010000700 Acetolactate synthase Proteins 0.000 description 46
- 230000000694 effects Effects 0.000 description 46
- 235000001014 amino acid Nutrition 0.000 description 41
- 229920002477 rna polymer Polymers 0.000 description 34
- 238000003776 cleavage reaction Methods 0.000 description 33
- 230000007017 scission Effects 0.000 description 33
- 239000013598 vector Substances 0.000 description 30
- 125000003275 alpha amino acid group Chemical group 0.000 description 29
- 230000004927 fusion Effects 0.000 description 29
- 102000004196 processed proteins & peptides Human genes 0.000 description 27
- 240000008042 Zea mays Species 0.000 description 26
- 102000004190 Enzymes Human genes 0.000 description 25
- 108090000790 Enzymes Proteins 0.000 description 25
- 108091079001 CRISPR RNA Proteins 0.000 description 23
- 230000001965 increasing effect Effects 0.000 description 23
- 230000037431 insertion Effects 0.000 description 22
- 238000003780 insertion Methods 0.000 description 22
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 21
- 238000009395 breeding Methods 0.000 description 19
- 230000001488 breeding effect Effects 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 19
- 230000002829 reductive effect Effects 0.000 description 19
- 230000001404 mediated effect Effects 0.000 description 18
- 239000002245 particle Substances 0.000 description 18
- 101710172430 Uracil-DNA glycosylase inhibitor Proteins 0.000 description 17
- 238000011161 development Methods 0.000 description 17
- 230000018109 developmental process Effects 0.000 description 17
- 230000027455 binding Effects 0.000 description 16
- 229920001184 polypeptide Polymers 0.000 description 16
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 14
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 14
- 241001493065 dsRNA viruses Species 0.000 description 14
- 125000005842 heteroatom Chemical group 0.000 description 14
- 241000589158 Agrobacterium Species 0.000 description 13
- 108091028113 Trans-activating crRNA Proteins 0.000 description 12
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 12
- 230000002068 genetic effect Effects 0.000 description 12
- 230000003993 interaction Effects 0.000 description 12
- 239000002105 nanoparticle Substances 0.000 description 12
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 12
- 238000013518 transcription Methods 0.000 description 12
- 230000035897 transcription Effects 0.000 description 12
- 238000001890 transfection Methods 0.000 description 12
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 11
- 241000209094 Oryza Species 0.000 description 11
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 11
- 230000000295 complement effect Effects 0.000 description 11
- 108020001507 fusion proteins Proteins 0.000 description 11
- 102000037865 fusion proteins Human genes 0.000 description 11
- 235000009973 maize Nutrition 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 230000001105 regulatory effect Effects 0.000 description 11
- 102000004533 Endonucleases Human genes 0.000 description 10
- 108010042407 Endonucleases Proteins 0.000 description 10
- 239000005586 Nicosulfuron Substances 0.000 description 10
- 235000007164 Oryza sativa Nutrition 0.000 description 10
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 10
- 238000007792 addition Methods 0.000 description 10
- 235000005822 corn Nutrition 0.000 description 10
- 238000002744 homologous recombination Methods 0.000 description 10
- 230000006801 homologous recombination Effects 0.000 description 10
- RTCOGUMHFFWOJV-UHFFFAOYSA-N nicosulfuron Chemical compound COC1=CC(OC)=NC(NC(=O)NS(=O)(=O)C=2C(=CC=CN=2)C(=O)N(C)C)=N1 RTCOGUMHFFWOJV-UHFFFAOYSA-N 0.000 description 10
- 238000003752 polymerase chain reaction Methods 0.000 description 10
- 235000009566 rice Nutrition 0.000 description 10
- 101150023114 RNA1 gene Proteins 0.000 description 9
- 101150084101 RNA2 gene Proteins 0.000 description 9
- 101100353432 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PRP2 gene Proteins 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 239000000203 mixture Substances 0.000 description 9
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 8
- 230000006780 non-homologous end joining Effects 0.000 description 8
- 230000037361 pathway Effects 0.000 description 8
- 238000003976 plant breeding Methods 0.000 description 8
- 210000001938 protoplast Anatomy 0.000 description 8
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 8
- 230000014616 translation Effects 0.000 description 8
- 101000776160 Homo sapiens Alsin Proteins 0.000 description 7
- 108020004682 Single-Stranded DNA Proteins 0.000 description 7
- 230000001939 inductive effect Effects 0.000 description 7
- 230000003612 virological effect Effects 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 6
- 108700028369 Alleles Proteins 0.000 description 6
- 239000004471 Glycine Substances 0.000 description 6
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 6
- 101100191561 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PRP3 gene Proteins 0.000 description 6
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 description 6
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 229940104302 cytosine Drugs 0.000 description 6
- 238000002716 delivery method Methods 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- 210000002257 embryonic structure Anatomy 0.000 description 6
- 210000003527 eukaryotic cell Anatomy 0.000 description 6
- 108091006047 fluorescent proteins Proteins 0.000 description 6
- 102000034287 fluorescent proteins Human genes 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 238000001727 in vivo Methods 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 239000013600 plasmid vector Substances 0.000 description 6
- 238000011084 recovery Methods 0.000 description 6
- 230000008929 regeneration Effects 0.000 description 6
- 238000011069 regeneration method Methods 0.000 description 6
- 108091008146 restriction endonucleases Proteins 0.000 description 6
- 230000035882 stress Effects 0.000 description 6
- 229940113082 thymine Drugs 0.000 description 6
- 230000001052 transient effect Effects 0.000 description 6
- 239000013603 viral vector Substances 0.000 description 6
- 102100032047 Alsin Human genes 0.000 description 5
- 239000005562 Glyphosate Substances 0.000 description 5
- 241000282414 Homo sapiens Species 0.000 description 5
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 5
- 235000007244 Zea mays Nutrition 0.000 description 5
- 230000009471 action Effects 0.000 description 5
- 238000000137 annealing Methods 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 5
- 229940097068 glyphosate Drugs 0.000 description 5
- 230000004807 localization Effects 0.000 description 5
- 239000011859 microparticle Substances 0.000 description 5
- 230000035755 proliferation Effects 0.000 description 5
- 230000004083 survival effect Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 4
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 4
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- 102000004316 Oxidoreductases Human genes 0.000 description 4
- 108090000854 Oxidoreductases Proteins 0.000 description 4
- 229920002873 Polyethylenimine Polymers 0.000 description 4
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 4
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 4
- 210000004102 animal cell Anatomy 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- USIUVYZYUHIAEV-UHFFFAOYSA-N diphenyl ether Chemical compound C=1C=CC=CC=1OC1=CC=CC=C1 USIUVYZYUHIAEV-UHFFFAOYSA-N 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 239000005090 green fluorescent protein Substances 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 239000000411 inducer Substances 0.000 description 4
- 230000002401 inhibitory effect Effects 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 229910052757 nitrogen Inorganic materials 0.000 description 4
- 210000003463 organelle Anatomy 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000011426 transformation method Methods 0.000 description 4
- 239000001226 triphosphate Substances 0.000 description 4
- 235000011178 triphosphate Nutrition 0.000 description 4
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 229910052725 zinc Inorganic materials 0.000 description 4
- 239000011701 zinc Substances 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- 101710147947 Acetolactate synthase small subunit 1, chloroplastic Proteins 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- 241000701489 Cauliflower mosaic virus Species 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 241000702463 Geminiviridae Species 0.000 description 3
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- 241000712887 Hantaan virus Lee Species 0.000 description 3
- 206010020649 Hyperkeratosis Diseases 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- 241000702489 Maize streak virus Species 0.000 description 3
- 108060004795 Methyltransferase Proteins 0.000 description 3
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 239000002202 Polyethylene glycol Substances 0.000 description 3
- 241001533393 Potyviridae Species 0.000 description 3
- 108020001991 Protoporphyrinogen Oxidase Proteins 0.000 description 3
- 102000005135 Protoporphyrinogen oxidase Human genes 0.000 description 3
- 241000700159 Rattus Species 0.000 description 3
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 3
- 241000961632 Tymovirales Species 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000002155 anti-virotic effect Effects 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000033590 base-excision repair Effects 0.000 description 3
- 108091008324 binding proteins Proteins 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 230000011088 chloroplast localization Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000004132 cross linking Methods 0.000 description 3
- 230000009615 deamination Effects 0.000 description 3
- 238000006481 deamination reaction Methods 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 230000005017 genetic modification Effects 0.000 description 3
- 235000013617 genetically modified food Nutrition 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 239000002502 liposome Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 108091070501 miRNA Proteins 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 238000000520 microinjection Methods 0.000 description 3
- 210000003470 mitochondria Anatomy 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 108091027963 non-coding RNA Proteins 0.000 description 3
- 102000042567 non-coding RNA Human genes 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 239000000575 pesticide Substances 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 230000008635 plant growth Effects 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 101150054546 ppo gene Proteins 0.000 description 3
- 230000017854 proteolysis Effects 0.000 description 3
- 239000002096 quantum dot Substances 0.000 description 3
- 102000037983 regulatory factors Human genes 0.000 description 3
- 108091008025 regulatory factors Proteins 0.000 description 3
- 230000008263 repair mechanism Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 108010048818 seryl-histidine Proteins 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- MZZYGYNZAOVRTG-UHFFFAOYSA-N 2-hydroxy-n-(1h-1,2,4-triazol-5-yl)benzamide Chemical compound OC1=CC=CC=C1C(=O)NC1=NC=NN1 MZZYGYNZAOVRTG-UHFFFAOYSA-N 0.000 description 2
- JFJWVJAVVIQZRT-UHFFFAOYSA-N 2-phenyl-1,3-dihydropyrazole Chemical compound C1C=CNN1C1=CC=CC=C1 JFJWVJAVVIQZRT-UHFFFAOYSA-N 0.000 description 2
- MFUPLJQNEXUUDW-UHFFFAOYSA-N 2-phenylisoindole-1,3-dione Chemical compound O=C1C2=CC=CC=C2C(=O)N1C1=CC=CC=C1 MFUPLJQNEXUUDW-UHFFFAOYSA-N 0.000 description 2
- WCKQPPQRFNHPRJ-UHFFFAOYSA-N 4-[[4-(dimethylamino)phenyl]diazenyl]benzoic acid Chemical compound C1=CC(N(C)C)=CC=C1N=NC1=CC=C(C(O)=O)C=C1 WCKQPPQRFNHPRJ-UHFFFAOYSA-N 0.000 description 2
- 101150001232 ALS gene Proteins 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241001115066 Aureusvirus Species 0.000 description 2
- 241000724306 Barley stripe mosaic virus Species 0.000 description 2
- 241000710175 Carlavirus Species 0.000 description 2
- 241000714207 Carmovirus Species 0.000 description 2
- 102000053642 Catalytic RNA Human genes 0.000 description 2
- 108090000994 Catalytic RNA Proteins 0.000 description 2
- 241000710151 Closterovirus Species 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 241000723607 Comovirus Species 0.000 description 2
- 102000000311 Cytosine Deaminase Human genes 0.000 description 2
- 108010080611 Cytosine Deaminase Proteins 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 2
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 108091092584 GDNA Proteins 0.000 description 2
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 2
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 2
- 101000658622 Homo sapiens Testis-specific Y-encoded-like protein 2 Proteins 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 2
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 2
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 2
- OZTZJMUZVAVJGY-BZSNNMDCSA-N Leu-Tyr-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OZTZJMUZVAVJGY-BZSNNMDCSA-N 0.000 description 2
- 241000961584 Lolavirus Species 0.000 description 2
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 2
- 241000724202 Maize stripe tenuivirus Species 0.000 description 2
- 102000016397 Methyltransferase Human genes 0.000 description 2
- 241000723638 Nepovirus Species 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- 108091005461 Nucleic proteins Proteins 0.000 description 2
- 231100000674 Phytotoxicity Toxicity 0.000 description 2
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 101100084449 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PRP4 gene Proteins 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 241000351588 Tepovirus Species 0.000 description 2
- 102100034917 Testis-specific Y-encoded-like protein 2 Human genes 0.000 description 2
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 241001459703 Tomato yellow spot virus Species 0.000 description 2
- 108090000848 Ubiquitin Proteins 0.000 description 2
- 102000044159 Ubiquitin Human genes 0.000 description 2
- 241001533358 Umbravirus Species 0.000 description 2
- 102100037111 Uracil-DNA glycosylase Human genes 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 241000726445 Viroids Species 0.000 description 2
- 241000607479 Yersinia pestis Species 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 239000000556 agonist Substances 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 239000012876 carrier material Substances 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 229920006317 cationic polymer Polymers 0.000 description 2
- 210000002421 cell wall Anatomy 0.000 description 2
- 230000030570 cellular localization Effects 0.000 description 2
- 239000013043 chemical agent Substances 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 2
- 244000038559 crop plants Species 0.000 description 2
- 231100000433 cytotoxic Toxicity 0.000 description 2
- 230000001472 cytotoxic effect Effects 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 230000009881 electrostatic interaction Effects 0.000 description 2
- 230000000408 embryogenic effect Effects 0.000 description 2
- 210000002308 embryonic cell Anatomy 0.000 description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009088 enzymatic function Effects 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 229910052731 fluorine Inorganic materials 0.000 description 2
- 238000001476 gene delivery Methods 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 2
- ZNJFBWYDHIGLCU-HWKXXFMVSA-N jasmonic acid Chemical compound CC\C=C/C[C@@H]1[C@@H](CC(O)=O)CCC1=O ZNJFBWYDHIGLCU-HWKXXFMVSA-N 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- NIFKBBMCXCMCAO-UHFFFAOYSA-N methyl 2-[(4,6-dimethoxypyrimidin-2-yl)carbamoylsulfamoyl]-4-(methanesulfonamidomethyl)benzoate Chemical group COC(=O)C1=CC=C(CNS(C)(=O)=O)C=C1S(=O)(=O)NC(=O)NC1=NC(OC)=CC(OC)=N1 NIFKBBMCXCMCAO-UHFFFAOYSA-N 0.000 description 2
- 230000033607 mismatch repair Effects 0.000 description 2
- 230000025608 mitochondrion localization Effects 0.000 description 2
- 108091005573 modified proteins Proteins 0.000 description 2
- 102000035118 modified proteins Human genes 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 230000009437 off-target effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000002888 pairwise sequence alignment Methods 0.000 description 2
- 229920001277 pectin Polymers 0.000 description 2
- 230000000149 penetrating effect Effects 0.000 description 2
- 230000035515 penetration Effects 0.000 description 2
- 238000000053 physical method Methods 0.000 description 2
- 230000008121 plant development Effects 0.000 description 2
- 239000003375 plant hormone Substances 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 108091092562 ribozyme Proteins 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000002195 synergetic effect Effects 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 2
- 229910052721 tungsten Inorganic materials 0.000 description 2
- 239000010937 tungsten Substances 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- OAKPWEUQDVLTCN-NKWVEPMBSA-N 2',3'-Dideoxyadenosine-5-triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1CC[C@@H](CO[P@@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)O1 OAKPWEUQDVLTCN-NKWVEPMBSA-N 0.000 description 1
- AZPJXONNBLOZFE-UHFFFAOYSA-N 2-[(3-methylphenyl)carbamoyl]benzoic acid Chemical compound CC1=CC=CC(NC(=O)C=2C(=CC=CC=2)C(O)=O)=C1 AZPJXONNBLOZFE-UHFFFAOYSA-N 0.000 description 1
- LAXVMANLDGWYJP-UHFFFAOYSA-N 2-amino-5-(2-aminoethyl)naphthalene-1-sulfonic acid Chemical compound NC1=CC=C2C(CCN)=CC=CC2=C1S(O)(=O)=O LAXVMANLDGWYJP-UHFFFAOYSA-N 0.000 description 1
- ALYNCZNDIQEVRV-UHFFFAOYSA-N 4-aminobenzoic acid Chemical compound NC1=CC=C(C(O)=O)C=C1 ALYNCZNDIQEVRV-UHFFFAOYSA-N 0.000 description 1
- KKADPXVIOXHVKN-UHFFFAOYSA-N 4-hydroxyphenylpyruvic acid Chemical compound OC(=O)C(=O)CC1=CC=C(O)C=C1 KKADPXVIOXHVKN-UHFFFAOYSA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- SJQRQOKXQKVJGJ-UHFFFAOYSA-N 5-(2-aminoethylamino)naphthalene-1-sulfonic acid Chemical compound C1=CC=C2C(NCCN)=CC=CC2=C1S(O)(=O)=O SJQRQOKXQKVJGJ-UHFFFAOYSA-N 0.000 description 1
- NJYVEMPWNAYQQN-UHFFFAOYSA-N 5-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C21OC(=O)C1=CC(C(=O)O)=CC=C21 NJYVEMPWNAYQQN-UHFFFAOYSA-N 0.000 description 1
- PRZRAMLXTKZUHF-UHFFFAOYSA-N 5-oxo-n-sulfonyl-4h-triazole-1-carboxamide Chemical compound O=S(=O)=NC(=O)N1N=NCC1=O PRZRAMLXTKZUHF-UHFFFAOYSA-N 0.000 description 1
- OEDUIFSDODUDRK-UHFFFAOYSA-N 5-phenyl-1h-pyrazole Chemical compound N1N=CC=C1C1=CC=CC=C1 OEDUIFSDODUDRK-UHFFFAOYSA-N 0.000 description 1
- WQZIDRAQTRIQDX-UHFFFAOYSA-N 6-carboxy-x-rhodamine Chemical compound OC(=O)C1=CC=C(C([O-])=O)C=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 WQZIDRAQTRIQDX-UHFFFAOYSA-N 0.000 description 1
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical compound NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 1
- 101150073246 AGL1 gene Proteins 0.000 description 1
- 102000012758 APOBEC-1 Deaminase Human genes 0.000 description 1
- 108010004483 APOBEC-3G Deaminase Proteins 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 1
- 108010013043 Acetylesterase Proteins 0.000 description 1
- 241000604451 Acidaminococcus Species 0.000 description 1
- 241000093740 Acidaminococcus sp. Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- JEPNLGMEZMCFEX-QSFUFRPTSA-N Ala-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N JEPNLGMEZMCFEX-QSFUFRPTSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- FUKFQILQFQKHLE-DCAQKATOSA-N Ala-Lys-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O FUKFQILQFQKHLE-DCAQKATOSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- 239000012099 Alexa Fluor family Substances 0.000 description 1
- 241001234079 Allexivirus Species 0.000 description 1
- 241001621841 Alopecurus myosuroides Species 0.000 description 1
- 241000961634 Alphaflexiviridae Species 0.000 description 1
- 241000982621 Alphanecrovirus Species 0.000 description 1
- 241000405760 Alphapartitivirus Species 0.000 description 1
- 241000710929 Alphavirus Species 0.000 description 1
- 241001611015 Ampelovirus Species 0.000 description 1
- 241000252087 Anguilla japonica Species 0.000 description 1
- 101710095342 Apolipoprotein B Proteins 0.000 description 1
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 101000768857 Arabidopsis thaliana 3-phosphoshikimate 1-carboxyvinyltransferase, chloroplastic Proteins 0.000 description 1
- 101000852723 Arabidopsis thaliana Acetolactate synthase small subunit 1, chloroplastic Proteins 0.000 description 1
- 101000852721 Arabidopsis thaliana Acetolactate synthase small subunit 2, chloroplastic Proteins 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 1
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- JOADBFCFJGNIKF-GUBZILKMSA-N Arg-Met-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O JOADBFCFJGNIKF-GUBZILKMSA-N 0.000 description 1
- NYDIVDKTULRINZ-AVGNSLFASA-N Arg-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NYDIVDKTULRINZ-AVGNSLFASA-N 0.000 description 1
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 1
- NIELFHOLFTUZME-HJWJTTGWSA-N Arg-Phe-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NIELFHOLFTUZME-HJWJTTGWSA-N 0.000 description 1
- WCZXPVPHUMYLMS-VEVYYDQMSA-N Arg-Thr-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O WCZXPVPHUMYLMS-VEVYYDQMSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- ZPMNECSEJXXNBE-CIUDSAMLSA-N Asn-Cys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZPMNECSEJXXNBE-CIUDSAMLSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- ALHMNHZJBYBYHS-DCAQKATOSA-N Asn-Lys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ALHMNHZJBYBYHS-DCAQKATOSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 1
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- GVPSCJQLUGIKAM-GUBZILKMSA-N Asp-Arg-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GVPSCJQLUGIKAM-GUBZILKMSA-N 0.000 description 1
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 1
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- SNAWMGHSCHKSDK-GUBZILKMSA-N Asp-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SNAWMGHSCHKSDK-GUBZILKMSA-N 0.000 description 1
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 1
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 1
- SWTQDYFZVOJVLL-KKUMJFAQSA-N Asp-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N)O SWTQDYFZVOJVLL-KKUMJFAQSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- VHUKCUHLFMRHOD-MELADBBJSA-N Asp-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O VHUKCUHLFMRHOD-MELADBBJSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 241001336715 Babuvirus Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000701513 Badnavirus Species 0.000 description 1
- 241000709750 Barley yellow dwarf virus-PAV Species 0.000 description 1
- 241000191879 Barley yellow striate mosaic cytorhabdovirus Species 0.000 description 1
- 241000225551 Bean golden yellow mosaic virus Species 0.000 description 1
- 241000986779 Becurtovirus Species 0.000 description 1
- 241000702325 Beet curly top virus Species 0.000 description 1
- 241000196477 Beet mosaic virus Species 0.000 description 1
- 241001429251 Beet necrotic yellow vein virus Species 0.000 description 1
- 241000710149 Beet yellows virus Species 0.000 description 1
- 241000702451 Begomovirus Species 0.000 description 1
- 241000439483 Benyviridae Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 241000961645 Betaflexiviridae Species 0.000 description 1
- 241000982567 Betanecrovirus Species 0.000 description 1
- 241000405758 Betapartitivirus Species 0.000 description 1
- 241001474374 Blennius Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000970620 Brambyvirus Species 0.000 description 1
- 241000251538 Branchiostoma lanceolatum Species 0.000 description 1
- 235000012905 Brassica oleracea var viridis Nutrition 0.000 description 1
- 244000064816 Brassica oleracea var. acephala Species 0.000 description 1
- 241000145651 Brome streak mosaic virus Species 0.000 description 1
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical compound [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 description 1
- 241001533462 Bromoviridae Species 0.000 description 1
- 241000724268 Bromovirus Species 0.000 description 1
- 241001533357 Bymovirus Species 0.000 description 1
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 241000710011 Capillovirus Species 0.000 description 1
- 241001115395 Caulimoviridae Species 0.000 description 1
- 241000701459 Caulimovirus Species 0.000 description 1
- 241001115396 Cavemovirus Species 0.000 description 1
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 1
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 1
- 241001218361 Cheravirus Species 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 244000037364 Cinnamomum aromaticum Species 0.000 description 1
- 235000014489 Cinnamomum aromaticum Nutrition 0.000 description 1
- 241000073079 Citrivirus Species 0.000 description 1
- 241000973027 Closteroviridae Species 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 241000948358 Crinivirus Species 0.000 description 1
- 241000724252 Cucumber mosaic virus Species 0.000 description 1
- 241000724253 Cucumovirus Species 0.000 description 1
- 241000702461 Curtovirus Species 0.000 description 1
- OHOQEZWSNFNUSY-UHFFFAOYSA-N Cy3-bifunctional dye zwitterion Chemical compound O=C1CCC(=O)N1OC(=O)CCCCCN1C2=CC=C(S(O)(=O)=O)C=C2C(C)(C)C1=CC=CC(C(C1=CC(=CC=C11)S([O-])(=O)=O)(C)C)=[N+]1CCCCCC(=O)ON1C(=O)CCC1=O OHOQEZWSNFNUSY-UHFFFAOYSA-N 0.000 description 1
- WZZGXXNRSZIQFC-VGDYDELISA-N Cys-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N WZZGXXNRSZIQFC-VGDYDELISA-N 0.000 description 1
- HKALUUKHYNEDRS-GUBZILKMSA-N Cys-Leu-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HKALUUKHYNEDRS-GUBZILKMSA-N 0.000 description 1
- 102100038076 DNA dC->dU-editing enzyme APOBEC-3G Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 241000405611 Deltapartitivirus Species 0.000 description 1
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 1
- 241000723672 Dianthovirus Species 0.000 description 1
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 1
- 101150111720 EPSPS gene Proteins 0.000 description 1
- 241001669679 Eleotris Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000283087 Equus Species 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000723648 Fabavirus Species 0.000 description 1
- 241000711950 Filoviridae Species 0.000 description 1
- 241000621174 Foveavirus Species 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000723722 Furovirus Species 0.000 description 1
- 101150104463 GOS2 gene Proteins 0.000 description 1
- 102000002464 Galactosidases Human genes 0.000 description 1
- 108010093031 Galactosidases Proteins 0.000 description 1
- 241000982564 Gallantivirus Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 229930191978 Gibberellin Natural products 0.000 description 1
- OVQXQLWWJSNYFV-XEGUGMAKSA-N Gln-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(N)=O)C)C(O)=O)=CNC2=C1 OVQXQLWWJSNYFV-XEGUGMAKSA-N 0.000 description 1
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 1
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 1
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- DRNMNLKUUKKPIA-HTUGSXCWSA-N Gln-Phe-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)CCC(N)=O)C(O)=O DRNMNLKUUKKPIA-HTUGSXCWSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- JHSRJMUJOGLIHK-GUBZILKMSA-N Glu-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N JHSRJMUJOGLIHK-GUBZILKMSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- CQIIXEHDSZUSAG-QWRGUYRKSA-N Gly-His-His Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CQIIXEHDSZUSAG-QWRGUYRKSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- AFPFGFUGETYOSY-HGNGGELXSA-N His-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AFPFGFUGETYOSY-HGNGGELXSA-N 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- UOAVQQRILDGZEN-SRVKXCTJSA-N His-Asp-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UOAVQQRILDGZEN-SRVKXCTJSA-N 0.000 description 1
- TVRMJKNELJKNRS-GUBZILKMSA-N His-Glu-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N TVRMJKNELJKNRS-GUBZILKMSA-N 0.000 description 1
- HQKADFMLECZIQJ-HVTMNAMFSA-N His-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N HQKADFMLECZIQJ-HVTMNAMFSA-N 0.000 description 1
- WJGSTIMGSIWHJX-HVTMNAMFSA-N His-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WJGSTIMGSIWHJX-HVTMNAMFSA-N 0.000 description 1
- FBCURAVMSXNOLP-JYJNAYRXSA-N His-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBCURAVMSXNOLP-JYJNAYRXSA-N 0.000 description 1
- YAEKRYQASVCDLK-JYJNAYRXSA-N His-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N YAEKRYQASVCDLK-JYJNAYRXSA-N 0.000 description 1
- MKWFGXSFLYNTKC-XIRDDKMYSA-N His-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N MKWFGXSFLYNTKC-XIRDDKMYSA-N 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 102000003964 Histone deacetylase Human genes 0.000 description 1
- 108090000353 Histone deacetylase Proteins 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 108091064358 Holliday junction Proteins 0.000 description 1
- 102000039011 Holliday junction Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000742736 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3G Proteins 0.000 description 1
- 101001059353 Homo sapiens Methionyl-tRNA formyltransferase, mitochondrial Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000755690 Homo sapiens Single-stranded DNA cytosine deaminase Proteins 0.000 description 1
- 241000724309 Hordeivirus Species 0.000 description 1
- 241000235789 Hyperoartia Species 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 1
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 1
- UQXADIGYEYBJEI-DJFWLOJKSA-N Ile-His-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N UQXADIGYEYBJEI-DJFWLOJKSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- FTUZWJVSNZMLPI-RVMXOQNASA-N Ile-Met-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N FTUZWJVSNZMLPI-RVMXOQNASA-N 0.000 description 1
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 1
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 1
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 1
- 108010057186 Insulin Glargine Proteins 0.000 description 1
- COCFEDIXXNGUNL-RFKWWTKHSA-N Insulin glargine Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(=O)NCC(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 COCFEDIXXNGUNL-RFKWWTKHSA-N 0.000 description 1
- 241000978134 Ipomovirus Species 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- 241000904817 Lachnospiraceae bacterium Species 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 240000000759 Lepidium meyenii Species 0.000 description 1
- 235000000421 Lepidium meyenii Nutrition 0.000 description 1
- 241001429356 Lettuce infectious yellows virus Species 0.000 description 1
- 241000191478 Lettuce necrotic yellows cytorhabdovirus Species 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 1
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- RRSLQOLASISYTB-CIUDSAMLSA-N Leu-Cys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O RRSLQOLASISYTB-CIUDSAMLSA-N 0.000 description 1
- NHHKSOGJYNQENP-SRVKXCTJSA-N Leu-Cys-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N NHHKSOGJYNQENP-SRVKXCTJSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 241000253097 Luteoviridae Species 0.000 description 1
- 241000709757 Luteovirus Species 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- PYFNONMJYNJENN-AVGNSLFASA-N Lys-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PYFNONMJYNJENN-AVGNSLFASA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- DAHQKYYIXPBESV-UWVGGRQHSA-N Lys-Met-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O DAHQKYYIXPBESV-UWVGGRQHSA-N 0.000 description 1
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 1
- PIXVFCBYEGPZPA-JYJNAYRXSA-N Lys-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N PIXVFCBYEGPZPA-JYJNAYRXSA-N 0.000 description 1
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 1
- UDXSLGLHFUBRRM-OEAJRASXSA-N Lys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCCN)N)O UDXSLGLHFUBRRM-OEAJRASXSA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 1
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000982559 Macanavirus Species 0.000 description 1
- 241001533339 Machlomovirus Species 0.000 description 1
- 241000013718 Macluravirus Species 0.000 description 1
- 241001059847 Maculavirus Species 0.000 description 1
- 241000723994 Maize dwarf mosaic virus Species 0.000 description 1
- 241000975283 Maize necrotic streak virus Species 0.000 description 1
- 241000611254 Maize rayado fino virus Species 0.000 description 1
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 1
- 241001059704 Mandarivirus Species 0.000 description 1
- 241000709759 Marafivirus Species 0.000 description 1
- 241000702459 Mastrevirus Species 0.000 description 1
- NLHSFJQUHGCWSD-PYJNHQTQSA-N Met-Ile-His Chemical compound N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O NLHSFJQUHGCWSD-PYJNHQTQSA-N 0.000 description 1
- OSZTUONKUMCWEP-XUXIUFHCSA-N Met-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC OSZTUONKUMCWEP-XUXIUFHCSA-N 0.000 description 1
- SPSSJSICDYYTQN-HJGDQZAQSA-N Met-Thr-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O SPSSJSICDYYTQN-HJGDQZAQSA-N 0.000 description 1
- GHQFLTYXGUETFD-UFYCRDLUSA-N Met-Tyr-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N GHQFLTYXGUETFD-UFYCRDLUSA-N 0.000 description 1
- 102100028928 Methionyl-tRNA formyltransferase, mitochondrial Human genes 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 244000171805 Mimulus langsdorfii Species 0.000 description 1
- 241000711513 Mononegavirales Species 0.000 description 1
- 241000711408 Murine respirovirus Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241001531264 Mus musculus musculus Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 241001336717 Nanoviridae Species 0.000 description 1
- 241001494793 Nanovirus Species 0.000 description 1
- 241000204974 Natronobacterium Species 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 244000018764 Nyssa sylvatica Species 0.000 description 1
- 235000003339 Nyssa sylvatica Nutrition 0.000 description 1
- 241001677705 Oleavirus Species 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 238000002944 PCR assay Methods 0.000 description 1
- 101150006897 PPO2 gene Proteins 0.000 description 1
- 241001112772 Panicovirus Species 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- 241000264850 Pecluvirus Species 0.000 description 1
- 241001112770 Petuvirus Species 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- KIAWKQJTSGRCSA-AVGNSLFASA-N Phe-Asn-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KIAWKQJTSGRCSA-AVGNSLFASA-N 0.000 description 1
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 1
- CUMXHKAOHNWRFQ-BZSNNMDCSA-N Phe-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CUMXHKAOHNWRFQ-BZSNNMDCSA-N 0.000 description 1
- FGXIJNMDRCZVDE-KKUMJFAQSA-N Phe-Cys-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N FGXIJNMDRCZVDE-KKUMJFAQSA-N 0.000 description 1
- RJYBHZVWJPUSLB-QEWYBTABSA-N Phe-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N RJYBHZVWJPUSLB-QEWYBTABSA-N 0.000 description 1
- YEEFZOKPYOUXMX-KKUMJFAQSA-N Phe-Gln-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YEEFZOKPYOUXMX-KKUMJFAQSA-N 0.000 description 1
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 1
- SPXWRYVHOZVYBU-ULQDDVLXSA-N Phe-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N SPXWRYVHOZVYBU-ULQDDVLXSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 1
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 1
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 1
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 1
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 1
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 1
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 1
- 241000604739 Phoebe Species 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241001144416 Picornavirales Species 0.000 description 1
- 241000368092 Poacevirus Species 0.000 description 1
- 241000253102 Polerovirus Species 0.000 description 1
- 108010076039 Polyproteins Proteins 0.000 description 1
- 241001112830 Pomovirus Species 0.000 description 1
- 241001098086 Pospiviroidae Species 0.000 description 1
- 241000709769 Potato leafroll virus Species 0.000 description 1
- 241000723762 Potato virus Y Species 0.000 description 1
- 241000710007 Potexvirus Species 0.000 description 1
- 241000710078 Potyvirus Species 0.000 description 1
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 1
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- SMFQZMGHCODUPQ-ULQDDVLXSA-N Pro-Lys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SMFQZMGHCODUPQ-ULQDDVLXSA-N 0.000 description 1
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 1
- HOTVCUAVDQHUDB-UFYCRDLUSA-N Pro-Phe-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 HOTVCUAVDQHUDB-UFYCRDLUSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- BVRBCQBUNGAWFP-KKUMJFAQSA-N Pro-Tyr-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O BVRBCQBUNGAWFP-KKUMJFAQSA-N 0.000 description 1
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 1
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 1
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 1
- 229940079156 Proteasome inhibitor Drugs 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 241001112091 Pseudoviridae Species 0.000 description 1
- 241001112090 Pseudovirus Species 0.000 description 1
- 102000015097 RNA Splicing Factors Human genes 0.000 description 1
- 108010039259 RNA Splicing Factors Proteins 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241000702247 Reoviridae Species 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 241000711931 Rhabdoviridae Species 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 241000702632 Rice dwarf virus Species 0.000 description 1
- 241001001708 Rosadnavirus Species 0.000 description 1
- 101100298775 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PRP11 gene Proteins 0.000 description 1
- 101100137814 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PRP6 gene Proteins 0.000 description 1
- 101100137821 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PRP8 gene Proteins 0.000 description 1
- 241001596272 Sadwavirus Species 0.000 description 1
- 241000961587 Secoviridae Species 0.000 description 1
- 241000709666 Sequivirus Species 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 1
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- 241000351127 Solendovirus Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 241001116311 Soymovirus Species 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 101100166147 Streptococcus thermophilus cas9 gene Proteins 0.000 description 1
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 1
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- WBCCCPZIJIJTSD-TUBUOCAGSA-N Thr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H]([C@@H](C)O)N WBCCCPZIJIJTSD-TUBUOCAGSA-N 0.000 description 1
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 1
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 1
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- XVHAUVJXBFGUPC-RPTUDFQQSA-N Thr-Tyr-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XVHAUVJXBFGUPC-RPTUDFQQSA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241001048955 Tobacco curly shoot virus Species 0.000 description 1
- 241001384546 Tobacco mottle leaf curl virus Species 0.000 description 1
- 241000723573 Tobacco rattle virus Species 0.000 description 1
- 241000702292 Tobacco yellow dwarf virus Species 0.000 description 1
- 241000723848 Tobamovirus Species 0.000 description 1
- 241000723717 Tobravirus Species 0.000 description 1
- 241000948359 Tomato chlorosis virus Species 0.000 description 1
- 241000708495 Tomato chlorotic mottle virus Species 0.000 description 1
- 241001189523 Tomato dwarf leaf virus Species 0.000 description 1
- 241000702295 Tomato golden mosaic virus Species 0.000 description 1
- 241001135990 Tomato leaf curl virus Species 0.000 description 1
- 241000702305 Tomato mottle virus Species 0.000 description 1
- 241001533336 Tombusviridae Species 0.000 description 1
- 241000710141 Tombusvirus Species 0.000 description 1
- 241000225739 Topocuvirus Species 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- 241000961581 Torradovirus Species 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 241000023777 Triticum mosaic virus Species 0.000 description 1
- 241000013717 Tritimovirus Species 0.000 description 1
- HLDFBNPSURDYEN-VHWLVUOQSA-N Trp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HLDFBNPSURDYEN-VHWLVUOQSA-N 0.000 description 1
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 1
- 241001116302 Tungrovirus Species 0.000 description 1
- 241001059845 Tymoviridae Species 0.000 description 1
- 241000710136 Tymovirus Species 0.000 description 1
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 1
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 1
- HTHCZRWCFXMENJ-KKUMJFAQSA-N Tyr-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HTHCZRWCFXMENJ-KKUMJFAQSA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 1
- QUILOGWWLXMSAT-IHRRRGAJSA-N Tyr-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QUILOGWWLXMSAT-IHRRRGAJSA-N 0.000 description 1
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 1
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 1
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 1
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 1
- FASACHWGQBNSRO-ZEWNOJEFSA-N Tyr-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FASACHWGQBNSRO-ZEWNOJEFSA-N 0.000 description 1
- AEOFMCAKYIQQFY-YDHLFZDLSA-N Tyr-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AEOFMCAKYIQQFY-YDHLFZDLSA-N 0.000 description 1
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- 241000439034 Velarivirus Species 0.000 description 1
- 241000961586 Virgaviridae Species 0.000 description 1
- 241001086877 Vitivirus Species 0.000 description 1
- 241000709760 Waikavirus Species 0.000 description 1
- 241000702302 Wheat dwarf virus Species 0.000 description 1
- 241001429320 Wheat streak mosaic virus Species 0.000 description 1
- 101000741267 Zea mays Phosphoenolpyruvate carboxylase 1 Proteins 0.000 description 1
- 101500015412 Zea mays Ubiquitin Proteins 0.000 description 1
- 108700007346 Zea mays oleosin Proteins 0.000 description 1
- 241000200207 Zea mosaic virus Species 0.000 description 1
- 241000982586 Zeavirus Species 0.000 description 1
- 101710185494 Zinc finger protein Proteins 0.000 description 1
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 1
- CUOLBWPZVZCPIJ-MCDZGGTQSA-N [[(2r,3s,4r,5r)-5-(6-aminopurin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate;diphosphono hydrogen phosphate Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O.C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O CUOLBWPZVZCPIJ-MCDZGGTQSA-N 0.000 description 1
- AZJLCKAEZFNJDI-DJLDLDEBSA-N [[(2r,3s,5r)-5-(4-aminopyrrolo[2,3-d]pyrimidin-7-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 AZJLCKAEZFNJDI-DJLDLDEBSA-N 0.000 description 1
- HDRRAMINWIWTNU-NTSWFWBYSA-N [[(2s,5r)-5-(2-amino-6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1CC[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HDRRAMINWIWTNU-NTSWFWBYSA-N 0.000 description 1
- ARLKCWCREKRROD-POYBYMJQSA-N [[(2s,5r)-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 ARLKCWCREKRROD-POYBYMJQSA-N 0.000 description 1
- PGAVKCOVUIYSFO-UHFFFAOYSA-N [[5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 1
- ZXZIQGYRHQJWSY-NKWVEPMBSA-N [hydroxy-[[(2s,5r)-5-(6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy]phosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(=O)O)CC[C@@H]1N1C(NC=NC2=O)=C2N=C1 ZXZIQGYRHQJWSY-NKWVEPMBSA-N 0.000 description 1
- 230000036579 abiotic stress Effects 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 239000003627 allelochemical Substances 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 244000037640 animal pathogen Species 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000004900 autophagic degradation Effects 0.000 description 1
- 235000010233 benzoic acid Nutrition 0.000 description 1
- 150000001559 benzoic acids Chemical class 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000003124 biologic agent Substances 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000006287 biotinylation Effects 0.000 description 1
- 238000007413 biotinylation Methods 0.000 description 1
- 239000007844 bleaching agent Substances 0.000 description 1
- 235000008429 bread Nutrition 0.000 description 1
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Substances BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 1
- 229910052794 bromium Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- CZPLANDPABRVHX-UHFFFAOYSA-N cascade blue Chemical compound C=1C2=CC=CC=C2C(NCC)=CC=1C(C=1C=CC(=CC=1)N(CC)CC)=C1C=CC(=[N+](CC)CC)C=C1 CZPLANDPABRVHX-UHFFFAOYSA-N 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 230000014107 chromosome localization Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000008645 cold stress Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- OILAIQUEIWYQPH-UHFFFAOYSA-N cyclohexane-1,2-dione Chemical compound O=C1CCCCC1=O OILAIQUEIWYQPH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- UFJPAQSLHAGEBL-RRKCRQDMSA-N dITP Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(N=CNC2=O)=C2N=C1 UFJPAQSLHAGEBL-RRKCRQDMSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- URGJWIFLBWJRMF-JGVFFNPUSA-N ddTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 URGJWIFLBWJRMF-JGVFFNPUSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000018044 dehydration Effects 0.000 description 1
- 238000006297 dehydration reaction Methods 0.000 description 1
- 230000032798 delamination Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 150000004985 diamines Chemical class 0.000 description 1
- RWYFURDDADFSHT-RBBHPAOJSA-N diane Chemical compound OC1=CC=C2[C@H]3CC[C@](C)([C@](CC4)(O)C#C)[C@@H]4[C@@H]3CCC2=C1.C1=C(Cl)C2=CC(=O)[C@@H]3CC3[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@@](C(C)=O)(OC(=O)C)[C@@]1(C)CC2 RWYFURDDADFSHT-RBBHPAOJSA-N 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 1
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 230000012361 double-strand break repair Effects 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 230000008641 drought stress Effects 0.000 description 1
- 241001492478 dsDNA viruses, no RNA stage Species 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000009144 enzymatic modification Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009313 farming Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000001215 fluorescent labelling Methods 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 244000053095 fungal pathogen Species 0.000 description 1
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 1
- 229960003883 furosemide Drugs 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 230000001295 genetical effect Effects 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- IXORZMNAPKEEDV-UHFFFAOYSA-N gibberellic acid GA3 Natural products OC(=O)C1C2(C3)CC(=C)C3(O)CCC2C2(C=CC3O)C1C3(C)C(=O)O2 IXORZMNAPKEEDV-UHFFFAOYSA-N 0.000 description 1
- 239000003448 gibberellin Substances 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 102000005396 glutamine synthetase Human genes 0.000 description 1
- 108020002326 glutamine synthetase Proteins 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 210000002149 gonad Anatomy 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 230000008642 heat stress Effects 0.000 description 1
- 239000001307 helium Substances 0.000 description 1
- 229910052734 helium Inorganic materials 0.000 description 1
- SWQJXJOGLNCZEY-UHFFFAOYSA-N helium atom Chemical compound [He] SWQJXJOGLNCZEY-UHFFFAOYSA-N 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 102000054962 human APOBEC3G Human genes 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 210000001822 immobilized cell Anatomy 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 150000002545 isoxazoles Chemical class 0.000 description 1
- ZNJFBWYDHIGLCU-UHFFFAOYSA-N jasmonic acid Natural products CCC=CCC1C(CC(O)=O)CCC1=O ZNJFBWYDHIGLCU-UHFFFAOYSA-N 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 229940060975 lantus Drugs 0.000 description 1
- 235000012902 lepidium meyenii Nutrition 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000598 lipoate effect Effects 0.000 description 1
- 238000002865 local sequence alignment Methods 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 239000002122 magnetic nanoparticle Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000000442 meristematic effect Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 239000002923 metal particle Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 230000036438 mutation frequency Effects 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 239000002113 nanodiamond Substances 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 235000021049 nutrient content Nutrition 0.000 description 1
- ONDBSQWZWRGVIL-UHFFFAOYSA-N o-pyrimidin-2-yl benzenecarbothioate Chemical compound C=1C=CC=CC=1C(=S)OC1=NC=CC=N1 ONDBSQWZWRGVIL-UHFFFAOYSA-N 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- WCPAKWJPBJAGKN-UHFFFAOYSA-N oxadiazole Chemical compound C1=CON=N1 WCPAKWJPBJAGKN-UHFFFAOYSA-N 0.000 description 1
- COWNFYYYZFRNOY-UHFFFAOYSA-N oxazolidinedione Chemical compound O=C1COC(=O)N1 COWNFYYYZFRNOY-UHFFFAOYSA-N 0.000 description 1
- 230000036542 oxidative stress Effects 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- KXFJZKUFXHWWAJ-UHFFFAOYSA-N p-hydroxybenzoylformic acid Natural products OC(=O)C(=O)C1=CC=C(O)C=C1 KXFJZKUFXHWWAJ-UHFFFAOYSA-N 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000007030 peptide scission Effects 0.000 description 1
- QIIPQYDSKRYMFG-UHFFFAOYSA-N phenyl hydrogen carbonate Chemical class OC(=O)OC1=CC=CC=C1 QIIPQYDSKRYMFG-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010065135 phenylalanyl-phenylalanyl-phenylalanine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- XEBWQGVWTUSTLN-UHFFFAOYSA-M phenylmercury acetate Chemical compound CC(=O)O[Hg]C1=CC=CC=C1 XEBWQGVWTUSTLN-UHFFFAOYSA-M 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 230000004983 pleiotropic effect Effects 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920000575 polymersome Polymers 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 150000003147 proline derivatives Chemical class 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 239000003207 proteasome inhibitor Substances 0.000 description 1
- 239000011546 protein dye Substances 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 101150022630 prp5 gene Proteins 0.000 description 1
- 150000003217 pyrazoles Chemical class 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- HBMJWWWQQXIZIP-UHFFFAOYSA-N silicon carbide Chemical compound [Si+]#[C-] HBMJWWWQQXIZIP-UHFFFAOYSA-N 0.000 description 1
- 229910010271 silicon carbide Inorganic materials 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 108010068698 spleen exonuclease Proteins 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 1
- 125000003831 tetrazolyl group Chemical group 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- GUKSGXOLJNWRLZ-UHFFFAOYSA-N thymine glycol Chemical group CC1(O)C(O)NC(=O)NC1=O GUKSGXOLJNWRLZ-UHFFFAOYSA-N 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 150000003918 triazines Chemical class 0.000 description 1
- YWBFPKPWMSWWEA-UHFFFAOYSA-O triazolopyrimidine Chemical compound BrC1=CC=CC(C=2N=C3N=CN[N+]3=C(NCC=3C=CN=CC=3)C=2)=C1 YWBFPKPWMSWWEA-UHFFFAOYSA-O 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 108700004896 tripeptide FEG Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 210000003934 vacuole Anatomy 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 1
- 101150106994 yme2 gene Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8209—Selection, visualisation of transformants, reporter constructs, e.g. antibiotic resistance markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/04—Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/04—Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
- A01H1/045—Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection using molecular markers
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/06—Processes for producing mutations, e.g. treatment with chemicals or with radiation
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/12—Processes for modifying agronomic input traits, e.g. crop yield
- A01H1/122—Processes for modifying agronomic input traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- A01H1/123—Processes for modifying agronomic input traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8274—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8274—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
- C12N15/8278—Sulfonylurea
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2810/00—Vectors comprising a targeting moiety
- C12N2810/10—Vectors comprising a non-peptidic targeting moiety
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Botany (AREA)
- Developmental Biology & Embryology (AREA)
- Environmental Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 표현형으로 선별가능한 형질의 병행 도입과 조합된, 식물, 식물 세포 또는 물질에서의 타겟화된 편집 방법에 관한 것이다. 또한, 본 발명은 전이유전자성 선별 마커 서열을 도입하는 단계를 포함하지 않는 방법을 제공한다.
Description
본 발명은, 표현형으로 선별가능한 형질의 병행 도입 (parallel introduction)과 조합되는, 식물, 식물 세포 또는 물질에서의 타겟화된 편집 (targeted editing) 방법에 관한 것이다. 또한, 전이유전자성 선별 마커 서열 (transgenic selection marker sequence)을 도입하는 단계를 포함하지 않는 방법을 제공한다. 이 방법은 제1 게놈 타겟 부위에 타겟화된 변형을 도입하여, 외인성 폴리뉴클레오티드 주형의 제공 또는 타겟 부위에의 이중 가닥 절단의 도입에 의존하지 않는 선별가능한 표현형을 수득하는 것을 포함한다. 마지막으로, 본 발명은 서로 다른 게놈 타겟 부위에서 전이유전자성 마커-프리 선별 (transgenic marker-free selection) 및 타겟화된 편집을 병행함으로써, 식물 물질을 선별 마커 카세트 없이도 단리할 수 있는 선별가능한 또는 기타 표현형을 부여하여, 대상 유전자형을 동정하기 위한 현저하게 감소된 선별 시도를 포함하는 정확한 육종을 가능하게 한다.
진핵생물 세포의 정확한 유전자 정보 변형은 농업, 제약 및 의학 응용분야들에서 상당한 가치가 있지만, 기초 연구에서도 중요하다. 게놈 조작 또는 편집은 높은 정확도로 타겟에 지정된 유전자 변화를 만드는 능력을 나타낸다. 타겟화된 이중 가닥 절단은 예를 들어 진핵생물 세포에서 부위-특이적인 뉴클레아제 (SSN) 또는 재조합효소에 의해 구축될 수 있다.
식물의 경우, 정확한 이중 가닥 절단 유도는 상동적인 재조합 (HR) 현상의 빈도를 100x 내지 1000x 높인다 (Puchta et al., Proc. Natl. Acad. Sci. USA 93:5055-5060, 1996). 그러나, 변형된 세포 및 식물의 다운스트림 동정은 식물 개선을 위한 육종 도구로서 유전자 편집의 일상적인 사용을 제한한다.
농약과 같은 농업 기술에서 식물 육종 및 개발은 한 세기 동안 농작물 생산량 증가에 상당한 진전을 거두었다. 그러나, 식물 육종가들은 수많은 변화에 계속적으로 대응하여야 한다. 농업 관행이 바뀌고 있어, 특이적인 농경 특징을 보유한 유전자형의 식물 개발 필요성이 발생한다. 또한, 타겟 환경 및 그 환경 내 유기체는 계속적으로 바뀌고, 예를 들어, 진균 및 해충이 계속 발생하여, 대상 식물의 저항성을 극복한다. 새로운 토지는 정기적으로 농사에 사용되어, 식물은 달라진 재배 조건에 노출된다. 마지막으로, 소비자 선호 및 요구 사항도 변한다. 이에 식물 육종가들은 새로운 농작물 품종을 계속적으로 개발하여야 하는 끊임없는 과제에 직면해있다 (Collard and Mackill, Philos. Trans. R. Soc. Lond. B. Biol. Sci. 2008 Feb 12; 363(1491): 557-572).
육종 전략을 돕기 위해, 대상 유전자형을 신뢰성있게 확인할 수 있도록, 진단학적 가능성을 가진 선별가능한 마커 서열 또는 마커-보조 선별 (marker-assisted selection, MAS) 전략이 필요하다. EP 2 342 337 B1에 개시된 바와 같이, 진단 마커의 개발은 대상 형질의 기저가 되는 유전자(들)의 유전자 위치 맵핑에서 시작되는 프로세스는, 측면 마커 동정, 밀접하게 연관된 마커의 동정을 통한 유전자(들)의 정밀 맵핑, 가장 연관된 마커의 DNA 마커 서열 결정, 타겟 유전자를 맵핑하는데 사용된 부모 계통들 간에 마커 유전자 좌에서의 서열 변이 확인, 간단한 PCR 분석 개발, 스크리닝 또는 육종시 진단 특성을 가진 마커를 테스트하게 될, 식물 물질의 유전자 백그라운드 (생식질 (germplasm))에서 예측치 검정으로 이어지게 된된다. 이러한 전략은, 대상 게놈 내 적정 위치에 대상 마커가 존재하여야 하거나 또는 삽입되어야 하므로, 기본적으로 고된 일이며, 따라서 비용 집약적이다.
DNA 마커 기술은 표현형 형질을 확인하는 대신 용이한 마커 분석에 기반한 선별을 가능하게 함으로써 식물 육종의 효율을 상당히 높일 수 있다. 그러나, 진단 또는 스크리닝 특성을 가진 마커 개발 및 이들 마커의 적용 효과는 앞서 기술한 바와 같이 어려운 일이며 시간이 많이 소요되는 과정이다. 현재, 점 돌연변이, 예를 들어, SNP를 검출하는 방법은 오직 제한된 수의 점 돌연변이를 제한된 수로 동정할 수 있으며, 제한된 레퍼토리를 검출할 수 있다 (Slade et al., Nat. Biotech. 23, 75-81).
여전히, 선별가능한 마커 유전자는 형질전환 및 색소체형질전환 (transplastomic) 식물 연구 또는 농작물 개발에서 식물에서 중요한 역할을 수행한다. 선별가능한 마커 유전자는 종종 리포터 유전자와 함께 사용되는데, 리포터 유전자는 선택 이점을 세포에 제공하진 않지만, 형질전환 현상을 모니터링하거나 또는 비-형질전환 물질로부터 형질전환 물질을 수동 분리하는데 사용될 수 있다.
빠르게 발전하고 있는 영역은 마커-프리 (marker-free) 식물을 제조하기 위해 선별가능한 마커 유전자를 없애는 전략을 개발하는 것이다. 마커-프리 식물의 구축 합리화는 여러가지 관점에서 상세히 논의되어 있다 (Yoder and Goldsbrough, 1994; Ow, 2001; Hare and Chua, 2002). 형질전환 및 비-형질전환 식물의 상업화를 위해, 최종 식물 품종에서 용도를 제공하지 않는 유전자 서열을 제거하는 것이 규정된 절차를 단순화하고 소비자 허용성을 개선할 것이다. 최종 식물로부터 마커 유전자의 제거는 광범위한 생물안전성 평가를 거치지 않았거나 또는 식물에서 부정적인 다면발현 효과 (pleiotropic effect)를 발생시킬 수 있는 실험 마커 유전자의 사용을 허용할 것이다. 또한, 이는 다음번 형질전환 전에 제거된다면 형질전환 식물의 반복적인 형질전환에 사용가능한 마커 유전자의 재사용을 허용할 것이다.
따라서, 전이유전자성 선별 마커 유전자는 처리된 세포로부터 재생되는 식물의 회수 효율을 높일 순 있지만, 식물 게놈 내 전이유전자 서열을 도입하는 것이 늘 바람직한 것은 아니다. 또한, 형질전환 마커 유전자를 선별한 후 제거하는 것 역시 종종 매우 복잡하다.
정확한 유전자 편집 또는 게놈 조작은 과거 수년 간 대상 게놈의 타겟화된 부위-특이적인 조작을 달성할 수 있는 가장 중요한 유전자 조작 분야 중 하나로서 부상하였다. 부위-특이적인 게놈 조작의 필수 전제 조건은 프로그래밍가능한 뉴클레아제로서, 이를 사용해 지정된 위치에서 대상 핵산을 절단하여 이중 가닥 절단 (DSB) 또는 하나 이상의 단일 가닥 절단을 만들 수 있다. 다른 예로, 이러한 뉴클레아제는, 뉴클레아제 기능을 포함하지 않고 다른 효소와 조합하여 인지 서열로서 작용한다면, 키메라 또는 돌연변이된 변이체일 수 있다. 이러한 뉴클레아제 또는 이의 변이체가 임의의 유전자 편집 또는 게놈 조작 방식에서 핵심이다. 최근 수년간, 메가뉴클레아제, 징크 핑거 뉴클레아제, TALE 뉴클레아제, 아르고너트 (Argonaute) 뉴클레아제, 예를 들어 나트로노박테리움 그레고리 (Natronobacterium gregoryi)로부터 유래된 아르고너트 (Argonaute) 뉴클레아제, 그리고 예를 들어, CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) 시스템의 일부로서 Cas, Cpf1, CasX 또는 CasY 뉴클레아제를 포함하는 CRISPR 뉴클레아제를 포함하여, 적절한 다수의 뉴클레아제, 특히 맞춤형 엔도뉴클레아제들이 개발되었다.
CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats)는, 본래, CRISPR 시스템이 바이러스 공격을 방어하기 위한 후천적인 면역 시스템의 역할을 수행하는 박테리아에서, 천연 환경에서 진화되었다. 바이러스에 노출되면, 바이러스의 짧은 DNA 세그먼트가 CRISPR 유전자 좌에 삽입된다. 바이러스 서열을 포함하는 CRISPR 유전자 좌의 영역으로부터 RNA가 전사된다. 바이러스 게놈에 상보적인 서열을 포함하고 있는 이 RNA는, CRISPR 작동자 (effector) 단백질을 바이러스 게놈 내 타겟 서열을 타겟팅하도록 매개한다. CRISPR 작동자 단백질은 바이러스 타겟을 절단함으로써, 바이러스의 복제를 방해한다. 과거 수년간, CRISPR 시스템은 진핵생물 세포에서도 유전자 편집 또는 게놈 조작에 성공적으로 적용되고 있다. 현재 동물 세포에서의 편집 및 인간에서의 치료학적인 적용이 주된 중점 연구 과제이다. 복잡한 동물 및 식물 게놈을 타겟화된 방식으로 변형시키는 것은 여전히 어려운 과제이다.
CRISPR 시스템은, 천연 환경에서, 하나 이상의 작은 개별 비-코딩 RNA를, Cas 뉴클레아제 또는 특이적인 DNA 이중 가닥 절단을 만들 수 있는 Cpf1 뉴클레아제 (Zetsche et al., "Cpf1 is a Single RNA-Guides Endonuclease of a Class 2 CRISPR-Cas System", Cell, 163, pp. 1-13, October 2015)와 같은 다른 CRISPR 뉴클레아제와 조합하여 포함하는, 분자 복합체이다. 현재, CRISPR 시스템은 5가지 타입의 CRISPR 시스템을 포함하는 2가지 클래스, 즉, 예를 들어 작동자로서 Cas9를 이용하는 타입 II 시스템과, 작동자 분자로서 Cpf1을 이용하는 타입 V 시스템으로 분류된다 (Makarova et al., Nature Rev. Microbiol., 2015). 인공적인 CRISPR 시스템에서, 합성 비-코딩 RNA 및 CRISPR 뉴클레아제 및/또는 선택적으로, 닉카제 (nickase)로서 작용하도록 변형되거나 또는 어떠한 뉴클레아제 기능이 결핍되도록 변형된 CRISPR 뉴클레아제는, crRNA 및/또는 tracrRNA의 기능을 겸비한 하나 이상의 합성 또는 인공 가이드 RNA 또는 gRNA와 조합하여, 사용될 수 있다 (Makarova et al., 2015, supra). 천연 시스템에서 CRISPR/Cas에 의해 매개되는 면역 반응에는 CRISPR-RNA (crRNA)가 필요한데, CRISPR 뉴클레아제의 특이적인 활성화를 조절하는 이러한 가이드 RNA의 성숙화는 지금까지 파악된 다양한 CRISPR 시스템들에 따라 매우 다양하다. 먼저, 스페이서 (spacer)라고도 하는 침입 DNA (invading DNA)가 CRISPR 유전자 좌의 근위 말단에 위치된 2개의 인접 반복 영역 사이에 삽입된다. 타입 II CRISPR 시스템은 간섭 단계 (interference step)의 핵심 효소로서 Cas9 뉴클레아제를 코딩하며, 이 시스템은 crRNA와 또한 가이드 모티프로서 트랜스-활성화성 RNA (trans-activating RNA, tracrRNA)를 둘다 포함한다. 이들이 혼성되어, RNAseIII에 의해 인지되는 이중 가닥 (ds) RNA 영역을 만드는데, 이것이 절단되어 성숙한 crRNA가 될 수 있다. 이후, Cas 분자와 조합되어, 뉴클레아제를 타겟 핵산 영역으로 특이적으로 안내한다. 재조합 gRNA 분자는 가변적인 DNA 인지 영역과 Cas 상호작용 영역을 둘다 포함할 수 있으며, 따라서, 특이적인 타겟 핵산 및 바람직한 Cas 뉴클레아제와는 독립적으로, 특이적으로 설계될 수 있다. 추가적인 안전 기전으로서, PAM (protospacer adjacent motif)이 타겟 핵산 영역에 존재하여야 하며; PAM은 Cas9/RNA 복합체-인지 DNA 바로 다음에 위치하는 DNA 서열이다. 스트렙토코커스 피오게네스 (Streptococcus pyogenes) Cas9의 경우, PAM 서열은 "NGG" 또는 "NAG" (표준 IUPAC 뉴클레오티드 코드)로 알려져 있다 (Jinek et al, "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity", Science 2012, 337: 816-821). 스타필로코커스 아우레우스 (Staphylococcus aureus) Cas9의 경우, PAM 서열은 "NNGRRT" 또는 "NNGRR(N)"이다. 또 다른 변이체 CRISPR/Cas9 시스템들도 알려져 있다. 즉, 네이세리아 메닌기티디스 (Neisseria meningitidis) Cas9은 PAM 서열 NNNNGATT에서 절단한다. 스트렙토코커스 서모필러스 (Streptococcus thermophilus) Cas9은 PAM 서열 NNAGAAW에서 절단한다. 최근, 캄필로박터 (Campylobacter)의 CRISPR 시스템에 대한, 또 다른 PAM 모티프 NNNNRY가 공지되었다 (WO 2016/021973 A1). Cpf1 뉴클레아제의 경우, Cpf1-crRNA 복합체가 짧은 T-풍부 PAM 앞에 위치하는 타겟 DNA를 효과적으로 절단하는 것으로 공지되었는데, 이는 일반적으로 Cas9 시스템이 G-풍부 PAM을 인지하는 것과는 대비된다 (Zetsche et al., supra). 또한, 변형된 CRISPR 폴리펩타이드를 이용함으로써, 특이적인 단일 가닥의 절단을 만들 수 있다. Cas 닉카제와 다양한 재조합 gRNA의 조합 사용 역시 이중 DNA 닉킹을 이용해 매우 특이적인 DNA 이중 가닥 절단을 유도할 수 있다. 또한, 2개의 gRNA를 이용함으로써, DNA 결합의 특이성, 즉 DNA 절단을 최적화할 수 있다.
현재, 예를 들어, 엔도뉴클레아제로서 Cas9 또는 이의 변이체 또는 임의의 키메라 형태에 의존하는 타입 II 시스템이 게놈 조작용으로 변형되었다. 2개의 구성성분, 즉 싱글 가이드 RNA (sgRNA)로도 지칭되는 가이드 RNA (gRNA)와 비-특이적인 CRISPR-부속 엔도뉴클레아제로 이루어진 합성 CRISPR 시스템을 이용해, 타겟팅할 유전자에 특이적이면서 엔도뉴클레아제 Cas9와 조합될 수 있는 gRNA를 공동-발현함으로써, 넉-아웃 세포 또는 동물을 구축할 수 있다. 특히, gRNA는, Cas 또는 임의의 다른 CRISPR 작동자 단백질 또는 이의 변이체 또는 촉매학적 활성 단편과 상호작용하는 하나의 도메인과, 대상 타겟 핵산과 상호작용하는 또 다른 도메인을 포함하는, 인공 분자이며, 즉 crRNA와 tracrRNA로 된 합성 융합체이다 ("싱글 가이드 RNA" (sgRNA) 또는 간단히 "gRNA"; Jinek et al., 2012, supa). 게놈 타겟은 뉴클레오티드 약 20개로 된 DNA 서열일 수 있으며, 이 타겟은 PAM 서열 바로 상류에 존재한다. PAM 서열은 타겟 결합에 특히 중요하며, 정확한 서열은 Cas9의 타입에 따라 결정되며, 예를 들어, 스트렙토코커스 피오게네스 유래 Cas9의 경우 5' NGG 3' 또는 5' NAG 3' (표준 IUPAC 뉴클레오티드 코드)를 인지한다 (Jinek et al., 2012, supra). 변형된 Cas 뉴클레아제를 사용해, 대상 타겟 서열에 타겟화된 단일 가닥 절단을 만들 수 있다. 이러한 Cas 닉카제를 다른 재조합 gRNA와 조합 사용하면, 이중 닉킹 시스템을 이용하여 높은 수준의 부위 특이적인 DNA 이중 가닥 절단을 도입할 수 있다. 하나 이상의 gRNA를 사용하면, 전체 특이성은 추가로 높이고, 오프-타겟 효과는 낮출 수 있다.
Cas9 단백질과 gRNA는, 일단 발현되면, gRNA "스캐폴드" 도메인과 Cas9 상의 표면-노출된 양 전하의 그루브 간의 상호작용을 통해, 리보뉴클레오-단백질 복합체를 형성한다. 중요한 점은, gRNA의 "스페이서" 서열이 자유로운 상태로 남아 타겟 DNA와 상호작용하게 된다는 것이다. Cas9-gRNA 복합체는 PAM을 가진 임의의 게놈 서열과 결합하지만, gRNA 스페이서가 타겟 DNA와 매칭되는 정도에 따라 Cas9의 절단 여부가 결정된다. Cas9-gRNA 복합체가 잠정적인 DNA 타겟에 결합하면, gRNA 타겟팅 서열의 3' 말단에 위치한 "시드 (seed)" 서열이 타겟 DNA에 대한 어닐링을 개시한다. 시드 서열과 타겟 DNA 서열이 매칭되면, gRNA는 타겟 DNA에 3'에서 5' 방향 (gRNA의 극성 (polarity)을 기준으로)으로 계속 어닐링하게 될 것이다.
최근, 타겟화된 게놈 조작에 CRISPR/Cas9 시스템과 더불어, 조작된 CRISPR/Cpf1 시스템이 점점 중요해지고 있다 (Zetsche et al., supra 및 EP 3 009 511 A2). 타입 V 시스템은 타입 II 시스템과 더불어 클래스 2 CRISPR 시스템에 속한다 (Makarova and Koonin Methods. Mol. Biol., 2015, 1311:47-753). Cpf1 작동자 단백질은, Cas9의 특징적인 아르기닌-풍부 클러스터에 대한 카운터파트와 더불어, Cas9의 해당 도메인에 상동적인 RuvC 유사 뉴클레아제 도메인을 포함하는 거대 단백질 (아미노산 약 1,3000개)이다. 그러나, Cpf1에는 모든 Cas9 단백질에 존재하는 HNH 뉴클레아제 도메인이 없으며, HNH 도메인 등의 긴 삽입체를 포함하고 있는 Cas9와는 달리 Cpf1 서열에서는 RuvC-유사 도메인이 연속적이다 (Chylinski, 2014; Makarova, 2015). Cpf1 작동자는 Cas9 작동자와 비교해 구체적인 차이가 있으며, 즉 CRISPR 어레이 프로세싱, 짧은 T-풍부 PAM에 의한 타겟 DNA의 효과적인 절단 (PAM이 G-풍부 서열 앞에 있는 Cas9과 대조적으로), 및 Cpf1에 의한 엇갈린 형태의 (staggered) DNA 이중 가닥 절단 도입에, 부가적인 트랜스-활성화 crRNA (tracrRNA)가 요구되지 않는다. 극히 최근에, CasX 및 CasY에 기반한 부가적인 새로운 CRISPR-Cas 시스템이 동정되었으며, 이는 작동자 단백질의 비교적 작은 크기로 인해 수많은 유전자 편집 또는 게놈 조작 방식에서 특히 주목을 받고 있다 (Burstein et al., "New CRISPR-Cas systems from uncultivated microbes", Nature, December 2016).
여전히, CRISPR 시스템 그 자체는 타겟 세포의 대상 게놈 내 바람직한 위치에 점 돌연변이를 형성하는 고유한 능력이 결핍되어 있다.
이중 가닥 절단 (DSB)를 도입하는 CRISPR 시스템과 같은 게놈 조작 도구는 DSB 복구 기전이 필요하다. 이러한 기전은 2가지 주된 기본 타입, 즉 비-상동적인 말단 연결 (non-homologous end joining, NHEJ)과 상동적인 재조합 (homologous recombination, HR)으로 분류된다. 상동성에 기초한 복구 기전은 대개 일반적으로 상동성-특이적인 복구 (HOR)로 지칭된다.
NHEJ는 상동적인 서열이 필요없는 동식물에서의 지배적인 핵 반응이지만, 흔히 오류가 발생하며, 따라서 잠재적으로 돌연변이 유발성이다 (Wyman C., Kanaar R. "DNA double-strand break repair: all's well that ends well", Annu. Rev. Genet. 2006; 40, 363-83). HOR에 의한 복구에는 상동성이 필요하지만, 절단된 염색체를 복구하기 위해 온전한 염색체를 이용하는 HOR 경로, 즉 이중 가닥 절단 복구 및 합성-의존적인 가닥 어닐링이 매우 정확하다. 고전적인 DSB 복구 경로에서, 3' 말단이 온전한 상동적인 주형에 침입해, DNA 복구 합성을 위한 프라이머로 사용되어, 궁극적으로 이중 홀리데이 정션 (double Holliday junction, dHJ)의 형성을 유도한다. dHJ는, 침입 가닥의 연장 (elongation)이 제2 DSB 말단으로부터 DNA를 "포획"하여 합성할 때 형성되는, 4 가닥의 갈라진 구조 (four-stranded branched structure)이다. 각각의 HJ는 2가지 방식 중 한가지 방식으로 절단에 의해 해리된다. 합성-의존적인 가닥 어닐링은 보존적이며, 오직 비-교차 방식 (non-crossover event)으로 이루어진다. 이는, 신규 합성된 서열들 모두 동일 분자 상에 존재한다는 것을 의미한다. NHEJ 복구 경로와 달리, 합성-의존적인 가닥 어닐링에서는 가닥 침투 및 D 루프 형성 후, 침투 가닥의 신규 합성된 부분이 주형으로부터 분리되고, 다른 DSB 말단 위치에서 비-침투 가닥의 가공된 말단 쪽으로 회귀한다. 비-침투 가닥의 3' 말단이 연장 및 라이게이션되어, 갭이 채워지게 된다. 아직 충분히 규명된 것은 아니지만 절단-유발성 복구 경로로 지칭되는, 또 다른 HOR 경로도 존재한다. 이 경로의 중요한 특징은 DSB에 복구에 사용될 수 있는 침투 말단이 단 하나라는 것이다.
따라서, 식물 게놈에 타겟화된 점 돌연변이를 도입하고 이 돌연변이를 활용하는 것이 오늘날 도전 과제이다. 또한, 부위-특이적인 뉴클제 (SSN)를 이용한 게놈 조작 가능성은 특히 대상 게놈이 식물 게놈과 같이 복합한 진핵생물 게놈인 경우 SSN에 의해 도입된 변형의 선별 문제를 여전히 가지고 있으며, 타겟화된 변형을 육종시 선별 라운드 동안 추적하여야 한다.
현재 게놈 조작 (GE)의 이용 잠재성이 풍부함에도 불구하고, 이러한 GE 방식 대부분은 하나의 SSN을 포함하는 복합체에 의해 타겟화된 대상 변형을 도입하는 것을 목표로 한다. 따라서, 이러한 타겟화된 변형을 후속 식물 육종을 위해 식물 생식질에 도입하는 것은 가능하지만, 여전히 타겟화된 변형을 후속 추적하는 것은 번거러운 일이다. 만일 선별 마커 또는 선별 마커 카세트를 사용해 선별하는 것을 보조하고, 따라서 잠재적으로 대상이 되는 세포를 분리한다면, 대상 유전자형/표현형 조합을 달성하기 위한 육종시, 연속적인 교배 라운드 후 식물 게놈으로부터 이러한 마커 카세트를 제거하는 것이 상당한 장애물로 여전히 남아있다.
동시에, 예를 들어, 대상 변형에 기반한 대상 형질, 엘리트 이벤트 (elite event) 또는 품종으로부터 교배할 우호적인 특성을 육종시 규정, 구축 또는 교배할 수 있는, 식물 육종에 적합한 새로운 방법을 제공할 필요도 있다. 여러가지 육종 단계 동안에 대상 형질의 존재 및 증폭을 스크리닝하는 것은 때때로 어렵거나 또는 시간이 매우 많이 소요된다.
따라서, 세포 및 식물을 단리하기 위해 더 좋은 방법, 바람직하게는 후속 선별 라운드에서 전이유전자성 마커 서열을 게놈에 삽입할 필요없는 방법이 필요하다. 또한, 선별 및 스크리닝 수단을 위해 외인성 전이유전자 서열을 도입하지 않는 매우 정확한 부위-특이적인 방식으로 구축할 수 있는, 선별가능한 마커 서열이 상당히 요구된다. 마지막으로, 육종시 연속적인 교배 및 선별 라운드 동안에 대상 형질을 생식질에 축적하기 위한 신속 육종을 돕는 새로운 전략을 규정할 필요성이 상당하다.
따라서, 본 발명의 기본 과제는 표현형으로 선별가능한 형질의 스크리닝 용이성을 이용함으로써 유전자 편집 물질로 처리 및 편집된 세포를 분리하는 새로운 방법을 제공하는 것이다. 이를 위해, 세포 및 그 후대에서 선별가능한 또는 기타 표현형을 부여하기 위한 타겟화된 변형을 제1 유전자에 만들어, 형질전환 선별가능한 마커 서열의 도입을 억제한다. 병행하여, 세포에 표현형을 부여하거나 또는 일반적으로 부여하지 않을 수 있는 타겟화된 변형을 대상 제2 유전자에 만든다. 제1 유전자 변형이 적용된 세포를 동정하기 위해, 제1 유전자에서의 변형에 의해 부여된 표현형을 이용하는 다른 방법 또는 선별 물질을 적용함으로써, 세포 및 이의 후대 세포 또는 식물을 무처리 세포 백그라운드로부터 분리 또는 재생할 수 있다. 대상 게놈에 존재하거나 또는 도입할 전이유전자성 선별 마커 서열의 사용없이, 보다 신속하고, 따라서 저렴한 선별을 제공하기 위해, 이들 개체군으로부터 제2 대상 유전자에 타겟화된 변형을 가진 세포 또는 식물을 동정하며, 제2 변형이 추구하는 실제 목표이다.
전술한 과제는, 전략을 제2 부위 특이적인 대상 변형 (site-directed modification of interest)의 타겟화된 도입과 더불어, 비-전이유전자성 및 표현형으로 선별가능한 변형의 부위-특이적인 도입을 병행하도록 정의함으로써, 본원에 상세히 기술된 바와 같이 달성하였다. 일반적으로, 제2 변형은, 이것으로 부여되는 표현형이 식물 재생 과정에서 발현되지 않거나 또는 관련없기 때문에, 선별 기회를 가지지 않을 것이다. 그래서, 본 발명의 방법의 기초가 되는 목적은 선별 도구로서 제1 변형을 이용하는 것이다. 전통적인 전략과 비교해, 본 발명의 방법은 전이유전자성 마커 유전자를 도입하지 않는 이점을 가진다. 대응되는 선별 물질로 선별가능한 선별 표현형을 이용하지 않는 경우와 비교해, 식물을 생성하는 세포 대부분을 차지할 비처리 세포를 모두 또는 대부분 제거함으로써 효율을 높이는 이점을 가진다. 제1 식물 게놈 타겟 부위에서 표현형으로 선별가능한 형질의 발현을 유발하는타겟화된 변형을 겪지 않은 비처리 세포를 제거함으로써, 생산하여야 하는 식물의 수가 크게 줄어들고, 제2 변형에 대해 분자 스크리닝해야 할 식물의 숫자도 상당히 줄어든다. 본 발명에 따른 방법은 따라서 육종 효율을 현저하게 높이고, 노동-집약적인 단계들을 회피한다.
구체적으로, 상기한 과제들은, 제1 측면에서, (a) 하나 이상의 제1 타겟화된 염기 변형을 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 타겟화된 염기 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계; (b) 하나 이상의 제2 타겟화된 변형을 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 제2 타겟화된 변형이 하나 이상의 부위-특이적인 작동자를 이용해 도입되어 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로 하나 이상의 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포 또는 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는 단계; 및 (c) (i) 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로 (ii) 제2 식물 게놈 타겟 부위에서 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써, 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계를 포함하는, 전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물 (whole plant)을 단리하는 방법을 제공함으로써, 달성되었다.
본 발명의 다양한 측면에 따른 일 구현예에서, (b) 부가적으로 복구 주형을 도입하여, 적어도 제2 식물 게놈 타겟 부위에서 타겟화된 서열 변환 (targeted sequence conversion) 또는 치환을 만드는 단계를 포함하는, 방법을 제공한다.
추가적인 구현예에서, 제1 측면에 따른 방법은, (d) 하나 이상의 제1 타겟화된 변형 및 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리 (segregation)함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 더 포함한다.
일 구현예에서, 하나 이상의 부위-특이적인 작동자는 하나 이상의 염기 편집 복합체와 일시적으로 또는 영구적으로 연결되며, 염기 편집 복합체는 단계 (a)의 하나 이상의 제1 타겟화된 염기 변형을 매개한다.
추가적인 구현예에서, 하나 이상의 부위-특이적인 작동자는 CRISPR 뉴클레아제, 예로 Cas 또는 Cpf1 뉴클레아제, TALEN, ZFN, 메가뉴클레아제, 아르고너트 (Argonaute) 뉴클레아제, 제한 엔도뉴클레아제, 예로, FokI 또는 이의 변이체, 재조합효소 또는 2 부위-특이적인 닉킹 엔도뉴클레아제, 또는 염기 편집기 (base editor), 또는 전술한 작동자의 임의의 변이체 또는 촉매학적으로 활성인 단편을 포함하는, 하나 이상의 뉴클레아제로부터 선택된다.
다른 추가의 구현예에서, 하나 이상의 부위-특이적인 작동자는 CRISPR-기반의 뉴클레아제이며, CRISPR-기반의 뉴클레아제는 하나 이상의 염기 편집 복합체에 관한 부위-특이적인 DNA 결합 도메인 (site-specific DNA binding domain directing the at least one base editing complex)을 포함하며, 하나 이상의 CRISPR-기반의 뉴클레아제 또는 이를 코딩하는 핵산 서열은 (a) SpCas9, SaCas9, SaKKH-Cas9, VQR-Cas9, St1Cas9 등의 Cas9, (b) AsCpf1, LbCpf1, FnCpf1 등의 Cpf1, (c) CasX, 또는 (d) CasY, 또는 전술한 CRISPR-기반의 뉴클레아제의 임의 변이체 또는 유도체를 포함하는 군으로부터 선택되며, 바람직하게는 하나 이상의 CRISPR-기반의 뉴클레아제는 대응되는 야생형 서열과 비교해 돌연변이를 포함하므로, 형성되는 CRISPR-기반의 뉴클레아제는 단일 가닥 특이적인 DNA 닉카제 또는 모든 DNA 절단력이 결핍된 DNA 결합 작동자로 변환된다.
일 구현예에서, 제1 측면에 따른 하나 이상의 제1 타겟화된 염기 변형은 구성성분으로서 하나 이상의 염기 편집기를 포함하는 하나 이상의 염기 편집 복합체에 의해 만들어진다.
일 구현예에서, 염기 편집 복합체는 하나 이상의 시티딘 데아미나제 및 이의 촉매학적으로 활성인 단편을 포함한다.
추가적인 구현예에서, 하나 이상의 제1 타겟화된 염기 변형은 임의의 뉴클레오티드 C, A, T 또는 G가 임의의 다른 뉴클레오티드로 변환되는 것이다.
본 발명의 방법에 따른 일 구현예에서, 염기 편집 복합체는 APOBEC1 구성성분, UGI 구성성분, XTEN 구성성분 또는 PmCDA1 구성성분 중 하나 이상을 포함한다. 추가적인 구현예에서, 하나 이상의 염기 편집 복합체는 구성성분을 1개 보다 많이 포함하며, 2개 이상의 구성성분이 물질적으로 연결된다.
본 발명의 방법에 따른 일 측면에서, 하나 이상의 염기 편집 복합체는 하나 보다 많은 수의 구성성분을 포함하며, 2 이상의 구성성분은 개별 구성성분으로서 제공된다.
본 발명의 방법에 따른 추가적인 구현예에서, 하나 이상의 염기 편집 복합체의 하나 이상의 구성성분은 하나 이상의 염기 편집 복합체를 세포내 소기관으로 타겟팅하기 위한 하나 이상의 소기관 위치화 신호를 포함한다. 일 구현예에서, 하나 이상의 소기관 위치화 신호는 핵 위치화 신호 (NLS)이며, 추가적인 구현예에서, 하나 이상의 소기관 위치화 신호는 엽록체 수송 펩타이드이다. 다른 추가의 구현예에서, 하나 이상의 소기관 위치화 신호는 미토콘드리아 수송 펩타이드이다.
본 발명의 방법의 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 게놈 타겟 부위이고, 하나 이상의 표현형으로 선별가능한 형질은 내성 형질/허용성 형질 (tolerance trait) 또는 생장 우세 형질 (growth advantage trait)이며, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형은 하나 이상의 변형된 식물 세포, 조직 또는 식물 또는 그 자손에 부가할, 화합물 또는 촉발인자에 대한 내성/허용성 또는 생장 우세 (growth advantage)를 부여한다.
일 구현예에서, 하나 이상의 표현형으로 선별가능한 대상 형질은 하나 이상의 내인성 유전자이거나 또는 이에 의해 코딩되거나, 또는 하나 이상의 대상 표현형 형질은 하나 이상의 전이유전자이거나 또는 이에 의해 코딩되며, 하나 이상의 내인성 유전자 또는 하나 이상의 전이유전자는 하나 이상의 대상 표현형 형질에서 하나 이상의 변형이 결핍된 세포를 저해, 손상 또는 사멸시키는, 식물독소, 바람직하게는 제초제에 대한 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형 형질을 코딩하거나, 또는 하나 이상의 표현형 형질은 세포 분열, 증식 속도, 배발생 또는 비-변형된 세포, 조직, 기관 또는 식물과 비교해 변형된 세포, 조직, 기관 또는 식물에 우세를 제공하는 다른 표현형으로 선별가능한 특성의 부스터 (booster)로 이루어진 군으로부터 선택된다.
일 구현예에서, 하나 이상의 제1 식물 게놈 타겟 부위는 제초제 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 하나 이상의 내인성 유전자 또는 전이유전자이며, 제초제 내성/허용성은 글리포세이트 등의 EPSPS-저해제에 대한 내성/허용성, 글루포시네이트 등의 글루타민 합성 저해제에 대한 내성/허용성, 이미다졸린 또는 설포닐우레아 등의 ALS- 또는 AHAS-저해제에 대한 내성/허용성, 아릴옥시페녹시프로피오네이트 (FOP) 등의 ACCase 저해제에 대한 내성/허용성, 피토엔 데세투라제 (phytoene desaturase) 단계에서 카로티노이드 생합성의 저해제, 4-하이드록시페닐-피루베이트-다이옥시게나제 (HPPD)의 저해제 또는 기타 카로티노이드 생합성 타겟의 저해제 등의 카로티노이드 생합성 저해제에 대한 내성/허용성, 셀룰로스 저해제에 대한 내성/허용성, 지질 합성 저해제에 대한 내성/허용성, 장쇄 지방산 저해제에 대한 내성/허용성, 미소관 조립 저해제에 대한 내성/허용성, 광화학계 I 전자 전환체 (photosystem I electron diverter)에 대한 내성/허용성, 카바메이트, 트리아진 및 트리아지논 등의 광화학계 II 저해제에 대한 내성/허용성, PPO-저해제에 대한 내성/허용성 및 디캄바 (2,4-D, 즉, 2,4-다이클로로페녹시아세트산) 등의 합성 옥신에 대한 내성/허용성으로 이루어진 군으로부터 선택된다.
추가적인 구현예에서, 하나 이상의 표현형으로 선별가능한 형질은 식물독성 내성/허용성 형질, 바람직하게는 제초제 내성/허용성 형질이며, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형은 식물독성 화합물, 바람직하게는 제초제에 대해 내성/허용성을 부여하며, 이 화합물은 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물, 또는 그 자손에 부가될 외인성 화합물이다.
일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 ALS이다. 다른 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 PPO이다. 또 다른 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 EPSPS, ALS 또는 PPO이고, EPSPS, ALS 또는 PPO는 하나 이상의 대응되는 아미노산 변환을 만드는 하나 이상의 핵산 변환을 포함하며, 하나 이상의 핵산 변환은 하나 이상의 염기 편집기에 의해 수행된다.
일 구현예에서, 본 발명의 방법은 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 타겟화된 변형의 도입을 포함하며, 제1 식물 게놈 타겟 부위는 ALS이고, 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 A122를 코딩하는 서열에서, 또는 서열번호 25에 따른 ALS 참조 서열과 비교해 P197을 코딩하는 서열에서, 또는 서열번호 25에 따른 ALS 참조 서열과 비교해 A205를 코딩하는 서열에서, 또는 서열번호 25에 따른 ALS 참조 서열과 비교해 D376을 코딩하는 서열에서, 또는 서열번호 25에 따른 ALS 참조 서열과 비교해 R377을 코딩하는 서열에서 발생한다. 또 다른 구현예에서, 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 W574를 코딩하는 서열에서 발생한다. 일 구현예에서, 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 S653을 코딩하는 서열에서 발생한다. 일 구현예에서, 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 G654를 코딩하는 서열에서 발생한다.
본 발명의 방법의 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 PPO이고, 타겟화된 변형은 서열번호 26에 따른 PPO 참조 서열과 비교해 C215를 코딩하는 서열에서 발생한다. 다른 구현예에서, 타겟화된 변형은 서열번호 26에 따른 PPO 참조 서열과 비교해 A220을 코딩하는 서열에서 발생한다. 추가적인 구현예에서, 타겟화된 변형은 서열번호 26에 따른 PPO 참조 서열과 비교해 G221을 코딩하는 서열에서 발생한다. 다른 추가의 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 PPO이고, 타겟화된 변형은 서열번호 26에 따른 PPO 참조 서열과 비교해 N425를 코딩하는 서열에서, 또는 서열번호 26에 따른 PPO 참조 서열과 비교해 I475를 코딩하는 서열에서 발생한다.
본 발명의 방법에 따른 일 측면에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 EPSPS이고, 타겟화된 변형은 서열번호 27에 따른 EPSPS 참조 서열과 비교해, G101 및 G144를 코딩하는 서열에서, G101 및 A192를 코딩하는 서열에서, 또는 T102 및 P106을 코딩하는 서열에서 발생한다.
제1 게놈 타겟 부위의 타겟화된 변형들의 추가적인 조합 또는 부가적인 변형도 본 발명의 범위에 포함된다.
본 발명의 방법에 대한 일 구현예에서, 하나 이상의 표현형으로 선별가능한 형질은 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 동정 또는 분리하는데 유용한 가시적인 표현형 (visible phenotype)이다. 하나 이상의 표현형으로 선별가능한 형질은 광택 표현형, 골든 표현형, 생장 우세 표현형 또는 색소 표현형 또는 임의의 다른 가시적으로 스크리닝가능한 표현형일 수 있다.
본 발명에 따른 제2 측면에서, (a) 하나 이상의 제1 타겟화된 코돈 결손 변형을 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 뉴클레아제, 재조합효소 또는 DNA 변형 물질을 포함하는 하나 이상의 제1 부위-특이적인 작동자를 이용해 도입하는 단계로서, 하나 이상의 타겟화된 코돈 결손 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계; (b) 하나 이상의 제2 타겟화된 변형을 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 제2 타겟화된 변형이 하나 이상의 제2 부위-특이적인 작동자를 이용해 도입되어 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로 하나 이상의 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포 또는 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및 (c) (i) 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 코돈 결손 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로 (ii) 제2 식물 게놈 타겟 부위에서 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써, 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계, 및 선택적으로 (d) 하나 이상의 제1 타겟화된 변형 및 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 포함하는, 전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물을 단리하는 방법을 제공한다.
본 발명은, 다른 측면에서, (a) 하나 이상의 제1 타겟화된 프래임쉬프트 (frameshift) 또는 결손 변형을 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 하나 이상의 제1 부위-특이적인 작동자를 사용해 도입하는 단계로서, 하나 이상의 타겟화된 프래임쉬프트 또는 결손 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계; (b) 하나 이상의 제2 타겟화된 변형을 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 제2 타겟화된 변형이 뉴클레아제, 재조합효소 또는 DNA 변형 물질을 포함하는 하나 이상의 제2 부위-특이적인 작동자를 이용해 도입되어, 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로 하나 이상의 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포, 또는 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 완전한 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및 (c) (i) 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 프래임쉬프트 또는 결손 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로, 추가적으로 (ii) 제2 식물 게놈 타겟 부위에서 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써, 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계, 그리고 선택적으로, (d) 하나 이상의 제1 타겟화된 변형 및 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 포함하는, 전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물을 단리하는 방법을 제공한다.
상기한 측면에 따른 일 구현예에서, 바람직하게는 단계 (b)는 복구 주형을 도입하여 하나 이상의 제1 및/또는 제2 식물 게놈 타겟 부위에 타겟화된 서열 변형 또는 치환을 만드는 것을 더 포함한다.
추가적인 구현예에서, 하나 이상의 부위-특이적인 작동자는 하나 이상의 CRISPR 뉴클레아제, 예로 Cas 또는 Cpf1 뉴클레아제, TALEN, ZFN, 메가뉴클레아제, 아르고너트 (Argonaute) 뉴클레아제, 제한 엔도뉴클레아제, 예로, FokI 또는 이의 변이체, 재조합효소 또는 2 부위-특이적인 닉킹 엔도뉴클레아제, 또는 전술한 작동자의 임의의 변이체 또는 촉매학적으로 활성인 단편으로부터 선택된다.
본 발명의 다양한 측면에 따른 일 구현예에서, 하나 이상의 부위-특이적인 작동자는 CRISPR-기반의 뉴클레아제이고, CRISPR-기반의 뉴클레아제는 부위-특이적인 DNA 결합 도메인을 포함하고, 하나 이상의 CRISPR-기반의 뉴클레아제, 또는 이를 코딩하는 핵산 서열은 (a) SpCas9, SaCas9, SaKKH-Cas9, VQR-Cas9, St1Cas9 등의 Cas9, (b) AsCpf1, LbCpf1, FnCpf1 등의 Cpf1, (c) CasX, 또는 (d) CasY, 또는 전술한 CRISPR-기반의 뉴클레아제의 임의 변이체 또는 유도체를 포함하는 군으로부터 선택되고, 선택적으로 하나 이상의 CRISPR-기반의 뉴클레아제는 해당 야생형 서열과 비교해 돌연변이를 포함하여, 제조되는 CRISPR-기반의 뉴클레아제는 단일 가닥 특이적인 DNA 닉카제, 또는 모든 DNA 절단력이 결핍된 DNA 결합 작동자로 변환된다.
본 발명의 측면들에 따른 추가적인 구현예에서, 적어도 부위-특이적인 작동자, 또는 하나 이상의 부위-특이적인 작동자를 포함하는 복합체의 하나 이상의 구성성분은, 하나 이상의 염기 편집 복합체를 세포내 소기관으로의 타겟화하기 위한 하나 이상의 소기관 위치화 신호를 포함하며, 하나 이상의 소기관 위치화 신호는 핵 위치화 신호 (NLS), 엽록체 수송 펩타이드, 또는 미토콘드리아 수송 펩타이드로부터 선택될 수 있다.
전술한 측면들의 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 게놈 타겟 부위이고, 하나 이상의 표현형으로 선별가능한 형질은 내성/허용성 형질 또는 생장 우세 형질이고, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형은 하나 이상의 변형된 식물 세포, 조직 또는 식물, 또는 그 자손에 부가될 화합물 또는 촉발제에 대해 내성/허용성 또는 생장 우세를 부여한다.
상기한 측면들에 대한 추가적인 구현예에서, 하나 이상의 표현형으로 선별가능한 대상 형질은 하나 이상의 내인성 유전자이거나 또는 이에 의해 코딩되거나, 또는 하나 이상의 대상 표현형 형질은 하나 이상의 전이유전자이거나 또는 이에 의해 코딩되며, 하나 이상의 내인성 유전자 또는 하나 이상의 전이유전자는 하나 이상의 대상 표현형 형질에 하나 이상의 변형이 결핍된 세포를 저해, 손상 또는 사멸시키는, 식물독소, 바람직하게는 제초제에 대한 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형 형질을 코딩하거나, 또는 하나 이상의 표현형 형질은 세포 분열, 증식 속도, 배발생 또는 비-변형된 세포, 조직, 기관 또는 식물과 비교해 변형된 세포, 조직, 기관 또는 식물에 우세를 제공하는 다른 표현형으로 선별가능한 특성의 부스터로 이루어진 군으로부터 선택된다.
상기한 측면에 대한 다른 추가의 구현예에서, 하나 이상의 제1 식물 게놈 타겟 부위는 제초제 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 하나 이상의 내인성 유전자 또는 전이유전자이며, 제초제 제초제 내성/허용성은 글리포세이트 등의 EPSPS-저해제에 대한 내성/허용성, 글루포시네이트 등의 글루타민 합성 저해제에 대한 내성/허용성, 이미다졸린 또는 설포닐우레아 등의 ALS- 또는 AHAS-저해제에 대한 내성/허용성, 아릴옥시페녹시프로피오네이트 (FOP) 등의 ACCase 저해제에 대한 내성/허용성, 피토엔 데세투라제 단계에서 카로티노이드 생합성의 저해제, 4-하이드록시페닐-피루베이트-다이옥시게나제 (HPPD)의 저해제 또는 기타 카로티노이드 생합성 타겟의 저해제 등의 카로티노이드 생합성 저해제에 대한 내성/허용성, 셀룰로스 저해제에 대한 내성/허용성, 지질 합성 저해제에 대한 내성/허용성, 장쇄 지방산 저해제에 대한 내성/허용성 지방산 저해제, 미소관 조립 저해제에 대한 내성/허용성, 광화학계 I 전자 전환체에 대한 내성/허용성, 카바메이트, 트리아진 및 트리아지논 등의 광화학계 II 저해제에 대한 내성/허용성, PPO-저해제에 대한 내성/허용성 및 디캄바 (2,4-다이클로로페녹시아세트산) 등의 합성 옥신에 대한 내성/허용성으로 이루어진 군으로부터 선택된다.
전술한 측면들의 일 구현예에서, 하나 이상의 표현형으로 선별가능한 형질은 식물독성 내성/허용성 형질, 바람직하게는 제초제 내성/허용성 형질이며, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 코돈 결손 또는 프래임쉬프트 또는 결손 변형은 식물독성 화합물, 바람직하게는 제초제에 대한 내성/허용성을 부여하며, 이 화합물은 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물, 또는 그 자손에 부가될 외인성 화합물이다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 선별 목적으로 아마란투스 투베르쿨라투스 (Amaranthus tuberculatus)로부터 유래된 PPX2L 유전자 산물의 상동체이다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 제1 타겟화된 염기 변형, 타겟화된 코돈 결손 또는 타겟화된 프래임쉬프트 또는 결손 변형은 서열번호 28에 따른 아마란투스 투베르쿨라투스 (Amaranthus tuberculatus)의 PPX2L 유전자 산물의 G210 잔기에 상응하는 위치에서 이루어진다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 표현형으로 선별가능한 형질은 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 동정 또는 단리하는데 유용한 가시적인 표현형이다. 본 발명의 다양한 측면들에 따른 하나 이상의 표현형으로 선별가능한 형질은 광택 표현형, 골든 표현형, 생장 우세 표현형 또는 색소 표현형 또는 임의의 다른 가시적으로 스크리닝가능한 표현형일 수 있다.
본 발명의 모든 측면에 따른 방법의 일 구현예에서, 변형할 하나 이상의 식물 세포는 바람직하게는 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays) 등의 지 spp. (Zea spp.), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris) 등의 베타 spp., 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 넥수오사 (Cardamine nexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp . sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카야누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 전술한 식물들 중 하나에 속하는 임의 품종 또는 아종으로 이루어진 군으로부터 선택되는 식물로부터 유래된다.
도 1 (도 1 A - C)은 예를 들어 식물 육종 및 타겟화된 선별 전략에서 선별시 대상 세포를 단리하기 위해 본 발명에 따른 방법을 수행하는 방식을 예시한 것이다. 도 1A는 염기 편집기 (BE) 또는 BE 복합체, 및 편집 물질, 즉, 부위-특이적인 뉴클레아제 (SSN)를 포함하는 부위-특이적인 작동자를 2개의 서로 다른 게놈 위치에서 병행하여 세포에 처리한 것을 보여준다. 화살표는, 염기 편집기 (복합체) 및 부위-특이적인 작동자가 2개의 타겟화된 부위-특이적인 변형을 도입하게 되는 타겟 부위를 표시한다. 도 1B는 도 1A에 예시된 선행 단계의 결과를 나타낸 것으로, 즉, BE (복합체)는 백색 강조 표시된 대상 유전자에 변형된 표현형을 도입하고, 부위-특이적인 작동자는 흑색으로 강도 표시된 형질 유전자에 타겟화된 편집을 도입한다. 따라서, 2개의 서로 다른 게놈 타겟 부위 내 2개의 개별 변형은 처리된 식물로부터 식물 세포 또는 식물의 단리를 허용한다. 그런 후, 식물에서 대상 유전자에서의 편집을 스크리닝할 수 있으며, 이는 일반적으로 스크리닝 목적으로 사용되는 변형된 표현형과는 상이하다. 도 1C는 바람직한 유전자형을 달성하기 위한 식물 분리 결과를 나타낸 것이다. 이러한 바람직한 대상 유전자형은 부위-특이적인 작동자를 통해 도입된 타겟화된 변형 (검정)을 포함하지만, 변형된 표현형 변형을 더 이상 포함하지 않으며, 변형된 표현형 변형은 스크리닝 목적으로 도입된 것이며, 실시예에서 제조되는 식물 세포, 조직, 기관 또는 완전한 식물의 게놈에 게놈 형질로서 포함되지 않는다.
도 2는 TaALS S1 부위의 공동-편집에 의한 강화된 스크리닝 효율을 예시한 것이다.
도 3은 TaALS-P173 편집에 의한 제초제 내성 밀을 예시한 것이다.
도 4는 ZmALS-P165 편집에 의한 제초제 내성 옥수수의 구축을 예시한 것이다.
도 5는 옥수수에서 편집할 제초제 내성 부위 및 서열 구조를 예시한 것이다.
도 6은 ZmALS-P197 및 ZmALS-G654의 효율적인 편집을 예시한 것이다.
도 7은 ZmALS-P197 및 ZmALS-G654의 바람직한 제초제 내성-부여 잔기로의 변환 효율을 예시한 것이다.
서열:
서열번호 1은 APOBEC1 (랫 시티딘 데아미나제) - XTEN 링커의 뉴클레오티드 서열이다 (예, Schellenberger et al., "A recombinant polypeptide extends the in vivo half-life of peptides and proteins in a tunable manner", Nature Biotechnol. 27, 1186-1190 (2009)) - nCas9(D10A) - UGI (우라실 DNA 글리코실라제 저해제) - NLS 코딩 구조체, 코돈 최적화되지 않음. 이 서열은 3' 정지 코돈 TAA를 포함한다.
서열번호 2는 곡류 식물에서 사용하기 위해 코돈 최적화된 APOBEC1 - XTEN 링커 - nCas9(D10A) - UGI - NLS 코딩 구조체의 뉴클레오티드 서열이다. 이 서열은 3' 정지 코돈 TAG를 포함한다.
서열번호 3은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_ALS1&2_P197S/L/F의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 ALS 상동체에서의 잔기 배열을 기반으로 한다. 이 서열은 SpCas9-유래 (스크렙토코커스 피오게네스 Cas9-유래) 기반의 편집기에 적용된다.
서열번호 4는 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_ALS1&2_P197S/L/F의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 ALS 상동체에서의 잔기 배열을 기반으로 한다. 이 서열은 SaKKH-BE3-유래 기반의 편집기에 적용된다 (스타필로코커스 아우레우스 Cas9 (SaCas9)-유래의 SaCas9 돌연변이, PAM 특이성이 완화됨).
서열번호 5는 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_ALS1&2_P197S/L/F의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 ALS 상동체에서의 잔기 배열을 기반으로 한다. 이 서열은 VQR-BE3-유래 기반의 편집기에 적용된다 (스타필로코커스 아우레우스 Cas9 (SaCas9)-유래의 SaCas9 돌연변이, 여러가지 PAM 특이성을 가짐).
서열번호 6은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_ALS1&2_S653N의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 ALS 상동체에서의 잔기 배열을 기반으로 한다. 이 서열은 SpCas9-유래 기반의 편집기에 적용된다.
서열번호 7은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_A220_&_G221의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 SpCas9-유래 기반의 편집기에 적용된다.
서열번호 8은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_A220_&_G221의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 SaKKH-BE3-유래 기반의 편집기에 적용된다.
서열번호 9는 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_A220_&_G221의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 VQR-BE3-유래 기반의 편집기에 적용된다.
서열번호 10은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_C215의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 SpCas9-유래 기반의 편집기에 적용된다.
서열번호 11은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_C215의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 SaKKH-BE3-유래 기반의 편집기에 적용된다.
서열번호 12는 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_C215의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 SaKKH-BE3-유래 기반의 편집기에 적용된다.
서열번호 13은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_C215의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 VQR-BE3-유래 기반의 편집기에 적용된다.
서열번호 14는 코돈 최적화된 APOBEC1 - XTEN 링커 - CasX1 - UGI - NLS 코딩 구조체의 뉴클레오티드 서열이다. 이 서열은 3' 정지 코돈 TAG를 포함한다.
서열번호 15는 코돈 최적화된 APOBEC1 - XTEN 링커 - AsCpf1(R1226A) (액시드아미노코커스 sp . R1226A 돌연변이를 가진 Cpf1)- UGI - NLS 코딩 구조체의 뉴클레오티드 서열이다. 이 서열은 3' 정지 코돈 TAG를 포함한다.
서열번호 16은 NLS - dCas9 - NLS - 링커 - PmCDA1 (바다 칠성장어 (sea lamprey) 유래의 활성화-유도된 시티딘 데아미나제 (AID) 오르소로그 PmCDA1, Nishida et al. (Science 2016, vol. 353, issue 6305, aaf8729) 참조) - UGI를 코딩하는 구조체의 뉴클레오티드 서열이다. 이 서열은 3' 정지 코돈 TAG를 포함한다.
서열번호 17은 예시적인 Cas9 닉카제 n(i)Cas9 (D10A)를 코딩하는 뉴클레오티드 서열이다.
서열번호 18은 예시적인 CasX를 코딩하는 뉴클레오티드 서열이다.
서열번호 19는 예시적인 AsCpf1 (R1226A)을 코딩하는 뉴클레오티드 서열이다.
서열번호 20은 예시적인 APOBEC1을 코딩하는 뉴클레오티드 서열이다.
서열번호 21은 예시적인 UGI를 코딩하는 뉴클레오티드 서열이다.
서열번호 22는 예시적인 PmCDA1을 코딩하는 뉴클레오티드 서열이다.
서열번호 23은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_N425_&Y426의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 VQR-BE3-유래 기반의 편집기에 적용된다.
서열번호 24는 액시드아미노코커스 sp BV3L6 Cpf1 (AsCpf1), UniProtKB/Swiss-Prot identifier: U2UMQ6.1의 서열이다.
서열번호 25는 아라비돕시스 탈리아나 유래의 아세토락테이트 신타제 (ALS) (엽록체), GenBank: AAW70386의 서열이다.
서열번호 26은 아라비돕시스 탈리아나 프로토포르피리노겐 옥시다제 (PPO)의 서열이다.
서열번호 27은 엽록체 수송 펩타이드가 제거된 성숙 단백질인 아라비돕시스 탈리아나 5-에놀피루빌쉬키메이트-3-포스페이트 신타제 (EPSPS)의 서열이다; NCBI accession AAY25438.
서열번호 28은 아마란투스 투베르쿨라투스 (Amaranthus tuberculatus) 미토콘드리아 프로토포르피리노겐 옥시다제 (PPX2L), cf. NCBI accession DQ386114의 서열이다.
도 2는 TaALS S1 부위의 공동-편집에 의한 강화된 스크리닝 효율을 예시한 것이다.
도 3은 TaALS-P173 편집에 의한 제초제 내성 밀을 예시한 것이다.
도 4는 ZmALS-P165 편집에 의한 제초제 내성 옥수수의 구축을 예시한 것이다.
도 5는 옥수수에서 편집할 제초제 내성 부위 및 서열 구조를 예시한 것이다.
도 6은 ZmALS-P197 및 ZmALS-G654의 효율적인 편집을 예시한 것이다.
도 7은 ZmALS-P197 및 ZmALS-G654의 바람직한 제초제 내성-부여 잔기로의 변환 효율을 예시한 것이다.
서열:
서열번호 1은 APOBEC1 (랫 시티딘 데아미나제) - XTEN 링커의 뉴클레오티드 서열이다 (예, Schellenberger et al., "A recombinant polypeptide extends the in vivo half-life of peptides and proteins in a tunable manner", Nature Biotechnol. 27, 1186-1190 (2009)) - nCas9(D10A) - UGI (우라실 DNA 글리코실라제 저해제) - NLS 코딩 구조체, 코돈 최적화되지 않음. 이 서열은 3' 정지 코돈 TAA를 포함한다.
서열번호 2는 곡류 식물에서 사용하기 위해 코돈 최적화된 APOBEC1 - XTEN 링커 - nCas9(D10A) - UGI - NLS 코딩 구조체의 뉴클레오티드 서열이다. 이 서열은 3' 정지 코돈 TAG를 포함한다.
서열번호 3은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_ALS1&2_P197S/L/F의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 ALS 상동체에서의 잔기 배열을 기반으로 한다. 이 서열은 SpCas9-유래 (스크렙토코커스 피오게네스 Cas9-유래) 기반의 편집기에 적용된다.
서열번호 4는 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_ALS1&2_P197S/L/F의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 ALS 상동체에서의 잔기 배열을 기반으로 한다. 이 서열은 SaKKH-BE3-유래 기반의 편집기에 적용된다 (스타필로코커스 아우레우스 Cas9 (SaCas9)-유래의 SaCas9 돌연변이, PAM 특이성이 완화됨).
서열번호 5는 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_ALS1&2_P197S/L/F의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 ALS 상동체에서의 잔기 배열을 기반으로 한다. 이 서열은 VQR-BE3-유래 기반의 편집기에 적용된다 (스타필로코커스 아우레우스 Cas9 (SaCas9)-유래의 SaCas9 돌연변이, 여러가지 PAM 특이성을 가짐).
서열번호 6은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_ALS1&2_S653N의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 ALS 상동체에서의 잔기 배열을 기반으로 한다. 이 서열은 SpCas9-유래 기반의 편집기에 적용된다.
서열번호 7은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_A220_&_G221의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 SpCas9-유래 기반의 편집기에 적용된다.
서열번호 8은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_A220_&_G221의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 SaKKH-BE3-유래 기반의 편집기에 적용된다.
서열번호 9는 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_A220_&_G221의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 VQR-BE3-유래 기반의 편집기에 적용된다.
서열번호 10은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_C215의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 SpCas9-유래 기반의 편집기에 적용된다.
서열번호 11은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_C215의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 SaKKH-BE3-유래 기반의 편집기에 적용된다.
서열번호 12는 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_C215의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 SaKKH-BE3-유래 기반의 편집기에 적용된다.
서열번호 13은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_C215의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 VQR-BE3-유래 기반의 편집기에 적용된다.
서열번호 14는 코돈 최적화된 APOBEC1 - XTEN 링커 - CasX1 - UGI - NLS 코딩 구조체의 뉴클레오티드 서열이다. 이 서열은 3' 정지 코돈 TAG를 포함한다.
서열번호 15는 코돈 최적화된 APOBEC1 - XTEN 링커 - AsCpf1(R1226A) (액시드아미노코커스 sp . R1226A 돌연변이를 가진 Cpf1)- UGI - NLS 코딩 구조체의 뉴클레오티드 서열이다. 이 서열은 3' 정지 코돈 TAG를 포함한다.
서열번호 16은 NLS - dCas9 - NLS - 링커 - PmCDA1 (바다 칠성장어 (sea lamprey) 유래의 활성화-유도된 시티딘 데아미나제 (AID) 오르소로그 PmCDA1, Nishida et al. (Science 2016, vol. 353, issue 6305, aaf8729) 참조) - UGI를 코딩하는 구조체의 뉴클레오티드 서열이다. 이 서열은 3' 정지 코돈 TAG를 포함한다.
서열번호 17은 예시적인 Cas9 닉카제 n(i)Cas9 (D10A)를 코딩하는 뉴클레오티드 서열이다.
서열번호 18은 예시적인 CasX를 코딩하는 뉴클레오티드 서열이다.
서열번호 19는 예시적인 AsCpf1 (R1226A)을 코딩하는 뉴클레오티드 서열이다.
서열번호 20은 예시적인 APOBEC1을 코딩하는 뉴클레오티드 서열이다.
서열번호 21은 예시적인 UGI를 코딩하는 뉴클레오티드 서열이다.
서열번호 22는 예시적인 PmCDA1을 코딩하는 뉴클레오티드 서열이다.
서열번호 23은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_N425_&Y426의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 VQR-BE3-유래 기반의 편집기에 적용된다.
서열번호 24는 액시드아미노코커스 sp BV3L6 Cpf1 (AsCpf1), UniProtKB/Swiss-Prot identifier: U2UMQ6.1의 서열이다.
서열번호 25는 아라비돕시스 탈리아나 유래의 아세토락테이트 신타제 (ALS) (엽록체), GenBank: AAW70386의 서열이다.
서열번호 26은 아라비돕시스 탈리아나 프로토포르피리노겐 옥시다제 (PPO)의 서열이다.
서열번호 27은 엽록체 수송 펩타이드가 제거된 성숙 단백질인 아라비돕시스 탈리아나 5-에놀피루빌쉬키메이트-3-포스페이트 신타제 (EPSPS)의 서열이다; NCBI accession AAY25438.
서열번호 28은 아마란투스 투베르쿨라투스 (Amaranthus tuberculatus) 미토콘드리아 프로토포르피리노겐 옥시다제 (PPX2L), cf. NCBI accession DQ386114의 서열이다.
정의:
본원에서, 단수 형태 ("a" "an" 및 "the")는 문맥 상 명확하게 달리 언급되지 않은 한 복수의 언급도 포함하는 것임에 유념하여야 한다. 예를 들어, 구성성분을 언급하는 것은 복수의 구성성분들로 된 조성물을 포함하는 것으로 의도된다. "a" 구성요소를 포함하는 조성물을 언급하는 것은 언급된 것 외에도 다른 구성요소를 포함하는 것으로 의도된다. 즉, 용어 "a" "an" 및 "the"는 수적인 제한을 나타내는 것이 아니라 언급된 항목이 하나 이상 존재하는 것을 의미한다. 각 용어는 당해 기술 분야의 당업자가 이해하는 가장 넓은 의미로 간주되며, 비슷한 목적을 달성하기 위해 유사한 방식으로 작동하는 모든 기술적인 균등물을 포괄하는 것으로 의도된다.
범위는 본원에서 "약" 또는 "대략" 또는 "실질적으로" 하나의 특정 수치 형태로서 및/또는 "약" 또는 "대략" 또는 "실질적"으로 다른 특정 수치 형태로서 표현될 수 있다. 이러한 범위로 표현되는 경우, 그외 예시적인 구현예들은 하나의 특정 수치에서 및/또는 다른 특정 수치까지를 포함한다. 나아가, 용어 "약"은, 수치가 측정 또는 결정되는 방식, 즉 측정 시스템의 한계에 따라 일부 결정되는, 당해 기술 분야의 당업자에 의해 결정된 특정 수치에 대한 허용가능한 오차 범위 내인 것으로 이해된다. 예를 들어, "약"은 당해 기술 분야에서 실시시 허용가능한 표준 편차 내인 것을 의미할 수 있다. 다른 예로, "약"은 주어진 수치에서 최대 ±20%, 바람직하게는 최대 5 내지 ±10%, 더 바람직하게 최대 ±5%, 더 더 바람직하게 최대 ±1%의 범위를 의미할 수 있다. 다른 예로, 생물 시스템 또는 프로세스와 특히 관련하여, 이 용어는 수치의 자릿수 이내, 바람직하게는 2배수 이내를 의미할 수 있다. 구체적인 수치가 출원서 및 청구항에 기술되어 있을 경우, 달리 언급되지 않은 한, 용어 "약"이 내포된 것이며, 문맥 상 구체적인 수치에 대해 허용가능한 오차 범위 내인 것을 의미한다.
"포함하는" 또는 "함유하는" 또는 "비롯하여"는 적어도 언급된 화합물, 요소, 입자 또는 방법 단계가 조성물 또는 물품 또는 방법에 존재하는 것을 의미하지만, 다른 화합물, 물질, 입자, 방법 단계가 명명된 바와 동일한 기능을 가지고 있더라도, 다른 화합물, 물질, 입자, 방법 단계의 존재를 배제하는 것은 아니다.
본원에서 아미노산 서열과 관련하여 용어 "촉매학적으로 활성인 단편 (catalytically active fragment)"은, 주형 서열의 활성 부위 전체 또는 일부를 포함하는, 주어진 주형 아미노산 서열로부터 유래된 코어 서열 또는 이를 코딩하는 핵산 서열을 지칭하는 것으로, 단 수득되는 촉매적으로 활성인 단편은 천연 효소의 활성 부위 또는 이의 변이체가 담당하는 주형 서열의 특징적인 활성을 여전히 유지한다. 이러한 변형은 주형 서열과 동일한 활성을 여전히 가지고 있는 크기가 작은 아미노산 서열을 만들어, 촉매적으로 활성인 단편을 보다 다목적의 또는 입체적으로 부담이 적은 보다 안정적인 도구로 만드는데 적합하다.
본원에서, "상보적인" 또는 "상보성"은 2개의 DNA, 2개의 RNA 또는 본 발명에 따른 하이브리드 서열, RNA와 DNA 핵산 영역들 간의 상관성을 나타내는 것이다. DNA 또는 RNA의 뉴클레오베이스에 의해 정의된 바에 따라, 2개의 핵산 영역은 자물쇠-열쇠 모형에 따라 서로 혼성할 수 있다. 이를 위해, 왓슨-크릭 염기 쌍 형성 원리는 상보적인 염기로서 아데닌과 티민/우라실뿐만 아니라 구아닌과 시토신을 각각 기본으로 한다. 또한, 리버스-왓슨-크릭, 후그스틴 (Hoogsteen), 리버스-후그스틴 및 워블 쌍 형성 (Wobble pairing)과 같은 비-왓슨-크릭 쌍 형성도, 각각의 염기 쌍들이 서로 수소 결합을 형성할 수 있는 한, 즉 2개의 서로 다른 핵산 가닥이 상보성에 기초하여 서로 혼성할 수 있는 한, 본원에서 용어 "상보성"에 포함된다.
본원에서, 용어 "구조체", 특히 "유전자 구조체" 또는 "재조합 구조체" 또는 "발현 구조체"는, 본 발명에 따른 타겟 세포 또는 식물, 식물 세포, 조직, 기관 또는 물질에 도입, 형질전환, 형질감염 또는 형질전이되기 위한, 특히 플라스미드 또는 플라스미드 벡터, 코스미드, 인공 효모- 또는 박테리아 인공 염색체 (YAC 및 BAC), 파지미드, 박테리아 파지에 기반한 벡터, 발현 카세트, DNA 서열 및 RNA 서열을 포함하는 단리된 단일 가닥 또는 이중 가닥 핵산 서열, 또는 아미노산 서열, 변형된 바이러스 등의 바이러스 벡터 및 이들의 조합 또는 혼합물을 포함하는 구조체를 지칭한다. 본 발명에 따른 재조합 구조체는 핵산 또는 아미노산 서열의 형태로서 작동자 도메인을 포함할 수 있으며, 여기서 작동자 도메인은 타겟 세포에서 작용을 발휘할 수 있는 분자를 의미하며, 이는 전이유전자, 단일 가닥 또는 이중 가닥 RNA 분자, 예를 들어 가이드 RNA, miRNA, 단일 또는 이중 CRISPR tracr/crRNA, 또는 siRNA, 또는 아미노산 서열, 예를 들어, 특히 효소 또는 이의 촉매학적으로 활성인 단편, 결합 단백질, 항체, 전사인자, 뉴클레아제, 바람직하게는 부위 특이적인 뉴클레아제 등을 포함한다. 아울러, 재조합 구조체는 조절 서열 및/또는 위치화 서열을 포함할 수 있다. 재조합 구조체는 플라스미드 벡터 등의 벡터에 통합될 수 있거나, 및/또는 벡터 구조로부터, 예를 들어 폴리펩타이드 서열 형태로 또는 벡터에 연결되지 않은 단일 가닥 또는 이중 가닥 핵산으로서 분리되어 존재할 수 있다. 이는, 예를 들어, 형질전환에 의해 도입된 후, 유전자 구조체는, 염색체 외부에, 즉 타겟 세포의 게놈에 통합되지 않고, 예를 들어 이중 가닥 또는 단일 가닥 DNA, 이중 가닥 또는 단일 가닥 RNA 또는 아미노산 서열로서 존재할 수 있다. 다른 구현예로, 본 발명에 따른 유전자 구조체 또는 이의 일부는, 타겟 세포의 핵 게놈 또는 다른 유전 요소, 예를 들어 미토콘드리아 또는 엽록체와 같은 색소체 게놈 등의, 타겟 세포의 게놈에 안정적으로 통합될 수 있다. 이와 관련하여 사용되는 용어 "플라스미드 벡터"는 본래 플라스미드로부터 수득되는 유전자 구조체를 의미한다.
본원에서 용어 "전달 구조체" 또는 "전달 벡터"는 RNA 및 DNA를 포함하는 하이브리드 핵산 등이 핵산 및/또는 대상 아미노산 서열을 타겟 세포, 바람직하게는 진핵생물 세포로 수송하기 위한 카고로서 사용되는 임의의 생물학적 또는 화학적 수단을 지칭한다. 본원에서, 용어 전달 구조체 또는 벡터는 따라서 본 발명에 따른 유전자 또는 재조합 구조체를 타겟 세포, 조직, 장기 또는 유기체로 전달하기 위한 수송 수단을 지칭한다. 즉, 벡터는 핵산 서열을 포함할 수 있으며, 선택적으로 대상 타겟 세포 또는 식물 타겟 구조 내 식물의 바람직한 세포 구획으로 직접 또는 간접적으로 전달하기 위한 위치화 서열 또는 조절 서열과 같은 서열을 포함할 수 있다. 또한, 벡터는 아미노산 서열 또는 리보뉴클레오-분자 복합체를 타겟 세포 또는 타겟 구조에 도입하기 위해 사용될 수 있다. 통상적으로, 본원에서, 벡터는 플라스미드 벡터일 수 있다. 또한, 본 발명에 따른 일부 바람직한 구현예에서, 대상 구조체 또는 서열 또는 복합체의 직접 도입이 수행된다. 용어 직접 도입은, 본원에 따라 변형할 DNA 타겟 서열을 포함하는 원하는 타겟 세포 또는 타겟 구조가, 전달 벡터를 사용해 전달된 물질이 그 효과를 발휘하게 될 특이적인 대상 타겟 세포로, 직접 형질절환 또는 형질전이 또는 형질감염되는 것을 암시한다. 용어 간접 도입은 구조, 예를 들어, 그 자체가 형질전환될 실제 타겟 세포 또는 대상 구조는 아니지만 실제 타겟 구조, 예를 들어 분열 세포 또는 조직, 또는 줄기세포 또는 조직으로, 바람직하게는 본 발명에 따른 유전자 구조체를 포함하는 벡터의 전신 전파 및 전달을 위한 토대로서 사용되는, 잎 세포 또는 기관 또는 조직의 세포로의 도입이 달성되는 것을 의미한다. 하이브리드 핵산 서열 등의 아미노산 서열 및/또는 핵산 서열로 타겟 세포를 형질감염하는 맥락에서 용어 벡터가 사용되는 경우, 용어 벡터는 펩타이드 또는 단백질 형질감염에 적합한 물질, 예를 들어, 이온성 지질 혼합물, 세포 침투 펩타이드 (CPP) 또는 입자 총법 (particle bombardment)을 내포한다. 핵산 물질을 도입하는 맥락의 경우, 용어 벡터는 플라스미드 벡터뿐 아니라 핵산 및/또는 아미노산 서열을 대상 타겟 세포로, 예를 들어 입자 총법에 의해 도입하기 위한 토대로 사용할 수 있는 적합한 담체 물질을 의미할 수 있다. 이러한 담체 물질은, 특히, 금 또는 텅스텐 입자를 포함한다. 마지막으로, 용어 벡터는 또한 본 발명에 따른 하나 이상의 유전자 구조체를 도입하기 위한 바이러스 벡터, 예를 들어, 다음과 같은 바이러스 균주로부터 유래된 변형된 바이러스의 사용을 의미한다: 아데노바이러스 또는 아데노부속 바이러스 (AAV) 벡터, 렌티바이러스 벡터, 헤르페스 심플렉스 바이러스 (HSV-1), 백시니아 바이러스, 센다이 바이러스, 신드비스 바이러스, 셈리키 포레스트 알파바이러스 (Semliki forest alphavirus), 엡스타인-바-바이러스 (EBV), 옥수수 스트리크 바이러스 (Maize Streak Virus, MSV), 보리 줄무늬 모자이크 바이러스 (Barley Stripe Mosaic Virus, BSMV), 브롬 모자이크 바이러스 (Brome Mosaic virus, BMV, 등재번호: RNA1: X58456; RNA2: X58457; RNA3: X58458), 옥수수 줄무늬 바이러스 (Maize stripe virus, MSpV), MYDV (Maize rayado fino virus), MYDV (Maize yellow dwarf virus), MDMV (Maize dwarf mosaic virus), Benyviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 사탕무 엽맥황화 바이러스 (Beet necrotic yellow vein virus) (등재번호: RNA1: NC_003514; RNA2: NC_003515; RNA3: NC_003516; RNA4: NC_003517) 또는 Bromoviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 속명 알파파 모자이크 바이러스 (Alfalfa mosaic virus, 등재번호: RNA1: NC_001495; RNA2: NC_002024; RNA3: NC_002025) 또는 속명 브로모바이러스 (Bromovirus), 예를 들어 BMV (상기 참조), 또는 속명 쿠쿠모바이러스 (Cucumovirus), 예를 들어, 오이 모자이크 바이러스 (Cucumber mosaic virus, 등재번호: RNA1: NC_002034; RNA2: NC_002035; RNA3: NC_001440), 속명 올레아바이러스 (Oleavirus), Caulimoviridae 과, 특히 바드나바이러스 (Badnavirus) 또는 콜리모바이러스 (Caulimovirus) 과의 dsDNA 바이러스, 예를 들어, 여러가지 바나나 스트리크 바이러스 (Banana streak viruse) (예, 등재번호: NC_007002, NC_015507, NC_006955 또는 NC_003381) 또는 콜리플라워 모자이크 바이러스 (등재번호: NC_001497), 또는 속명 카베모바이러스 (Cavemovirus), 페투바이러스 (Petuvirus), 로사드나바이러스 (Rosadnavirus), 솔렌도바이러스 (Solendovirus), 소이모바이러스 (Soymovirus) 또는 툰그로바이러스 (Tungrovirus), 또는 Closteroviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 속명 앰펠로바이러스 (Ampelovirus), 크리니바이러스 (Crinivirus), 예를 들어, 상추 감염성 황색 바이러스 (Lettuce infectious yellows virus, 등재번호: RNA1: NC_003617; RNA2: NC_003618) 또는 토마토 클로로시스 바이러스 (등재번호: RNA1: NC_007340; RNA2: NC_007341), 클로스테로바이러스 (Closterovirus), 예로, 사탕무 황색 바이러스 (등재번호: NC_001598) 또는 벨라리바이러스 (Velarivirus), Geminiviridae 과의 단일 가닥 DNA (+/-) 바이러스, 예를 들어, 베쿠르토바이러스 (Becurtovirus), 베고모바이러스 (Begomovirus), 예를 들어, 빈 골든 옐로우 모자이크 바이러스 (Bean golden yellow mosaic virus), 토바코 컬리 쇼트 바이러스 (Tobacco curly shoot virus), 토바코 모틀 리프 컬 바이러스 (Tobacco mottle leaf curl virus), 토마토 클로로틱 모틀 바이러스 (Tomato chlorotic mottle virus), 토마토 위축 잎 바이러스 (Tomato dwarf leaf virus), 토마토 골든 모자이크 바이러스 (Tomato golden mosaic virus), 토마토 잎 말림 바이러스 (Tomato leaf curl virus), 토마토 모틀 바이러스 (Tomato mottle virus) 또는 토마토 옐로우 스팟 바이러스 (Tomato yellow spot virus), 또는 Geminiviridae 과의 속명 쿠르토바이러스 (Curtovirus), 예를 들어, 비트 컬리 탑 바이러스 (Beet curly top virus), 또는 Geminiviridae 과의 속명 토포쿠바이러스 (Topocuvirus), 턴큐트바이러스 (Turncurtvirus) 또는 마스트레바이러스 (Mastrevirus), 예를 들어 옥수수 스트리크 바이러스 (Maize streak virus)(상기 참조), 토바코 황화 위축 바이러스 (Tobacco yellow dwarf virus), 밀 위축 바이러스 (Wheat dwarf virus), Luteoviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 속명 루테오바이러스 (Luteovirus), 예로, 보리 황화 위축 바이러스- PAV (Barley yellow dwarf virus- PAV, 등재번호: NC_004750), 또는 속명 폴레로바이러스 (Polerovirus), 예로, 감자 잎 말림 바이러스 (Potato leafroll virus, 등재번호: NC_001747), Nanoviridae 과의 단일 가닥 DNA 바이러스, 예를 들어, 속명 나노바이러스 (Nanovirus) 또는 바부바이러스 (Babuvirus), Partiviridae 과의 이중 가닥 RNA 바이러스, 예를 들어, 특히 알파파티티바이러스 (Alphapartitivirus), 베타파티티바이러스 (Betapartitivirus) 또는 델타파티티바이러스 (Deltapartitivirus), Pospiviroidae 과의 비로이드 (viroid), Potyviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 속명 브람비바이러스 (Brambyvirus), 비모바이러스 (Bymovirus), 이포모바이러스 (Ipomovirus), 마클루라바이러스 (Macluravirus), 포아세바이러스 (Poacevirus), 예를 들어, 트리티컴 모자이크 바이러스 (Triticum mosaic virus) (등재번호: NC_012799), 또는 Potyviridae 과의 속명 포티바이러스 (Potyvirus), 예를 들어, 비트 모자이크 바이러스 (등재번호: NC_005304), 옥수수 위축 모자이크 바이러스 (Maize dwarf mosaic virus) (등재번호: NC_003377), 감자 바이러스 Y (등재번호: NC_001616), 또는 옥수수 모자이크 바이러스 (Zea mosaic virus, 등재번호: NC_018833), 또는 Potyviridae의 속명 트리티모바이러스 (Tritimovirus), 예를 들어 브롬 스트리크 모자이크 바이러스 (Brome streak mosaic virus, 등재번호: NC_003501) 또는 밀 스트리크 모자이크 바이러스 (Wheat streak mosaic virus, 등재번호: NC_001886), Pseudoviridae 과의 단일 가닥 RNA 바이러스, 예를 들어, 속명 슈도바이러스 (Pseudovirus) 또는 시레바이러스 (Sirevirus), Reoviridae 과의 이중 가닥 RNA 바이러스, 예를 들어, 벼 위축 바이러스 (Rice dwarf virus) (등재번호: RNA1: NC_003773; RNA2: NC_003774; RNA3: NC_003772; RNA4: NC_003761; RNA5: NC_003762; RNA6: NC_003763; RNA7: NC_003760; RNA8: NC_003764; RNA9: NC_003765; RNA10: NC_003766; RNA11: NC_003767; RNA12: NC_003768), Tombusviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 속명 알파네크로바이러스 (Alphanecrovirus), 아우레우스바이러스 (Aureusvirus), 베타네크로바이러스 (Betanecrovirus), 카르모바이러스 (Carmovirus), 다이안토바이러스 (Dianthovirus), 갈란티바이러스 (Gallantivirus), 마카나바이러스 (Macanavirus), 마클로모바이러스 (Machlomovirus), 파니코바이러스 (Panicovirus), 톰부스바이러스 (Tombusvirus), 움브라바이러스 (Umbravirus) 또는 지아바이러스 (Zeavirus), 예를 들어, 옥수수 괴사 스트리크 바이러스 (Maize necrotic streak virus) (등재번호: NC_007729), 또는 Virgaviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어 속명 푸로바이러스 (Furovirus), 호르데이바이러스 (Hordeivirus), 예를 들어, 보리 스트립 모자이크 바이러스 (등재번호: RNA1: NC_003469; RNA2: NC_003481; RNA3: NC_003478), 또는 속명 페클루바이러스 (Pecluvirus), 포모바이러스 (Pomovirus), 토바모바이러스 (Tobamovirus) 또는 토브라마이러스 (Tobravirus), 예를 들어, 담배 얼룩 바이러스 (Tobacco rattle virus) (등재번호: RNA1: NC_003805; RNA2: NC_003811), 뿐만 아니라 목 Mononegavirales의 (-) 가닥 RNA 바이러스, 특히 과 Rhabdoviridae, 예를 들어, 보리 황색 스트리아테 모자이크 바이러스 (Barley yellow striate mosaic virus) (등재번호: KM213865) 또는 상추 괴사성 황색 바이러스 (Lettuce necrotic yellows virus) (등재번호/생검: NC_007642/ AJ867584), 목 Picornavirales의 (+) 가닥 RNA 바이러스, 특히 과 Secoviridae, 예를 들어, 속명 코모바이러스 (Comovirus), 파바바이러스 (Fabavirus), 네포바이러스 (Nepovirus), 케라바이러스 (Cheravirus), 사드와바이러스 (Sadwavirus), 세퀴바이러스 (Sequivirus), 토라도바이러스 (Torradovirus) 또는 와이카바이러스 (Waikavirus), 목 Tymovirales의 (+) 가닥 RNA 바이러스, 특히 과 Alphaflexiviridae, 예를 들어, 속명 알렉시바이러스 (Allexivirus), 롤라바이러스 (Lolavirus), 만드리바이러스 (Mandarivirus) 또는 포텍스바이러스 (Potexvirus), 목 Tymovirales, 특히 과 Betaflexiviridae, 예를 들어, 속명 카필로바이러스 (Capillovirus), 카를라바이러스 (Carlavirus), 시트리바이러스 (Citrivirus), 포베아바이러스 (Foveavirus), 테포바이러스 (Tepovirus) 또는 비티바이러스 (Vitivirus), 목 Tymovirales의 (+) 가닥 RNA 바이러스, 특히 과 Tymoviridae, 예를 들어, 속명 마쿨라바이러스 (Maculavirus), 마라피바이러스 (Marafivirus) 또는 티모바이러스 (Tymovirus) 및 박테리아 벡터, 예를 들어 아그로박테리움 spp . (Agrobacterium spp.), 예를 들어, 아그로박테리움 투메팍시엔스 (Agrobacterium tumefaciens). 마지막으로, 용어 벡터는 또한 폴리머성 또는 지질-기반의 전달 구조체 등의, 물리적인 도입 방법과 조합하여, 선형 핵산 서열 (단일 가닥 또는 이중 가닥) 또는 아미노산 서열 또는 이의 조합을 타겟 세포에 도입하기 적합한 화학적 전달 물질을 의미한다.
적합한 전달 구조체 또는 벡터는, 따라서, 타겟 세포에 뉴클레오티드 서열을 전달하기 위한 생물학적 수단, 예를 들어 바이러스 벡터, 아그로박테리움 spp. 또는 화학적 전달 구조체, 예를 들어, 나노입자, 예로, 메조포러스 실리카 나노입자 (MSNP), 양이온성 폴리머, 예로, PEI (폴리에틸렌이민) 폴리머를 이용한 방법 또는 폴리머, 예를 들어, DEAE-덱스트란, 또는 양이온성 표면을 구축하기 위한 PEI의 비-공유적 표면 결합, 지질 또는 폴리머성 소낭 또는 이들의 조합을 포함한다. 지질 또는 폴리머성 소낭은, 예를 들어, 지질, 리포좀, 지질 캡슐화 시스템, 나노입자, 소형 핵산-지질 입자 포뮬레이션, 폴리머 및 폴리머좀으로부터 선택될 수 있다.
본원에서, 원핵생물 또는 진핵생물 세포, 바람직하게는 동물 세포, 더 바람직하게는 본 발명에 따른 식물 또는 식물 세포 또는 식물 물질과 관련하여, 용어 "파생물" 또는 "자손" 또는 "후대"는 유성 및 무성 증식을 포함하는 자연적인 번식 (reproductive propagation)으로부터 생기는 상기한 세포 또는 물질의 자손을 지칭한다. 이러한 번식은 자연 현상으로부터 생긴 유기체의 게놈에 돌연변이 도입을 유도하여, 부모 유기체 또는 세포와 게놈 측면에서는 다르지만, 여전히 동일한 속/종에 속하며; 부모 재조합 숙주 세포와 동일한 특징들을 대부분 가진, 자손 또는 후대를 만들 수 있음은, 당해 기술 분야의 당업자에게 널리 공지되어 있다. 생식 또는 재생 중에 자연 현상으로부터 생기는 상기한 파생물, 자손 또는 후대도, 따라서, 본 발명의 상기한 용어에 포함된다. 또한, 용어 "파생물"은, 직접적으로 세포 또는 유기체를 지칭한다기 보다는, 다른 것으로부터 간접적으로 수득되는 변형에 의한, 물질 또는 분자를 의미할 수 있다. 이는 세포 또는 물질로부터 수득되는 식물 대사산물 또는 세포로부터 유래되는 핵산 서열을 의미할 수 있다. 따라서, 이들 용어는 임의의 파생물, 자손 또는 선조 (progenitor)를 지칭하기 보다는, 부모 세포 또는 바이러스 또는 이의 분자에 기초하여 계통 발생적으로 관련된 파생물 또는 자손 또는 선조를 지칭하는 것이며, 파생물, 자손 또는 선조와 "부모" 간의 연관성은 당해 기술 분야의 당업자가 명백하게 추론가능하다.
또한, 본원에서, 생물학적 서열(핵산 또는 아미노산) 또는 분자 또는 복합체의 맥락에서 사용되는 용어 "유래된" 또는 "로부터 유래되는" 또는 "유도체"는, 해당 서열이, 참조 서열, 예를 들어, 즉, 상기 서열의 기원이 되는 서열 목록 또는 데이터베이스 등재 번호 또는 각각의 스캐폴드 구조를 기반으로 하며, 참조 서열이 더 많은 서열, 예를 들어 바이러스의 전체 게놈 또는 전체 폴리단백질 코딩 서열을 포함할 수 있는 반면, 천연 서열"로부터 유래된" 서열은 이의 단리된 단편 또는 이의 코헤런트 단편 (coherent fragment)만 포함할 수 있다는 것을 암시한다. 이런 맥락에서, cDNA 분자 또는 RNA는 분자 주형으로서 사용되는 DNA 서열"로부터 유래된" 것으로 칭해질 수 있다. 이에, 당해 기술 분야의 당업자는 기준 서열"로부터 유래된" 서열을 쉽게 규정할 수 있으며, 이는 DNA 또는 아미노산 수준에서 서열 정렬함으로써 대응되는 참조 서열에 대해 높은 동일성을 가질 것이며, 해당 참조 서열과 마찬가지로 DNA/아미노산의 코헤런트 가닥을 가질 것이다 (정렬된 분자의 주어진 길이에 대해 >75%의 쿼리 동일성, 단, 서열 정렬시 유래된 서열은 쿼리이고, 참조 서열은 대상이 됨). 따라서, 당업자는 중합효소 연쇄 반응 등을 이용해 본원에 제공된 내용에 기초한 각각의 서열을 적절한 대상 벡터 시스템에 클로닝하거나 또는 서열을 벡터 스캐폴드로서 이용할 수 있다. 즉, "로부터 유래된"이란 용어는 임의의 (arbitrary) 서열이 아니라, 이것이 유래된 참조 서열에 대응되는 서열이며, 일부 차이, 예를 들어, 숙주 세포 내에서 재조합 구조체의 복제시 천연적으로 발생하는 일부 돌연변이를 배제할 수 없으며, 즉 용어 "로부터 유래된"에 포함된다. 또한, 부모 서열로부터 나온 몇몇 서열 가닥들은 부모로부터 유래된 서열에 연결될 수 있다. 서로 다른 가닥들은 부모 서열에 대해 높은 상동성 또는 심지어 100% 상동성을 가질 것이다. 당업자라면, 본 발명에 따른 인공 분자 복합체의 서열이, 핵산 서열로서 제공되거나 또는 일부 제공될 경우, 이후 전사되며, 선택적으로 생체내 번역되며, 숙주 세포에서 추가적으로 소화 및/또는 가공 처리 (신호 펩타이드 절단, 내인성 바이오틴화 등)될 가능성이 있다는 것을 잘 알고 있을 것이므로, 용어 "로부터 유래된"은 본 발명의 내용에 따라 기원 서열에 대한 상관관계를 나타낸다.
본원에서, "융합체"는 하나 이상의 비-천연 서열 (예, 모이어티)를 포함하는 단백질 및/또는 핵산을 지칭할 수 있다. 융합체는 변형된 단백질의 N-말단 또는 C-말단에 또는 이 둘다에 또는 개별 도메인으로서 분자 내부에 위치될 수 있다. 핵산 분자의 경우, 융합체 분자들은 5'- 또는 3'- 말단에서, 또는 둘 사이 임의의 적절한 위치에서 부착될 수 있다. 융합체는 전사 및/또는 번역 융합체일 수 있다. 융합체는 하나 이상의 동일한 비-천연 서열을 포함할 수 있다. 융합체는 하나 이상의 서로 다른 비-천연 서열을 포함할 수 있다. 융합체는 키메라일 수 있다. 융합체는 핵산 친화성 태그를 포함할 수 있다. 융합체는 바코드를 포함할 수 있다. 융합체는 펩타이드 친화성 태그를 포함할 수 있다. 융합체는 부위-특이적인 작동자 또는 염기 편집기의 세포내 위치화를 제공할 수 있다 (예, 핵으로의 타겟팅을 위한 핵 위치화 신호 (NLS), 미토콘드리아로의 타겟팅을 위한 미토콘드리아 위치화 신호, 엽록체 타겟팅을 위한 엽록체 위치화 신호, 15 소포체 (ER) 체류 신호 등). 융합체는 추적 또는 정제하는데 사용될 수 있는 비-천연 서열 (예, 친화성 태그)을 제공할 수 있다. 융합체는 바이오틴과 같은 소분자 또는 alexa fluor 염료, Cyanine3 염료, Cyanine5 염료와 같은 염료일 수 있다. 융합체는 안정성 증가 또는 감소를 제공할 수 있다. 일부 구현예에서, 융합체는 검출가능한 신호를 제공할 수 있는 모이어티 등의 검출가능한 표지 물질을 포함할 수 있다. 검출가능한 신호를 제공할 수 있는 적합한 검출가능한 표지 물질 및/또는 모이어티로는, 비-제한적으로, 효소, 방사성 동위원소, 특이 결합 쌍의 구성원; 형광단; 플루오레센트 리포터 또는 형광 단백질; 양자점 등을 포함할 수 있다. 융합체는 FRET 쌍의 구성원, 또는 형광단/양자점 도너/어셉터 쌍의 구성원을 포함할 수 있다. 융합체는 효소를 포함할 수 있다. 적합한 효소로는 비-제한적으로 HRP (horse radish peroxidase), 루시퍼라제, β-25 갈락토시다제 등이 있을 수 있다. 융합체는 형광 단백질을 포함할 수 있다. 적합한 형광 단백질로는 비-제한적으로 그린 형광 단백질 (GFP) (예, 아큐오리아 빅토리아 (Aequoria victoria)의 GFP, 안구일라 자포니카 (Anguilla japonica)의 형광 단백질 또는 이의 돌연변이 또는 유도체), 레드 형광 단백질, 옐로우 형광 단백질, 옐로우-그린 형광 단백질 (예, 세팔로코르데이트 브란키오스토마 란세올라툼 (cephalochordate Branchiostoma lanceolatum)의 테트라머 형광 단백질로부터 유래된 mNeonGreen) 다양한 임의의 형광 및 유색 단백질 등을 포함할 수 있다. 융합체는 나노입자를 포함할 수 있다. 적합한 나노입자로는, 선택적으로 나노입자와 연결된, 형광 또는 발광 나노입자, 그리고 자기 나노입자 또는 나노다이아몬드를 포함할 수 있다. 나노입자(들)의 임의의 광학 또는 자기 특성 또는 특징을 검출할 수 있다. 융합체는 헬리카제, 뉴클레아제 (예, Fokl), 엔도뉴클레아제, 엑소뉴클레아제 (예, 5'-엑소뉴클레아제 및/또는 3'-엑소뉴클레아제), 리가제, 닉카제, 뉴클레아제-헬리카제 (예, Cas3), DNA 메틸트랜스퍼라제 (예, Dam), 또는 DNA 데메틸라제, 히스톤 메틸트랜스퍼라제, 히스톤 데메틸라제, 아세틸라제 (예를 들어, 비-제한적으로, 히스톤 아세틸라제), 데아세틸라제 (예를 들어, 비-제한적으로, 히스톤 데아세틸라제), 포스파타제, 키나제, 전사 (조) 활성인자, 전사 (조)인자, RNA 폴리머라제 서브유닛, 전사 억제자, DNA 결합 단백질, DNA 구조형성 단백질, 긴 비-코딩 RNA, DNA 복구 단백질 (예, 단일 가닥 및/또는 이중 가닥 절단을 복구하는데 참여하는 단백질, 예를 들어, 염기 절개 복구 (base excision repair), 뉴클레오티드 절개 복구, 미스매치 복구, NHEJ, HR, MMEJ (microhomology-mediated end joining), 및/또는 ANHEJ (alternative non-homologous end-joining)에 참여하는 단백질, 예를 들어, 비-제한적으로 HR 조절인자 및 HR 복합체 조립 신호), 마커 단백질, 리포터 단백질, 형광 단백질, 리간드 결합 단백질 (예, mCherry 또는 중금속 결합 단백질), 신호 펩타이드 (예, Tat-신호 서열), 타겟팅 단백질 또는 펩타이드, 세포내 위치화 서열 (예, 핵 위치화 서열, 엽록체 위치화 서열), 및/또는 항체 에피토프, 또는 이들의 임의 조합을 포함할 수 있다.
용어 "유전자 변형된" 또는 "유전자 조작" 또는 "유전자(유전학적으로) 조작된"은 본원에서 광의적인 의미로 사용되며, 인간의 개입이 없는 경우에 확인되는 상태와 다르게 목적한 방식으로 변형시키도록 타겟 세포, 조직, 기관 또는 유기체의 내인성 유전 물질 또는 트랜스크립톰 또는 프로테옴에 영향을 미치기 위한, 인간의 개입에 의해 직접 또는 간접적으로 달성되는, 핵산 서열 또는 아미노산 서열, 타겟 세포, 조직, 기관 또는 유기체에 대한 모든 변형을 의미한다. 인간 개입은 시험관내, 생체내/식물체내 (in planta) 또는 이 둘다에서 이루어질 수 있다. 추가적인 변형은, 예를 들어, 하나 이상의 점 돌연변이(들), 예를 들어 타겟화된 단백질 조작 또는 코돈 최적화, 결손(들), 및 하나 이상의 핵산 또는 아미노산 분자의 하나 이상의 삽입(들) 또는 결손(들) (상동적인 재조합 포함), 핵산 또는 아미노산 서열의 변형, 또는 이들의 조합을 포함할 수 있다. 또한, 이들 용어는, 천연적으로 생기는 참조 서열, 유기체 또는 물질과 유사하지만, 목적한 조작을 위한 하나 이상의 단계에 의해 구축된, 핵산 분자 또는 아미노산 분자 또는 숙주 세포 또는 유기체, 예로 식물 또는 이의 식물 물질을 포함할 것이다. 따라서, 본원에서, "타겟화된 유전자 조작" 또는 "타겟화된 (염기) 변형"은, 조작할 하나 이상의 세포, 바람직하게는 식물 세포에서 원하는 효과를 달성하기 위해, 타겟화된 방식, 즉 타겟 세포에서 특정 위치에서, 적절한 특수 상황에서 이루어지는, "유전자 조작"의 결과이며, 이 용어는 달성되는 변형이 예를 들어 세포의 게놈 내 타겟 부위의 이용가능한 서열 정보 및/또는 대상 분자 도구의 타겟 특이성의 정보 (핵산 또는 아미노산 서열의 인지 또는 결합 특성, 상보적인 염기 쌍 등)에 기반하여 미리 계획할 수 있도록, 타겟화할 서열에 대응되는 변형이 선행되는 서열 고려에 기초함을 암시한다.
용어 "게놈"은 유기체의 각 세포, 또는 바이러스 또는 소기관에 존재하는 유전 물질 전체 (유전자 및 비-코딩 서열); 및/또는 하나의 부모로부터 (반수체) 유닛으로서 유전된 염색체 전체 세트를 의미한다. 본원에서, 용어 "입자 총법"은 바이올리스틱 형질감염 (biolistic transfection) 또는 미세입자-매개 유전자 전달이라고도 하며, 대상 핵산 또는 유전자 구조체를 포함하는 코팅된 미세입자 또는 나노입자를 타겟 세포나 조직으로 이동시키기 위한 물리적인 전달 방법을 의미한다. 미세입자 또는 나노입자는 발사체로서 기능하며, 종종 "유전자 총 (gene gun)"으로 지칭되는 적절한 장치를 사용해 고압 하에 대상 타겟 구조로 발포한다. 입자 총법을 통한 형질전환은 대상 유전자로 덮인 금속 미세발사체를 사용하는데, 이는 "유전자 총"으로 알려진 장치를 사용해 타겟 조직의 세포 벽을 뚫기에 충분하지만 세포 사멸을 유발할 만큼 해롭지 않은 높은 속도 (~1500 km/h)로 타겟 세포에 발사된다 (Sandford et al. 1987). 세포 벽이 완전히 제거된 원형질체의 경우, 논리적으로 조건은 다르다. 하나 이상의 미세발사체 상에 침전된 핵산 또는 유전자 구조체는 발사 후 세포 내로 방출되어, 게놈에 통합된다. 미세발사체의 가속은 고 전압 전기 방전 또는 압축 가스 (헬륨)에 의해 달성된다. 사용되는 금속 입자는, 무독성, 비-반응성이며, 타겟 세포 보다 직경이 더 작아야 한다는 필수 조건을 가진다. 가장 흔히 사용되는 것은 금 또는 텅스텐이다. 유전자 총 및 이의 일반적인 사용과 관련한 관련 시스템의 제조사 및 판매사로부터 공개적으로 이용가능한 많은 정보들이 존재한다.
용어 "게놈 편집" 및 "게놈 조작"은 본원에서 상호 호환적으로 사용되며, 살아있는 유기체의 게놈 또는 임의의 유전자 정보를 타겟화된 방식으로 특이적으로 변형시키는 전략 및 기법을 지칭한다. 이와 같이, 이들 용어는 유전자 편집을 포함하며, 게놈의 유전자 코딩 영역 이외의 다른 영역의 편집 역시 포함한다. 이 용어는 또한 (존재하는 경우) 핵의 편집 또는 조작뿐 아니라 세포의 다른 유전자 정보를 편집 또는 조작하는 것을 포함한다. 아울러, 용어 "게놈 편집" 및 "게놈 조작"은 또한 후생유전학적 편집 (epigenetic editing) 또는 조작, 즉 타겟화된 변형, 예를 들어 메틸화, 히스톤 변형 또는 유전자 발현시 유전가능한 변화를 유발할 가능성이 있는 비-코딩 RNA의, 변형을 포함한다.
본원에서, "생식질 (germplasm)"은 유전 자원, 또는 보다 정확하게는 유기체의 DNA 및 이들 물질의 콜렉션을 나타내기 위해 사용되는 용어이다. 육종 기법에서, 용어 생식질은 새로운 식물 또는 식물 품종이 구축될 수 있는 유전 물질의 콜렉션을 나타내기 위해 사용된다.
용어 "가이드 RNA", "gRNA" 또는 "싱글 가이드 RNA" 또는 "sgRNA"는 본원에서 상호 호환적으로 사용되며, CRISPR RNA (crRNA)와 트랜스-활성화 crRNA (tracrRNA)로 된 합성 융합체를 지칭하거나, 또는 이 용어는 crRNA 및/또는 tracrRNA로만 이루어진 단일 RNA 분자를 지칭하거나, 또는 이 용어는 crRNA 또는 tracrRNA 모이어티를 각각 포함하는 gRNA들을 지칭한다. tracr 및 crRNA 모이어티가 따라서 하나의 공유 결합된 RNA 분자에 반드시 존재하여야 하는 것은 아니지만, 이는 2개의 개별 RNA 분자들로 구성될 수 있으며, 이들은 조합되거나 또는 비-공유 또는 공유 상호작용에 의해 조합되어 본원에 따른 gRNA를 제공할 수 있다. 용어 "gDNA" 또는 "sgDNA" 또는 "가이드 DNA"는 본원에서 상호 호환적으로 사용되며, 아르고너트 (Argonaute) 뉴클레아제와 상호작용하는 핵산 분자를 지칭한다. 본원에 언급된 gRNA 및 gDNA 둘다, 부위-특이적인 뉴클레아제와 상호작용하여 부위-특이적인 뉴클레아제를 게놈 타겟 부위로 타겟팅하는 것을 보조하는 능력으로 인해, "가이딩 핵산(들)" 또는 "가이드 핵산(들)"로 지칭된다.
본원에서, 용어 "돌연변이" 및 "변형"은 상호 호환적으로 사용되며, 생체내 또는 시험관내 핵산 조작 측면에서 부가물 (adduct)의 도입, 결손, 삽입, 부가, 치환, 편집 및/또는 가닥 절단을 의미한다. 결손은 핵산 서열에서 하나 이상의 뉴클레오티드가 생략되는 변화로서 정의된다. 삽입 또는 부가는 핵산 서열에서 하나 이상의 뉴클레오티드가 첨가되는 변화이다. "치환" 또는 편집은 치환 대상인 하나 이상의 뉴클레오티드와 다른 분자에 의해 하나 이상의 뉴클레오티드가 대체되는 것이다. 예를 들어, 티민이 시토신, 아데신, 구아닌 또는 우리딘으로 대체되는 것으로 예시되는 바와 같이, 핵산이 다른 핵산으로 대체될 수 있다. 피리미딘 -> 피리미딘 (예, C -> T 또는 T -> C 뉴클레오티드 치환) 또는 퓨린 -> 퓨린 (예, G -> A 또는 A -> G 뉴클레오티드 치환)은 염기 전이 (transition)로 지칭되며, 피리미딘 -> 퓨린 또는 퓨린 -> 피리미딘 (예, G -> T 또는 G -> C 또는 A -> T 또는 A -> C)은 염기 전환 (transversion)으로 지칭된다. 다른 구현예에서, 핵산은, 티민이 티민 글리콜로 치환되는 예와 같이, 변형된 핵산으로 대체될 수 있다. 돌연변이는 미스매치를 유발할 수 있다. 용어 미스매치는 2개의 핵산 간의 비-공유적인 상호작용을 지칭하는데, 이때 각 핵산은 서로 다른 뉴클레오티드 서열 또는 핵산 분자에 존재하는 것이며, 염기-쌍 형성 규칙을 따르지 않는다. 예를 들어, 부분적으로 상보적인 서열 5'-AGT-3' 및 5'-AAT-3'의 경우, G-A 미스매치 (염기 전이)가 존재한다.
서열 또는 분자와 관련하여 용어 "뉴클레오티드" 및 "핵산"은 본원에서 상호 호환적으로 사용되며, 천연 또는 합성 기원의 단일 가닥 또는 이중 가닥 DNA 또는 RNA를 지칭한다. 즉, 용어 뉴클레오티드 서열은 길이와 무관하게 모든 DNA 또는 RNA 서열에 사용되며, 따라서 이 용어는 하나 이상의 뉴클레오티드를 포함하는 임의의 뉴클레오티드 서열뿐 아니라 이 보다 더 큰 임의 타입의 올리고뉴클레오티드 또는 폴리클레오티드를 포괄한다. 즉, 이 용어(들)는 천연 및/또는 합성 데옥시리보뉴클레익산 (DNA) 및/또는 리보뉴클레익산 (RNA) 서열을 지칭하며, 이는 선택적으로 합성 핵산 유사체를 포함할 수 있다. 본 발명에 따른 핵산은 선택적으로 코돈 최적화될 수 있다. "코돈 최적화"는, 대상 세포 또는 유기체에서 재조합 핵산의 전사율을 개선하기 위해 DNA 또는 RNA의 코돈 용법을 대상 세포 또는 유기체에 적합하게 하는 것을, 의미한다. 당해 기술 분야의 당업자라면, 타겟 핵산이 코돈 중복 (codon degeneracy)으로 인해 하나의 위치에서 변형될 수 있지만, 이러한 변형이 번역 후 그 위치에서 여전히 동일한 아미노산 서열을 만들 것임을 잘 인지하고 있으며, 이는 타겟 세포 또는 유기체의 종-특이적인 코돈 용법을 고려하기 위해 코돈 최적화에 의해 달성된다. 본 발명에 따른 핵산 서열은 다음과 같은 비-제한적인 유기체 리스트에 대해 특이적인 코돈 최적화를 수행할 수 있다: 호르데움 불가리 (Hordeum vulgare), 소르굼 비콜러 (Sorghum bicolor), 세칼레 세레알레 (Secale cereale), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays), 세타리아 이탈리카 (Setaria italica), 오리자 사티바 (Oriza sativa), 오리자 미누타 (Oryza minuta), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 트리티칼레 (Triticale), 호르데움 불부숨 (Hordeum bulbusom), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 말루스 도메스티카 (Malus domestica), 베타 불가리스 (Beta vulgaris), 헬리안투스 안누스 (Helianthus annuus), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 에리트란테 구타타 (Erythranthe guttata), 겐리시아 아우레아 (Genlisea aurea), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 아레노사 (Arabidopsis arenosa), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 플렉수오사 (Cardamine flexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 라파누스 사티부스 (Raphanus sativus), 에루카 베시카리아 사티바 (Eruca vesicaria sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 포풀루스 트리코카르파 (Populus trichocarpa), 무스 무스쿨러스 (Mus musculus), 라투스 노르베기쿠스 (Rattus norvegicus) 또는 호모 사피엔스 (Homo sapiens).
본원에서, "뉴클레오티드"는 일반적으로 염기-당-포스페이트 조합을 지칭할 수 있다. 뉴클레오티드는 합성 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 합성 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드는 핵산 서열로 된 모노머 단위일 수 있다 (예, 데옥시리보핵산 (DNA) 및 리보핵산 (RNA)). 용어 뉴클레오티드는 리보뉴클레오시드 트리포스페이트 아데노신 트리포스페이트 (ATP), 우리딘 트리포스페이트 (UTP), 시토신 트리포스페이트 (CTP), 구아노신 트리포스페이트 (GTP) 및 데옥시리보뉴클레오시드 트리포스페이트, 예를 들어 dATP, dCTP, dITP, dUTP, dGTP, dTTP 또는 이의 유도체를 포함할 수 있다. 이러한 유도체는 예를 들어, 비-제한적으로, [αS]dATP, 7-deaza-dGTP 및 7-deaza-dATP, 및 이를 함유한 핵산 분자에 뉴클레아제 내성을 부여하는 뉴클레오티드 유도체 등을 지칭할 수 있다. 용어 뉴클레오티드는 본원에서 다이데옥시리보뉴클레오시드 트리포스페이트 (ddNTP) 및 이의 유도체를 지칭할 수 있다. 다이데옥시리보뉴클레오시드 트리포스페이트에 대한 예시적인 예로는, 비-제한적으로, ddATP, ddCTP, ddGTP, ddITP 및 ddTTP 등을 포함할 수 있다. 뉴클레오티드는 널리 공지된 기법으로 검출가능하게 표지되거나 또는 비-표지될 수 있다. 또한, 표지는 양자점으로 수행될 수 있다. 검출가능한 표지 물질로는, 예를 들어, 방사성 동위원소, 형광 표지물질, 화학발광성 표지 물질, 생발광성 표지 물질 및 효소 표지 물질 등을 포함할 수 있다. 뉴클레오티드의 형광 표지 물질은 비-제한적으로 플루오레세인, 5-카르복시플루오레세인 (FAM), 2'7'-5 다이메톡시-4'5-다이클로로-6-카르복시플루오레세인 (JOE), 로다민, 6-카르복시로다민 (R6G), N,N,N',N'-테트라메틸-6-카르복시로다민 (TAMRA), 6-카르복시-X-로다민 (ROX), 4-(4'-다이메틸아미노페닐아조) 벤조산 (DABCYL), 케스케이드 블루, 오렌지 그린, 텍사스 레드, 시아닌 및 5-(2'-아미노에틸)아미노나프탈렌-l-설폰산 (EDANS) 등을 포함할 수 있다.
본원에서, "비-천연" 또는 "비-천연적으로 생기는" 또는 "인공"은 핵산 또는 폴리펩타이드 서열, 또는 천연 핵산 또는 단백질에서 발견되지 않는 바이오틴 또는 플루오레세인과 같은 임의의 기타 생체분자를 지칭할 수 있다. 비-천연은 친화성 태그를 지칭할 수 있다. 비-천연은 융합체를 지칭할 수 있다. 비-천연은 돌연변이, 삽입 및/또는 결손을 포함하는 천연적으로 생기는 핵산 또는 폴리펩타이드 서열을 지칭할 수 있다. 비-천연 서열은, 비-천연 서열이 융합된 핵산 및/또는 폴리펩타이드 서열에 의해 발휘될 수 있는 활성 (예, 효소 활성, 메틸트랜스퍼라제 활성, 아세틸트랜스퍼라제 활성, 키나제 활성, 유비퀴틴화 활성 등)을 나타내거나 및/또는 코딩할 수 있다. 비-천연 핵산 또는 폴리펩타이드 서열은 천연적으로 생기는 핵산 또는 폴리펩타이드 서열 (또는 이의 변이체)에 유전자 조작에 의해 연결되어, 키메라 핵산 및/또는 폴리펩타이드를 코딩하는 키메라 핵산 및/또는 폴리펩타이드 서열을 제작할 수 있다. 비-천연 서열은 3' 혼성화 연장 서열을 지칭할 수 있다.
본원에서, 용어 "식물독성 (phytotoxic 또는 phytotoxicity)은 식물 세포, 조직, 기관 또는 식물과 관련하여, 식물 또는 임의의 식물 세포에서의 일반적으로 세포독성 또는 세포독성 효과를 의미한다. 즉, 이 용어는 식물 세포, 조직, 기관 또는 완전한 식물을 저해하거나, 손상시키거나 또는 심지어 죽이는 화합물 또는 촉발물질에 의한 식물에 대한 독성 효과를 내포한다. 이러한 손상은, 제초제, 농약, 미량 금속, 병원체에 의해 유발된 독성 작동물질, 염 함유 식물독소 (salinity phytotoxin) 또는 이종감응물질 (allelochemical) 등의 매우 다양한 화합물들에 의해 유발될 수 있다. 또한, 이 용어는 식물의 식물호르몬을 의미하지만, 에틸렌, 자스몬산 및 살리실산과 같은 식물 면역 반응을 조절하는 호르몬 또는 식물 생장 및 발단을 조절하는 옥신, 아브시스산 (ABA), 사이토카인, 지베렐린 및 브라시노스테로이드와 같은 식물 호르몬으로 제한되는 것은 아니다.
본원에서, 용어 "식물"은 완전한 식물 유기체, 식물 기관, 분화된 및 미-분화된 식물 조직, 식물 세포, 종자, 및 이의 파생물 및 후대를 지칭한다. "식물 세포"는, 비-제한적인 예로, 종자 유래 세포, 성숙 및 미성숙 배 유래 세포, 분열 조직, 모종 (seedling), 여러가지 분화 상태의 캘러스 조직, 잎, 꽃, 뿌리, 순 (shoot), 배우체, 포자체, 꽃가루 및 소포자, 원형질체 (protoplast), 거대조류 (macroalgae) 및 미세조류 유래 세포를 포함한다. 여러가지 식물 세포는 반수체, 이배체 또는 배수체일 수 있다. 용어 "식물 기관"은 식물의 형태학적으로 기능적으로 구분되는 부분을 구성하는 조직 군 또는 식물 조직을 의미한다.
본원에서, "식물 물질"은 식물의 모든 발생 단계 (developmental stage)에서 수득할 수 있는 모든 물질을 지칭한다. 식물 물질은 식물 자체 (in planta)에서 또는 식물 또는 식물 조직 또는 이의 기관의 시험관내 배양으로부터 수득할 수 있다. 즉, 이 용어는 식물 세포, 조직 및 기관뿐만 아니라 발생된 식물 구조와, 식물 세포 또는 구획 내에서 발견할 수 있거나 및/또는 식물에 의해 생산될 수 있거나, 또는 모든 발생 단계에서 임의의 식물 세포, 조직 또는 식물의 추출물로부터 수득될 수 있는, 핵산, 폴리펩타이드 및 모든 화학적 식물 물질 또는 대사산물과 같은, 세포내 성분 (sub-cellular component)을 포함한다. 이 용어는, 또한, 식물 물질을 포함하는 하나 이상의 식물 세포로부터 유래되는, 식물 물질의 파생물, 예를 들어 원형질체를 포함한다. 또한, 이 용어는 식물의 분열 조직 세포 (meristematic cell) 또는 분열 조직을 포함한다.
"플라스미드"는 이중 가닥 핵산 서열의 형태로 된 자율적으로 복제하는 원형의 염색체외 인자를 지칭한다. 유전자 조작 분야에서, 이들 플라스미드는, 예를 들어 항생제 또는 제초제에 대한 내성을 코딩하는 유전자, 타겟 핵산 서열을 코딩하는 유전자, 위치화 서열, 조절 서열, 테그 서열, 마커 유전자, 예를 들어 항생제 마커 또는 형광 마커 등을 삽입함으로써, 타겟화된 변형을 일반적으로 겪는다. 복제 오리진과 같은 오리지날 플라스미드의 구조 성분들은 유지된다. 본 발명의 특정 구현예에서, 위치화 서열은 핵 위치화 서열, 색소체 위치화 서열, 바람직하게는 미토콘드리아 위치화 서열 또는 엽록체 위치화 서열을 포함할 수 있다. 이러한 위치화 서열은 식물 생명공학 분야에서 당업자가 입수가능하다. 여러가지 대상 타겟 서열에 사용하기 위한 다양한 플라스미드 벡터들이 상업적으로 이용가능하며, 이의 변형들 역시 해당 분야의 당업자들에게 공지되어 있다.
"중합효소 연쇄 반응" (PCR)은 특정 DNA 세그먼트를 합성하기 위한 기법이다. PCR은 일련의 반복적인 변성, 어닐링 및 연장 사이클을 포함한다. 전형적으로, 이중 가닥 DNA는 열 변성되며, 타겟 세그먼트의 3' 바운더리에 상보적인 프라이머 2개가 낮은 온도에서 DNA에 어닐링된 다음 중간 온도에서 연장된다. 이러한 연속적인 3가지 단계로 된 세트를 "사이클"이라 한다.
"자손"은 식물, 식물 세포 또는 식물 조직의 임의의 후손 세대를 포함한다.
본원에서, 용어 "조절 서열"은, 대상 핵산 서열의 전사 및/또는 번역 및/또는 변형을 지시할 수 있는, 핵산 또는 아미노산 서열을 지칭한다.
본원에서, 용어 "단백질", "아미노산" 또는 "폴리펩타이드"는 상호 호환적으로 사용되며, 촉매적 효소 기능 또는 구조적 또는 기능적 작용을 가진 아미노산 서열을 지칭한다. 용어 "아미노산" 또는 "아미노산 서열" 또는 "아미노산 분자"는 모든 천연 및 화학 합성된 단백질, 펩타이드, 폴리펩타이드 및 효소 또는 변형된 단백질, 펩타이드, 폴리펩타이드 및 효소를 포함하며, 여기서 용어 "변형된"은, 야생형 서열의 말단 절단 (truncation)에서부터 더 짧지만 여전히 활성인 영역을 비롯하여, 단백질, 펩타이드, 폴리펩타이드 및 효소의 모든 화학적 또는 효소적 변형을 포함한다.
본 발명에 따르면, 당해 기술 분야의 당업자들은 통상적인 분자 생물학, 미생물학 및 재조합 DNA 기술을 사용할 수 있다. 이러한 기술들은 문헌에 충분히 설명되어 있다. 예를 들어, 특히 Sambrook, Fritsch & Maniatis, Molecular Cloning: A Laboratory Manual, Second Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York (herein "Sambrook et al., 1989"); DNA Cloning: A Practical Approach, Volumes I and II (D.N. Glover ed. 1985); Oligonucleotide Synthesis (M.J. Gait ed. 1984); Nucleic Acid Hybridization (B.D. Hames & SJ. Higgins eds. (1985); Transcription and Translation (B.D. Hames & S.J. Higgins, eds. (1984); Animal Cell Culture (RI. Freshney, ed. (1986); Immobilized Cells and Enzymes (IRL Press, (1986); B. Perbal, A Practical Guide To Molecular Cloning (1984); F.M. Ausubel et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1994)을 참조한다.
본원에서, "선별가능한 표현형" 또는 "표현형으로 선별가능한" 또는 "표현형으로 스크리닝가능한"은 생장, 대사, 식물독성 (예, 제초제) 또는 기타 화합물에 대한 민감성 또는 영양분의 소모와 관련하여 세포 또는 유기체의 성능 또는 가시적인 특징의 변형으로 정의된다. 또한, "선별가능한 표현형"은 육안 또는 특수 장치를 사용해 관찰되는 가시적인 또는 비-가시적인 외양을 포함한다. 표현형으로 선별가능한 형질은 즉 하나 이상의 게놈 영역에 의해 코딩되며, 가시적으로 현미경에 의해 또는 분자 또는 분석 생물학의 임의 수단에 의해 스크리닝할 수 있는 표현형을 나타낸다.
본 발명에서 핵산 또는 아미노산 서열의 상동성 또는 동일성 %에 관한 경우, 이들 값은 핵산의 경우 EMBOSS Water Pairwise Sequence Alignments (nucleotide) programme (www.ebi.ac.uk/Tools/psa/ emboss_water/nucleotide.html) 또는 아미노산 서열의 경우 EMBOSS Water Pairwise Sequence Alignments (protein) programme (www.ebi.ac.uk/Tools/psa/emboss_water/)을 이용함으로써 수득되는 값으로 정의된다. 국소 서열 정렬을 위해 European Molecular Biology Laboratory (EMBL) European Bioinformatics Institute (EBI)에 의해 제공되는 이들 툴은 변형된 Smith-Waterman 알고리즘 (see www.ebi.ac.uk/Tools/psa/ and Smith, T.F. & Waterman, M.S. "Identification of common molecular subsequences" Journal of Molecular Biology, 1981 147 (1):195-197)을 사용한다. 정렬 수행시 EMBL-EBI에 의해 규정된 디폴트 파라미터를 사용한다. 그러한 파라미터는 (i) 아미노산 서열의 경우: 매트릭스 = BLOSUM62, 갭 오픈 패널티 = 10 및 갭 연장 패널티 = 0.5이거나, 또는 (ii) 핵산 서열의 경우: 매트릭스 = DNAfull, 갭 오픈 패널티 = 10 및 갭 연장 패널티 = 0.5이다.
이중 가닥 핵산 서열, 예를 들어 DNA 타겟 서열로서 게놈 서열과 관련하여, 용어 "가닥 절단"은 단일 가닥 절단 및/또는 이중 가닥 절단을 포함한다. 단일 가닥 절단 (닉)은 이중 가닥의 핵산 서열의 2개의 가닥 중 하나에서 끊어짐 (interruption)을 의미한다. 이는, 이중 가닥 핵산 서열의 양쪽 가닥에서의 끊어짐을 의미하는 이중 가닥 절단과 비교된다. 본 발명에 따른 가닥 절단은, 대상 핵산 염기 위치에서, 적합한 엔도뉴클레아제, 예를 들어, CRISPR 엔도뉴클레아제 또는 야생형 단백질 또는 엔도뉴클레아제의 돌연변이되거나 절단된 버전일 수 있지만 여전히 야생형 단백질의 효소적 기능을 발휘할 수 있는 이의 변이체를 이용한 효소적 절단에 의해, 이중 가닥 핵산 서열에 도입될 수 있다.
본원에서, 용어 "타겟 영역", "타겟 부위", "타겟 구조", "타겟 구조체", "타겟 핵산" 또는 "타겟 세포/조직/유기체", 또는 "DNA 타겟 영역"은 타겟 세포의 임의 구획 내의 임의의 게놈 또는 에피게놈 영역일 수 있는 타겟을 지칭한다.
본원에서, 용어 "타겟화된 (targeted)" 또는 "부위-특이적인 (site-specific 또는 site-directed)"은 변형할 대상 게놈 영역의 서열에 대한 정보를 이용하며, 대상 게놈 타겟 영역 안에서 구현될 하나 이상의 변형을 인 실리코 예측할 수 있는, 분자 도구, 예를 들어, CRISPR 등의 뉴클레아제 및 이의 변이체, TALEN, ZFN, 메가뉴클레아제 또는 재조합효소, DNA-변형 효소, 예로, 시티딘 데아미나제 효소, 히스톤 변형 효소 등과 같은 염기 변형 효소, DNA-결합 단백질, cr/tracRNA, 가이드 RNA의 작동 기전에 대한 정보에 추가적으로 의존하는, 분자 생물학의 작용을 지칭한다. 따라서, 관련 분자 도구는 생체외 또는 인 실리코로 설계 및 구축할 수 있다.
본원에서, 용어 "전이유전자" 또는 "전이유전자성"은 하나의 유기체의 게놈으로부터 취득되거나 또는 합성에 의해 제조된 다음 대상 숙주 세포 또는 유기체 또는 조직으로 도입되고, 후숙적으로 "안정적인" 형질전환 또는 형질감염 방식을 이용해 숙주의 게놈에 통합되는, 하나 이상의 핵산 서열을 지칭한다. 반면에, 용어 "일시적인" 형질전환 또는 형질감염 또는 도입은, 선택적으로 적절한 화학제 또는 생물 제제를 포함하는, 하나 이상의 핵산 (단일 가닥 또는 이중 가닥의 DNA, RNA 또는 이들의 혼합) 및/또는 하나 이상의 아미노산 서열을 비롯하여, 분자 도구를 도입하여, 비-제한적인 예로, 세포질, 소기관, 예로 핵, 미토콘드리아, 액포, 엽록체 또는 막 등의 하나 이상의 세포의 대상 구획 내로 전달하여, 안정적인 통합 또는 삽입을 달성하지 않고도 도입된 하나 이상의 분자의 전사 및/또는 번역 및/또는 조합 및/또는 활성을 달성하고, 따라서 세포의 게놈에 도입된 각각의 하나 이상의 분자의 유전이 구축되는, 방식을 의미한다.
따라서, 본원에서, 용어 "일시적인 도입"은, 본 발명에 따른 하나 이상의 핵산 서열의 일시적인 도입, 바람직하게는 전달 벡터의 도움을 받거나 또는 도움없이, 전달 벡터 또는 재조합 구조체에의 삽입, 타겟 구조, 예를 들어, 식물 세포에 통합되는 것을 의미하며, 하나 이상의 핵산 서열은 타겟 구조의 내인성 핵산 물질, 즉 게놈에 전체로서 삽입되지 않는, 즉 하나 이상의 핵산 서열이 타겟 세포의 내인성 DNA에 삽입되지 않는, 적절한 반응 조건 하에 도입된다. 결론적으로, 일시적인 도입의 경우, 도입된 유전자 구조체는 타겟 구조의 후대, 예를 들어, 원핵생물, 동물 또는 식물 세포로 유전되지 않을 것이다. 하나 이상의 핵산 서열 또는 이의 전사 또는 번역으로부터 생기는 생성물만 일시적으로 존재하며, 즉, 일시적인 방식으로, 구성적이거나 또는 유도성 형태로 존재하므로, 따라서 타겟 세포 내에서 제한된 시간 동안 효과를 발휘하도록 작용할 수 있을 뿐이다. 따라서, 일시적인 도입에 의해 도입된 하나 이상의 핵산 서열은 세포의 후대로 유전되지 않을 것이다. 그러나, 일시적인 방식으로 도입된 핵산 서열의 효과는 타겟 세포의 후대로까지 이어질 가능성이 있을 수 있다.
본원에 기술된 임의의 부위-특이적인 작동자 또는 염기 편집기의 "변이체"는 천연적으로 생기는 야생형 효소의 활성을 변형시키기 위해, 해당 야생형 효소와 비교해 하나 이상의 돌연변이, 결손 또는 삽입을 포함하는 분자를 의미한다. "변이체"는, 비-제한적인 예로서, 촉매적으로 비-활성형 Cas9 (dCas9), 또는 닉카제로서 기능하도록 변형된 부위-특이적인 뉴클레아제일 수 있다.
상세한 설명
본 발명은 병행 도입 전략을 특이적으로 조합 및 이용하는, 식물 세포, 조직, 기관 또는 물질에서의 타겟화된 편집 방법을 제공한다. 본원에 제공된 방법은 따라서 제1 게놈 타겟 부위에서 표현형으로 선별가능한 형질의 병행 도입을 기초로 하며, 이러한 표현형으로 선별가능한 형질은 쉽게 스크리닝할 수 있으며, 전이유전자성 마커 서열 또는 마커 카세트의 도입을 포함하지 않는다. 또한, 선별가능한 표현형을 수득하기 위해 제1 게놈 타겟 부위에 타겟화된 변형의 도입은, 일반적으로 게놈 타겟 부위에 이중 가닥 절단을 도입하는 부위-특이적인 뉴클레아제 (SSN)를 이용하는 다양한 게놈 편집 방식에 필요한 단계들인, 외인성 폴리뉴클레오티드 주형의 제공도, 타겟 부위에 이중 가닥 (ds) 절단의 도입에도 의존하지 않으며, 외인성 핵산 물질로서 상동적인 복구 (HR)의 복구 주형을 제공함으로써 대개 해결된다.
이에, 일반적으로 반복적이며 일반적으로 시간 소모적인 선별 단계가 요구되는, 대상 농업 형질들을 대상 식물에 조합하는 식물 육종 전략과 구체적으로 관련있는 방법을 제공한다. 또한, 본원에 제공된 구체적인 방법 단계들은 전이유전자성 마커-프리 선별 및 여러가지 게놈 타겟 부위에서의 타겟화된 편집을 병행하여, 식물 또는 식물 세포에 선별가능한 또는 기타 표현형을 부여하게 된다. 이에, 이러한 변형된 식물 물질을 선별 마커 카세트 없이도 분리할 수 있으며, 이러한 표현형 선별은 일반적으로 이처럼 표현형으로 스크리닝가능하지 않은 제2 대상 타겟화된 변형을 스크리닝하는 비율을 현저하게 낮출 수 있다. 하나의 변형이 전이유전자성 마커-프리 선별을 보장하고 또 다른 변형은 고도의 부위-특이적이며 예측가능한 편집을 대상 게놈 타겟 부위 도입할 수 있게 하는 2가지 타겟화된 변형의 동시적인 도입의 상승적인 상호작용 (synergistic interplay)으로 인해, 본 발명의 방법은 대상 유전자형을 동정하기 위한 선별 노력을 현저하게 낮추는 것을 포함한 정확한 육종 전략을 가능케 하며, 이로써 대상 식물 세포 또는 생식질 내에서 해당 변형을 동정하는데 필요한 시간과 비율 감소의 도움이 된다.
제1 측면에서, 본 발명은, (a) 하나 이상의 제1 타겟화된 염기 변형을 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 타겟화된 염기 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계; (b) 하나 이상의 제2 타겟화된 변형을 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 제2 타겟화된 변형이 하나 이상의 부위-특이적인 작동자를 이용해 도입되어 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로 하나 이상의 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포 또는 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및 (c) (i) 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로 (ii) 제2 식물 게놈 타겟 부위에서 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써, 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계를 포함하는, 전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물을 단리하는 방법을 제공한다.
본 발명의 방법에 따르면, 선별가능한 마커로서 사용할 형질전환성 외인성 서열의 안정적인 통합은 필수적이지 않다. 대신, 표현형으로 선별가능한 형질 또는 표현형은 제1 식물 게놈 타겟 부위에 구축된다. 이는 선별시 마커로서 사용할 외인성 핵산 구조체의 통합에 의존하지 않는, 선별가능한 편집을 제공하는 이점이 있다.
본원에서, "표현형으로 선별가능한 형질"은 관련 게놈 형질의 발현 후 가시적인 또는 선별가능한 표현형을 유발하는 하나 이상의 유전자에 의해 코딩되는 형질을 의미한다. 이러한 형질에 대한 선별은 가시적으로, 또는 식물 세포, 조직, 기관, 물질 또는 완전한 식물에 적용될 선별 물질, 화합물 또는 촉발제를 이용함으로써, 달성될 수 있다.
제1 및 제2 식물 게놈 타겟 부위는 동일한 또는 서로 다른 게놈 유전자 좌일 수 있다. 바람직하게는, 제1 및 제2 식물 게놈 타겟 부위는 서로 다른 게놈 유전자 좌에 위치하고, 게놈 유전자 좌는 동일한 또는 서로 다른 염색체에 위치될 수 있다.
본 발명의 방법에 따르면, 제1 및 제2 타겟화된 변형의 동시적인 도입 전략이 이루어지며, 이러한 제1 및 제2 식물 게놈 타겟 부위에 도입된 여러가지 타겟화된 변형들의 병행은 이후 스크리닝 단계를 현저하게 개선한다. 통상적으로, 제1 변형은, 이로 부여되는 표현형이 식물 구축 프로세스에서 관련 또는 발현되지 않기 때문에, 선별 기회는 없을 것이다. 그래서, 본 발명의 방법의 기저가 되는 의도는 선별하기 위한 도구로서 표현형으로 선별가능한 표현형을 유발하는 제1 변형을 이용하는 것이다. 전통적인 방법과 비교해, 본원에 개시된 방법은 전이유전자성 마커 유전자를 통합시키지 않는 이점을 가진다. 선별 물질로 선별가능한 표현형을 이용하지 않는 경우와 비교해, 식물을 생산하는 세포 대부분을 포함하는 모든 또는 대부분의 무처리 세포를 제거함으로써 효율을 높이는 이점을 가진다. 무처리 세포를 제거함으로써, 생산해야 할 식물의 수가 크게 감소되며, 제2 타겟화된 변형을 분자 스크리닝해야 할 식물의 수가 크게 줄어드어, 개시된 식물 육종 방법의 효율이 크게 증가한다.
바람직하게는, 본 발명의 다양한 측면에 따른 방법들은, 대상 제2 식물 게놈 타겟 부위에의 하나 이상의 제2 타겟화된 변형 수용 (receiving)과 더불어, 변형할 하나 이상의 식물 세포에의 하나 이상의 제1 타겟화된 염기 변형, 코돈 결손 또는 프래임쉬프트 또는 결손 변형의 동시적인 또는 후속적인 도입에 의존한다. 따라서, 제1 및 제2 타겟 부위에서의 변형은 바람직하게는 동일한 세포에 동시적으로, 즉 동시적인 방식으로, 즉 병행 방식으로 도입된다. 이러한 의미에서 후속적인 도입 (subsequent introduction)은, 하나 이상의 염기 편집 복합체 및/또는 하나 이상의 부위-특이적인 작동자를 포함하는 도입된 여러가지 도구들이 서로 직전에 작용할 수 있다는 것을 의미한다. 여전히, 이 용어는 이런 맥락에서 동일한 세포 안에 대상 도구들을 동시적으로 병행 도입하는 것을 내포한다. 이는, 하나 이상의 제1 및 제2 타겟화된 변형을 매개하는 분자 도구의 도입 프로세스 커플링은 서로 완전히 독립적이기 때문에, 스크리닝 잠재성을 개선하는 효과를 가진다. 하나의 변형을 가진 변형할 세포는 따라서 또한 제2 타겟화된 변형을 가질 가능성이 훨씬 더 높다. 세포를 특히 처리된 및 무처리된 세포의 전제 집단으로부터 명확한 표현형을 일반적으로 가지지 않은 제2 변형에 대해 랜덤 선별하는 것과 비교해, 본 발명의 방법은 선별 이점을 제공해준다. 따라서, 통상적으로 게놈 편집시 병목 현상인 선별은 기능적인 방식으로 해당 도구의 전달로서 현저하게 개선되며, 동조화되고, 동시적으로 행해진다. 타겟화된 방식으로 제1 변형을 선별할 가능성으로 인해, 본 발명에 따른 임의의 도구 또는 복합체를 기능적인 방식으로 전혀 수용하지 않는 세포는 제1 식물 게놈 타겟 부위에서 표현형으로 선별가능한 형질을 유도하는 변형을 수용하지 않을 것이므로, 제2 식물 게놈 타겟 부위의 하나 이상의 타겟화된 변형을 스크리닝하는 시도는 제한된 횟수로 행해져야 있다. 상기한 식물 세포가 병행된 방식으로 세포에 첨가된 본 발명에 따른 제2 부위-특이적인 작동자 복합체를 수용할 가능성이 낮기 때문에, 제1 타겟화된 변형의 스크리닝이 음성인 경우, 제2 타겟화된 변형에 대해서는 시간-소모적인 스크리닝을 행할 필요가 없을 것이다.
따라서, 본 발명에 따른 방법은, 적절한 시약 또는 가시적인 스크리닝에 의해 제1 타겟화된 변형을 가진 타겟화된 표현형으로 선별가능한 형질을 선별함으로써 하나 이상의 제1 변형을 수용하거나 또는 수용하지 않은 세포를 선별할 수 있게 한다. 이에, 이러한 스크리닝은 하나 이상의 제1 변형을 포함하지 않는 세포를 제거하거나, 스크리닝은 육안 검사 (visual inspection) 및 제1 타겟화된 변형을 수용한 또는 수용하지 않은 변형된 세포들로의 분리를 가능하게 한다. 제1 타겟화된 변형을 성공적으로 수용한 세포들 중에서, 본 발명에 따른 병행 도입 및 전달 방식으로 인해 합리적인 갯수가 하나 이상의 제2 타겟화된 변형 역시 가질 것으로 예상할 수 있다. 이러한 맥락에서 "합리적인"은 하나 이상의 제1 타겟화된 염기 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별함으로써 하나 이상의 제2 타겟화된 변형의 존재를 스크리닝해야 하는 세포의 수의 임의 개선, 즉 감소를 내포한다. 하나 이상의 제2 타겟화된 변형이 존재하는 실제 빈도는 일반적으로 수종의 인자에 따라 가변적일 것이므로, 예측하기 어렵다. 이는 통상적인 분자 기법, 예를 들어 PCR 기반의 통상적인 분자 기법을 이용하여 스크리닝하기 번거러운 게놈 조작을 통해 도입된 임의의 변형을 스크리닝하게끔 한다. 본 발명의 방법에 따르면, 제1 및 제2 타겟화된 변형 둘다 수용한 세포의 빈도는, 제1 및 제2 변형을 가진 것에 대해, 제1 변형을 가진 식물 세포 또는 식물 2:1 내지 1,000:1 범위일 수 있다. 따라서, 제2 변형을 스크리닝하여야 하는 세포의 총 수가 줄어들기 때문에, 임의의 스크리닝 또는 선별 단계에서 본질적인 이점이 존재한다. 구체적으로, 제1 및 제2 타겟화된 변형을 도입하기 위한 도구의 전달에 실패한 세포는, 임의의 분자 도구(들)를 수용하지 않을 가능성이 높으며, 따라서 제1 타겟화된 변형도 제2 타겟화된 변형도 존재하지 않을 것이다. 표현형으로 선별가능한 제1 형질이 나타나지, 즉 선별가능하지 않을 것이다. 선별압 또는 육안 선별 후, 표현형으로 선별가능한 형질이 "음성"인 해당 식물 세포, 조직, 기관 또는 완전한 식물은, 제1 변형이 존재하지 않을 경우 제2 변형이 도입될 기회가 대응되는 도구의 병행 도입으로 인해 낮기 때문에, 제2 타겟화된 변형에 대한 후속적인 스크리닝을 거치지 않아도 될 것이다.
필요에 따라, 유래된 식물을 교배하고 제2 변형으로부터 이를 유전자적으로 분리함으로써, 제1 변형을 제거할 수 있다.
본원에 개시된 방법은 따라서 하나 이상의 제1 타겟화된 대상 변형에 대해 스크리닝한 바와 같이 편집 시약을 수용하지 않거나 또는 타겟화된 변형을 겪지 않은 세포를 소거 또는 제거함으로써 대상 제2 유전자에서 타겟화된 변형을 가진 식물 회수를 높이는데 이용할 수 있다.
본 발명의 다양한 구현예에 따른 타겟화된 염기 변형은, dsDNA 백본 절단 또는 도너 주형 없이도, 프로그래밍가능한 방식으로 하나의 타겟 DNA 염기를 다른 것으로 직접적이고 비가역적으로 변환할 수 있는 게놈 편집을 의미한다 (cf. Komor et al., Nature, Vol. 533, 2016).
일 구현예에서, 본 발명의 제1 측면에 따른 방법은, 부가적으로, 단계 (b)에서, 적어도 제2 식물 게놈 타겟 부위에서 타겟화된 서열 변환 또는 치환을 만들기 위해 복구 주형을 도입하는 것을 포함한다. 복구 주형 (RT)은 임의의 게놈 편집시 제공될 수 있는 이중 가닥 또는 단일 가닥 핵산 서열이며, 이는 이중 가닥 또는 단일 가닥 DNA 절단을 유발하여, 상동적인 복구 (homology-directed repair)를 보조하는 것으로 알려진 서열을 가진 주형으로서, RT를 제공함으로써 DNA 절단의 타겟화된 복구를 보조한다. 본 발명에 따른 하나 이상의 복구 주형 핵산 서열의 크기는 부분적으로 다양할 수 있다. 이는 부위-특이적인 방식으로 변형할 DNA 타겟 서열에 따라 약 20 bp 내지 약 5,000 bp 또는 심지어 8,000 bp 범위일 수 있다. RT는 개별체 (physical entity)로서 또는 본 발명에 따른 복합체의 일부로서 제공될 수 있다. RT의 사용은 세포의 NHEJ 복구 기전으로 인한 부적절한 삽입 또는 결손을 회피하기 위해 특정 용도에 유익할 수 있을 것이다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 본원에 제공된 방법은 (d) 하나 이상의 제1 타겟화된 변형 및 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 추가적인 단계를 포함한다.
추가적인 대상 식물 또는 식물 물질은 대상 게놈 물질을 포함하는 임의의 식물 물질일 수 있으며, 예를 들어 임의의 대상 형질 또는 엘리트 이벤트 (elite event)를 포함하는 이 물질은, 예를 들어, 유전자형을 구축하고, 따라서 대상 식물을 확립하기 위한 후속적인 육종 라운드 용도로 의도된다. 따라서, 대상 유전자형은 여러가지 대상 식물로부터 유래된 형질들을 조합하는 선행 육종 단계의 결과이다.
본 발명의 모든 측면들에 따른 일 구현예에서, 대상 최종 유전자형은 하나 이상의 제1 타겟화된 변형, 즉 하나 이상의 표현형으로 선별가능한 형질을 포함하지 않는다. 도 1에 예시한 바와 같이, 본 발명의 방법은, 특정 용도에서 바람직하다면, 원하는 식물을 교배하고, 이를 제2 타겟화된 변형으로부터 유전자 측면에서 분리함으로써, 표현형으로 선별가능한 형질을 유발하는 제1 타겟화된 변형을 제거하는데 특히 적합하다 (cf. 도 1 C). 다른 구현예에서, 표현형으로 선별가능한 대상 형질을 코딩하는 제1 타겟화된 변형은, 달성되는 대상 유전자형 및 대응되는 식물 또는 식물 물질에 이와 같은 표현형으로 선별가능한 형질이 유용한 경우에, 대상 유전자형을 유지할 수 있다.
본 발명의 제1 측면에 따른 일 구현예에서, 하나 이상의 부위-특이적인 작동자는 하나 이상의 염기 편집 복합체에 일시적으로 또는 영구적으로 연결되며, 염기 편집 복합체는 단계 (a)의 하나 이상의 제1 타겟화된 염기 변형을 매개한다. 따라서, 하나 이상의 부위-특이적인 작동자는 하나 이상의 염기 편집 복합체에 비-공유적으로(일시적으로) 또는 공유적으로(영구적으로) 부착될 수 있다. 하나 이상의 염기 편집 복합체의 임의 구성성분이 하나 이상의 부위-특이적인 작동자에 일시적으로 또는 영구적으로 연결될 수 있다. 용어 "일시적" 및 "영구적"은 따라서 광의적으로 해석되며, 하나 이상의 부위-특이적인 작동자 및 하나 이상의 염기 편집 복합체의 물리적 근접성을 달성하기 위한 공유적 및/또는 비-공유적 결합 또는 부착을 둘다 포함한다. 적어도 하나 이상의 염기 편집 복합체의 구성성분 및 하나 이상의 부위-특이적인 작동자 또는 임의의 기타 구성성분, 예를 들어 하나 이상의 부위-특이적인 작동자와 조합된 gRNA 또는 RT 상의 연결은, 하나 이상의 제1 및 하나 이상의 제2 게놈 타겟 부위가 대상 게놈 내에서 매우 근접하게 위치된 경우에, 흥미로울 수 있다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 부위-특이적인 작동자는 CRISPR 뉴클레아제, 예로 Cas 또는 Cpf1 뉴클레아제, TALEN, ZFN, 메가뉴클레아제, 아르고너트 (Argonaute) 뉴클레아제, 제한 엔도뉴클레아제, 예로, FokI 또는 이의 변이체, 재조합효소 또는 2 부위-특이적인 닉킹 엔도뉴클레아제, 또는 염기 편집기, 또는 전술한 작동자의 임의의 변이체 또는 촉매학적으로 활성인 단편을 포함하는, 하나 이상의 뉴클레아제로부터 선택된다.
따라서, 본원에서, "부위-특이적인 작동자"는, 게놈 타겟 부위에 단일 가닥 또는 이중 가닥 절단을 도입할 수 있는 능력, 또는 대상 게놈 타겟 부위에 점 돌연변이, 삽입 또는 결손을 포함하여 타겟화된 변형을 도입할 수 있는 능력을 가진, 임의의 뉴클레아제, 닉카제, 재조합효소 또는 염기 편집기로서 정의될 수 있다. 하나 이상의 "부위-특이적인 작동자"는 자체적으로 작용할 수 있거나, 또는 분자 복합체의 일부로서 다른 분자와 조합하여 작용할 수 있다. "부위-특이적인 작동자"는, 부위-특이적인 작동자 복합체의 구성성분들이 물리적으로 인접하도록 공유 또는 비-공유적 상호작용 중 하나 이상에 의해 결합된 또는 결합되는, 개별 분자들로서 또는 융합 분자로서 존재할 수 있다.
본원에서, "염기 편집기"는 단백질 또는 기원이 되는 단백질과 동일한 촉매 활성을 가진 이의 단편을 지칭하며, 단백질 또는 이의 단편은 단독으로 또는 분자 복합체로서 제공되는 경우에는 본원에서 염기 편집 복합체로서 지칭되며, 만일 염기 변환이 침목 돌연변이를 야기하지 않고 오히려 염기 편집기로 변환할 위치를 포함하는 코돈에 의해 코딩된 아미노산의 변환을 유발한다면, 타겟화된 염기 변형을 매개할 수 있는 능력, 즉 대상 점 돌연변이를 유발하여 타겟화된 돌연변이를 발생시킬 수 있는 대상 염기의 변환을 매개하는 능력을 가진다. 바람직하게는, 본 발명에 따른 하나 이상의 염기 편집기는 하나 이상의 부위-특이적인 작동자, 또는 선택적으로 하나 이상의 부위-특이적인 작동자 복합체의 구성성분에 일시적으로 또는 영구적으로 연결된다. 연결은 공유 및/또는 비-공유적일 수 있다.
본원에 기술된 임의의 염기 편집기 또는 부위-특이적인 작동자 및 이의 촉매학적으로 활성인 단편, 또는 염기 편집기 복합체 또는 부위-특이적인 작동자 복합체의 임의 구성성분은 핵산 단편으로서 세포에 도입될 수 있으며, 핵산 단편은 DNA, RNA 또는 단백질 작동자이거나 또는 이를 코딩하는 것이거나, 또는 이는 DNA, RNA 및/또는 단백질, 또는 이들의 임의 조합으로서 도입될 수 있다.
엔도뉴클레아제, DSB 및 복구 주형으로 선별가능한 변형을 만들기 위한 요건을 제거하는 핵심적인 툴세트는 염기 편집기 또는 타겟화된 돌연변이 유발 도메인의 사용이다. 복수의 간행물들에서 CRISPR/Cas9 닉카제 또는 시티딘 데아미나제 도메인에 연결된 비-기능성 뉴클레아제, 아포지단백질 B mRNA-편집성 촉매적 폴리펩타이드 (APOBEC1), 예를 들어 랫 유래의 APOBEC를 이용하여, 타겟화된 염기 변환, 주로 시티딘 (C)에서 티민 (T) 변환이 입증된 바 있다. 시토신 (C)의 탈아민화는 시티딘 데아미나제에 의해 촉매되며, 우라실 (U)이 만들어지며, 이는 티민 (T)과 염기 쌍을 형성하는 특성을 가진다. 가장 알려진 시티딘 데아미나제는 RNA에 작용하며, DNA를 받아들이는 것으로 공지된 수종의 예들은 단일 가닥 (ss) DNA를 필요로 한다. dCas9-타겟 DNA 복합체에 대한 연구를 통해, 대체된 DNA 가닥의 뉴클레오티드 (nt) 9개 이상이 Cas9-가이드 RNA-DNA 'R-루프' 복합체의 형성시 쌍 형성으로부터 해리되는 것으로, 밝혀졌다 (Jore et al., Nat. Struct. Mol. Biol., 18, 529-536 (2011)). 실제, Cas9 R-루프 복합체의 구조에서, 대체된 DNA 가닥의 프로토스페이서 첫 nt 11개는 무질서해지는데, 이는 이러한 움직임이 매우 제한적이지 않다는 것을, 시사한다. 비-주형 가닥에서 시토신의 Cas9 닉카제-유도성 돌연변이가 세포의 시토신 데아미나제 효소에 의한 이의 허용성으로부터 생길 수 있는 것으로 또한 추측되었다. R-루프에서 ssDNA 가닥 서브세트는 DNA에서 C에서 U로의 직접적이고 프로그래밍가능한 변환을 달성하기 위한 dCas9-묶인 (tethered) 시티딘 데아미나제의 효과적인 기질로서 이용할 수 있는 것으로 추정되었다 (Komor et al., supra).
따라서, 본 발명에 따른 임의의 염기 편집 복합체는 하나 이상의 시티딘 데아미나제 및 이의 촉매학적으로 활성인 단편을 포함한다. 하나 이상의 염기 편집 복합체는, 염기 편집기로서, 시티딘 데아미나제 또는 촉매학적 활성 단편 형태로 이의 도메인을 포함할 수 있다.
다른 구현예에서, 하나 이상의 제1 타겟화된 염기 변형은 임의의 뉴클레오티드 C, A, T 또는 G에서 임의의 다른 뉴클레오티드로의 변환이다. C, A, T 또는 G 뉴클레오티드 중 어느 하나는 부위-특이적인 방식으로 염기 편집기 및 이의 촉매학적으로 활성인 단편에 의해 다른 뉴클레오티드로 교체될 수 있다. 하나 이상의 염기 편집 복합체는 따라서 타겟화된 방식으로 임의의 다른 대상 뉴클레오티드로 대상 뉴클레오티드를 변환할 수 있는, 임의의 염기 편집기 또는 이의 염기 편집기 도메인 또는 이의 촉매학적 활성 단편을 포함할 수 있다.
본 발명은 이와 같은 염기 편집기 도구에 대한 정보를 조합하는 방법을 제공하며, 염기 편집으로 선별가능한 표현형 아웃풋을 가진 내인성 마커를 인위적으로 구축할 수 있으므로, 전이유전자성 마커의 사용을 피하기 위한, 표현형으로 선별가능한 대상 표현형을 달성하는 조합된 방법으로 이 기법을 이용한다. 이를 위해, 염기 편집기는, C에서 U 또는 G에서 A로의 변형을 매개하여 부위 특이적인 돌연변이 유발을 도입하기 위해, 선택적으로, CRISPR-기반의 뉴클레아제에 대한 gRNA에 의해 안내되는 게놈 타겟 영역을 인지 및 결합하는 능력을 보유한, 변형된 부위-특이적인 작동자와 조합된다. 그래서, 타겟화된 돌연변이가 달성될 수 있으며, 이로써 대상 표현형이 구축된다. 이는, 특히 본원에 기술된 방법은 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 타겟화된 염기 변형을 도입하기 위한 하나 이상의 염기 편집기 또는 염기 편집 복합체의 사용을, 하나 이상의 부위-특이적인 작동자에 의해 매개되는 제2 변형과 병행 방식으로 조합하는 것이므로, 타겟화된 육종 전략 방식을 제시해준다. 이러한 방식은, 본 발명의 다양한 측면들에 따른 하나 이상의 제1 변형을 위해, 즉, 타겟화된 염기 변형, 타겟화된 코돈 결손 또는 타겟화된 프래임쉬프트 또는 결손 변형을 위해 DSB 또는 RT를 도입할 필요없이, 상승적인 방식으로 대상 변형 또는 유전자형을 마커-프리 방식으로 선별 및 스크리닝할 수 있게 해준다.
우라실 DNA 글리코실라제 (UGI) 도메인의 추가는 염기-편집 효율을 추가적으로 높인다. 복합체의 적절한 타겟팅을 보장하기 위해 핵 위치화 신호 (NLS) 또는 임의의 다른 소기관 타겟팅 신호가 추가적으로 필요할 수도 있다.
본 발명의 모든 측면들에 따른 일 구현예에서, 하나 이상의 부위-특이적인 작동자는 CRISPR-기반의 뉴클레아제이고, CRISPR-기반의 뉴클레아제는 하나 이상의 염기 편집 복합체를 디렉팅하는 부위-특이적인 DNA 결합 도메인을 포함하며, 하나 이상의 CRISPR-기반의 뉴클레아제 또는 이를 코딩하는 핵산 서열은 (a) SpCas9, SaCas9, SaKKH-Cas9, VQR-Cas9, St1Cas9 등의 Cas9, (b) AsCpf1, LbCpf1, FnCpf1 등의 Cpf1, (c) CasX, 또는 (d) CasY, 또는 전술한 CRISPR-기반의 뉴클레아제의 임의 변이체 또는 유도체를 포함하는 군으로부터 선택되며, 바람직하게는 하나 이상의 CRISPR-기반의 뉴클레아제는 해당 야생형 서열과 비교해 돌연변이를 포함하며, 그래서 제조되는 CRISPR-기반의 뉴클레아제는 단일 가닥 특이적인 DNA 닉카제, 또는 모든 DNA 절단력이 결핍된 DNA 결합 작동자로 변환된다.
본원에서, "CRISPR-기반의 뉴클레아제"는 천연적으로 생긴 다음 이의 천연 상태로부터 단리되고, 바람직하게는 타겟화된 게놈 조작의 도구로서 적합하게 변형되거나 또는 대상 재조합 구조체에 조합된, CRISPR 시스템에서 동정된 임의의 뉴클레아제이다. 임의의 CRISPR-기반의 뉴클레아제가 사용될 수 있으며, 선택적으로 오리지날 야생형 CRISPR-기반의 뉴클레아제가 DNA 인지, 즉 결합 특성을 제공하는 한, 본 발명에 따른 다양한 구현예에 적합하게 리프로그래밍되거나 또는 추가적으로 돌연변이될 수 있다. 이러한 DNA 인지는 PAM 의존적일 수 있다. 최적화되고 조작된 PAM 인지 패턴을 가진 CRISPR 뉴클레아제가 사용될 수 있으며, 특정한 용도로 구축될 수 있다. PAM 인지 코드의 확대 (expansion)는, 야생형 CRISPR-기반의 뉴클레아제의 오리지날 PAM 특이성과 무관하게, 부위-특이적인 작동자 복합체를 대상 타겟 부위로 타겟팅하는데 적합할 수 있다. Cpf1 변이체는 S542R, K548V, N552R 또는 K607R 돌연변이 중 하나 이상, 바람직하게는 액시드아미노코커스 (cf. 서열번호 24) 유래의 AsCpf1에서 돌연변이 S542R/K607R 또는 S542R/K548V/N552R을 포함할 수 있다. 또한, 변형된 Cas 변이체, 예를 들어 Cas9 변이체는, 염기 편집 복합체의 일부로서 예를 들어 BE3, VQR-BE3, EQR-BE3, VRER-BE3, SaBE3, SaKKH-BE3의 일부로서 본 발명의 방법에 따라 사용할 수 있다 (Kim et al., Nat. Biotech., 2017, doi:10.1038/nbt.3803). 따라서, 본 발명에서, 이중 가닥 절단 효소의 의미에서 임의의 "뉴클레아제"가 아닐 수 있지만, 여전히 본질적인 DNA 인지, 따라서 결합력을 가지고 있는 뉴클레아제-데드 변이체 (nuclease-dead variant) 또는 닉카제일 수 있는, 인위적으로 변형된 CRISPR 뉴클레아제가 고려된다. 본 발명의 목적에 적합한 예시적인 Cas- 또는 Cpf1-기반의 구조체는 서열번호 17 - 19에 열거된다. AsCpf1 야생형 서열은 서열번호 24에 기술된다. 본 발명의 방법에 사용하기에 적합한 다른 Cpf1-기반의 작동자는 라크노스피래세애 박테리움 (Lachnospiraceae bacterium) (LbCpf1, 예로, NCBI Reference Sequence: WP_051666128.1), 또는 프란시셀라 툴라렌시스 (Francisella tularensis) (FnCpf1, 예, UniProtKB/Swiss-Prot: A0Q7Q2.1)로부터 유래된다. Cpf1의 변이체들이 공지되어 있다 (cf. Gao et al., BioRxiv, dx.doi.org/10.1101/091611). 시험관내 및 생체내 강화된 활성을 가진, 각각 TYCV/CCCC 및 TATV PAM을 가진 타겟 부위를 절단할 수 있는 돌연변이 S542R/K607R 및 S542R/K548V/N552R을 가진 AsCpf1의 변이체는, 따라서 본 발명에 따른 부위-특이적인 작동자로서 간주된다. 오프-타겟 활성의 게놈-와이드 분석에서, 이들 변이체가 DNA 타겟팅 특이성을 높은 수준으로 보유한 것으로 나타났으며, 이는 non-PAM-상호작용 도메인에 돌연변이를 도입함으로써 추가적으로 개선할 수 있다. 요컨대, 이들 변이체는 인간 게놈의 비-반복 영역에 각 ~8.7에서 하나의 절단부에 대한 AsCpf1의 타겟팅 범위를 증가시키며, 단, CRISPR/Cas 게놈 조작 툴박스에 유용한 추가를 제공한다 (Gao et al., supra).
본 발명의 제1 측면에 따른 일 구현예에서, 하나 이상의 제1 타겟화된 염기 변형은 하나 이상의 염기 편집기를 구성성분으로서 포함하는 하나 이상의 염기 편집 복합체에 의해 수행된다. 본 발명에 따른 염기 편집 복합체는 염기 편집기를 포함하며, 아울러 선택적인 구성성분을 추가로 포함한다.
일 구현예에서, 염기 편집 복합체는 APOBEC1 구성성분, 바람직하게는 랫 APOBEC1을 포함한다. 다른 구현예에서, 염기 편집 복합체는 염기 편집기로서 임의의 시티딘/시토신 데아미나제 효소, 예를 들어 인간 AID, 예컨대, UniProtKB/Swiss-Prot: Q9GZX7.1, 인간 APOBEC3G, 예컨대, GenBank: CAK54752.1, 또는 칠성장어 (lamprey) CDA1, 예컨대 GenBank: ABO15150.1을 포함하며, 임의의 효소 또는 이의 촉매학적 활성인 단편도 본 발명의 범위에 고려된다. 본 발명의 방법으로 사용하기 적합한 예시적인 APOBEC 구성성분은 서열번호 20으로 표시된다. 아울러, 변형된 염기 편집기를 본 발명의 방법에 따라 사용할 수 있으며, 바람직하게는 바람직하게는 < 6 nt, < 5 nt, < 4 nt, < 3 nt 또는 심지어 2 또는 1 nt의 편집 폭이 작은 염기 편집기가 사용될 수 있다. 편집 범위가 더 작을수록, 보다 정확한 편집을 대상 게놈 타겟 부위에 도입할 수 있다.
일 구현예에서, 염기 편집 복합체는 UGI (우라실 DNA 글리코실라제 저해제) 구성성분을 포함한다. 특정 구현예에서, 바실러스 섭틸리스 유래 UGI이 사용되거나, 또는 특정 세포에서 활성인 내인성 염기-절개 복구 (base-excision repair, BER) 활성을 억제하기 위해 UDG 활성을 저해하는 임의의 다른 도메인이 사용될 수 있다. 본 발명의 방법에 사용하기 적합한 예시적인 UGI 구성성분은 서열번호 21로 표시된다.
다른 추가의 구현예에서, 염기 편집 복합체는 하나 이상의 부위-특이적인 작동자에 연결된 하나 이상의 염기 편집기의 최적화된 탈아민화 활성을 제공하기 위해, XTEN 구성성분, 즉, 특이적인 링커를 포함한다. 염기 편집기와 부위-특이적인 작동자 사이에 뉴클레오티드 (nt) 2개 이상 길이의 다른 링커가 사용될 수 있으며, 이 링커는 부위-특이적인 작동자에 의해 부여되는 결합 활성 및/또는 염기 편집기의 염기 편집 활성에 영향을 미치지 않는다. 적절한 XTEN 링커 서열은 서열번호 1 (688번부터 735번 위치), 서열번호 2 (706번부터 753번 위치), 서열번호 14 (706번부터 753번 위치), 또는 서열번호 15 (706번부터 753번 위치)에 제공된다. 당해 기술 분야의 당업자에게 공지된 다양한 추가적인 링커뿐 아니라 링커 설계에 대한 문헌들이 존재한다. 고정된 링커뿐 아니라 유연한 링커 둘다 본 발명의 다양한 방법에 따라 사용될 수 있다.
본 발명에 따른 융합 구조체의 예는 서열번호 1, 2, 14, 15 또는 16으로 제공된다.
일 구현예에서, 하나 이상의 염기 편집 복합체는 구성성분을 한개 보다 많이 포함하며, 적어도 2개의 구성성분이 물질적으로 연결된다. 물질적인 연결은 공유 연결, 예를 들어, DNA 단편들을 서로 융합하여 발현 후 융합 단백질을 구축하거나, 또는 본 발명에 따른 복합체의 서로 다른 구성성분들을 서로 화학적으로 가교함으로써, 공유 연결을 포함할 수 있다. 물질적인 연결은 부가적으로 비-공유적 상호작용을 포함할 수 있다. 따라서, 비-공유적 상호작용 또는 부착은 정전기 상호작용, 반데르 발스 힘, TT-이펙트 및 소수성 효과를 포함한다. 핵산 분자 측면에서 특히 중요한 것은 정전기 상호작용으로서 수소 결합이다. 수소 결합 (H-결합)은 부분적인 양의 수소 원자와 수소 원자에 공유 결합되지 않은 음전기성이 매우 높은 부분적인 음의 산소, 질소, 황 또는 불소 원자 간의 상호작용을 수반하는, 특별한 타입의 쌍극자-쌍극자 상호작용이다.
추가적인 구현예에서, 염기 편집 복합체는 염기 편집기로서 PmCDA1 (바다 칠성장어 유래의 활성화-유도된 시티딘 데아미나제 (AID) 오르소로그 PmCDA1, Nishida et al. (Science 2016, vol. 353, issue 6305, aaf8729) 참조함) 구성성분을 포함한다. 본 발명의 방법에 따라 사용하기 위한 예시적인 PmCDA1은 서열번호 22에 제공된다.
CRISPR-기반의 뉴클레아제는 변형할 대상 게놈 타겟 영역 내에 존재하는 프로토스페이서-인접 모티프 (PAM)의 인지를 통해 작동한다. 변형된 CRISPR-기반의 뉴클레아제를 이용하여 염기 편집의 범위 및 정확도를 추가적으로 높이기 위해, 타겟화할 수 있는 부위의 수를 늘리기 위한 여러가지 PAM 특이성 도입이 특히 관심의 대상이다 (Kim et al., Nat. Biotech., 2017, doi:10.1038/nbt.3808). 당해 기술 분야의 당업자에 공지된 바와 같이, 야생형 CRISPR 뉴클레아제는 뉴클레아제에 따라 다양한 본질적인 PAM 특이성을 가진다. 본 발명에서, 변형된 PAM 특이성, 따라서 변형된 타겟팅 범위를 가진, CRISPR-기반의 뉴클레아제, 예를 들어, NGA (VQR-Cas9), NGAG (EQR-Cas9) 또는 NGCG (VRER-Cas9) PAM 서열을 수용하는 SpCas9 돌연변이뿐 아니라 NNNRRT에 대한 변이체의 PAM 요건을 완화하는 돌연변이 3개 (SaKKH-Cas9)를 포함하는 조작된 SaCas9 변이체가 고려된다 (Kleinstiver et al., Nat. Biotechnol. 33, 1293-1298 (2015)). 여러가지 CRISPR-기반의 뉴클레아제에 적합한 본 발명에 따른 예시적인 PAM 서열은 서열번호 3-13 및 23으로 표시된다.
일 구현예에서, 하나 이상의 염기 편집 복합체는 2개 이상의 구성성분을 포함하며, 2 이상의 구성성분은 개별 구성성분으로 제공된다. 이러한 방식은 특정 형질전환 또는 형질감염 전략에 적합할 수 있다.
본 발명에 따른 특정 구현예에서, 본 발명에 따른 임의의 복합체의 하나 이상의 구성성분은, 복합체가 세포 안에서 형성되거나 또는 복합체가 형질전환 또는 형질감염 이전에 생체외에서 형성될 수 있도록, 대상 세포에서 동족 결합 파트너와 특이적으로 상호작용하거나 또는 조합할 수 있는 부분 또는 영역을 포함할 수 있다. 결합 쌍들은 도킹 도메인 또는 조합 도메인, 또는 이를 코딩하는 핵산 서열을 통해 조합할 수 있으며, 이는 바이오틴, 앱타머, DNA, RNA 또는 플루오레세인을 포함하는 형광단을 포함하는 단백질 염료, 또는 이의 변이체, 말레이미드 또는 테트라졸륨 (XTT), 하나 이상의 복구 주형 핵산 서열과 상호작용하도록 특이적으로 구성된 가이드 핵산 서열, 스트렙타비딘 또는 이의 변이체, 바람직하게는 모노머성 스트렙타비딘, 아비딘 또는 이의 변이체, 친화성-태그, 바람직하게는 스트렙타비딘-태그, 항체, 단쇄 가변 단편 (scFv), 주어진 항체 또는 scFv에 대해 특이적인 항원, 싱글-도메인 항체 (나노바디), 안티칼린 (anticalin), 아그로박테리움 VirD2 단백질 또는 이의 도메인, 피코나바이러스 VPg, 토포이소머라제 또는 이의 도메인, PhiX174 파지 A 단백질, PhiX A* 단백질, VirE2 단백질 또는 이의 도메인, 또는 디곡시게닌 (digoxigenin) 중 하나 이상으로부터 선택된다. 다른 적합한 결합 쌍들도 당해 기술 분야의 당업자들에게 공지되어 있다. 가장 바람직하게는, 동족 결합 파트너는 높은 친화성 상수 (high affinity constant) 또는 결합 친화성을 가지며, 따라서 본 발명에 따른 하나 이상의 염기 복합체 또는 하나 이상의 부위-특이적인 작동자 복합체의 복합체 형성을 돕기 위해, 생리학적 조건에서 각각에 대해 낮은 해리 상수 (Kd)를 가지며, 즉 Kd 값은 낮은 μM, 또는 바람직하게는 nM 범위, 바람직하게는 그 보다 더 낮다.
본 발명의 모든 측면들에 따른 일 구현예에서, 하나 이상의 염기 편집 복합체의 하나 이상의 구성성분, 및/또는 하나 이상의 부위-특이적인 작동자 복합체의 하나 이상의 구성성분은 하나 이상의 염기 편집 복합체를 세포내 소기관으로의 타겟화하기 위한 하나 이상의 소기관 위치화 신호를 포함한다. 일 구현예에서, 하나 이상의 소기관 위치화 신호는 핵 위치화 신호 (NLS)이다. 추가적인 구현예에서, 하나 이상의 소기관 위치화 신호는 엽록체 수송 펩타이드이다. 다른 추가의 구현예에서, 하나 이상의 소기관 위치화 신호는 미토콘드리아 수송 펩타이드이다. 하나 이상의 위치화 신호(들)가 염기 편집의 하나 이상의 구성성분 또는 부위-특이적인 작동자 복합체와 조합되어 존재할 수 있다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 게놈 타겟 부위이고, 하나 이상의 표현형으로 선별가능한 형질은 내성/허용성 형질 또는 생장 우세 형질이고, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형은 하나 이상의 변형된 식물 세포, 조직 또는 식물, 또는 그 자손에 부가될 화합물 또는 촉발제에 대해 내성/허용성 또는 생장 우세를 부여한다.
본원에서, "생장 우세"는 식물 발생 및 재생의 모든 단계 동안에 임의의 생리학적 또는 대사적으로 유익한 특성을 의미하며, 예를 들어 생물적 및 비생물적 스트레스에 대한 내성에 유익한 특성 또는 예를 들어 가뭄 또는 염분과 같은 스트레스 조건에서의 식물 생장 및 발달에 영향을 미치는 특성을 의미한다.
본 발명에 따른 "화합물" 또는 "촉발제"는 제초제일 수 있으며, 이는 예를 들어 세포 대사 저해제로부터 선택되며, 예를 들어: EPSPS 저해 (글리신, 예, 글리포세이트); ALS/AHAS (분지형 아미노산 생산) 저해 (예를 들어, 이미다졸린, 설포닐우레아); 지질 합성 저해/ACCases (아릴옥시페녹시프로피오네이트 (FOP), 사이클로헥산다이온 (DIM), 페닐피라졸린 (DEN); 글루타민 신테타제의 저해제 (글루포시네이트/포스피노트리신), 증식/세포 분열 저해제, 예를 들어, 식물 세포 증식 파괴물질 (페녹시카르복시산, 예, 2,4-D), 합성 옥신 (벤조산 예, 디캄바), 옥신 수송 저해 (프탈라메이트); 및 광 프로세스 간섭, 예를 들어: 표백물질 (bleacher)/ HPPD 저해제 (피라졸 및 이속사졸); II 광시스템 저해제 (PS II 저해제) (트리아진, 트리아지논, 피리다존, C3: 이옥시닐 및 브로복시닐 및 수많은 기타 물질); 프로토포르피리노겐 옥시다제의 저해제 (PPO/PPX) (예, 다이페닐에테르 및 N-페닐프탈이미드) 등이 있다.
아울러, 본 발명에 따른 "화합물" 또는 "촉발제"는 식물 대사에 영향을 미치는, 식물에 의해 내인성으로 생산되거나 또는 외부적으로 적용되는, 식물 성장인자 또는 임의의 기타 물질일 수 있다.
본원에 기술된 방법에 대한 모든 구현예들에서, 화합물 또는 촉발제는 대상 형질, 본 발명의 모든 측면의 다양한 방법에 따라 타겟화된 방식으로 변형된, 하나 이상의 식물 세포, 조직, 기관, 물질 또는 완전한 식물에 의해 코딩된 표현형으로 선별가능한 형질을 선별할 수 있도록, 외부에서 적용될 수 있다. 표현형으로 선별가능한 형질의 변형 형태에서 특이적인 상호작용 쌍의 제공, 및 후속적인 선별 및 교배 단계 동안의 해당 화합물 또는 촉발제의 제공은, 따라서, 임의의 육종 시도를 향상시킬 수 있다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 표현형으로 선별가능한 대상 형질은 하나 이상의 내인성 유전자이거나 또는 이에 의해 코딩되거나, 또는 하나 이상의 대상 표현형 형질은 하나 이상의 전이유전자이거나 또는 이에 의해 코딩되며, 하나 이상의 내인성 유전자 또는 하나 이상의 전이유전자는 하나 이상의 대상 표현형 형질에 하나 이상의 변형이 결핍된 세포를 저해, 손상 또는 사멸시키는, 식물독소, 바람직하게는 제초제에 대한 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형 형질을 코딩하거나, 또는 하나 이상의 표현형 형질은 세포 분열, 증식 속도, 배발생, 또는 비-변형된 세포, 조직, 기관 또는 식물과 비교해 변형된 세포, 조직, 기관 또는 식물에 이점을 제공하는 기타 표현형으로 선별가능한 특성의 부스터로 이루어진 군으로부터 선택된다.
본 발명의 다양한 측면들에 따른 추가적인 구현예에서, 하나 이상의 제1 식물 게놈 타겟 부위는 제초제 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 하나 이상의 내인성 유전자 또는 전이유전자이며, 제초제 내성/허용성은 글리포세이트 등의 EPSPS-저해제에 대한 내성/허용성, 글루포시네이트 등의 글루타민 합성 저해제에 대한 내성/허용성, 이미다졸린 또는 설포닐우레아 등의 ALS- 또는 AHAS-저해제에 대한 내성/허용성, 아릴옥시페녹시프로피오네이트 (FOP) 등의 ACCase 저해제에 대한 내성/허용성, 피토엔 데세투라제 (phytoene desaturase) 단계에서 카로티노이드 생합성의 저해제, 4-하이드록시페닐-피루베이트-다이옥시게나제 (HPPD)의 저해제 또는 기타 카로티노이드 생합성 타겟의 저해제 등의 카로티노이드 생합성 저해제에 대한 내성/허용성, 셀룰로스 저해제에 대한 내성/허용성, 지질 합성 저해제에 대한 내성/허용성, 장쇄 지방산 저해제에 대한 내성/허용성 지방산 저해제, 미소관 조립 저해제에 대한 내성/허용성, 광화학계 I 전자 전환체에 대한 내성/허용성, 카바메이트, 트리아진 및 트리아지논 등의 광화학계 II 저해제에 대한 내성/허용성, PPO-저해제에 대한 내성/허용성 및 디캄바 (2,4-D, 즉, 2,4-다이클로로페녹시아세트산) 등의 합성 옥신에 대한 내성/허용성으로 이루어진 군으로부터 선택된다.
본 발명의 다양한 측면들에 따른 추가적인 구현예에서, 하나 이상의 내인성 유전자 또는 하나 이상의 전이유전자는, 병원체 내성/허용성을 포함하는 생물학적 스트레스에 대한 내성/허용성; 저온 내성/허용성, 가뭄 스트레스 내성/허용성, 삼투성 내성/허용성, 열 스트레스 내성/허용성, 한랭 스트레스 내성/허용성, 산화 스트레스 내성/허용성, 중금속 스트레스 내성/허용성, 염 스트레스 또는 침수 (waterlogging) 내성/허용성, 도복 내성/허용성, 탈립 내성/허용성 등의 비생물학적 스트레스에 대한 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형 형질을 코딩하며, 병원체는 바이러스, 박테리아, 진균 또는 동물 병원체로부터 선택되거나, 또는 하나 이상의 대상 표현형 형질은 수율 증가, 개화기 변형, 종자 색 변형, 내포자 조성 변형, 영양 함량 변형 또는 대상 경로의 대사적 조작 등의, 추가적인 농업 대상 형질 변형으로 이루어진 군으로부터 선택된다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 표현형으로 선별가능한 형질은 식물독성 내성/허용성 형질, 바람직하게는 제초제 내성/허용성 형질이며, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형은 식물독성 화합물, 바람직하게는 제초제에 대해 내성/허용성을 부여하며, 이 화합물은 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물, 또는 그 자손에 부가될 외인성 화합물이다.
대상 식물 세포의 게놈에 의해 코딩된 임의의 추가적인 표현형으로 선별가능한 형질은, 표현형으로 선별가능한 대상 형질을 코딩하는 하나 이상의 유전자가 공지되어 있고 대응되는 상보적인 화합물 또는 촉발제가 타겟화된 변형을 스크리닝하기 위해 이용가능하거나 또는 스크리닝하도록 설계할 수 있다면, 본 발명의 다양한 측면들에 따른 하나 이상의 제1 타겟화된 변형의 타겟이 될 수 있다. 가시적인 표현형의 경우, 스크리닝 목적을 위해 화합물 또는 촉발제가 반드시 필요한 것은 아니며, 대신 가시적으로 스크리닝가능한 형질의 관찰에 기초한 적절한 판독 및 결정 전략이 준비되어 있어야 한다.
다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 제초제 또는 식물독성 화합물에 대해 내성 또는 허용성을 부여하는 유전자이며, 제1 식물 게놈 타겟 부위는 하나 이상의 대응되는 아미노산 변환을 발생시키는 하나 이상의 핵산 변환을 포함하며, 하나 이상의 핵산 변환은 하나 이상의 염기 편집기에 의해 이루어진다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 ALS이다. 임의의 ALS 서열이 본 발명의 목적에 적합하다. 예시적인 ALS 서열은 서열번호 25로 표시된다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 PPO이다. 임의의 PPO 서열이 본 발명의 목적에 적합하다. 예시적인 PPO 서열은 서열번호 26으로 표시된다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 EPSPS이다. 임의의 EPSPS 서열이 본 발명의 목적에 적합하다. 예시적인 EPSPS 서열은 서열번호 27로 표시된다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 EPSPS, ALS 또는 PPO, 또는 이의 임의의 대립유전자 또는 식물 변이체이며, EPSPS, ALS 또는 PPO는 하나 이상의 대응되는 아미노산 변환을 만드는 하나 이상의 핵산 변환을 포함하며, 하나 이상의 핵산 변환은 하나 이상의 염기 편집기에 의해 수행된다.
본 발명에 따른 표현형으로 선별가능한 형질을 코딩하는 이러한 타겟 하나는 5-에놀피루빌쉬키메이트-3-포스페이트 신타제 (EPSPS) 유전자이다. 효소의 글리포세이트 민감성을 낮추기 위한 여러가지 단일 및 이중 아미노산 치환들이 밝혀져 있다 (Sammons, R. D. and Gaines, T. A. (2014), Glyphosate resistance: state of knowledge. Pest. Manag. Sci., 70: 1367-1377.)
다른 타겟은, 다양한 단일 아미노산 돌연변이들이 트리아졸로피리미딘, 설포닐우레아, 피리미디닐티오벤조네이트, 이미다졸리논 및 설포닐아미노카르보닐트리아졸리논 클래스 유래의 하나 이상의 제초제에 대한 내성과 연관되어 있는, 아세토락테이트 신타제 (ALS) 유전자이다. 본 발명의 목적에 적합한 잔기 치환으로는 A122, P197, A205, D376, W574 및 S653 등이 있다.
또 다른 선별가능한 변형은 지 메이스 (Zea mays) 및 아라비돕시스 탈리아나 (Arabidopsis thaliana)의 프로토포르피리노겐 옥시다제 (PPO) 유전자에 존재할 것이다. 여기서, 215번 위치의 시스테인의, 페닐알라닌 (A215F), 루신 (A215L) 또는 라이신 (A215K)으로의 변형뿐 아니라 220번 알라닌의 발린 (A220V), 트레오닌 (A220T) 또는 루신 (A220L)으로의 변형, 그리고 221번 글리신의 세린 (A221S) 또는 루신 (A221L)으로의 변형은, 다이페닐에테르, N-페닐프탈이미드, 옥사다이아졸, 옥사졸리딘다이온, 페닐피라졸, 피리미디니다이온, 티아다이아졸, 트리아졸리논 및 기타 등의 PPO 제초제에 대한 내성과 연관되어 있다 (Li, Xianggan et al. "Development of Protoporphyrinogen Oxidase as an Efficient Selection Marker for Agrobacterium Tumefaciens-Mediated Transformation of Maize. "Plant Physiology 133.2 (2003): 736-747. PMC. Web. 15 Mar. 2017). 전술한 잔기 치환 외에도, N. tabacum 또는 이의 상동체에서 178번 글리신의 단일 아미노산 결손은 PPO 저해제 결합을 방해하여, 전술한 저해제들에 대해 내성을 제공하며 (Patzoldt, W. L. et al. (2006). "A codon deletion confers resistance to herbicides inhibiting protoporphyrinogen oxidase" PNAS 103(33):12329-12334), 본 발명의 다양한 측면에 따라 이용할 수 있다.
아울러, 본 발명에 제시된 기법은 정확한 아미노산 변형 및 결손뿐 아니라 선별가능한 표현형을 유발하는 유전자 서열을 변형 또는 방해하기 위한 정지 코돈의 도입도 가능하게 한다. 아미노산을 코딩하는 코돈 61개 중, 아미노산 5종은 하나 이상의 시토신/시티딘을 양쪽 가닥에서 티민/티미딘으로 변환함으로써 정지 코돈으로 변환될 수 있다.
이러한 변형을 만드는 툴은 CRISPR 뉴클레아제 자체이다. 단일 또는 다중 염기 쌍 결손을 제공하는 것으로 입증된 CRISPR 뉴클레아제로는 Cas9, Cpf1, CasX 및 CasY가 있다. 이들 뉴클레아제는 이 시점에 가장 편리한 옵션이지만, 향후 부위-특이적인 뉴클레아제 개발을 본원에 기술된 절차에 맞게 쉽게 적용시킬 수 있을 것이다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 ALS이며, 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 A122를 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 P197을 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 A205를 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 D376을 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 R377을 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 W574를 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 S653을 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 G654를 코딩하는 서열에서 발생하거나, 또는 전술한 변형들의 임의 조합을 포함한다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 PPO이고, 타겟화된 변형은 서열번호 26에 따른 PPO 참조 서열과 비교해 C215, A220, G221, N425 또는 Y426을 코딩하는 서열에서 또는 이들 돌연변이들의 임의 조합으로 발생한다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 선별 목적의 경우 아마란투스 투베르쿨라투스 (Amaranthus tuberculatus)의 PPX2L 유전자 산물이다. 본 발명의 다양한 측면들에 따른 일 구현예에서, 타겟화된 염기 변형, 타겟화된 코돈 결손 또는 타겟화된 프래임쉬프트 또는 결손 변형을 포함하는 제1 타겟화된 변형은, 서열번호 28에 따른 아마란투스 투베르쿨라투스 (Amaranthus tuberculatus)의 PPX2L 유전자 산물의 G210 잔기와 동일한 위치에서 이루어진다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 EPSPS이고, 하나 이상의 타겟화된 변형은 서열번호 27에 따른 EPSPS 참조 서열과 비교해 G101, T102, P106, G144 또는 A192를 코딩하는 서열에서 발생하거나, 또는 전술한 돌연변이의 임의 조합이다. 바람직한 특정 구현예에서, 타겟화된 변형은 서열번호 27에 따른 EPSPS 참조 서열과 비교해 G101 및 G144를 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 27에 따른 EPSPS 참조 서열과 비교해 G101 및 A192를 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 27에 따른 EPSPS 참조 서열과 비교해 T102 및 P106을 코딩하는 서열에서 발생한다.
당해 기술 분야의 당업자는, 본원의 내용을 기반으로, 본 발명에 따른 하나 이상의 표현형으로 선별가능한 형질을 구축하기 위해 추가적으로 적합한 식물독성 내성/허용성 형질 및 대응되는 돌연변이를 규정할 수 있다.
본 발명의 다양한 측면들에 따른 특정 구현예에서, 하나 이상의 표현형으로 선별가능한 형질은 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 동정 또는 단리하는데 유용한 가시적인 표현형이다. "가시적인" 표현형은 눈을 통해 육안으로 또는 현미경을 통해 관찰하는 수단에 의해 검출하여, 분자 생물학적 수단에 의한 스크리닝이 필수적이지 않은, 임의의 표현형이다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 표현형으로 선별가능한 형질은 광택 표현형, 골든 표현형, 생장 우세 표현형 또는 색소 표현형이다. 몇가지 다른 가시적인 표현형들이 당해 기술 분야의 당업자들에게 잘 알려져 있다. 이러한 가시적인 표현형은 이의 유전자 백그라운드로 인해 대상 식물 또는 식물 세포에 상당히 의존적일 것이다.
본 발명에 따른 제2 측면에서, (a) 하나 이상의 제1 타겟화된 코돈 결손 변형을, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에, 뉴클레아제, 재조합효소 또는 DNA 변형 물질을 포함하는 하나 이상의 제1 부위-특이적인 작동자를 이용해 도입하는 단계로서, 하나 이상의 타겟화된 코돈 결손 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계; (b) 하나 이상의 제2 타겟화된 변형을 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 제2 타겟화된 변형이 하나 이상의 제2 부위-특이적인 작동자를 이용해 도입되어 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로 하나 이상의 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포 또는 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및 (c) (i) 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 코돈 결손 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로, 추가적으로 (ii) 제2 식물 게놈 타겟 부위에서 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써, 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계; 선택적으로 (d) 하나 이상의 제1 타겟화된 변형 및 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 포함하는, 전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물을 단리하는 방법을 제공한다.
본 발명의 다른 측면에서, (a) 하나 이상의 제1 타겟화된 프래임쉬프트 또는 결손 변형을, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 하나 이상의 제1 부위-특이적인 작동자를 사용해 도입하는 단계로서, 하나 이상의 타겟화된 프래임쉬프트 또는 결손 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계; (b) 하나 이상의 제2 타겟화된 변형을 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 제2 타겟화된 변형이 뉴클레아제, 재조합효소 또는 DNA 변형 시약을 포함하는 하나 이상의 제2 부위-특이적인 작동자를 이용해 도입되어, 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 구축되고, 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로 하나 이상의 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포, 또는 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 완전한 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및 (c) (i) 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 프래임쉬프트 또는 결손 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로, 추가적으로 (ii) 제2 식물 게놈 타겟 부위에서 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써, 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계; 선택적으로, (d) 하나 이상의 제1 타겟화된 변형 및 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 포함하는, 전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물을 단리하는 방법을 제공한다.
전술한 바와 같이, 본 발명에 따른 방법은, 2가지 서로 다른 분자 복합체, 즉 전이유전자성 마커의 삽입없이, 선별가능한 표현형을 구축하는 하나 이상의 제1 타겟화된 변형을 도입하도록 구성된 복합체 하나와, 하나 이상의 제2 타겟화된 변형을 도입하도록 구성된 다른 복합체를 조합하는 새로운 방법을 제공하며, 이때 제1 변형은 스크리닝 목적으로 이용되고, 제2 변형은 도입할 게놈 편집이다. 따라서, 본 발명의 방법은 서로 다른 게놈 타겟 부위에서 게놈 편집 전략을 상승적으로 조합하여, 서로 다른 타겟화된 변형을 달성하며, 따라서 궁극적으로 대상 유전자형을 가진 식물을 확립하기 위한 효율적인 육종 공정을 확립한다.
특정 구현예에서, 본 발명의 방법에서 단계 (b)는 복구 주형(RT)을 도입하여, 하나 이상의 제1 및/또는 제2 식물 게놈 타겟 부위에서 타겟화된 서열 변환 또는 치환을 만드는 단계를 더 포함한다. 뉴클레아제 또는 닉카제로 인해 발생하는 절단이 복구 기전으로서 에러가 발생하기 쉬운 내인성 NHEJ 경로에 의존하기 보다는 상동적인 복구를 보조하도록 대상 RT를 제공함으로써 미리 정해진 방식으로 복구할 수 있으므로, 이 RT는, 별도로 또는 본 발명에 따른 하나 이상의 복합체의 일부로서 제공되는 적합한 RT이 제공되는 한, 게놈 편집 방식에 또 다른 수준의 정확도가 부가된다. 일 구현예에서, CRISPR-기반의 뉴클레아제는 gRNA와 상호작용하는 부위-특이적인 작동자로 사용되고, 이때 gRNA는 RT에 공유 결합될 수 있거나, 또는 CRISPR-기반의 뉴클레아제 및/또는 gRNA는 RT와 비-공유적으로 상호작용할 수 있다. 다른 구현예에서, RT는, 대상 RT를 코딩하는 구조체에 부가되는 등의, 별도로 제공되며, RT는 하나 이상의 대상 게놈 타겟 부위에 어닐링하는 RT 내 상동성 팔에 의해 매개되는 상보적인 염기 쌍 형성을 이용해 부위-특이적인 작동자 복합체와 조합할 것이다.
일 구현예에서, 융합 단백질 또는 비-공유적으로 조합된 활성 Cpf1 및 상호작용 도메인으로서 비활성형 dCas9는 부위-특이적인 작동자로서 제공될 수 있다. Cas9에 대한 gRNA는 복구 주형 또는 이의 연장부를 타겟팅하여, Cpf1-dCas9-RT 복합체를 형성할 수 있다. crRNA (Cpf1)는 HDR를 개시하기 위해 이중 가닥 절단이 결정된 게놈 유전자 좌를 타겟팅한다. 마찬가지로, 고 활성의 징크 핑거 단백질, megaTAL 또는 비활성 메가뉴클레아제도 사용될 수 있다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 본원의 임의 한가지 방법에 의해 수득가능한 식물 세포, 조직, 기관, 물질 또는 완전한 식물, 또는 그 자손를 제공한다.
본원에 제공된 방법이 농업적으로 유익한 형질을 가진 새로운 식물을 제공하는 것을 돕도록 특이적으로 설계되어 있어 전이유전자성 마커 서열은 포함하지 않으므로, 본원의 방법은 빠르고 믿을 수 있는 방식으로 여러가지 다양한 식물 유전자형을 구축하는데 적합하다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 변형할 하나 이상의 식물 세포는 바람직하게는 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays) 등의 지 spp. (Zea spp .), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris) 등의 베타 spp., 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 넥수오사 (Cardamine nexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp . sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카야누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 전술한 식물들 중 하나에 속하는 임의 품종 또는 아종으로 이루어진 군으로부터 선택되는 식물로부터 유래된다.
유전자 변형된 전이유전자가 없는 식물의 제조 방법:
다른 측면에서, 본 발명은 하기 단계들을 포함하는 게놈 편집에 의해 유전자 변형된 식물을 구축하는 방법을 제공한다:
a) 유전자 변형할 식물의 세포 또는 조직을 제공하는 단계;
b) 제1 게놈 편집 시스템 및 제2 게놈 편집 시스템을 제공하는 단계로서, 제1 게놈 편집 시스템이 식물 선별가능한 마커 유전자를 타겟하여 변형시킬 수 있고, 제2 게놈 편집 시스템이 식물에서 대상 유전자를 타겟하여 변형시킬 수 있는, 단계;
c) 세포 또는 조직을 제1 및 제2 게놈 편집 시스템으로 공동-형질전환하는 단계;
d) 형질전환된 세포 또는 조직으로부터, 바람직하게는 선택압없이 식물을 재생하는 단계 ;
e) 단계 d)에서 재생한 식물에서 선별가능한 마커 유전자가 변형된 식물을 선별하는 단계; 및
f) 단계 e)에서 선별된 식물로부터 타겟 유전자가 변형된 식물을 동정하는 단계.
본 발명의 식물 또는 조직은 원형질체, 캘러스, 외식편, 미성숙 배 등의 온전한 식물로 재생될 수 있는 모든 세포 또는 조직을 포함한다.
본원에서, "유전자 변형 (genetical modification)"은 유전자의 서열 변형 및/또는 유전자의 발현 변형을 포함한다.
본원에서, 용어 "대상 유전자"는 구조 유전자 및 비-구조 유전자 등의 식물에서 변형시킬 임의의 뉴클레오티드 서열을 의미한다. 바람직하게는, 대상 식물은 식물의 형질, 바람직하게는 농업 형질과 연관되어 있다.
본원에서, "선별가능한 마커 유전자"는, 적절하게 변형된 후, 선별할 선별가능한 형질을 식물에 부여하는 식물의 내인성 유전자를 의미한다. 바람직하게는, 적절하게 변형되었을 때, 선별가능한 마커 유전자는 식물의 다른 형질은 실질적으로 변형시키지 않는다.
예를 들어, 선별가능한 마커 유전자는, 적절하게 변형되었을 때 식물에 제초제 내성을 부여하는 식물 내인성 제초제 내성 유전자일 수 있다. 식물 내인성 제초제 내성 유전자로는 비-제한적으로 PsbA, ALS, EPSPS, ACCase, PPO, HPPD, PDS, GS, DOXPS 및 P450 등이 있다. 제초제 내성을 부여할 수 있는 ALS 돌연변이 부위로는, 비-제한적으로, A122, P197, A205 및 S653 (아미노산의 번호는 아라비돕시스 탈리아나 ALS의 아미노산 서열을 참조함)을 포함한다. 제초제 내성을 부여할 수 있는 EPSPS 돌연변이 부위로는, 비-제한적으로, T102, P106 (아미노산의 번호는 아라비돕시스 탈리아나 EPSPS의 아미노산 서열을 참조함)을 포함한다. 제초제 내성을 부여할 수 있는 ACCase 돌연변이 부위로는, 비-제한적으로, I1781, W2027, I2041, D2078 및 G2096 (아미노산의 번호는 알로페쿠러스 미오수로이데스 (Alopecurus myosuroides) 엽록체 ACCase의 아미노산 서열을 참조함)를 포함한다. 제초제 내성을 부여할 수 있는 HPPD 돌연변이 부위로는, 비-제한적으로, P277, L365, G417 및 G419 (아미노산의 번호는 벼 HPPD 효소의 아미노산 서열을 참조함)를 포함한다.
본 발명의 일부 구현예에서, 밀에 제초제 내성을 부여할 수 있는 ALS 돌연변이 부위는 TaALS P173을 포함한다. 일부 구현예에서, 옥수수에 제초제 내성을 부여할 수 있는 ALS 돌연변이 부위는 ZmALS P165를 포함한다. 일부 구현예에서, 벼에 제초제 내성을 부여할 수 있는 ALS 돌연변이 부위는 OsALS P171을 포함한다.
다른 예로, 선별가능한 마커 유전자는, 적절하게 변형되었을 때, 식물이 비-제한적인 예로, LIG, PDS, zb7 및 GL2 등의 엽설 (ligule), 잎의 색, 잎 광택을 조절하는 유전자와 같은, 가시적으로-관찰가능한 형질 변화를 발생시키도록 유도할 수 있는, 유전자일 수 있다.
전통적인 식물 변형 방법 (형질전환 방법)에는 효율을 높이기 위해 식물 재생시 특정한 선택압이 적용되어야 한다 (예, 사용한 형질전환 벡터에 따라 여러가지 항생제를 사용하여 스크리닝함). 그러나, 이는 외래 유전자, 특히 항생제 내성 유전자가 식물 게놈에 삽입되어, 잠재적인 안전성 문제가 될 수 있다.
식물 변형에 게놈 편집 기술을 이용함으로써, 게놈 편집 시스템은 식물 게놈내 삽입되지 않고도 타겟 유전자의 변형을 달성할 수 있다. 따라서, 본 발명의 방법에서, 단계 d)의 재생은 바람직하게는 선택압없이 수행된다. 이는 외래 유전자의 삽입을 방지하며, 유전자 변형된 (게놈 편집된) 형질전환 식물이 구축된다. 그러나, 선택압없이 식물을 재생하면 스크리닝 효율은 크게 떨어질 것이다.
이 문제는 대상 유전자를 타겟팅하는 게놈 편집 시스템과 내인성 선별가능한 마커 유전자를 타겟팅하는 게놈 편집 시스템을 공동-형질전환함으로써, 본 발명에서 해소된다.
임의 이론으로 결부시키고자 하는 것은 아니지만, 본 발명의 방법에서, 대상 유전자를 타겟팅하는 게놈 편집 시스템 및 내인성 선별가능한 마커 유전자를 타겟팅하는 게놈 편집 시스템은 식물 (예, 식물 세포 또는 조직) 내에 공동-형질전환되면, 대상 유전자와 내인성 선별가능한 마커 유전자의 편집이 동시에 발생할 경향을 보일 것이다. 따라서, 내인성 선별가능한 마커 유전자에 기반하여 선택된 식물은, 대상 유전자 역시 변형될 가능성이 높을 것이다. 내인성 선별가능한 마커 유전자 편집에 대한 1차 스크리닝은 대상 유전자 편집에 대한 스크리닝 효율을 크게 향상시킬 것이다. 내인성 선별가능한 마커 유전자만 사용되기 때문에, 전이유전자 문제는 피할 수 있다. 본 발명에서, 내인성 선별가능한 마커 유전자는 바람직하게는 변형 후 대상 형질에는 영향을 미치지 않으며, 예를 들어, 수율을 감소시키지 않는다. 더 바람직하게는, 내인성 선별가능한 마커 유전자의 변형은 식물에 부가적인 대상 형질, 예를 들어 제초제 내성을 부여한다. 즉, 본 발명에서 식물 선별에 이용가능한 형질은 또한 제초제 내성과 같은 농업적으로 유용한 형질인 것이 바람직하다.
단계 e)에서 선별을 수행하는 방법은 선별가능한 마커 유전자의 특성에 따라 결정된다. 예를 들어, 선별가능한 마커 유전자가 변형되어 식물에 제초제 내성이 부여된다면, 재생된 식물은 야생형 선별가능한 마커 유전자를 가진 식물은 생존할 수 없거나 생장이 불량한 적절한 농도 하에 둘 수 있다. 그런 후, 이러한 제초제 농도에서 충분히 생존 또는 생장하는 식물을 선별한다.
단계 f)에서 동정은 예를 들어 PCR/RE, 서열분석에 의해 수행할 수 있다. 당해 기술 분야의 당업자라면 유전자의 돌연변이 유무를 동정하는 방법을 충분히 알 것이다.
본 발명의 식물 (세포 또는 조직)을 형질전환하는 적합한 방법으로는, 비-제한적으로, 입자 총법, PEG-매개 원형질체 형질전환 및 아그로박테리움-매개 형질전환 등이 있다.
본 발명은, 식물 게놈의 정확한 편집을 수행할 수 있는 한, 특정 게놈 편집 시스템으로 특별히 제한되는 것은 아니다. 예를 들어, 본 발명와 함께 사용하기 적합한 게놈 편집 시스템으로는, 비-제한적으로, PBE (precise base editor) 시스템, CRISPR-Cas9 시스템, CRISPR-Cpfl 시스템, CRISPRi 시스템, 징크 핑거 뉴클레아제 시스템 및 TALEN 시스템 등이 있다. 대상 유전자 및 내인성 선별가능한 마커 유전자를 타겟팅하는 적절한 게놈 편집 시스템의 선정 또는 설계는 당해 기술 분야의 당업자의 능력에 속한다.
CRISPR 시스템은 외부 유전자 침입으로부터 보호하기 위해 진화 중에 박테리아에서 발생하였다. 이는 변형되어 진핵생물의 게놈 편집에 널리 사용되고 있다.
CRISPR-Cas9 시스템은 Cas9 뉴클레아제-기반의 게놈 CRISPR 편집 시스템을 의미한다. "Cas9 뉴클레아제" 및 "Cas9"은 본원에서 상호 호환적으로 사용되며, Cas 단백질 또는 이의 단편 (예, Cas9의 활성형의 DNA 절단 도메인 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 단백질)을 포함하는, RNA 안내된 뉴클레아제를 지칭한다. Cas9은 가이드 RNA의 안내 하에 DNA 타겟 서열을 타겟팅 및 절단하여 DNA 이중 가닥 절단 (DSB)을 형성할 수 있는, 원핵생물 면역 시스템 CRISPR/Cas의 구성 성분이다. 본 발명에 사용하기 적합한 CRISPR-Cas9 시스템은 비-제한적으로 Shan, Q. et al. Targeted genome modification of crop plants using a CRISPR-Cas system. Nat. Biotechnol. 31, 686-688 (2013)에 기술된 것을 포함한다.
"가이드 RNA" 및 "gRNA"는 본원에서 상호 호환적으로 사용될 수 있으며, 전형적으로 일부 상보적인 부분을 통해 복합체를 형성하는 crRNA와 tracrRNA 분자로 구성되며, crRNA는 혼성화하기 위해 타겟 서열에 충분히 상보적이며 CRISPR 복합체 (Cas9+crRNA+tracrRNA)가 타겟 서열에 특이적으로 결합하게 지시하는, 서열을 포함한다. 그러나, 당해 기술 분야에서는, crRNA 및 tracrRNA 특징 둘다를 포함하는 싱글 가이드 RNA (sgRNA)가 설계될 수 있는 것으로 공지되어 있다.
본 발명의 CRISPR-Cas9 시스템은 하기 중 하나를 포함할 수 있다:
i) Cas9 단백질, 및 가이드 RNA;
ii) Cas9 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA;
iii) Cas9 단백질, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체;
iv) Cas9 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체; 또는
v) Cas9 단백질을 코딩하는 뉴클레오티드 서열과 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체.
CRISPR-Cpf1 시스템은 Cpf1 뉴클레아제를 기반으로 하는 CRISPR 게놈 편집 시스템이다. Cpf1와 Cas9의 차이는, Cpf1 단백질의 분자량이 작고, crRNA만 가이드 RNA로서 필요하며, PAM 서열 역시 다르다는 것이다. 본 발명에 사용하기 적합한 CRISPR-Cpf1 시스템으로는 Tang et al., 2017에 언급된 시스템 등이 있으나, 이로 한정되는 것은 아니다.
본 발명의 CRISPR-Cpfl 시스템은 하기 중 하나를 포함할 수 있다:
i) Cpf1 단백질, 및 가이드 RNA (crRNA);
ii) Cpf1 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA;
iii) Cpf1 단백질, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체;
iv) Cpf1 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체; 또는
v) Cpf1 단백질을 코딩하는 뉴클레오티드 서열과 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체.
CRISPR interference (CRISPRi)는 뉴클레아제-불활성화된 Cas9 단백질을 이용하는 CRISPR-Cas9 시스템으로부터 파생된 유전자 침묵화 시스템이다. 이 시스템은 타겟 유전자의 서열을 바꾸진 않지만, 이는 본원에서 게놈 편집 시스템으로 정의된다. 본 발명에 함께 사용하기 적합한 CRISPRi 시스템으로는 Seth and Harish, 2016에 언급된 시스템 등이 있으나, 이로 한정되는 것은 아니다.
본 발명의 CRISPRi 시스템은 하기 중 하나 이상을 포함할 수 있다:
i) 뉴클레아제-불활성화된 Cas9 단백질, 및 가이드 RNA;
ii) 뉴클레아제-불활성화된 Cas9 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA;
iii) 뉴클레아제-불활성화된 Cas9 단백질, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체;
iv) 뉴클레아제-불활성화된 Cas9 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체; 또는
v) 뉴클레아제-불활성화된 Cas9 단백질을 코딩하는 뉴클레오티드 서열과 가이드 RNA을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체.
정확한 염기 편집기 시스템 (precise base editor system)은 최근 CRISPR-Cas9에 기반하여 개발되었으며, Cas9 단백질과 시티딘 데아미나제로 된 뉴클레아제-불활성화된 융합 단백질을 이용해 게놈의 정확한 단일-염기 편집을 수행할 수 있는 시스템이다. 뉴클레아제-불활성화된 Cas9 (DNA 절단 도메인의 HNH 서브도메인 및/또는 RuvC 서브도메인 내 돌연변이가 원인임)는 gRNA-특이적인 DNA-결합력을 유지하고 있으며, 시티딘 데아미나제는 DNA의 시티딘(C) 탈아민화를 촉매하여 우라실 (U)을 만들 수 있다. 뉴클레아제-불활성화된 Cas9은 시티딘 데아미나제와 융합된다. 가이드 RNA의 안내 하에, 이 융합 단백질을 식물 게놈 내 타겟 서열을 타겟팅할 수 있다. 이 Cas9은 뉴클레아제 활성이 없어, DNA 이중 가닥은 절단되지 않는다. 융합 단백질에서 데아미나제 도메인은 Cas9-gRNA-DNA 복합체의 형성시 만들어진 단일 가닥 DNA의 시티딘을 U로 변환하며, C에서 T로의 치환은 염기 미스매치 복구에 의해 달성된다. 본 발명에서 사용하기 적합한 정확한 염기 편집기 시스템으로는 Zong et al., 2017에 기술된 시스템 등이 있으나, 이로 제한되는 것은 아니다.
본 발명의 정확한 염기 편집기 시스템은 하기 중 하나를 포함할 수 있다:
i) 뉴클레아제-불활성화된 Cas9와 시티딘 데아미나제로 된 융합 단백질, 및 가이드 RNA;
ii) 뉴클레아제-불활성화된 Cas9 단백질과 시티딘 데아미나제로 된 융합 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA;
iii) 뉴클레아제-불활성화된 Cas9 단백질과 시티딘 데아미나제로 된 융합 단백질, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체;
iv) 뉴클레아제-불활성화된 Cas9 단백질과 시티딘 데아미나제로 된 융합 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체; 또는
v) 뉴클레아제-불활성화된 Cas9 단백질과 시티딘 데아미나제로 된 융합 단백질을 코딩하는 뉴클레오티드 서열과 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체.
일부 구현예에서, 뉴클레아제-불활성화된 Cas9 단백질은 야생형 Cas9 (S. pyogenes SpCas9)와 비교해 아미노산 치환 D10A 및/또는 H840A를 포함한다. 시티딘 데아미나제의 예로는, 비-제한적으로, APOBEC1 데아미나제, 활성화-유도된 시티딘 데아미나제 (AID), APOBEC3G 또는 CDA1(PmCDA1) 등이 있다.
"징크 핑거 뉴클레아제 (ZFN)"는 징크 핑거 DNA 결합 도메인을 DNA 절단 도메인과 융합시켜 제조된 인공적인 제한 효소이다. 하나의 ZFN의 징크 핑거 DNA 결합 도메인은 전형적으로 징크 핑거 리피트를 3-6개 포함하며, 각각의 징크 핑거 리피트는 예를 들어 3 bp를 인지한다. 본 발명에 사용하기 적합한 ZFN 시스템은 예를 들어 Shukla et al., 2009 및 Townsend et al., 2009로부터 입수할 수 있다.
"TALEN (Transactivator-like effector nuclease)"은 일반적으로 TALE (transcriptional activator-like effector)의 DNA 결합 도메인과 DNA 절단 도메인의 융합에 의해 제조된, 특정 DNA 서열을 절단하도록 조작될 수 있는, 제한 효소이다. TALE는 거의 임의의 적절한 DNA 서열에 결합하도록 조작될 수 있다. 본 발명에 사용하기 적합한 TALEN 시스템은 예를 들어 Li et al., 2012로부터 입수할 수 있다.
당해 기술 분야의 당업자라면, 서로 다른 게놈 편집 시스템의 각각의 특징과 구현하기 원하는 구체적인 타입의 게놈 편집에 따라 본 발명의 방법에서 제1 게놈 편집 시스템 및 제2 게놈 편집 시스템의 조합을 적절하게 결정할 수 있으며, 예를 들어, 서로 간의 간섭, 예를 들어 동일한 gRNA를 공유할 수 있는 서로 다른 시스템 간의 간섭을 피하는데 적합한 조합을 선택할 수 있다.
예를 들어, 내인성 선별가능한 마커 유전자가 선별가능한 형질을 구축하기 위한 정확한 돌연변이용으로 단일 염기 편집 시스템이 필요하다면, CRISPR-Cas9 시스템은 통상적으로 2가지 시스템이 동일한 gRNA를 공유할 수 있기 때문에, CRISPR-Cas9 시스템은 대상 유전자의 타겟팅에는 사용되지 않으며, 따라서, 대상 유전자의 넉아웃을 위한 Cas9은 내인성 선별가능한 마커 유전자를 넉아웃시킬 수 있으며, 그 역도 가능하다.
본 발명의 방법에 대한 일부 바람직한 구현예에서, 제1 및 제2 게놈 편집 시스템은 정확한 염기 편집기 시스템이다.
본 발명의 일부 구현예에서, 제1 및 제2 게놈 편집 시스템의 구성성분들은 동일한 발현 구조체 또는 서로 다른 발현 구조체에 의해 발현될 수 있으며, 이는 당해 기술 분야의 당업자에 의해 편리하게 선택될 수 있다. 예를 들어, 대상 유전자 및 선별가능한 마커 유전자에 대한 가이드 RNA들은 동일한 발현 구조체를 이용해 전사될 수 있다. 바람직하게는, 제1 및 제2 게놈 편집 시스템의 구성성분들은 동일한 발현 구조에 의해 발현된다.
본 발명의 방법에 대한 일부 구현예에서, 제1 및 제2 게놈 편집 시스템은 둘다 정확한 염기 편집기 시스템이고, 뉴클레아제-불활성화된 Cas9 단백질과 시티딘 데아미나제로 된 융합 단백질 및 대상 유전자 및 선별가능한 마커 유전자에 대한 가이드 RNA들은 동일 발현 구조체에 의해 발현된다.
본 발명의 방법에 대한 일부 구현예에서, 식물은 외떡잎 또는 쌍떡잎이다. 예를 들어, 식물은 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays) 등의 지 spp. (Zea spp .), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris) 등의 베타 spp., 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 넥수오사 (Cardamine nexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp . sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카야누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 전술한 식물들 중 하나에 속하는 임의 품종 또는 아종으로 이루어진 군으로부터 선택되는 식물로부터 유래된다. 일부 구현예에서, 식물은 농작물이다.
본 발명의 일부 구현예에서, 본 방법은 유전자 조작된 전이유전자가 없는 식물의 자손을 수득하는 단계를 더 포함한다.
다른 측면에서, 본 발명은 또한 본 발명의 상기한 방법에 의해 수득되는 유전자 변형된 식물 또는 그 자손 또는 그 일부를 제공한다.
다른 측면에서, 본 발명은 또한 본 발명의 방법에 의해 수득된 제1 유전자 변형 식물을 유전자 변형을 포함하지 않는 제2 식물과 교배하여, 유전자 변형을 제2 식물에 도입하는 것을 포함하는 식물 육종 방법을 제공한다.
식물에서 변형시킬 대상 유전자 및 내인성 선별가능한 마커 유전자를 동시에 타겟팅함으로써, 유전자 변형된 전이유전자가 없는 식물의 스크리닝 효율을 크게 향상시킬 수 있다. 본 발명의 방법에 의해, 전이유전자가 없는 돌연변이의 스크리닝 효율을 돌연변이율이 1% 미만인 대상 유전자의 경우 약 10-100배까지 향상시킬 수 있다.
전달 방법:
식물에 유전 물질을 도입하는데 적합한 다양한 전달 기법들이, 예를 들어, 원형질체의 폴리에틸렌 글리콜 (PEG) 처리 (Potrykus et al. 1985), 전기천공 유사 공정 (D' Halluin et al., 1992), 미세주입법 (Neuhaus et al., 1987), 탄화규소 섬유 위스커 기법 (Kaeppler et al., 1992), 바이러스 벡터 매개 방식 (Gelvin, Nature Biotechnology 23, "Viral-mediated plant transformation gets a boost", 684-685 (2005)) 및 입자 총법 (예, Sood et al., 2011, Biologia Plantarum, 55, 1-15)을 포함하는 직접 전달 기법의 선택에 의해, 당해 기술 분야의 당업자들에게 공지되어 있다.
그럼에도 불구하고, 아그로박테리움 형질전환 또는 바이러스 벡터 매개 식물 형질전환과 같은 생물학적 방식, 및 입자 충격 또는 미세주입법과 물리적 전달 방법에 기반한 방법에 기초한 형질전전환 방법이 대상 식물 세포 또는 조직에 유전 물질을 도입하기 위한 유망한 기법으로서 부상하였다. Helenius et al. ("Gene delivery into intact plants using the HeliosTM Gene Gun", Plant Molecular Biology Reporter, 2000, 18 (3):287-288)는 식물 세포에 물질을 도입하기 위한 물리적 방법으로서 입자 총법을 기술하고 있다. 현재, 적어도 염기 편집기 및 하나 이상의 부위-특이적인 작동자뿐 아니라 적어도 염기 편집기 및 하나 이상의 부위-특이적인 작동자를 포함하는 대응되는 복합체를 도입하기 위해 적용할 수 있는, 식물 생물공학 분야의 당업자들에게 공지된 생물학적 및 물리적 수단을 포함하는, 대상 식물 세포에 유전자 구조체 형태로 유전 물질을 도입하기 위한 다양한 식물 형질전환 방법들이 존재한다. 특히, 형질전환 및 형질감염을 위한 전달 방법을 적용해, 본 발명의 툴을 동시에 도입할 수 있다. 일반적인 생물학적 수단은 다양한 여러가지 식물 물질들에 대해 수십년간 사용되어 온 아그로박테리움 spp.를 이용한 형질전환이다. 바이러스 벡터 매개 식물 형질전환은 대상 세포에 유전 물질을 도입하기 위한 또 다른 전략이다. 식물 생물학에서 유용한 물리적 수단은 입자 총법이며, 이는 또한 바이올리스틱 형질감염 또는 미세입자-매개 유전자 전달로 지칭되며, 대상 핵산 또는 유전자 구조체를 포함하는 코딩된 미세입자 또는 나노입자를 타겟 세포 또는 조직에 전달하기 위한 물리적 전달 방법을 지칭한다. 물리적 도입 수단은 핵산, 즉 RNA 및/또는 DNA 및 단백질을 도입하기 적합하다. 마찬가지로, 전기천공, 미세주입, 나노입자 및 세포 침투성 펩타이드 (CPP) 등의, 대상 핵산 또는 아미노산 구조체를 식물 세포에 특이적으로 도입하기 위한 특이적인 형질전환 또는 형질감염 방법들이 존재한다. 아울러, 유전자 구조체 및/또는 핵산 및/또는 단백질을 도입하기 위한 화학제를 이용한 형질감염 방법도 있으며, 이는 특히 칼슘 포스페이트를 이용한 형질감염, 리포좀, 예를 들어, 양이온성 리포좀을 이용한 형질감염, 또는 DEAD-덱스트란 또는 폴리에틸렌이민 등의 양이온성 폴리머를 이용한 형질감염 또는 이들의 조합 등을 포함한다. 이러한 전달 방법 및 전달 비히클 또는 카고는, 따라서, 동물 및 포유류 세포 등의 다른 진핵생물 세포에 사용되는 전달 툴과는 본질적으로 차이가 있으며, 모든 전달 방법은, 게놈 편집을 매개하기 위한 대상 구조체가 대상 타겟 세포의 특정 구획에 완전히 기능적이고 능동적인 방식으로 도입될 수 있도록, 특이적으로 미세-조정되고 최적화되어야 한다. 상기한 전달 기법을 단독으로 또는 조합하여 사용함으로써, 본 발명에 따른 하나 이상의 분자 복합체, 즉, 본 발명에 따른, 염기 편집기 복합체 및/또는 부위-특이적인 작동자 복합체 또는 이의 하나 이상의 서브컴포넌트, 즉 하나 이상의 SSN, 하나 이상의 gRNA, 하나 이상의 RT 또는 하나 이상의 염기 편집기, 또는 전술한 서브컴포넌트를 코딩하는 서열을 타겟 세포에 생체내 또는 시험관내 삽입할 수 있다.
물리적 및 화학적 전달 방법은 하나 이상의 식물 세포에 다양한 대상 툴을 공동-전달하여 병행 도입할 수 있으므로, 본 발명에 따르면 특히 바람직하다.
특정 구현예에서, RNA의 crRNA 영역은 스템 루프 또는 최적화된 스템 루프 구조 또는 최적화된 2차 구조를 포함한다. 다른 구현예에서, 성숙형 crRNA는 다이렉트 리피트 서열 (direct repeat sequence)에 스템 루프 또는 최적화된 스템 루프 구조를 포함하며, 이 스템 루프 또는 최적화된 스템 루프 구조는 절단 활성에 중요하다. 특정 구현예에서, 성숙형 crRNA는 바람직하게는 단일한 스템 루프를 포함한다. 특정 구현예에서, 다이렉트 리피트 서열은 바람직하게는 단일한 스템 루프를 포함한다. 특정 구현예에서, 작동자 단백질 복합체의 절단 활성은 스템 루프 RNA 듀플렉스 구조에 영향을 미치는 돌연변이를 도입함으로써 변형된다. 바람직한 구현예에서, 스템 루프의 RNA 듀플렉스를 유지하는 돌연변이가 도입될 수 있으며, 이로써 작동자 단백질 복합체의 절단 활성은 유지된다. 다른 바람직한 구현예에서, 스템 루프의 RNA 듀플렉스를 교란하는 돌연변이가 도입될 수 있으며, 이로써 작동자 단백질 복합체의 절단 활성은 완전히 없어진다.
특히, 본 발명의 다양한 측면들에 따른 방법은 아미노산을 코딩하는 코딩 영역 내의 변형인 제1 및/또는 제2 타겟화된 변형으로 제한되는 것은 아니다. 조절 서열의 변형 역시 고려된다. 후생유전학적 효과 (epigenetic effect)를 가진 임의의 변형 역시 본 발명의 방법에서 다루어질 수 있다.
일 구현예에서, 변형할 하나 이상의 게놈 타겟 서열은 프로모터와 같은 조절 서열일 수 있으며, 프로모터의 편집은 프로모터 또는 프로모터 단편을 다른 프로모터 (치환 프로모터라 함) 또는 프로모터 단편 (치환 프로모터 단편이라 함)으로 치환하는 것을 포함하며, 프로모터 치환으로 다음 중 임의의 하나의 조합이 달성된다: 프로모터 활성 증가, 프로모터 조직 특이성 증가, 프로모터 활성 감소, 프로모터 조직 특이성 감소, 새로운 프로모터 활성, 유도성 프로모터 활성, 유전자 발현의 윈도우 연장, 동일한 세포 층 또는 다른 세포층에서 유전자 발현의 시기 또는 전개 프로세스의 변형, 예를 들어, 꽃밥의 반사면 (tapetum)에서 유전자 발현 시기 연장, DNA 결합 인자의 돌연변이 및/또는 DNA 결합 인자의 결손 또는 부가. 변형할 프로모터 (또는 프로모터 단편)은, 편집되는 세포에 내인성, 인공적인, 기-존재하는 또는 전이유전자인, 프로모터 (또는 프로모터 단편)일 수 있다. 치환 프로모터 또는 이의 단편은 편집되는 세포에 내인성, 인공적인, 기-존재하는 또는 전이유전자성인 프로모터 또는 이의 단편일 수 있다.
일 구현예에서, 하나 이상의 게놈 타겟 서열은 프로모터일 수 있으며, 프로모터의 편집은 천연 EPSPS1 프로모터를 식물 유비퀴틴 프로모터로 치환하는 것을 포함한다. 다른 구현예에서, 변형할 하나 이상의 게놈 타겟 서열은 프로모터일 수 있으며, 편집할 프로모터는 지 메이스 (Zea mays)-PEPC1 프로모터 (Kausch et al., Plant Molecular Biology, 45: 1-15, 2001), 지 메이스 (Zea mays) 유비퀴틴 프로모터 (UBI1ZM PRO, Christensen et al., plant Molecular Biology 18: 675-689, 1992), 벼 액틴 프로모터 (McElroy et al., The Plant Cell, Vol 2, 163-171, February 1990), 지 메이스 (Zea mays)-GOS2 프로모터 (미국 특허 6,504,083) 또는 지 메이스 (Zea mays) 올레신 (oleosin) 프로모터 (미국 특허 8,466,341)를 포함하는 군으로부터 선택된다.
일 구현예에서, 하나 이상의 부위-특이적인 작동자 복합체는 공동-전달된 RT와 조합하여 사용하여, 선별가능한 전이유전자 마커의 삽입없이, 프로모터 또는 프로모터 요소를 대상 게놈 뉴클레오티드 서열에 삽입할 수 있으며, 프로모터 삽입 (또는 프로모터 요소 삽입)으로 다음과 같은 사항 중 어느 하나 또는 이들 조합 중 어느 하나가 달성된다: 프로모터 활성 증가, 즉, 프로모터 강도 증가, 프로모터 조직 특이성 증가, 프로모터 활성 감소, 프로모터 조직 특이성 감소, 새로운 프로모터 활성, 유도성 프로모터 활성, 유전자 발현 윈도우 연장, 유전자 발현의 시기 또는 전개 프로세스의 변형, DNA 결합 인자의 돌연변이 및/또는 DNA 결합 인자의 부가. 삽입할 프로모터 요소는, 비-제한적으로, 프로모터 코어 요소, 예를 들어, 비-제한적으로, CAAT box, CCAAT box, Pribnow box, 및/또는 TATA box, 번역 조절 서열 및/또는 유도성 발현을 위한 억제인자 시스템, 예를 들어, TET 오퍼레이터 리프레서/오퍼레이터/인듀서 요소, 또는 설포닐우레아 리프레서/오퍼레이터/인듀서 요소일 수 있다. 탈수-반응성 인자 (dehydration-responsive element, DRE)가 9 bp 보존된 코어 서열 TACCGACAT를 포함하는, 가뭄-반응성 유전자 rd29A의 프로모터에서 cis-작용성 프로모터 요소로서 최초로 동정되었다 (Yamaguchi-Shinozaki, K., and Shinozaki, K. (1994) Plant Cell 6, 251-264). 내인성 프로모터에 DRE의 삽입은 하류 유전자의 가뭄 유도성 발현을 부여할 수 있다. 또 다른 예는 ABA-반응성 인자 (ABRE)로서, 이는 수많은 ABA 및/또는 스트레스-조절되는 유전자에 존재하는 것으로 확인된 (C/T)ACGTGGC 컨센서스 서열을 포함한다 (Busk P. K., Pages M. (1998) Plant Mol. Biol. 37:425-435). 내인성 프로모터 영역에 35S 인핸서 또는 MMV 인핸서가 삽입되면, 유전자 발현이 증가할 것이다 (미국 특허 5,196,525). 삽입할 프로모터 또는 프로모터 요소는, 편집 대상 세포에 내인성, 인공적인, 기-존재하는 또는 전이유전자성, 프로모터 또는 프로모터 요소일 수 있다.
일 구현예에서, 하나 이상의 부위-특이적인 작동자 복합체를 사용해, 비-제한적인 예로, 콜리플라워 모자이크 바이러스 35 S 인핸서와 같은 인핸서 요소를 내인성 FMT1 프로모터 앞에 삽입하여, FTM1의 발현을 강화할 수 있다. 추가적인 구현예에서, 하나 이상의 부위-특이적인 작동자 복합체를 사용해, TET 오퍼레이터 리프레서/오퍼레이터/인듀서 시스템의 구성성분, 또는 설포닐우레아 리프레서/오퍼레이터/인듀서 시스템의 구성성분을 식물 게놈에 삽입하여, 선별가능한 전이유전자 마커의 삽입없이 유도성 발현 시스템을 구축 또는 조절할 수 있다.
다른 구현예에서, 하나 이상의 부위-특이적인 작동자 복합체를 사용해 프로모터 또는 프로모터 요소의 결손을 허용할 수 있으며, 프로모터 결손 (또는 프로모터 요소 결손)으로 다음과 같은 사항 중 어느 하나 또는 이들 조합 중 어느 하나가 달성된다: 영구적으로 불활성화된 유전자 좌, 프로모터 활성 증가 (프로모터 강도 증가), 프로모터 조직 특이성 증가, 프로모터 활성 감소, 프로모터 조직 특이성 감소, 새로운 프로모터 활성, 유도성 프로모터 활성, 유전자 발현 윈도우 연장, 유전자 발현의 시기 또는 전개 프로세스의 변형, DNA 결합 인자의 돌연변이 및/또는 DNA 결합 인자의 부가. 제거될 프로모터 요소는, 비-제한적으로, 프로모터 코어 요소, 프로모터 인핸서 요소 또는 35S 인핸서 요소일 수 있다. 제거될 프로모터 또는 프로모터 단편은 편집 대상 세포에 내인성, 인공적인, 기-존재하는 또는 전이유전자성일 수 있다.
또 다른 구현예에서, 변형할 하나 이상의 게놈 타겟 대상 부위는 종결인자일 수 있으며, 종결인자의 편집은 "종결인자 스왑 (terminator swap)" 또는 "종결인자 대체 (terminator replacement)"로도 지칭되는 종결인자 또는 종결인자 단편을, 치환 종결인자로도 지칭되는 다른 종결인자 또는 치환 종결인자 단편으로도 지칭되는 종결인자 단편으로 치환하는 것을 포함하며, 종결인자 치환으로 다음과 같은 사항 중 어느 하나 또는 이들 조합 중 어느 하나가 달성된다: 종결인자 활성 증가, 종결인자 조직 특이성 증가, 종결인자 활성 감소, 종결인자 조직 특이성 감소, DNA 결합 인자의 돌연변이 및/또는 DNA 결합 인자의 결손 또는 부가. 변형할 종결인자 또는 그 단편은 편집되는 세포에 내인성, 인공적인, 기-존재하는 또는 전이유전자인 종결인자일 수 있다. 치환 종결인자는 편집되는 세포에 내인성, 인공적인, 기-존배하는 또는 전이유전자인 종결인자 또는 그 단편일 수 있다.
일 구현예에서, 변형할 하나 이상의 대상 게놈 타겟 부위는 종결인자를 포함하며, 편집 대상인 종결인자는 옥수수 Argos 8 또는 SRTF18 유전자 유래 종결인자 또는 기타 종결인자, 예를 들어 감자 PinII 종결인자, 수수 액틴 종결인자 (WO 2013/184537 A1), 벼 T28 종결인자 (WO 2013/012729 A2), AT-T9 TERM (WO 2013/012729 A2) 또는 GZ-W64A TERM (미국 특허 7,053,282)을 포함하는 군으로부터 선택된다.
일 구현예에서, 본 발명에 따른 하나 이상의 부위-특이적인 작동자 복합체는 공동-전달된 RT 서열과 조합 사용하여, 종결인자 또는 종결인자 요소를 대상 게놈 뉴클레오티드 서열에 삽입할 수 있으며, 종결인자 (단편)의 삽입으로 다음과 같은 사항 중 어느 하나 또는 이들 조합 중 어느 하나가 달성된다: 종결인자 활성 증가, 즉, 종결인자 강도 증가, 종결인자 조직 특이성 증가, 종결인자 활성 감소, 종결인자 조직 특이성 감소, DNA 결합 인자의 돌연변이 및/또는 DNA 결합 인자의 부가.
삽입할 종결인자 또는 이의 요소 또는 단편은 편집되는 세포에 내인성, 인공적인, 기-존재하는 또는 전이유전자인 종결인자 (또는 종결인자 요소)일 수 있다.
또 다른 구현예에서, 하나 이상의 부위-특이적인 작동자 복합체를 사용해 종결인자 또는 종결인자 요소를 결손시킬 수 있으며, 종결인자 결손 (또는 종결인자 요소 결손)으로 다음과 같은 사항 중 어느 하나 또는 이들 조합 중 어느 하나가 달성된다: 종결인자 활성 증가 (종결인자 강도 증가), 종결인자 조직 특이성 증가, 종결인자 활성 감소, 종결인자 조직 특이성 감소, DNA 결합 인자의 돌연변이 및/또는 DNA 결합 인자의 부가. 제거할 종결인자 또는 이의 단편은 편집되는 세포에 내인성, 인공적인, 기-존재하는 또는 전이유전자일 수 있다.
일 구현예에서, 본 발명의 하나 이상의 부위-특이적인 작동자 복합체는 선별가능한 전이유전자 마커의 삽입없이도 세포의 게놈 내 조절 서열을 변형 또는 치환할 수 있다. 조절 서열은 유기체에서 특정 유전자의 발현을 증가 또는 감소시킬 수 있거나 및/또는 유기체에서 조직 특이적인 유전자의 발현을 변형시킬 수 있는 핵산 분자의 세그먼트이다. 조절 서열의 예로는, 비-제한적으로, 3' UTR (비-번역 영역) 영역, 5' UTR 영역, 전사 활성인자 (transcription activator), 전사 인핸서, 전사 억제인자, 번역 억제인자, 스플라이싱 인자, miRNA, siRNA, 인공 miRNA, 프로모터 요소, CAMV 35 S 인핸서, MMV 인핸서 요소, SECIS 요소, 폴리아데닐화 신호 및 폴리유비퀴틴화 부위 등이 있다. 일부 구현예에서, 본 발명의 하나 이상의 타겟화된 변형 형태의 편집 또는 조절 인자의 치환으로, 단백질 번역, RNA 절단, RNA 스플라이싱, 전사 종결인자 또는 번역 후 수정이 변형될 수 있다. 일 구현예에서, 조절 인자는 프로모터에서 동정할 수 있으며, 이러한 조절 인자는 프로모터를 상향 또는 하향 조절하도록 이들 조절 인자를 최적화하기 위해 편집 또는 변형될 수 있다.
일 구현예에서, 변형할 하나 이상의 대상 게놈 타겟 부위는 폴리유비퀴틴화 부위이며, 폴리유비퀴틴화 부위의 변형으로 단백질 분해 속도가 변경된다. 유비퀴틴 태그는 단백질이 프로테아좀 또는 자가포식에 의해 분해되게 만든다. 프로테아좀 저해제는 단백질 과생산을 유발할 수 있는 것으로 알려져 있다. 대상 단백질을 코딩하는 DNA 서열에 행해진 변형은 대상 단백질의 하나 이상의 아미노산 변형을 발생시킬 수 있으며, 이러한 변형은 단백질의 폴리유비퀴틴화 (번역 후 수정)를 허용하여 단백질 분해를 바꿀 수 있다.
추가적인 구현예에서, 변형할 하나 이상의 대상 게놈 타겟 부위는 옥수수 EPSPS 유전자의 폴리유비퀴틴화 부위이며, 변형된 폴리유비퀴틴화 부위는 EPSPS 단백질 분해 속도를 낮춤으로써 단백질 함량 증가를 야기한다.
다른 추가의 구현예에서, 변형할 하나 이상의 대상 게놈 타겟 부위는 인트론 부위이며, 변형은 인트론 강화 모티프 (intron enhancing motif)의 인트론에의 삽입으로 구성되며, 그 결과 이 인트론을 포함하는 유전자의 전사 활성이 조정된다.
이제 본 발명은 하기 실시예를 들어 설명될 것이나, 이들 실시예는 본 발명의 범위를 제한하는 것으로 해석되지 않는다.
실시예
:
실시예
1: 염기 편집을 검증하기 위한 차세대 서열분석
닉카제 커플링된 염기 편집기를 이용한 이전에 언급된 타겟에 대한 활성을 조사하기 위해, 표준 방법에 의해 APOBEC-XTEN-Cas9 (nickase)-UGI (서열번호 1 및 서열번호 2)를 코딩하는 플라스미드를 구축하고, 염기 편집기 및 sgRNA를 지 메이스(Zea mays) 조직으로부터 유래된 세포에서 일시적으로 발현시켰다. 복합체와 더불어, 실시예 2-6에서 설계된 gRNA를 검사하였다. 아울러, 대상 타겟 부위와 관련하여 특이적인 PAM 모티프 (서열번호 3-13 및 23)를 지정하였다.
또한, 특정 제초제 타겟 유전자에서 해당 아미노산을 변환시키는데 이용가능한 타겟 부위 범위를 넓이기 위해, SaKKH-BE3 및 VQR-BE3 단백질 (Komor A. et al., Increasing the genome-targeting scope and precision of base editing with engineered Cas9-cytidine deaminase fusion, Nat. Biotech. (2017))를 옥수수 발현용으로 코돈-최적화하여 합성한 다음 동일한 옥수수 세포 시스템에서 발현하기 위한 적절한 sgRNA와 함께 플라스미드에 클로닝하였다.
염기 편집기 발현성 플라스미드를 처리한 지 12-96시간 후, 세포 집단으로부터 전체 게놈 DNA를 추출하고, 타겟화된 심층 서열분석을 실시하여 타겟에서의 염기 변환 빈도 및 패턴을 분석하였다. ALS1 (특히 P197, S653), ALS2 (특히 P197, S653) 및 PPO (특히 C215, A220, G221, N425, Y426) 유전자에서 제초제-내성 아미노산 치환을 유발하는 변환력을 분석하였다.
실시예
2: 염기 편집 구성성분의 형질전환 및
설포닐우레아
또는
이미다졸
리논에 대한 선별
염기 편집으로 본원에 기술된 방법을 이용해 제초제 내성을 부여할 수 있는 지를 확인하기 위해, 실시예 1에 기술된 염기 편집기를, 실시예 1에서 NGS에 의해 검증된 옥수수 ALS1, ALS2 유전자를 타겟팅하는 특이적으로 설계된 몇가지 gRNA를 이용해, 지 메이스 (Zea mays) 유래 조직으로 형질전환하고, 설포닐우레아 (P197 또는 S653 치환의 경우) 또는 이미다졸리논 (S653 치환의 경우)이 함유된 선별 배지에서 재생하였다. 제초제 내성 식물은 염기 편집기의 작동으로 인해 염기 변환을 겪게 될 것이며, 따라서 197번 프로린 또는 653번 세린이 전달된 편집기에 따라 치환될 것이다. 염기 변환 이벤트를 검증하기 위해, 제초제 내성 식물의 ALS 유전자를 상호보완적인 제초제 (complementary herbicide)를 사용해 선별하고, 분자 기법으로 분석하였다.
실시예
3: 비-연관 유전자 좌에서 비-
선별성
변형의 빈도를 높이기 위한 염기 편집기 작용으로 인한 제초제 내성의 공동-선별
유전자 편집 이벤트를 가진 식물을 단리하기 위한 전이유전자가 없는 선별이 게놈 조작시 적절하고 간단한 툴을 제공함을 입증하기 위해, 실시예 2에 기술된 방법을, 동일 세포에서 제초제 유전자의 염기-변환과 대상 유전자의 타겟화된 변형을 병행하여 동시에 구축하기 위한, 부위-특이적인 뉴클레아제의 공동-전달과 결합시켰다. 동일 플라스미드 또는 제2 플라스미드에 뉴클레아제를 sgRNA 및 선택적으로 복구 주형과 함께 코딩시켜, 염기 편집기의 작용으로 인한 염기 변환으로 동일 세포에서 타겟화된 변형을 만들었다. 이후 단계에서, 실시예 2에 기술된 바와 같이 식물을 제초제 선별 조건에서 재생시킨 다음 대상 유전자에서 타겟화된 변형에 대한 분자 및 기타 적절한 기법을 통해 스크리닝할 수 있으며, 제초제 선별로 하나 이상의 제2 변형, 즉 변형시킬 대상 유전자를 표시하는 제2 게놈 유전자 좌에서 하나 이상의 타겟화된 변형을 스크리닝할 세포의 수를 현저하게 줄일 수 있다.
실시예
4: 기능성
CRISPR
/
Cpf1
염기 편집기 설계 및 염기 편집기
윈도우의
정의
본 실시예에서, 제2 CRISPR 단백질, 즉 Cpf1을 이용해, 게놈 타겟에 염기 편집기 복합체를 전달하였다. CRISPR/Cas9와 마찬가지로, CRISPR/Cpf1은 이의 DNA 타겟에 결합하면 R 루프 유사 구조를 형성하여, 염기 편집에 이용가능한 비-타겟 가닥을 단일 가닥으로 남기게 된다. 그러나, Cpf1-유래 염기 편집기를 이용한 염기 변환 윈도우의 정확한 위치는 모르기 때문에, 타겟에서 PAM 서열에 대한 염기 변환 패턴을 분석할 필요가 있다. 염기 변환 윈도우는 실시예 1에 기술된 세포 집단에서 그 서열을 타겟팅하는 Cpf1 기반의 편집자의 전달 후 옥수수 게놈의 GC-풍부 서열 상의 타겟화된 NGS에 의해 정의될 수 있다. 다른 타겟 식물의 경우, 전략을 그에 맞게 수정할 수 있다.
실시예
5: 복구 주형 또는
상동적인
재조합없이
선별가능한
변형을 만들기 위한 PPO 유전자에서 단일-뉴클레오티드 결손 적용
아마란투스 투베르쿨라투스 (Amaranthus tuberculatus) PPO 유전자의 210번 글리신 아미노산을 제거하면, PPO-저해성 제초제에 대한 내성이 작물에 부여된다 (Patzoldt, W. L. et al. (2006). "A codon deletion confers resistance to herbicides inhibiting protoporphyrinogen oxidase" PNAS 103(33):12329-12334). 이 이소형은 PPX2L로도 지칭된다. 니코티아나 타바쿰 (Nicotiana tabacum)에서 대응되는 아미노산은 PPO2 유전자의 178번 글리신이다. 지 메이스 (Zea mays)의 경우, 대응되는 아미노산은 알라닌이지만, 주변 잔기들이 고도로 보존적이서, 알라닌 결손으로 인해 내성으로 될 기능성 활성 부위를 여전히 구성할 것으로 보인다.
본 실시예에서, Cas9 또는 Cpf과 같은 부위-특이적인 뉴클레아제를 적절한 crRNA 또는 sgRNA와 함께 사용해, 이 아미노산 코돈 근처에 이중 가닥 절단을 만들 수 있다. 활성 PPO 효소를 보존하면서 제초제 결합을 저해하는 염기 3개의 결손으로, 제초제 내성 식물이 만들어질 것이다. 따라서, 이러한 선별가능한 변형은 복구 주형 또는 상동적인 재조합을 사용하지 않고 행할 수 있으며, 따라서 전이유전자 마커 프리 전략을 제공해준다.
실시예
6: 부가적인 이용
부가적인 실시예는 CRISPR 뉴클레아제 CasX, CasY 및 Cpf1을, 상기 실시예 1-3에서 CRISPR Cas9에 대해 기술된 방법과 함께 사용가능하다. 또한, 실시예 1에 기술된 Cas9-연계된 염기 편집기 또는 실시예 4에 언급된 Cpf1과 연계된 염기 편집기를 이용한, 선별가능한 유전자 타겟 또는 식물 스크리닝을 위한 표현형 마커에의 조기 정지 코돈의 도입. 구체적인 예는 표현형 유전자 (예, 수많은 광택 유전자, 골든 등) 내 정지 코돈일 수 있다.
또한, 제초제-내성에 기반하여 선별하기 위한 추가적인 타겟은 앞서 기술된 바와 같이 PPO, ALS 및 EPSPS 유전자에서의 기타 아미노산 결손, 조기 정지 코돈의 도입 또는 아미노한 변경을 포함한다. PPO 유전자에서 염기 편집하기 적합한 gRNA 프로토스페이서 서열이 제공된다 (서열번호 7 - 13).
CasX-연계된 염기 편집 복합체의 서열 (서열번호 14), AsCpf1-연계된 염기 편집 복합체의 서열(서열번호 15) 및 시티딘 데아미나제 PmCDA1을 Cas9-연계된 염기 편집 복합체에 도입하기 위한 서열 (서열번호 16)이 추가적으로 제공된다.
CRISPR 뉴클레아제-연계된 염기 편집 복합체의 최적화, 특히 데 노보 설계를 위해, 다음과 같은 구성성분들을 임의 순서로, 임의 조합으로 사용할 수 있다: niCas9 (D10A; 서열번호 17), CasX (서열번호 18), niAsCpf1 (R1226A; 서열번호 19), APOBEC1 (서열번호 20), UGI (서열번호 21), PmCDA1 (서열번호 22), 및 링커, 예로 XTEN 링커, 및 핵 위치화 신호 또는 대상 게놈 부위에 따른 기타 소기관 타겟팅 신호, 또는 이들 구성성분들의 임의 조합.
실시예
7: 벼 돌연변이 식물의 스크리닝
Yuan Zong et al. (Zong, Y. et al. Precise base editing in rice, wheat and maize with a Cas9-cytidine deaminase fusion. Nat. Biotechnol. 2017, doi: 10.1038/nbt.3811)에 따라, OsALS 유전자 (Genbank No.: AY885674.1)의 2개의 다른 부위 (S1 및 S2)를 동시에 타겟팅하는 벡터 pH-nCas9-PBE-OsALS-S1/S2를, pH-nCas9- PBE를 기반으로 구축하였다. OsALS의 S1 부위를 제초제 선별을 위한 부위로 사용하였다. S1 유전자 좌가 돌연변이되면, 식물은 니코설푸론과 같은 제초제에 대해 내성을 획득하게 될 것이다 (Tranel and Wright, 2002). 실험의 sgRNA 타겟 서열을 표 1에 나타낸다.
표 1. 벼 sgRNA 타겟 서열
sgRNA | 타겟 서열 |
sgRNA-OsALS-S1 | CAGGTCCCCCGCCGCATGATCGG |
sgRNA-OsALS-S2 | CCTACCCGGGCGGCGCGTCCATG |
PAM은 밑줄 표시된다.
pH-nCas9-PBE-OsALS-S1/S2 바이너리 벡터를 아그로박테리움 균주 AGL1에 전기천공에 의해 형질전환하였다. 아그로박테리움-매개 형질전환, 조직 배양 및 벼 품종 Zhonghua 11에서의 재생을 Shan et al. (Shan, Q. et al. Targeted genome modification of crop plants using a CRISPR-Cas system. Nat. Biotechnol. 31, 686-688 (2013))에 따라 수행하였다. 조직 배양시 히그로마이신 선별 (50 μg/ml)을 이용하였다. (본 실험은 개념 증명이어서, 식물을 먼저 히그로마이신을 사용해 선별한 다음 니코설푸론으로 선별하였다. 목표는 먼저 형질전환 식물을 수득한 다음 제초제 내성에 대해 스크리닝하는 것이었다.) 벼 식물을 재생시킨 후, 재생된 모종 10주를, 야생형 식물은 생존할 수 없는 니코설푸론 0.0065 PPM 함유성 선별 배지에서 배양하였다. 14일 후 4주가 생존하였다. 이들 4주로부터 DNA를 추출하였다. ALS 유전자를 PCR에 의해 증폭시키고, 서열분석하여 돌연변이 유전자형을 확인하였다. 그 결과, 이들 4주 모두 S2 유전자 좌에서 염기 돌연변이되었으며, 제초제-내성 식물은 S2 부위에서 100% (4/4)의 돌연변이율을 달성한 것으로, 나타났다. 돌연변이 패턴은 도 2a에 나타낸다.
실시예
8: 밀 돌연변이 식물 스크리닝
Yuan Zong et al. (Zong, Y. et al. Precise base editing in rice, wheat and maize with a Cas9-cytidine deaminase fusion. Nat. Biotechnol. 2017, doi: 10.1038/nbt.3811)에 따라, 하기 구조체들을 pTaU6에 기반하여 제조하였다:
1) B 게놈 (GenBank No.: AY210406)의 TaALS 유전자의 S2 부위를 타겟팅하는 pTaU6-TaALS-S2,
2) B 게놈 및 D 게놈 (Genbank No. EU660901 및 EU660902)의 TaACCase 유전자에서 하나의 부위를 타겟팅하는 pTaU6-TaACCase,
3) 병행하여 TaALS 유전자의 2가지 부위를 타겟팅하는 pTaU6-TaALS-S1/S2, 및
4) 병행하여 TaALS 및 ACCase 유전자를 타겟팅하는 TaU6-TaALS-S1/TaACCase.
TaALS S1 부위를 제초제 선별 부위로 사용하였다. 그 부위가 돌연변이되면, 식물은 제초제 (예, 니코설푸론) 내성을 획득하게 될 것이지만, TaALS S2 부위에서의 돌연변이만으로는 내성이 부여되진 않을 것이다 (Tranel and Wright, 2002). 이 실험에 사용된 sgRNA 타겟 서열을 표 2에 나타낸다.
표 2. 밀 sgRNA 타겟 서열
sgRNA | 타겟 서열 |
sgRNA-TaALS-S1 | CAGGTCCCCCGCCGCATGATCGG |
sgRNA-TaALS-S2 | CCTACCCTGGCGGCGCGTCCATG |
sgRNA-TaACCase | TTCAGCTACTAAGACAGCGCAGG |
PAM은 밑줄 표시된다.
플라스미드 DNA (pnCas9-PBE와 pTaU6 벡터 시리즈의 동일 비율 혼합물)를 사용해, 기존에 언급된 형질전환과 같이 Konun 199의 어린 배아에 유전자 총으로 형질전환하였다 (Zhang, K., Liu, J., Zhang, Y., Yang, Z. & Gao, C. Biolistic genetic transformation of a wide range of Chinese elite wheat (Triticum aestivum L.) varieties. J. Genet. Genomics. 42, 39-42 (2015). 유전자 총 형질전환 후, 배아를 문헌에 따라 처리하고, 조직 배양시 선별 물질은 사용하지 않았다.
B 게놈의 TaALS 유전자의 S2 부위만 타겟팅함으로써 수득한 밀 식물의 경우, 식물 3-4주를 하나의 샘플로 각각 채집하여 PCR/RE에 의해 돌연변이를 검출하였다. 샘플 258개를 PCR/RE에 의해 검출하였으며 (개별 식물 약 1000주), 돌연변이는 검출되지 않았다.
TaACCase 유전자 부위만 타겟팅함으로써 수득한 밀 식물의 경우, 식물 3-4주를 하나의 샘플로 각각 채집하여 생거 서열분석으로 분석하였다. 샘플 64개를 서열분석하였으며 (개별 식물 약 256주), 돌연변이는 검출되지 않았다.
TaALS 유전자의 S1 부위와 S2 부위를 병행하여 타겟팅함으로써 수득한 밀 식물 (약 800주)을 먼저 (야생형 식물은 생존할 수 없는) 0.13 PPM 니코설푸론 함유성 선별 배지에서 배양하였다. 30일 후, 12주가 생존하였으며, 이중 9주는 TaALS-S2 부위에 염기 돌연변이를 가지고 있었다. 니코설푸론 선별 배지를 이용한 ALS-S2 부위 돌연변이의 선별 효율은 75% (9/12)이었다. 돌연변이주 5종의 돌연변이 타입을 도 2b에 나타낸다.
TaALS 유전자 및 TaACCase 유전자를 병행하여 타겟팅함으로써 수득한 밀 식물 (약 800주)을 0.13 PPM 니코설푸론 함유성 선별 배지에서 배양하였다. 30일 후, 9주가 생존하였으며, 2주는 TaACCase 부위에 염기 돌연변이를 가지고 있었다. 니코설푸론 선별 배지를 이용한 TaACCase 부위 돌연변이의 선별 효율은 22% (2/9)이었다. TaACCase 부위의 돌연변이 패턴을 도 2c에 나타낸다.
실험 결과, 돌연변이 비율이 매우 낮은 타겟 유전자 (예, 타겟 유전자의 돌연변이율이 0.5%)의 경우, 본 발명의 방법은 타겟 돌연변이의 수득 가능성을 10-100배 높일 수 있는 것으로, 확인되었다.
실시예
9:
TaALS
-P173에
기반한
밀에서의 염기 공동-편집 시스템의 개발
본 실험에서, TaALS-P173에 대응되는 sgRNA 부위를 이용해, 밀 형질전환 중에 제초제 선별 시스템을 확립하였다. PnCas9-PBE 및 TaALS-P173-sgRNA 구조체를 빵밀 품종인 Kenong 199의 미성숙 배아 세포 640개에 입자 총법에 의해 전달하였다. 모종 (2-3 cm)을 재생한 후, PCR 제한 효소 분해 분석 (PCR-RE 분석)으로 돌연변이 빈도를 분석하였다. 동시에, 동일 모종을 0.27 ppm 니코설푸론 함유 배지로 이동시켰다 (도 3). PCR-RE 분석에 의해 동정된 돌연변이 모종 14주 (2.1%) 중 10주 (1.56%)가, 제초제 함유 배지에서 3주 배양 후 내성을 나타내었으며, 민감성 돌연변이 3주는 어떠한 아미노산 치환도 포함하지 않았다 (표 3).
내성 | A 게놈 치환 | B 게놈 치환 | D 게놈 치환 | |
R | T0-1 | F/S | F/S | F/S |
R | T0-2 | F(헤테로) | F(호모) | S(호모) |
R | T0-3 | S(헤테로) | F/S | S(헤테로) |
S | T0-4 | WT | WT | SM |
R | T0-5 | S(호모) | S(헤테로) | F/S |
R | T0-6 | S(호모) | F,C(헤테로) | WT |
S | T0-7 | S(호모) | F,C(헤테로) | WT |
R | T0-8 | WT | WT | F(헤테로) |
R | T0-9 | F(호모) | F/S | S(헤테로) |
R | T0-10 | F(호모) | F/S | S(헤테로) |
R | T0-11 | S(헤테로) | F(헤테로) | F/S |
R | T0-12 | S(헤테로) | F(헤테로) | F/S |
S | T0-13 | WT | SM | WT |
S | T0-14 | WT | SM | WT |
SM: 침묵 돌연변이; S: 민감성; R: 내성; 호모: 동형접합체; 헤테로: 이형접합체
그 결과, TaALS-P173 치환을 제초제 함유 배지에서 인지할 수 있는 것으로 검증되었다. 그래서, 본 발명자들은, 이 부위가 또한 다른 게놈 편집 이벤트를 선별하는데 이용할 수 있는지를 확인하기 위해, 조사를 수행하였다. 다른 3 부위 (TaALS-A98, TaALS-A181 및 TaACCase-A2004)를 TaALS-P173와 각각 조합하였다. 선별 효율을 평가하기 위해, TaALS-P173 부위 타겟팅 시스템이 공동-입자 총법 형질전환된 재생 모종을 니코설푸론 함유 배지에 배치하였으며, 생존한 모종은 유전자형 분석에 사용하였다. 타겟화된 돌연변이들이 이들 3가지 부위 모두에서 검출되었으며 (표 4), 선별 효율은 최대 78%이었다. TaALS-A181 및 TaACCase-A2004 부위의 경우, 선별 효율은 비교적 낮았는데 (~25%), 아마도 데아미나제 APOBEC1의 GC 컨텍스트 (GC context)에서 낮은 변환 효율이 원인일 수 있다.
GC 컨텍스트를 가진 부위에서의 선별 효율을 높이기 위해, APOBEC1을 APOBEC1과 비교해 다른 서열 선호성을 가진 데아미나제-PmCDA1으로 치환하였다. 새롭게 확립한 염기 편집기 pPmCDA1-PBE, TaACCase-A2004-sgRNA 및 TaALS-P173-sgRNA 구조체를 입자 총법에 의해 미성숙 배아 세포 640개에 전달하였다. 생존 모종 2주 모두 타겟 부위 TaACCase-A2004에서 돌연변이 대립유전자를 가지고 있었다 (100%) (표 4).
데아미나제 | 생존 식물 수 | 제2 부위에서의 돌연변이 수 | 선별 효율 (%) | |
TaALS-P173+A98 | APOBEC1 | 18 | 14 | 78 |
TaALS-P173+A181 | APOBEC1 | 8 | 2 | 25 |
TaALS-P173 +TaACCase A2004 | APOBEC1 | 9 | 2 | 22 |
PmCDA1 | 2 | 2 | 100 |
실시예
10:
ZmALS
-P165에
기반한
옥수수에서의 염기 공동-편집 시스템 개발
옥수수에서 공동-편집 시스템을 확립하기 위해, TaALS-P173에 대응되는 아세토락테이트 신타제 부위를 제초제 내성 검사를 위한 타겟으로 하였다. ZmALS2 상의 싱글 편집된 대립유전자가 식물 제초제 내성을 부여할 수 있는 것으로 보고된 바 있다 (Svitashev et al, 2016). 이에, ZmALS-P165를 타겟팅하는 바이너리 벡터를 미성숙 배아에 형질전환하였다 (ZmALS-P165 부위는 ZmALS1 및 ZmALS2 둘다에 보존되어 있음). 재생 식물로부터 3가지 독립적인 돌연변이를 수득하였으며, 이들의 유전자형은 동일하였다. C에서 T로의 치환을 가진 ZmALS1 대립유전자 2종과 ZmALS2 대립유전자 1종에서는 하나의 아미노산 잔기 변형이 달성되었다: 165번 위치에서 프롤린에서 루신으로 치환. ZmALS2에 이형접합성 P165L 치환을 가진 돌연변이 식물 1주는 설포닐우레아 계열의 제초제인 메조설푸론-메틸에 내성을 나타내었다 (도 4).
ZmALS-P165 부위가 선별가능한 마커로서 충분히 작동함을 검증한 후, 다른 2가지 부위 - ZmAccase A2004 및 ZmSbe2 Stop - 를 이 선별가능한 부위와 각각 조합하였다. 형질전환을 위해 바이올리스틱 및 아그로박테리움-매개 전달을 수행하였다. ZmAccase A2004 부위는 GC 컨텍스트 내에 위치하였으며, PmCDA1을 사용해 APOBEC1을 대체하였다.
바이올리스틱 전달을 이용한 선별 효율을 평가하기 위해, 입자 총 발사한 캘러스와 아그로박테리움 매개 형질전환된 미성숙 배아를 메조설푸론-메틸 함유 배지 위에 배치하였다. 생존 모종들은 타겟 부위 돌연변이를 나타내었다.
실시예
11:
OsALS
-P171에
기반한
벼에서의 염기 공동-편집 시스템의 개발
벼에서 공동-편집 시스템을 확립하기 위해, TaALS-P173에 대응되는 아세토락테이트 신타제 부위를 제초제 내성 검사를 위한 타겟으로 하였다. 싱글 편집된 대립유전자가 식물 제초제 내성을 부여할 수 있는 것으로 보고된 바 있다 (Kawai, K., Kaku, K., Izawa, N., Shimizu, M., Kobayashi, H., & Shimizu, T. (2008). Herbicide sensitivities of mutated enzymes expressed from artificially generated genes of acetolactate synthase. Journal of pesticide science, 33(2), 128-137). 이에, OsALS-P171을 타겟팅하는 바이너리 벡터를 미성숙 배아에 형질전환하였다. 재생 식물로부터 돌연변이들이 수득되었다.
OsALS-P171 부위가 선별가능한 마커로서 충분히 작동함을 검증한 후, 다른 3가지 부위 - OsAccase W2125, OsBDAH2 Stop 및 OsSbe2 Stop - 를 이 선별가능한 부위와 각각 조합하였다. 형질전환을 위해 바이올리스틱 및 아그로박테리움-매개 전달을 수행하였다. 생존 모종은 타겟 부위 돌연변이를 나타내었다.
실시예
12:
ZmALS
-P197 또는
ZmALS
-G654에
기반한
옥수수에서의 염기 공동-편집 시스템의 개발
1. 염기 편집기를 이용해 달성된 제초제 내성을 부여하는 아미노산 변환 구축
이미다졸리논 및 설포닐우레아와 같은 제초제 그룹에 대해 식물에서 내성을 나타내는 아미노산으로 변환하기 위한 지 메이스 (Zea mays)의 타겟 아미노산을 선정하였다. 도 5에서 녹색 화살표는 원하는 변환을 수득하기 위한 코딩 또는 비-코딩 가닥에 대한 가이드 서열이다. 주의: 본 실시예에서 아미노산 잔기 위치 번호는 아라비돕시스 탈리아나의 원형이 되는 (archetypal) ALS 유전자에 대해 표준화하였다. 옥수수 및 밀 펩타이드 서열에서 이들 잔기들의 위치는 다소 다를 것이다.
2. 옥수수 ALS에서 제초제-민감성 P197 코돈은 염기 편집기에 의해 효과적으로 편집될 수 있다.
모든 실험은 옥수수 원형질체 시스템 (Corn Protoplast system)에서 수행하였다. sgRNA:-Guide에 대한 Pol III 프로모터는 P197 유전자 좌 (도 6, 좌측 그래프, 상단) 및 G654 유전자 좌 (도 6, 우측 그래프, 상단)에서 ALS1 및 ALS2 유전자를 변형하도록 제작하였다. 염기-편집기 시스템은 이 경우 pUbi1 구동형 (driven) 염기 편집기 및 ZmU3-구동형 가이드 RNA를 포함하는, 싱글 벡터 시스템이다. 상기에 나타낸 결과는 가이드 RNA에서 모든 C에 대해 계산된 C에서 T로의 변환 빈도 %이며, ALS1 및 ALS2 둘다 음성 대조군에서 백그라운드를 제한 것이다. 여기에 표시된 빈도는 P197 코돈에서 C 하나 또는 양쪽 C가 동일 세포에서 변경되었는지는 나타내지 않는다. G654 유전자 좌에서, 변경 역시 명백하였지만, 그 정도는 낮았다.
3. 제초제-민감성 잔기는 처리 세포의 최대 6% 빈도로 제초제-내성으로 변환된다 (도 7)
도 6에 나타낸 데이터를 분석하는 다른 방법은 원하는 아미노산 코돈 변환을 나타낸 리드의 수를 측정하는 것이다. 최종 데이터 %는 원형질체 형질전환 효율에 대해 정규화한다.
상단 패널: 프롤린197이 ALS1 및 ALS2 유전자 좌 양쪽에서 루신 또는 세린으로 변환된 리드의 %를 보여준다. 데이터는 Pol III 프로모터를 사용한 실험의 결과이다.
중앙 패널: 프롤린197이 ALS1 및 ALS2 유전자 좌 양쪽에서 루신 또는 세린으로 변환된 리드의 %를 보여준다. 데이터는 Pol III 프로모터 및 sgRNA에 대한 리보자임 전달 전략을 사용한 실험의 결과이다.
하단 패널: 글리신654가 ALS1 및 ALS2 유전자 좌 양쪽에서 아스파르트산으로 변환된 리드의 %를 보여준다. 데이터는 Pol III 프로모터 및 sgRNA에 대한 리보자임 전달 전략을 사용한 실험의 결과이다.
SEQUENCE LISTING
<110> Institute of Genetics and Developmental Biology, Chinese Academy of Sciences
KWS SAAT SE
<120> Methods for isolating cells without the use of transgenic marker sequences
<130> P20182491
<160> 28
<170> PatentIn version 3.5
<210> 1
<211> 5142
<212> DNA
<213> Artificial Sequence
<220>
<223> APOBEC1 XTEN nCas9(D10A) UGI NLS construct
<400> 1
atgagctcag agactggccc agtggctgtg gaccccacat tgagacggcg gatcgagccc 60
catgagtttg aggtattctt cgatccgaga gagctccgca aggagacctg cctgctttac 120
gaaattaatt gggggggccg gcactccatt tggcgacata catcacagaa cactaacaag 180
cacgtcgaag tcaacttcat cgagaagttc acgacagaaa gatatttctg tccgaacaca 240
aggtgcagca ttacctggtt tctcagctgg agcccatgcg gcgaatgtag tagggccatc 300
actgaattcc tgtcaaggta tccccacgtc actctgttta tttacatcgc aaggctgtac 360
caccacgctg acccccgcaa tcgacaaggc ctgcgggatt tgatctcttc aggtgtgact 420
atccaaatta tgactgagca ggagtcagga tactgctgga gaaactttgt gaattatagc 480
ccgagtaatg aagcccactg gcctaggtat ccccatctgt gggtacgact gtacgttctt 540
gaactgtact gcatcatact gggcctgcct ccttgtctca acattctgag aaggaagcag 600
ccacagctga cattctttac catcgctctt cagtcttgtc attaccagcg actgccccca 660
cacattctct gggccaccgg gttgaaaagc ggcagcgaga ctcccgggac ctcagagtcc 720
gccacacccg aaagtgataa aaagtattct attggtttag ccatcggcac taattccgtt 780
ggatgggctg tcataaccga tgaatacaaa gtaccttcaa agaaatttaa ggtgttgggg 840
aacacagacc gtcattcgat taaaaagaat cttatcggtg ccctcctatt cgatagtggc 900
gaaacggcag aggcgactcg cctgaaacga accgctcgga gaaggtatac acgtcgcaag 960
aaccgaatat gttacttaca agaaattttt agcaatgaga tggccaaagt tgacgattct 1020
ttctttcacc gtttggaaga gtccttcctt gtcgaagagg acaagaaaca tgaacggcac 1080
cccatctttg gaaacatagt agatgaggtg gcatatcatg aaaagtaccc aacgatttat 1140
cacctcagaa aaaagctagt tgactcaact gataaagcgg acctgaggtt aatctacttg 1200
gctcttgccc atatgataaa gttccgtggg cactttctca ttgagggtga tctaaatccg 1260
gacaactcgg atgtcgacaa actgttcatc cagttagtac aaacctataa tcagttgttt 1320
gaagagaacc ctataaatgc aagtggcgtg gatgcgaagg ctattcttag cgcccgcctc 1380
tctaaatccc gacggctaga aaacctgatc gcacaattac ccggagagaa gaaaaatggg 1440
ttgttcggta accttatagc gctctcacta ggcctgacac caaattttaa gtcgaacttc 1500
gacttagctg aagatgccaa attgcagctt agtaaggaca cgtacgatga cgatctcgac 1560
aatctactgg cacaaattgg agatcagtat gcggacttat ttttggctgc caaaaacctt 1620
agcgatgcaa tcctcctatc tgacatactg agagttaata ctgagattac caaggcgccg 1680
ttatccgctt caatgatcaa aaggtacgat gaacatcacc aagacttgac acttctcaag 1740
gccctagtcc gtcagcaact gcctgagaaa tataaggaaa tattctttga tcagtcgaaa 1800
aacgggtacg caggttatat tgacggcgga gcgagtcaag aggaattcta caagtttatc 1860
aaacccatat tagagaagat ggatgggacg gaagagttgc ttgtaaaact caatcgcgaa 1920
gatctactgc gaaagcagcg gactttcgac aacggtagca ttccacatca aatccactta 1980
ggcgaattgc atgctatact tagaaggcag gaggattttt atccgttcct caaagacaat 2040
cgtgaaaaga ttgagaaaat cctaaccttt cgcatacctt actatgtggg acccctggcc 2100
cgagggaact ctcggttcgc atggatgaca agaaagtccg aagaaacgat tactccatgg 2160
aattttgagg aagttgtcga taaaggtgcg tcagctcaat cgttcatcga gaggatgacc 2220
aactttgaca agaatttacc gaacgaaaaa gtattgccta agcacagttt actttacgag 2280
tatttcacag tgtacaatga actcacgaaa gttaagtatg tcactgaggg catgcgtaaa 2340
cccgcctttc taagcggaga acagaagaaa gcaatagtag atctgttatt caagaccaac 2400
cgcaaagtga cagttaagca attgaaagag gactacttta agaaaattga atgcttcgat 2460
tctgtcgaga tctccggggt agaagatcga tttaatgcgt cacttggtac gtatcatgac 2520
ctcctaaaga taattaaaga taaggacttc ctggataacg aagagaatga agatatctta 2580
gaagatatag tgttgactct taccctcttt gaagatcggg aaatgattga ggaaagacta 2640
aaaacatacg ctcacctgtt cgacgataag gttatgaaac agttaaagag gcgtcgctat 2700
acgggctggg gacgattgtc gcggaaactt atcaacggga taagagacaa gcaaagtggt 2760
aaaactattc tcgattttct aaagagcgac ggcttcgcca ataggaactt tatgcagctg 2820
atccatgatg actctttaac cttcaaagag gatatacaaa aggcacaggt ttccggacaa 2880
ggggactcat tgcacgaaca tattgcgaat cttgctggtt cgccagccat caaaaagggc 2940
atactccaga cagtcaaagt agtggatgag ctagttaagg tcatgggacg tcacaaaccg 3000
gaaaacattg taatcgagat ggcacgcgaa aatcaaacga ctcagaaggg gcaaaaaaac 3060
agtcgagagc ggatgaagag aatagaagag ggtattaaag aactgggcag ccagatctta 3120
aaggagcatc ctgtggaaaa tacccaattg cagaacgaga aactttacct ctattaccta 3180
caaaatggaa gggacatgta tgttgatcag gaactggaca taaaccgttt atctgattac 3240
gacgtcgatc acattgtacc ccaatccttt ttgaaggacg attcaatcga caataaagtg 3300
cttacacgct cggataagaa ccgagggaaa agtgacaatg ttccaagcga ggaagtcgta 3360
aagaaaatga agaactattg gcggcagctc ctaaatgcga aactgataac gcaaagaaag 3420
ttcgataact taactaaagc tgagaggggt ggcttgtctg aacttgacaa ggccggattt 3480
attaaacgtc agctcgtgga aacccgccaa atcacaaagc atgttgcaca gatactagat 3540
tcccgaatga atacgaaata cgacgagaac gataagctga ttcgggaagt caaagtaatc 3600
actttaaagt caaaattggt gtcggacttc agaaaggatt ttcaattcta taaagttagg 3660
gagataaata actaccacca tgcgcacgac gcttatctta atgccgtcgt agggaccgca 3720
ctcattaaga aatacccgaa gctagaaagt gagtttgtgt atggtgatta caaagtttat 3780
gacgtccgta agatgatcgc gaaaagcgaa caggagatag gcaaggctac agccaaatac 3840
ttcttttatt ctaacattat gaatttcttt aagacggaaa tcactctggc aaacggagag 3900
atacgcaaac gacctttaat tgaaaccaat ggggagacag gtgaaatcgt atgggataag 3960
ggccgggact tcgcgacggt gagaaaagtt ttgtccatgc cccaagtcaa catagtaaag 4020
aaaactgagg tgcagaccgg agggttttca aaggaatcga ttcttccaaa aaggaatagt 4080
gataagctca tcgctcgtaa aaaggactgg gacccgaaaa agtacggtgg cttcgatagc 4140
cctacagttg cctattctgt cctagtagtg gcaaaagttg agaagggaaa atccaagaaa 4200
ctgaagtcag tcaaagaatt attggggata acgattatgg agcgctcgtc ttttgaaaag 4260
aaccccatcg acttccttga ggcgaaaggt tacaaggaag taaaaaagga tctcataatt 4320
aaactaccaa agtatagtct gtttgagtta gaaaatggcc gaaaacggat gttggctagc 4380
gccggagagc ttcaaaaggg gaacgaactc gcactaccgt ctaaatacgt gaatttcctg 4440
tatttagcgt cccattacga gaagttgaaa ggttcacctg aagataacga acagaagcaa 4500
ctttttgttg agcagcacaa acattatctc gacgaaatca tagagcaaat ttcggaattc 4560
agtaagagag tcatcctagc tgatgccaat ctggacaaag tattaagcgc atacaacaag 4620
cacagggata aacccatacg tgagcaggcg gaaaatatta tccatttgtt tactcttacc 4680
aacctcggcg ctccagccgc attcaagtat tttgacacaa cgatagatcg caaacgatac 4740
acttctacca aggaggtgct agacgcgaca ctgattcacc aatccatcac gggattatat 4800
gaaactcgga tagatttgtc acagcttggg ggtgactctg gtggttctac taatctgtca 4860
gatattattg aaaaggagac cggtaagcaa ctggttatcc aggaatccat cctcatgctc 4920
ccagaggagg tggaagaagt cattgggaac aagccggaaa gcgatatact cgtgcacacc 4980
gcctacgacg agagcaccga cgagaatgtc atgcttctga ctagcgacgc ccctgaatac 5040
aagccttggg ctctggtcat acaggatagc aacggtgaga acaagattaa gatgctctct 5100
ggtggttctc ccaagaagaa gaggaaagtc taagacgtct aa 5142
<210> 2
<211> 5214
<212> DNA
<213> Artificial Sequence
<220>
<223> APOBEC1 XTEN nCas9(D10A) UGI NLS construct codon optimized
<400> 2
atgccaaaga agaagaggaa ggtttcatcg gagaccggcc ctgttgctgt tgaccccacc 60
ctgcggcgga gaatcgagcc acacgagttc gaggtgttct tcgacccaag ggagctccgc 120
aaggaaacgt gcctcctgta cgagatcaac tggggcggca ggcactccat ctggaggcac 180
accagccaaa acaccaacaa gcacgtggag gtcaacttca tcgagaagtt caccaccgag 240
aggtacttct gcccaaacac ccgctgctcc atcacctggt tcctgtcctg gagcccatgc 300
ggcgagtgct ccagggccat caccgagttc ctcagccgct acccacacgt caccctgttc 360
atctacatcg ccaggctcta ccaccacgcc gacccaagga acaggcaggg cctccgcgac 420
ctgatctcca gcggcgtgac catccaaatc atgaccgagc aggagtccgg ctactgctgg 480
aggaacttcg tcaactactc cccaagcaac gaggcccact ggccaaggta cccacacctc 540
tgggtgcgcc tctacgtgct cgagctgtac tgcatcatcc tcggcctgcc accatgcctc 600
aacatcctga ggcgcaagca accacagctg accttcttca ccatcgccct ccaaagctgc 660
cactaccaga ggctcccacc acacatcctg tgggctaccg gcctcaagtc cggcagcgaa 720
acgccaggca cctccgagag cgctacgcct gaacttaagg acaagaagta ctcgatcggc 780
ctcgccatcg ggacgaactc agttggctgg gccgtgatca ccgacgagta caaggtgccc 840
tctaagaagt tcaaggtcct ggggaacacc gaccgccatt ccatcaagaa gaacctcatc 900
ggcgctctcc tgttcgacag cggggagacc gctgaggcta cgaggctcaa gagaaccgct 960
aggcgccggt acacgagaag gaagaacagg atctgctacc tccaagagat tttctccaac 1020
gagatggcca aggttgacga ttcattcttc caccgcctgg aggagtcttt cctcgtggag 1080
gaggataaga agcacgagcg gcatcccatc ttcggcaaca tcgtggacga ggttgcctac 1140
cacgagaagt accctacgat ctaccatctg cggaagaagc tcgtggactc caccgataag 1200
gcggacctca gactgatcta cctcgctctg gcccacatga tcaagttccg cggccatttc 1260
ctgatcgagg gggatctcaa cccagacaac agcgatgttg acaagctgtt catccaactc 1320
gtgcagacct acaaccaact cttcgaggag aacccgatca acgcctctgg cgtggacgcg 1380
aaggctatcc tgtccgcgag gctctcgaag tccaggaggc tggagaacct gatcgctcag 1440
ctcccaggcg agaagaagaa cggcctgttc gggaacctca tcgctctcag cctggggctc 1500
accccgaact tcaagtcgaa cttcgatctc gctgaggacg ccaagctgca actctccaag 1560
gacacctacg acgatgacct cgataacctc ctggcccaga tcggcgatca atacgcggac 1620
ctgttcctcg ctgccaagaa cctgtcggac gccatcctcc tgtcagatat cctccgcgtg 1680
aacaccgaga tcacgaaggc tccactctct gcctccatga tcaagcgcta cgacgagcac 1740
catcaggatc tgaccctcct gaaggcgctg gtccgccaac agctcccgga gaagtacaag 1800
gagattttct tcgatcagtc gaagaacggc tacgctgggt acatcgacgg cggggcctca 1860
caagaggagt tctacaagtt catcaagcca atcctggaga agatggacgg cacggaggag 1920
ctcctggtga agctcaacag ggaggacctc ctgcggaagc agagaacctt cgataacggc 1980
agcatccccc accaaatcca tctcggggag ctgcacgcca tcctgagaag gcaagaggac 2040
ttctaccctt tcctcaagga taaccgggag aagatcgaga agatcctgac cttcagaatc 2100
ccatactacg tcggccctct cgcgcggggg aactcaagat tcgcttggat gacccgcaag 2160
tctgaggaga ccatcacgcc gtggaacttc gaggaggtgg tggacaaggg cgctagcgct 2220
cagtcgttca tcgagaggat gaccaacttc gacaagaacc tgcccaacga gaaggtgctc 2280
cctaagcact cgctcctgta cgagtacttc accgtctaca acgagctcac gaaggtgaag 2340
tacgtcaccg agggcatgcg caagccagcg ttcctgtccg gggagcagaa gaaggctatc 2400
gtggacctcc tgttcaagac caaccggaag gtcacggtta agcaactcaa ggaggactac 2460
ttcaagaaga tcgagtgctt cgattcggtc gagatcagcg gcgttgagga ccgcttcaac 2520
gccagcctcg ggacctacca cgatctcctg aagatcatca aggataagga cttcctggac 2580
aacgaggaga acgaggatat cctggaggac atcgtgctga ccctcacgct gttcgaggac 2640
agggagatga tcgaggagcg cctgaagacg tacgcccatc tcttcgatga caaggtcatg 2700
aagcaactca agcgccggag atacaccggc tgggggaggc tgtcccgcaa gctcatcaac 2760
ggcatccggg acaagcagtc cgggaagacc atcctcgact tcctcaagag cgatggcttc 2820
gccaacagga acttcatgca actgatccac gatgacagcc tcaccttcaa ggaggatatc 2880
caaaaggctc aagtgagcgg ccagggggac tcgctgcacg agcatatcgc gaacctcgct 2940
ggctcccccg cgatcaagaa gggcatcctc cagaccgtga aggttgtgga cgagctcgtg 3000
aaggtcatgg gccggcacaa gcctgagaac atcgtcatcg agatggccag agagaaccaa 3060
accacgcaga aggggcaaaa gaactctagg gagcgcatga agcgcatcga ggagggcatc 3120
aaggagctgg ggtcccaaat cctcaaggag cacccagtgg agaacaccca actgcagaac 3180
gagaagctct acctgtacta cctccagaac ggcagggata tgtacgtgga ccaagagctg 3240
gatatcaacc gcctcagcga ttacgatgtc gatcatatcg ttccccagtc tttcctgaag 3300
gatgactcca tcgacaacaa ggtcctcacc aggtcggaca agaaccgcgg caagtcagat 3360
aacgttccat ctgaggaggt cgttaagaag atgaagaact actggaggca gctcctgaac 3420
gccaagctga tcacgcaaag gaagttcgac aacctcacca aggctgagag aggcgggctc 3480
tcagagctgg acaaggccgg cttcatcaag cggcagctgg tcgagaccag acaaatcacg 3540
aagcacgttg cgcaaatcct cgactctcgg atgaacacga agtacgatga gaacgacaag 3600
ctgatcaggg aggttaaggt gatcaccctg aagtctaagc tcgtttccga cttcaggaag 3660
gatttccagt tctacaaggt tcgcgagatc aacaactacc accatgccca tgacgcttac 3720
ctcaacgctg tggtcggcac cgctctgatc aagaagtacc caaagctgga gtccgagttc 3780
gtgtacgggg actacaaggt ttacgatgtg cgcaagatga tcgccaagtc ggagcaagag 3840
atcggcaagg ctaccgccaa gtacttcttc tactcaaaca tcatgaactt cttcaagacc 3900
gagatcacgc tggccaacgg cgagatccgg aagagaccgc tcatcgagac caacggcgaa 3960
acgggggaga tcgtgtggga caagggcagg gatttcgcga ccgtccgcaa ggttctctcc 4020
atgccccagg tgaacatcgt caagaagacc gaggtccaaa cgggcgggtt ctcaaaggag 4080
tctatcctgc ctaagcggaa cagcgacaag ctcatcgcca gaaagaagga ctgggaccca 4140
aagaagtacg gcgggttcga cagccctacc gtggcctact cggtcctggt tgtggcgaag 4200
gttgagaagg gcaagtccaa gaagctcaag agcgtgaagg agctcctggg gatcaccatc 4260
atggagaggt ccagcttcga gaagaaccca atcgacttcc tggaggccaa gggctacaag 4320
gaggtgaaga aggacctgat catcaagctc ccgaagtact ctctcttcga gctggagaac 4380
ggcaggaaga gaatgctggc ttccgctggc gagctccaga aggggaacga gctcgcgctg 4440
ccaagcaagt acgtgaactt cctctacctg gcttcccact acgagaagct caagggcagc 4500
ccggaggaca acgagcaaaa gcagctgttc gtcgagcagc acaagcatta cctcgacgag 4560
atcatcgagc aaatctccga gttcagcaag cgcgtgatcc tcgccgacgc gaacctggat 4620
aaggtcctct ccgcctacaa caagcaccgg gacaagccca tcagagagca agcggagaac 4680
atcatccatc tcttcaccct gacgaacctc ggcgctcctg ctgctttcaa gtacttcgac 4740
accacgatcg atcggaagag atacacctcc acgaaggagg tcctggacgc gaccctcatc 4800
caccagtcga tcaccggcct gtacgaaacg aggatcgacc tctcacaact cggcggggat 4860
aagagacccg cagcaaccaa gaaggcaggg caagcaaaga agaagaagac gcgtgactcc 4920
ggcggcagca ccaacctgtc cgacatcatc gagaaggaaa cgggcaagca actcgtgatc 4980
caggagagca tcctcatgct gccagaggag gtggaggagg tcatcggcaa caagccagag 5040
tccgacatcc tggtgcacac cgcctacgac gagtccaccg acgagaacgt catgctcctg 5100
accagcgacg ccccagagta caagccatgg gccctcgtca tccaggacag caacggggag 5160
aacaagatca agatgctgtc gggggggagc ccaaagaaga agcggaaggt gtag 5214
<210> 3
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer sequence
<400> 3
caggtgccgc gacgcatgat 20
<210> 4
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer sequence
<400> 4
cacgggacag gtgccgcgac g 21
<210> 5
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer sequence
<400> 5
gggacaggtg ccgcgacgca 20
<210> 6
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer sequence
<400> 6
gccccaccac tagggatcat 20
<210> 7
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer sequence
<400> 7
atcaccagca tagacacctt 20
<210> 8
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer sequence
<400> 8
aggatcacca gcatagacac c 21
<210> 9
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer sequence
<400> 9
cttagaagga tcaccagcat 20
<210> 10
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer sequence
<400> 10
ctgagcagaa aggctcaatg 20
<210> 11
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer sequence
<400> 11
ataagcacct gagcagaaag g 21
<210> 12
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer sequence
<400> 12
cctttctgct caggtgctta t 21
<210> 13
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer sequence
<400> 13
acctgagcag aaaggctcaa 20
<210> 14
<211> 4047
<212> DNA
<213> Artificial Sequence
<220>
<223> APOBEC1 XTEN linker CasX1 UGI NLS codon optimized
<400> 14
atgccaaaga agaagaggaa ggtttcatcg gagaccggcc ctgttgctgt tgaccccacc 60
ctgcggcgga gaatcgagcc acacgagttc gaggtgttct tcgacccaag ggagctccgc 120
aaggaaacgt gcctcctgta cgagatcaac tggggcggca ggcactccat ctggaggcac 180
accagccaaa acaccaacaa gcacgtggag gtcaacttca tcgagaagtt caccaccgag 240
aggtacttct gcccaaacac ccgctgctcc atcacctggt tcctgtcctg gagcccatgc 300
ggcgagtgct ccagggccat caccgagttc ctcagccgct acccacacgt caccctgttc 360
atctacatcg ccaggctcta ccaccacgcc gacccaagga acaggcaggg cctccgcgac 420
ctgatctcca gcggcgtgac catccaaatc atgaccgagc aggagtccgg ctactgctgg 480
aggaacttcg tcaactactc cccaagcaac gaggcccact ggccaaggta cccacacctc 540
tgggtgcgcc tctacgtgct cgagctgtac tgcatcatcc tcggcctgcc accatgcctc 600
aacatcctga ggcgcaagca accacagctg accttcttca ccatcgccct ccaaagctgc 660
cactaccaga ggctcccacc acacatcctg tgggctaccg gcctcaagtc cggcagcgaa 720
acgccaggca cctccgagag cgctacgcct gaacttaagg agaagagaat taacaagatc 780
agaaaaaaat tgagcgccga caatgcgact aaaccagttt ccagaagcgg ccctatgaaa 840
acgctcctcg tgcgggtcat gacagatgac cttaaaaaac gccttgagaa gcgcagaaag 900
aaaccggaag tgatgcctca agttatttcc aataatgccg ccaataacct ccgcatgctt 960
ttggatgact acaccaaaat gaaggaagcg atacttcaag tttactggca agagttcaaa 1020
gatgatcacg ttggtcttat gtgtaaattt gcccaaccgg cctctaagaa gatagatcag 1080
aacaagctga agccagagat ggacgagaag ggaaatctca cgactgcggg cttcgcgtgc 1140
tcgcaatgtg gtcagcctct ctttgtgtat aaacttgagc aagtctcaga gaaggggaaa 1200
gcatatacga actacttcgg tagatgcaac gtggcagagc atgaaaaact tattttgctc 1260
gctcagctga aaccggagaa agactcggac gaagcagtta cttatagcct tggcaaattt 1320
ggccaaaggg cactcgactt ctatagcatc cacgtgacga aggaatctac gcatccagtg 1380
aaaccattgg cgcagattgc aggaaatcgc tatgcgtcgg gaccggtggg caaggccctt 1440
tcggatgcct gtatgggtac gatagcttcc tttttgtcaa agtaccaaga tataattatc 1500
gaacaccaaa aggtcgtcaa ggggaatcaa aagagattgg aaagtttgag ggagctcgct 1560
ggcaaggaga atctcgaata tccatcagtc acgctccctc cgcagccaca taccaaggaa 1620
ggggttgacg cttataatga ggttatcgcg cgggtccgca tgtgggtcaa cttgaatctt 1680
tggcaaaaac tcaaactgtc cagagatgat gcaaagcctt tgctcaggtt gaagggcttc 1740
ccttcgttcc cagtcgttga aaggagagaa aacgaagtcg attggtggaa cactatcaat 1800
gaagtgaaaa agctcattga tgctaagaga gacatgggta gggtcttttg gtctggagtt 1860
accgcagaaa agcggaatac tattctggaa ggctacaact atcttcccaa cgaaaacgac 1920
cacaagaaaa gggaggggag cctcgaaaat cccaaaaaac cggcgaaacg ccaatttggg 1980
gatctgcttc tttatctgga gaagaagtat gcaggcgact ggggaaaagt gtttgacgag 2040
gcttgggagc gcatcgacaa aaagatcgct ggcctcacat cacacataga aagggaggag 2100
gcaaggaatg cagaagatgc gcagagcaaa gcagttctta cggattggtt gcgcgctaag 2160
gcttcctttg ttttggagcg cttgaaggaa atggacgaaa aggaatttta tgcgtgcgaa 2220
atccagctgc aaaaatggta tggtgatttg agggggaacc ccttcgctgt ggaagccgaa 2280
aaccgggtcg tggacatatc cgggttttcc atagggtcgg acggtcactc cattcaatac 2340
cggaatttgc ttgcatggaa atatcttgag aacggtaagc gggagtttta tttgctgatg 2400
aactacggaa aaaagggtcg cattaggttc actgatggca cagatattaa aaaaagcggt 2460
aagtggcaag gtcttctgta cggcggagga aaggcgaagg ttatcgactt gacctttgac 2520
ccagacgatg agcagttgat tattttgcct ttggcattcg gtacaagaca agggagggaa 2580
ttcatctgga acgatctgct ctcccttgaa acgggtctca tcaagctggc taacggcaga 2640
gtcatagaga aaaccatata taataagaag attggtagag atgagccggc tctttttgtg 2700
gcgctcactt tcgagaggcg cgaggtcgtt gacccgtcca acatcaagcc cgttaacctg 2760
atcggtgttg ataggggaga aaacataccg gcggtgatag cacttaccga cccagaggga 2820
tgccccctcc cagaattcaa agattcttcg gggggaccaa ctgacattct caggataggt 2880
gagggctata aggagaagca gcgcgctatc caagcggcga aggaagtcga gcaacggaga 2940
gcggggggct attctcggaa attcgcatcg aaaagccgga atcttgccga cgacatggtc 3000
aggaactcag ccagggacct cttctatcac gcggttacgc acgacgccgt tcttgttttt 3060
gaaaatctct cgcggggttt tggacggcaa ggtaagcgga cctttatgac ggaaagacag 3120
tacaccaaaa tggaagattg gctcaccgcg aagctcgcgt acgaggggct tacatctaaa 3180
acgtacttgt ccaaaacact cgcccagtac actagcaaaa cgtgttctaa ctgcggcttt 3240
acgatcacta ccgcggacta cgacggcatg ctcgtcaggc tcaagaaaac gtctgacgga 3300
tgggcaacca cacttaacaa taaagagctc aaggctgaag gtcagatcac atattataat 3360
agatataaga ggcagaccgt ggagaaggag ctgtcagctg agcttgacag gttgtctgag 3420
gagtccggca acaacgatat ttctaagtgg acaaaaggac ggagagatga agcattgttt 3480
ctgctcaaaa agcggttctc gcacaggccc gttcaggagc agtttgtttg tcttgattgc 3540
ggtcacgagg tccacgcgga tgagcaggcc gctctcaata tagcgaggag ctggttgttt 3600
ttgaactcta attccacaga attcaaaagc tataagtccg ggaagcaacc gttcgtgggc 3660
gcttggcaag ccttttataa gcgcaggctc aaggaggttt ggaaaccaaa cgctaaacgc 3720
cccgcggcta caaagaaggc tggccaggca aagaagaaga agaccaacct gtccgacatc 3780
atcgagaagg aaacgggcaa gcaactcgtg atccaggaga gcatcctcat gctgccagag 3840
gaggtggagg aggtcatcgg caacaagcca gagtccgaca tcctggtgca caccgcctac 3900
gacgagtcca ccgacgagaa cgtcatgctc ctgaccagcg acgccccaga gtacaagcca 3960
tgggccctcg tcatccagga cagcaacggg gagaacaaga tcaagatgct gtcggggggg 4020
agcccaaaga agaagcggaa ggtgtag 4047
<210> 15
<211> 4962
<212> DNA
<213> Artificial Sequence
<220>
<223> APOBEC1 XTEN linker AsCpf1(R1226A) UGI NLS codon optimized
<400> 15
atgccaaaga agaagaggaa ggtttcatcg gagaccggcc ctgttgctgt tgaccccacc 60
ctgcggcgga gaatcgagcc acacgagttc gaggtgttct tcgacccaag ggagctccgc 120
aaggaaacgt gcctcctgta cgagatcaac tggggcggca ggcactccat ctggaggcac 180
accagccaaa acaccaacaa gcacgtggag gtcaacttca tcgagaagtt caccaccgag 240
aggtacttct gcccaaacac ccgctgctcc atcacctggt tcctgtcctg gagcccatgc 300
ggcgagtgct ccagggccat caccgagttc ctcagccgct acccacacgt caccctgttc 360
atctacatcg ccaggctcta ccaccacgcc gacccaagga acaggcaggg cctccgcgac 420
ctgatctcca gcggcgtgac catccaaatc atgaccgagc aggagtccgg ctactgctgg 480
aggaacttcg tcaactactc cccaagcaac gaggcccact ggccaaggta cccacacctc 540
tgggtgcgcc tctacgtgct cgagctgtac tgcatcatcc tcggcctgcc accatgcctc 600
aacatcctga ggcgcaagca accacagctg accttcttca ccatcgccct ccaaagctgc 660
cactaccaga ggctcccacc acacatcctg tgggctaccg gcctcaagtc cggcagcgaa 720
acgccaggca cctccgagag cgctacgcct gaacttaaga cccaatttga gggatttacg 780
aatctttatc aagtttcaaa gacgcttagg tttgagctca ttccacaagg aaaaaccttg 840
aagcacattc aagagcaggg ctttatcgag gaagacaagg cacggaatga ccattataaa 900
gaattgaaac ccataatcga tcgcatatac aaaacttatg ccgaccaatg cttgcagctt 960
gtccaactcg actgggaaaa tctctcggct gcgatagact cttacaggaa ggaaaagaca 1020
gaagaaacaa gaaacgccct cattgaagag caggctacgt atagaaatgc tattcacgac 1080
tatttcattg gcagaacaga taacttgacg gacgccataa acaaaagaca tgcggagatc 1140
tacaagggat tgttcaaagc ggagcttttc aacggaaaag ttctcaagca gcttggcacg 1200
gtcaccacta ccgaacacga aaacgccttg ttgaggagct tcgataagtt cacgacatat 1260
ttctctggtt tctatgagaa tcggaagaat gtcttctctg cagaagacat ttcaaccgca 1320
atcccacacc ggattgtgca agataacttt ccgaaattta aggaaaactg tcacatcttc 1380
actaggttga ttacggctgt tccatctctt agagaacact tcgaaaacgt caaaaaagct 1440
ataggcattt tcgtctcaac gagcatagag gaggtcttct cgttcccttt ctataaccag 1500
cttctcaccc agacacagat tgatctctat aatcaactcc ttggtggtat ttcaagggaa 1560
gccgggacgg agaagattaa ggggttgaat gaagttctca atctggcgat acagaagaat 1620
gacgaaaccg cccatattat agcttccctc ccacatcggt ttataccgtt gttcaagcag 1680
atcctgtcgg accgcaacac gctttctttc atactcgaag agttcaaaag cgacgaggaa 1740
gtcatacaga gcttctgtaa gtataaaaca cttttgagga atgaaaacgt tcttgaaact 1800
gccgaggcct tgtttaacga gctcaacagc atagatctta cgcatatttt tatttcccac 1860
aaaaaattgg aaactataag ctcagcgctg tgtgatcact gggatacgct tcgcaatgcc 1920
ctttatgagc gcaggatcag cgaactgacg gggaagatta cgaaatctgc gaaagagaaa 1980
gttcaaaggt cccttaagca cgaggatatt aatctccaag aaataataag cgcggctggt 2040
aaagaacttt ccgaagcttt caagcaaaag acatccgaaa tactctccca tgcgcatgca 2100
gccctggacc aaccattgcc aacaactttg aagaaacaag aagagaagga aatcctgaag 2160
tcccaactcg actctttgct cggcctctat cacttgcttg attggttcgc ggttgatgag 2220
tccaacgaag ttgaccctga gttcagcgcc aggttgaccg gtataaagtt ggaaatggaa 2280
ccaagcctct cattttacaa caaggcgagg aactacgcga ccaagaaacc atacagcgtc 2340
gaaaagttta agcttaactt tcaaatgcca acgctcgctt ccggttggga tgttaacaaa 2400
gaaaaaaata acggcgccat cttgtttgtt aaaaacggtt tgtattacct cggcatcatg 2460
ccaaaacaaa agggtcggta caaggctctg agcttcgagc caacagagaa aacaagcgaa 2520
ggcttcgaca agatgtatta tgattacttt cccgatgcag ctaaaatgat ccccaagtgc 2580
tcaacacagc ttaaagcggt taccgcccat ttccagactc acacgacccc aattctcttg 2640
tcaaataact ttattgaacc cttggaaata accaaagaga tatatgacct taataacccg 2700
gagaaagaac ccaagaagtt ccagacggcg tacgctaaga aaacaggaga tcagaagggc 2760
tatagggagg ccctttgtaa atggattgac tttacaaggg actttttgtc gaaatatacg 2820
aagaccactt caattgacct ttcgtccctg cggccgtcta gccagtataa agatttgggt 2880
gagtactatg cggaacttaa tcctttgttg taccacatat cttttcaacg gattgcagag 2940
aaggagataa tggatgcggt cgaaacagga aagctctatc tgttccagat ttacaataaa 3000
gattttgcca agggacacca tggaaaacct aacctgcata ctctttactg gacgggtctt 3060
ttctcgccgg aaaatttggc taagacgtct atcaagttga atgggcaggc agaactcttc 3120
tatcgcccta agtctaggat gaaacggatg gctcatcggc tgggtgaaaa aatgctcaac 3180
aaaaagctta aggatcaaaa gacaccaatc ccggacacac tttatcaaga attgtacgat 3240
tacgttaatc acagactctc acatgacctt tcagatgagg cccgcgcttt gcttcccaat 3300
gttattacta aagaggtctc gcatgagatc ataaaagata gaagattcac gtctgataag 3360
ttcttttttc atgtgccaat aactctcaac tatcaggccg caaattcgcc gtccaagttc 3420
aaccaaaggg tgaatgccta cctcaaggag cacccggaga cgccaataat aggtatcgat 3480
cggggcgaac gcaaccttat ttatataaca gttatcgata gcacagggaa aatactggag 3540
cagcggagcc tgaatactat tcaacagttt gactaccaaa agaaactgga caatagagag 3600
aaggagcgcg tcgccgcccg gcaagcttgg tccgtggtcg gaactataaa agatcttaaa 3660
cagggatacc tgtcacaggt catccatgaa atcgtggatc tgatgataca ctatcaagct 3720
gttgtcgtgc tcgaaaactt gaattttgga ttcaaatcga agagaactgg aatcgctgaa 3780
aaagcggtgt accaacagtt cgagaagatg ctcatcgata agcttaattg tttggtgctt 3840
aaggactatc ccgccgaaaa ggttgggggg gtgctgaacc cgtatcagct cacagatcaa 3900
tttacttcat tcgcgaagat gggaacgcag tcaggatttc tgttctacgt tccagcccct 3960
tatacgtcga aaattgaccc tcttacgggg ttcgtggacc cctttgtttg gaaaacgata 4020
aaaaaccacg agtcacgcaa gcactttctc gagggatttg attttcttca ttatgatgtg 4080
aagaccgggg acttcatttt gcactttaag atgaacagga acttgtcttt ccaaaggggc 4140
ttgcctggat tcatgccggc ctgggatatc gtgtttgaaa agaacgaaac acagttcgat 4200
gcgaaaggga cgcccttcat agctggaaag cgcatagttc cagtgattga gaaccacaga 4260
ttcactggtc gctacagaga cctgtatccg gcaaatgaac tgatagcact ccttgaggaa 4320
aagggtatcg tgtttcgcga tggttcaaat attctcccga agcttttgga gaacgacgat 4380
tctcatgcta tagatactat ggtcgctctc atccggtccg tccttcaaat ggccaattcg 4440
aatgcagcga ccggtgagga ttacataaat tcaccagtcc gggaccttaa tggggtttgc 4500
ttcgactcgc gctttcaaaa ccccgaatgg ccaatggacg ccgatgctaa cggtgcctac 4560
catatagcac ttaaaggaca gcttctgttg aatcacctta aagaatcaaa agaccttaag 4620
ctgcagaatg gaatttcaaa tcaggattgg ctcgcgtaca tacaggagct tcgcaatacc 4680
aacctgtccg acatcatcga gaaggaaacg ggcaagcaac tcgtgatcca ggagagcatc 4740
ctcatgctgc cagaggaggt ggaggaggtc atcggcaaca agccagagtc cgacatcctg 4800
gtgcacaccg cctacgacga gtccaccgac gagaacgtca tgctcctgac cagcgacgcc 4860
ccagagtaca agccatgggc cctcgtcatc caggacagca acggggagaa caagatcaag 4920
atgctgtcgg gggggagccc aaagaagaag cggaaggtgt ag 4962
<210> 16
<211> 5121
<212> DNA
<213> Artificial Sequence
<220>
<223> NLS dCas9 NLS Linker PmCDA1 UGI construct
<400> 16
atgccaaaga agaagaggaa ggttgacaag aagtactcga tcggcctcgc catcgggacg 60
aactcagttg gctgggccgt gatcaccgac gagtacaagg tgccctctaa gaagttcaag 120
gtcctgggga acaccgaccg ccattccatc aagaagaacc tcatcggcgc tctcctgttc 180
gacagcgggg agaccgctga ggctacgagg ctcaagagaa ccgctaggcg ccggtacacg 240
agaaggaaga acaggatctg ctacctccaa gagattttct ccaacgagat ggccaaggtt 300
gacgattcat tcttccaccg cctggaggag tctttcctcg tggaggagga taagaagcac 360
gagcggcatc ccatcttcgg caacatcgtg gacgaggttg cctaccacga gaagtaccct 420
acgatctacc atctgcggaa gaagctcgtg gactccaccg ataaggcgga cctcagactg 480
atctacctcg ctctggccca catgatcaag ttccgcggcc atttcctgat cgagggggat 540
ctcaacccag acaacagcga tgttgacaag ctgttcatcc aactcgtgca gacctacaac 600
caactcttcg aggagaaccc gatcaacgcc tctggcgtgg acgcgaaggc tatcctgtcc 660
gcgaggctct cgaagtccag gaggctggag aacctgatcg ctcagctccc aggcgagaag 720
aagaacggcc tgttcgggaa cctcatcgct ctcagcctgg ggctcacccc gaacttcaag 780
tcgaacttcg atctcgctga ggacgccaag ctgcaactct ccaaggacac ctacgacgat 840
gacctcgata acctcctggc ccagatcggc gatcaatacg cggacctgtt cctcgctgcc 900
aagaacctgt cggacgccat cctcctgtca gatatcctcc gcgtgaacac cgagatcacg 960
aaggctccac tctctgcctc catgatcaag cgctacgacg agcaccatca ggatctgacc 1020
ctcctgaagg cgctggtccg ccaacagctc ccggagaagt acaaggagat tttcttcgat 1080
cagtcgaaga acggctacgc tgggtacatc gacggcgggg cctcacaaga ggagttctac 1140
aagttcatca agccaatcct ggagaagatg gacggcacgg aggagctcct ggtgaagctc 1200
aacagggagg acctcctgcg gaagcagaga accttcgata acggcagcat cccccaccaa 1260
atccatctcg gggagctgca cgccatcctg agaaggcaag aggacttcta ccctttcctc 1320
aaggataacc gggagaagat cgagaagatc ctgaccttca gaatcccata ctacgtcggc 1380
cctctcgcgc gggggaactc aagattcgct tggatgaccc gcaagtctga ggagaccatc 1440
acgccgtgga acttcgagga ggtggtggac aagggcgcta gcgctcagtc gttcatcgag 1500
aggatgacca acttcgacaa gaacctgccc aacgagaagg tgctccctaa gcactcgctc 1560
ctgtacgagt acttcaccgt ctacaacgag ctcacgaagg tgaagtacgt caccgagggc 1620
atgcgcaagc cagcgttcct gtccggggag cagaagaagg ctatcgtgga cctcctgttc 1680
aagaccaacc ggaaggtcac ggttaagcaa ctcaaggagg actacttcaa gaagatcgag 1740
tgcttcgatt cggtcgagat cagcggcgtt gaggaccgct tcaacgccag cctcgggacc 1800
taccacgatc tcctgaagat catcaaggat aaggacttcc tggacaacga ggagaacgag 1860
gatatcctgg aggacatcgt gctgaccctc acgctgttcg aggacaggga gatgatcgag 1920
gagcgcctga agacgtacgc ccatctcttc gatgacaagg tcatgaagca actcaagcgc 1980
cggagataca ccggctgggg gaggctgtcc cgcaagctca tcaacggcat ccgggacaag 2040
cagtccggga agaccatcct cgacttcctc aagagcgatg gcttcgccaa caggaacttc 2100
atgcaactga tccacgatga cagcctcacc ttcaaggagg atatccaaaa ggctcaagtg 2160
agcggccagg gggactcgct gcacgagcat atcgcgaacc tcgctggctc ccccgcgatc 2220
aagaagggca tcctccagac cgtgaaggtt gtggacgagc tcgtgaaggt catgggccgg 2280
cacaagcctg agaacatcgt catcgagatg gccagagaga accaaaccac gcagaagggg 2340
caaaagaact ctagggagcg catgaagcgc atcgaggagg gcatcaagga gctggggtcc 2400
caaatcctca aggagcaccc agtggagaac acccaactgc agaacgagaa gctctacctg 2460
tactacctcc agaacggcag ggatatgtac gtggaccaag agctggatat caaccgcctc 2520
agcgattacg atgtcgatca tatcgttccc cagtctttcc tgaaggatga ctccatcgac 2580
aacaaggtcc tcaccaggtc ggacaagaac cgcggcaagt cagataacgt tccatctgag 2640
gaggtcgtta agaagatgaa gaactactgg aggcagctcc tgaacgccaa gctgatcacg 2700
caaaggaagt tcgacaacct caccaaggct gagagaggcg ggctctcaga gctggacaag 2760
gccggcttca tcaagcggca gctggtcgag accagacaaa tcacgaagca cgttgcgcaa 2820
atcctcgact ctcggatgaa cacgaagtac gatgagaacg acaagctgat cagggaggtt 2880
aaggtgatca ccctgaagtc taagctcgtt tccgacttca ggaaggattt ccagttctac 2940
aaggttcgcg agatcaacaa ctaccaccat gcccatgacg cttacctcaa cgctgtggtc 3000
ggcaccgctc tgatcaagaa gtacccaaag ctggagtccg agttcgtgta cggggactac 3060
aaggtttacg atgtgcgcaa gatgatcgcc aagtcggagc aagagatcgg caaggctacc 3120
gccaagtact tcttctactc aaacatcatg aacttcttca agaccgagat cacgctggcc 3180
aacggcgaga tccggaagag accgctcatc gagaccaacg gcgaaacggg ggagatcgtg 3240
tgggacaagg gcagggattt cgcgaccgtc cgcaaggttc tctccatgcc ccaggtgaac 3300
atcgtcaaga agaccgaggt ccaaacgggc gggttctcaa aggagtctat cctgcctaag 3360
cggaacagcg acaagctcat cgccagaaag aaggactggg acccaaagaa gtacggcggg 3420
ttcgacagcc ctaccgtggc ctactcggtc ctggttgtgg cgaaggttga gaagggcaag 3480
tccaagaagc tcaagagcgt gaaggagctc ctggggatca ccatcatgga gaggtccagc 3540
ttcgagaaga acccaatcga cttcctggag gccaagggct acaaggaggt gaagaaggac 3600
ctgatcatca agctcccgaa gtactctctc ttcgagctgg agaacggcag gaagagaatg 3660
ctggcttccg ctggcgagct ccagaagggg aacgagctcg cgctgccaag caagtacgtg 3720
aacttcctct acctggcttc ccactacgag aagctcaagg gcagcccgga ggacaacgag 3780
caaaagcagc tgttcgtcga gcagcacaag cattacctcg acgagatcat cgagcaaatc 3840
tccgagttca gcaagcgcgt gatcctcgcc gacgcgaacc tggataaggt cctctccgcc 3900
tacaacaagc accgggacaa gcccatcaga gagcaagcgg agaacatcat ccatctcttc 3960
accctgacga acctcggcgc tcctgctgct ttcaagtact tcgacaccac gatcgatcgg 4020
aagagataca cctccacgaa ggaggtcctg gacgcgaccc tcatccacca gtcgatcacc 4080
ggcctgtacg aaacgaggat cgacctctca caactcggcg gggataagag acccgcagca 4140
accaagaagg cagggcaagc aaagaagaag aagacgcgtg actccggcgg cagcccaaag 4200
aagaagagga aggttggtgg aggaggttct ggaggtggag gttctatgac cgacgctgag 4260
tacgtgagaa tccatgagaa gttggacatc tacacgttta agaaacagtt tttcaacaac 4320
aaaaaatccg tgtcgcatag atgctacgtt ctctttgaat taaaacgacg gggtgaacgt 4380
agagcgtgtt tttggggcta tgctgtgaat aaaccacaga gcgggacaga acgtggcatt 4440
cacgccgaaa tctttagcat tagaaaagtc gaagaatacc tgcgcgacaa ccccggacaa 4500
ttcacgataa attggtactc atcctggagt ccttgtgcag attgcgctga aaagatctta 4560
gaatggtata accaggagct gcgggggaac ggccacactt tgaaaatctg ggcttgcaaa 4620
ctctattacg agaaaaatgc gaggaatcaa attgggctgt ggaacctcag agataacggg 4680
gttgggttga atgtaatggt aagtgaacac taccaatgtt gcaggaaaat attcatccaa 4740
tcgtcgcaca atcaattgaa tgagaataga tggcttgaga agactttgaa gcgagctgaa 4800
aaacgacgga gcgagttgtc cattatgatt caggtaaaaa tactccacac cactaagagt 4860
cctgctgtta ccaacctgtc cgacatcatc gagaaggaaa cgggcaagca actcgtgatc 4920
caggagagca tcctcatgct gccagaggag gtggaggagg tcatcggcaa caagccagag 4980
tccgacatcc tggtgcacac cgcctacgac gagtccaccg acgagaacgt catgctcctg 5040
accagcgacg ccccagagta caagccatgg gccctcgtca tccaggacag caacggggag 5100
aacaagatca agatgctgtg a 5121
<210> 17
<211> 4101
<212> DNA
<213> Artificial Sequence
<220>
<223> nCas9 (D10A)
<400> 17
gataaaaagt attctattgg tttagccatc ggcactaatt ccgttggatg ggctgtcata 60
accgatgaat acaaagtacc ttcaaagaaa tttaaggtgt tggggaacac agaccgtcat 120
tcgattaaaa agaatcttat cggtgccctc ctattcgata gtggcgaaac ggcagaggcg 180
actcgcctga aacgaaccgc tcggagaagg tatacacgtc gcaagaaccg aatatgttac 240
ttacaagaaa tttttagcaa tgagatggcc aaagttgacg attctttctt tcaccgtttg 300
gaagagtcct tccttgtcga agaggacaag aaacatgaac ggcaccccat ctttggaaac 360
atagtagatg aggtggcata tcatgaaaag tacccaacga tttatcacct cagaaaaaag 420
ctagttgact caactgataa agcggacctg aggttaatct acttggctct tgcccatatg 480
ataaagttcc gtgggcactt tctcattgag ggtgatctaa atccggacaa ctcggatgtc 540
gacaaactgt tcatccagtt agtacaaacc tataatcagt tgtttgaaga gaaccctata 600
aatgcaagtg gcgtggatgc gaaggctatt cttagcgccc gcctctctaa atcccgacgg 660
ctagaaaacc tgatcgcaca attacccgga gagaagaaaa atgggttgtt cggtaacctt 720
atagcgctct cactaggcct gacaccaaat tttaagtcga acttcgactt agctgaagat 780
gccaaattgc agcttagtaa ggacacgtac gatgacgatc tcgacaatct actggcacaa 840
attggagatc agtatgcgga cttatttttg gctgccaaaa accttagcga tgcaatcctc 900
ctatctgaca tactgagagt taatactgag attaccaagg cgccgttatc cgcttcaatg 960
atcaaaaggt acgatgaaca tcaccaagac ttgacacttc tcaaggccct agtccgtcag 1020
caactgcctg agaaatataa ggaaatattc tttgatcagt cgaaaaacgg gtacgcaggt 1080
tatattgacg gcggagcgag tcaagaggaa ttctacaagt ttatcaaacc catattagag 1140
aagatggatg ggacggaaga gttgcttgta aaactcaatc gcgaagatct actgcgaaag 1200
cagcggactt tcgacaacgg tagcattcca catcaaatcc acttaggcga attgcatgct 1260
atacttagaa ggcaggagga tttttatccg ttcctcaaag acaatcgtga aaagattgag 1320
aaaatcctaa cctttcgcat accttactat gtgggacccc tggcccgagg gaactctcgg 1380
ttcgcatgga tgacaagaaa gtccgaagaa acgattactc catggaattt tgaggaagtt 1440
gtcgataaag gtgcgtcagc tcaatcgttc atcgagagga tgaccaactt tgacaagaat 1500
ttaccgaacg aaaaagtatt gcctaagcac agtttacttt acgagtattt cacagtgtac 1560
aatgaactca cgaaagttaa gtatgtcact gagggcatgc gtaaacccgc ctttctaagc 1620
ggagaacaga agaaagcaat agtagatctg ttattcaaga ccaaccgcaa agtgacagtt 1680
aagcaattga aagaggacta ctttaagaaa attgaatgct tcgattctgt cgagatctcc 1740
ggggtagaag atcgatttaa tgcgtcactt ggtacgtatc atgacctcct aaagataatt 1800
aaagataagg acttcctgga taacgaagag aatgaagata tcttagaaga tatagtgttg 1860
actcttaccc tctttgaaga tcgggaaatg attgaggaaa gactaaaaac atacgctcac 1920
ctgttcgacg ataaggttat gaaacagtta aagaggcgtc gctatacggg ctggggacga 1980
ttgtcgcgga aacttatcaa cgggataaga gacaagcaaa gtggtaaaac tattctcgat 2040
tttctaaaga gcgacggctt cgccaatagg aactttatgc agctgatcca tgatgactct 2100
ttaaccttca aagaggatat acaaaaggca caggtttccg gacaagggga ctcattgcac 2160
gaacatattg cgaatcttgc tggttcgcca gccatcaaaa agggcatact ccagacagtc 2220
aaagtagtgg atgagctagt taaggtcatg ggacgtcaca aaccggaaaa cattgtaatc 2280
gagatggcac gcgaaaatca aacgactcag aaggggcaaa aaaacagtcg agagcggatg 2340
aagagaatag aagagggtat taaagaactg ggcagccaga tcttaaagga gcatcctgtg 2400
gaaaataccc aattgcagaa cgagaaactt tacctctatt acctacaaaa tggaagggac 2460
atgtatgttg atcaggaact ggacataaac cgtttatctg attacgacgt cgatcacatt 2520
gtaccccaat cctttttgaa ggacgattca atcgacaata aagtgcttac acgctcggat 2580
aagaaccgag ggaaaagtga caatgttcca agcgaggaag tcgtaaagaa aatgaagaac 2640
tattggcggc agctcctaaa tgcgaaactg ataacgcaaa gaaagttcga taacttaact 2700
aaagctgaga ggggtggctt gtctgaactt gacaaggccg gatttattaa acgtcagctc 2760
gtggaaaccc gccaaatcac aaagcatgtt gcacagatac tagattcccg aatgaatacg 2820
aaatacgacg agaacgataa gctgattcgg gaagtcaaag taatcacttt aaagtcaaaa 2880
ttggtgtcgg acttcagaaa ggattttcaa ttctataaag ttagggagat aaataactac 2940
caccatgcgc acgacgctta tcttaatgcc gtcgtaggga ccgcactcat taagaaatac 3000
ccgaagctag aaagtgagtt tgtgtatggt gattacaaag tttatgacgt ccgtaagatg 3060
atcgcgaaaa gcgaacagga gataggcaag gctacagcca aatacttctt ttattctaac 3120
attatgaatt tctttaagac ggaaatcact ctggcaaacg gagagatacg caaacgacct 3180
ttaattgaaa ccaatgggga gacaggtgaa atcgtatggg ataagggccg ggacttcgcg 3240
acggtgagaa aagttttgtc catgccccaa gtcaacatag taaagaaaac tgaggtgcag 3300
accggagggt tttcaaagga atcgattctt ccaaaaagga atagtgataa gctcatcgct 3360
cgtaaaaagg actgggaccc gaaaaagtac ggtggcttcg atagccctac agttgcctat 3420
tctgtcctag tagtggcaaa agttgagaag ggaaaatcca agaaactgaa gtcagtcaaa 3480
gaattattgg ggataacgat tatggagcgc tcgtcttttg aaaagaaccc catcgacttc 3540
cttgaggcga aaggttacaa ggaagtaaaa aaggatctca taattaaact accaaagtat 3600
agtctgtttg agttagaaaa tggccgaaaa cggatgttgg ctagcgccgg agagcttcaa 3660
aaggggaacg aactcgcact accgtctaaa tacgtgaatt tcctgtattt agcgtcccat 3720
tacgagaagt tgaaaggttc acctgaagat aacgaacaga agcaactttt tgttgagcag 3780
cacaaacatt atctcgacga aatcatagag caaatttcgg aattcagtaa gagagtcatc 3840
ctagctgatg ccaatctgga caaagtatta agcgcataca acaagcacag ggataaaccc 3900
atacgtgagc aggcggaaaa tattatccat ttgtttactc ttaccaacct cggcgctcca 3960
gccgcattca agtattttga cacaacgata gatcgcaaac gatacacttc taccaaggag 4020
gtgctagacg cgacactgat tcaccaatcc atcacgggat tatatgaaac tcggatagat 4080
ttgtcacagc ttgggggtga c 4101
<210> 18
<211> 3003
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX
<400> 18
gagaagagaa ttaacaagat cagaaaaaaa ttgagcgccg acaatgcgac taaaccagtt 60
tccagaagcg gccctatgaa aacgctcctc gtgcgggtca tgacagatga ccttaaaaaa 120
cgccttgaga agcgcagaaa gaaaccggaa gtgatgcctc aagttatttc caataatgcc 180
gccaataacc tccgcatgct tttggatgac tacaccaaaa tgaaggaagc gatacttcaa 240
gtttactggc aagagttcaa agatgatcac gttggtctta tgtgtaaatt tgcccaaccg 300
gcctctaaga agatagatca gaacaagctg aagccagaga tggacgagaa gggaaatctc 360
acgactgcgg gcttcgcgtg ctcgcaatgt ggtcagcctc tctttgtgta taaacttgag 420
caagtctcag agaaggggaa agcatatacg aactacttcg gtagatgcaa cgtggcagag 480
catgaaaaac ttattttgct cgctcagctg aaaccggaga aagactcgga cgaagcagtt 540
acttatagcc ttggcaaatt tggccaaagg gcactcgact tctatagcat ccacgtgacg 600
aaggaatcta cgcatccagt gaaaccattg gcgcagattg caggaaatcg ctatgcgtcg 660
ggaccggtgg gcaaggccct ttcggatgcc tgtatgggta cgatagcttc ctttttgtca 720
aagtaccaag atataattat cgaacaccaa aaggtcgtca aggggaatca aaagagattg 780
gaaagtttga gggagctcgc tggcaaggag aatctcgaat atccatcagt cacgctccct 840
ccgcagccac ataccaagga aggggttgac gcttataatg aggttatcgc gcgggtccgc 900
atgtgggtca acttgaatct ttggcaaaaa ctcaaactgt ccagagatga tgcaaagcct 960
ttgctcaggt tgaagggctt cccttcgttc ccagtcgttg aaaggagaga aaacgaagtc 1020
gattggtgga acactatcaa tgaagtgaaa aagctcattg atgctaagag agacatgggt 1080
agggtctttt ggtctggagt taccgcagaa aagcggaata ctattctgga aggctacaac 1140
tatcttccca acgaaaacga ccacaagaaa agggagggga gcctcgaaaa tcccaaaaaa 1200
ccggcgaaac gccaatttgg ggatctgctt ctttatctgg agaagaagta tgcaggcgac 1260
tggggaaaag tgtttgacga ggcttgggag cgcatcgaca aaaagatcgc tggcctcaca 1320
tcacacatag aaagggagga ggcaaggaat gcagaagatg cgcagagcaa agcagttctt 1380
acggattggt tgcgcgctaa ggcttccttt gttttggagc gcttgaagga aatggacgaa 1440
aaggaatttt atgcgtgcga aatccagctg caaaaatggt atggtgattt gagggggaac 1500
cccttcgctg tggaagccga aaaccgggtc gtggacatat ccgggttttc catagggtcg 1560
gacggtcact ccattcaata ccggaatttg cttgcatgga aatatcttga gaacggtaag 1620
cgggagtttt atttgctgat gaactacgga aaaaagggtc gcattaggtt cactgatggc 1680
acagatatta aaaaaagcgg taagtggcaa ggtcttctgt acggcggagg aaaggcgaag 1740
gttatcgact tgacctttga cccagacgat gagcagttga ttattttgcc tttggcattc 1800
ggtacaagac aagggaggga attcatctgg aacgatctgc tctcccttga aacgggtctc 1860
atcaagctgg ctaacggcag agtcatagag aaaaccatat ataataagaa gattggtaga 1920
gatgagccgg ctctttttgt ggcgctcact ttcgagaggc gcgaggtcgt tgacccgtcc 1980
aacatcaagc ccgttaacct gatcggtgtt gataggggag aaaacatacc ggcggtgata 2040
gcacttaccg acccagaggg atgccccctc ccagaattca aagattcttc ggggggacca 2100
actgacattc tcaggatagg tgagggctat aaggagaagc agcgcgctat ccaagcggcg 2160
aaggaagtcg agcaacggag agcggggggc tattctcgga aattcgcatc gaaaagccgg 2220
aatcttgccg acgacatggt caggaactca gccagggacc tcttctatca cgcggttacg 2280
cacgacgccg ttcttgtttt tgaaaatctc tcgcggggtt ttggacggca aggtaagcgg 2340
acctttatga cggaaagaca gtacaccaaa atggaagatt ggctcaccgc gaagctcgcg 2400
tacgaggggc ttacatctaa aacgtacttg tccaaaacac tcgcccagta cactagcaaa 2460
acgtgttcta actgcggctt tacgatcact accgcggact acgacggcat gctcgtcagg 2520
ctcaagaaaa cgtctgacgg atgggcaacc acacttaaca ataaagagct caaggctgaa 2580
ggtcagatca catattataa tagatataag aggcagaccg tggagaagga gctgtcagct 2640
gagcttgaca ggttgtctga ggagtccggc aacaacgata tttctaagtg gacaaaagga 2700
cggagagatg aagcattgtt tctgctcaaa aagcggttct cgcacaggcc cgttcaggag 2760
cagtttgttt gtcttgattg cggtcacgag gtccacgcgg atgagcaggc cgctctcaat 2820
atagcgagga gctggttgtt tttgaactct aattccacag aattcaaaag ctataagtcc 2880
gggaagcaac cgttcgtggg cgcttggcaa gccttttata agcgcaggct caaggaggtt 2940
tggaaaccaa acgctaaacg ccccgcggct acaaagaagg ctggccaggc aaagaagaag 3000
aag 3003
<210> 19
<211> 3918
<212> DNA
<213> Artificial Sequence
<220>
<223> AsCpf1 (R1226A)
<400> 19
acccaatttg agggatttac gaatctttat caagtttcaa agacgcttag gtttgagctc 60
attccacaag gaaaaacctt gaagcacatt caagagcagg gctttatcga ggaagacaag 120
gcacggaatg accattataa agaattgaaa cccataatcg atcgcatata caaaacttat 180
gccgaccaat gcttgcagct tgtccaactc gactgggaaa atctctcggc tgcgatagac 240
tcttacagga aggaaaagac agaagaaaca agaaacgccc tcattgaaga gcaggctacg 300
tatagaaatg ctattcacga ctatttcatt ggcagaacag ataacttgac ggacgccata 360
aacaaaagac atgcggagat ctacaaggga ttgttcaaag cggagctttt caacggaaaa 420
gttctcaagc agcttggcac ggtcaccact accgaacacg aaaacgcctt gttgaggagc 480
ttcgataagt tcacgacata tttctctggt ttctatgaga atcggaagaa tgtcttctct 540
gcagaagaca tttcaaccgc aatcccacac cggattgtgc aagataactt tccgaaattt 600
aaggaaaact gtcacatctt cactaggttg attacggctg ttccatctct tagagaacac 660
ttcgaaaacg tcaaaaaagc tataggcatt ttcgtctcaa cgagcataga ggaggtcttc 720
tcgttccctt tctataacca gcttctcacc cagacacaga ttgatctcta taatcaactc 780
cttggtggta tttcaaggga agccgggacg gagaagatta aggggttgaa tgaagttctc 840
aatctggcga tacagaagaa tgacgaaacc gcccatatta tagcttccct cccacatcgg 900
tttataccgt tgttcaagca gatcctgtcg gaccgcaaca cgctttcttt catactcgaa 960
gagttcaaaa gcgacgagga agtcatacag agcttctgta agtataaaac acttttgagg 1020
aatgaaaacg ttcttgaaac tgccgaggcc ttgtttaacg agctcaacag catagatctt 1080
acgcatattt ttatttccca caaaaaattg gaaactataa gctcagcgct gtgtgatcac 1140
tgggatacgc ttcgcaatgc cctttatgag cgcaggatca gcgaactgac ggggaagatt 1200
acgaaatctg cgaaagagaa agttcaaagg tcccttaagc acgaggatat taatctccaa 1260
gaaataataa gcgcggctgg taaagaactt tccgaagctt tcaagcaaaa gacatccgaa 1320
atactctccc atgcgcatgc agccctggac caaccattgc caacaacttt gaagaaacaa 1380
gaagagaagg aaatcctgaa gtcccaactc gactctttgc tcggcctcta tcacttgctt 1440
gattggttcg cggttgatga gtccaacgaa gttgaccctg agttcagcgc caggttgacc 1500
ggtataaagt tggaaatgga accaagcctc tcattttaca acaaggcgag gaactacgcg 1560
accaagaaac catacagcgt cgaaaagttt aagcttaact ttcaaatgcc aacgctcgct 1620
tccggttggg atgttaacaa agaaaaaaat aacggcgcca tcttgtttgt taaaaacggt 1680
ttgtattacc tcggcatcat gccaaaacaa aagggtcggt acaaggctct gagcttcgag 1740
ccaacagaga aaacaagcga aggcttcgac aagatgtatt atgattactt tcccgatgca 1800
gctaaaatga tccccaagtg ctcaacacag cttaaagcgg ttaccgccca tttccagact 1860
cacacgaccc caattctctt gtcaaataac tttattgaac ccttggaaat aaccaaagag 1920
atatatgacc ttaataaccc ggagaaagaa cccaagaagt tccagacggc gtacgctaag 1980
aaaacaggag atcagaaggg ctatagggag gccctttgta aatggattga ctttacaagg 2040
gactttttgt cgaaatatac gaagaccact tcaattgacc tttcgtccct gcggccgtct 2100
agccagtata aagatttggg tgagtactat gcggaactta atcctttgtt gtaccacata 2160
tcttttcaac ggattgcaga gaaggagata atggatgcgg tcgaaacagg aaagctctat 2220
ctgttccaga tttacaataa agattttgcc aagggacacc atggaaaacc taacctgcat 2280
actctttact ggacgggtct tttctcgccg gaaaatttgg ctaagacgtc tatcaagttg 2340
aatgggcagg cagaactctt ctatcgccct aagtctagga tgaaacggat ggctcatcgg 2400
ctgggtgaaa aaatgctcaa caaaaagctt aaggatcaaa agacaccaat cccggacaca 2460
ctttatcaag aattgtacga ttacgttaat cacagactct cacatgacct ttcagatgag 2520
gcccgcgctt tgcttcccaa tgttattact aaagaggtct cgcatgagat cataaaagat 2580
agaagattca cgtctgataa gttctttttt catgtgccaa taactctcaa ctatcaggcc 2640
gcaaattcgc cgtccaagtt caaccaaagg gtgaatgcct acctcaagga gcacccggag 2700
acgccaataa taggtatcga tcggggcgaa cgcaacctta tttatataac agttatcgat 2760
agcacaggga aaatactgga gcagcggagc ctgaatacta ttcaacagtt tgactaccaa 2820
aagaaactgg acaatagaga gaaggagcgc gtcgccgccc ggcaagcttg gtccgtggtc 2880
ggaactataa aagatcttaa acagggatac ctgtcacagg tcatccatga aatcgtggat 2940
ctgatgatac actatcaagc tgttgtcgtg ctcgaaaact tgaattttgg attcaaatcg 3000
aagagaactg gaatcgctga aaaagcggtg taccaacagt tcgagaagat gctcatcgat 3060
aagcttaatt gtttggtgct taaggactat cccgccgaaa aggttggggg ggtgctgaac 3120
ccgtatcagc tcacagatca atttacttca ttcgcgaaga tgggaacgca gtcaggattt 3180
ctgttctacg ttccagcccc ttatacgtcg aaaattgacc ctcttacggg gttcgtggac 3240
ccctttgttt ggaaaacgat aaaaaaccac gagtcacgca agcactttct cgagggattt 3300
gattttcttc attatgatgt gaagaccggg gacttcattt tgcactttaa gatgaacagg 3360
aacttgtctt tccaaagggg cttgcctgga ttcatgccgg cctgggatat cgtgtttgaa 3420
aagaacgaaa cacagttcga tgcgaaaggg acgcccttca tagctggaaa gcgcatagtt 3480
ccagtgattg agaaccacag attcactggt cgctacagag acctgtatcc ggcaaatgaa 3540
ctgatagcac tccttgagga aaagggtatc gtgtttcgcg atggttcaaa tattctcccg 3600
aagcttttgg agaacgacga ttctcatgct atagatacta tggtcgctct catccggtcc 3660
gtccttcaaa tggccaattc gaatgcagcg accggtgagg attacataaa ttcaccagtc 3720
cgggacctta atggggtttg cttcgactcg cgctttcaaa accccgaatg gccaatggac 3780
gccgatgcta acggtgccta ccatatagca cttaaaggac agcttctgtt gaatcacctt 3840
aaagaatcaa aagaccttaa gctgcagaat ggaatttcaa atcaggattg gctcgcgtac 3900
atacaggagc ttcgcaat 3918
<210> 20
<211> 687
<212> DNA
<213> Artificial Sequence
<220>
<223> APOBEC1
<400> 20
atgagctcag agactggccc agtggctgtg gaccccacat tgagacggcg gatcgagccc 60
catgagtttg aggtattctt cgatccgaga gagctccgca aggagacctg cctgctttac 120
gaaattaatt gggggggccg gcactccatt tggcgacata catcacagaa cactaacaag 180
cacgtcgaag tcaacttcat cgagaagttc acgacagaaa gatatttctg tccgaacaca 240
aggtgcagca ttacctggtt tctcagctgg agcccatgcg gcgaatgtag tagggccatc 300
actgaattcc tgtcaaggta tccccacgtc actctgttta tttacatcgc aaggctgtac 360
caccacgctg acccccgcaa tcgacaaggc ctgcgggatt tgatctcttc aggtgtgact 420
atccaaatta tgactgagca ggagtcagga tactgctgga gaaactttgt gaattatagc 480
ccgagtaatg aagcccactg gcctaggtat ccccatctgt gggtacgact gtacgttctt 540
gaactgtact gcatcatact gggcctgcct ccttgtctca acattctgag aaggaagcag 600
ccacagctga cattctttac catcgctctt cagtcttgtc attaccagcg actgccccca 660
cacattctct gggccaccgg gttgaaa 687
<210> 21
<211> 249
<212> DNA
<213> Artificial Sequence
<220>
<223> UGI
<400> 21
accaacctgt ccgacatcat cgagaaggaa acgggcaagc aactcgtgat ccaggagagc 60
atcctcatgc tgccagagga ggtggaggag gtcatcggca acaagccaga gtccgacatc 120
ctggtgcaca ccgcctacga cgagtccacc gacgagaacg tcatgctcct gaccagcgac 180
gccccagagt acaagccatg ggccctcgtc atccaggaca gcaacgggga gaacaagatc 240
aagatgctg 249
<210> 22
<211> 624
<212> DNA
<213> Artificial Sequence
<220>
<223> PmCDA1
<400> 22
atgaccgacg ctgagtacgt gagaatccat gagaagttgg acatctacac gtttaagaaa 60
cagtttttca acaacaaaaa atccgtgtcg catagatgct acgttctctt tgaattaaaa 120
cgacggggtg aacgtagagc gtgtttttgg ggctatgctg tgaataaacc acagagcggg 180
acagaacgtg gcattcacgc cgaaatcttt agcattagaa aagtcgaaga atacctgcgc 240
gacaaccccg gacaattcac gataaattgg tactcatcct ggagtccttg tgcagattgc 300
gctgaaaaga tcttagaatg gtataaccag gagctgcggg ggaacggcca cactttgaaa 360
atctgggctt gcaaactcta ttacgagaaa aatgcgagga atcaaattgg gctgtggaac 420
ctcagagata acggggttgg gttgaatgta atggtaagtg aacactacca atgttgcagg 480
aaaatattca tccaatcgtc gcacaatcaa ttgaatgaga atagatggct tgagaagact 540
ttgaagcgag ctgaaaaacg acggagcgag ttgtccatta tgattcaggt aaaaatactc 600
cacaccacta agagtcctgc tgtt 624
<210> 23
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer sequence
<400> 23
tgttacttct aaactacata 20
<210> 24
<211> 1307
<212> PRT
<213> Acidaminococcus sp. BV3L6
<400> 24
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu
1010 1015 1020
Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly
1025 1030 1035
Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala
1040 1045 1050
Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro
1055 1060 1065
Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe
1070 1075 1080
Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu
1085 1090 1095
Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe
1100 1105 1110
Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly
1115 1120 1125
Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn
1130 1135 1140
Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1145 1150 1155
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr
1160 1165 1170
Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu
1175 1180 1185
Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu
1190 1195 1200
Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu
1205 1210 1215
Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly
1220 1225 1230
Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp
1250 1255 1260
Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu
1265 1270 1275
Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile
1280 1285 1290
Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1295 1300 1305
<210> 25
<211> 670
<212> PRT
<213> Arabidopsis thaliana
<400> 25
Met Ala Ala Ala Thr Thr Thr Thr Thr Thr Ser Ser Ser Ile Ser Phe
1 5 10 15
Ser Thr Lys Pro Ser Pro Ser Ser Ser Lys Ser Pro Leu Pro Ile Ser
20 25 30
Arg Phe Ser Leu Pro Phe Ser Leu Asn Pro Asn Lys Ser Ser Ser Ser
35 40 45
Ser Arg Arg Arg Gly Ile Lys Ser Ser Ser Pro Ser Ser Ile Ser Ala
50 55 60
Val Leu Asn Thr Thr Thr Asn Val Thr Thr Thr Pro Ser Pro Thr Lys
65 70 75 80
Pro Thr Lys Pro Glu Thr Phe Ile Ser Arg Phe Ala Pro Asp Gln Pro
85 90 95
Arg Lys Gly Ala Asp Ile Leu Val Glu Ala Leu Glu Arg Gln Gly Val
100 105 110
Glu Thr Val Phe Ala Tyr Pro Gly Gly Ala Ser Met Glu Ile His Gln
115 120 125
Ala Leu Thr Arg Ser Ser Ser Ile Arg Asn Val Leu Pro Arg His Glu
130 135 140
Gln Gly Gly Val Phe Ala Ala Glu Gly Tyr Ala Arg Ser Ser Gly Lys
145 150 155 160
Pro Gly Ile Cys Ile Ala Thr Ser Gly Pro Gly Ala Thr Asn Leu Val
165 170 175
Ser Gly Leu Ala Asp Ala Leu Leu Asp Ser Val Pro Leu Val Ala Ile
180 185 190
Thr Gly Gln Val Pro Arg Arg Met Ile Gly Thr Asp Ala Phe Gln Glu
195 200 205
Thr Pro Ile Val Glu Val Thr Arg Ser Ile Thr Lys His Asn Tyr Leu
210 215 220
Val Met Asp Val Glu Asp Ile Pro Arg Ile Ile Glu Glu Ala Phe Phe
225 230 235 240
Leu Ala Thr Ser Gly Arg Pro Gly Pro Val Leu Val Asp Val Pro Lys
245 250 255
Asp Ile Gln Gln Gln Leu Ala Ile Pro Asn Trp Glu Gln Ala Met Arg
260 265 270
Leu Pro Gly Tyr Met Ser Arg Met Pro Lys Pro Pro Glu Asp Ser His
275 280 285
Leu Glu Gln Ile Val Arg Leu Ile Ser Glu Ser Lys Lys Pro Val Leu
290 295 300
Tyr Val Gly Gly Gly Cys Leu Asn Ser Ser Asp Glu Leu Gly Arg Phe
305 310 315 320
Val Glu Leu Thr Gly Ile Pro Val Ala Ser Thr Leu Met Gly Leu Gly
325 330 335
Ser Tyr Pro Cys Asp Asp Glu Leu Ser Leu His Met Leu Gly Met His
340 345 350
Gly Thr Val Tyr Ala Asn Tyr Ala Val Glu His Ser Asp Leu Leu Leu
355 360 365
Ala Phe Gly Val Arg Phe Asp Asp Arg Val Thr Gly Lys Leu Glu Ala
370 375 380
Phe Ala Ser Arg Ala Lys Ile Val His Ile Asp Ile Asp Ser Ala Glu
385 390 395 400
Ile Gly Lys Asn Lys Thr Pro His Val Ser Val Cys Gly Asp Val Lys
405 410 415
Leu Ala Leu Gln Gly Met Asn Lys Val Leu Glu Asn Arg Ala Glu Glu
420 425 430
Leu Lys Leu Asp Phe Gly Val Trp Arg Asn Glu Leu Asn Val Gln Lys
435 440 445
Gln Lys Phe Pro Leu Ser Phe Lys Thr Phe Gly Glu Ala Ile Pro Pro
450 455 460
Gln Tyr Ala Ile Lys Val Leu Asp Glu Leu Thr Asp Gly Lys Ala Ile
465 470 475 480
Ile Ser Thr Gly Val Gly Gln His Gln Met Trp Ala Ala Gln Phe Tyr
485 490 495
Asn Tyr Lys Lys Pro Arg Gln Trp Leu Ser Ser Gly Gly Leu Gly Ala
500 505 510
Met Gly Phe Gly Leu Pro Ala Ala Ile Gly Ala Ser Val Ala Asn Pro
515 520 525
Asp Ala Ile Val Val Asp Ile Asp Gly Asp Gly Ser Phe Ile Met Asn
530 535 540
Val Gln Glu Leu Ala Thr Ile Arg Val Glu Asn Leu Pro Val Lys Val
545 550 555 560
Leu Leu Leu Asn Asn Gln His Leu Gly Met Val Met Gln Trp Glu Asp
565 570 575
Arg Phe Tyr Lys Ala Asn Arg Ala His Thr Phe Leu Gly Asp Pro Ala
580 585 590
Gln Glu Asp Glu Ile Phe Pro Asn Met Leu Leu Phe Ala Ala Ala Cys
595 600 605
Gly Ile Pro Ala Ala Arg Val Thr Lys Lys Ala Asp Leu Arg Glu Ala
610 615 620
Ile Gln Thr Met Leu Asp Thr Pro Gly Pro Tyr Leu Leu Asp Val Ile
625 630 635 640
Cys Pro His Gln Glu His Val Leu Pro Met Ile Pro Ser Gly Gly Thr
645 650 655
Phe Asn Asp Val Ile Thr Glu Gly Asp Gly Arg Ile Lys Tyr
660 665 670
<210> 26
<211> 537
<212> PRT
<213> Arabidopsis thaliana
<400> 26
Met Glu Leu Ser Leu Leu Arg Pro Thr Thr Gln Ser Leu Leu Pro Ser
1 5 10 15
Phe Ser Lys Pro Asn Leu Arg Leu Asn Val Tyr Lys Pro Leu Arg Leu
20 25 30
Arg Cys Ser Val Ala Gly Gly Pro Thr Val Gly Ser Ser Lys Ile Glu
35 40 45
Gly Gly Gly Gly Thr Thr Ile Thr Thr Asp Cys Val Ile Val Gly Gly
50 55 60
Gly Ile Ser Gly Leu Cys Ile Ala Gln Ala Leu Ala Thr Lys His Pro
65 70 75 80
Asp Ala Ala Pro Asn Leu Ile Val Thr Glu Ala Lys Asp Arg Val Gly
85 90 95
Gly Asn Ile Ile Thr Arg Glu Glu Asn Gly Phe Leu Trp Glu Glu Gly
100 105 110
Pro Asn Ser Phe Gln Pro Ser Asp Pro Met Leu Thr Met Val Val Asp
115 120 125
Ser Gly Leu Lys Asp Asp Leu Val Leu Gly Asp Pro Thr Ala Pro Arg
130 135 140
Phe Val Leu Trp Asn Gly Lys Leu Arg Pro Val Pro Ser Lys Leu Thr
145 150 155 160
Asp Leu Pro Phe Phe Asp Leu Met Ser Ile Gly Gly Lys Ile Arg Ala
165 170 175
Gly Phe Gly Ala Leu Gly Ile Arg Pro Ser Pro Pro Gly Arg Glu Glu
180 185 190
Ser Val Glu Glu Phe Val Arg Arg Asn Leu Gly Asp Glu Val Phe Glu
195 200 205
Arg Leu Ile Glu Pro Phe Cys Ser Gly Val Tyr Ala Gly Asp Pro Ser
210 215 220
Lys Leu Ser Met Lys Ala Ala Phe Gly Lys Val Trp Lys Leu Glu Gln
225 230 235 240
Asn Gly Gly Ser Ile Ile Gly Gly Thr Phe Lys Ala Ile Gln Glu Arg
245 250 255
Lys Asn Ala Pro Lys Ala Glu Arg Asp Pro Arg Leu Pro Lys Pro Gln
260 265 270
Gly Gln Thr Val Gly Ser Phe Arg Lys Gly Leu Arg Met Leu Pro Glu
275 280 285
Ala Ile Ser Ala Arg Leu Gly Ser Lys Val Lys Leu Ser Trp Lys Leu
290 295 300
Ser Gly Ile Thr Lys Leu Glu Ser Gly Gly Tyr Asn Leu Thr Tyr Glu
305 310 315 320
Thr Pro Asp Gly Leu Val Ser Val Gln Ser Lys Ser Val Val Met Thr
325 330 335
Val Pro Ser His Val Ala Ser Gly Leu Leu Arg Pro Leu Ser Glu Ser
340 345 350
Ala Ala Asn Ala Leu Ser Lys Leu Tyr Tyr Pro Pro Val Ala Ala Val
355 360 365
Ser Ile Ser Tyr Pro Lys Glu Ala Ile Arg Thr Glu Cys Leu Ile Asp
370 375 380
Gly Glu Leu Lys Gly Phe Gly Gln Leu His Pro Arg Thr Gln Gly Val
385 390 395 400
Glu Thr Leu Gly Thr Ile Tyr Ser Ser Ser Leu Phe Pro Asn Arg Ala
405 410 415
Pro Pro Gly Arg Ile Leu Leu Leu Asn Tyr Ile Gly Gly Ser Thr Asn
420 425 430
Thr Gly Ile Leu Ser Lys Ser Glu Gly Glu Leu Val Glu Ala Val Asp
435 440 445
Arg Asp Leu Arg Lys Met Leu Ile Lys Pro Asn Ser Thr Asp Pro Leu
450 455 460
Lys Leu Gly Val Arg Val Trp Pro Gln Ala Ile Pro Gln Phe Leu Val
465 470 475 480
Gly His Phe Asp Ile Leu Asp Thr Ala Lys Ser Ser Leu Thr Ser Ser
485 490 495
Gly Tyr Glu Gly Leu Phe Leu Gly Gly Asn Tyr Val Ala Gly Val Ala
500 505 510
Leu Gly Arg Cys Val Glu Gly Ala Tyr Glu Thr Ala Ile Glu Val Asn
515 520 525
Asn Phe Met Ser Arg Tyr Ala Tyr Lys
530 535
<210> 27
<211> 444
<212> PRT
<213> Arabidopsis thaliana
<400> 27
Lys Ala Ser Glu Ile Val Leu Gln Pro Ile Arg Glu Ile Ser Gly Leu
1 5 10 15
Ile Lys Leu Pro Gly Ser Lys Ser Leu Ser Asn Arg Ile Leu Leu Leu
20 25 30
Ala Ala Leu Ser Glu Gly Thr Thr Val Val Asp Asn Leu Leu Asn Ser
35 40 45
Asp Asp Ile Asn Tyr Met Leu Asp Ala Leu Lys Arg Leu Gly Leu Asn
50 55 60
Val Glu Thr Asp Ser Glu Asn Asn Arg Ala Val Val Glu Gly Cys Gly
65 70 75 80
Gly Ile Phe Pro Ala Ser Ile Asp Ser Lys Ser Asp Ile Glu Leu Tyr
85 90 95
Leu Gly Asn Ala Gly Thr Ala Met Arg Pro Leu Thr Ala Ala Val Thr
100 105 110
Ala Ala Gly Gly Asn Ala Ser Tyr Val Leu Asp Gly Val Pro Arg Met
115 120 125
Arg Glu Arg Pro Ile Gly Asp Leu Val Val Gly Leu Lys Gln Leu Gly
130 135 140
Ala Asp Val Glu Cys Thr Leu Gly Thr Asn Cys Pro Pro Val Arg Val
145 150 155 160
Asn Ala Asn Gly Gly Leu Pro Gly Gly Lys Val Lys Leu Ser Gly Ser
165 170 175
Ile Ser Ser Gln Tyr Leu Thr Ala Leu Leu Met Ser Ala Pro Leu Ala
180 185 190
Leu Gly Asp Val Glu Ile Glu Ile Val Asp Lys Leu Ile Ser Val Pro
195 200 205
Tyr Val Glu Met Thr Leu Lys Leu Met Glu Arg Phe Gly Val Ser Val
210 215 220
Glu His Ser Asp Ser Trp Asp Arg Phe Phe Val Lys Gly Gly Gln Lys
225 230 235 240
Tyr Lys Ser Pro Gly Asn Ala Tyr Val Glu Gly Asp Ala Ser Ser Ala
245 250 255
Ser Tyr Phe Leu Ala Gly Ala Ala Ile Thr Gly Glu Thr Val Thr Val
260 265 270
Glu Gly Cys Gly Thr Thr Ser Leu Gln Gly Asp Val Lys Phe Ala Glu
275 280 285
Val Leu Glu Lys Met Gly Cys Lys Val Ser Trp Thr Glu Asn Ser Val
290 295 300
Thr Val Thr Gly Pro Pro Arg Asp Ala Phe Gly Met Arg His Leu Arg
305 310 315 320
Ala Ile Asp Val Asn Met Asn Lys Met Pro Asp Val Ala Met Thr Leu
325 330 335
Ala Val Val Ala Leu Phe Ala Asp Gly Pro Thr Thr Ile Arg Asp Val
340 345 350
Ala Ser Trp Arg Val Lys Glu Thr Glu Arg Met Ile Ala Ile Cys Thr
355 360 365
Glu Leu Arg Lys Leu Gly Ala Thr Val Glu Glu Gly Ser Asp Tyr Cys
370 375 380
Val Ile Thr Pro Pro Lys Lys Val Lys Thr Ala Glu Ile Asp Thr Tyr
385 390 395 400
Asp Asp His Arg Met Ala Met Ala Phe Ser Leu Ala Ala Cys Ala Asp
405 410 415
Val Pro Ile Thr Ile Asn Asp Pro Gly Cys Thr Arg Lys Thr Phe Pro
420 425 430
Asp Tyr Phe Gln Val Leu Glu Arg Ile Thr Lys His
435 440
<210> 28
<211> 534
<212> PRT
<213> Amaranthus tuberculatus
<400> 28
Met Val Ile Gln Ser Ile Thr His Leu Ser Pro Asn Leu Ala Leu Pro
1 5 10 15
Ser Pro Leu Ser Val Ser Thr Lys Asn Tyr Pro Val Ala Val Met Gly
20 25 30
Asn Ile Ser Glu Arg Glu Glu Pro Thr Ser Ala Lys Arg Val Ala Val
35 40 45
Val Gly Ala Gly Val Ser Gly Leu Ala Ala Ala Tyr Lys Leu Lys Ser
50 55 60
His Gly Leu Ser Val Thr Leu Phe Glu Ala Asp Ser Arg Ala Gly Gly
65 70 75 80
Lys Leu Lys Thr Val Lys Lys Asp Gly Phe Ile Trp Asp Glu Gly Ala
85 90 95
Asn Thr Met Thr Glu Ser Glu Ala Glu Val Ser Ser Leu Ile Asp Asp
100 105 110
Leu Gly Leu Arg Glu Lys Gln Gln Leu Pro Ile Ser Gln Asn Lys Arg
115 120 125
Tyr Ile Ala Arg Asp Gly Leu Pro Val Leu Leu Pro Ser Asn Pro Ala
130 135 140
Ala Leu Leu Thr Ser Asn Ile Leu Ser Ala Lys Ser Lys Leu Gln Ile
145 150 155 160
Met Leu Glu Pro Phe Leu Trp Arg Lys His Asn Ala Thr Glu Leu Ser
165 170 175
Asp Glu His Val Gln Glu Ser Val Gly Glu Phe Phe Glu Arg His Phe
180 185 190
Gly Lys Glu Phe Val Asp Tyr Val Ile Asp Pro Phe Val Ala Gly Thr
195 200 205
Cys Gly Gly Asp Pro Gln Ser Leu Ser Met His His Thr Phe Pro Glu
210 215 220
Val Trp Asn Ile Glu Lys Arg Phe Gly Ser Val Phe Ala Gly Leu Ile
225 230 235 240
Gln Ser Thr Leu Leu Ser Lys Lys Glu Lys Gly Gly Glu Asn Ala Ser
245 250 255
Ile Lys Lys Pro Arg Val Arg Gly Ser Phe Ser Phe Gln Gly Gly Met
260 265 270
Gln Thr Leu Val Asp Thr Met Cys Lys Gln Leu Gly Glu Asp Glu Leu
275 280 285
Lys Leu Gln Cys Glu Val Leu Ser Leu Ser Tyr Asn Gln Lys Gly Ile
290 295 300
Pro Ser Leu Gly Asn Trp Ser Val Ser Ser Met Ser Asn Asn Thr Ser
305 310 315 320
Glu Asp Gln Ser Tyr Asp Ala Val Val Val Thr Ala Pro Ile Arg Asn
325 330 335
Val Lys Glu Met Lys Ile Met Lys Phe Gly Asn Pro Phe Ser Leu Asp
340 345 350
Phe Ile Pro Glu Val Thr Tyr Val Pro Leu Ser Val Met Ile Thr Ala
355 360 365
Phe Lys Lys Asp Lys Val Lys Arg Pro Leu Glu Gly Phe Gly Val Leu
370 375 380
Ile Pro Ser Lys Glu Gln His Asn Gly Leu Lys Thr Leu Gly Thr Leu
385 390 395 400
Phe Ser Ser Met Met Phe Pro Asp Arg Ala Pro Ser Asp Met Cys Leu
405 410 415
Phe Thr Thr Phe Val Gly Gly Ser Arg Asn Arg Lys Leu Ala Asn Ala
420 425 430
Ser Thr Asp Glu Leu Lys Gln Ile Val Ser Ser Asp Leu Gln Gln Leu
435 440 445
Leu Gly Thr Glu Asp Glu Pro Ser Phe Val Asn His Leu Phe Trp Ser
450 455 460
Asn Ala Phe Pro Leu Tyr Gly His Asn Tyr Asp Ser Val Leu Arg Ala
465 470 475 480
Ile Asp Lys Met Glu Lys Asp Leu Pro Gly Phe Phe Tyr Ala Gly Asn
485 490 495
His Lys Gly Gly Leu Ser Val Gly Lys Ala Met Ala Ser Gly Cys Lys
500 505 510
Ala Ala Glu Leu Val Ile Ser Tyr Leu Asp Ser His Ile Tyr Val Lys
515 520 525
Met Asp Glu Lys Thr Ala
530
Claims (93)
- 전이유전자성 선별 마커 서열 (transgenic selectable marker sequence)의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물 (whole plant)을 단리하는 방법으로서,
상기 방법은,
a. 하나 이상의 제1 타겟화된 염기 변형을, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 도입하는 단계로서, 상기 하나 이상의 타겟화된 염기 변형이 하나 이상의 표현형으로 선별가능한 형질 (phenotypically selectable trait)의 발현을 유발하는, 단계;
b. 하나 이상의 제2 타겟화된 변형을, 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 상기 하나 이상의 제2 타겟화된 변형이 하나 이상의 부위-특이적인 작동자 (site-specific effector)를 이용해 도입되어 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 상기 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로, 상기 하나 이상의 제2 타겟화된 변형이, 변형할 동일한 하나 이상의 식물 세포에, 또는 상기 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및
c. i. 상기 제1 식물 게놈 타겟 부위에서 상기 하나 이상의 제1 타겟화된 염기 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로,
ii. 상기 제2 식물 게놈 타겟 부위에서 상기 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써.
하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계를 포함하는, 방법. - 제1항에 있어서,
상기 단계 b가 복구 주형을 도입하여 적어도 상기 제2 식물 게놈 타겟 부위에 타겟화된 서열 변환 또는 치환을 만드는 단계를 더 포함하는, 방법. - 제1항에 있어서,
d. 상기 하나 이상의 제1 타겟화된 변형 및 상기 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을, 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리 (segregation)함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 더 포함하는, 방법. - 제1항에 있어서,
상기 하나 이상의 부위-특이적인 작동자가 하나 이상의 염기 편집 복합체에 일시적으로 또는 영구적으로 연결되고, 상기 염기 편집 복합체가 단계 a의 하나 이상의 제1 타겟화된 염기 변형을 매개하는, 방법. - 제1항에 있어서,
하나 이상의 부위-특이적인 작동자가 Cas 또는 Cpf1 뉴클레아제를 포함하는 CRISPR 뉴클레아제, TALEN, ZFN, 메가뉴클레아제, 아르고너트 (Argonaute) 뉴클레아제, FokI 또는 이의 변이체를 포함하는 제한 엔도뉴클레아제, 재조합효소 또는 2 부위-특이적인 닉킹 엔도뉴클레아제 (two site-specific nicking endonucleases), 또는 염기 편집기, 또는 이들 작동자의 임의 변이체 또는 촉매학적으로 활성인 단편을 포함하는, 하나 이상의 뉴클레아제로부터 선택되는, 방법. - 제1항에 있어서,
상기 하나 이상의 부위-특이적인 작동자가 CRISPR-기반의 뉴클레아제이고, 상기 CRISPR-기반의 뉴클레아제는 하나 이상의 염기 편집 복합체에 대한 (directing) 부위-특이적인 DNA 결합 도메인을 포함하고, 상기 하나 이상의 CRISPR-기반의 뉴클레아제 또는 이를 코딩하는 핵산 서열이
a. SpCas9, SaCas9, SaKKH-Cas9, VQR-Cas9, St1Cas9를 포함하는, Cas9,
b. AsCpf1, LbCpf1, FnCpf1을 포함하는, Cpf1,
c. CasX, 또는
d. CasY
또는 상기 CRISPR-기반의 뉴클레아제의 임의 변이체 또는 유도체를 포함하는 군으로부터 선택되고, 바람직하게는, 상기 하나 이상의 CRISPR-기반의 뉴클레아제는 해당 야생형 서열과 비교해 돌연변이를 포함하므로, 형성되는 CRISPR-기반의 뉴클레아제는 단일 가닥 특이적인 DNA 닉카제로 또는 모든 DNA 절단력이 결핍된 DNA 결합 작동자로 변환되는, 방법. - 제1항에 있어서,
상기 하나 이상의 제1 타겟화된 염기 변형이 구성성분으로서 하나 이상의 염기 편집기를 포함하는 하나 이상의 염기 편집 복합체에 의해 수행되는, 방법. - 제7항에 있어서,
상기 염기 편집 복합체가 하나 이상의 시티딘 데아미나제 또는 이의 촉매학적으로 활성인 단편을 포함하는, 방법. - 제7항에 있어서,
상기 하나 이상의 제1 타겟화된 염기 변형은, 뉴클레오티드 C, A, T 또는 G가 다른 뉴클레오티드로 변환되는 것인, 방법. - 제7항에 있어서,
상기 염기 편집 복합체가 APOBEC1 구성성분을 포함하는, 방법. - 제7항에 있어서,
상기 염기 편집 복합체가 UGI 구성성분을 포함하거나, 및/또는 상기 염기 편집 복합체가 XTEN 구성성분을 포함하는, 방법. - 제7항에 있어서,
상기 염기 편집 복합체가 PmCDA1 구성성분을 포함하는, 방법. - 제7항에 있어서,
상기 하나 이상의 염기 편집 복합체가 구성성분을 2개 이상 포함하고, 상기 2개 이상의 구성성분이 물리적으로 연결된, 방법. - 제7항에 있어서,
상기 하나 이상의 염기 편집 복합체가 구성성분을 2개 이상 포함하고, 상기 2개 이상의 구성성분이 개별 구성성분으로서 제공되는, 방법. - 제7항에 있어서,
상기 하나 이상의 염기 편집 복합체의 하나 이상의 구성성분이 상기 하나 이상의 염기 편집 복합체를 세포내 소기관으로 타겟화하기 위한 하나 이상의 소기관 위치화 신호 (organelle localization signal)를 포함하는, 방법. - 제15항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 핵 위치화 신호 (NLS)인, 방법. - 제15항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 엽록체 수송 펩타이드인, 방법. - 제15항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 미토콘드리아 수송 펩타이드인, 방법. - 제1항에 있어서,
상기 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위가 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 게놈 타겟 부위이고, 상기 하나 이상의 표현형으로 선별가능한 형질은 내성/허용성 형질 또는 생장 우세 (growth advantage) 형질이고, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형이 하나 이상의 변형된 식물 세포, 조직 또는 식물, 또는 그 자손에 부가될 화합물 또는 촉발제에 대해 내성/허용성 또는 생장 우세를 부여하는, 방법. - 제19항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 대상 형질이 하나 이상의 내인성 유전자이거나 또는 이에 의해 코딩되거나, 또는 상기 하나 이상의 대상 표현형 형질이 하나 이상의 전이유전자이거나 또는 이에 의해 코딩되고, 여기서 상기 하나 이상의 내인성 유전자 또는 하나 이상의 전이유전자가, 하나 이상의 대상 표현형 형질에서 하나 이상의 변형이 결핍된 세포를 저해, 손상 또는 사멸시키는, 식물독소, 바람직하게는 제초제에 대한 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형 형질을 코딩하거나, 또는 상기 하나 이상의 표현형 형질이 세포 분열; 증식 속도; 배발생 (embryogenesis); 또는 비-변형된 세포, 조직, 기관 또는 식물과 비교해 변형된 세포, 조직, 기관 또는 식물에 이점을 제공하는 다른 표현형으로 선별가능한 특성의 부스터 (booster)로 이루어진 군으로부터 선택되는, 방법. - 제19항에 있어서,
상기 하나 이상의 제1 식물 게놈 타겟 부위가 제초제 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 하나 이상의 내인성 유전자 또는 전이유전자이고, 여기서 상기 제초제 내성/허용성이 글리포세이트를 포함하는 EPSPS-저해제에 대한 내성/허용성, 글루포시네이트를 포함하는 글루타민 합성 저해제에 대한 내성/허용성, 이미다졸린 또는 설포닐우레아를 포함하는 ALS- 또는 AHAS-저해제에 대한 내성/허용성, 아릴옥시페녹시프로피오네이트 (FOP)를 포함하는 ACCase 저해제에 대한 내성/허용성, 피토엔 데세투라제 (phytoene desaturase) 단계에서 카로티노이드 생합성의 저해제, 4-하이드록시페닐-피루베이트-다이옥시게나제 (HPPD)의 저해제 또는 기타 카로티노이드 생합성 타겟의 저해제를 포함하는 카로티노이드 생합성 저해제에 대한 내성/허용성, 셀룰로스 저해제에 대한 내성/허용성, 지질 합성 저해제에 대한 내성/허용성, 장쇄 지방산 저해제에 대한 내성/허용성, 미소관 조립 저해제 (microtubule assembly inhibitor)에 대한 내성/허용성, 광화학계 I 전자 전환체 (photosystem I electron diverter)에 대한 내성/허용성, 카바메이트, 트리아진 및 트리아지논을 포함하는 광화학계 II 저해제에 대한 내성/허용성, PPO-저해제에 대한 내성/허용성 및 디캄바 (2,4-다이클로로페녹시아세트산)를 포함하는 합성 옥신에 대한 내성/허용성으로 이루어진 군으로부터 선택되는, 방법. - 제19항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 식물독성 내성/허용성 형질, 바람직하게는 제초제 내성/허용성 형질이고, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형이 식물독성 화합물, 바람직하게는 제초제에 대한 내성/허용성을 부여하며, 상기 화합물이 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물, 또는 그 자손에 부가될 외인성 화합물인, 방법. - 제19항에 있어서,
상기 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위가 ALS인, 방법. - 제19항에 있어서,
상기 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위가 PPO인, 방법. - 제19항에 있어서,
상기 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위가 EPSPS, ALS 또는 PPO이고, 상기 EPSPS, ALS 또는 PPO가 하나 이상의 핵산 변환을 포함하여 하나 이상의 대응되는 아미노산 변환이 이루어지고, 상기 하나 이상의 핵산 변환이 하나 이상의 염기 편집기에 의해 수행되는, 방법. - 제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 A122를 코딩하는 서열에서 이루어지는, 방법. - 제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 P197을 코딩하는 서열에서 이루어지는, 방법. - 제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 A205를 코딩하는 서열에서 이루어지는, 방법. - 제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 D376을 코딩하는 서열에서 이루어지는, 방법. - 제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 R377을 코딩하는 서열에서 이루어지는, 방법. - 제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 W574를 코딩하는 서열에서 이루어지는, 방법. - 제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 S653을 코딩하는 서열에서 이루어지는, 방법. - 제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 G654를 코딩하는 서열에서 이루어지는, 방법. - 제24항에 있어서,
상기 타겟화된 변형이 서열번호 26에 따른 PPO 참조 서열과 비교해 C215를 코딩하는 서열에서 이루어지는, 방법. - 제24항에 있어서,
상기 타겟화된 변형이 서열번호 26에 따른 PPO 참조 서열과 비교해 A220을 코딩하는 서열에서 이루어지는, 방법. - 제24항에 있어서,
상기 타겟화된 변형이 서열번호 26에 따른 PPO 참조 서열과 비교해 G221을 코딩하는 서열에서 이루어지는, 방법. - 제24항에 있어서,
상기 타겟화된 변형이 서열번호 26에 따른 PPO 참조 서열과 비교해 N425를 코딩하는 서열에서 이루어지는, 방법. - 제24항에 있어서,
상기 타겟화된 변형이 서열번호 26에 따른 PPO 참조 서열과 비교해 Y426 또는 I475를 코딩하는 서열에서 이루어지는, 방법. - 제25항에 있어서,
상기 타겟화된 변형이 서열번호 27에 따른 EPSPS 참조 서열과 비교해 G101 및 G144를 코딩하는 서열에서 이루어지는, 방법. - 제25항에 있어서,
상기 타겟화된 변형이 서열번호 27에 따른 EPSPS 참조 서열과 비교해 G101 및 A192를 코딩하는 서열에서 이루어지는, 방법. - 제25항에 있어서,
상기 타겟화된 변형이 서열번호 27에 따른 EPSPS 참조 서열과 비교해 T102 및 P106을 코딩하는 서열에서 이루어지는, 방법. - 제1항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 동정 또는 단리하는데 유용한 가시적인 표현형 (visible phenotype)인, 방법. - 제42항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 광택 (glossy) 표현형인, 방법. - 제42항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 골든 (golden) 표현형인, 방법. - 제42항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 색소 (pigmentation) 표현형 또는 생장 우세 표현형인, 방법. - 제1항에 있어서,
상기 변형할 하나 이상의 식물 세포가 바람직하게는 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays) 등의 지 spp. (Zea spp .), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris) 등의 베타 spp., 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 넥수오사 (Cardamine nexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp . sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카야누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 상기 식물들 중 하나에 속하는 품종 또는 아종으로 이루어진 군으로부터 선택되는 식물로부터 유래되는, 방법. - 전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물을 단리하는 방법으로서,
상기 방법은
a. 하나 이상의 제1 타겟화된 코돈 결손 변형을, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에, 뉴클레아제, 재조합효소 또는 DNA 변형 물질을 포함하는 하나 이상의 제1 부위-특이적인 작동자를 이용해 도입하는 단계로서, 상기 하나 이상의 타겟화된 코돈 결손 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계;
b. 하나 이상의 제2 타겟화된 변형을, 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 상기 하나 이상의 제2 타겟화된 변형이 하나 이상의 제2 부위-특이적인 작동자를 이용해 도입되어 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 상기 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로, 하나 이상의 상기 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포에, 또는 상기 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및
c. i. 상기 제1 식물 게놈 타겟 부위에서 상기 하나 이상의 제1 타겟화된 코돈 결손 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로,
ii. 상기 제2 식물 게놈 타겟 부위에서 상기 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써,
하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계;
선택적으로,
d. 상기 하나 이상의 제1 타겟화된 변형 및 상기 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을, 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 포함하는, 방법. - 제47항에 있어서,
단계 b는 바람직하게는 복구 주형을 도입하여 하나 이상의 제1 및/또는 제2 식물 게놈 타겟 부위에 타겟화된 서열 변환 또는 치환을 만드는 단계를 더 포함하는, 방법. - 제47항에 있어서,
상기 하나 이상의 부위-특이적인 작동자가 Cas 또는 Cpf1 뉴클레아제를 포함하는 CRISPR 뉴클레아제, TALEN, ZFN, 메가뉴클레아제, 아르고너트 (Argonaute) 뉴클레아제, FokI 또는 이의 변이체를 포함하는 제한 엔도뉴클레아제, 재조합효소 또는 2 부위-특이적인 닉킹 엔도뉴클레아제, 또는 이들 작동자의 임의 변이체 또는 촉매학적으로 활성인 단편 중 하나 이상으로부터 선택되는, 방법. - 제47항에 있어서,
상기 하나 이상의 부위-특이적인 작동자가 CRISPR-기반의 뉴클레아제이고, 상기 CRISPR-기반의 뉴클레아제는 부위-특이적인 DNA 결합 도메인을 포함하고, 상기 하나 이상의 CRISPR-기반의 뉴클레아제 또는 이를 코딩하는 핵산 서열이
a. SpCas9, SaCas9, SaKKH-Cas9, VQR-Cas9, St1Cas9를 포함하는, Cas9,
b. AsCpf1, LbCpf1, FnCpf1을 포함하는, Cpf1,
c. CasX, 또는
d. CasY
또는 상기한 CRISPR-기반의 뉴클레아제의 임의 변이체 또는 유도체를 포함하는 군으로부터 선택되고, 선택적으로, 상기 하나 이상의 CRISPR-기반의 뉴클레아제가 해당 야생형 서열과 비교해 돌연변이를 포함하므로, 형성되는 CRISPR-기반의 뉴클레아제는 단일 가닥 특이적인 DNA 닉카제로 또는 모든 DNA 절단력이 결핍된 DNA 결합 작동자로 변환되는, 방법. - 제47항에 있어서,
상기 적어도 부위-특이적인 작동자, 또는 상기 하나 이상의 부위-특이적인 작동자를 포함하는 복합체의 하나 이상의 구성성분이, 하나 이상의 염기 편집 복합체를 세포내 소기관으로의 타겟화하기 위한 하나 이상의 소기관 위치화 신호를 포함하는, 방법. - 제51항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 핵 위치화 신호 (NLS)인, 방법. - 제51항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 엽록체 수송 펩타이드인, 방법. - 제51항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 미토콘드리아 수송 펩타이드인, 방법. - 제47항에 있어서,
상기 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위가 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 게놈 타겟 부위이고, 상기 하나 이상의 표현형으로 선별가능한 형질은 내성/허용성 형질 또는 생장 우세 형질이고, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형이 하나 이상의 변형된 식물 세포, 조직 또는 식물, 또는 그 자손에 부가될 화합물 또는 촉발제에 대해 내성/허용성 또는 생장 우세를 부여하는, 방법. - 제47항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 대상 형질이 하나 이상의 내인성 유전자이거나 또는 이에 의해 코딩되거나, 또는 상기 하나 이상의 대상 표현형 형질이 하나 이상의 전이유전자이거나 또는 이에 의해 코딩되고, 여기서 상기 하나 이상의 내인성 유전자 또는 하나 이상의 전이유전자가, 하나 이상의 대상 표현형 형질에 하나 이상의 변형이 결핍된 세포를 저해, 손상 또는 사멸시키는, 식물독소, 바람직하게는 제초제에 대한 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형 형질을 코딩하거나, 또는 상기 하나 이상의 표현형 형질이 세포 분열; 증식 속도; 배발생; 또는 비-변형된 세포, 조직, 기관 또는 식물과 비교해 변형된 세포, 조직, 기관 또는 식물에 이점을 제공하는 다른 표현형으로 선별가능한 특성의 부스터 (booster)로 이루어진 군으로부터 선택되는, 방법. - 제47항에 있어서,
상기 하나 이상의 제1 식물 게놈 타겟 부위가 제초제 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 하나 이상의 내인성 유전자 또는 전이유전자이고, 여기서 상기 제초제 내성/허용성이 글리포세이트를 포함하는 EPSPS-저해제에 대한 내성/허용성, 글루포시네이트를 포함하는 글루타민 합성 저해제에 대한 내성/허용성, 이미다졸린 또는 설포닐우레아를 포함하는 ALS- 또는 AHAS-저해제에 대한 내성/허용성, 아릴옥시페녹시프로피오네이트 (FOP)를 포함하는 ACCase 저해제에 대한 내성/허용성, 피토엔 데세투라제 (phytoene desaturase) 단계에서 카로티노이드 생합성의 저해제, 4-하이드록시페닐-피루베이트-다이옥시게나제 (HPPD)의 저해제 또는 기타 카로티노이드 생합성 타겟의 저해제를 포함하는 카로티노이드 생합성 저해제에 대한 내성/허용성, 셀룰로스 저해제에 대한 내성/허용성, 지질 합성 저해제에 대한 내성/허용성, 장쇄 지방산 저해제에 대한 내성/허용성, 미소관 조립 저해제 (microtubule assembly inhibitor)에 대한 내성/허용성, 광화학계 I 전자 전환체 (photosystem I electron diverter)에 대한 내성/허용성, 카바메이트, 트리아진 및 트리아지논을 포함하는 광화학계 II 저해제에 대한 내성/허용성, PPO-저해제에 대한 내성/허용성 및 디캄바 (2,4-다이클로로페녹시아세트산)를 포함하는 합성 옥신에 대한 내성/허용성으로 이루어진 군으로부터 선택되는, 방법. - 제47항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 식물독성 내성/허용성 형질, 바람직하게는 제초제 내성/허용성 형질이고, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 코돈 결손 변형이 식물독성 화합물, 바람직하게는 제초제에 대해 내성/허용성을 부여하며, 상기 화합물이 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물, 또는 그 자손에 부가될 외인성 화합물인, 방법. - 제58항에 있어서,
상기 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위가 선별 목적으로 아마란투스 투베르쿨라투스 (Amaranthus tuberculatus) 유래의 PPX2L 유전자 산물의 상동체 (homolog)인, 방법. - 제59항에 있어서,
상기 하나 이상의 제1 타겟화된 코돈 결손 변형이 서열번호 28에 따른 아마란투스 투베르쿨라투스 (Amaranthus tuberculatus) 유래의 PPX2L 유전자 산물의 G210 잔기에 상응하는 위치에서 이루어지는, 방법. - 제47항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 동정 또는 단리하는데 유용한 가시적인 표현형인, 방법. - 제47항에 있어서,
상기 변형할 하나 이상의 식물 세포가 바람직하게는 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays) 등의 지 spp. (Zea spp .), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris) 등의 베타 spp., 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 넥수오사 (Cardamine nexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp . sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카야누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 상기 식물들 중 하나에 속하는 품종 또는 아종으로 이루어진 군으로부터 선택되는 식물로부터 유래되는, 방법. - 전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물을 단리하는 방법으로서,
상기 방법인
a. 하나 이상의 제1 타겟화된 프래임쉬프트 또는 결손 변형을 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에, 하나 이상의 제1 부위-특이적인 작동자를 사용해 도입하는 단계로서, 상기 하나 이상의 타겟화된 프래임쉬프트 또는 결손 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계;
b. 하나 이상의 제2 타겟화된 변형을 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 상기 하나 이상의 제2 타겟화된 변형이 뉴클레아제, 재조합효소 또는 DNA 변형 시약 (DNA modification reagent)을 포함하는 하나 이상의 제2 부위-특이적인 작동자를 이용해 도입되어, 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 상기 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로, 하나 이상의 상기 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포에, 또는 상기 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 완전한 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및
c. i. 상기 제1 식물 게놈 타겟 부위에서 상기 하나 이상의 제1 타겟화된 프래임쉬프트 또는 결손 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로,
ii. 상기 제2 식물 게놈 타겟 부위에서 상기 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써,
하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계;
선택적으로,
d. 상기 하나 이상의 제1 타겟화된 변형 및 상기 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을, 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 포함하는 방법. - 제63항에 있어서,
단계 b는 바람직하게는 복구 주형을 도입하여 하나 이상의 제1 및/또는 제2 식물 게놈 타겟 부위에 타겟화된 서열 변환 또는 치환을 만드는 단계를 더 포함하는, 방법. - 제63항에 있어서,
상기 하나 이상의 부위-특이적인 작동자가 Cas 또는 Cpf1 뉴클레아제를 포함하는 CRISPR 뉴클레아제, TALEN, ZFN, 메가뉴클레아제, 아르고너트 (Argonaute) 뉴클레아제, FokI 또는 이의 변이체를 포함하는 제한 엔도뉴클레아제, 재조합효소 또는 2 부위-특이적인 닉킹 엔도뉴클레아제, 또는 이들 작동자의 임의 변이체 또는 촉매학적으로 활성인 단편 중 하나 이상으로부터 선택되는, 방법. - 제63항에 있어서,
상기 하나 이상의 부위-특이적인 작동자가 CRISPR-기반의 뉴클레아제이고, 상기 CRISPR-기반의 뉴클레아제는 부위-특이적인 DNA 결합 도메인을 포함하고, 상기 하나 이상의 CRISPR-기반의 뉴클레아제 또는 이를 코딩하는 핵산 서열이
a. SpCas9, SaCas9, SaKKH-Cas9, VQR-Cas9, St1Cas9를 포함하는, Cas9,
b. AsCpf1, LbCpf1, FnCpf1을 포함하는, Cpf1,
c. CasX, 또는
d. CasY
또는 상기한 CRISPR-기반의 뉴클레아제의 임의 변이체 또는 유도체를 포함하는 군으로부터 선택되고, 선택적으로, 상기 하나 이상의 CRISPR-기반의 뉴클레아제가 해당 야생형 서열과 비교해 돌연변이를 포함하므로, 형성되는 CRISPR-기반의 뉴클레아제는 단일 가닥 특이적인 DNA 닉카제로 또는 모든 DNA 절단력이 결핍된 DNA 결합 작동자로 변환되는, 방법. - 제63항에 있어서,
상기 적어도 부위-특이적인 작동자, 또는 상기 하나 이상의 부위-특이적인 작동자를 포함하는 복합체의 하나 이상의 구성성분이, 하나 이상의 염기 편집 복합체를 세포내 소기관으로의 타겟화하기 위한 하나 이상의 소기관 위치화 신호를 포함하는, 방법. - 제67항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 핵 위치화 신호 (NLS)인, 방법. - 제67항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 엽록체 수송 펩타이드인, 방법. - 제67항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 미토콘드리아 수송 펩타이드인, 방법. - 제63항에 있어서,
상기 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위가 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 게놈 타겟 부위이고, 상기 하나 이상의 표현형으로 선별가능한 형질은 내성/허용성 형질 또는 생장 우세 형질이고, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형이 하나 이상의 변형된 식물 세포, 조직 또는 식물, 또는 그 자손에 부가될 화합물 또는 촉발제에 대해 내성/허용성 또는 생장 우세를 부여하는, 방법. - 제63항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 대상 형질이 하나 이상의 내인성 유전자이거나 또는 이에 의해 코딩되거나, 또는 상기 하나 이상의 대상 표현형 형질이 하나 이상의 전이유전자이거나 또는 이에 의해 코딩되고, 여기서 상기 하나 이상의 내인성 유전자 또는 하나 이상의 전이유전자가, 하나 이상의 대상 표현형 형질에 하나 이상의 변형이 결핍된 세포를 저해, 손상 또는 사멸시키는, 식물독소, 바람직하게는 제초제에 대한 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형 형질을 코딩하거나, 또는 상기 하나 이상의 표현형 형질이 세포 분열; 증식 속도; 배발생; 또는 비-변형된 세포, 조직, 기관 또는 식물과 비교해 변형된 세포, 조직, 기관 또는 식물에 이점을 제공하는 다른 표현형으로 선별가능한 특성의 부스터 (booster)로 이루어진 군으로부터 선택되는, 방법. - 제63항에 있어서,
상기 하나 이상의 제1 식물 게놈 타겟 부위가 제초제 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 하나 이상의 내인성 유전자 또는 전이유전자이고, 여기서 상기 제초제 내성/허용성이 글리포세이트를 포함하는 EPSPS-저해제에 대한 내성/허용성, 글루포시네이트를 포함하는 글루타민 합성 저해제에 대한 내성/허용성, 이미다졸린 또는 설포닐우레아를 포함하는 ALS- 또는 AHAS-저해제에 대한 내성/허용성, 아릴옥시페녹시프로피오네이트 (FOP)를 포함하는 ACCase 저해제에 대한 내성/허용성, 피토엔 데세투라제 단계에서 카로티노이드 생합성의 저해제, 4-하이드록시페닐-피루베이트-다이옥시게나제 (HPPD)의 저해제 또는 기타 카로티노이드 생합성 타겟의 저해제를 포함하는 카로티노이드 생합성 저해제에 대한 내성/허용성, 셀룰로스 저해제에 대한 내성/허용성, 지질 합성 저해제에 대한 내성/허용성, 장쇄 지방산 저해제에 대한 내성/허용성, 미소관 조립 저해제에 대한 내성/허용성, 광화학계 I 전자 전환체에 대한 내성/허용성, 카바메이트, 트리아진 및 트리아지논을 포함하는 광화학계 II 저해제에 대한 내성/허용성, PPO-저해제에 대한 내성/허용성 및 디캄바 (2,4-다이클로로페녹시아세트산)를 포함하는 합성 옥신에 대한 내성/허용성으로 이루어진 군으로부터 선택되는, 방법. - 제63항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 식물독성 내성/허용성 형질, 바람직하게는 제초제 내성/허용성 형질이고, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 프래임쉬프트 또는 결손 변형이 식물독성 화합물, 바람직하게는 제초제에 대한 내성/허용성을 부여하며, 상기 화합물이 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물, 또는 그 자손에 부가될 외인성 화합물인, 방법. - 제63항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 동정 또는 단리하는데 유용한 가시적인 표현형인, 방법. - 제75항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 광택 표현형인, 방법. - 제75항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 골든 표현형인, 방법. - 제75항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 색소 표현형인, 방법. - 제75항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 생장 우세 표현형인, 방법. - 제63항에 있어서,
상기 변형할 하나 이상의 식물 세포가, 바람직하게는 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays) 등의 지 spp. (Zea spp .), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris) 등의 베타 spp., 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 넥수오사 (Cardamine nexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp . sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카야누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 상기 식물들 중 하나에 속하는 품종 또는 아종으로 이루어진 군으로부터 선택되는 식물로부터 유래되는, 방법. - 제1항에 따른 방법에 의해 수득가능한 식물 세포, 조직, 기관, 물질 또는 완전한 식물, 또는 이들의 자손.
- 제47항에 따른 방법에 의해 수득가능한 식물 세포, 조직, 기관, 물질 또는 완전한 식물, 또는 이들의 자손.
- 제63항에 따른 방법에 의해 수득가능한 식물 세포, 조직, 기관, 물질 또는 완전한 식물, 또는 이들의 자손.
- 게놈 편집에 의해 유전자 변형된 식물을 제조하는 방법으로서,
상기 방법은
a) 유전자 변형할 식물의 세포 또는 조직을 제공하는 단계;
b) 제1 게놈 편집 시스템 및 제2 게놈 편집 시스템을 제공하는 단계로서, 상기 제1 게놈 편집 시스템은 식물 선별가능한 마커 유전자를 타겟하여 변형시킬 수 있고, 상기 제2 게놈 편집 시스템은 식물에서 대상 유전자를 타겟하여 변형시킬 수 있는, 단계;
c) 세포 또는 조직을 상기 제1 및 제2 게놈 편집 시스템으로 공동-형질전환하는 단계;
d) 형질전환된 세포 또는 조직으로부터, 바람직하게는 선택압 (selection pressure) 없이 식물을 재생하는 단계;
e) 단계 d)에서 재생된 식물에서 선별가능한 마커 유전자가 변형된 식물을 선별하는 단계; 및
f) 단계 e)에서 선별된 식물로부터 타겟 유전자가 변형된 식물을 동정하는 단계를 포함하는, 방법. - 제84항에 있어서,
상기 게놈 편집 시스템이 PBE (정확한 염기 편집기 (precise base editor)) 시스템, CRISPR-Cas9 시스템, CRISPR-Cpfl 시스템, CRISPRi 시스템, 징크 핑거 뉴클레아제 시스템 및 TALEN 시스템으로부터 선택되는, 방법. - 제84항에 있어서,
상기 선별가능한 마커 유전자의 변형으로 식물에서 선별가능한 형질이 발현되고, 바람직하게는 상기 선별가능한 마커 유전자의 변형이 식물의 다른 형질은 변형시키지 않는, 방법. - 제86항에 있어서,
상기 선별가능한 형질이 제초제 내성인, 방법. - 제87항에 있어서,
상기 선별가능한 마커 유전자가 sbA, ALS, EPSPS, ACCase, PPO, HPPD, PDS, GS, DOXPS 및 P450로 이루어진 군으로부터 선택되는, 방법. - 제86항에 있어서,
상기 선별가능한 형질이 엽설 (ligule), 잎의 색, 잎 광택과 같은 가시적으로-관찰가능한 형질인, 방법. - 제87항에 있어서,
상기 선별가능한 마커 유전자가 LIG, PDS, zb7 및 GL2로 이루어진 군으로부터 선택되는, 방법. - 제84항 내지 제90항 중 어느 한 항에 있어서,
상기 제1 및 제2 게놈 편집 시스템이 정확한 염기 편집기 (PBE) 시스템인, 방법. - 제84항 내지 제91항 중 어느 한 항에 있어서,
상기 식물이 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays) 등의 지 spp. (Zea spp .), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris) 등의 베타 spp., 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 넥수오사 (Cardamine nexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp . sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카야누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 상기 식물들 중 하나에 속하는 품종 또는 아종으로 이루어진 군으로부터 선택되는, 방법. - 제84항의 방법에 의해 수득가능하며, 바람직하게는 전이유전자가 없는 (transgene-free), 유전자 변형된 식물.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020227033631A KR20220137166A (ko) | 2017-05-05 | 2018-05-07 | 전이유전자성 마커 서열을 이용하지 않는 세포 단리 방법 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762502418P | 2017-05-05 | 2017-05-05 | |
US62/502,418 | 2017-05-05 | ||
CN201710778196 | 2017-09-01 | ||
CN201710778196.0 | 2017-09-01 | ||
PCT/CN2018/085829 WO2018202199A1 (en) | 2017-05-05 | 2018-05-07 | Methods for isolating cells without the use of transgenic marker sequences |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227033631A Division KR20220137166A (ko) | 2017-05-05 | 2018-05-07 | 전이유전자성 마커 서열을 이용하지 않는 세포 단리 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200004382A true KR20200004382A (ko) | 2020-01-13 |
Family
ID=68695561
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227033631A KR20220137166A (ko) | 2017-05-05 | 2018-05-07 | 전이유전자성 마커 서열을 이용하지 않는 세포 단리 방법 |
KR1020197036090A KR20200004382A (ko) | 2017-05-05 | 2018-05-07 | 전이유전자성 마커 서열을 이용하지 않는 세포 단리 방법 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227033631A KR20220137166A (ko) | 2017-05-05 | 2018-05-07 | 전이유전자성 마커 서열을 이용하지 않는 세포 단리 방법 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20210230616A1 (ko) |
EP (1) | EP3635118A4 (ko) |
JP (1) | JP2020518253A (ko) |
KR (2) | KR20220137166A (ko) |
CN (1) | CN117051035A (ko) |
AU (1) | AU2018263195B2 (ko) |
BR (1) | BR112019022737A2 (ko) |
CA (1) | CA3062475A1 (ko) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210047651A1 (en) * | 2019-07-12 | 2021-02-18 | The Regents Of The University Of California | Compositions and methods for targeted insertion of selectable marker-free dna sequence in plants |
CA3159682A1 (en) * | 2019-11-07 | 2021-05-14 | Qingdao Kingagroot Chemical Compound Co., Ltd. | Method for generating new mutations in organisms, and application thereof |
TW202408595A (zh) * | 2022-06-16 | 2024-03-01 | 美商英特利亞醫療公司 | 用於對細胞進行遺傳修飾之方法及組合物 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003083118A1 (fr) * | 2002-03-29 | 2003-10-09 | Kumiai Chemical Industry Co., Ltd. | Genes codant l'acetolactase synthase |
AR051690A1 (es) * | 2004-12-01 | 2007-01-31 | Basf Agrochemical Products Bv | Mutacion implicada en el aumento de la tolerancia a los herbicidas imidazolinona en las plantas |
AR074941A1 (es) * | 2009-01-07 | 2011-02-23 | Bayer Cropscience Sa | Plantas transplastomicas exentas de marcador de seleccion |
UA112969C2 (uk) * | 2010-08-03 | 2016-11-25 | Сібас Юс Ллс | Рослина, стійка до одного або більше ррх-інгібуючих гербіцидів, яка містить мутантний ген протопорфіриноген ix оксидази (ррх) |
CA2908512C (en) * | 2013-04-05 | 2023-10-24 | Dow Agrosciences Llc | Methods and compositions for integration of an exogenous sequence within the genome of plants |
US9404792B2 (en) * | 2013-07-01 | 2016-08-02 | Raytheon Company | Auto-alignment system for high precision masted head mirror |
MX361154B (es) * | 2013-08-22 | 2018-11-28 | Pioneer Hi Bred Int | Modificación del genoma usando sistemas guía de polinucleótido/cas endonucleasa y métodos de uso. |
CN111471675A (zh) * | 2014-03-05 | 2020-07-31 | 国立大学法人神户大学 | 特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体 |
UA125246C2 (uk) * | 2015-03-16 | 2022-02-09 | Інстітьют Оф Генетікс Енд Дівелопментл Байолоджі, Чайніз Екадемі Оф Сайнсис | Спосіб здійснення сайт-спрямованої модифікації рослинних геномів із застосуванням неуспадковуваних матеріалів |
BR112018008109A2 (pt) * | 2015-10-20 | 2018-11-06 | Pioneer Hi Bred Int | métodos para modificar uma sequência de nucleotídeos no genoma de uma célula vegetal, produzir uma planta, produzir tecido de calo de planta que tem uma sequência de nucleotídeos modificada em seu genoma sem o uso de um marcador selecionável, e planta de progênie da planta |
-
2018
- 2018-05-07 CN CN202311021129.6A patent/CN117051035A/zh active Pending
- 2018-05-07 BR BR112019022737A patent/BR112019022737A2/pt not_active Application Discontinuation
- 2018-05-07 KR KR1020227033631A patent/KR20220137166A/ko not_active Application Discontinuation
- 2018-05-07 AU AU2018263195A patent/AU2018263195B2/en not_active Withdrawn - After Issue
- 2018-05-07 CA CA3062475A patent/CA3062475A1/en not_active Abandoned
- 2018-05-07 EP EP18794967.2A patent/EP3635118A4/en active Pending
- 2018-05-07 JP JP2019560164A patent/JP2020518253A/ja active Pending
- 2018-05-07 KR KR1020197036090A patent/KR20200004382A/ko active Application Filing
- 2018-05-07 US US16/610,782 patent/US20210230616A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
KR20220137166A (ko) | 2022-10-11 |
EP3635118A1 (en) | 2020-04-15 |
EP3635118A4 (en) | 2021-01-27 |
CA3062475A1 (en) | 2018-11-08 |
AU2018263195B2 (en) | 2022-04-07 |
BR112019022737A2 (pt) | 2020-05-19 |
JP2020518253A (ja) | 2020-06-25 |
US20210230616A1 (en) | 2021-07-29 |
AU2018263195A1 (en) | 2019-12-19 |
CN117051035A (zh) | 2023-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108795972B (zh) | 不使用转基因标记序列分离细胞的方法 | |
EP3574101B1 (en) | Repair template linkage to endonucleases for genome engineering | |
JP7047014B2 (ja) | オリゴヌクレオチド仲介型遺伝子修復を使用した標的遺伝子修飾の効率を高めるための方法および組成物 | |
JP6947784B2 (ja) | オリゴヌクレオチド仲介型遺伝子修復を使用した標的遺伝子修飾の効率を高めるための方法および組成物 | |
US20190161760A1 (en) | Hybrid nucleic acid sequences for genome engineering | |
CN111263810A (zh) | 使用多核苷酸指导的核酸内切酶的细胞器基因组修饰 | |
JP2018531024A (ja) | マーカーフリーゲノム改変のための方法および組成物 | |
JP2018531024A6 (ja) | マーカーフリーゲノム改変のための方法および組成物 | |
WO2019153902A1 (zh) | 植物基因组定点替换的方法 | |
CN113473845A (zh) | 经由基因组编辑进行基因沉默 | |
KR20200004382A (ko) | 전이유전자성 마커 서열을 이용하지 않는 세포 단리 방법 | |
AU2018309648A1 (en) | Methods and compositions for targeted genomic insertion | |
CN114686456B (zh) | 基于双分子脱氨酶互补的碱基编辑系统及其应用 | |
CN117858952A (zh) | 编辑香蕉基因的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X601 | Decision of rejection after re-examination | ||
A107 | Divisional application of patent | ||
J201 | Request for trial against refusal decision | ||
N231 | Notification of change of applicant | ||
J301 | Trial decision |
Free format text: TRIAL NUMBER: 2022101001763; TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20220927 Effective date: 20230926 |