KR20220144317A - Crispr 시스템을 이용한 유전자 발현 조절 시스템 - Google Patents
Crispr 시스템을 이용한 유전자 발현 조절 시스템 Download PDFInfo
- Publication number
- KR20220144317A KR20220144317A KR1020220043768A KR20220043768A KR20220144317A KR 20220144317 A KR20220144317 A KR 20220144317A KR 1020220043768 A KR1020220043768 A KR 1020220043768A KR 20220043768 A KR20220043768 A KR 20220043768A KR 20220144317 A KR20220144317 A KR 20220144317A
- Authority
- KR
- South Korea
- Prior art keywords
- protein
- seq
- dcas12f1
- cas12f1
- region
- Prior art date
Links
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 234
- 230000014509 gene expression Effects 0.000 title claims abstract description 233
- 230000001105 regulatory effect Effects 0.000 title claims abstract description 103
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000010354 CRISPR gene editing Methods 0.000 title abstract description 173
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 915
- 108020001507 fusion proteins Proteins 0.000 claims abstract description 467
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 460
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 249
- 102000004169 proteins and genes Human genes 0.000 claims description 785
- 235000018102 proteins Nutrition 0.000 claims description 783
- 238000013518 transcription Methods 0.000 claims description 308
- 230000035897 transcription Effects 0.000 claims description 308
- 239000002773 nucleotide Substances 0.000 claims description 239
- 125000003729 nucleotide group Chemical group 0.000 claims description 239
- 150000001413 amino acids Chemical class 0.000 claims description 227
- 230000002401 inhibitory effect Effects 0.000 claims description 197
- 102000006890 Methyl-CpG-Binding Protein 2 Human genes 0.000 claims description 123
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 claims description 123
- 150000007523 nucleic acids Chemical class 0.000 claims description 111
- 239000013598 vector Substances 0.000 claims description 91
- 210000004027 cell Anatomy 0.000 claims description 78
- 102000039446 nucleic acids Human genes 0.000 claims description 78
- 108020004707 nucleic acids Proteins 0.000 claims description 78
- 230000002103 transcriptional effect Effects 0.000 claims description 74
- 125000006850 spacer group Chemical group 0.000 claims description 73
- 235000001014 amino acid Nutrition 0.000 claims description 65
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 claims description 58
- 238000010446 CRISPR interference Methods 0.000 claims description 56
- 235000004279 alanine Nutrition 0.000 claims description 42
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 38
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 claims description 37
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 36
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 claims description 36
- 230000000295 complement effect Effects 0.000 claims description 34
- 239000000203 mixture Substances 0.000 claims description 32
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 26
- 235000003704 aspartic acid Nutrition 0.000 claims description 26
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 claims description 26
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 26
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 claims description 26
- 229940045145 uridine Drugs 0.000 claims description 26
- 239000013603 viral vector Substances 0.000 claims description 25
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 21
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 21
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims description 21
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 21
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 21
- 239000004474 valine Substances 0.000 claims description 21
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 claims description 18
- 239000004475 Arginine Substances 0.000 claims description 18
- 239000002126 C01EB10 - Adenosine Substances 0.000 claims description 18
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 claims description 18
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 claims description 18
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 claims description 18
- 229960005305 adenosine Drugs 0.000 claims description 18
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 18
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 claims description 18
- 229940029575 guanosine Drugs 0.000 claims description 18
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims description 13
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 13
- 238000002716 delivery method Methods 0.000 claims description 12
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 12
- 241000702421 Dependoparvovirus Species 0.000 claims description 11
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 9
- 235000013922 glutamic acid Nutrition 0.000 claims description 9
- 239000004220 glutamic acid Substances 0.000 claims description 9
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 claims description 8
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 claims description 8
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 claims description 7
- 241000700584 Simplexvirus Species 0.000 claims description 7
- 108090000353 Histone deacetylase Proteins 0.000 claims description 6
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 claims description 6
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims description 6
- 241000701161 unidentified adenovirus Species 0.000 claims description 6
- 241000713666 Lentivirus Species 0.000 claims description 5
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 5
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 5
- 241000700618 Vaccinia virus Species 0.000 claims description 5
- 239000013612 plasmid Substances 0.000 claims description 5
- 241001430294 unidentified retrovirus Species 0.000 claims description 5
- 102100031149 Deoxyribonuclease gamma Human genes 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 4
- 108010031616 deoxyribonuclease gamma Proteins 0.000 claims description 4
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 4
- 108010077544 Chromatin Proteins 0.000 claims description 3
- 210000003483 chromatin Anatomy 0.000 claims description 3
- 230000001939 inductive effect Effects 0.000 claims description 3
- 230000000903 blocking effect Effects 0.000 claims description 2
- 102000003964 Histone deacetylase Human genes 0.000 claims 2
- 239000013600 plasmid vector Substances 0.000 claims 1
- 102100021455 Histone deacetylase 3 Human genes 0.000 description 106
- 101000899282 Homo sapiens Histone deacetylase 3 Proteins 0.000 description 106
- 230000005764 inhibitory process Effects 0.000 description 83
- 230000004048 modification Effects 0.000 description 73
- 238000012986 modification Methods 0.000 description 73
- 108091028113 Trans-activating crRNA Proteins 0.000 description 49
- 230000004913 activation Effects 0.000 description 39
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 38
- 108091028043 Nucleic acid sequence Proteins 0.000 description 35
- 239000002585 base Substances 0.000 description 30
- 230000009466 transformation Effects 0.000 description 30
- 230000000694 effects Effects 0.000 description 28
- 102000004190 Enzymes Human genes 0.000 description 21
- 108090000790 Enzymes Proteins 0.000 description 21
- 108020004414 DNA Proteins 0.000 description 20
- 239000012636 effector Substances 0.000 description 20
- 230000033228 biological regulation Effects 0.000 description 19
- 210000004899 c-terminal region Anatomy 0.000 description 16
- 230000008685 targeting Effects 0.000 description 16
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 15
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 14
- 230000001737 promoting effect Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 9
- 230000004927 fusion Effects 0.000 description 9
- 238000010276 construction Methods 0.000 description 8
- 239000000539 dimer Substances 0.000 description 8
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 8
- 230000010076 replication Effects 0.000 description 8
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 8
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 8
- 241000282414 Homo sapiens Species 0.000 description 7
- 230000027455 binding Effects 0.000 description 7
- 239000003623 enhancer Substances 0.000 description 7
- 238000010362 genome editing Methods 0.000 description 7
- 102100038720 Histone deacetylase 9 Human genes 0.000 description 6
- 101150094724 PCSK9 gene Proteins 0.000 description 6
- 102000040945 Transcription factor Human genes 0.000 description 6
- 108091023040 Transcription factor Proteins 0.000 description 6
- 230000009977 dual effect Effects 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 239000002105 nanoparticle Substances 0.000 description 6
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 5
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 5
- 238000003776 cleavage reaction Methods 0.000 description 5
- 230000000052 comparative effect Effects 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 230000007017 scission Effects 0.000 description 5
- 229940104230 thymidine Drugs 0.000 description 5
- 108091093088 Amplicon Proteins 0.000 description 4
- 238000010453 CRISPR/Cas method Methods 0.000 description 4
- 241000282472 Canis lupus familiaris Species 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 4
- 101710096438 DNA-binding protein Proteins 0.000 description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 102000034356 gene-regulatory proteins Human genes 0.000 description 4
- 108091006104 gene-regulatory proteins Proteins 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 241000701022 Cytomegalovirus Species 0.000 description 3
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 3
- 108091061960 Naked DNA Proteins 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000007385 chemical modification Methods 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 230000005782 double-strand break Effects 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 150000003833 nucleoside derivatives Chemical class 0.000 description 3
- 230000003584 silencer Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 2
- 235000011330 Armoracia rusticana Nutrition 0.000 description 2
- 240000003291 Armoracia rusticana Species 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 108010008945 General Transcription Factors Proteins 0.000 description 2
- 102000006580 General Transcription Factors Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 102000002488 Nucleoplasmin Human genes 0.000 description 2
- 102100039087 Peptidyl-alpha-hydroxyglycine alpha-amidating lyase Human genes 0.000 description 2
- 229920002873 Polyethylenimine Polymers 0.000 description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 108091005948 blue fluorescent proteins Proteins 0.000 description 2
- 210000003855 cell nucleus Anatomy 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- SPTYHKZRPFATHJ-HYZXJONISA-N dT6 Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)CO)[C@@H](O)C1 SPTYHKZRPFATHJ-HYZXJONISA-N 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 230000030147 nuclear export Effects 0.000 description 2
- 230000025308 nuclear transport Effects 0.000 description 2
- 108060005597 nucleoplasmin Proteins 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 230000004850 protein–protein interaction Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 239000013607 AAV vector Substances 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 206010061692 Benign muscle neoplasm Diseases 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 101100421200 Caenorhabditis elegans sep-1 gene Proteins 0.000 description 1
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N DMSO Substances CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 1
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 108091005772 HDAC11 Proteins 0.000 description 1
- -1 HcRED Proteins 0.000 description 1
- 102100039996 Histone deacetylase 1 Human genes 0.000 description 1
- 102100039385 Histone deacetylase 11 Human genes 0.000 description 1
- 102100039999 Histone deacetylase 2 Human genes 0.000 description 1
- 102100021454 Histone deacetylase 4 Human genes 0.000 description 1
- 102100021453 Histone deacetylase 5 Human genes 0.000 description 1
- 102100022537 Histone deacetylase 6 Human genes 0.000 description 1
- 102100038715 Histone deacetylase 8 Human genes 0.000 description 1
- 101001035024 Homo sapiens Histone deacetylase 1 Proteins 0.000 description 1
- 101001035011 Homo sapiens Histone deacetylase 2 Proteins 0.000 description 1
- 101000899259 Homo sapiens Histone deacetylase 4 Proteins 0.000 description 1
- 101000899255 Homo sapiens Histone deacetylase 5 Proteins 0.000 description 1
- 101000899330 Homo sapiens Histone deacetylase 6 Proteins 0.000 description 1
- 101001032113 Homo sapiens Histone deacetylase 7 Proteins 0.000 description 1
- 101001032118 Homo sapiens Histone deacetylase 8 Proteins 0.000 description 1
- 101001032092 Homo sapiens Histone deacetylase 9 Proteins 0.000 description 1
- 101001035694 Homo sapiens Polyamine deacetylase HDAC10 Proteins 0.000 description 1
- 101000600434 Homo sapiens Putative uncharacterized protein encoded by MIR7-3HG Proteins 0.000 description 1
- 101000740205 Homo sapiens Sal-like protein 1 Proteins 0.000 description 1
- 101000874241 Homo sapiens Sin3 histone deacetylase corepressor complex component SDS3 Proteins 0.000 description 1
- 101000798089 Homo sapiens tRNA (cytosine(38)-C(5))-methyltransferase Proteins 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100078999 Mus musculus Mx1 gene Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 201000004458 Myoma Diseases 0.000 description 1
- WWGBHDIHIVGYLZ-UHFFFAOYSA-N N-[4-[3-[[[7-(hydroxyamino)-7-oxoheptyl]amino]-oxomethyl]-5-isoxazolyl]phenyl]carbamic acid tert-butyl ester Chemical compound C1=CC(NC(=O)OC(C)(C)C)=CC=C1C1=CC(C(=O)NCCCCCCC(=O)NO)=NO1 WWGBHDIHIVGYLZ-UHFFFAOYSA-N 0.000 description 1
- 101150085710 OCT4 gene Proteins 0.000 description 1
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 1
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 1
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 1
- 102100039388 Polyamine deacetylase HDAC10 Human genes 0.000 description 1
- 102100037401 Putative uncharacterized protein encoded by MIR7-3HG Human genes 0.000 description 1
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 102100037204 Sal-like protein 1 Human genes 0.000 description 1
- 102100029064 Serine/threonine-protein kinase WNK1 Human genes 0.000 description 1
- 102100035738 Sin3 histone deacetylase corepressor complex component SDS3 Human genes 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 101710132316 Transactivation protein Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 102000009899 alpha Karyopherins Human genes 0.000 description 1
- 108010077099 alpha Karyopherins Proteins 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000006196 deacetylation Effects 0.000 description 1
- 238000003381 deacetylation reaction Methods 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 108700032552 influenza virus INS1 Proteins 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 102000013415 peroxidase activity proteins Human genes 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 102100032270 tRNA (cytosine(38)-C(5))-methyltransferase Human genes 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 241000202362 uncultured archaeon Species 0.000 description 1
- 210000001364 upper extremity Anatomy 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 238000012418 validation experiment Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/095—Fusion polypeptide containing a localisation/targetting motif containing a nuclear export signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Saccharide Compounds (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 CRISPR 조절 시스템에 관한 것이다. 보다 구체적으로, 본 발명은 표적 유전자의 발현을 효과적으로 조절하기 위한 Cas12f1 융합 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는 CRISPR 조절 시스템 및 이의 이용에 관한 것이다. 또한, 본 발명은 Cas12f1 융합 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는 CRISPR 조절 시스템을 이용한 표적 유전자의 발현 조절 방법에 관한 것이다.
Description
본 발명은 CRISPR 기술을 이용한 유전자 발현 조절 시스템에 관한 것이다. 보다 구체적으로, 본 발명은 표적 유전자의 발현을 효과적으로 조절하기 위한 Cas12f1 융합 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는 CRISPR 기술을 이용한 유전자 발현 조절 시스템(CRISRP 조절 시스템으로 약칭함) 및 이의 이용에 관한 것이다.
CRISRP 조절 시스템은 CRISPR/Cas 시스템을 이용한 표적 유전자의 발현을 조절하는 기술로, 현재 가장 많이 연구된 CRISPR/Cas9 시스템을 이용하여 개발되고 있다. 일반적으로, CRISPR 조절 시스템은 가이드 RNA와 유전자의 전사를 조절하는 도메인을 포함하는 dCas9 융합 단백질을 이용하는 것을 특징으로 한다. 이때, Cas9 단백질에 융합되는 전사 조절 도메인의 종류에 따라 CRISPR 조절 시스템은 CRISPR activation 시스템과 CRISPR interference 시스템으로 분류된다. 이러한 CRISPR 조절 시스템은 특정 유전자가 과발현되거나 적게 발현되는 경우 특정 유전자의 발현을 조절하기 위해 효과적인 해결책으로 이용될 수 있다. 하지만, CRISPR 조절 시스템에 주로 이용되는 dCas9 단백질은 그 크기가 커서 CRISPR 조절 시스템을 위한 융합 단백질을 만들고 이를 세포에 전달하기 위해 AAV 등의 벡터에 패키징 하는데 어려움이 있다. 이러한 문제를 해결하기 위해, Cas9 단백질을 split 하여 여러 벡터로 세포 내 전달하는 방법 및 상대적으로 크기가 작은 Cas 단백질의 개발 및 이의 적용 등의 노력으로 해결책을 모색하고 있는 상황이다.
본 명세서에서는 표적 유전자의 발현을 억제하기 위한 유전자 발현 조절용 조성물을 제공하고자 한다.
본 명세서에서는 표적 유전자의 발현을 억제하기 위한 유전자 발현 조절용 조성물을 이용한 유전자 발현 억제 방법을 제공하고자 한다.
본 명세서에서는 표적 유전자의 발현을 촉진하기 위한 유전자 발현 조절용 조성물을 제공하고자 한다.
본 명세서에서는 표적 유전자의 발현을 촉진하기 위한 유전자 발현 조절용 조성물을 이용한 유전자 발현 촉진 방법을 제공하고자 한다.
상기 과제를 해결하기 위해, 본 명세서는 다음을 포함하는, 표적 유전자의 발현을 억제하기 위한, 유전자 발현 조절용 조성물을 제공한다:
전사 저해 Cas12f1 융합 단백질 또는 이를 암호화하는 핵산; 및
엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산,
이때, 상기 전사 저해 Cas12f1 융합 단백질은 dead Cas12f1(dCas12f1) 단백질 및 전사 저해 단백질을 포함하고,
상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 326번째 아미노산인 아스파트산(D), 422번째 아미노산인 글루탐산(E), 490번째 아미노산인 아르기닌(R) 또는 510번째 아미노산인 아스파트산(D)이 알라닌(A), 글루타민(Q), 류신(L), 트립토판(W) 또는 발린(V)으로 치환된 것이며,
상기 전사 저해 단백질은 유전자의 전사를 저해 또는 억제하는 단백질 또는 펩타이드이며,
이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 다음을 포함하고:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA의 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 상기 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이뤄진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이뤄진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이뤄진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3'.
상기 과제를 해결하기 위해, 본 명세서에서는 다음을 포함하는, 세포 내에서 표적 유전자의 발현을 억제하는 방법을 제공한다:
전사 저해 Cas12f1 융합 단백질 또는 이를 암호화하는 핵산; 및 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 세포 내로 전달하는 것,
이로 인해 상기 세포 내에서 CRISPR interference 복합체가 형성될 수 있으며,
이로 인해 상기 표적 유전자의 전사가 CRISPR interference 복합체에 의해 억제될 수 있고,
이때, 상기 전사 저해 Cas12f1 융합 단백질은 dead Cas12f1(dCas12f1) 단백질 및 전사 저해 단백질을 포함하고,
상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 326번째 아미노산인 아스파트산(D), 422번째 아미노산인 글루탐산(E), 490번째 아미노산인 아르기닌(R) 또는 510번째 아미노산인 아스파트산(D)이 알라닌(A), 글루타민(Q), 류신(L), 트립토판(W) 또는 발린(V)으로 치환된 것이며,
상기 전사 저해 단백질은 유전자의 전사를 저해 또는 억제하는 단백질 또는 펩타이드이며,
이때, 엔지니어링 된 가이드 Cas12f1 RNA는 다음을 포함하고:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
이때, 상기 엔지니어링 된 가이드 Cas12f1 RNA의 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이뤄진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이뤄진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이뤄진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3'.
상기 과제를 해결하기 위해, 본 명세서는 다음을 포함하는, 표적 유전자의 발현을 촉진하기 위한, 유전자 발현 조절용 조성물을 제공한다:
전사 활성 Cas12f1 융합 단백질 또는 이를 암호화하는 핵산; 및
엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산,
이때, 상기 전사 활성 Cas12f1 융합 단백질은 dead Cas12f1(dCas12f1) 단백질 및 전사 활성 단백질을 포함하고,
상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 326번째 아미노산인 아스파트산(D), 422번째 아미노산인 글루탐산(E), 490번째 아미노산인 아르기닌(R) 또는 510번째 아미노산인 아스파트산(D)이 알라닌(A), 글루타민(Q), 류신(L), 트립토판(W) 또는 발린(V)으로 치환된 것이며,
상기 전사 활성 단백질은 인핸서 또는 프로모터 근위 요소(promoter-proximal element)에 결합할 수 있는 DNA 결합 단백질 또는 DNA 결합 펩타이드이며,
이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 다음을 포함하고:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA의 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 상기 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이뤄진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이뤄진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이뤄진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3'.
상기 과제를 해결하기 위해, 본 명세서에서는 다음을 포함하는, 세포 내에서 표적 유전자의 발현을 촉진하는 방법을 제공한다:
전사 활성 Cas12f1 융합 단백질 또는 이를 암호화하는 핵산; 및 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 세포 내로 전달하는 것,
이로 인해 상기 세포 내에서 CRISPR activation 복합체가 형성될 수 있으며,
이로 인해 상기 표적 유전자의 전사가 CRISPR activation 복합체에 의해 억제될 수 있고,
이때, 상기 전사 활성 Cas12f1 융합 단백질은 dead Cas12f1(dCas12f1) 단백질 및 전사 활성 단백질을 포함하고,
상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 326번째 아미노산인 아스파트산(D), 422번째 아미노산인 글루탐산(E), 490번째 아미노산인 아르기닌(R) 또는 510번째 아미노산인 아스파트산(D)이 알라닌(A), 글루타민(Q), 류신(L), 트립토판(W) 또는 발린(V)으로 치환된 것이며,
상기 전사 활성 단백질은 인핸서 또는 프로모터 근위 요소(promoter-proximal element)에 결합할 수 있는 DNA 결합 단백질 또는 DNA 결합 펩타이드이며,
이때, 엔지니어링 된 가이드 Cas12f1 RNA는 다음을 포함하고:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
이때, 상기 엔지니어링 된 가이드 Cas12f1 RNA의 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이뤄진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이뤄진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이뤄진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3'.
본 명세서에서 제공하는 Cas12f1 융합 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는 CRISPR 발현 조절 시스템을 이용하면, 표적 유전자의 발현을 조절할 수 있다. 구체적으로, 전사 저해 Cas12f1 융합 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는 CRISPR 발현 조절 시스템을 사용하는 경우, 표적 유전자의 발현을 억제할 수 있다. 또한, 전사 활성 Cas12f1 융합 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는 CRISPR 발현 조절 시스템을 사용하는 경우, 표적 유전자의 발현을 촉진할 수 있다.
도 1은 본 명세서에서 개시하는 엔지니어링 된 Cas12f1 가이드 RNA를 예시적으로 나타낸 모식도이다.
도 2 내지 도 5는 실험예 2에 개시된 실시예 중, DY2를 표적으로 하는 Example 1.1.1 내지 Example 1.1.13에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 6 내지 도 9는 실험예 2에 개시된 실시예 중, DY10을 표적으로 하는 Example 1.2.1 내지 Example 1.2.13에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 10 내지 도 13은 실험예 2에 개시된 실시예 중, Intergenic22를 표적으로 하는 Example 1.3.1 내지 Example 1.3.13에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 14 내지 도 15는 실험예 2에 개시된 실시예 중, DY2를 표적으로 하는 Comparative Example 1.1.1, DY10을 표적으로 하는 Comparative Example 1.2.1, 및 각각의 Control의 Indel 효율을 나타낸 그래프이다.
도 16 내지 도 17은 실험예 3.1에 개시된 실시예 중 DY2를 표적으로 하는 Example 2.1.1 내지 Example 2.1.15에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 18 내지 도 19는 실험예 3.1에 개시된 실시예 중, DY10을 표적으로 하는 Example 2.2.1 내지 Example 2.2.15에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 20 내지 도 21은 실험예 3.2에 개시된 실시예 중 DY2를 표적으로 하는 Example 3.1.1 내지 Example 3.1.12에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 22 내지 도 23는 실험예 3.2에 개시된 실시예 중, DY10을 표적으로 하는 Example 3.2.1 내지 Example 3.2.12에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 24 내지 도 26은 실험예 4.1에 개시된 각각의 실시예에 대한 평균 indel 효율을 나타낸 그래프이다. FUS를 표적으로 하는 Example 4.4.1 내지 Example 4.4.4, GAK를 표적으로 하는 Example 4.5.1 내지 Example 4.5.2, 및 MLH를 표적으로 하는 Example 4.6.1에 대한 평균 indel 효율이 각각 도시되어 있다. 이때, Ex는 Example을 나타내는 약어이다.
도 27은 실험예 5의 Large scale validation 실험 결과를 나타낸 것이다.
도 28은 실험예 6의 in vitro cleavage assay 결과를 나타낸 것이다.
도 29는 다양한 dead Cas12f1의 cleavage 활성 제거 유무를 확인한 결과를 나타낸 것이다.
도 30은 전사 저해 Cas12f1 융합 단백질의 다양한 모듈 설계를 모식화하여 나타낸 것이다.
도 31은 다양하게 설계된 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 32는 다양하게 설계된 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 33은 다양하게 설계된 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 34는 다양하게 설계된 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 35는 KRAB을 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 36은 DNMT를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 37은 KRAB과 MeCP2를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 38은 KRAB을 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 39는 KRAB과 MeCP2를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 40은 복수 개의 KRAB을 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 41은 복수 개의 KRAB과 MeCP2를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 42는 HDAC를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 43은 KRAB과 MeCP2를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 44는 복수 개의 KRAB과 MeCP2를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 45는 KRAB과 MeCP2를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 46은 PCSK9 유전자의 발현 저해 효과를 확인하기 위해 promoter에 위치하는 타겟을 선정하여 indel 효율을 확인한 결과를 나타낸 것이다.
도 47은 타겟팅 효율을 높이기 위하여 guide RNA optimization, spacer optimization한 결과를 나타낸 것이다.
도 48은 타겟팅 효율을 높이기 위하여 guide RNA optimization, spacer optimization한 결과를 나타낸 것이다.
도 49는 최적의 guide RNA를 이용해 PCSK9 유전자의 promoter에 위치하는 타겟에 대한 indel 효율을 확인한 결과를 나타낸 것이다.
도 50은 다양하게 설계된 CRISPR 발현 조절 시스템을 이용하여 HepG2 세포에서 PCSK9 유전자 발현 저해를 확인한 결과를 나타낸 것이다.
도 51은 다양하게 설계된 CRISPR 발현 조절 시스템을 이용하여 Hep3B 세포에서 PCSK9 유전자 발현 저해를 확인한 결과를 나타낸 것이다.
도 52는 다양하게 설계된 CRISPR 발현 조절 시스템을 이용하여 Huh7 세포에서 PCSK9 유전자 발현 저해를 확인한 결과를 나타낸 것이다.
도 53은 다양하게 설계된 CRISPR 발현 조절 시스템을 이용하여 HepG2 세포에서 PCSK9 유전자 발현 저해를 확인한 결과를 나타낸 것이다.
도 54는 VP64를 포함하는 전사 활성 Cas12f1 융합 단백질의 모식도를 나태난 것이다.
도 55는 VP64를 포함하는 전사 활성 Cas12f1 융합 단백질을 포함하는 CRISPR 발현 조절 시스템을 이용하여 OCT4 유전자의 발현 증가를 확인한 결과를 나타낸 것이다.
도 2 내지 도 5는 실험예 2에 개시된 실시예 중, DY2를 표적으로 하는 Example 1.1.1 내지 Example 1.1.13에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 6 내지 도 9는 실험예 2에 개시된 실시예 중, DY10을 표적으로 하는 Example 1.2.1 내지 Example 1.2.13에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 10 내지 도 13은 실험예 2에 개시된 실시예 중, Intergenic22를 표적으로 하는 Example 1.3.1 내지 Example 1.3.13에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 14 내지 도 15는 실험예 2에 개시된 실시예 중, DY2를 표적으로 하는 Comparative Example 1.1.1, DY10을 표적으로 하는 Comparative Example 1.2.1, 및 각각의 Control의 Indel 효율을 나타낸 그래프이다.
도 16 내지 도 17은 실험예 3.1에 개시된 실시예 중 DY2를 표적으로 하는 Example 2.1.1 내지 Example 2.1.15에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 18 내지 도 19는 실험예 3.1에 개시된 실시예 중, DY10을 표적으로 하는 Example 2.2.1 내지 Example 2.2.15에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 20 내지 도 21은 실험예 3.2에 개시된 실시예 중 DY2를 표적으로 하는 Example 3.1.1 내지 Example 3.1.12에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 22 내지 도 23는 실험예 3.2에 개시된 실시예 중, DY10을 표적으로 하는 Example 3.2.1 내지 Example 3.2.12에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 24 내지 도 26은 실험예 4.1에 개시된 각각의 실시예에 대한 평균 indel 효율을 나타낸 그래프이다. FUS를 표적으로 하는 Example 4.4.1 내지 Example 4.4.4, GAK를 표적으로 하는 Example 4.5.1 내지 Example 4.5.2, 및 MLH를 표적으로 하는 Example 4.6.1에 대한 평균 indel 효율이 각각 도시되어 있다. 이때, Ex는 Example을 나타내는 약어이다.
도 27은 실험예 5의 Large scale validation 실험 결과를 나타낸 것이다.
도 28은 실험예 6의 in vitro cleavage assay 결과를 나타낸 것이다.
도 29는 다양한 dead Cas12f1의 cleavage 활성 제거 유무를 확인한 결과를 나타낸 것이다.
도 30은 전사 저해 Cas12f1 융합 단백질의 다양한 모듈 설계를 모식화하여 나타낸 것이다.
도 31은 다양하게 설계된 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 32는 다양하게 설계된 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 33은 다양하게 설계된 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 34는 다양하게 설계된 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 35는 KRAB을 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 36은 DNMT를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 37은 KRAB과 MeCP2를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 38은 KRAB을 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 39는 KRAB과 MeCP2를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 40은 복수 개의 KRAB을 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 41은 복수 개의 KRAB과 MeCP2를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 42는 HDAC를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 43은 KRAB과 MeCP2를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 44는 복수 개의 KRAB과 MeCP2를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 45는 KRAB과 MeCP2를 포함하는 전사 저해 Cas12f1 융합 단백질을 이용한 표적 유전자의 발현 억제 효과를 확인한 결과를 나타낸 것이다.
도 46은 PCSK9 유전자의 발현 저해 효과를 확인하기 위해 promoter에 위치하는 타겟을 선정하여 indel 효율을 확인한 결과를 나타낸 것이다.
도 47은 타겟팅 효율을 높이기 위하여 guide RNA optimization, spacer optimization한 결과를 나타낸 것이다.
도 48은 타겟팅 효율을 높이기 위하여 guide RNA optimization, spacer optimization한 결과를 나타낸 것이다.
도 49는 최적의 guide RNA를 이용해 PCSK9 유전자의 promoter에 위치하는 타겟에 대한 indel 효율을 확인한 결과를 나타낸 것이다.
도 50은 다양하게 설계된 CRISPR 발현 조절 시스템을 이용하여 HepG2 세포에서 PCSK9 유전자 발현 저해를 확인한 결과를 나타낸 것이다.
도 51은 다양하게 설계된 CRISPR 발현 조절 시스템을 이용하여 Hep3B 세포에서 PCSK9 유전자 발현 저해를 확인한 결과를 나타낸 것이다.
도 52는 다양하게 설계된 CRISPR 발현 조절 시스템을 이용하여 Huh7 세포에서 PCSK9 유전자 발현 저해를 확인한 결과를 나타낸 것이다.
도 53은 다양하게 설계된 CRISPR 발현 조절 시스템을 이용하여 HepG2 세포에서 PCSK9 유전자 발현 저해를 확인한 결과를 나타낸 것이다.
도 54는 VP64를 포함하는 전사 활성 Cas12f1 융합 단백질의 모식도를 나태난 것이다.
도 55는 VP64를 포함하는 전사 활성 Cas12f1 융합 단백질을 포함하는 CRISPR 발현 조절 시스템을 이용하여 OCT4 유전자의 발현 증가를 확인한 결과를 나타낸 것이다.
용어 정의
본 명세서에서 사용되는 용어에 대한 정의는 이하와 같다.
약
본 명세서에서 사용되는 "약"이라는 용어는 참조 양, 수준, 값, 수, 빈도, 퍼센트, 치수, 크기, 양, 중량 또는 길이에 대해 30, 25, 20, 25, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1% 정도로 변하는 양, 수준, 값, 수, 빈도, 퍼센트, 치수, 크기, 양, 중량 또는 길이를 의미한다.
A,T,C,G, 및 U
본 명세서에서 사용되는 A, T, C, G 및 U 기호는 당업계 통상의 기술자가 이해하는 의미로 해석된다. 문맥 및 기술에 따라 DNA 또는 RNA 상에서 염기, 뉴클레오사이드 또는 뉴클레오타이드로 적절히 해석될 수 있다. 예를 들어, 염기를 의미하는 경우는 각각 아데닌(A), 티민(T), 시토신(C), 구아닌(G) 또는 우라실(U) 자체로 해석될 수 있고, 뉴클레오사이드를 의미하는 경우는 각각 아데노신(A), 티미딘(T), 시티딘(C), 구아노신(G) 또는 유리딘(U)으로 해석될 수 있으며, 서열에서 뉴클레오타이드를 의미하는 경우는 상기 각각의 뉴클레오사이드를 포함하는 뉴클레오타이드를 의미하는 것으로 해석되어야 한다.
작동 가능하게 연결된(operably linked)
본 명세서에서 사용되는 "작동 가능하게 연결된"이라는 용어는 유전자 발현 기술에 있어서, 특정 구성이 다른 구성과 연결되어, 상기 특정 구성이 의도된 방식대로 기능할 수 있도록 연결되어 있는 것을 의미한다. 예를 들어, 프로모터 서열이 암호화 서열과 작동적으로 연결되었다고 할 때, 상기 프로모터가 상기 암호화 서열의 세포 내에서의 전사 및/또는 발현에 영향을 미칠 수 있도록 연결된 것을 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
표적 유전자 또는 표적 핵산
본 명세서에서 사용되는 "표적 유전자" 또는 "표적 핵산"은 기본적으로, 유전자 발현 조절의 대상이 되는 세포 내 유전자, 또는 핵산을 의미한다. 상기 표적 유전자 또는 표적 핵산은 혼용될 수 있으며, 서로 동일한 대상을 지칭할 수 있다. 상기 표적 유전자 또는 표적 핵산은 달리 기재되지 않은 한, 대상 세포가 가진 고유한 유전자 또는 핵산, 혹은 외부 유래의 유전자 또는 핵산 모두를 의미할 수 있으며, 유전자 발현 조절의 대상이 될 수 있다면 특별히 제한되지 않는다. 상기 표적 유전자 또는 표적 핵산은 단일가닥 DNA, 이중가닥 DNA, 및/또는 RNA일 수 있다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
표적 서열
본 명세서에서 사용되는 "표적 서열"은 CRISPR activation 복합체 또는 CRISPR interference 복합체가 표적 유전자 또는 표적 핵산의 발현을 조절하기 위해 인식하는 특정 서열을 의미한다. 상기 표적 서열은 그 목적에 따라 적절히 선택될 수 있다. 구체적으로, "표적 서열"은 표적 유전자 또는 표적 핵산 서열 내에 포함된 서열이며, 본 명세서에서 제공하는 가이드 RNA, 또는 엔지니어링 된 가이드 RNA에 포함된 스페이서 서열과 상보성을 가지는 서열을 의미한다. 일반적으로, 상기 스페이서 서열은 표적 유전자 또는 표적 핵산의 서열 및 Cas12f1 융합 단백질이 인식하는 PAM 서열을 고려하여 결정된다. 상기 표적 서열은 CRISPR activation 복합체 또는 CRISPR interference 복합체의 가이드 RNA와 상보적으로 결합하는 특정 가닥만을 지칭할 수 있으며, 상기 특정 가닥 부분을 포함하는 표적 이중 가닥 전체를 지칭할 수도 있으며, 이는 문맥에 따라 적절히 해석된다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
벡터
본 명세서에서 사용되는 "벡터"는 달리 특정되지 않는 한, 유전 물질을 세포 내로 운반할 수 있는 모든 물질을 통틀어 일컫는다. 예를 들어, 벡터는 대상이 되는 유전 물질, 예를 들어 CRISPR 발현 조절 시스템의 Cas12f1 융합 단백질을 암호화하는 핵산, 및/또는 가이드 RNA를 암호화하는 핵산을 포함하는 DNA 분자일 수 있으나, 이에 제한되는 것은 아니다. 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
자연계에서 발견되는
본 명세서에서 "자연계에서 발견되는" 이라는 용어는, 자연계에서 발견되는, 변형되지 않은 대상을 의미하며, 인위적인 변형이 가해진 "엔지니어링 된 대상"과 구분하기 위해 사용된다. 상기 "자연계에서 발견되는" 유전자, 핵산, DNA, RNA 등은 야생형 및 mature form (active form)의 유전자, 핵산, DNA, RNA를 모두 포괄하는 개념으로 사용된다. 상기 용어는 그 외 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석되어야 한다.
엔지니어링 된
본 명세서에서 사용되는 "엔지니어링 된"이란 용어는 자연계에 이미 존재하는 구성을 가진 물질, 분자 등과 구분하기 위해 사용하는 용어로, 상기 물질, 분자 등에 인위적인 변형이 가해진 것을 의미한다. 예를 들어, "엔지니어링 된 가이드 RNA"의 경우, 자연계에 존재하는 가이드 RNA의 구성에 인위적인 변경이 가해진 가이드 RNA를 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
NLS(Nuclear Localization Sequence, or Signal)
본 명세서에서 "NLS"라 함은, 핵 수송(nuclear transport) 작용으로 세포 핵 외부의 물질을 핵 내부로 수송할 때, 수송 대상인 단백질에 붙어 일종의 "태그"역할을 하는 일정 길이의 펩타이드, 또는 그 서열을 의미한다. 구체적으로, 상기 NLS는 아미노산 서열 PKKKRKV(서열번호 278)을 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(서열번호 279)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD(서열번호 280) 또는 RQRRNELKRSP(서열번호 281)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호 282)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부 터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호 283); 마이오 마(myoma) T 단백질의 서열 VSRKRPRP(서열번호 284) 및 PPKKARED(서열번호 285); 인간 p53의 서열 PQPKKKPL(서열번호 286); 마우스 c-abl IV의 서열 SALIKKKKKMAP(서열번호 287); 인플루엔자 바이러스 NS1의 서열 DRLRR(서열번호 288) 및 PKQKKRK(서열번호 289); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(서열번호 290); 마우스 Mx1 단백질의 서열 REKKKFLKRR(서열번호 291); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK(서열번호 292); 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(서열번호 293)로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다. 본 명세서에서 사용되는 "NLS"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
NES(Nuclear Export Sequence, or Signal)
본 명세서에서 "NES"라 함은, 핵 수송(nuclear transport) 작용으로 세포 핵 내부의 물질을 핵 외부로 수송할 때, 수송 대상인 단백질에 붙어 일종의 "태그"역할을 하는 일정 길이의 펩타이드, 또는 그 서열을 의미한다. 본 명세서에서 사용되는 "NES"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
태그
본 명세서에서 "태그"라 함은, 펩타이드, 또는 단백질의 추적 및/또는 분리정제를 쉽게 하기 위하여 부가되는 기능적 도메인을 통틀어 일컫는다. 구체적으로, 상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루 티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등의 태그 단백질, 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 청록색 형관 단백질(CFP), 청색 형광 단백질(BFP), HcRED, DsRed 등의 자가형광 단백질, 및 글루타티온-S-트랜스 퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타 -글루쿠로니다제, 루시퍼라제 등의 리포터 유전자를 포함하나, 이에 제한되는 것은 아니다. 본 명세서에서 사용되는 "태그"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기재된 것과 유사 또는 동일한 방법 및 물질이 본 발명의 실행 또는 시험에서 사용될 수 있지만, 적합한 방법 및 물질이 이하에 기재된다. 본 명세서에서 언급된 모든 간행물, 특허 및 기타 다른 참고문헌은 전체가 참고로 포함된다. 추가로, 물질, 방법 및 실시예는 단지 예시적이며, 제한되는 것으로 의도되지 않는다.
이하 본 발명을 설명한다.
배경기술 - CRISPR/Cas12f1 시스템
CRISPR/Cas12f1 시스템
CRISPR/Cas12f 시스템은 type V CRISPR/Cas 시스템 중 V-F 서브타입에 속하고, 이는 다시 V-F1 내지 V-F3의 베리언트로 나뉜다. CRISPR/Cas12f 시스템은 선행연구(Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))에서 Cas14로 명명된 이펙터 단백질 중, Cas14a, Cas14b, 및 Cas14c 변이체를 포함하는 CRISPR/Cas14 시스템을 포함한다. 이 중, Cas14a 이펙터 단백질을 포함하는 CRISPR/Cas14a 시스템은 CRISPR/Cas12f1 시스템으로 분류된다(Makarova et al., Nature Reviews, Microbiology volume 18, 67 (2020)). 최근 선행 연구(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021), Xiao et al., Structural basis for the dimerization-dependent CRISPR-Cas12f nuclease, bioRxiv (2020)) 등을 통해 상기 CRISPR/Cas12f1 복합체의 구조가 밝혀졌다.
CRISPR/Cas12f1 시스템을 이용한 CRIPSR 조절 시스템
상기 CRISPR/Cas12f1 시스템은 CRISPR/Cas9 시스템에 비하여 Cas12f1 단백질의 크기가 현저히 작다는 특징이 있다. 이러한 특징은 기존에 연구된 대부분의 Cas 뉴클레아제의 크기로 인한 융합 단백질 개발의 어려움, AAV (아데노 관련 바이러스)에 탑재의 어려움 및 이로 인한 치료제로서 적용 어려움을 해결 가능하게 한다. 하지만 이러한 장점에도 불구하고, 선행 연구(Harrington et al., Science 362, 839-842 (2018), Tautvydas Karvelis et al., Nucleic Acids Research 48, 5016-5023 (2020))에서 밝혀진 바로는, 상기 CRISPR/Cas12f1 시스템은 세포 내에서 이중 가닥 DNA에 대한 절단 활성을 보이지 않거나, 절단 활성을 보이더라도 그 효율이 매우 낮아 이를 적극적으로 유전자 편집에 활용하기 힘들다는 한계를 가지고 있었다. 하지만 이러한 한계를 극복하기 위해, 최근 본 발명자들은 CRISPR/Cas12f1 시스템의 세포 내 유전자 편집 활성을 높이기 위한, 엔지니어링 된 Cas12f1 가이드 RNA를 개발하였다.
따라서, 표적 특이성이 향상된 엔지니어링 된 가이드 RNA 및 작은 크기의 Cas12f1 단백질을 이용한다면, 기존의 Cas9의 큰 크기에 따른 융합 단백질의 개발 및 AAV 벡터 패키징의 어려움으로 효율적으로 사용되기 어려웠던 CRISPR 조절 시스템을 보다 효율적으로 이용할 수 있을 것으로 기대된다.
이하에서, CRISPR/Cas12f1 시스템을 이용한 CRISPR 조절 시스템에 대해 자세히 설명한다.
<CRISPR 조절 시스템(CRISPR regulatory system)>
본 명세서에서는 CRISPR/Cas12f1 시스템을 이용한 CRISPR 조절 시스템을 제공한다. 보다 구체적으로 상기 CRISPR 조절 시스템은 엔지니어링 된 Cas12f1 가이드 RNA와 Cas12f1 융합 단백질을 포함한다. 이때, 상기 CRISPR 조절 시스템은 상기 Cas12f1 융합 단백질에 따라 CRISPR activation 시스템 및 CRISPR interference 시스템으로 구분할 수 있다. 상기 CRISPR activation 시스템은 발현을 조절하고자 하는 대상, 즉, 표적 유전자의 발현을 증가 또는 촉진시키는 역할을 한다. 반면에, 상기 CRISPR interference 시스템은 표적 유전자의 발현을 저해 또는 억제하는 역할을 한다. 이러한 효과는 상기 Cas12f1 융합 단백질에 포함된 발현 조절 도메인에 의한 것으로, 상기 발현 조절 도메인인 전사 활성 단백질 또는 전사 저해 단백질에 따라 CRISPR 조절 시스템의 효과가 달라진다.
상기 CRIPSR 조절 시스템은 Cas12f1 융합 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함한다. 이때, 상기 Cas12f1 융합 단백질은 변형된 Cas12f1 단백질 및 발현 조절 도메인을 포함한다. 상기 CRIPSR 조절 시스템은 상기 발현 조절 도메인의 종류에 따라 그 효과가 달라질 수 있다.
일 구현예로, 상기 CRIPSR 조절 시스템은 표적 유전자의 발현을 저해 또는 억제하기 위한 CRISPR interference 시스템일 수 있다. 상기 CRISPR interference 시스템은 전사 저해 Cas12f1 융합 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는 것을 특징으로 한다. 이때, 상기 전사 저해 Cas12f1 융합 단백질은 변형된 Cas12f1 단백질 및 전사 저해 단백질을 포함하는 것을 특징으로 한다.
일 구현예로, 상기 CRIPSR 조절 시스템은 표적 유전자의 발현을 증가 또는 촉진하기 위한 CRISPR activation 시스템일 수 있다. 상기 CRISPR activation 시스템은 전사 활성 Cas12f1 융합 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는 것을 특징으로 한다. 이때, 상기 전사 활성 Cas12f1 융합 단백질은 변형된 Cas12f1 단백질 및 전사 활성 단백질을 포함하는 것을 특징으로 한다.
이하에서 각 구성에 대해 자세히 설명한다.
1. 발현 조절 단백질 - Cas12f1 융합 단백질
본 명세서에서 제공하는 CRISPR 조절 시스템은 Cas12f1 융합 단백질을 포함한다. 상기 Cas12f1 융합 단백질은 표적 유전자의 발현을 조절하는 발현 조절 단백질로서 역할한다. 기본적으로 상기 Cas12f1 융합 단백질은 변형된 Cas12f1 단백질 및 발현 조절 도메인을 포함한다. 상기 CRISPR 조절 시스템은 상기 Cas12f1 융합 단백질의 발현 조절 도메인에 따라 표적 유전자의 발현을 증가 또는 향상시키거나 저해 또는 억제시킬 수 있다. 또한, 상기 Cas12f1 융합 단백질에 포함된 발현 조절 도메인의 종류, 개수, 조합 및 융합 위치에 따라 CRISPR 조절 시스템의 효율에 차이가 생길 수 있다.
본 명세서에서는 CRISPR 조절 시스템을 위한 Cas12f1 융합 단백질을 제공한다. 상기 Cas12f1 융합 단백질은 변형된 Cas12f1 단백질 및 발현 조절 도메인을 포함한다. 상기 변형된 Cas12f1 단백질은 야생형 Cas12f1 단백질 서열에서 적어도 일부 서열이 변형된 것으로, 상기 변형으로 인해 야생형 Cas12f1 단백질과 비교할 때, 기능이 변경된 Cas12f1 변이체인 것을 특징으로 한다. 상기 변형된 Cas12f1 단백질은 표적 핵산 또는 표적 유전자의 이중 가닥을 전부 절단할 수 없도록 기능이 변경된 것을 특징으로 한다. 상기 발현 조절 도메인은 표적 유전자의 전사를 활성화시키거나 또는 저해시키는 단백질인 것을 특징으로 한다.
일 구현예로, 상기 Cas12f1 융합 단백질은 변형된 Cas12f1 단백질 및 전사 활성 단백질를 포함할 수 있다. 이때, 상기 Cas12f1 융합 단백질을 포함하는 CRISPR 조절 시스템은 표적 유전자의 발현을 증가 또는 향상시키는 것을 특징으로 한다.
다른 일 구현예로, 상기 Cas12f1 융합 단백질은 변형된 Cas12f1 단백질 및 전사 저해 단백질를 포함할 수 있다. 이때, 상기 Cas12f1 융합 단백질을 포함하는 CRISPR 조절 시스템은 표적 유전자의 발현을 저해 또는 억제시키는 것을 특징으로 한다.
Cas12f1 융합 단백질의 특징 1 - 변형된 Cas12f1 단백질 포함
본 명세서에서 제공하는 Cas12f1 융합 단백질은 표적 핵산 또는 표적 유전자의 이중 가닥을 절단할 수 없도록 기능이 변경된 변형된 Cas12f1 단백질을 포함하는 것을 특징으로 한다. 상기 변형된 Cas12f1 단백질은 야생형 Cas12f1 단백질의 아미노산 서열 중 적어도 하나의 아미노산 서열이 변형된 것을 특징으로 한다.
Cas12f1 융합 단백질의 특징 2 - 발현 조절 도메인 포함
본 명세서에서 제공하는 Cas12f1 융합 단백질은 발현 조절 도메인으로 표적 유전자의 전사를 활성화시키거나 또는 저해시키는 단백질을 포함하는 것을 특징으로 한다. 상기 발현 조절 도메인은 전사 활성 단백질 또는 전사 저해 단백질인 것을 특징으로 한다.
일 구현예로, 상기 전사 활성 단백질은 VP64, Sun Tag, VPR(VP64, p65, Rta) 또는 TV(TAL, VP64)일 수 있다.
다른 일 구현예로, 상기 전사 저해 단백질은 KRAB, DNMT, MeCP2, HDAC, LSD, SRDX SALL1 또는 SDS3 일 수 있다.
Cas12f1 융합 단백질의 특징 3 - 다양한 모듈화
본 명세서에서 제공하는 Cas12f1 융합 단백질은 둘 이상의 발현 조절 도메인을 포함할 수 있으며, 이때, 발현 조절 도메인의 종류, 개수, 조합 및 융합 위치를 다양하게 설계 가능한 것을 특징으로 한다. 이러한 Cas12f1 융합 단백질의 다양한 모듈화는 Cas12f1 단백질이 작은 크기를 가진다는 장점을 활용하여 더 효과적인 CRISPR 조절 시스템의 개발을 가능하게 한다. 다양한 모듈화에 따라 CRISPR 조절 시스템의 효율에 차이가 생길 수 있으며, 표적 유전자에 따라 다양한 모듈화를 통해 최적의 Cas12f1 융합 단백질을 포함하는 CRISPR 조절 시스템을 설계할 수 있다.
일 구현예로, 상기 Cas12f1 융합 단백질은 변형된 Cas12f1 단백질 및 둘 이상의 전사 저해 단백질을 포함할 수 있다. 이때, 상기 둘 이상의 전사 저해 단백질은 서로 다른 단백질일 수 있다. 이때, 상기 서로 다른 전사 저해 단백질은 모두 상기 변형된 Cas12f1 단백질의 N 말단에 위치할 수 있다. 또는, 상기 서로 다른 전사 저해 단백질은 모두 상기 변형된 Cas12f1 단백질의 C 말단에 위치할 수 있다. 또는, 상기 서로 다른 전사 저해 단백질은 각각 상기 변형된 Cas12f1 단백질의 N 말단 또는 C 말단에 위치할 수 있다.
Cas12f1 융합 단백질의 특징 4 - 링커 포함
본 명세서에서 제공하는 Cas12f1 융합 단백질은 변형된 Cas12f1 단백질과 발현 조절 도메인을 연결하는 링커를 포함하는 것을 특징으로 한다. 이때, 상기 링커는 변형된 Cas12f1 단백질과 발현 조절 도메인의 기능 및 구조에 영향을 주지 않는 아미노산 서열인 것을 특징으로 한다.
Cas12f1 융합 단백질의 효과
본 명세서에서 제공하는 Cas12f1 융합 단백질을 CRISPR/Cas12f1 시스템에 사용하는 경우, 야생형 Cas12f1 단백질을 사용하는 경우와 달리, 표적 유전자의 이중 가닥 절단 없이 표적 유전자의 발현을 증가 또는 저해시키는 효과가 나타난다. 기존의 CRISPR/Cas12f1 시스템은 유전자 편집 기술 분야(표적 유전자의 넉아웃이나 목적 유전자의 넉인 등)에 활용되고 있는 반면, Cas12f1 융합 단백질을 이용한 CRISPR/Cas12f1 시스템, 즉, CRISPR 조절 시스템은 별도의 유전자 편집(이중 가닥 절단에 따른 핵산 변형 등) 없이 표적 유전자의 발현을 조절할 수 있어 다양한 유전자 발현 조절 기술에 활용할 수 있게 된다.
Cas12f1 융합 단백질의 용도
본 명세서에서 제공하는 Cas12f1 융합 단백질은 엔지니어링 된 Cas12f1 가이드 RNA와 함께 유전자 발현 조절 용도로 사용될 수 있다. 또한, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 유전자 발현 조절용 조성물을 제조하기 위한 용도로 사용할 수 있다.
이하에서, Cas12f1 융합 단백질의 구성 및 다양한 구현예에 대해 설명한다.
1) 변형된 Cas12f1 단백질
변형된 Cas12f1 단백질 - 개괄
본 명세서에서 제공하는 CRISPR 조절 시스템을 위한 Cas12f1 융합 단백질은 변형된 Cas12f1 단백질이 포함된다. 기본적으로, 상기 변형된 Cas12f1 단백질은 자연계에 존재하는 야생형 Cas12f1 단백질의 아미노산 서열에서 적어도 하나의 아미노산 서열이 변형된 것일 수 있다. 상기 변형된 Cas12f1 단백질을 암호화하는 서열은 변형된 Cas12f1 단백질에 대해 인간 코돈-최적화된 Cas12f1 서열일 수 있다. 또한, 상기 변형된 Cas12f1 단백질은 자연계에 존재하는 야생형 Cas12f1 단백질의 기능이 변경된 것이다. 구체적으로, 상기 변형된 Cas12f1 단백질은 야생형 Cas12f1 단백질의 표적 핵산 또는 표적 유전자의 이중 가닥 절단 기능이 제거된 것으로, 이하에서, 변형된 Cas12f1 단백질은 "dead Cas12f1 단백질(dCas12f1 단백질)"로 지칭하며 혼용되어 사용된다. 특별히 한정하지 않는 한, 본 명세서에서 "변형된 Cas12f1 단백질"이라고 할 때, 이는 표적 핵산 또는 표적 유전자의 이중 가닥 절단을 할 수 없는 dCas12f1 단백질을 의미한다.
변형된 Cas12f1 단백질 - 야생형 Cas12f1 단백질
본 명세서에서 제공하는 Cas12f1 융합 단백질은 변형된 Cas12f1 단백질을 포함한다. 이때, 상기 변형된 Cas12f1 단백질은 야생형 Cas12f1 단백질의 아미노산 서열 중 적어도 하나 이상이 변형된 것일 수 있다.
일 구현예로, 상기 야생형 Cas12f1 단백질은 Cas14 패밀리(Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))에서 유래한 것일 수 있다. 일 구현예로, 상기 야생형 Cas12f1 단백질은 Uncultured archaeon 유래의 Cas14a 단백질(Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))일 수 있다. 일 구현예로, 상기 야생형 Cas12f1 단백질은 야생형 Cas14a1 단백질일 수 있다. 일 구현예로, 상기 야생형 Cas12f1 단백질은 서열번호 260에 제시된 아미노산 서열을 가질 수 있다.
dCas12f1 단백질 - 야생형 Cas12f1 단백질의 기능 변경
본 명세서에서 제공하는 Cas12f1 융합 단백질에 포함된 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 기능이 변경 또는 상실된 것일 수 있다.
일 구현예로, 상기 dCas12f1 단백질은 표적 핵산 또는 표적 유전자의 이중 가닥 전부를 절단할 수 없도록 변형된 것일 수 있다.
dCas12f1 단백질 - 변형된 아미노산 서열
본 명세서에서 제공하는 Cas12f1 융합 단백질에 포함된 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 적어도 하나의 아미노산이 다른 아미노산으로 치환된 것일 수 있다. 따라서, 상기 dCas12f1은 야생형 Cas12f1 단백질과 비교하여 적어도 다른 하나의 아미노산 서열을 가질 수 있다. 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 490번째 아미노산인 아르기닌(R), 510번째 아미노산인 아스파트산(D), 422번째 아미노산인 글루탐산(E) 및 326번째 아미노산인 아스파트산(D) 중 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다.
dCas12f1 단백질 구현예
일 구현예로, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 490번째 아미노산인 아르기닌(R)이 다른 아미노산으로 치환된 것일 수 있다. 이때, 상기 다른 아미노산은 알라닌(A), 글루타민(Q), 류신(L) 또는 트립토판(W)일 수 있으나, 이에 제한된 것은 아니다.
일 구현예로, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 510번째 아미노산인 아스파트산(D)이 다른 아미노산으로 치환된 것일 수 있다. 이때, 상기 다른 아미노산은 알라닌(A), 류신(L) 또는 발린(V)일 수 있으나, 이에 제한된 것은 아니다.
일 구현예로, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 422번째 아미노산인 글루탐산(E)이 다른 아미노산으로 치환된 것일 수 있다. 이때, 상기 다른 아미노산은 알라닌(A)일 수 있으나, 이에 제한된 것은 아니다.
일 구현예로, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 326번째 아미노산인 아스파트산(D)이 다른 아미노산으로 치환된 것일 수 있다. 이때, 상기 다른 아미노산은 알라닌(A)일 수 있으나, 이에 제한된 것은 아니다.
dCas12f1 단백질 예시 1
일 구현예로, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 490번째 아미노산인 아르기닌(R)이 알라닌(A)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 알라닌을 가질 수 있다. 상기 dCas12f1 단백질은 서열번호 261에 제시된 아미노산 서열을 가질 수 있다. 이러한 상기 dCas12f1 단백질은 "R490A dCas12f1 단백질" 또는 "dCas12f1 R490A 단백질"로 표시할 수 있다.
일 구현예로, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 490번째 아미노산인 아르기닌(R)이 글루타민(Q)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 글루타민을 가질 수 있다. 상기 dCas12f1 단백질은 서열번호 262에 제시된 아미노산 서열을 가질 수 있다. 이러한 상기 dCas12f1 단백질은 "R490Q dCas12f1 단백질" 또는 "dCas12f1 R490Q 단백질"로 표시할 수 있다.
일 구현예로, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 490번째 아미노산인 아르기닌(R)이 류신(L)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 류신을 가질 수 있다. 상기 dCas12f1 단백질은 서열번호 264에 제시된 아미노산 서열을 가질 수 있다. 이러한 상기 dCas12f1 단백질은 "R490L dCas12f1 단백질" 또는 "dCas12f1 R490L 단백질"로 표시할 수 있다.
일 구현예로, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 490번째 아미노산인 아르기닌(R)이 트립토판(W)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 트립토판을 가질 수 있다. 상기 dCas12f1 단백질은 서열번호 265에 제시된 아미노산 서열을 가질 수 있다. 이러한 상기 dCas12f1 단백질은 "R490W dCas12f1 단백질" 또는 "dCas12f1 R490W 단백질"로 표시할 수 있다.
dCas12f1 단백질 예시 2
일 구현예로, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 510번째 아미노산인 아스파트산(D)이 알라닌(A)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 알라닌을 가질 수 있다. 상기 dCas12f1 단백질은 서열번호 266에 제시된 아미노산 서열을 가질 수 있다. 이러한 상기 dCas12f1 단백질은 "D510A dCas12f1 단백질" 또는 "dCas12f1 D510A 단백질"로 표시할 수 있다.
일 구현예로, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 510번째 아미노산인 아스파트산(D)이 류신(L)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 류신을 가질 수 있다. 상기 dCas12f1 단백질은 서열번호 267에 제시된 아미노산 서열을 가질 수 있다. 이러한 상기 dCas12f1 단백질은 "D510L dCas12f1 단백질" 또는 "dCas12f1 D510L 단백질"로 표시할 수 있다.
일 구현예로, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 510번째 아미노산인 아스파트산(D)이 발린(V)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 발린을 가질 수 있다. 상기 dCas12f1 단백질은 서열번호 268에 제시된 아미노산 서열을 가질 수 있다. 이러한 상기 dCas12f1 단백질은 "D510V dCas12f1 단백질" 또는 "dCas12f1 D510V 단백질"로 표시할 수 있다.
dCas12f1 단백질 예시 3
일 구현예로, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 422번째 아미노산인 글루탐산(E)이 알라닌(A)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 422번째 알라닌을 가질 수 있다. 상기 dCas12f1 단백질은 서열번호 269에 제시된 아미노산 서열을 가질 수 있다. 이러한 상기 dCas12f1 단백질은 "E422A dCas12f1 단백질" 또는 "dCas12f1 E422A 단백질"로 표시할 수 있다.
dCas12f1 단백질 예시 4
일 구현예로, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 326번째 아미노산인 아스파트산(D)이 알라닌(A)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 326번째 알라닌을 가질 수 있다. 상기 dCas12f1 단백질은 서열번호 271에 제시된 아미노산 서열을 가질 수 있다. 이러한 상기 dCas12f1 단백질은 "D326A dCas12f1 단백질" 또는 "dCas12f1 D326A 단백질"로 표시할 수 있다.
2) 발현 조절 도메인
발현 조절 도메인 - 개괄
본 명세서에서 제공하는 CRISPR 조절 시스템을 위한 Cas12f1 융합 단백질은 발현 조절 도메인이 포함된다. 상기 발현 조절 도메인으로 표적 유전자의 전사를 활성화시키거나 또는 저해시키는 단백질로, 전사 활성 단백질 또는 전사 저해 단백질일 수 있다. 상기 발현 조절 도메인이 전사 활성 단백질인 경우, 이를 포함하는 상기 Cas12f1 융합 단백질은 표적 유전자의 발현을 증가 또는 촉진시키기 위한 CRISPR 조절 시스템으로 이용될 수 있다. 또는, 상기 발현 조절 도메인이 전사 저해 단백질인 경우, 이를 포함하는 상기 Cas12f1 융합 단백질은 표적 유전자의 발현을 저해 또는 억제시키기 위한 CRISPR 조절 시스템으로 이용될 수 있다.
발현 조절 도메인의 종류 1 - 전사 활성 단백질
일 구현예로, 상기 발현 조절 도메인은 전사 활성 단백질일 수 있다. 상기 전사활성 단백질은 표적 유전자의 전사를 활성 또는 촉진시키는 역할을 하는 단백질일 수 있다. 상기 전사 활성 단백질은 표적 유전자의 인핸서 또는 프로모터 근위 요소(promoter-proximal element)에 결합할 수 있는 DNA 결합 단백질일 수 있다. 상기 전사 활성 단백질은 프로모터 근처에 위치한 조절 DNA 부위에 결합하여 일반적인 transcription machinery (RNA 중합효소 및 일반적인 transcription factors 등)와 단백질-단백질 상호작용을 통해 프로모터에 transcription machinery의 결합을 촉진하여 유전자의 전사를 촉진할 수 있다. 또는 상기 전사 활성 단백질은 RNA 중합효소가 프로모터로부터 방출되어 DNA를 따라 합성을 진행하도록 촉발하여 유전자의 전사를 촉진할 수 있다.
일 구현예로, 상기 전사 활성 단백질은 VP64일 수 있다.
발현 조절 도메인의 종류 2 - 전사 저해 단백질
일 구현예로, 상기 발현 조절 도메인은 전사 저해 단백질일 수 있다. 상기 전사저해 단백질은 표적 유전자의 전사를 저해 또는 억제시키는 역할을 하는 단백질일 수 있다. 상기 전사저해 단백질은 표적 유전자의 operator 또는 silencer에 결합하여 표적 유전자의 발현을 저해 또는 억제하는 DNA 결합 단백질 또는 펩타이드일 수 있다. 이때, 상기 전사 저해 단백질은 RNA 중합효소가 프로모터에 부착되는 것을 차단하여 유전자의 전사를 저해 또는 억제할 수 있다. 또는 상기 전사 저해 단백질은 크로마틴의 구조변화를 유도하여 유전자의 전사를 저해 또는 억제하는 단백질 또는 펩타이드일 수 있다. 이때, 상기 크로마틴의 구조변화는 메틸화(methylation), 탈메틸화(demethylation), 아세틸화(acetylation), 탈아세틸화(deacetylation) 등에 의한 것일 수 있다.
일 구현예로, 상기 전사 저해 단백질은 KRAB, DNMT, MeCP2, LSD 또는 HDAC일 수 있다. 이때, 상기 DNMT는 DNMT1, TRDMT1 또는 DNMT3일 수 있다. 이때, 상기 HDAC는 HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10 또는 HDAC11일 수 있다.
발현 조절 도메인 - Cas12f1 융합 단백질 상의 개수
하나의 Cas12f1 융합 단백질은 적어도 하나의 발현 조절 도메인을 포함할 수 있다. 이때, 상기 발현 조절 도메인은 전사 활성 단백질 또는 전사 저해 단백질일 수 있다. 또는, 하나의 Cas12f1 융합 단백질은 복수 개의 발현 조절 도메인을 포함할 수 있다. 이때, 상기 복수 개의 발현 조절 도메인은 모두 동일한 기능을 하는 도메인으로, 전사 활성을 촉진하거나 전사 활성을 저해하는 기능을 하는 단백질일 수 있다. 즉, 상기 복수 개의 발현 조절 도메인은 모두 전사 활성 단백질이거나 또는 모두 전사 저해 단백질일 수 있다. 다만, 상기 복수 개의 발현 조절 도메인은 기능이 동일할 뿐 반드시 동일한 단백질일 필요는 없다. 예를 들어, 상기 복수 개의 발현 조절 도메인이 모두 전사 저해 단백질인 경우, 한 종류의 전사 저해 단백질이 복수 개로 존재하거나, 또는 여러 종류의 전사 저해 단백질이 복수 개로 존재하는 것일 수 있다.
발현 조절 도메인 - Cas12f1 융합 단백질 상의 위치
상기 발현 조절 도메인은 Cas12f1 융합 단백질에 포함된 변형된 Cas12f1 단백질, 즉, dCas12f1 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 상기 Cas12f1 융합 단백질에 포함된 발현 조절 도메인이 둘 이상인 경우, 상기 발현 조절 도메인은 dCas12f1 단백질의 N 말단에 모두 위치하거나, dCas12f1 단백질의 C 말단에 모두 위치하거나, 또는 일부는 dCas12f1 단백질의 N 말단에 위치하고 나머지는 dCas12f1 단백질의 C 말단에 위치할 수 있다.
일 구현예로, 상기 Cas12f1 융합 단백질에 포함된 발현 조절 도메인이 2개인 경우, 상기 2개의 발현 조절 도메인은 모두 dCas12f1 단백질의 N 말단에 모두 위치할 수 있다. 또는, 상기 2개의 발현 조절 도메인은 모두 dCas12f1 단백질의 C 말단에 모두 위치할 수 있다. 또는, 상기 2개의 발현 조절 도메인 중 1개는 dCas12f1 단백질의 C 말단에 위치하고, 나머지 1개는 dCas12f1 단백질의 N 말단에 모두 위치할 수 있다.
일 구현예로, 상기 Cas12f1 융합 단백질에 포함된 발현 조절 도메인이 3개인 경우, 상기 3개의 발현 조절 도메인은 모두 dCas12f1 단백질의 N 말단에 모두 위치할 수 있다. 또는, 상기 3개의 발현 조절 도메인은 모두 dCas12f1 단백질의 C 말단에 모두 위치할 수 있다. 또는, 상기 3개의 발현 조절 도메인 중 2개는 dCas12f1 단백질의 C 말단에 위치하고, 나머지 1개는 dCas12f1 단백질의 N 말단에 모두 위치할 수 있다. 또는, 상기 3개의 발현 조절 도메인 중 1개는 dCas12f1 단백질의 C 말단에 위치하고, 나머지 2개는 dCas12f1 단백질의 N 말단에 모두 위치할 수 있다.
발현 조절 도메인 예시
일 구현예로, 상기 발현 조절 도메인은 전사 활성 단백질일 수 있다. 이때, 상기 전사 활성 단백질은 VP64일 수 있다. 상기 발현 조절 도메인은 서열번호 272에 제시된 아미노산 서열을 가질 수 있다.
일 구현예로, 상기 발현 조절 도메인은 전사 저해 단백질일 수 있다. 이때, 상기 전사 저해 단백질은 KRAB일 수 있다. 상기 발현 조절 도메인은 서열번호 274에 제시된 아미노산 서열을 가질 수 있다.
일 구현예로, 상기 발현 조절 도메인은 전사 저해 단백질일 수 있다. 이때, 상기 전사 저해 단백질은 MeCP2일 수 있다. 상기 발현 조절 도메인은 서열번호 275에 제시된 아미노산 서열을 가질 수 있다.
일 구현예로, 상기 발현 조절 도메인은 전사 저해 단백질일 수 있다. 이때, 상기 전사 저해 단백질은 DNMT3일 수 있다. 상기 발현 조절 도메인은 서열번호 276에 제시된 아미노산 서열을 가질 수 있다.
일 구현예로, 상기 발현 조절 도메인은 전사 저해 단백질일 수 있다. 이때, 상기 전사 저해 단백질은 HDAC3일 수 있다. 상기 발현 조절 도메인은 서열번호 277에 제시된 아미노산 서열을 가질 수 있다.
3) 링커
본 명세서에서 제공하는 CRISPR 조절 시스템을 위한 Cas12f1 융합 단백질은 dCas12f1 단백질과 발현 조절 도메인을 연결하기 위해 링커가 포함된다. 이때, 상기 링커는 dCas12f1 단백질과 발현 조절 도메인의 기능 및 구조에 영향을 주지 않는 아미노산 서열인 것을 특징으로 한다.
4) 추가 도메인
본 명세서에서 제공하는 CRISPR 조절 시스템을 위한 Cas12f1 융합 단백질은 하나 이상의 추가 도메인을 더 포함할 수 있다. 상기 추가 도메인은 상기 Cas12f1 융합 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 또는 상기 추가 도메인은 상기 Cas12f1 융합 단백질에 포함된 dCas12f1 단백질과 발현 조절 도메인의 사이에 위치할 수 있다.
일 구현예로, 상기 추가 도메인은 NLS(Nuclear Localization Sequence), 또는 NES(Nuclear Export Sequence)일 수 있다. 구체적으로, 상기 NLS는 "용어의 정의" 중 NLS 단락에 예시된 것 중 어느 하나일 수 있으나, 이에 제한되는 것은 아니다.
일 구현예로, 상기 추가 도메인은 태그일 수 있다. 구체적으로, 상기 태그는 "용어의 정의" 중 태그 단락에 예시된 것 중 어느 하나일 수 있으나, 이에 제한되는 것은 아니다.
5) Cas12f1 융합 단백질
Cas12f1 융합 단백질 - 개괄
본 명세서에서 제공하는 CRISPR 조절 시스템을 위한 Cas12f1 융합 단백질은 기능에 따라 두 종류로 구분된다. 우선, 상기 Cas12f1 융합 단백질은 표적 유전자의 발현을 증가 또는 촉진하는 기능을 하는 전사 활성 Cas12f1 융합 단백질일 수 있다. 구체적으로 전사 활성 Cas12f1 융합 단백질은 dCas12f1 단백질; 및 발현 조절 도메인으로 전사 활성 단백질을 포함하는 것을 특징으로 한다. 상기 전사 활성 Cas12f1 융합 단백질은 표적 유전자의 발현을 증가 또는 향상시키기 위한 CRISPR 조절 시스템, 즉, CRISPR activation 시스템에 이용된다. 두번째로, 상기 Cas12f1 융합 단백질은 표적 유전자의 발현을 저해 또는 억제하는 기능을 하는 전사 저해 Cas12f1 융합 단백질일 수 있다. 구체적으로 전사 활성 Cas12f1 융합 단백질은 dCas12f1 단백질; 및 발현 조절 도메인으로 전사 저해 단백질을 포함하는 것을 특징으로 한다. 상기 전사 활성 Cas12f1 융합 단백질은 표적 유전자의 발현을 저해 또는 억제시키기 위한 CRISPR 조절 시스템, 즉, CRISPR interference 시스템에 이용된다.
Cas12f1 융합 단백질 - 모듈화
본 명세서에서 제공하는 CRISPR 조절 시스템을 위한 Cas12f1 융합 단백질은 다양한 모듈화를 통해 기능을 향상시키거나 최적화시킬 수 있다. 이때, 상기 모듈화는 Cas12f1 융합 단백질에 포함된 발현 조절 도메인의 개수, 종류 및 Cas12f1 융합 단백질 내 위치를 다양하게 조절하는 것을 특징으로 한다. 이러한 모듈화를 통해 최적화된 전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질을 개발하여 CRISPR activation 시스템 또는 CRISPR interference 시스템에 보다 효과적으로 이용할 수 있다. 또한, 상기 Cas12f1 융합 단백질은 발현 조절 도메인 뿐만 아니라 추가 도메인의 개수, 종류 및 Cas12f1 융합 단백질 내 위치를 다양하게 조절할 수 있다.
일 구현예에서, 상기 Cas12f1 융합 단백질은 dCas12f1 단백질 및 2개의 전사 저해 단백질을 포함할 수 있다. 이때, 상기 2개의 전사 저해 단백질은 동일한 종류의 전사 저해 단백질일 수 있다. 또는 상기 2개의 전사 저해 단백질은 서로 다른 종류의 전사 저해 단백질일 수 있다. 이때, 상기 2개의 전사 저해 단백질은 모두 dCas12f1 단백질의 N 말단에 위치할 수 있다. 또는 상기 2개의 전사 저해 단백질은 모두 dCas12f1 단백질의 C 말단에 위치할 수 있다. 또는 상기 2개의 전사 저해 단백질은 dCas12f1 단백질의 N 말단 및 C 말단에 하나씩 위치할 수 있다. 상기 Cas12f1 융합 단백질은 하나 이상의 추가 도메인을 더 포함할 수 있다. 이때, 상기 추가 도메인은 상기 Cas12f1 융합 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 또는 상기 추가 도메인은 상기 dCas12f1 단백질 및 전사 저해 단백질 사이에 위치할 수 있다. 상기 Cas12f1 융합 단백질에 포함된 dCas12f1 단백질, 전사 저해 단백질 및 추가 도메인의 위치는 다양하게 조절할 수 있다.
Cas12f1 융합 단백질 - 전사 활성 Cas12f1 융합 단백질 구현예
본 명세서에서 제공하는 Cas12f1 융합 단백질은 전사 활성 Cas12f1 융합 단백질일 수 있다.
일 구현예로, 상기 전사 활성 Cas12f1 융합 단백질은 dCas12f1 단백질 및 적어도 하나의 전사 활성 단백질을 포함할 수 있다. 이때, 상기 전사 활성 단백질은 dCas12f1 단백질의 N 말단 또는 C 말단에 위치할 수 있다. 상기 전사 활성 Cas12f1 융합 단백질은 추가 도메인으로 적어도 하나의 NLS를 더 포함할 수 있다. 이때, 상기 NLS는 전사 활성 Cas12f1 융합 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 또는 상기 NLS는 상기 dCas12f1 단백질과 전사 활성 단백질 사이에 위치할 수 있다. 이때, 상기 전사 활성 Cas12f1 융합 단백질에 포함된 dCas12f1 단백질, 전사 활성 단백질 및 NLS는 링커에 의해 연결될 수 있다.
일 구현예로, 상기 전사 활성 Cas12f1 융합 단백질은 dCas12f1 단백질 및 둘 이상의 전사 활성 단백질을 포함할 수 있다. 이때, 상기 둘 이상의 전사 활성 단백질은 dCas12f1 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 상기 전사 활성 Cas12f1 융합 단백질은 추가 도메인으로 적어도 하나의 NLS를 더 포함할 수 있다. 이때, 상기 NLS는 전사 활성 Cas12f1 융합 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 또는 상기 NLS는 상기 dCas12f1 단백질과 전사 활성 단백질 사이에 위치할 수 있다. 이때, 상기 전사 활성 Cas12f1 융합 단백질에 포함된 dCas12f1 단백질, 전사 활성 단백질 및 NLS는 링커에 의해 연결될 수 있다.
이하에서, 전사 활성 Cas12f1 융합 단백질의 다양한 예시를 설명한다. 하기 예시는 단순 예시로, 이에 제한되지 않는다.
Cas12f1 융합 단백질 - 전사 활성 Cas12f1 융합 단백질 예시 1
일 구현예로, 상기 전사 활성 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로, dCas12f1 단백질 및 전사 활성 단백질이 순서대로 연결된 것; 또는 전사 활성 단백질 및 dCas12f1 단백질이 순서대로 연결된 것
일 수 있다. 이때, 상기 dCas12f1 단백질과 전사 활성 단백질은 링커에 의해 연결될 수 있다.
상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 490번째 아미노산인 아르기닌(R)이 알라닌(A), 글루타민(Q), 류신(L) 또는 트립토판(W)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 알라닌을 가지는 dCas12f1 R490A 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 글루타민을 가지는 dCas12f1 R490Q 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 류신을 가지는 dCas12f1 R490L 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 트립토판을 가지는 dCas12f1 R490W 단백질일 수 있다. 이때, 상기 dCas12f1 단백질은 서열번호 261, 262, 264 및 265에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 510번째 아미노산인 아스파트산(D)이 알라닌(A), 류신(L) 또는 발린(V)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 알라닌을 가지는 dCas12f1 D510A 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 류신을 가지는 dCas12f1 D510L 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 발린을 가지는 dCas12f1 D510V 단백질일 수 있다. 이때, 상기 dCas12f1 단백질은 서열번호 266 내지 268에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
상기 전사 활성 단백질은 VP64일 수 있다. 이때, 상기 전사 활성 단백질은 서열번호 272에 제시된 아미노산 서열을 가질 수 있다.
상기 전사 활성 Cas12f1 융합 단백질은 추가 도메인으로 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS는 상기 전사 활성 Cas12f1 융합 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 또는, 상기 하나 이상의 NLS는 상기 dCas12f1 단백질과 전사 활성 단백질 사이에 위치할 수 있다. 이때, 상기 하나 이상의 NLS는 링커에 의해 dCas12f1 단백질 및/또는 전사 활성 단백질과 연결될 수 있다.
일 예로, 상기 전사 활성 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 R490A 단백질]-[VP64]; [dCas12f1 R490Q 단백질]-[VP64]; [dCas12f1 R490L 단백질]-[VP64]; [dCas12f1 R490W 단백질]-[VP64]; [VP64]-[dCas12f1 R490A 단백질]; [VP64]-[dCas12f1 R490Q 단백질]; [VP64]-[dCas12f1 R490L 단백질]; 또는 [VP64]-[dCas12f1 R490W 단백질]. 상기 전사 활성 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 활성 Cas12f1 융합 단백질의 N 말단, 상기 전사 활성 Cas12f1 융합 단백질의 C 말단 및/또는 dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 VP64 사이에 위치할 수 있다.
일 예로, 상기 전사 활성 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 D510A 단백질]-[VP64]; [dCas12f1 D510L 단백질]-[VP64]; [dCas12f1 D510V 단백질]-[VP64]; [VP64]-[dCas12f1 D510A 단백질]; [VP64]-[dCas12f1 D510L 단백질]; 또는 [VP64]-[dCas12f1 D510V 단백질]. 상기 전사 활성 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 활성 Cas12f1 융합 단백질의 N 말단, 상기 전사 활성 Cas12f1 융합 단백질의 C 말단 및/또는 dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 VP64 사이에 위치할 수 있다.
Cas12f1 융합 단백질 - 전사 활성 Cas12f1 융합 단백질 예시 2
일 구현예로, 상기 전사 활성 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로, dCas12f1 단백질, 전사 활성 단백질 및 전사 활성 단백질이 순서대로 연결된 것; 또는 전사 활성 단백질, 전사 활성 단백질 및 dCas12f1 단백질이 순서대로 연결된 것일 수 있다. 이때, 상기 dCas12f1 단백질과 전사 활성 단백질은 링커에 의해 연결될 수 있다.
상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 490번째 아미노산인 아르기닌(R)이 알라닌(A), 글루타민(Q), 류신(L) 또는 트립토판(W)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 알라닌을 가지는 dCas12f1 R490A 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 글루타민을 가지는 dCas12f1 R490Q 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 류신을 가지는 dCas12f1 R490L 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 트립토판을 가지는 dCas12f1 R490W 단백질일 수 있다. 이때, 상기 dCas12f1 단백질은 서열번호 261, 262, 264 및 265에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 510번째 아미노산인 아스파트산(D)이 알라닌(A), 류신(L) 또는 발린(V)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 알라닌을 가지는 dCas12f1 D510A 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 류신을 가지는 dCas12f1 D510L 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 발린을 가지는 dCas12f1 D510V 단백질일 수 있다. 이때, 상기 dCas12f1 단백질은 서열번호 266 내지 268에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
상기 전사 활성 단백질은 VP64일 수 있다. 이때, 상기 전사 활성 단백질은 서열번호 272에 제시된 아미노산 서열을 가질 수 있다.
상기 전사 활성 Cas12f1 융합 단백질은 추가 도메인으로 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS는 상기 전사 활성 Cas12f1 융합 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 또는, 상기 하나 이상의 NLS는 상기 dCas12f1 단백질과 전사 활성 단백질 사이에 위치할 수 있다. 또는, 상기 하나 이상의 NLS는 상기 전사 활성 단백질들 사이에 위치할 수 있다. 이때, 상기 하나 이상의 NLS는 링커에 의해 dCas12f1 단백질 및/또는 전사 활성 단백질과 연결될 수 있다.
일 예로, 상기 전사 활성 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 R490A 단백질]-[VP64]-[VP64]; [dCas12f1 R490Q 단백질]-[VP64]-[VP64]; [dCas12f1 R490L 단백질]-[VP64]-[VP64]; [dCas12f1 R490W 단백질]-[VP64]-[VP64]; [VP64]-[VP64]-[dCas12f1 R490A 단백질]; [VP64]-[VP64]-[dCas12f1 R490Q 단백질]; [VP64]-[VP64]-[dCas12f1 R490L 단백질]; 또는 [VP64]-[VP64]-[dCas12f1 R490W 단백질]. 상기 전사 활성 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 활성 Cas12f1 융합 단백질의 N 말단, 상기 전사 활성 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 VP64 사이 및/또는 VP64과 VP64 사이에 위치할 수 있다.
일 예로, 상기 전사 활성 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 D510A 단백질]-[VP64]-[VP64]; [dCas12f1 D510L 단백질]-[VP64]-[VP64]; [dCas12f1 D510V 단백질]-[VP64]-[VP64]; [VP64]-[VP64]-[dCas12f1 D510A 단백질]; [VP64]-[VP64]-[dCas12f1 D510L 단백질]; 또는 [VP64]-[VP64]-[dCas12f1 D510V 단백질]. 상기 전사 활성 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 활성 Cas12f1 융합 단백질의 N 말단, 상기 전사 활성 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 VP64 사이 및/또는 VP64과 VP64 사이에 위치할 수 있다.
Cas12f1 융합 단백질 - 전사 저해 Cas12f1 융합 단백질 구현예
본 명세서에서 제공하는 Cas12f1 융합 단백질은 전사 저해 Cas12f1 융합 단백질일 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 dCas12f1 단백질 및 적어도 하나의 전사 저해 단백질을 포함할 수 있다. 이때, 상기 전사 저해 단백질은 dCas12f1 단백질의 N 말단 또는 C 말단에 위치할 수 있다. 상기 전사 저해 Cas12f1 융합 단백질은 추가 도메인으로 적어도 하나의 NLS를 더 포함할 수 있다. 이때, 상기 NLS는 전사 저해 Cas12f1 융합 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 또는 상기 NLS는 상기 dCas12f1 단백질과 전사 저해 단백질 사이에 위치할 수 있다. 이때, 상기 전사 저해 Cas12f1 융합 단백질에 포함된 dCas12f1 단백질, 전사 저해 단백질 및 NLS는 링커에 의해 연결될 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 dCas12f1 단백질 및 둘 이상의 전사 저해 단백질을 포함할 수 있다. 이때, 상기 둘 이상의 전사 저해 단백질은 dCas12f1 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 상기 전사 저해 Cas12f1 융합 단백질은 추가 도메인으로 적어도 하나의 NLS를 더 포함할 수 있다. 이때, 상기 NLS는 전사 저해 Cas12f1 융합 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 또는 상기 NLS는 상기 dCas12f1 단백질과 전사 저해 단백질 사이에 위치할 수 있다. 이때, 상기 전사 저해 Cas12f1 융합 단백질에 포함된 dCas12f1 단백질, 전사 저해 단백질 및 NLS는 링커에 의해 연결될 수 있다.
이하에서, 전사 저해 Cas12f1 융합 단백질의 다양한 예시를 설명한다. 하기 예시는 단순 예시로, 이에 제한되지 않는다.
Cas12f1 융합 단백질 - 전사 저해 Cas12f1 융합 단백질 예시 1
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로, dCas12f1 단백질 및 전사 저해 단백질이 순서대로 연결된 것; 또는 전사 저해 단백질 및 dCas12f1 단백질이 순서대로 연결된 것일 수 있다. 이때, 상기 dCas12f1 단백질과 전사 저해 단백질은 링커에 의해 연결될 수 있다.
상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 490번째 아미노산인 아르기닌(R)이 알라닌(A), 글루타민(Q), 류신(L) 또는 트립토판(W)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 알라닌을 가지는 dCas12f1 R490A 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 글루타민을 가지는 dCas12f1 R490Q 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 류신을 가지는 dCas12f1 R490L 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 트립토판을 가지는 dCas12f1 R490W 단백질일 수 있다. 이때, 상기 dCas12f1 단백질은 서열번호 261, 262, 264 및 265에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 510번째 아미노산인 아스파트산(D)이 알라닌(A), 류신(L) 또는 발린(V)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 알라닌을 가지는 dCas12f1 D510A 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 류신을 가지는 dCas12f1 D510L 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 발린을 가지는 dCas12f1 D510V 단백질일 수 있다. 이때, 상기 dCas12f1 단백질은 서열번호 266 내지 268에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
상기 전사 저해 단백질은 KRAB, MeCP2, DNMT3 또는 HDAC3일 수 있다. 이때, 상기 전사 저해 단백질은 서열번호 274 내지 277에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
상기 전사 저해 Cas12f1 융합 단백질은 추가 도메인으로 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS는 상기 전사 저해 Cas12f1 융합 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 또는, 상기 하나 이상의 NLS는 상기 dCas12f1 단백질과 전사 저해 단백질 사이에 위치할 수 있다. 이때, 상기 하나 이상의 NLS는 링커에 의해 dCas12f1 단백질 및/또는 전사 저해 단백질과 연결될 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 R490A 단백질]-[KRAB]; [dCas12f1 R490Q 단백질]-[KRAB]; [dCas12f1 R490L 단백질]-[KRAB]; [dCas12f1 R490W 단백질]-[KRAB]; [KRAB]-[dCas12f1 R490A 단백질]; [KRAB]-[dCas12f1 R490Q 단백질]; [KRAB]-[dCas12f1 R490L 단백질]; 또는 [KRAB]-[dCas12f1 R490W 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단 및/또는 dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 KRAB 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 D510A 단백질]-[KRAB]; [dCas12f1 D510L 단백질]-[KRAB]; [dCas12f1 D510V 단백질]-[KRAB]; [KRAB]-[dCas12f1 D510A 단백질]; [KRAB]-[dCas12f1 D510L 단백질]; 또는 [KRAB]-[dCas12f1 D510V 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단 및/또는 dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 KRAB 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 R490A 단백질]-[DNMT3]; [dCas12f1 R490Q 단백질]-[DNMT3]; [dCas12f1 R490L 단백질]-[DNMT3]; [dCas12f1 R490W 단백질]-[DNMT3]; [DNMT3]-[dCas12f1 R490A 단백질]; [DNMT3]-[dCas12f1 R490Q 단백질]; [DNMT3]-[dCas12f1 R490L 단백질]; 또는 [DNMT3]-[dCas12f1 R490W 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단 및/또는 dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 DNMT3 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 D510A 단백질]-[DNMT3]; [dCas12f1 D510L 단백질]-[DNMT3]; [dCas12f1 D510V 단백질]-[DNMT3]; [DNMT3]-[dCas12f1 D510A 단백질]; [DNMT3]-[dCas12f1 D510L 단백질]; 또는 [DNMT3]-[dCas12f1 D510V 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단 및/또는 dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 DNMT3 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 R490A 단백질]-[MeCP2]; [dCas12f1 R490Q 단백질]-[MeCP2]; [dCas12f1 R490L 단백질]-[MeCP2]; [dCas12f1 R490W 단백질]-[MeCP2]; [MeCP2]-[dCas12f1 R490A 단백질]; [MeCP2]-[dCas12f1 R490Q 단백질]; [MeCP2]-[dCas12f1 R490L 단백질]; 또는 [MeCP2]-[dCas12f1 R490W 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단 및/또는 dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 MeCP2 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 D510A 단백질]-[MeCP2]; [dCas12f1 D510L 단백질]-[MeCP2]; [dCas12f1 D510V 단백질]-[MeCP2]; [MeCP2]-[dCas12f1 D510A 단백질]; [MeCP2]-[dCas12f1 D510L 단백질]; 또는 [MeCP2]-[dCas12f1 D510V 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단 및/또는 dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 MeCP2 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 R490A 단백질]-[HDAC3]; [dCas12f1 R490Q 단백질]-[HDAC3]; [dCas12f1 R490L 단백질]-[HDAC3]; [dCas12f1 R490W 단백질]-[HDAC3]; [HDAC3]-[dCas12f1 R490A 단백질]; [HDAC3]-[dCas12f1 R490Q 단백질]; [HDAC3]-[dCas12f1 R490L 단백질]; 또는 [HDAC3]-[dCas12f1 R490W 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단 및/또는 dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 HDAC3 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 D510A 단백질]-[HDAC3]; [dCas12f1 D510L 단백질]-[HDAC3]; [dCas12f1 D510V 단백질]-[HDAC3]; [HDAC3]-[dCas12f1 D510A 단백질]; [HDAC3]-[dCas12f1 D510L 단백질]; 또는 [HDAC3]-[dCas12f1 D510V 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단 및/또는 dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 HDAC3 사이에 위치할 수 있다.
Cas12f1 융합 단백질 - 전사 저해 Cas12f1 융합 단백질 예시 2
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로, dCas12f1 단백질, 전사 저해 단백질 및 전사 저해 단백질이 순서대로 연결된 것; 또는 전사 저해 단백질, 전사 저해 단백질 및 dCas12f1 단백질이 순서대로 연결된 것일 수 있다. 이때, 상기 dCas12f1 단백질과 전사 저해 단백질은 링커에 의해 연결될 수 있다.
상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 490번째 아미노산인 아르기닌(R)이 알라닌(A), 글루타민(Q), 류신(L) 또는 트립토판(W)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 알라닌을 가지는 dCas12f1 R490A 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 글루타민을 가지는 dCas12f1 R490Q 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 류신을 가지는 dCas12f1 R490L 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 트립토판을 가지는 dCas12f1 R490W 단백질일 수 있다. 이때, 상기 dCas12f1 단백질은 서열번호 261, 262, 264 및 265에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 510번째 아미노산인 아스파트산(D)이 알라닌(A), 류신(L) 또는 발린(V)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 알라닌을 가지는 dCas12f1 D510A 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 류신을 가지는 dCas12f1 D510L 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 발린을 가지는 dCas12f1 D510V 단백질일 수 있다. 이때, 상기 dCas12f1 단백질은 서열번호 266 내지 268에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
상기 전사 저해 단백질은 KRAB, MeCP2, DNMT3 또는 HDAC3일 수 있다. 이때, 상기 전사 저해 단백질은 서열번호 274 내지 277에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
상기 전사 저해 Cas12f1 융합 단백질은 추가 도메인으로 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS는 상기 전사 저해 Cas12f1 융합 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 또는, 상기 하나 이상의 NLS는 상기 dCas12f1 단백질과 전사 저해 단백질 사이에 위치할 수 있다. 또는, 상기 하나 이상의 NLS는 상기 전사 저해 단백질들 사이에 위치할 수 있다. 이때, 상기 하나 이상의 NLS는 링커에 의해 dCas12f1 단백질 및/또는 전사 저해 단백질과 연결될 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 R490A 단백질]-[KRAB]-[KRAB]; [dCas12f1 R490Q 단백질]-[KRAB]-[KRAB]; [dCas12f1 R490L 단백질]-[KRAB]-[KRAB]; [dCas12f1 R490W 단백질]-[KRAB]-[KRAB]; [KRAB]-[KRAB]-[dCas12f1 R490A 단백질]; [KRAB]-[KRAB]-[dCas12f1 R490Q 단백질]; [KRAB]-[KRAB]-[dCas12f1 R490L 단백질]; 또는 [KRAB]-[KRAB]-[dCas12f1 R490W 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 KRAB 사이 및/또는 KRAB과 KRAB 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 D510A 단백질]-[KRAB]-[KRAB]; [dCas12f1 D510L 단백질]-[KRAB]-[KRAB]; [dCas12f1 D510V 단백질]-[KRAB]-[KRAB]; [KRAB]-[KRAB]-[dCas12f1 D510A 단백질]; [KRAB]-[KRAB]-[dCas12f1 D510L 단백질]; 또는 [KRAB]-[KRAB]-[dCas12f1 D510V 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 KRAB 사이 및/또는 KRAB과 KRAB 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 R490A 단백질]-[KRAB]-[MeCP2]; [dCas12f1 R490Q 단백질]-[KRAB]-[MeCP2]; [dCas12f1 R490L 단백질]-[KRAB]-[MeCP2]; [dCas12f1 R490W 단백질]-[KRAB]-[MeCP2]; [dCas12f1 R490A 단백질]-[MeCP2]-[KRAB]; [dCas12f1 R490Q 단백질]-[MeCP2]-[KRAB]; [dCas12f1 R490L 단백질]-[MeCP2]-[KRAB]; [dCas12f1 R490W 단백질]-[MeCP2]-[KRAB]; [KRAB]-[MeCP2]-[dCas12f1 R490A 단백질]; [KRAB]-[MeCP2]-[dCas12f1 R490Q 단백질]; [KRAB]-[MeCP2]-[dCas12f1 R490L 단백질]; [KRAB]-[MeCP2]-[dCas12f1 R490W 단백질]; [MeCP2]-[KRAB]-[dCas12f1 R490A 단백질]; [MeCP2]-[KRAB]-[dCas12f1 R490Q 단백질]; [MeCP2]-[KRAB]-[dCas12f1 R490L 단백질]; 또는 [MeCP2]-[KRAB]-[dCas12f1 R490W 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 KRAB 사이, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 MeCP2 사이 및/또는 KRAB과 MeCP2 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 D510A 단백질]-[KRAB]-[MeCP2]; [dCas12f1 D510L 단백질]-[KRAB]-[MeCP2]; [dCas12f1 D510V 단백질]-[KRAB]-[MeCP2]; [dCas12f1 D510A 단백질]-[MeCP2]-[KRAB]; [dCas12f1 D510L 단백질]-[MeCP2]-[KRAB]; [dCas12f1 D510V 단백질]-[MeCP2]-[KRAB]; [KRAB]-[MeCP2]-[dCas12f1 D510A 단백질]; [KRAB]-[MeCP2]-[dCas12f1 D510L 단백질]; [KRAB]-[MeCP2]-[dCas12f1 D510V 단백질]; [MeCP2]-[KRAB]-[dCas12f1 D510A 단백질]; [MeCP2]-[KRAB]-[dCas12f1 D510L 단백질]; 또는 [MeCP2]-[KRAB]-[dCas12f1 D510V 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 MeCP2 사이 및/또는 KRAB과 MeCP2 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 R490A 단백질]-[KRAB]-[DNMT3]; [dCas12f1 R490Q 단백질]-[KRAB]-[DNMT3]; [dCas12f1 R490L 단백질]-[KRAB]-[DNMT3]; [dCas12f1 R490W 단백질]-[KRAB]-[DNMT3]; [dCas12f1 R490A 단백질]-[DNMT3]-[KRAB]; [dCas12f1 R490Q 단백질]-[DNMT3]-[KRAB]; [dCas12f1 R490L 단백질]-[DNMT3]-[KRAB]; [dCas12f1 R490W 단백질]-[DNMT3]-[KRAB]; [KRAB]-[DNMT3]-[dCas12f1 R490A 단백질]; [KRAB]-[DNMT3]-[dCas12f1 R490Q 단백질]; [KRAB]-[DNMT3]-[dCas12f1 R490L 단백질]; [KRAB]-[DNMT3]-[dCas12f1 R490W 단백질]; [DNMT3]-[KRAB]-[dCas12f1 R490A 단백질]; [DNMT3]-[KRAB]-[dCas12f1 R490Q 단백질]; [DNMT3]-[KRAB]-[dCas12f1 R490L 단백질]; 또는 [DNMT3]-[KRAB]-[dCas12f1 R490W 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 KRAB 사이, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 DNMT3 사이 및/또는 KRAB과 DNMT3 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 D510A 단백질]-[KRAB]-[DNMT3]; [dCas12f1 D510L 단백질]-[KRAB]-[DNMT3]; [dCas12f1 D510V 단백질]-[KRAB]-[DNMT3]; [dCas12f1 D510A 단백질]-[DNMT3]-[KRAB]; [dCas12f1 D510L 단백질]-[DNMT3]-[KRAB]; [dCas12f1 D510V 단백질]-[DNMT3]-[KRAB]; [KRAB]-[DNMT3]-[dCas12f1 D510A 단백질]; [KRAB]-[DNMT3]-[dCas12f1 D510L 단백질]; [KRAB]-[DNMT3]-[dCas12f1 D510V 단백질]; [DNMT3]-[KRAB]-[dCas12f1 D510A 단백질]; [DNMT3]-[KRAB]-[dCas12f1 D510L 단백질]; 또는 [DNMT3]-[KRAB]-[dCas12f1 D510V 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 DNMT3 사이 및/또는 KRAB과 DNMT3 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 R490A 단백질]-[KRAB]-[HDAC3]; [dCas12f1 R490Q 단백질]-[KRAB]-[HDAC3]; [dCas12f1 R490L 단백질]-[KRAB]-[HDAC3]; [dCas12f1 R490W 단백질]-[KRAB]-[HDAC3]; [dCas12f1 R490A 단백질]-[HDAC3]-[KRAB]; [dCas12f1 R490Q 단백질]-[HDAC3]-[KRAB]; [dCas12f1 R490L 단백질]-[HDAC3]-[KRAB]; [dCas12f1 R490W 단백질]-[HDAC3]-[KRAB]; [KRAB]-[HDAC3]-[dCas12f1 R490A 단백질]; [KRAB]-[HDAC3]-[dCas12f1 R490Q 단백질]; [KRAB]-[HDAC3]-[dCas12f1 R490L 단백질]; [KRAB]-[HDAC3]-[dCas12f1 R490W 단백질]; [HDAC3]-[KRAB]-[dCas12f1 R490A 단백질]; [HDAC3]-[KRAB]-[dCas12f1 R490Q 단백질]; [HDAC3]-[KRAB]-[dCas12f1 R490L 단백질]; 또는 [HDAC3]-[KRAB]-[dCas12f1 R490W 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 KRAB 사이, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 HDAC3 사이 및/또는 KRAB과 HDAC3 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 D510A 단백질]-[KRAB]-[HDAC3]; [dCas12f1 D510L 단백질]-[KRAB]-[HDAC3]; [dCas12f1 D510V 단백질]-[KRAB]-[HDAC3]; [dCas12f1 D510A 단백질]-[HDAC3]-[KRAB]; [dCas12f1 D510L 단백질]-[HDAC3]-[KRAB]; [dCas12f1 D510V 단백질]-[HDAC3]-[KRAB]; [KRAB]-[HDAC3]-[dCas12f1 D510A 단백질]; [KRAB]-[HDAC3]-[dCas12f1 D510L 단백질]; [KRAB]-[HDAC3]-[dCas12f1 D510V 단백질]; [HDAC3]-[KRAB]-[dCas12f1 D510A 단백질]; [HDAC3]-[KRAB]-[dCas12f1 D510L 단백질]; 또는 [HDAC3]-[KRAB]-[dCas12f1 D510V 단백질]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 HDAC3 사이 및/또는 KRAB과 HDAC3 사이에 위치할 수 있다.
Cas12f1 융합 단백질 - 전사 저해 Cas12f1 융합 단백질 예시 3
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로, 전사 저해 단백질, dCas12f1 단백질 및 전사 저해 단백질이 순서대로 연결된 것일 수 있다. 이때, 상기 dCas12f1 단백질과 전사 저해 단백질은 링커에 의해 연결될 수 있다.
상기 전사 저해 단백질은 KRAB, MeCP2, DNMT3 또는 HDAC3일 수 있다. 이때, 상기 전사 저해 단백질은 서열번호 274 내지 277에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 490번째 아미노산인 아르기닌(R)이 알라닌(A), 글루타민(Q), 류신(L) 또는 트립토판(W)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 알라닌을 가지는 dCas12f1 R490A 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 글루타민을 가지는 dCas12f1 R490Q 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 류신을 가지는 dCas12f1 R490L 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 트립토판을 가지는 dCas12f1 R490W 단백질일 수 있다. 이때, 상기 dCas12f1 단백질은 서열번호 261, 262, 264 및 265에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 510번째 아미노산인 아스파트산(D)이 알라닌(A), 류신(L) 또는 발린(V)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 알라닌을 가지는 dCas12f1 D510A 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 류신을 가지는 dCas12f1 D510L 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 발린을 가지는 dCas12f1 D510V 단백질일 수 있다. 이때, 상기 dCas12f1 단백질은 서열번호 266 내지 268에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
상기 전사 저해 Cas12f1 융합 단백질은 추가 도메인으로 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS는 상기 전사 저해 Cas12f1 융합 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 또는, 상기 하나 이상의 NLS는 상기 dCas12f1 단백질과 전사 저해 단백질 사이에 위치할 수 있다. 또는, 상기 하나 이상의 NLS는 상기 전사 저해 단백질들 사이에 위치할 수 있다. 이때, 상기 하나 이상의 NLS는 링커에 의해 dCas12f1 단백질 및/또는 전사 저해 단백질과 연결될 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [KRAB]-[dCas12f1 R490A 단백질]-[KRAB]; [KRAB]-[dCas12f1 R490Q 단백질]-[KRAB]; [KRAB]-[dCas12f1 R490L 단백질]-[KRAB]; [KRAB]-[dCas12f1 R490W 단백질]-[KRAB]; [KRAB]-[dCas12f1 R490A 단백질]-[KRAB]; [KRAB]-[dCas12f1 R490Q 단백질]-[KRAB]; [KRAB]-[dCas12f1 R490L 단백질]-[KRAB]; 또는 [KRAB]-[dCas12f1 R490W 단백질]-[KRAB]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단 및/또는 dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 KRAB 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [KRAB]-[dCas12f1 D510A 단백질]-[KRAB]; [KRAB]-[dCas12f1 D510L 단백질]-[KRAB]; [KRAB]-[dCas12f1 D510V 단백질]-[KRAB]; [KRAB]-[dCas12f1 D510A 단백질]-[KRAB]; [KRAB]-[dCas12f1 D510L 단백질]-[KRAB]; 또는 [KRAB]-[dCas12f1 D510V 단백질]-[KRAB]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단 및/또는 dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 KRAB 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [KRAB]-[dCas12f1 R490A 단백질]-[MeCP2]; [KRAB]-[dCas12f1 R490Q 단백질]-[MeCP2]; [KRAB]-[dCas12f1 R490L 단백질]-[MeCP2]; [KRAB]-[dCas12f1 R490W 단백질]-[MeCP2]; [MeCP2]-[dCas12f1 R490A 단백질]-[KRAB]; [MeCP2]-[dCas12f1 R490Q 단백질]-[KRAB]; [MeCP2]-[dCas12f1 R490L 단백질]-[KRAB]; 또는 [MeCP2]-[dCas12f1 R490W 단백질]-[KRAB]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 KRAB 사이 및/또는 dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 MeCP2 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [KRAB]-[dCas12f1 D510A 단백질]-[MeCP2]; [KRAB]-[dCas12f1 D510L 단백질]-[MeCP2]; [KRAB]-[dCas12f1 D510V 단백질]-[MeCP2]; [MeCP2]-[dCas12f1 D510A 단백질]-[KRAB]; [MeCP2]-[dCas12f1 D510L 단백질]-[KRAB]; 또는 [MeCP2]-[dCas12f1 D510V 단백질]-[KRAB]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 KRAB 사이 및/또는 dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 MeCP2 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [KRAB]-[dCas12f1 R490A 단백질]-[DNMT3]; [KRAB]-[dCas12f1 R490Q 단백질]-[DNMT3]; [KRAB]-[dCas12f1 R490L 단백질]-[DNMT3]; [KRAB]-[dCas12f1 R490W 단백질]-[DNMT3]; [DNMT3]-[dCas12f1 R490A 단백질]-[KRAB]; [DNMT3]-[dCas12f1 R490Q 단백질]-[KRAB]; [DNMT3]-[dCas12f1 R490L 단백질]-[KRAB]; 또는 [DNMT3]-[dCas12f1 R490W 단백질]-[KRAB]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 KRAB 사이 및/또는 dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 DNMT3 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [KRAB]-[dCas12f1 D510A 단백질]-[DNMT3]; [KRAB]-[dCas12f1 D510L 단백질]-[DNMT3]; [KRAB]-[dCas12f1 D510V 단백질]-[DNMT3]; [DNMT3]-[dCas12f1 D510A 단백질]-[KRAB]; [DNMT3]-[dCas12f1 D510L 단백질]-[KRAB]; 또는 [DNMT3]-[dCas12f1 D510V 단백질]-[KRAB]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 KRAB 사이 및/또는 dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 DNMT3 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [KRAB]-[dCas12f1 R490A 단백질]-[HDAC3]; [KRAB]-[dCas12f1 R490Q 단백질]-[HDAC3]; [KRAB]-[dCas12f1 R490L 단백질]-[HDAC3]; [KRAB]-[dCas12f1 R490W 단백질]-[HDAC3]; [HDAC3]-[dCas12f1 R490A 단백질]-[KRAB]; [HDAC3]-[dCas12f1 R490Q 단백질]-[KRAB]; [HDAC3]-[dCas12f1 R490L 단백질]-[KRAB]; 또는 [HDAC3]-[dCas12f1 R490W 단백질]-[KRAB]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 KRAB 사이 및/또는 dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 HDAC3 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [KRAB]-[dCas12f1 D510A 단백질]-[HDAC3]; [KRAB]-[dCas12f1 D510L 단백질]-[HDAC3]; [KRAB]-[dCas12f1 D510V 단백질]-[HDAC3]; [HDAC3]-[dCas12f1 D510A 단백질]-[KRAB]; [HDAC3]-[dCas12f1 D510L 단백질]-[KRAB]; 또는 [HDAC3]-[dCas12f1 D510V 단백질]-[KRAB]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 KRAB 사이 및/또는 dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 HDAC3 사이에 위치할 수 있다.
Cas12f1 융합 단백질 - 전사 저해 Cas12f1 융합 단백질 예시 4
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 dCas12f1 단백질 및 3개 이상의 전사 활성 단백질을 포함할 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로, dCas12f1 단백질, 전사 저해 단백질, 전사 저해 단백질 및 전사 저해 단백질이 순서대로 연결된 것; 전사 저해 단백질, 전사 저해 단백질, 전사 저해 단백질 및 dCas12f1 단백질이 순서대로 연결된 것; 전사 저해 단백질, 전사 저해 단백질, dCas12f1 단백질 및 전사 저해 단백질이 순서대로 연결된 것; 또는 전사 저해 단백질, dCas12f1 단백질, 전사 저해 단백질 및 전사 저해 단백질이 순서대로 연결된 것 일 수 있다. 이때, 상기 dCas12f1 단백질과 전사 저해 단백질은 링커에 의해 연결될 수 있다.
상기 전사 저해 단백질은 KRAB, MeCP2, DNMT3 또는 HDAC3일 수 있다. 이때, 상기 전사 저해 단백질은 서열번호 274 내지 277에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 490번째 아미노산인 아르기닌(R)이 알라닌(A), 글루타민(Q), 류신(L) 또는 트립토판(W)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 알라닌을 가지는 dCas12f1 R490A 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 글루타민을 가지는 dCas12f1 R490Q 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 류신을 가지는 dCas12f1 R490L 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 490번째 트립토판을 가지는 dCas12f1 R490W 단백질일 수 있다. 이때, 상기 dCas12f1 단백질은 서열번호 261, 262, 264 및 265에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 510번째 아미노산인 아스파트산(D)이 알라닌(A), 류신(L) 또는 발린(V)으로 치환된 것일 수 있다. 이때, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 알라닌을 가지는 dCas12f1 D510A 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 류신을 가지는 dCas12f1 D510L 단백질일 수 있다. 또는, 상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질의 아미노산 서열과 비교하였을 때 510번째 발린을 가지는 dCas12f1 D510V 단백질일 수 있다. 이때, 상기 dCas12f1 단백질은 서열번호 266 내지 268에 제시된 아미노산 서열 중 적어도 하나의 아미노산 서열을 가질 수 있다.
상기 전사 저해 Cas12f1 융합 단백질은 추가 도메인으로 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS는 상기 전사 저해 Cas12f1 융합 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 또는, 상기 하나 이상의 NLS는 상기 dCas12f1 단백질과 전사 저해 단백질 사이에 위치할 수 있다. 또는, 상기 하나 이상의 NLS는 상기 전사 저해 단백질들 사이에 위치할 수 있다. 이때, 상기 하나 이상의 NLS는 링커에 의해 dCas12f1 단백질 및/또는 전사 저해 단백질과 연결될 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 R490A 단백질]-[KRAB]-[KRAB]-[MeCP2]; [dCas12f1 R490Q 단백질]-[KRAB]-[KRAB]-[MeCP2]; [dCas12f1 R490L 단백질]-[KRAB]-[KRAB]-[MeCP2]; [dCas12f1 R490W 단백질]-[KRAB]-[KRAB]-[MeCP2]; [dCas12f1 R490A 단백질]-[KRAB]-[KRAB]-[DNMT3]; [dCas12f1 R490Q 단백질]-[KRAB]-[KRAB]-[DNMT3]; [dCas12f1 R490L 단백질]-[KRAB]-[KRAB]-[DNMT3]; [dCas12f1 R490W 단백질]-[KRAB]-[KRAB]-[DNMT3]; [dCas12f1 R490A 단백질]-[KRAB]-[KRAB]-[HDAC3]; [dCas12f1 R490Q 단백질]-[KRAB]-[KRAB]-[HDAC3]; [dCas12f1 R490L 단백질]-[KRAB]-[KRAB]-[HDAC3]; [dCas12f1 R490W 단백질]-[KRAB]-[KRAB]-[HDAC3]; [dCas12f1 R490A 단백질]-[KRAB]-[MeCP2]-[KRAB]; [dCas12f1 R490Q 단백질]-[KRAB]-[MeCP2]-[KRAB]; [dCas12f1 R490L 단백질]-[KRAB]-[MeCP2]-[KRAB]; [dCas12f1 R490W 단백질]-[KRAB]-[MeCP2]-[KRAB]; [dCas12f1 R490A 단백질]-[KRAB]-[DNMT3]-[KRAB]; [dCas12f1 R490Q 단백질]-[KRAB]-[DNMT3]-[KRAB]; [dCas12f1 R490L 단백질]-[KRAB]-[DNMT3]-[KRAB]; [dCas12f1 R490W 단백질]-[KRAB]-[DNMT3]-[KRAB]; [dCas12f1 R490A 단백질]-[KRAB]-[HDAC3]-[KRAB]; [dCas12f1 R490Q 단백질]-[KRAB]-[HDAC3]-[KRAB]; [dCas12f1 R490L 단백질]-[KRAB]-[HDAC3]-[KRAB] 또는 [dCas12f1 R490W 단백질]-[KRAB]-[HDAC3]-[KRAB]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 KRAB 사이, KRAB과 KRAB 사이, KRAB과 MeCP2 사이, KRAB과 DNMT3 사이 및/또는 KRAB과 HDAC3 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [dCas12f1 D510A 단백질]-[KRAB]-[KRAB]-[MeCP2]; [dCas12f1 D510L 단백질]-[KRAB]-[KRAB]-[MeCP2]; [dCas12f1 D510V 단백질]-[KRAB]-[KRAB]-[MeCP2]; [dCas12f1 D510A 단백질]-[KRAB]-[KRAB]-[DNMT3]; [dCas12f1 D510L 단백질]-[KRAB]-[KRAB]-[DNMT3]; [dCas12f1 D510V 단백질]-[KRAB]-[KRAB]-[DNMT3]; [dCas12f1 D510A 단백질]-[KRAB]-[KRAB]-[HDAC3]; [dCas12f1 D510L 단백질]-[KRAB]-[KRAB]-[HDAC3]; [dCas12f1 D510V 단백질]-[KRAB]-[KRAB]-[HDAC3]; [dCas12f1 D510A 단백질]-[KRAB]-[MeCP2]-[KRAB]; D510 [dCas12f1 D510L 단백질]-[KRAB]-[MeCP2]-[KRAB]; [dCas12f1 D510V 단백질]-[KRAB]-[MeCP2]-[KRAB]; [dCas12f1 D510A 단백질]-[KRAB]-[DNMT3]-[KRAB]; [dCas12f1 D510L 단백질]-[KRAB]-[DNMT3]-[KRAB]; [dCas12f1 D510V 단백질]-[KRAB]-[DNMT3]-[KRAB]; [dCas12f1 D510A 단백질]-[KRAB]-[HDAC3]-[KRAB]; [dCas12f1 D510L 단백질]-[KRAB]-[HDAC3]-[KRAB] 또는 [dCas12f1 D510V 단백질]-[KRAB]-[HDAC3]-[KRAB]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 KRAB 사이, KRAB과 KRAB 사이, KRAB과 MeCP2 사이, KRAB과 DNMT3 사이 및/또는 KRAB과 HDAC3 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [KRAB]-[KRAB]-[dCas12f1 R490A 단백질]-[MeCP2]; [KRAB]-[KRAB]-[dCas12f1 R490Q 단백질]-[MeCP2]; [KRAB]-[KRAB]-[dCas12f1 R490L 단백질]-[MeCP2]; [KRAB]-[KRAB]-[dCas12f1 R490W 단백질]-[MeCP2]; [KRAB]-[KRAB]-[dCas12f1 R490A 단백질]-[DNMT3]; [KRAB]-[KRAB]-[dCas12f1 R490Q 단백질]-[DNMT3]; [KRAB]-[KRAB]-[dCas12f1 R490L 단백질]-[DNMT3]; [KRAB]-[KRAB]-[dCas12f1 R490W 단백질]-[DNMT3]; [KRAB]-[KRAB]-[dCas12f1 R490A 단백질]-[HDAC3]; [KRAB]-[KRAB]-[dCas12f1 R490Q 단백질]-[HDAC3]; [KRAB]-[KRAB]-[dCas12f1 R490L 단백질]-[HDAC3]; [KRAB]-[KRAB]-[dCas12f1 R490W 단백질]-[HDAC3]; [KRAB]-[MeCP2]-[dCas12f1 R490A 단백질]-[KRAB]; [KRAB]-[MeCP2]-[dCas12f1 R490Q 단백질]-[KRAB]; [KRAB]-[MeCP2]-[dCas12f1 R490L 단백질]-[KRAB]; [KRAB]-[MeCP2]-[dCas12f1 R490W 단백질]-[KRAB]; [KRAB]-[DNMT3]-[dCas12f1 R490A 단백질]-[KRAB]; [KRAB]-[DNMT3]-[dCas12f1 R490Q 단백질]-[KRAB]; [KRAB]-[DNMT3]-[dCas12f1 R490L 단백질]-[KRAB]; [KRAB]-[DNMT3]-[dCas12f1 R490W 단백질]-[KRAB]; [KRAB]-[HDAC3]-[dCas12f1 R490A 단백질]-[KRAB]; [KRAB]-[HDAC3]-[dCas12f1 R490Q 단백질]-[KRAB]; [KRAB]-[HDAC3]-[dCas12f1 R490L 단백질]-[KRAB] 또는 [KRAB]-[HDAC3]-[dCas12f1 R490W 단백질]-[KRAB]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 KRAB 사이, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 MeCP2 사이, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 DNMT3 사이, dCas12f1 단백질(dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질)과 HDAC3 사이, KRAB과 KRAB 사이, KRAB과 MeCP2 사이, KRAB과 DNMT3 사이 및/또는 KRAB과 HDAC3 사이에 위치할 수 있다.
일 예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 다음과 같은 구조를 가질 수 있다: [KRAB]-[KRAB]-[dCas12f1 D510A 단백질]-[MeCP2]; [KRAB]-[KRAB]-[dCas12f1 D510L 단백질]-[MeCP2]; [KRAB]-[KRAB]-[dCas12f1 D510V 단백질]-[MeCP2]; [KRAB]-[KRAB]-[dCas12f1 D510A 단백질]-[DNMT3]; [KRAB]-[KRAB]-[dCas12f1 D510L 단백질]-[DNMT3]; [KRAB]-[KRAB]-[dCas12f1 D510V 단백질]-[DNMT3]; [KRAB]-[KRAB]-[dCas12f1 D510A 단백질]-[HDAC3]; [KRAB]-[KRAB]-[dCas12f1 D510L 단백질]-[HDAC3]; [KRAB]-[KRAB]-[dCas12f1 D510V 단백질]-[HDAC3]; [KRAB]-[MeCP2]-[dCas12f1 D510A 단백질]-[KRAB]; [KRAB]-[MeCP2]-[dCas12f1 D510L 단백질]-[KRAB]; [KRAB]-[MeCP2]-[dCas12f1 D510V 단백질]-[KRAB]; [KRAB]-[DNMT3]-[dCas12f1 D510A 단백질]-[KRAB]; [KRAB]-[DNMT3]-[dCas12f1 D510L 단백질]-[KRAB]; [KRAB]-[DNMT3]-[dCas12f1 D510V 단백질]-[KRAB]; [KRAB]-[HDAC3]-[dCas12f1 D510A 단백질]-[KRAB]; [KRAB]-[HDAC3]-[dCas12f1 D510L 단백질]-[KRAB] 또는 [KRAB]-[HDAC3]-[dCas12f1 D510V 단백질]-[KRAB]. 상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS를 더 포함할 수 있다. 이때, 상기 하나 이상의 NLS은 상기 전사 저해 Cas12f1 융합 단백질의 N 말단, 상기 전사 저해 Cas12f1 융합 단백질의 C 말단, dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 KRAB 사이, dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 MeCP2 사이, dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 DNMT3 사이, dCas12f1 단백질(dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질)과 HDAC3 사이, KRAB과 KRAB 사이, KRAB과 MeCP2 사이, KRAB과 DNMT3 사이 및/또는 KRAB과 HDAC3 사이에 위치할 수 있다.
2. 엔지니어링 된 가이드 RNA
본 명세서에서 제공하는 CRISPR 조절 시스템은 CRISPR/Cas12f1 시스템의 가이드 RNA를 포함한다. 상기 가이드 RNA는 자연계에 존재하는 야생형 Cas12f1 가이드 RNA 또는 CRISPR/Cas12f1 시스템의 효율 향상을 위해 엔지니어링 된 Cas12f1 가이드 RNA일 수 있다.
Cas12f1 가이드 RNA는 크게 스페이서, 및 스캐폴드 영역으로 나눌 수 있으며, 상기 스캐폴드 영역은 다섯개의 Stem (Stem 1 내지 Stem 5로 명명) 및 하나의 pseudoknot (PK)로 구성된다. 상기 Cas12f1 가이드 RNA는 tracrRNA의 일부(tracrRNA anti-repeat), 및 crRNA 반복 부분(crRNA repeat)의 일부가 상보적으로 결합하여 듀플렉스(duplex)를 이루고 있는 구조를 2개 포함하며, 이를 편의상 crRNA repeat-tracrRNA anti-repeat(R:AR) 부분으로 명명한다. 상기 Stem 5(R:AR2), 및 PK(R:AR1)는 이러한 crRNA repeat-tracrRNA anti-repeat 듀플렉스 구조를 이루고 있다.
본 명세서에서 제공하는 CRISPR 조절 시스템은 발현을 조절하고자 하는 유전자, 즉, 표적 유전자의 전사 조절 영역을 표적하는 엔지니어링 된 Cas12f1 가이드 RNA를 이용할 수 있다. 보다 구체적으로, 상기 CRISPR 조절 시스템은 표적 유전자의 전사 조절 영역 내에 존재하는 표적 서열과 상보적 결합을 하는 엔지니어링 된 Cas12f1 가이드 RNA를 포함한다. 이때, 상기 표적 유전자의 전사 조절 영역은 프로모터, 인핸서, 프로모터 근위 요소(promoter-proximal element), operator 및 silencer 등의 표적 유전자의 전사를 조절하는 영역을 모두 포함한다. 상기 CRISPR 조절 시스템에 포함된 엔지니어링 된 Cas12f1 가이드 RNA는 Cas12f1 융합 단백질과 복합체를 형성하여 Cas12f1 융합 단백질이 표적 유전자의 전사 조절 영역에 위치하도록 역할하는 것을 특징으로 한다.
본 명세서에서는 CRISPR 조절 시스템을 위해 엔지니어링 된 Cas12f1 가이드 RNA를 제공한다. 상기 엔지니어링 된 Cas12f1 가이드 RNA는 자연계에서 발견되는 가이드 RNA에 새로운 구성을 추가하고, 또한 그 구조 일부를 변형한 것이다. 상기 엔지니어링 된 Cas12f1 가이드 RNA는 그 구성의 3'말단에 새로운 구성인 U-rich tail을 포함하는 것을 특징으로 한다. 또한, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 그 구성 중 Cas12f1 단백질과 상호작용하는 역할을 하는 스캐폴드 영역의 적어도 일부가 변형된 것을 특징으로 한다.
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail을 포함할 수 있다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 가이드 RNA의 스캐폴드 영역과는 다른 것을 특징으로 한다.
엔지니어링 된 Cas12f1 가이드 RNA의 특징 1 - U-rich tail 포함
본 명세서에서 제공하는 엔지니어링 된 Cas12f1 가이드 RNA는 자연계에서 발견되는 가이드 RNA에 U-rich tail이 추가된 것을 특징으로 한다. 상기 U-rich tail은 상기 엔지니어링 된 Cas12f1 가이드 RNA의 3'말단 부분에 위치하며, 유리딘이 풍부하게 포함된 부분이다.
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 3'말단 부분에 유리딘이 풍부하게 포함된 U-rich tail을 포함할 수 있다. 일 구현예로, 상기 U-rich tail의 서열은 (UaN)bUc로 표현될 수 있다. 이때, 상기 N은 A, U, C, 또는 G 중 하나이며, 상기 a, b, c는 정수이고, 상기 a는 1 이상 5 이하, b는 0 이상 2 이하, c는 1 이상 10 이하일 수 있다.
엔지니어링 된 Cas12f1 가이드 RNA의 특징 2 - 스캐폴드 영역의 한 군데 이상이 변형됨
본 명세서에서 제공하는 엔지니어링 된 Cas12f1 가이드 RNA는 자연계에서 발견되는 가이드 RNA와 비교하여, 그 스캐폴드 부분의 일부가 변형된 것을 특징으로 한다. 스캐폴드 영역은 tracrRNA 및 crRNA의 일부를 포함하는 영역으로, Cas12f1 단백질과 상호작용하는 기능을 한다. 상기 스캐폴드 영역에 대해서는 이하 더 자세히 설명할 것이다.
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 엔지니어링 된 스캐폴드 영역을 포함할 수 있다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 가이드 RNA의 스캐폴드 영역이 변형된 것임을 특징으로 한다. 따라서, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 가이드 RNA의 스캐폴드 영역과는 상이한 서열을 가진다. 일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 가이드 RNA의 스캐폴드 영역 중 일부 영역이 제거된 것일 수 있다. 일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 가이드 RNA의 스캐폴드 영역에 포함된 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다.
엔지니어링 된 Cas12f1 가이드 RNA의 효과
본 명세서에서 제공하는 엔지니어링 된 Cas12f1 가이드 RNA를 CRISPR/Cas12f1 시스템에 사용하는 경우, 자연계에서 발견되는 가이드 RNA를 사용하는 경우에 비해 세포 내에서 유전자 편집 활성이 극적으로 향상되는 효과가 나타난다. 또한, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 자연계에서 발견되는 가이드 RNA와 길이가 동등하거나, 더 짧은 길이를 가져 유전자 편집 기술 분야에서 응용 가능성이 높다. 상기 엔지니어링 된 Cas12f1 가이드 RNA를 사용하면 CRISPR/Cas12f1 시스템의 장점 (예를 들어, 크기가 매우 작다는 장점)을 충분히 유전자 편집 및 유전자 발현 조절 기술에 활용할 수 있게 된다.
엔지니어링 된 Cas12f1 가이드 RNA의 용도
본 명세서에서 제공하는 엔지니어링 된 Cas12f1 가이드 RNA는 Cas12f1 단백질과 함께 유전자 발현 조절 용도로 사용될 수 있다. 또한, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 유전자 발현 조절용 조성물을 제조하기 위한 용도로 사용할 수 있다.
이하에서, 엔지니어링 된 Cas12f1 가이드 RNA의 구성 및 다양한 구현예에 대해 설명한다.
1) U-rich tail
U-rich tail - 개괄
본 명세서에서는 CRISPR 조절 시스템의 효율 향상을 위해 도입할 수 있는 U-rich tail을 제공한다. 상기 U-rich tail 서열은 엔지니어링 된 Cas12f1 가이드 RNA 중 crRNA의 스페이서의 3'말단에 연결되어 있는 것을 특징으로 하며, 엔지니어링 된 Cas12f1 가이드 RNA가 사용된 CRISPR/Cas12f1 시스템의 표적 핵산에 대한 편집 효율을 높이는 역할을 한다. 상기 U-rich tail 서열은 기본적으로 유리딘을 풍부하게 포함하고 있으며, 유리딘이 하나 이상 연속된 서열을 포함한다. 상기 U-rich tail 서열은 엔지니어링 된 CRISPR/Cas12f1 시스템의 실제 사용 환경 및 발현 환경(예를 들어, 진핵 세포 또는 원핵 세포 내부 환경)에 따라 유리딘 외 추가적인 염기를 더 포함할 수 있다.
상기 U-rich tail 서열은 PCT/KR2020/014961출원에 개시된 U-rich tail 서열일 수 있다. 이하 본 명세서에서 U-rich tail 서열을 지칭할 때, PCT/KR2020/014961출원에 개시된 상기 U-rich tail 서열에 대한 내용 및 실험 결과를 모두 포함하는 것으로 이해해야 한다.
U-rich tail 서열 구조 1 - 유리딘 연속 서열
U-rich tail 서열을 설계하는 데 있어 중요한 점 중 하나는, 유리딘이 하나 이상 연속된 서열을 풍부하게 포함시키는 것이다. 본 발명자들은 실험을 통해 유리딘이 1개 이상 연속된 서열인 U-rich tail 서열을 CRISPR/Cas12f1 시스템에 도입한 경우, 상기 CRISPR/Cas12f1 복합체의 유전자 편집 효율이 향상되는 것을 발견했다. 따라서, 본 명세서에서 제공하는 U-rich tail 서열은 유리딘이 하나 이상 연속된 서열을 포함한다.
일 구현예로, 상기 U-rich tail 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 또는 20개의 유리딘이 연속된 서열을 포함할 수 있다.
U-rich tail 서열 구조 2 - 변형된 유리딘 연속 서열
본 명세서에서 제공하는 U-rich tail 서열은 유리딘이 1개 내지 5개 반복될 때마다, 유리딘이 아닌 다른 리보뉴클레오사이드(A, C, G)가 하나씩 포함된 변형된 유리딘 반복 서열을 포함할 수 있다. 상기 변형된 유리딘 연속 서열은 특히 엔지니어링 된 crRNA를 발현하는 벡터를 설계할 때 유용하다.
일 구현예로, 상기 U-rich tail 서열은 UV, UUV, UUUV, UUUUV, 및/또는 UUUUUV 가 하나 이상 반복된 서열을 포함할 수 있다. 이때, 상기 V는 아데노신(A), 사이티딘(C), 구아노신(G) 중 하나이다.
U-rich tail 서열 - 구현예
일 구현예로, 상기 U-rich tail 서열은 (UaN)bUc로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이다. 일 구현예로, 상기 b는 0 이상 2 이하일 수 있다. 일 구현예로, 상기 c는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10일 수 있다. 일 구현예로, 상기 c는 바로 이전 문장에서 선택된 두 수치범위 내의 정수일 수 있다. 예를 들어, 상기 c는 1 이상 6 이하일 수 있다.
U-rich tail 서열 예시
일 구현예로, 상기 U-rich tail의 서열은 5'-U-3', 5'-UU-3', 5'-UUU-3', 5'-UUUU-3', 5'-UUUUU-3', 5'-UUUUUU-3', 5'-UUURUUU-3', 5'-UUURUUURUUU-3'(서열번호 646), 5'-UUUURU-3', 5'-UUUURUU-3', 5'-UUUURUUU-3', 5'-UUUURUUUU-3', 5'-UUUURUUUUU-3'(서열번호 647), 또는 5'-UUUURUUUUUU-3'(서열번호 648)일 수 있다. 일 구현예로, 상기 U-rich tail의 서열은 5'-U-3', 5'-UU-3', 5'-UUU-3', 5'-UUUU-3', 5'-UUUUU-3', 5'-UUUUUU-3', 5'-UUUAUUU-3', 5'-UUUAUUUAUUU-3'(서열번호 254), 5'-UUUUAU-3', 5'-UUUUAUU-3', 5'-UUUUAUUU-3', 5'-UUUUAUUUU-3', 5'-UUUUAUUUUU-3'(서열번호 255), 5'-UUUUAUUUUUU-3'(서열번호 256), 5'-UUUGUUU-3', 5'-UUUGUUUGUUU-3'(서열번호 257), 5'-UUUUGU-3', 5'-UUUUGUU-3', 5'-UUUUGUUU-3', 5'-UUUUGUUUU-3', 5'-UUUUGUUUUU-3'(서열번호 258), 또는 5'-UUUUGUUUUUU-3'(서열번호 259)일 수 있다.
일 구현예로, 상기 U-rich tail의 서열은 5'-UUUUUU-3', 5'-UUUUAUUUUUU-3'(서열번호 256), 또는 5'-UUUUGUUUUUU-3'(서열번호 259) 일 수 있다. 일 구현예로, 상기 U-rich tail의 서열은 5'-UUUUAUUUU-3'일 수 있다.
2) Cas12f1 가이드 RNA의 부분을 지칭하는 용어의 설명
Cas12f1 가이드 RNA의 부분 - 개괄
자연계에서 발견되는 Cas12f1 가이드 RNA는 tracrRNA 및 crRNA로 나뉘며, 상기 crRNA는 다시 crRNA 반복 서열 부분 및 스페이서로 나눌 수 있다는 것이 통상의 기술자에게 잘 알려져 있다.
상기 기준과는 별개로, 본 명세서에서는 상기 Cas12f1 가이드 RNA 중 Cas12f1 단백질과 상호작용하는 부분을 통틀어 스캐폴드 영역이라 지칭한다. 상기 스캐폴드 영역은 tracrRNA 및 crRNA의 일부를 포함하며, 반드시 한 분자의 RNA를 지칭하는 것은 아니다. 상기 스캐폴드 영역은 다시 제1 영역, 제2 영역, 제3 영역, 제4 영역, 제5 영역, 및 제6 영역으로 세분화될 수 있다. 상기 세분화된 영역을 tracrRNA, crRNA 상에서 서술하면, 상기 제1 영역 내지 제4 영역은 tracrRNA에 포함되고, 상기 제5 영역 내지 상기 제6 영역은 crRNA, 구체적으로 crRNA 반복 서열 부분에 포함된다.
이하 서술되는 "제n 영역", 또는 "자연계에서 발견되는 제n 영역" (n은 1 이상 6이하의 정수)은 기본적으로 자연계에서 발견되는 Cas12f1 가이드 RNA의 각 부분을 지칭한다. 엔지니어링 된 Cas12f1 가이드 RNA 내 상기 분류 기준과 대응되는 영역은 일반적으로 "변형된 제n 영역" 내지 "엔지니어링 된 스캐폴드 영역의 제n 영역"으로 서술된다.
다만, 엔지니어링 된 스캐폴드 영역에 포함된 제n 영역일지라도, 달리 변형되지 않아 자연계에서 발견되는 제n 영역과 동일한 경우가 있을 수 있는데, 그 때에 한해 "제n 영역"이라는 용어는 혼용될 수 있다. 이때, 상기 "제n 영역"이 지칭하는 대상(예를 들어, 엔지니어링 된 Cas12f1 가이드 RNA에 포함된 영역인지, 자연계에서 발견되는 가이드 RNA에 포함된 영역인지 여부)은 문맥에 따라 적절히 해석되어야 한다.
tracrRNA, crRNA
본 명세서에서 "tracrRNA", "crRNA"라고 쓰는 경우, CRISPR/Cas 기술 분야에서 통상의 기술자가 인식할 수 있는 의미를 모두 포함한다. 이는, 자연계에서 발견되는 듀얼 가이드 RNA의 각 분자를 지칭하는 용어로 사용되는 것이 일반적이지만, 상기 tracrRNA 및 crRNA를 링커로 연결한 싱글 가이드 RNA의 각 해당 부분을 지칭하는데도 사용될 수 있다. 달리 서술하지 않는 한, tracrRNA 및 crRNA라고만 기재하는 경우 CRISPR/Cas12f1 시스템을 구성하는 tracrRNA 및 crRNA를 의미한다.
일 구현예로, tracrRNA의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3' (서열번호 1) 또는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3' (서열번호 2)일 수 있다. 일 구현예로, 상기 tracrRNA는 제1 영역, 제2 영역, 제3 영역, 및 제4 영역을 포함한다. 일 구현예로, 상기 tracrRNA는 5'말단에서 3'말단 방향으로, 제1 영역, 제2 영역, 제3 영역, 및 제4 영역이 순서대로 연결된 것이다.
일 구현예로, crRNA의 서열은 crRNA 반복 서열 및 스페이서 서열을 포함한다. 이때, 상기 crRNA 반복 서열은 5'-GAAUGAAGGAAUGCAAC-3' (서열번호 3) 또는 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3' (서열번호 4일) 수 있다. 상기 crRNA 반복 서열은 제5 영역, 및 제6 영역을 포함한다. 상기 스페이서 서열은 표적 서열에 따라 달라질 수 있으며, 일반적으로 10 내지 50개의 뉴클레오타이드를 포함한다. 일 구현예로, 상기 crRNA는 5'말단에서 3'말단 방향으로, 제5 영역, 제6 영역, 및 스페이서가 순서대로 연결된 것이다(서열번호 5 또는 6).
스캐폴드 영역 - 개괄
본 명세서에서 "스캐폴드 영역"이라고 쓰는 경우, 자연계에서 발견되는 가이드 RNA의 부분 중 스페이서를 제외한 나머지 부분을 통틀어 지칭한다. 구체적으로, 상기 스캐폴드 영역은 tracrRNA, 및 crRNA의 일부를 포함한다. 구체적으로, 상기 crRNA의 일부는 crRNA 반복 서열 부분일 수 있다. 상기 스캐폴드 영역은 일반적으로 Cas 단백질과 상호작용할 수 있는 부분으로 알려져있다. 본 명세서에서는 상기 스캐폴드 영역을 제1 영역 내지 제6 영역으로 나누어 서술하며, 각 영역에 대해서는 이하 더 자세히 설명한다.
스캐폴드 영역 1 - 제1 영역
본 명세서에서 "제1 영역"이라고 쓰는 경우, tracrRNA의 5'말단을 포함하는 영역을 지칭한다. 상기 제1 영역은 CRISPR/Cas12f1 복합체 내에서 Stem 구조를 형성하는 뉴클레오타이드를 포함하고, 이와 인접한 뉴클레오타이드를 포함할 수 있다.
상기 제1 영역은 Stem 1 부분(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))을 포함한다. 상기 제1 영역은 상기 Stem 1 부분과 인접한 하나 이상의 뉴클레오타이드를 포함할 수 있다.
상기 제1 영역은 CRISPR/Cas12f1 복합체에서, Cas12f1 단백질과 상호작용하지 않는 disordered region을 포함한다.
일 구현예로, 상기 제1 영역은 서열번호 1 또는 2로 표현되는 tracrRNA의 5'말단으로부터 1번째 뉴클레오타이드부터 11번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제1 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAA-3' (서열번호 10)일 수 있다.
스캐폴드 영역 2 - 제2 영역
본 명세서에서 "제2 영역"이라고 쓰는 경우, tracrRNA 내 상기 제1 영역의 3'말단 방향에 위치한 영역을 지칭한다. 상기 제2 영역은 CRISPR/Cas12f1 복합체 내에서 Stem 구조를 형성하는 뉴클레오타이드를 포함하고, 이와 인접한 뉴클레오타이드를 포함할 수 있다. 이때, 상기 Stem 구조는 상기 제1 영역에 포함된 Stem과는 다른 것이다.
상기 제2 영역은 Stem 2 부분(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))을 포함한다. 상기 제2 영역은 상기 Stem 2 부분과 인접한 하나 이상의 뉴클레오타이드를 포함할 수 있다.
상기 제2 영역은 CRISPR/Cas12f1 복합체에서, 이량체를 이루는 하나의 Cas12f1 단백질의 RuvC 도메인, 및/또는 이량체 이루는 다른 하나의 Cas12f1 단백질의 RuvC 도메인과 상호작용하는 하나 이상의 뉴클레오타이드를 포함할 수 있다. 상기 제2 영역은 CRISPR/Cas12f1 복합체에서, Cas12f1 단백질과 상호작용하지 않는 disordered region을 포함한다.
일 구현예로, 상기 제2 영역은 서열번호 1 또는 2로 표현되는 tracrRNA의 5'말단으로부터 22번째 뉴클레오타이드부터 72번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제2 영역의 서열은 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3' (서열번호 11일) 수 있다.
스캐폴드 영역 3 - 제3 영역
본 명세서에서 "제3 영역"이라고 쓰는 경우, tracrRNA 내 상기 제2 영역의 3'말단 방향에 위치한 영역을 지칭한다. 상기 제3 영역은 CRISPR/Cas12f1 복합체 내에서 Stem 구조를 형성하는 뉴클레오타이드, 및 crRNA에 포함된 일부 뉴클레오타이드와 상보적인 결합을 형성하고 있는 뉴클레오타이드를 포함하고, 이와 인접한 뉴클레오타이드를 포함할 수 있다.
상기 제3 영역은 Stem 4 부분(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)) 및 Stem 3-PK (R:AR-1) 부분 중 tracrRNA에 속한 뉴클레오타이드(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))를 포함한다. 상기 제3 영역은 상기 Stem 4 부분 및/또는 Stem 3-PK (R:AR-1) 부분 중 tracrRNA에 속한 뉴클레오타이드와 인접한 하나 이상의 뉴클레오타이드를 포함할 수 있다.
상기 제3 영역은 CRISPR/Cas12f1 복합체에서, 이량체를 이루는 하나의 Cas12f1 단백질의 WED 도메인, 및/또는 RuvC 도메인과 상호작용하는 하나 이상의 뉴클레오타이드를 포함한다. 이때, 상기 뉴클레오타이드는 Stem 3-PK (R:AR-1) 부분 중 tracrRNA에 속한 뉴클레오타이드일 수 있다.
상기 제3 영역은 CRISPR/Cas12f1 복합체에서, 이량체를 이루는 하나의 Cas12f1 단백질의 RuvC 도메인 및/또는 이량체를 이루는 다른 하나의 Cas12f1 단백질의 REC 도메인과 상호작용하는 하나 이상의 뉴클레오타이드를 포함한다. 이때, 상기 뉴클레오타이드는 Stem 4 부분에 포함된 뉴클레오타이드일 수 있다.
상기 제3 영역은 crRNA의 제6 영역에 포함된 하나 이상의 뉴클레오타이드와 상보적으로 결합하는 하나 이상의 뉴클레오타이드를 포함한다.
일 구현예로, 상기 제3 영역은 서열번호 1 또는 2로 표현되는 tracrRNA의 5'말단으로부터 73번째 뉴클레오타이드부터 127번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제3 영역의 서열은 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3' (서열번호 12일) 수 있다.
스캐폴드 영역 4 - 제4 영역
본 명세서에서 "제4 영역"이라고 쓰는 경우, tracrRNA의 제3 영역의 3'말단 방향에 위치한 영역을 지칭한다. 상기 제4 영역은 CRISPR/Cas12f1 복합체 내에서 crRNA에 포함된 일부 뉴클레오타이드와 상보적인 결합을 형성할 수 있는 뉴클레오타이드를 포함하고, 이와 인접한 뉴클레오타이드를 포함할 수 있다.
상기 제4 영역은 Stem 5 (R:AR-2) 중 tracrRNA에 속한 뉴클레오타이드를 포함한다(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)). 상기 제4 영역은 상기 Stem 5 (R:AR-2) 중 tracrRNA에 속한 뉴클레오타이드와 인접한 하나 이상의 뉴클레오타이드를 포함할 수 있다.
상기 제4 영역은 CRISPR/Cas12f1 복합체에서, 이량체를 이루는 하나의 Cas12f1 단백질의 WED 도메인, 및/또는 ZF 도메인과 상호작용하는 하나 이상의 뉴클레오타이드를 포함할 수 있다. 이때 상기 뉴클레오타이드는 Stem 5 (R:AR-2) 중 tracrRNA에 속한 뉴클레오타이드일 수 있다.
상기 제4 영역은 crRNA의 제5 영역에 포함된 하나 이상의 뉴클레오타이드와 상보적으로 결합하는 하나 이상의 뉴클레오타이드를 포함할 수 있다. 상기 제4 영역은 CRISPR/Cas12f1 복합체에서, Cas12f1 단백질과 상호작용하지 않는 disordered region을 포함한다.
일 구현예로, 상기 제4 영역은 서열번호 1으로 표현되는 tracrRNA의 5'말단으로부터 128번째 뉴클레오타이드부터 140번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제4 영역은 서열번호 2으로 표현되는 tracrRNA의 5'말단으로부터 128번째 뉴클레오타이드부터 162번째 뉴클레오타이드까지를 의미할 수 있다.
일 구현예로, 상기 제4 영역의 서열은 5'-AACAAAUUCAUUU-3' (서열번호 13) 또는 5'-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3' (서열번호 14일) 수 있다.
스캐폴드 영역 5 - 제5 영역
본 명세서에서 "제5 영역"이라고 쓰는 경우, crRNA 5'말단을 포함하는 영역을 지칭한다. 상기 제5 영역은 CRISPR/Cas12f1 복합체 내에서 상기 제4 영역의 하나 이상의 뉴클레오타이드와 상보적인 결합을 형성하는 뉴클레오타이드를 포함하며, 이와 인접한 뉴클레오타이드를 포함할 수 있다.
상기 제5 영역은 Stem 5 (R:AR-2) 부분 중 crRNA에 속한 뉴클레오타이드를 포함한다(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)). 상기 제5 영역은 상기 Stem 5 (R:AR-2) 부분 중 crRNA에 속한 뉴클레오타이드와 인접한 하나 이상의 뉴클레오타이드를 포함할 수 있다.
상기 제5 영역은 CRISPR/Cas12f1 복합체에서, 이량체를 이루는 하나의 Cas12f1 단백질의 WED 도메인, REC 도메인 및/또는 ZF 도메인과 상호작용하는 하나 이상의 뉴클레오타이드를 포함할 수 있다. 이때 상기 뉴클레오타이드는 Stem 5 (R:AR-2) 중 crRNA에 속한 뉴클레오타이드일 수 있다.
상기 제5 영역은 상기 제4 영역에 포함된 하나 이상의 뉴클레오타이드와 상보적으로 결합하는 하나 이상의 뉴클레오타이드를 포함할 수 있다. 상기 제5 영역은 CRISPR/Cas12f1 복합체에서, Cas12f1 단백질과 상호작용하지 않는 disordered region을 포함한다.
일 구현예로, 상기 제5 영역은 서열번호 3로 표현되는 crRNA의 5'말단으로부터 1번째 뉴클레오타이드부터 10번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제5 영역은 서열번호 4로 표현되는 crRNA의 5'말단으로부터 1번째 뉴클레오타이드부터 30번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제5 영역의 서열은 5'-GAAUGAAGGA-3' (서열번호 15) 또는 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGA-3' (서열번호 16)일 수 있다.
스캐폴드 영역 6 - 제6 영역
본 명세서에서 "제6 영역"이라고 쓰는 경우, crRNA 내 상기 제5 영역의 3'말단 방향에 위치한 영역을 지칭한다. 상기 제6 영역은 CRISPR/Cas12f1 복합체 내에서 상기 제3 영역의 하나 이상의 뉴클레오타이드와 상보적인 결합을 형성하는 뉴클레오타이드를 포함하며, 이와 인접한 뉴클레오타이드를 포함할 수 있다.
상기 제6 영역은 PK (R:AR-1) 부분 중 crRNA에 속한 뉴클레오타이드를 포함한다(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)). 상기 제6 영역은 상기 PK (R:AR-1) 부분 중 crRNA에 속한 뉴클레오타이드와 인접한 하나 이상의 뉴클레오타이드를 포함할 수 있다.
상기 제6 영역은 CRISPR/Cas12f1 복합체에서, 이량체를 이루는 하나의 Cas12f1 단백질의 WED 도메인, ZF 도메인 및/또는 RuvC 도메인과 상호작용하는 하나 이상의 뉴클레오타이드를 포함한다. 이때, 상기 뉴클레오타이드는 Stem 3-PK (R:AR-1) 부분 중 crRNA에 속한 뉴클레오타이드일 수 있다.
일 구현예로, 상기 제6 영역은 서열번호 3로 표현되는 crRNA의 5'말단으로부터 11번째 뉴클레오타이드부터 17번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제6 영역은 서열번호 4로 표현되는 crRNA의 5'말단으로부터 31번째 뉴클레오타이드부터 37번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제6 영역의 서열은 5'-AUGCAAC-3'일 수 있다.
스페이서
본 명세서에서 "스페이서"라 쓰는 경우, CRISPR/Cas12f1 시스템에서 표적 서열 부분과 혼성화되는 하나 이상의 뉴클레오타이드를 지칭한다. 상기 스페이서는, CRISPR/Cas12f1 시스템에서 가이드 RNA의 crRNA의 3'말단 부근의 10개 내지 50개의 연속된 뉴클레오타이드를 지칭한다. 상기 스페이서는 CRISPR/Cas12f1 시스템을 사용하여 편집하고자 하는 표적 핵산의 표적 서열에 대응하여 설계된다. 달리 표현하면, 상기 스페이서는 표적 핵산의 표적 서열에 따라 다양한 서열을 가질 수 있다.
3) 엔지니어링 된 스캐폴드 영역 - 개괄
엔지니어링 된 스캐폴드 영역 개괄
본 명세서에서는 CRISPR 조절 시스템의 표적 유전자 내 타겟팅 효율 향상을 위해 도입할 수 있는 엔지니어링 된 스캐폴드 영역을 제공한다. 상기 엔지니어링 된 스캐폴드 영역은 전술한 U-rich tail과 시너지를 일으켜, 엔지니어링 된 Cas12f1 가이드 RNA가 사용된 CRISPR 조절 시스템의 표적 유전자 내 타겟팅 효율을 향상시킨다. 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 Cas12f1 가이드 RNA의 스캐폴드 영역(이하, 자연계에서 발견되는 스캐폴드 영역)에서 한 군데 이상이 변형되어, 이와는 다른 서열 및/또는 구조를 가지게 된 것이 특징이다.
이때, 상기 엔지니어링 된 스캐폴드 영역의 기능은 자연계에서 발견되는 스캐폴드 영역과 동일하거나, 유사한 기능을 가진다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 각 부분에 대응하는 영역을 포함한다. 구체적으로, 상기 엔지니어링 된 스캐폴드 영역은 제1 영역, 제2 영역, 제3 영역, 제4 영역, 제5 영역, 및 제6 영역을 포함하며, 이는 자연계에서 발견되는 스캐폴드 영역에 포함된 제1 영역 내지 제6 영역에 각각 대응된다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역 중 제1 영역 및/또는 제2 영역에 대응되는 영역을 포함하지 않을 수 있다.
싱글 가이드 RNA를 만들기 위한 변형
본 명세서에서 제공하는 엔지니어링 된 Cas12f1 가이드 RNA는 한 분자의 싱글 가이드 RNA일 수 있다. 따라서, 본 명세서에서 제공하는 엔지니어링 된 스캐폴드 영역은 각 영역 중 하나 이상이 변형된 것이고, 추가적으로 tracrRNA 제4 영역의 3'말단 및 crRNA 제5 영역의 5' 말단이 링커를 통해 연결된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역에서 한 군데 이상이 변형되고, 상기 제4 영역의 3'말단 및 상기 제5 영역의 5'말단이 링커를 통해 연결된 것일 수 있다. 이때, 상기 링커는 5'-GAAA-3'일 수 있다.
4) 엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형
제1 영역 변형 개괄
본 명세서에서 제공하는 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역에서 제1 영역이 변형된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역을 포함할 수 있다. 이때, 상기 변형된 제1 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 하나 이상의 뉴클레오타이드가 제거된 것이다. 이때, 상기 제거된 뉴클레오타이드는 CRISPR/Cas12f1 복합체에서 Stem 구조를 형성하는 영역에서 선택된 뉴클레오타이드이다.
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA에 포함된 엔지니어링 된 스캐폴드 영역은, 자연계에서 발견되는 스캐폴드 영역 중 제1 영역에 포함된 하나 이상의 뉴클레오타이드가 제거된 것을 포함할 수 있다. 일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제1 영역 중 CRISPR/Cas12f1 복합체에서 Stem 구조를 형성 부분에 포함된 뉴클레오타이드일 수 있다. 일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제1 영역 중 Stem 1 (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))에 속하는 뉴클레오타이드일 수 있다. 일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제1 영역 중 CRISPR/Cas12f1 복합체에서 Cas12f1 단백질과 상호작용하지 않는 뉴클레오타이드일 수 있다.
일 구현예로, 상기 변형된 제1 영역은 3'말단 방향에 5'-A-3' 서열을 포함하는 것을 특징으로 한다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역을 자연계에서 발견되는 스캐폴드 영역 중 제1 영역이 제거된 것일 수 있다. 달리 표현해, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역 중 제1 영역과 대응되는 영역을 포함하지 않을 수 있다.
제1 영역 변형 내용 1 - 일부 뉴클레오타이드 제거
상기 엔지니어링 된 스캐폴드 영역의 제1 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역의 변형된 제1 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 5'말단의 1개 내지 20개의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제1 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 5'말단의 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 또는 20개의 연속된 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제1 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 5'말단에서 바로 이전 문장에서 선택된 두 개의 수치범위 내 연속된 뉴클레오타이드가 제거된 것일 수 있다. 예를 들어, 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 5'말단의 1개 내지 3개의 연속된 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제1 영역은 적어도 하나의 뉴클레오타이드를 포함하며, 이는 5'-A-3'일 수 있다.
제1 영역 변형 내용 2 - 제1 영역 제거
본 명세서에서 제공하는 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역 중 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않을 수 있다.
제1 영역이 변형된 엔지니어링 된 스캐폴드 서열 예시
일 구현예로, 상기 변형된 제1 영역의 서열은 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 및 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27)에서 선택된 것일 수 있다.
일 구현예로, 제1 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 11,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 119), 5'-AACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 120), 5'-GAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 121), 5'-AGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 122), 5'-GAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 123), 5'-GGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 124), 5'-UGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 125), 5'-GUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 126), 5'-AGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 127), 5'-AAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 128), 5'-AAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 129), 5'-UAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 130), 5'-AUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 131), 5'-GAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 132), 5'-UGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 133), 5'-CUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 134), 5'-ACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 135), 5'-CACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 136), 5'-UCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 137), 및 5'-UUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 138)로 이뤄진 군에서 선택된 서열; 및
5'-GAAUGAAGGAAUGCAAC-3'(서열번호 3).
일 구현예로, 제1 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 및 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 11,
서열번호 12, 및
서열번호 14가 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 16 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 및 서열번호 17 내지 27로 이뤄진 군에서 선택된 서열,
서열번호 11,
서열번호 12,
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
일 구현예로, 제1 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 168), 5'-AACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 169), 5'-GAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 170), 5'-AGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 171), 5'-GAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 172), 5'-GGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 173), 5'-UGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 174), 5'-GUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 175), 5'-AGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 176), 5'-AAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 177), 5'-AAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 178), 5'-UAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 179), 5'-AUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 180), 5'-GAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 181), 5'-UGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 182), 5'-CUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 183), 5'-ACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 184), 5'-CACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 185), 5'-UCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 186), 및 5'-UUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 187)에서 선택된 서열일 수 있다.
제1 영역이 제거된 엔지니어링 된 스캐폴드 서열 예시
일 구현예로, 제1 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 11,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 379); 및
서열번호 3.
일 구현예로, 제1 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 11,
서열번호 12, 및
서열번호 14가 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 16 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 5'에서 3'말단 방향으로,
서열번호 11,
서열번호 12,
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
일 구현예로, 제1 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 5'CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 487)일 수 있다.
5) 엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형
제2 영역 변형 개괄
본 명세서에서 제공하는 엔지니어링 된 가이드 RNA에 포함된 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역에서 제2 영역이 변형된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역을 포함할 수 있다. 이때, 상기 변형된 제2 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서 하나 이상의 뉴클레오타이드가 제거된 것이다. 이때, 상기 제거된 뉴클레오타이드는 CRISPR/Cas12f1 복합체에서 Stem 구조를 형성하는 영역에서 선택된 뉴클레오타이드이다.
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA에 포함된 엔지니어링 된 스캐폴드 영역은, 자연계에서 발견되는 스캐폴드 영역 중 제2 영역에 포함된 하나 이상의 뉴클레오타이드가 제거된 것을 포함할 수 있다. 일 구현예로, 상기 뉴클레오타이드의 제거는 상기 자연계에서 발견되는 제2 영역 중 Stem 구조를 형성하는 부분에서 일어난 것이고, 뉴클레오타이드가 베이스 페어 단위로 제거된 것일 수 있다. 일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제2 영역 중 CRISPR/Cas12f1 복합체에서 Stem 구조를 형성하는 부분에 포함된 뉴클레오타이드일 수 있다. 일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제2 영역 중 Stem 2 (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))에 속하는 뉴클레오타이드일 수 있다. 일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제2 영역 중 CRISPR/Cas12f1 복합체에서 Cas12f1 단백질과 상호작용하지 않는 뉴클레오타이드일 수 있다.
일 구현예로, 상기 변형된 제2 영역은 3'말단 방향에 5'-G-3' 서열을 가지는 것을 특징으로 한다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역을 자연계에서 발견되는 스캐폴드 영역 중 제2 영역이 제거된 것일 수 있다. 달리 표현해, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역 중 제2 영역과 대응되는 영역을 포함하지 않을 수 있다.
제2 영역 변형 내용 1 - 일부 뉴클레오타이드 제거
상기 엔지니어링 된 스캐폴드 영역의 제2 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역의 변형된 제2 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서 1개 내지 51개의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 11 서열 기준, 5'말단으로부터 1번째 내지 22번째 뉴클레오타이드, 및/또는 27번째 내지 51번째 뉴클레오타이드 중 하나 이상이 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 11 서열 기준, 5'말단으로부터 1번째 내지 22번째 뉴클레오타이드, 및/또는 27번째 내지 51번째 뉴클레오타이드 중 하나 이상이 제거되고, 23번째 내지 26번째 뉴클레오타이드가 다른 것으로 치환된 것일 수 있다. 일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 11 서열 기준, 5'말단으로부터 1번째 내지 22번째 뉴클레오타이드 중 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 또는 22개의 연속된 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 11 서열 기준, 5'말단으로부터 27번째 내지 51번째 뉴클레오타이드 중 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 또는 25개의 연속된 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제2 영역의 서열은 적어도 5'-G-3'을 포함하는 것을 특징으로 한다.
제2 영역 변형 내용 2 - 베이스 페어 단위 제거
상기 제2 영역의 변형은 Stem 구조를 형성하는 부분에 포함된 서로 상보적인 결합을 하는 한 쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 11 서열 기준, 5'말단으로부터 1번째 내지 22번째 뉴클레오타이드, 및 27번째 내지 50번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 베이스 페어를 이루는 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 11 서열 기준, 5'말단으로부터 1번째 내지 22번째 뉴클레오타이드, 및 27번째 내지 50번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 베이스 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 베이스 페어를 이루지 않는 1개 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 11 서열 기준, 5'말단으로부터 1번째 내지 22번째 뉴클레오타이드, 및 27번째 내지 50번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 베이스 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 미스매치인 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제2 영역은 서열번호 139 내지 149에 제시된 서열 중 적어도 하나의 서열을 가질 수 있다.
제2 영역 변형 내용 3 - 제2 영역 제거
본 명세서에서 제공하는 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역 중 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역이 없는 것일 수 있다.
제2 영역이 변형된 엔지니어링 된 스캐폴드 서열 예시
일 구현예로, 상기 변형된 제2 영역의 서열은 5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361) 및 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362)로 이뤄진 군에서 선택된 서열일 수 있다.
일 구현예로, 변형된 제2 영역의 서열은 서열번호 363 내지 378로 제시된 서열 중 적어도 하나의 서열일 수 있다.
일 구현예로, 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'-CUUCACUGAUAAAGUGGAGAAGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 381), 5'-CUUCACUGAUAAAGUGGAGAAUUAGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 382), 5'-CUUCACUGAUAAAGUGGAGAACUUAGGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 383), 5'-CUUCACUGAUAAAGUGGAGAACUUAGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 384), 5'-CUUCACUGAUAAAGUGGAGAACCUUAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 385), 5'-CUUCACUGAUAAAGUGGAGAACCGUUAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 386), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUAGGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 387), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUUAGAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 388), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUUUAGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 389), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCUUAGGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 390), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCAUUAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 391), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACUUAGGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 392), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACUUAGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 393), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCUUAGGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 394), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 395), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 396), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAUUAGCUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 397), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 398), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 399), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 400), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 401), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 402), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 403), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 404), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 405), 및 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 406)로 이뤄진 군에서 선택된 서열; 및
서열번호 3.
일 구현예로, 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 12,
서열번호 14가 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 16 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로, 서열번호 10, 5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열, 서열번호 12, 서열번호 13, 링커, 서열번호 15, 및 5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
일 구현예로, 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAAGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 408), 5'-CUUCACUGAUAAAGUGGAGAAUUAGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 409), 5'-CUUCACUGAUAAAGUGGAGAACUUAGGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 410), 5'-CUUCACUGAUAAAGUGGAGAACUUAGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 411), 5'-CUUCACUGAUAAAGUGGAGAACCUUAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 412), 5'-CUUCACUGAUAAAGUGGAGAACCGUUAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 413), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUAGGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 414), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUUAGAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 415), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUUUAGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 416), 5’-CUUCACUGAUAAAGUGGAGAACCGCUUCUUAGGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 417), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCAUUAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 418), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACUUAGGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 419), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACUUAGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 420), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCUUAGGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 421), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 422), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 423), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAUUAGCUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 424), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 425), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 426), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 427), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 428), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 429), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 430), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 431), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 432), 및 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 433)로 이뤄진 군에서 선택된 서열일 수 있다.
제2 영역이 제거된 엔지니어링 된 스캐폴드 서열 예시
일 구현예로, 제2 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'-CUUCACUGAUAAAGUGGAGAAGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 380); 및
서열번호 3.
일 구현예로, 제2 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 12,
서열번호 14이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 16 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로, 서열번호 10, 서열번호 12, 서열번호 13, 링커, 서열번호 15, 및 5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
일 구현예로, 제2 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAAGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 407)일 수 있다.
6) 엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형
제3 영역 변형 개괄
본 명세서에서 제공하는 엔지니어링 된 가이드 RNA에 포함된 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역에서 제3 영역이 변형된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역을 포함할 수 있다. 이때, 상기 변형된 제3 영역은 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서 하나 이상의 뉴클레오타이드가 제거된 것이다. 이때, 상기 제거된 뉴클레오타이드는 CRISPR/Cas12f1 복합체에서 Stem 구조를 형성하는 영역에서 선택된 뉴클레오타이드이다.
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA에 포함된 엔지니어링 된 스캐폴드 영역은, 자연계에서 발견되는 스캐폴드 영역 중 제3 영역에 포함된 하나 이상의 뉴클레오타이드가 제거된 것을 포함할 수 있다. 일 구현예로, 상기 뉴클레오타이드의 제거는 상기 자연계에서 발견되는 제3 영역 중 Stem 구조를 형성하는 부분에서 일어난 것이고, 뉴클레오타이드가 베이스 페어 단위로 제거된 것일 수 있다. 일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제3 영역 중 CRISPR/Cas12f1 복합체에서 Stem 구조를 형성하는 부분에 포함된 뉴클레오타이드일 수 있다. 일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제3 영역 중 Stem 4 (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))에 속하는 뉴클레오타이드일 수 있다.
일 구현예로, 상기 변형된 제3 영역은 5'-GCUGCUUGCAUCAGCCUAAUGUCGAG-3'(서열번호 475), 5'-UUCG-3', 및 5'-CUCGA-3' 서열을 가지는 것을 특징으로 한다.
제3 영역 변형 내용 1 - 일부 뉴클레오타이드 제거
상기 엔지니어링 된 스캐폴드 영역의 제3 영역은 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역의 변형된 제3 영역은 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서 1개 내지 20개의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제3 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서, 서열번호 12 서열 기준, 5'말단으로부터 27번째 내지 36번째 뉴클레오타이드, 및/또는 41번째 내지 50번째 뉴클레오타이드 중 하나 이상이 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 12 서열 기준, 5'말단으로부터 27번째 내지 36번째 뉴클레오타이드 중 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 연속된 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 12 서열 기준, 5'말단으로부터 41번째 내지 50번째 뉴클레오타이드 중 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 연속된 뉴클레오타이드가 제거된 것일 수 있다.
제3 영역 변형 내용 2 - 베이스 페어 단위 제거
상기 제3 영역의 변형은 Stem 구조를 형성하는 부분에 포함된 서로 상보적인 결합을 하는 한 쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제3 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서, 서열번호 12 서열 기준, 5'말단으로부터 27번째 내지 36번째 뉴클레오타이드, 및 41번째 내지 50번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 베이스 페어를 이루는 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제3 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서, 서열번호 12 서열 기준, 5'말단으로부터 27번째 내지 36번째 뉴클레오타이드, 및 41번째 내지 50번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 베이스 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 베이스 페어를 이루지 않는 1개 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제3 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서, 서열번호 12 서열 기준, 5'말단으로부터 27번째 내지 36번째 뉴클레오타이드, 및 41번째 내지 50번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 베이스 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 미스매치인 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
제3 영역이 변형된 엔지니어링 된 스캐폴드 서열 예시
일 구현예로, 상기 변형된 제3 영역의 서열은 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447)로 이뤄진 군에서 선택된 서열일 수 있다.
일 구현예로, 제3 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 11,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 448), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 449), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 450), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 451), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 452), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 453), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGAAACAAAUUCAUUU-3'(서열번호 454), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGAAACAAAUUCAUUU-3'(서열번호 455), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGAAACAAAUUCAUUU-3'(서열번호 456), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGAAACAAAUUCAUUU-3'(서열번호 457), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGAAACAAAUUCAUUU-3'(서열번호 458), 및 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGAAACAAAUUCAUUU-3'(서열번호 459), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGAAACAAAUUCAUUU-3'(서열번호 460)로 이뤄진 군에서 선택된 서열; 및
서열번호 3.
일 구현예로, 제3 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 11,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
서열번호 14가 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 16 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 링커, 서열번호 15, 및 5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
일 구현예로, 제3 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 461), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 462), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 463), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 464), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 465), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 466), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 467), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 468), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 469), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 470), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 471), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 472), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 473), 및 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 474)로 이뤄진 군에서 선택된 서열일 수 있다.
7) 엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형
제4 영역 및 제5 영역 변형 개괄
본 명세서에서 제공하는 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역에서 제4 영역 및 제5 영역이 변형된 것일 수 있다. 상기 제4 영역 및 제5 영역은 CRISPR/Cas12f1 복합체 내에서 서로 혼성화되어 Stem을 구성하는 부분을 포함하므로, 해당 부분이 같이 변형되어 엔지니어링 된 스캐폴드 영역을 구성할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제4 영역 및/또는 변형된 제5 영역을 포함할 수 있다.
변형된 제4 영역은 자연계에서 발견되는 스캐폴드 영역의 제4 영역에서 하나 이상의 뉴클레오타이드가 제거된 것을 특징으로 한다. 변형된 제5 영역은 자연계에서 발견되는 스캐폴드 영역의 제5 영역에서 하나 이상의 뉴클레오타이드가 제거된 것을 특징으로 한다.
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA에 포함된 엔지니어링 된 스캐폴드 영역은, 자연계에서 발견되는 스캐폴드 영역 중 제4 영역 및/또는 제5 영역의 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역은 5'말단 방향에 5'-AACAAA-3' 서열을 가지는 것을 특징으로 한다. 일 구현예로, 상기 변형된 제5 영역은 3'말단 방향에 5'-GGA-3' 서열을 가지는 것을 특징으로 한다.
제4 영역 및 제5 영역 변형 내용 1 - 일부 뉴클레오타이드 제거
상기 엔지니어링 된 스캐폴드 영역의 제4 영역은 자연계에서 발견되는 스캐폴드 영역 중 제4 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 상기 엔지니어링 된 스캐폴드 영역의 제5 영역은 자연계에서 발견되는 스캐폴드 영역 중 제5 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역의 변형된 제4 영역은 자연계에서 발견되는 스캐폴드 영역의 제4 영역에서 1개 내지 7개의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 엔지니어링 된 스캐폴드 영역의 변형된 제4 영역은 자연계에서 발견되는 스캐폴드 영역의 제4 영역에서 1개 내지 28개의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제4 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역에서, 서열번호 13 서열 기준, 5'말단으로부터 7번째 내지 13번째 뉴클레오타이드 중 하나 이상이 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제4 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역에서, 서열번호 14 서열 기준, 5'말단으로부터 7번째 내지 34번째 뉴클레오타이드 중 하나 이상이 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역의 서열은 적어도 5'-AACAAA-3'을 포함하는 것을 특징으로 한다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역의 변형된 제5 영역은 자연계에서 발견되는 스캐폴드 영역의 제5 영역에서 1개 내지 7개의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 엔지니어링 된 스캐폴드 영역의 변형된 제5 영역은 자연계에서 발견되는 스캐폴드 영역의 제5 영역에서 1개 내지 27개의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제5 영역에서, 서열번호 15 서열 기준, 5'말단으로부터 1번째 내지 7번째 뉴클레오타이드 중 하나 이상이 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제5 영역에서, 서열번호 16 서열 기준, 5'말단으로부터 1번째 내지 27번째 뉴클레오타이드 중 하나 이상이 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제5 영역의 서열은 적어도 5'-GGA-3'을 포함하는 것을 특징으로 한다.
제4 영역 및 제5 영역 변형 내용 3 - 베이스 페어 단위 제거
상기 제4 영역 및 제5 영역은 CRISPR/Cas12 복합체 내에서 서로 상보적으로 결합하여 Stem을 이루는 것으로 알려져 있다. 전술한 제4 영역 및 제5 영역의 변형은 이러한 Stem을 구성하는 하나 이상의 뉴클레오타이드를 대상으로 하므로, 상기 제4 영역 및 제5 영역의 변형은 Stem을 구성하는 뉴클레오타이드들을 베이스 페어 단위로 제거하는 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역 및 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역 및 제5 영역에서, 서열번호 13 서열 기준, 7번째 내지 13번째 뉴클레오타이드 및, 서열번호 15 서열 기준, 1번째 내지 7번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 베이스 페어를 이루는 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역 및 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역 및 제5 영역에서, 서열번호 13 서열 기준, 7번째 내지 13번째 뉴클레오타이드 및, 서열번호 15 서열 기준, 1번째 내지 7번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 베이스 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 베이스 페어를 이루지 않는 1개 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역 및 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역 및 제5 영역에서, 서열번호 13 서열 기준, 7번째 내지 13번째 뉴클레오타이드 및, 서열번호 15 서열 기준, 1번째 내지 7번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 베이스 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 미스매치인 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역 및 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역 및 제5 영역에서, 서열번호 14 서열 기준, 7번째 내지 34번째 뉴클레오타이드 및, 서열번호 16 서열 기준, 1번째 내지 27번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 베이스 페어를 이루는 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역 및 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역 및 제5 영역에서, 서열번호 14 서열 기준, 7번째 내지 34번째 뉴클레오타이드 및, 서열번호 16 서열 기준, 1번째 내지 27번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 베이스 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 베이스 페어를 이루지 않는 1개 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역 및 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역 및 제5 영역에서, 서열번호 14 서열 기준, 7번째 내지 34번째 뉴클레오타이드 및, 서열번호 16 서열 기준, 1번째 내지 27번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 베이스 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 미스매치인 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
변형된 제4 영역 및 제5 영역 서열 예시
일 구현예로, 상기 변형된 제4 영역의 서열은 5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 5'-AACAAAUUCA-3'(서열번호 67), 5'-AACAAAUUCAU-3'(서열번호 68), 및 5'-AACAAAUUCAUU-3'(서열번호 69)로 이뤄진 군에서 선택된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역의 서열은 5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 5'-AACAAAUUCA-3'(서열번호 67), 5'-AACAAAUUCAU-3'(서열번호 68), 5'-AACAAAUUCAUU-3'(서열번호 69), 5'-AACAAAUUCAUUU-3'(서열번호 70), 5'-AACAAAUUCAUUUU-3'(서열번호 71), 5'-AACAAAUUCAUUUUU-3'(서열번호 72), 5'-AACAAAUUCAUUUUUC-3'(서열번호 73), 5'-AACAAAUUCAUUUUUCC-3'(서열번호 74), 5'-AACAAAUUCAUUUUUCCU-3'(서열번호 75), 5'-AACAAAUUCAUUUUUCCUC-3'(서열번호 76), 5'-AACAAAUUCAUUUUUCCUCU-3'(서열번호 77), 5'-AACAAAUUCAUUUUUCCUCUC-3'(서열번호 78), 5'-AACAAAUUCAUUUUUCCUCUCC-3'(서열번호 79), 5'-AACAAAUUCAUUUUUCCUCUCCA-3'(서열번호 80), 5'-AACAAAUUCAUUUUUCCUCUCCAA-3'(서열번호 81), 5'-AACAAAUUCAUUUUUCCUCUCCAAU-3'(서열번호 82), 5'-AACAAAUUCAUUUUUCCUCUCCAAUU-3'(서열번호 83), 5'-AACAAAUUCAUUUUUCCUCUCCAAUUC-3'(서열번호 84), 5'-AACAAAUUCAUUUUUCCUCUCCAAUUCU-3'(서열번호 85), 5'-AACAAAUUCAUUUUUCCUCUCCAAUUCUG-3'(서열번호 86), 5'-AACAAAUUCAUUUUUCCUCUCCAAUUCUGC-3'(서열번호 87), 5'-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCA-3'(서열번호 88), 5'-AAACAAAUUCAUUUUUCCUCUCCAAUUCUGCAC-3'(서열번호 89), 및 5'-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACA-3'(서열번호 90)로 이뤄진 군에서 선택된 것일 수 있다.
일 구현예로, 상기 변형된 제5 영역의 서열은 5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'에서 선택된 것일 수 있다.
일 구현예로, 상기 변형된 제5 영역의 서열은 5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 5'-AAUGAAGGA-3', 5'-GAAUGAAGGA-3'(서열번호 91), 5'-CGAAUGAAGGA-3'(서열번호 92), 5'-ACGAAUGAAGGA-3'(서열번호 93), 5'-GACGAAUGAAGGA-3'(서열번호 94), 5'-AGACGAAUGAAGGA-3'(서열번호 95), 5'-UAGACGAAUGAAGGA-3'(서열번호 96), 5'-AUAGACGAAUGAAGGA-3'(서열번호 97), 5'-AAUAGACGAAUGAAGGA-3'(서열번호 98), 5'-GAAUAGACGAAUGAAGGA-3'(서열번호 99), 5'-CGAAUAGACGAAUGAAGGA-3'(서열번호 100), 5'-CCGAAUAGACGAAUGAAGGA-3'(서열번호 101), 5'-CCCGAAUAGACGAAUGAAGGA-3'(서열번호 102), 5'-ACCCGAAUAGACGAAUGAAGGA-3'(서열번호 103), 5'-AACCCGAAUAGACGAAUGAAGGA-3'(서열번호 104), 5'-GAACCCGAAUAGACGAAUGAAGGA-3'(서열번호 105), 5'-AGAACCCGAAUAGACGAAUGAAGGA-3'(서열번호 106), 5'-CAGAACCCGAAUAGACGAAUGAAGGA-3'(서열번호 107), 5'-GCAGAACCCGAAUAGACGAAUGAAGGA-3'(서열번호 108), 5'-UGCAGAACCCGAAUAGACGAAUGAAGGA-3'(서열번호 109), 및 5'-UUGCAGAACCCGAAUAGACGAAUGAAGGA-3'(서열번호 110)로 이뤄진 군에서 선택된 것일 수 있다.
일 구현예로, 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 11,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAA-3'(서열번호 150), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAU-3'(서열번호 151), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUU-3'(서열번호 152), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUC-3'(서열번호 153), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCA-3'(서열번호 154), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAU-3'(서열번호 155), 및 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUU-3'(서열번호 156)로 이뤄진 군에서 선택된 서열; 및
5'-GGAAUGCAAC-3'(서열번호 161), 5'-AGGAAUGCAAC-3'(서열번호 162), 5'-AAGGAAUGCAAC-3'(서열번호 163), 5'-GAAGGAAUGCAAC-3'(서열번호 164), 5'-UGAAGGAAUGCAAC-3'(서열번호 165), 5'-AUGAAGGAAUGCAAC-3'(서열번호 166), 및 5'-AAUGAAGGAAUGCAAC-3'(서열번호 167)로 이뤄진 군에서 선택된 서열.
일 구현예로, 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 11,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 90으로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 5'-AAUGAAGGA-3', 서열번호 91 내지 110으로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 11,
서열번호 12, 및
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 및 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117)에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
일 구현예로, 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3'(서열번호 200), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUGAAAAGGAAUGCAAC-3'(서열번호 201), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUGAAAAAGGAAUGCAAC-3'(서열번호 202), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCGAAAGAAGGAAUGCAAC-3'(서열번호 203), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGAAAUGAAGGAAUGCAAC-3'(서열번호 204), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUGAAAAUGAAGGAAUGCAAC-3'(서열번호 205), 및 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUGAAAAAUGAAGGAAUGCAAC-3'(서열번호 206)로 이뤄진 군에서 선택된 것일 수 있다.
8) 엔지니어링 된 스캐폴드 영역 6 - 각 변형의 조합
각 변형의 조합 개괄
본 명세서에서 제공하는 엔지니어링 된 Cas12f1 가이드 RNA에 포함된 엔지니어링 된 스캐폴드 영역은, 자연계에서 발견되는 스캐폴드 영역에 전술한 각 영역 별 변형이 하나 이상 조합된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 및 변형된 제2 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역을 포함하고, 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역을 포함하고, 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 제1 영역 및 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 및 변형된 제3 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역을 포함하고, 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 몇 변형된 제4 영역 및 제5 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역 및 변형된 제3 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역을 포함하고, 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역 및 변형된 제4 영역 및 제5 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제2 영역, 및 변형된 제3 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역 및 변형된 제3 영역을 포함하고, 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역 및 변형된 제3 영역을 포함하고, 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역을 포함하고, 제1 영역 및 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제2 영역, 및 변형된 제4 영역 및 제5 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역 및 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제3 영역, 및 변형된 제4 영역 및 제5 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역, 변형된 제3 영역, 및 변형된 제4 영역 및 제5 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제2 영역, 변형된 제3 영역, 및 변형된 제4 영역 및 제5 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역, 변형된 제3 영역, 및 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제3 영역, 및 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역 및 제2 영역이 제거된 것일 수 있다.
이때, 상기 변형된 영역은 전술한 각 영역의 변형 단락에서 설명된 바와 같다.
각 변형의 조합 1 - 제1 영역 변형 및 제2 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역 및 변형된 제2 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제1 영역 및 제2 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역 및 제2 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-ACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 157); 및
5'-GAAUGAAGGAAUGCAAC-3'(서열번호 3).
일 구현예로, 제1 영역 및 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 12,
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
일 구현예로, 제1 영역 및 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-ACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 207)일 수 있다.
각 변형의 조합 2 - 제2 영역 변형 및 제1 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역을 포함하고, 제1 영역이 제거된 것이다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제2 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 12,
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 3 - 제1 영역 변형 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역을 포함하고, 제2 영역이 제거된 것이다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제1 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 12,
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 4 - 제1 영역 제거 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 제1 영역 및 제2 영역이 제거된 것이다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 상기 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'에서 3'말단 방향으로,
서열번호 12,
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 5 - 제1 영역 변형 및 제3 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역 및 변형된 제3 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제1 영역 및 제3 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 11,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역 및 제3 영역이 변형된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 11,
서열번호 12,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 6 - 제3 영역 변형 및 제1 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역을 포함하고, 제1 영역이 제거된 것이다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제3 영역이 변형되고 제1 영역이 제거된 엔지니어링 된 스캐폴드 영역은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 11,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역이 변형되고 제1 영역이 제거된 엔지니어링 된 스캐폴드 영역은 5'말단에서 3'말단 방향으로,
서열번호 11,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 7 - 제1 영역 변형 및 제4 영역 및 제5 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 및 변형된 제4 영역 및 제5 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제1 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 11,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAA-3'(서열번호 158); 및
5'-GGAAUGCAAC-3'(서열번호 161).
일 구현예로, 제1 영역 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 11,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
일 구현예로, 제1 영역 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3'(서열번호 208)일 수 있다.
각 변형의 조합 8 - 제4 영역 및 제5 영역 변형 및 제1 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것이다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 11,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 11,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 9 - 제2 영역 변형 및 제3 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역 및 변형된 제3 영역을 포함한다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제2 영역 및 제3 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역 및 제3 영역이 변형된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 10 - 제3 영역 변형 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역을 포함하고, 제2 영역이 제거된 것이다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제3 영역이 변형되고 제2 영역이 제거된 엔지니어링 된 스캐폴드 영역은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역이 변형되고 제2 영역이 제거된 엔지니어링 된 스캐폴드 영역은 5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 11 - 제2 영역 변형 및 제4 영역 및 제5 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역 및 변형된 제4 영역 및 제5 영역을 포함한다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제2 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAA-3'(서열번호 159); 및
5'-GGAAUGCAAC-3'(서열번호 161).
일 구현예로, 제2 영역 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
일 구현예로, 제2 영역 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACUUAGAGUGAAGGUGGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3'(서열번호 209)일 수 있다.
각 변형의 조합 12 - 제4 영역 및 제5 영역 변형, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것이다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제4 영역 및 제5 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 13 - 제3 영역 변형, 및 제4 영역 및 제5 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제3 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 11,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'에서 3'말단 방향으로,
서열번호 10,
서열번호 11,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 14 - 제1 영역 변형, 제2 영역 변형, 및 제3 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제2 영역, 및 변형된 제3 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형” 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제1 영역, 제2 영역, 및 제3 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 제2 영역, 및 제3 영역이 변형된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 15 - 제2 영역 변형, 제3 영역 변형, 및 제1 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역, 변형된 제3 영역을 포함하고, 제1 영역이 제거된 것이다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제2 영역, 및 제3 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역, 및 제3 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 16 - 제1 영역 변형, 제3 영역 변형, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제3 영역을 포함하고, 제2 영역이 제거된 것이다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제1 영역, 및 제3 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 및 제3 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 17 - 제3 영역 변형, 제1 영역 제거, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역을 포함하고, 제1 영역 및 제2 영역이 제거된 것이다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제3 영역이 변형되고, 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다.
5'말단에서 3'말단 방향으로,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역이 변형되고, 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 18 - 제1 영역 변형, 제2 영역 변형, 및 제4 영역 및 제5 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제2 영역 및 변형된 제4 영역 및 제5 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제1 영역, 제2 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 제2 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-ACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAA-3'(서열번호 160); 및
5'-GGAAUGCAAC-3'(서열번호 161).
일 구현예로, 제1 영역, 제2 영역 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
일 구현예로, 제1 영역, 제2 영역 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-ACCGCUUCACUUAGAGUGAAGGUGGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3'(서열번호 210)일 수 있다.
각 변형의 조합 19 - 제2 영역 변형, 제4 영역 및 제5 영역 변형, 및 제1 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역, 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것이다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제2 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 20 - 제1 영역 변형, 제4 영역 및 제5 영역 변형, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것이다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제1 영역, 제4 영역 및 제5 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 제4 영역 및 제5 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 21 - 제4 영역 및 제5 영역 변형, 제1 영역 제거, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역 및 제2 영역이 제거된 것이다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제4 영역 및 제5 영역이 변형되고, 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제4 영역 및 제5 영역이 변형되고, 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 22 - 제1 영역 변형, 제3 영역 변형, 및 제4 영역 및 제5 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제1 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 11,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 11,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 23 - 제3 영역 변형, 제4 영역 및 제5 영역 변형, 및 제1 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역, 및 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것이다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
서열번호 11,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 11,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 24 - 제2 영역 변형, 제3 영역 변형, 및 제4 영역 및 제5 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역, 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제2 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 25 - 제3 영역 변형, 제4 영역 및 제5 영역 변형, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역, 및 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것이다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제2 영역이 제거된 엔지니어린 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제2 영역이 제거된 엔지니어린 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 26 - 제1 영역 변형, 제2 영역 변형, 제3 영역 변형, 및 제4 영역 및 제5 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제2 영역, 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제1 영역, 제2 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 제2 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 27 - 제2 영역 변형, 제3 영역 변형, 제4 영역 및 제5 영역 변형, 및 제1 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역, 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것이다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제2 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 28 - 제1 영역 변형, 제3 영역 변형, 제4 영역 및 제5 영역 변형, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것이다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제1 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이뤄진 군에서 선택된 서열,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 29 - 제3 영역 변형, 제4 영역 변형, 제1 영역 제거, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역 및 제2 영역이 제거된 것이다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이뤄진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이뤄진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 434 내지 447로 이뤄진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 30 - 제6 영역의 추가적인 변형
전술한 바, 제6 영역 또한 그 기능이 손상되지 않는 범위 내에서 변형될 수 있으므로, 본 명세서에서 제공하는 엔지니어링 된 스캐폴드 영역은 전술한 제1 영역, 제2 영역, 제3 영역, 제4 영역, 및/또는 제5 영역의 변형 내지 제1 영역 및/또는 제2 영역의 제거 외, 제6 영역이 추가적으로 변형된 것일 수 있다.
9) 엔지니어링 된 스캐폴드 영역 6 - 상동성 있는 서열 포함
본 명세서에서 제공하는 엔지니어링 된 스캐폴드 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형", "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형", "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형", "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형", 및 "엔지니어링 된 스캐폴드 영역 5 - 각 변형의 조합" 단락에서 서술된 엔지니어링 된 스캐폴드 영역(이하, 전술한 엔지니어링 된 스캐폴드 영역)의 서열과 상동성 있는 서열을 포함한다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 전술한 엔지니어링 된 스캐폴드 영역의 서열 중 어느 하나와 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76%, 75%, 74%, 73%, 72%, 71%, 70%, 69%, 68%, 67%, 66%, 65%, 64%, 63%, 62%, 61%, 60%, 59%, 58%, 57%, 56%, 55%, 54%, 53%, 52%, 51%, 또는 50% 일치하는, 또는 상동성 있는 서열일 수 있다. 일 구현예로, 상기 스캐폴드 서열은 전술한 엔지니어링 된 스캐폴드 영역의 서열 중 어느 하나와 바로 이전 문장에서 선택된 두 수치 범위 내 일치하는 서열일 수 있다. 예를 들어, 상기 스캐폴드 서열은 전술한 엔지니어링 된 스캐폴드 영역의 서열 중 어느 하나와 90% 내지 100% 일치하는 서열일 수 있다.
10) 엔지니어링 된 Cas12f1 가이드 RNA
엔지니어링 된 Cas12f1 가이드 RNA 개괄
본 명세서에서는 CRISPR 조절 시스템의 세포 내 표적 유전자 타겟팅 효율을 높이기 위한, 엔지니어링 된 Cas12f1 가이드 RNA를 제공한다. 상기 엔지니어링 된 Cas12f1 가이드 RNA는 엔지니어링 된 스캐폴드, 스페이서, 및 U-rich tail을 포함한다. 이때, 상기 엔지니어링 된 스캐폴드는 전술한 "엔지니어링 된 스캐폴드 영역"에서 설명된 것 중 어느 하나일 수 있다. 이때, 상기 U-rich tail은 "U-rich tail" 단락에서 설명된 것 중 어느 하나일 수 있다.
싱글 가이드 RNA 또는 듀얼 가이드 RNA
상기 엔지니어링 된 Cas12f1 가이드 RNA는 싱글 가이드 RNA 또는 듀얼 가이드 RNA일 수 있다. 상기 듀얼 가이드 RNA는 가이드 RNA가 tracrRNA 및 crRNA의 두 분자 RNA로 구성된 것을 의미한다. 상기 싱글 가이드 RNA는 (엔지니어링 된) tracrRNA의 3'말단 및 (엔지니어링 된) crRNA의 5' 말단이 링커를 통해 연결된 것을 의미한다. 달리 표현하면, 상기 듀얼 가이드 RNA에서, 엔지니어링 된 스캐폴드에 포함된 제4 영역의 3'말단 및 제5 영역의 5'말단이 링커를 통해 연결된 것을 의미한다. 이때, 엔지니어링 된 스캐폴드의 각 영역은 "엔지니어링 된 스캐폴드 영역" 단락들에서 설명된 변형, 및 그 구체적인 서열을 모두 포함할 수 있다.
엔지니어링 된 싱글 가이드 RNA 예시 1
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결된 것일 수 있다.
상기 스페이서는 10 내지 50 뉴클레오타이드 길이를 가지며, 표적 서열과 상보적인 서열을 가진다.
상기 U-rich tail의 서열은 유리딘 연속 서열, 또는 변형된 유리딘 연속 서열일 수 있다. 일 예로, 상기 U-rich tail 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 또는 20개의 유리딘이 연속된 서열을 포함할 수 있다. 또 다른 예로, 상기 U-rich tail 서열은 UV, UUV, UUUV, UUUUV, 및/또는 UUUUUV가 하나 이상 반복된 서열을 포함할 수 있다. 이때, 상기 V는 아데노신(A), 사이티딘(C), 구아노신(G) 중 하나이다.
상기 엔지니어링 된 스캐폴드 영역은 5'말단에서 3'말단 방향으로, 자연계에서 발견되는 스캐폴드 영역과 대응되는 제1 영역, 제2 영역, 제3 영역, 제4 영역, 링커, 제5 영역, 제6 영역이 순서대로 연결된 것이며, 자연계에서 발견되는 스캐폴드 영역과 비교해 제1 영역, 제2 영역, 제4 영역, 및 제5 영역에서 선택된 하나 이상의 영역이 변형된 것일 수 있다.
일 예로, 상기 엔지니어링 된 스캐폴드 영역의 제1 영역이 변형된 경우, 상기 변형된 제1 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 이때, 상기 제거된 뉴클레오타이드는 상기 제1 영역 중 Stem 1 (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))에 속하는 뉴클레오타이드일 수 있다. 이때, 상기 변형된 제1 영역의 서열은 5'-A-3'을 포함하는 것을 특징으로 한다.
또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역의 제2 영역이 변형된 경우, 상기 변형된 제2 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 이때, 상기 뉴클레오타이드의 제거는 상기 제2 영역 중 Stem 2 구조(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))를 형성하는 부분에서 일어난 것이고, 서로 베이스 페어를 이루는 뉴클레오타이드가 쌍 단위로 제거된 것일 수 있다. 이때, 상기 변형된 제2 영역의 서열은 적어도 5'-CCGCUUCACCA-3'(서열번호 51) 및 5'-UGAGUGAAGGUG-3'(서열번호 52)을 포함하는 것을 특징으로 한다. 더 구체적으로, 상기 변형된 제2 영역의 서열은 5'말단에서 3'말단 방향으로 5'-CCGCUUCACCA-3'(서열번호 51) 및 5'-UGAGUGAAGGUG-3'(서열번호 52)가 순서대로 연결되어 있을 수 있으며, 적절한 중간 서열을 통해 연결되어 있을 수 있다. 일 예로, 상기 중간 서열은 5'-UUAG-3', 5'-AUUAGU-3', 5'-AAUUAGCU-3', 5'-AAAUUAGACU-3'(서열번호 58), 5'-AAAGUUAGAACU-3'(서열번호 59), 5'-AAAGCUUAGGAACU-3'(서열번호 60), 5'-AAAGCUUUAGAGAACU-3'(서열번호 61), 5'-AAAGCUGUUAGUUAGAACU-3'(서열번호 62), 5'-AAAGCUGUUAGUAGAACU-3'(서열번호 63), 5'-AAAGCUGUUUAGAUUAGAACU-3'(서열번호 64), 5'-AAAGCUGUCUUAGGAUUAGAACU-3'(서열번호 65), 및 5'-AAAGCUGUCCUUAGGGAUUAGAACU-3'(서열번호 66)로 이뤄진 군에서 선택된 것일 수 있다.
또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역의 제4 영역 및 제5 영역이 변형된 경우, 상기 변형된 제4 영역 및 제5 영역은 자연계에서 발견되는 스캐폴드 영역 중 제4 영역 및/또는 제5 영역의 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 이때, 상기 뉴클레오타이드의 제거는 상기 제4 영역 및 제5 영역 중 Stem 5 (R:AR-2) 구조(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))를 형성하는 부분에서 일어난 것이고, 서로 베이스 페어를 이루는 뉴클레오타이드가 쌍 단위로 제거된 것일 수 있다. 이때, 상기 변형된 제4 영역의 서열은 적어도 5'-AACAAA-3'을 포함하는 것을 특징으로 한다. 이때, 상기 변형된 제5 영역의 서열은 적어도 5'-GGA-3'을 포함하는 것을 특징으로 한다.
엔지니어링 된 싱글 가이드 RNA 예시 2
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결된 것일 수 있다.
상기 스페이서는 10 내지 50 뉴클레오타이드 길이를 가지며, 표적 서열과 상보적인 서열을 가진다.
상기 U-rich tail의 서열은 (UaN)bUc로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUAUUUU-3'일 수 있다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUGUUUU-3'일 수 있다.
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것이다:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이뤄진 군에서 선택된 서열;
5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 39), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 40), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 41), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 42), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 43), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 44), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 45), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 46), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 47), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 48), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 49), 5'-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 50), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이뤄진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3',
이때, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 한다.
엔지니어링 된 싱글 가이드 RNA 예시 3
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결된 것일 수 있다.
상기 스페이서는 10 내지 50 뉴클레오타이드 길이를 가지며, 표적 서열과 상보적인 서열을 가진다.
상기 U-rich tail의 서열은 (UaN)bUc로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUAUUUU-3'일 수 있다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUGUUUU-3'일 수 있다.
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것이다:
5'-A-3'로 표현되는 제1 서열;
5'-CCGCUUCACCA-3'(서열번호 51)로 표현되는 제2 서열;
5'-UUAG-3'로 표현되는 제3 서열;
5'-UGAGUGAAGGUG-3'(서열번호 52)로 표현되는 제4 서열;
5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 표현되는 제5 서열;
5'-AACAAA-3'로 표현되는 제6 서열;
링커;
5'-GGA-3'로 표현되는 제7 서열; 및
5'-AUGCAAC-3'로 표현되는 제8 서열.
일 예로, 상기 링커는 5'-GAAA-3'일 수 있다.
또 다른 예로, 상기 링커는 5'-GAAA-3', 5'-UGAAAA-3', 5'-UUGAAAAA-3', 5'-UUCGAAAGAA-3'(서열번호 642), 5'-UUCAGAAAUGAA-3'(서열번호 643), 5'-UUCAUGAAAAUGAA-3'(서열번호 644), 및 5'-UUCAUUGAAAAAUGAA-3'(서열번호 645)로 이뤄진 군에서 선택된 것일 수 있다.
상기 구현예의 일 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-GA-3', 5'-AGA-3', 5'-GAGA-3', 5'-GGAGA-3', 5'-UGGAGA-3', 5'-GUGGAGA-3', 5'-AGUGGAGA-3', 5'-AAGUGGAGA-3', 5'-AAAGUGGAGA-3'(서열번호 28), 5'-UAAAGUGGAGA-3'(서열번호 29), 5'-AUAAAGUGGAGA-3'(서열번호 30), 5'-GAUAAAGUGGAGA-3'(서열번호 31), 5'-UGAUAAAGUGGAGA-3'(서열번호 32), 5'-CUGAUAAAGUGGAGA-3'(서열번호 33), 5'-ACUGAUAAAGUGGAGA-3'(서열번호 34), 5'-CACUGAUAAAGUGGAGA-3'(서열번호 35), 5'-UCACUGAUAAAGUGGAGA-3'(서열번호 36), 5'-UUCACUGAUAAAGUGGAGA-3'(서열번호 37), 및 5'-CUUCACUGAUAAAGUGGAGA-3'(서열번호 38)로 이뤄진 군에서 선택된 제9 서열을 추가적으로 포함할 수 있다. 이때, 상기 제9 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있을 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-AAA-3', 5'-AAAG-3', 5'-AAAGC-3', 5'-AAAGCU-3', 5'-AAAGCUG-3', 5'-AAAGCUGU-3', 5'-AAAGCUGUC-3', 5'-AAAGCUGUCC-3'(서열번호 53), 및 5'-AAAGCUGUCCC-3'(서열번호 54)로 이뤄진 군에서 선택된 제10 서열을 추가적으로 포함할 수 있다. 이때, 상기 제2 서열의 3'말단 및 상기 제3 서열의 5'말단은 상기 제10 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-U-3', 5'-CU-3', 5'-ACU-3', 5'-AACU-3', 5'-GAACU-3', 5'-AGAACU-3', 5'-UAGAACU-3', 5'-UUAGAACU-3', 5'-AUUAGAACU-3', 5'-GAUUAGAACU-3'(서열번호 55), 5'-GGAUUAGAACU-3'(서열번호 56), 및 5'-GGGAUUAGAACU-3'(서열번호 57)로 이뤄진 군에서 선택된 제11 서열을 추가적으로 포함할 수 있다. 이때, 상기 제3 서열의 3'말단 및 상기 제4 서열의 5'말단은 상기 제11 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-AAA-3', 5'-AAAG-3', 5'-AAAGC-3', 5'-AAAGCU-3', 5'-AAAGCUG-3', 5'-AAAGCUGU-3', 5'-AAAGCUGUC-3', 5'-AAAGCUGUCC-3'(서열번호 53), 및 5'-AAAGCUGUCCC-3'(서열번호 54)로 이뤄진 군에서 선택된 제10 서열 및 5'-U-3', 5'-CU-3', 5'-ACU-3', 5'-AACU-3', 5'-GAACU-3', 5'-AGAACU-3', 5'-UAGAACU-3', 5'-UUAGAACU-3', 5'-AUUAGAACU-3', 5'-GAUUAGAACU-3'(서열번호 55), 5'-GGAUUAGAACU-3'(서열번호 56), 및 5'-GGGAUUAGAACU-3'(서열번호 57)로 이뤄진 군에서 선택된 제11 서열을 추가적으로 포함할 수 있다. 이때, 상기 제2 서열의 3'말단 및 상기 제3 서열의 5'말단은 상기 제10 서열을 통해 연결되어 있고, 상기 제3 서열의 3'말단 및 상기 제4 서열의 5'말단은 상기 제11 서열을 통해 연결되어 있을 수 있다.
일 예로, 상기 제10 서열이 5'-A-3'인 경우, 상기 제11 서열은 5'-U-3'일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AA-3'인 경우, 상기 제11 서열은 5'-CU-3'일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAA-3'인 경우, 상기 제11 서열은 5'-ACU-3'일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAG-3'인 경우, 상기 제11 서열은 5'-AACU-3'일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAGC-3'인 경우, 상기 제11 서열은 5'-GAACU-3'일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAGCU-3'인 경우, 상기 제11 서열은 5'-AGAACU-3'일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAGCUG-3'인 경우, 상기 제11 서열은 5'-UAGAACU-3' 또는 5'-UUAGAACU-3' 일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAGCUGU-3'인 경우, 상기 제11 서열은 5'-AUUAGAACU-3' 일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAGCUGUC-3'인 경우, 상기 제11 서열은 5'-GAUUAGAACU-3'(서열번호 55) 일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAGCUGUCC-3'(서열번호 53)인 경우, 상기 제11 서열은 5'-GGAUUAGAACU-3'(서열번호 56) 일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAGCUGUCCC-3'(서열번호 54)인 경우, 상기 제11 서열은 5'-GGGAUUAGAACU-3'(서열번호 57) 일 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-U-3', 5'-UU-3', 5'-UUC-3', 5'-UUCA-3', 5'-UUCAU-3', 5'-UUCAUU-3', 및 5'-UUCAUUU-3'로 이뤄진 군에서 선택된 제 12서열을 추가적으로 포함할 수 있다. 이때, 상기 제6 서열의 3'말단 및 상기 링커의 5'말단은 상기 제12 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-UGAA-3', 5'-AUGAA-3', 5'-AAUGAA-3', 및 5'-GAAUGAA-3'로 이뤄진 군에서 선택된 제 13서열을 추가적으로 포함할 수 있다. 이때, 상기 링커의 3'말단 및 상기 제7 서열의 5'말단은 상기 제13 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-U-3', 5'-UU-3', 5'-UUC-3', 5'-UUCA-3', 5'-UUCAU-3', 5'-UUCAUU-3', 및 5'-UUCAUUU-3'로 이뤄진 군에서 선택된 제 12서열, 및 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-UGAA-3', 5'-AUGAA-3', 5'-AAUGAA-3', 및 5'-GAAUGAA-3'로 이뤄진 군에서 선택된 제 13서열을 추가적으로 포함할 수 있다. 이때, 상기 제6 서열의 3'말단 및 상기 링커의 5'말단은 상기 제12 서열을 통해 연결되고, 상기 링커의 3'말단 및 상기 제7 서열의 5'말단은 상기 제13 서열을 통해 연결되어 있을 수 있다.
일 예로, 상기 제12 서열이 5'-U-3'인 경우, 상기 제13 서열은 5'-A-3'일 수 있다. 또 다른 예로, 상기 제12 서열이 5'-UU-3'인 경우, 상기 제13 서열은 5'-AA-3'일 수 있다. 또 다른 예로, 상기 제12 서열이 5'-UUC-3'인 경우, 상기 제13 서열은 5'-GAA-3'일 수 있다. 또 다른 예로, 상기 제12 서열이 5'-UUCA-3'인 경우, 상기 제13 서열은 5'-UGAA-3'일 수 있다. 또 다른 예로, 상기 제12 서열이 5'-UUCAU-3'인 경우, 상기 제13 서열은 5'-AUGAA-3'일 수 있다. 또 다른 예로, 상기 제12 서열이 5'-UUCAUU-3'인 경우, 상기 제13 서열은 5'-AAUGAA-3'일 수 있다. 또 다른 예로, 상기 제12 서열이 5'-UUCAUUU-3'인 경우, 상기 제13 서열은 5'-GAAUGAA-3'일 수 있다.
엔지니어링 된 싱글 가이드 RNA 예시 4
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결된 것일 수 있다.
상기 스페이서는 10 내지 50 뉴클레오타이드 길이를 가지며, 표적 서열과 상보적인 서열을 가진다.
상기 U-rich tail의 서열은 유리딘 연속 서열, 또는 변형된 유리딘 연속 서열일 수 있다. 일 예로, 상기 U-rich tail 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 또는 20개의 유리딘이 연속된 서열을 포함할 수 있다. 또 다른 예로, 상기 U-rich tail 서열은 UV, UUV, UUUV, UUUUV, 및/또는 UUUUUV가 하나 이상 반복된 서열을 포함할 수 있다. 이때, 상기 V는 아데노신(A), 사이티딘(C), 구아노신(G) 중 하나이다.
상기 엔지니어링 된 스캐폴드 영역은 5'말단에서 3'말단 방향으로, 자연계에서 발견되는 스캐폴드 영역과 대응되는 제1 영역, 제2 영역, 제3 영역, 제4 영역, 링커, 제5 영역, 제6 영역이 순서대로 연결된 것이며, 자연계에서 발견되는 스캐폴드 영역과 비교해 제1 영역, 제2 영역, 제3 영역, 제4 영역, 및 제5 영역에서 선택된 하나 이상의 영역이 변형된 것일 수 있다. 더 나아가, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역과 대응되는 제1 영역 및/또는 제2 영역이 제거된 것일 수 있다.
일 예로, 상기 엔지니어링 된 스캐폴드 영역의 제1 영역이 변형된 경우, 상기 변형된 제1 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 이때, 상기 제거된 뉴클레오타이드는 상기 제1 영역 중 Stem 1 (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))에 속하는 뉴클레오타이드일 수 있다. 이때, 상기 변형된 제1 영역의 서열은 5'-A-3'을 포함하는 것을 특징으로 한다.
또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역의 제2 영역이 변형된 경우, 상기 변형된 제2 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 이때, 상기 뉴클레오타이드의 제거는 상기 제2 영역 중 Stem 2 구조(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))를 형성하는 부분에서 일어난 것이고, 서로 베이스 페어를 이루는 뉴클레오타이드가 쌍 단위로 제거된 것일 수 있다. 이때, 상기 변형된 제2 영역의 서열은 적어도 5'-G-3'을 포함하는 것을 특징으로 한다.
또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역의 제3 영역이 변형된 경우, 상기 변형된 제3 영역은 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 이때, 상기 뉴클레오타이드의 제거는 상기 제3 영역 중 Stem 4 구조(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))를 형성하는 부분에서 일어난 것이고, 서로 베이스 페어를 이루는 뉴클레오타이드가 쌍 단위로 제거된 것일 수 있다. 이때, 상기 변형된 제3 영역의 서열은 적어도 5'-GCUGCUUGCAUCAGCCUAAUGUCGAG-3'(서열번호 475), 및 5'-CUCGA-3'을 포함하는 것을 특징으로 한다. 더 구체적으로, 상기 변형된 제3 영역의 서열은 5'말단에서 3'말단 방향으로 5'-GCUGCUUGCAUCAGCCUAAUGUCGAG-3'(서열번호 475) 및 5'-CUCGA-3'가 순서대로 연결되어 있을 수 있으며, 적절한 중간 서열을 통해 연결되어 있을 수 있다. 일 예로, 상기 중간 서열은 5'-UUCG-3', 5'-AUUCGC-3', 5'-AAUUCGC-3', 5'-AAUUCGCC-3', 5'-AAGUUCGCC-3', 5'-AAGUUCGACC-3'(서열번호 476), 5'-AAGUUUCGAACC-3'(서열번호 477), 5'-AAGUGUUCGUAACC-3'(서열번호 478), 5'-AAGUGCUUCGGUAACC-3'(서열번호 479), 5'-AAGUGCUUUCGAGUAACC-3'(서열번호 480), 5'-AAGUGCUCUUCGGAGUAACC-3'(서열번호 481), 5'-AAGUGCUUUUCGAAGUAACC-3'(서열번호 482), 5'-AAGUGCUUUUUCGAAAGUAACC-3'(서열번호 483), 및 5'-AAGUGCUUUCUUCGGAAAGUAACC-3'(서열번호 484)로 이뤄진 군에서 선택된 것일 수 있다.
또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역의 제4 영역 및 제5 영역이 변형된 경우, 상기 변형된 제4 영역 및 제5 영역은 자연계에서 발견되는 스캐폴드 영역 중 제4 영역 및/또는 제5 영역의 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 이때, 상기 뉴클레오타이드의 제거는 상기 제4 영역 및 제5 영역 중 Stem 5 (R:AR-2) 구조(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))를 형성하는 부분에서 일어난 것이고, 서로 베이스 페어를 이루는 뉴클레오타이드가 쌍 단위로 제거된 것일 수 있다. 이때, 상기 변형된 제4 영역의 서열은 적어도 5'-AACAAA-3'을 포함하는 것을 특징으로 한다. 이때, 상기 변형된 제5 영역의 서열은 적어도 5'-GGA-3'을 포함하는 것을 특징으로 한다.
엔지니어링 된 싱글 가이드 RNA 예시 5
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결된 것일 수 있다.
상기 스페이서는 10 내지 50 뉴클레오타이드 길이를 가지며, 표적 서열과 상보적인 서열을 가진다.
상기 U-rich tail의 서열은 (UaN)bUc로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUAUUUU-3'일 수 있다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUGUUUU-3'일 수 있다.
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것이다:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이뤄진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이뤄진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이뤄진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3',
이때, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 한다.
엔지니어링 된 싱글 가이드 RNA 예시 6
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결된 것일 수 있다.
상기 스페이서는 10 내지 50 뉴클레오타이드 길이를 가지며, 표적 서열과 상보적인 서열을 가진다.
상기 U-rich tail의 서열은 (UaN)bUc로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUAUUUU-3'일 수 있다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUGUUUU-3'일 수 있다.
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것이다:
5'-GCUGCUUGCAUCAGCCUAAUGUCGAG-3'(서열번호 475)로 표현되는 제1 서열;
5'-UUCG-3'로 표현되는 제2 서열;
5'-CUCGA-3'로 표현되는 제3 서열;
5'-AACAAA-3'로 표현되는 제4 서열;
링커;
5'-GGA-3'로 표현되는 제5 서열; 및
5'-AUGCAAC-3'로 표현되는 제6 서열.
일 예로, 상기 링커는 5'-GAAA-3'일 수 있다.
또 다른 예로, 상기 링커는 5'-GAAA-3', 5'-UGAAAA-3', 5'-UUGAAAAA-3', 5'-UUCGAAAGAA-3'(서열번호 642), 5'-UUCAGAAAUGAA-3'(서열번호 643), 5'-UUCAUGAAAAUGAA-3'(서열번호 644), 및 5'-UUCAUUGAAAAAUGAA-3'(서열번호 645)로 이뤄진 군에서 선택된 것일 수 있다.
상기 구현예의 일 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5’-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이뤄진 군에서 선택된 제7 서열을 추가적으로 포함할 수 있다. 이때 상기 제7 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있을 수 있다.
상기 구현예의 일 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362) 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이뤄진 군에서 선택된 제8 서열을 추가적으로 포함할 수 있다. 이때 상기 제8 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있을 수 있다.
상기 구현예의 일 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5’-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이뤄진 군에서 선택된 제7 서열을 추가적으로 포함하고, 5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이뤄진 군에서 선택된 제8 서열을 추가적으로 포함할 수 있다. 이때 상기 제8 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있고, 상기 제7 서열의 3'말단은 상기 제8 서열의 5'말단과 연결되어 있을 수 있다.
상기 구현예의 일 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-AAG-3', 5'-AAGU-3', 5'-AAGUG-3', 5'-AAGUGC-3', 5'-AAGUGCU-3', 5'-AAGUGCUU-3', 5'-AAGUGCUUU-3', 5'-AAGUGCUUUC-3'(서열번호 485)로 이뤄진 군에서 선택된 제9 서열을 추가적으로 포함할 수 있다. 이때, 상기 제1 서열의 3'말단 및 상기 제2 서열의 5'말단은 상기 제9 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 일 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-C-3', 5'-CC-3', 5'-ACC-3', 5'-AACC-3', 5'-UAACC-3', 5'-GUAACC-3', 5'-AGUAACC-3', 5'-AAGUAACC-3', 5'-AAAGUAACC-3', 5'-GAAAGUAACC-3'(서열번호 486)로 이뤄진 군에서 선택된 제10 서열을 추가적으로 포함할 수 있다. 이때, 상기 제2 서열의 3'말단 및 상기 제3 서열의 5'말단은 상기 제10 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 일 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-AAG-3', 5'-AAGU-3', 5'-AAGUG-3', 5'-AAGUGC-3', 5'-AAGUGCU-3', 5'-AAGUGCUU-3', 5'-AAGUGCUUU-3', 5'-AAGUGCUUUC-3'(서열번호 485)로 이뤄진 군에서 선택된 제9 서열을 추가적으로 포함하고, 5'-C-3', 5'-CC-3', 5'-ACC-3', 5'-AACC-3', 5'-UAACC-3', 5'-GUAACC-3', 5'-AGUAACC-3', 5'-AAGUAACC-3', 5'-AAAGUAACC-3', 5'-GAAAGUAACC-3'(서열번호 486)로 이뤄진 군에서 선택된 제10 서열을 추가적으로 포함할 수 있다. 이때, 상기 제1 서열의 3'말단 및 상기 제2 서열의 5'말단은 상기 제9 서열을 통해 연결되어 있고, 상기 제2 서열의 3'말단 및 상기 제3 서열의 5'말단은 상기 제10 서열을 통해 연결되어 있을 수 있다.
일 예로, 상기 제9 서열이 5'-A-3'인 경우, 상기 제10 서열은 5'-C-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AA-3'인 경우, 상기 제10 서열은 5'-C-3', 또는 5'-CC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAG-3'인 경우, 상기 제10 서열은 5'-CC-3', 또는 5'-ACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGU-3'인 경우, 상기 제10 서열은 5'-AACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGUG-3'인 경우, 상기 제10 서열은 5'-UAACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGUGC-3'인 경우, 상기 제10 서열은 5'-GUAACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGUGCU-3'인 경우, 상기 제10 서열은 5'-AGUAACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGUGCUC-3'인 경우, 상기 제10 서열은 5'-GAGUAACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGUGCUU-3'인 경우, 상기 제10 서열은 5'-AAGUAACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGUGCUUU-3'인 경우, 상기 제10 서열은 5'-AAAGUAACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGUGCUUUC-3'(서열번호 485)인 경우, 상기 제10 서열은 5'-GAAAGUAACC-3'(서열번호 486)일 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-U-3', 5'-UU-3', 5'-UUC-3', 5'-UUCA-3', 5'-UUCAU-3', 5'-UUCAUU-3', 및 5'-UUCAUUU-3'로 이뤄진 군에서 선택된 제 11서열을 추가적으로 포함할 수 있다. 이때, 상기 제4 서열의 3'말단 및 상기 링커의 5'말단은 상기 제11 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-UGAA-3', 5'-AUGAA-3', 5'-AAUGAA-3', 및 5'-GAAUGAA-3'로 이뤄진 군에서 선택된 제 12서열을 추가적으로 포함할 수 있다. 이때, 상기 링커의 3'말단 및 상기 제5 서열의 5'말단은 상기 제12 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-U-3', 5'-UU-3', 5'-UUC-3', 5'-UUCA-3', 5'-UUCAU-3', 5'-UUCAUU-3', 및 5'-UUCAUUU-3'로 이뤄진 군에서 선택된 제 11서열, 및 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-UGAA-3', 5'-AUGAA-3', 5'-AAUGAA-3', 및 5'-GAAUGAA-3'로 이뤄진 군에서 선택된 제 12서열을 추가적으로 포함할 수 있다. 이때, 상기 제4 서열의 3'말단 및 상기 링커의 5'말단은 상기 제11 서열을 통해 연결되고, 상기 링커의 3'말단 및 상기 제5 서열의 5'말단은 상기 제12 서열을 통해 연결되어 있을 수 있다.
일 예로, 상기 제11 서열이 5'-U-3'인 경우, 상기 제12 서열은 5'-A-3'일 수 있다. 또 다른 예로, 상기 제11 서열이 5'-UU-3'인 경우, 상기 제12 서열은 5'-AA-3'일 수 있다. 또 다른 예로, 상기 제11 서열이 5'-UUC-3'인 경우, 상기 제12 서열은 5'-GAA-3'일 수 있다. 또 다른 예로, 상기 제11 서열이 5'-UUCA-3'인 경우, 상기 제12 서열은 5'-UGAA-3'일 수 있다. 또 다른 예로, 상기 제11 서열이 5'-UUCAU-3'인 경우, 상기 제12 서열은 5'-AUGAA-3'일 수 있다. 또 다른 예로, 상기 제11 서열이 5'-UUCAUU-3'인 경우, 상기 제12 서열은 5'-AAUGAA-3'일 수 있다. 또 다른 예로, 상기 제11 서열이 5'-UUCAUUU-3'인 경우, 상기 제12 서열은 5'-GAAUGAA-3'일 수 있다.
엔지니어링 된 싱글 가이드 RNA 서열 예시
일 구현예로, 상기 엔지니어링 된 싱글 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551 에서 선택된 서열을 가질 수 있다.
엔지니어링 된 듀얼 가이드 RNA 예시
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail을 포함한다.
상기 스페이서는 10 내지 50 뉴클레오타이드 길이를 가지며, 표적 서열과 상보적인 서열을 가진다.
상기 U-rich tail의 서열은 (UaN)bUc로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이다.
일 예로, 상기 U-rich tail의 서열은 5'-UUUUAUUUU-3'일 수 있다.
상기 엔지니어링 된 스캐폴드 영역의 서열은 다음 서열을 포함한다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이뤄진 군에서 선택된 제1 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이뤄진 군에서 선택된 제2 서열,
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이뤄진 군에서 선택된 제3 서열,
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 5'-AACAAAUUCA-3'(서열번호 67), 5'-AACAAAUUCAU-3'(서열번호 68), 5'-AACAAAUUCAUU-3'(서열번호 69), 및 5'-AACAAAUUCAUUU-3'(서열번호 13)로 이뤄진 군에서 선택된 제4 서열이 연결된 엔지니어링 된 tracrRNA; 및
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 5'-AAUGAAGGA-3', 및 5'-GAAUGAAGGA-3'(서열번호 15)으로 이뤄진 군에서 선택된 제5 서열, 및
5'-AUGCAAC-3'로 표현되는 제6 서열이 연결된 엔지니어링 된 crRNA 반복 서열 부분,
이때, 상기 엔지니어링 된 crRNA 반복 서열 부분의 3'말단은 상기 스페이서의 5'말단과 연결 되어 있다.
이때, 상기 엔지니어링 된 tracrRNA의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 1)과 상이하고, 및/또는 상기 엔지니어링 된 crRNA 반복 서열 부분은 5'-GAAUGAAGGAAUGCAAC-3'(서열번호 3)과 상이하다.
일 예로, 상기 엔지니어링 된 tracrRNA의 서열은 서열번호 1과 동일하고, 상기 엔지니어링 된 crRNA 반복 서열 부분은 서열번호 3과 상이할 수 있다. 또 다른 일 예로, 상기 엔지니어링 된 tracrRNA의 서열은 서열번호 1과 상이하고, 상기 엔지니어링 된 crRNA 반복 서열 부분은 서열번호 3과 동일할 수 있다. 또 다른 일 예로, 상기 엔지니어링 된 tracrRNA의 서열은 서열번호 1과 상이하고, 상기 엔지니어링 된 crRNA 반복 서열 부분은 서열번호 3과 상이할 수 있다.
일 예로, 상기 엔지니어링 된 tracrRNA의 서열은 상기 제1 서열 및/또는 제2 서열을 포함하지 않을 수 있다.
구체적으로, 상기 엔지니어링 된 tracrRNA의 서열은 다음으로 이뤄진 군에서 선택된 것일 수 있다:
5'말단에서 3'말단 방향으로, 상기 제2 서열, 상기 제3 서열, 및 상기 제4 서열이 연결된 서열,
5'말단에서 3'말단 방향으로, 상기 제1 서열, 상기 제3 서열, 및 상기 제4 서열이 연결된 서열, 및
5'말단에서 3'말단 방향으로, 상기 제3 서열, 및 상기 제4 서열이 연결된 서열.
일 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAA-3'를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-GGA-3'를 포함할 수 있다. 또 다른 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAAU-3'를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-AGGA-3'를 포함할 수 있다. 또 다른 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAAUU-3'를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-AAGGA-3'를 포함할 수 있다. 또 다른 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAAUUC-3'를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-GAAGGA-3'를 포함할 수 있다. 또 다른 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAAUUCA-3'(서열번호 67)를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-UGAAGGA-3'를 포함할 수 있다. 또 다른 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAAUUCAU-3'(서열번호 68)를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-AUGAAGGA-3'를 포함할 수 있다. 또 다른 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAAUUCAUU-3'(서열번호 69)를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-AAUGAAGGA-3'를 포함할 수 있다. 또 다른 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAAUUCAUUU-3'(서열번호 70)를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-GAAUGAAGGA-3'(서열번호 91)를 포함할 수 있다.
3. CRISPR activation 복합체 및 CRISPR interference 복합체
CRISPR activation 복합체 및 CRISPR interference 복합체 - 개괄
본 명세서에서는 CRISPR activation 복합체 및 CRISPR interference 복합체를 제공한다. 상기 CRISPR activation 복합체는 전사 활성 Cas12f1 융합 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함한다. 상기 CRISPR interference 복합체는 전사 저해 Cas12f1 융합 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함한다. 이때, 상기 전사 활성 Cas12f1 융합 단백질 및 전사 저해 Cas12f1 융합 단백질은 "5) Cas12f1 융합 단백질" 섹션에서 설명된 것이다. 이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 "10) 엔지니어링 된 Cas12f1 가이드 RNA" 섹션에서 설명된 것이다.
일 구현예로, 본 명세서에서는 전사 활성 Cas12f1 융합 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는, 표적 유전자의 발현을 증가 또는 촉진할 수 있는 CRISPR activation 복합체를 제공한다. 이때, 상기 전사 활성 Cas12f1 융합 단백질은 "5) Cas12f1 융합 단백질" 섹션에서 설명된 것 중 어느 하나일 수 있다. 이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 "10) 엔지니어링 된 Cas12f1 가이드 RNA" 섹션에서 설명된 것 중 어느 하나일 수 있다. 상기 CRISPR activation 복합체는 표적 유전자의 인핸서 또는 프로모터 근처에 위치한 조절 DNA 부위에 결합하여 일반적인 transcription machinery (RNA 중합효소 및 일반적인 transcription factors 등)와 단백질-단백질 상호작용을 통해 프로모터에 transcription machinery의 결합을 촉진하여 유전자의 전사를 촉진할 수 있다. 또는 상기 CRISPR activation 복합체는 표적 유전자의 인핸서 또는 프로모터 근처에 위치한 조절 DNA 부위에 결합하여 RNA 중합효소가 프로모터로부터 방출되어 DNA를 따라 합성을 진행하도록 촉발하여 유전자의 전사를 촉진할 수 있다.
일 구현예로, 본 명세서에서는 전사 저해 Cas12f1 융합 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는, 표적 유전자의 발현을 저해 또는 억제할 수 있는 CRISPR interference 복합체를 제공한다. 이때, 상기 전사 저해 Cas12f1 융합 단백질은 "5) Cas12f1 융합 단백질" 섹션에서 설명된 것 중 어느 하나일 수 있다. 이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 "10) 엔지니어링 된 Cas12f1 가이드 RNA" 섹션에서 설명된 것 중 어느 하나일 수 있다. 상기 CRISPR interference 복합체 표적 유전자의 operator 또는 silencer에 결합하여 RNA 중합효소가 프로모터에 부착되는 것을 차단하여 유전자의 전사를 저해 또는 억제할 수 있다.
전사 활성 Cas12f1 융합 단백질
본 명세서에서 제공되는 CRISPR activation 복합체를 구성하는 전사 활성 Cas12f1 융합 단백질은 "5) Cas12f1 융합 단백질" 섹션에서 설명된 것과 동일한 특징 및 구조를 가진다.
전사 저해 Cas12f1 융합 단백질
본 명세서에서 제공되는 CRISPR interference 복합체를 구성하는 전사 저해 Cas12f1 융합 단백질은 "5) Cas12f1 융합 단백질" 섹션에서 설명된 것과 동일한 특징 및 구조를 가진다.
엔지니어링 된 Cas12f1 가이드 RNA
본 명세서에서 제공되는 CRISPR activation 복합체 또는 CRISPR interference 복합체를 구성하는 엔지니어링 된 Cas12f1 가이드 RNA는 "10) 엔지니어링 된 Cas12f1 가이드 RNA" 섹션에서 설명된 것과 동일한 특징 및 구조를 가진다.
CRISPR activation 복합체의 예시
일 구현예로, 상기 전사 활성 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 dCas12f1 R490A 단백질 및 VP64이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 활성 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR activation 복합체를 이루고 있을 수 있다.
CRISPR interference 복합체의 예시
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 KRAB 및 dCas12f1 D510A 단백질이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 DNMT3 및 dCas12f1 D510A 단백질이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 DNMT3 및 dCas12f1 R490A 단백질이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 KRAB, MeCP2 및 dCas12f1 D510A 단백질이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 KRAB, MeCP2 및 dCas12f1 R490A 단백질이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 dCas12f1 R490A 단백질 및 KRAB이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 dCas12f1 D510A 단백질 및 KRAB이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 dCas12f1 D510A 단백질, KRAB 및 MeCP2이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 dCas12f1 R490A 단백질, KRAB 및 MeCP2이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 dCas12f1 R490A 단백질, KRAB 및 KRAB이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 dCas12f1 D510A 단백질, KRAB 및 KRAB이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 dCas12f1 D510A 단백질, KRAB, KRAB 및 MeCP2가 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 dCas12f1 R490A 단백질 및 HDAC3이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 KRAB, dCas12f1 D510A 단백질 및 MeCP2가 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 KRAB, MeCP2, dCas12f1 R490A 단백질 및 KRAB이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 MeCP2, dCas12f1 R490A 단백질 및 KRAB이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 전사 저해 Cas12f1 융합 단백질은 N 말단에서 C 말단 방향으로 MeCP2, dCas12f1 D510A 단백질 및 KRAB이 순서대로 연결된 것이고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 아미노산 서열을 가지며, 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR interference 복합체를 이루고 있을 수 있다.
4. CRISPR 발현 조절 시스템의 각 구성요소를 발현시키기 위한 벡터
벡터 - 개괄
본 명세서에서는 CRISPR 발현 조절 시스템의 구성 요소를 발현시키기 위한 벡터를 제공한다. 상기 벡터는 Cas12f1 융합 단백질, 및/또는 엔지니어링 된 Cas12f1 가이드 RNA를 발현시키도록 구성된다. 상기 벡터의 서열은 상기 CRISPR 발현 조절 시스템의 구성요소 중 하나를 암호화하는 핵산 서열을 포함하거나, 둘 이상의 구성요소를 암호화하는 핵산 서열을 포함할 수 있다. 상기 벡터의 서열은 Cas12f1 융합 단백질을 암호화하는 핵산 서열 및/또는 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함한다. 상기 벡터의 서열은 하나 이상의 프로모터 서열을 포함한다. 상기 프로모터는 Cas12f1 융합 단백질을 암호화하는 핵산 서열 및/또는 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열과 작동적으로 연결되어, 세포 내에서 상기 핵산 서열의 전사가 촉진될 수 있도록 한다. 상기 Cas12f1 융합 단백질은 "2. 발현 조절 단백질 - Cas12f1 융합 단백질" 섹션에서 설명된 Cas12f1 융합 단백질과 동일한 특징 및 구성을 가진다. 상기 엔지니어링 된 Cas12f1 가이드 RNA는 "3. 엔지니어링 된 Cas12f1 가이드 RNA" 섹션에서 설명된 엔지니어링 된 Cas12f1 가이드 RNA와 동일한 특징 및 구성을 가진다.
상기 벡터의 서열은 Cas12f1 융합 단백질을 암호화하는 핵산 서열 및 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함할 수 있다. 일 구현예로, 상기 벡터의 서열은 Cas12f1 융합 단백질을 암호화하는 핵산 서열을 포함하는 제1 서열, 및 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제2 서열을 포함할 수 있다. 상기 벡터의 서열은 Cas12f1 융합 단백질을 암호화하는 핵산 서열을 세포 내에서 발현시키기 위한 프로모터 서열, 및 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 세포 내에서 발현시키기 위한 프로모터 서열을 포함하고, 상기 프로모터들은 각 발현 대상과 작동적으로 연결(operably linked)되어 있다. 일 구현예로, 상기 벡터의 서열은 상기 제1 서열과 작동 가능하게 연결된 제1 프로모터 서열, 및 상기 제2 서열과 작동 가능하게 연결된 제2 프로모터 서열을 포함할 수 있다.
상기 벡터의 서열은 Cas12f1 융합 단백질을 암호화하는 핵산 서열 및 둘 이상의 서로 다른 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함할 수 있다. 일 구현예로, 상기 벡터의 서열은 Cas12f1 융합 단백질을 암호화하는 핵산 서열을 포함하는 제1 서열, 제1 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제2 서열, 제2 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제3 서열을 포함할 수 있다. 더 나아가, 상기 벡터의 서열은 상기 제1 서열과 작동 가능하게 연결된 제1 프로모터 서열, 상기 제2 서열과 작동 가능하게 연결된 제2 프로모터 서열, 상기 제3 서열과 작동 가능하게 연결된 제3 프로모터 서열을 포함할 수 있다.
발현 대상 - Cas12f1 융합 단백질
상기 벡터는 Cas12f1 융합 단백질을 발현하도록 구성된 것일 수 있다. 이때, 상기 Cas12f1 융합 단백질은 "2. 발현 조절 단백질 - Cas12f1 융합 단백질" 섹션에서 설명된 것과 동일한 구성 및 특징을 가진다.
일 구현예로, 상기 벡터는 Cas12f1 융합 단백질을 발현하도록 구성된 것일 수 있다. 이때, 상기 Cas12f1 융합 단백질은 전사 활성 Cas12f1 융합 단백질일 수 있다. 또는, 상기 Cas12f1 융합 단백질은 전사 저해 Cas12f1 융합 단백질일 수 있다. 일 구현예로, 상기 벡터는 표적 유전자의 발현을 촉진하기 위한 전사 활성 Cas12f1 융합 단백질을 발현하도록 구성된 것일 수 있다. 일 구현예로, 상기 벡터는 표적 유전자의 발현을 저해 또는 억제하기 위한 전사 저해 Cas12f1 융합 단백질을 발현하도록 구성된 것일 수 있다.
발현 대상 - 엔지니어링 된 Cas12f1 가이드 RNA
상기 벡터는 엔지니어링 된 Cas12f1 가이드 RNA를 발현하도록 구성된 것일 수 있다. 상기 엔지니어링 된 Cas12f1 가이드 RNA는 "3. 엔지니어링 된 Cas12f1 가이드 RNA" 섹션에서 설명한 엔지니어링 된 Cas12f1 가이드 RNA와 동일한 특징 및 구성을 가진다. 상기 벡터는 둘 이상의 서로 다른 엔지니어링 된 Cas12f1 가이드 RNA를 발현하도록 구성된 것일 수 있다.
발현 대상 - 부가 구성 요소
상기 벡터는 전술한 발현 대상 외, NLS, 태그 단백질 등의 부가 구성 요소를 발현하도록 구성된 것일 수 있다. 일 구현예로, 상기 부가 구성 요소는 상기 Cas12f1 융합 단백질 및/또는 엔지니어링 된 Cas12f1 가이드 RNA와는 독립적으로 발현될 수 있다. 또 다른 구현예로, 상기 부가 구성 요소는 상기 Cas12f1 융합 단백질 및/또는 엔지니어링 된 Cas12f1 가이드 RNA와 연결되어 발현될 수 있다. 이때, 상기 부가 구성 요소는 CRISPR 발현 조절 시스템을 발현시키고자 할 때 일반적으로 발현시키는 구성 요소일 수 있으며, 공지기술을 참조할 수 있다. 예를 들어, 상기 부가 발현 요소는, "용어의 설명" 중 "태그" 단락에서 설명된 태그 중 하나일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 상기 부가 발현 요소는, 글리포세이트(glyphosate), 글루포시네이트암모늄 (glufosinate ammonium) 또는 포스피노트리신(phosphinothricin)과 같은 제초제 저 항성 유전자, 암피실린(ampicillin), 카나마이신(kanamycin), G418, 블레오마이신 (Bleomycin), 하이그로마이신(hygromycin), 클로람페니콜(chloramphenicol)과 같은 항생제 내성 유전자일 수 있으나, 이에 제한되는 것은 아니다.
벡터 구성 - Cas12f1 융합 단백질 발현 서열
상기 벡터 서열은 상기 Cas12f1 융합 단백질을 암호화하는 핵산 서열을 포함할 수 있다. 이때, 상기 Cas12f1 단백질은 "2. 발현 조절 단백질 - Cas12f1 융합 단백질" 섹션에서 설명된 것과 동일한 구성 및 특징을 가진다.
일 구현예로, 상기 벡터의 서열은 Cas12f1 융합 단백질을 암호화하는 서열을 포함할 수 있다. 이때, 상기 Cas12f1 단백질은 전사 활성 Cas12f1 융합 단백질일 수 있다. 또는, 상기 Cas12f1 단백질은 전사 저해 Cas12f1 융합 단백질일 수 있다. 일 구현예로, 상기 벡터의 서열은 Cas12f1 융합 단백질을 암호화하는 인간 코돈 최적화된 핵산 서열을 포함할 수 있다. 일 구현예로, 상기 벡터의 서열은 표적 유전자의 발현을 촉진하기 위한 전사 활성 Cas12f1 융합 단백질을 암호화하는 서열을 포함할 수 있다. 일 구현예로, 상기 벡터의 서열은 표적 유전자의 발현을 저해 또는 억제하기 위한 전사 저해 Cas12f1 융합 단백질을 암호화하는 서열을 포함할 수 있다.
벡터 구성 - 엔지니어링 된 Cas12f1 가이드 RNA 발현 서열
일 구현예로, 상기 벡터의 서열은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열을 포함할 수 있다. 예를 들어, 상기 벡터의 서열은 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 서열을 포함할 수 있다.
일 구현예로, 상기 벡터의 서열은 둘 이상의 서로 다른 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열을 포함할 수 있다. 예를 들어, 상기 벡터의 서열은 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 각각 선택된 제1 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열, 및 제2 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열을 포함할 수 있다.
벡터 구성 - 프로모터 서열
상기 벡터 서열은 각 구성요소를 암호화하는 서열에 작동 가능하게 연결된 프로모터 서열을 포함한다. 상기 벡터의 발현 대상을 세포 내에서 발현시키려면, 각 구성 요소를 암호화하는 서열에 프로모터 서열을 작동적으로 연결시켜 세포 내에서 RNA 전사 인자가 활성화될 수 있도록 해야 한다. 상기 프로모터 서열은 대응하는 RNA 전사 인자, 또는 발현 환경에 따라 달리 설계할 수 있으며, CRISPR/Cas 시스템의 구성 요소를 세포 내에서 적절히 발현시킬 수 있는 것이라면 제한되지 않는다. 상기 프로모터 서열은 RNA 중합효소(예를 들어, RNA Pol I, Pol II, 또는 Pol III)의 전사를 촉진시키는 프로모터일 수 있다. 예를 들어, 상기 프로모터는 SV40 초기 프로모터, mouse mammary tumor virus long terminal repeat(LTR) 프로모터, adenovirus major late 프로모터 (Ad MLP), herpes simplex virus (HSV) 프로모터, CMV immediate early promoter region (CMVIE)와 같은 cytomegalovirus (CMV) 프로모터, rous sarcoma virus (RSV) 프로모터, human U6 small nuclear 프로모터 (U6) (Miyagishi et al., Nature Biotechnology 20, 497 - 500 (2002)), enhanced U6 프로모터 (e.g., Xia et al., Nucleic Acids Res. 2003 Sep 1;31(17)), human H1 프로모터 (H1), 및 7SK 중 하나 일 수 있으나, 이에 제한되는 것은 아니다.
일 구현예로, 상기 벡터 서열은 Cas12f1 융합 단백질을 암호화하는 서열, 및 프로모터 서열을 포함할 수 있다. 이때, 상기 프로모터 서열은 상기 Cas12f1 융합 단백질을 암호화하는 서열과 작동 가능하게 연결될 수 있다. 일 구현예로, 상기 벡터 서열은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열, 및 프로모터 서열을 포함할 수 있다. 이때, 상기 프로모터 서열은 상기 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열과 작동 가능하게 연결될 수 있다. 일 구현예로, 상기 벡터 서열은 Cas12f1 융합 단백질을 암호화하는 서열, 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열, 및 프로모터 서열을 포함할 수 있다. 이때, 상기 프로모터 서열은 상기 Cas12f1 융합 단백질을 암호화하는 서열, 및 상기 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열과 작동적으로 연결되며, 상기 프로모터 서열로 인해 활성화된 전사 인자가 상기 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA를 발현시킨다.
벡터 구성 - 둘 이상의 프로모터 서열 포함 가능
일 구현예로, 상기 벡터 서열은 제1 프로모터 서열, Cas12f1 융합 단백질을 암호화하는 제1 서열, 제2 프로모터 서열 및 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 제2 서열을 포함할 수 있다. 이때, 상기 제1 프로모터 서열은 상기 제1 서열과 작동적으로 연결되고, 상기 제2 프로모터 서열은 상지 제2 서열과 작동적으로 연결되며, 상기 제1 프로모터 서열에 의해 상기 제1 서열의 전사가 유도되고, 상기 제2 프로모터 서열에 의해 상기 제2 서열의 전사가 유도된다. 이때, 상기 제1 프로모터 및 상기 제2 프로모터는 동일한 종류의 프로모터일 수 있다. 이때, 상기 제1 프로모터 및 상기 제2 프로모터는 상이한 종류의 프로모터일 수 있다.
일 구현예로, 상기 벡터 서열은 제1 프로모터 서열, Cas12f1 융합 단백질을 암호화하는 제1 서열, 제2 프로모터 서열, 제1 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 제2 서열, 제3 프로모터 서열 및 제2 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 제3 서열을 포함할 수 있다. 이때, 상기 제1 프로모터 서열은 상기 제1 서열과 작동적으로 연결되고, 상기 제2 프로모터 서열은 상기 제2 서열과 작동적으로 연결되고, 상기 제3 프로모터 서열은 상기 제3 서열과 작동적으로 연결되며, 상기 제1 프로모터 서열에 의해 상기 제1 서열의 전사가 유도되고, 상기 제2 프로모터 서열에 의해 상기 제2 서열의 전사가 유도되며, 상기 제3 프로모터 서열에 의해 상기 제3 서열의 전사가 유도된다. 이때, 상기 제2 프로모터 및 상기 제3 프로모터는 동일한 종류의 프로모터일 수 있다. 구체적으로, 상기 제2 프로모터 서열 및 상기 제3 프로모터 서열은 U6 프로모터 서열일 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 제2 프로모터 및 상기 제3 프로모터는 상이한 종류의 프로모터일 수 있다. 구체적으로, 상기 제2 프로모터는 U6 프로모터 서열, 상기 제3 프로모터는 H1 프로모터 서열일 수 있으나, 이에 제한되는 것은 아니다.
벡터 구성 - 종결 신호
상기 벡터는 상기 프로모터 서열과 작동 가능하게 연결된 종결 신호를 포함할 수 있다. 상기 벡터 서열이 상기 프로모터 서열을 포함하는 경우, RNA 전사 인자에 의해 상기 프로모터와 작동 가능하게 연결된 서열의 전사가 유도되는데, 이러한 RNA 전사 인자의 전사 종결을 유도하는 서열을 종결 신호라고 일컫는다. 상기 종결 신호는, 프로모터 서열의 종류에 따라 달라질 수 있다. 예를 들어, 상기 프로모터가 U6, 또는 H1 프로모터일 경우, 상기 프로모터는 티미딘 연속 서열(예를 들어, TTTTTT (T6) 서열)을 종결 신호로 인식한다.
일 구현예로, 상기 벡터 서열이 U6 프로모터 서열을 포함하는 경우, 상기 U6 프로모터 서열과 작동 가능하게 연결된, 티미딘 연속 서열이 종결 신호로 작용할 수 있다. 일 구현예로, 상기 티미딘 연속 서열은 5개 이상의 티미딘이 연속으로 연결된 서열일 수 있다. 일 구현예로, 상기 벡터 서열이 H1 프로모터 서열을 포함하는 경우, 상기 H1 프로모터 서열과 작동 가능하게 연결된, 티미딘 연속 서열이 종결 신호로 작용할 수 있다. 일 구현예로, 상기 티미딘 연속 서열은 5개 이상의 티미딘이 연속으로 연결된 서열일 수 있다.
벡터 구성 - 기타 구성
상기 벡터 서열은 상기 구성 외, 목적에 따라 필요한 구성요소를 포함할 수 있다.
일 구현예로, 상기 벡터 서열은 조절/제어 구성요소 서열, 및/또는 부가 구성 요소 서열을 포함할 수 있다. 일 구현예로, 상기 부가 구성 요소는 형질주입된 세포를 비형질주입 세포로부터 구별하기 위한 목적으로 부가된 것일 수 있다. 이때, 상기 조절/제어 구성요소 서열 및 부가 구성 요소는 프로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(IRES, Internal Ribosome Entry Site), 스플라이스 억셉터, 2A 서열 및/또는 복제원점(replication origin)을 포함할 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 복제원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점, 및/또는 BBV 복제원점일 수 있으나, 이에 제한되는 것은 아니다.
벡터 종류 - 바이러스 벡터
상기 벡터는 바이러스 벡터일 수 있다.
일 구현예로, 상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상일 수 있다. 일 구현예로, 상기 바이러스 벡터는 아데노-연관 바이러스일 수 있다.
벡터 종류 - 비바이러스 벡터
상기 벡터는 비바이러스 벡터일 수 있다. 일 구현예로, 상기 비바이러스 벡터는 플라스미드, 파지, 네이키드 DNA, DNA 복합체, 및 mRNA로 구성된 군에서 선택되는 1 이상일 수 있다. 일 구현예로, 상기 플라스미드는 pcDNA 시리즈, pS456, pG1806, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈, 및 pUC19으로 이뤄진 군에서 선택된 것일 수 있다. 일 구현예로, 상기 파지는 λgt4λB, λ-Charon, λΔz1, 및 M13으로 이뤄진 군에서 선택된 것일 수 있다. 일 구현예로, 상기 벡터는 PCR 앰플리콘(amplicon)일 수 있다.
벡터 형태 - 원형 또는 선형 벡터
상기 벡터는 원형 또는 선형 형태일 수 있다. 상기 벡터가 선형 벡터인 경우, 상기 선형 벡터 서열이 종결 신호를 따로 포함하지 않더라도, 그 3'말단에서 RNA 전사가 종결된다. 이와 비교하여, 상기 벡터가 원형 벡터인 경우, 상기 원형 벡터 서열이 종결 신호를 따로 포함하지 않는다면, RNA 전사가 종결되지 않게 된다. 따라서, 상기 벡터로 원형 벡터를 사용하는 경우, 의도한 대상을 발현하기 위해서는 각 프로모터 서열과 관련된 전사 인자에 대응하는 종결 신호가 포함되어야 한다.
일 구현예로, 상기 벡터는 선형 벡터일 수 있다. 일 구현예로, 상기 벡터는 선형의 앰플리콘일 수 있다. 일 구현예로, 상기 벡터는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 서열과 전사 활성 Cas12f1 융합 단백질을 암호화하는 서열을 포함하는 선형의 앰플리콘일 수 있다. 일 구현예로, 상기 벡터는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 서열과 전사 저해 Cas12f1 융합 단백질을 암호화하는 서열을 포함하는 선형의 앰플리콘일 수 있다.
일 구현예로, 상기 벡터는 원형 벡터일 수 있다. 일 구현예로, 상기 벡터는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 서열과 전사 활성 Cas12f1 융합 단백질을 암호화하는 서열을 포함하는 원형 벡터일 수 있다. 일 구현예로, 상기 벡터는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 서열과 전사 저해 Cas12f1 융합 단백질을 암호화하는 서열을 포함하는 원형 벡터일 수 있다.
벡터 - 서열 예시
일 구현예로, 상기 벡터의 서열은 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 서열과 전사 활성 Cas12f1 융합 단백질을 암호화하는 서열을 포함할 수 있다.
일 구현예로, 상기 벡터의 서열은 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이뤄진 군에서 선택된 서열과 전사 저해 Cas12f1 융합 단백질을 암호화하는 서열을 포함할 수 있다.
5. CRISPR 발현 조절 시스템의 각 구성요소를 포함하는 유전자 발현 조절용 조성물
본 명세서에서는, CRISPR 발현 조절 시스템의 각 구성요소를 포함하는 유전자 발현 조절용 조성물을 개시한다. 일 구현예로, 본 명세서에서는 다음을 포함하는 유전자 발현 조절용 조성물을 개시한다: Cas12f1 융합 단백질 또는 이를 암호화하는 핵산; 및 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산. 이때, 상기 Cas12f1 융합 단백질은 "2. 발현 조절 단백질 - Cas12f1 융합 단백질" 섹션에서 개시된 것일 수 있다. 이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 "3. 엔지니어링 된 Cas12f1 가이드 RNA" 섹션에 개시된 것일 수 있다.
상기 유전자 발현 조절용 조성물은 상기 CRISPR 발현 조절 시스템의 각 구성요소 외 유전자 발현 조절 용도에 필요한 적절한 물질을 추가로 포함할 수 있다.
6. 핵산의 화학적인 변형
본 명세서에서는 엔지니어링 된 crRNA 또는 이를 암호화하는 핵산, 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및/또는 CRISPR 발현 조절 시스템의 구성 요소를 발현시키기 위한 벡터 등 핵산을 포함하거나, 핵산으로 이뤄진 구성 요소를 제공한다. 이때, 상기 구성 요소에서 "핵산"이라 함은, 자연계에 존재하는 DNA, 또는 RNA일 수 있고, 상기 구성 핵산의 일부 또는 전부에 화학적 변형이 일어난, 변형된 핵산일 수 있다. 일 구현예로, 상기 구성 핵산은 자연계에 존재하는 DNA, 및/또는 RNA일 수 있다. 일 구현예로, 상기 구성 핵산은 하나 이상의 뉴클레오타이드가 화학적으로 변형된 것일 수 있다. 이때, 상기 화학적 변형은 당업자에게 알려진 핵산의 변형을 모두 포함한다. 구체적으로, 상기 화학적 변형은 (WO 2019/089820 A1)에 기재된 핵산의 변형을 모두 포함할 수 있으나, 이에 제한되는 것은 아니다.
7. CRISPR 발현 조절 시스템을 이용한 유전자 발현 조절 방법
유전자 발현 조절 방법 - 개괄
본 명세서에서는 CRISPR 발현 조절 시스템을 이용하여 대상 세포 내의 표적 유전자의 발현을 조절하는 방법을 제공한다. 상기 표적 유전자는 표적 서열을 포함한다. 상기 유전자 발현 조절 방법은, 엔지니어링 된 Cas12f1 가이드 RNA, 및 Cas12f1 융합 단백질, 또는 각각을 암호화하는 핵산을 표적 유전자를 포함하고 있는 대상 세포 내에 전달하는 것을 포함한다. 그 결과, 상기 대상 세포 내에 CRISPR activation 복합체 또는 CRISPR interference 복합체가 주입되거나, CRISPR activation 복합체 또는 CRISPR interference 복합체의 형성이 유도되며, 상기 CRISPR activation 복합체 또는 CRISPR interference 복합체에 의해 표적 유전자의 발현이 조절된다. 상기 엔지니어링 된 Cas12f1 가이드 RNA는 "3. 엔지니어링 된 Cas12f1 가이드 RNA" 섹션에서 설명된 것과 동일한 특징 및 구조를 가진다. 상기 Cas12f1 융합 단백질은 "2. 발현 조절 단백질 - Cas12f1 융합 단백질" 섹션에서 설명된 것과 동일한 특징 및 구성을 가진다. 상기 CRISPR activation 복합체 및 CRISPR interference 복합체는 "4. 상기 CRISPR activation 복합체 및 CRISPR interference 복합체" 섹션에서 설명된 것과 동일한 특징 및 구성을 가진다.
일 구현예로, 표적 유전자의 발현을 촉진하기 위해, 상기 유전자 발현 조절 방법은 전사 활성 Cas12f1 융합 단백질 또는 이를 암호화하는 핵산, 및 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 대상 세포 내로 전달하는 것을 포함할 수 있다.
이때, 상기 전사 활성 Cas12f1 융합 단백질은 dCas12f1 단백질 및 전사 활성 단백질을 포함한다.
이때, 상기 dCas12f1 단백질은 전술한 "1) 변형된 Cas12f1 단백질" 섹션 중 어느 하나에서 서술된 것과 동일한 특징 및 구조를 가진다. 일 예로, 상기 dCas12f1 단백질은 서열번호 261, 262, 264, 265, 266, 267, 268, 269 및 271으로 이뤄진 군에서 선택된 서열로 표현될 수 있다. 상기 전사 활성 단백질은 전술한 "2) 발현 조절 도메인" 섹션 중 어느 하나에서 서술된 것과 동일한 특징 및 구조를 가진다. 일 예로, 상기 전사 활성 단백질은 VP64일 수 있다.
이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail을 포함한다.
이때, 상기 엔지니어링 된 스캐폴드 영역은 전술한 "엔지니어링 된 스캐폴드 영역" 단락 중 어느 하나에서 서술된 것과 동일한 특징 및 구조를 가진다. 일 예로, 상기 엔지니어링 된 스캐폴드 영역은 서열번호 168 내지 187으로 이뤄진 군에서 선택된 서열로 표현될 수 있다. 또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역은 서열번호 188 내지 199으로 이뤄진 군에서 선택된 서열로 표현될 수 있다. 또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역은 서열번호 200 내지 206으로 이뤄진 군에서 선택된 서열로 표현될 수 있다. 또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역은 서열번호 207 내지 210으로 이뤄진 군에서 선택된 서열로 표현될 수 있다.
이때, 상기 스페이서 서열은 상기 대상 세포 내에 포함된 표적 유전자에 존재하는 표적 서열과 상보적으로 결합할 수 있다.
이때, 상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상일 수 있다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUAUUUU-3'일 수 있다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUGUUUU-3'일 수 있다.
일 구현예로, 표적 유전자의 발현을 저해 또는 억제하기 위해, 상기 유전자 발현 조절 방법은 전사 저해 Cas12f1 융합 단백질 또는 이를 암호화하는 핵산, 및 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 대상 세포 내로 전달하는 것을 포함할 수 있다.
이때, 상기 전사 저해 Cas12f1 융합 단백질은 dCas12f1 단백질 및 전사 저해 단백질을 포함한다.
이때, 상기 dCas12f1 단백질은 전술한 "1) 변형된 Cas12f1 단백질" 섹션 중 어느 하나에서 서술된 것과 동일한 특징 및 구조를 가진다. 일 예로, 상기 dCas12f1 단백질은 서열번호 261, 262, 264, 265, 266, 267, 268, 269 및 271으로 이뤄진 군에서 선택된 서열로 표현될 수 있다. 상기 전사 저해 단백질은 전술한 "2) 발현 조절 도메인" 섹션 중 어느 하나에서 서술된 것과 동일한 특징 및 구조를 가진다. 일 예로, 상기 전사 저해 단백질은 KRAB, MeCP2, DNMT3 및/또는 HDAC3일 수 있다.
이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail을 포함한다.
이때, 상기 엔지니어링 된 스캐폴드 영역은 전술한 "엔지니어링 된 스캐폴드 영역" 단락 중 어느 하나에서 서술된 것과 동일한 특징 및 구조를 가진다. 일 예로, 상기 엔지니어링 된 스캐폴드 영역은 서열번호 168 내지 187으로 이뤄진 군에서 선택된 서열로 표현될 수 있다. 또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역은 서열번호 188 내지 199으로 이뤄진 군에서 선택된 서열로 표현될 수 있다. 또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역은 서열번호 200 내지 206으로 이뤄진 군에서 선택된 서열로 표현될 수 있다. 또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역은 서열번호 207 내지 210으로 이뤄진 군에서 선택된 서열로 표현될 수 있다.
이때, 상기 스페이서 서열은 상기 대상 세포 내에 포함된 표적 유전자에 존재하는 표적 서열과 상보적으로 결합할 수 있다.
이때, 상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상일 수 있다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUAUUUU-3'일 수 있다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUGUUUU-3'일 수 있다.
대상 세포
일 구현예로, 상기 대상 세포는 원핵 세포일 수 있다. 일 구현예로, 상기 대상 세포는 진핵 세포일 수 있다. 구체적으로, 상기 진핵 세포는 식물 세포, 동물 세포, 및/또는 인간 세포일 수 있으나, 이에 제한되지 않는다.
표적 서열 결정
CRISPR activation 복합체 또는 CRISPR interference 복합체로 발현을 조절하고자 하는 표적 유전자는 유전자 발현 조절의 목적, 대상 세포 환경, Cas12f1 융합 단백질이 인식하는 PAM 서열, 및/또는 기타 변수를 고려하여 결정할 수 있다. 이때, 표적 유전자 내에 존재하는 적절한 길이의 표적 서열을 결정할 수 있다면, 그 방법은 특별히 제한되지 않으며, 공지된 기술을 활용할 수 있다.
표적 서열에 따른 스페이서 서열 결정
상기 표적 서열이 결정되고 나면, 이에 대응하는 스페이서 서열을 설계한다. 상기 스페이서 서열은 상기 표적 서열과 상보적으로 결합할 수 있는 서열로 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 유전자와 상보적으로 결합할 수 있는 서열로 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 핵산과 상보적으로 결합할 수 있도록 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 핵산의 표적 가닥 서열에 포함된 표적 서열과 상보적인 서열로 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 핵산의 비표적 가닥 서열에 포함된 프로토스페이서의 DNA 서열에 상응하는 RNA 서열로 설계된다. 구체적으로, 상기 스페이서 서열은, 상기 프로토스페이서 서열과 동일한 염기 서열을 가지되, 상기 염기 서열에 포함된 티미딘 각각이 모두 유리딘으로 치환된 서열로 설계된다.
표적 서열과 스페이서 서열의 상보성
일 구현예로, 상기 스페이서 서열은 상기 표적 서열과 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 상보적인 서열일 수 있다. 일 구현예로, 상기 스페이서 서열은 상기 표적 서열과 바로 이전 문장에서 선택된 수치 범위 내 상보적인 서열일 수 있다. 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 60% 내지 90% 상보적인 서열일 수 있다. 또 다른 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 90% 내지 100% 상보적인 서열일 수 있다.
표적 서열과 스페이서 서열 간 미스매치 개수
일 구현예로, 상기 스페이서 서열은 상기 표적 서열과 0개, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 미스매치를 가지는 상보적인 서열일 수 있다. 일 구현예로, 상기 스페이서 서열은 바로 이전 문장에서 선택된 수치 범위 내의 미스매치를 가질 수 있다. 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 1개 내지 5개의 미스매치를 가질 수 있다. 또 다른 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 6개 내지 10개의 미스매치를 기질 수 있다.
CRISPR activation 복합체 또는 CRISPR interference 복합체 이용
본 명세서에서 제공하는 유전자 발현 조절 방법은 CRISPR activation 복합체 또는 CRISPR interference 복합체가 표적 특이적으로 유전자의 전사를 조절하는 활성을 가지는 점을 이용한다. 상기 CRISPR activation 복합체 및 CRISPR interference 복합체는 "4. CRISPR activation 복합체 및 CRISPR interference 복합체" 섹션에서 설명된 CRISPR activation 복합체 및 CRISPR interference 복합체와 동일한 특징 및 구성을 가진다.
CRISPR activation 복합체 또는 CRISPR interference 복합체 각 구성 요소의 세포 내 전달
본 명세서에서 제공하는 유전자 발현 조절 방법은 대상 세포 내에서 CRISPR activation 복합체 또는 CRISPR interference 복합체가 표적 유전자와 접촉하는 것을 전제로 한다. 따라서, 상기 CRISPR activation 복합체 또는 CRISPR interference 복합체가 상기 표적 유전자와 접촉하는 것을 유도하기 위해, 상기 유전자 발현 조절 방법은 상기 CRISPR activation 복합체 또는 CRISPR interference 복합체의 각 구성요소를 대상 세포 내에 전달하는 것을 포함한다. 일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질) 또는 이를 암호화하는 핵산을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)을 암호화하는 핵산을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)을 암호화하는 핵산을 대상 세포 내에 전달하는 것을 포함할 수 있다. 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질) 또는 이를 암호화하는 핵산은 다양한 전달 형태로, 다양한 전달 방법을 이용하여 대상 세포 내에 전달될 수 있다.
전달 형태 - RNP
상기 전달 형태로, 엔지니어링 된 Cas12f1 가이드 RNA 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)이 결합한 리보뉴클레오프로틴(Ribonucleoprotein, RNP)를 이용할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)이 결합한 CRISPR activation 복합체 또는 CRISPR interference 복합체를 대상 세포 내에 주입하는 것을 포함할 수 있다.
전달 형태 - 비바이러스 벡터
또 다른 전달 형태로, 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)을 암호화하는 핵산 서열을 포함하는 비바이러스 벡터를 이용할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)을 암호화하는 핵산 서열을 포함하는 비바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 비바이러스 벡터는 플라스미드, 네이키드 DNA, DNA 복합체, 또는 mRNA일 수 있으나, 이에 제한되는 것은 아니다. 또 다른 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제1 비바이러스 벡터, 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)을 암호화하는 핵산 서열을 포함하는 제2 비바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 제1 비바이러스 벡터 및 상기 제2 비바이러스 벡터는 각각 플라스미드, 네이키드 DNA, DNA 복합체, 및 mRNA로 이뤄진 군에서 선택된 하나일 수 있으나, 이에 제한되는 것은 아니다.
전달 형태 - 바이러스 벡터
또 다른 전달 형태로, 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)을 암호화하는 핵산 서열을 포함하는 바이러스 벡터를 이용할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)을 암호화하는 핵산 서열을 포함하는 바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택된 하나일 수 있으나, 이에 제한되는 것은 아니다. 일 구현예로, 상기 바이러스 벡터는 아데노-연관 바이러스일 수 있다.
또 다른 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제1 바이러스 벡터, 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)을 암호화하는 핵산 서열을 포함하는 제2 바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 제1 바이러스 벡터 및 제2 바이러스 벡터는 각각 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택된 하나일 수 있으나, 이에 제한되는 것은 아니다.
전달 방법 - 일반적인 전달 수단
상기 전달 방법은, 세포 내로 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질) 또는 이를 암호화하는 핵산을 적절한 전달 형태로 세포 내로 전달할 수 있는 것이라면 특별히 제한되지 않는다. 일 구현예로, 상기 전달 방법은 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 및/또는 일시적인 세포 압축 또는 스퀴징일 수 있다.
전달 방법 - 나노파티클
상기 전달 방법은, 상기 CRISPR 발현 조절 시스템에 포함된 적어도 하나의 구성요소를 나노파티클을 이용하여 전달하는 것일 수 있다. 이때, 상기 전달 방법은 당업계 통상의 기술자가 적절히 선택할 수 있는 공지된 방법일 수 있다. 예를 들어, 상기 나노파티클 전달 방법은 (WO 2019/089820 A1)에 개시된 방법일 수 있으나, 이에 제한되는 것은 아니다.
일 구현예로, 상기 전달 방법은 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질) 또는 이를 암호화하는 핵산 및/또는 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 나노파티클을 이용하여 전달하는 것일 수 있다. 일 구현예로, 상기 전달 방법은 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질) 또는 이를 암호화하는 핵산, 제1 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및/또는 제2 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 나노파티클을 이용하여 전달하는 것일 수 있다. 이때, 상기 전달 방법은 양이온성 리포좀법, 초산 리튬-DMSO, 지질-매개 형질감염(transfection), 인산칼슘 침전법(precipitation), lipofection, PEI(Polyethyleneimine)-매개 형질감염, DEAE-dextran 매개 형질감염, 및/또는 나노파티클-매개 핵산 전달(Panyam et., al Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조)일 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 CRISPR/Cas12f1 시스템의 구성 요소는 RNP, 비바이러스 벡터, 및/또는 바이러스 벡터 형태일 수 있다. 예를 들어, 상기 CRISPR 발현 조절 시스템의 구성 요소는 각 구성요소를 암호화하는 mRNA 형태일 수 있으나, 이에 제한되는 것은 아니다.
전달 형태 및 방법 - 조합 가능
상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질) 또는 이를 암호화하는 핵산을 세포 내 전달하는 것을 포함하는데, 이때 상기 구성의 전달 형태 및/또는 전달 방법은 서로 동일하거나 상이할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산은 제1 전달 형태로 전달하고, Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질) 또는 이를 암호화하는 핵산은 제2 전달 형태로 전달하는 것을 포함할 수 있다. 이때, 상기 제1 전달 형태 및 상기 제2 전달 형태는 각각 전술한 전달 형태 중 어느 하나일 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산은 제1 전달 방법으로 전달하고, Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질) 또는 이를 암호화하는 핵산은 제2 전달 방법으로 전달하는 것을 포함할 수 있다. 이때, 상기 제1 전달 방법 및 상기 제2 전달 방법은 각각 전술한 전달 방법 중 어느 하나일 수 있다.
전달 순서
상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질) 또는 이를 암호화하는 핵산을 세포 내 전달하는 것을 포함하는데, 이때 상기 구성이 세포 내에 동시에 전달될 수 있지만, 시간차를 두고 순차적으로 전달될 수 있다.
일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질) 또는 이를 암호화하는 핵산을 동시에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 세포 내로 전달한 후, 시간 차를 두고 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질) 또는 이를 암호화하는 핵산을 세포 내로 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질) 또는 이를 암호화하는 핵산을 세포 내로 전달한 후, 시간 차를 두고 엔지니어링 된 Cas12f1 가이드 RNA를 세포 내로 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)을 암호화하는 핵산을 세포 내로 전달한 후, 시간 차를 두고 엔지니어링 된 Cas12f1 가이드 RNA를 세포 내로 전달하는 것을 포함할 수 있다.
CRISPR activation 복합체 또는 CRISPR interference 복합체가 표적 핵산과 접촉
본 명세서에서 제공하는 유전자 발현 조절 방법에서, 표적 유전자의 발현 조절은 대상 세포 내에서 CRISPR activation 복합체 또는 CRISPR interference 복합체가 표적 유전자와 접촉하면서 이뤄진다. 따라서, 상기 유전자 발현 조절 방법은 CRISPR activation 복합체 또는 CRISPR interference 복합체가 대상 세포 내에서 접촉하도록 하거나, 접촉을 유도하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 CRISPR activation 복합체 또는 CRISPR interference 복합체가 대상 세포 내에서 표적 유전자와 접촉하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 CRISPR activation 복합체 또는 CRISPR interference 복합체가 대상 세포 내에서 표적 유전자와 접촉하도록 유도하는 것을 포함할 수 있다. 이때, 상기 유도는 상기 CRISPR activation 복합체 또는 CRISPR interference 복합체가 세포 내에서 표적 유전자와 접촉하도록 하는 방법이라면 특별히 제한되지 않는다. 일 구현예로, 상기 유도는 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질) 또는 이를 암호화하는 핵산을 세포 내에 전달하는 것일 수 있다.
유전자 발현 조절 결과
본 명세서에서 제공하는 유전자 발현 조절 방법의 수행 결과로, 표적 유전자의 발현이 촉진(또는 증가) 또는 억제(또는 저해)될 수 있다. 이때, 상기 발현은 표적 유전자의 mRNA로의 전사를 의미할 수 있다. 일반적으로, 표적 유전자의 발현이 촉진(또는 증가)되면, 해당 유전자의 mRNA의 발현양이 증가하고 해당 유전자에 의해 암호화된 단백질의 생산이 증가된다. 또한, 표적 유전자의 발현이 억제(또는 저해)되면, 해당 유전자의 mRNA의 발현양이 감소하고 해당 유전자에 의해 암호화된 단백질의 생산이 감소된다. 일 구현예로, 상기 유전자 발현 조절 방법의 수행 결과, 표적 유전자에 의해 암호화된 단백질의 생산이 증가 또는 감소될 수 있다.
유전자 발현 조절 방법 예시
일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)이 결합한 리보뉴클레오프로틴 형태의 CRISPR activation 복합체 또는 CRISPR interference 복합체를 진핵 세포 내에 전달하는 것을 포함할 수 있다. 이때, 상기 전달은 전기천공법, 또는 lipofection을 이용한 것일 수 있다.
일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)을 암호화하는 핵산을 진핵 세포 내에 전달하는 것을 포함할 수 있다. 이때, 상기 전달은 전기천공법, 또는 lipofection을 이용한 것일 수 있다.
일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열 및 Cas12f1 융합 단백질(전사 활성 Cas12f1 융합 단백질 또는 전사 저해 Cas12f1 융합 단백질)을 암호화하는 핵산 서열을 포함하는 아데노-연관 바이러스(AAV) 벡터를 진핵세포 내에 전달하는 것을 포함할 수 있다.
실험예
이하, 실험예 및 실시예를 통해 본 명세서가 제공하는 발명에 대해 더욱 상세히 설명한다. 이들 실시예는 오로지 본 명세서에 의해 개시되는 내용을 예시하기 위한 것으로, 본 명세서에 의해 개시되는 내용의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
1. 엔지니어링 된 Cas12f1 가이드 RNA의 효과
실험예 1. 실험 재료 준비
실험예 1.1 플라스미드 벡터 설계 및 제조
인간 세포에서 발현하기 위해, Cas12f1 유전자를 코돈-최적화 시켰으며(서열번호 270), 상기 최적화된 서열이 벡터 제조를 위해 합성되었다. 최종적으로 Cas12f1 단백질을 암호화하는 서열에는 chicken β-actin 프로모터, 5'- 및 3'-말단의 핵 위치 신호 서열(nuclear localization signal sequence), 자가 절단 T2A 펩타이드로 연결된 eGFP를 인코딩하는 서열이 부가되었다. 상기 Cas12f1 단백질의 아미노산 서열 및 이를 암호화하는 DNA 서열을 [표01]에 나타냈다.
[표01]
(엔지니어링 된) Cas12f1 가이드 RNA를 암호화하는 주형 DNA가 합성되었고, pTwist Amp plasmid vector (Twist Bioscience)에 클로닝되었다. 필요한 경우, 상기 벡터는 U6-상보적 forward primer 및 protospacer-상보적 reverse primer를 사용하여, 상기 가이드 RNA 암호화 서열의 증폭을 위한 주형으로 사용되었다. Gibson assembly를 사용하여, 상기 코돈-최적화 된 Cas12f1 유전자를 포함하는 벡터에 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 올리고뉴클레오타이드를 클로닝함으로써, 엔지니어링 된 CRISPR/Cas12f1 시스템에 대한 벡터를 제조하였다.
실험예 1.2 Cas12f1 가이드 RNA 엔지니어링
엔지니어링 된 Cas12f1 가이드 RNA 3'말단에 대한 U-rich tail 연결은, 서열-변형된 primer 및 Cas12f1 가이드 RNA 플라스미드 벡터의 존재 하, Pfu PCR Master Mix5 (Biofact)를 사용하여 수행되었다. 상기 PCR 앰플리콘은 HiGeneTM Gel&PCR Purification System (Biofact)을 사용하여 정제되었다. 상기 엔지니어링 된 Cas12f1 가이드 RNA의 엔지니어링 된 스캐폴드 영역 중 제2 영역, 제4 영역 및 제5 영역의 변형은 ApoI 및 BamHI 제한 효소를 사용하여 선형화된 가이드 RNA-암호화 벡터에 변형된 서열 (Macrogen)을 전달하는 합성 올리고뉴클레오타이드를 클로닝하여 수행되었다. 상기 엔지니어링 된 Cas12f1 가이드 RNA의 엔지니어링 된 스캐폴드 영역 중 제1 영역의 변형은, tracrRNA의 5'말단 부분을 표적으로 하는 forward primer 및 U6 프로모터 영역을 표적으로 하는 reverse primer를 사용하여 캐노니컬(canonical), 또는 엔지니어링 된 주형 플라스미드 벡터의 PCR 증폭에 의해 수행되었다. 상기 PCR 증폭은 Q5 Hot Start high-fidelity DNA polymerase (NEB)에 의해 수행되었으며, PCR 산물은 KLD Enzyme Mix (NEB)를 사용하여 결찰되었다(ligated). 상기 결찰된(ligated) PCR 산물은 DH5α E.coli 세포로 형질도입(transformed)되었다. Sanger 시퀀싱 분석에 의해 Mutagenesis가 확인되었다. 변형된 플라스미드 벡터는 NucleoBond ® Xtra Midi EF kit (MN)를 사용하여 정제되었다. 정제된 플라스미드 1 마이크로그램이 T7 RNA polymerase (NEB) 및 NTPs (Jena Bioscience)를 사용한 mRNA 합성의 주형으로 사용되었다. 상기 제조된 엔지니어링 된 Cas12f1 가이드 RNA를 Monarch® RNA cleanup kit (NEB)를 사용하여 정제하고, 극저온 바이알(cryogenic vials)에 분취하여 액체 질소에 보관하였다.
실험예 1.3 세포 배양 및 형질도입(transfection)
HEK293 T 세포(LentX-293T, Takara)가 10%의 열-불활성화 된 fetal bovine serum (FBS) 혈청(Corning) 및 페니실린/스트렙토마이신이 보충된 Dulbecco's Modified Eagle Medium (DMEM) 배지에서, 5% CO2 조건 하 배양되었다. 세포 형질주입은 전기천공법(electroporation) 또는 lipofection으로 수행되었다. 전기천공법의 경우, 실험예1.2에서 제조된 Cas12f1 단백질을 암호화하는 플라스미드 벡터및 가이드 RNA(및 엔지니어링 된 가이드 RNA)를 암호화하는 DNA 각 2-5 μg를 Neon transfection system (Invitrogen)을 사용해 4X105 HEK-293 T세포에 형질주입(transfection) 하였다. 상기 전기천공법은 1300V, 10 mA, 3 pulse 조건 하 수행하였다. lipofection을 위해, 6-15 μL FuGene 시약을 (Promega) 2-5 μg의 Cas12f1 단백질을 암호화하는 플라스미드 벡터 및 1.5-5 μg의 PCR 앰플리콘과 15분동안 혼합하였다. 상기 혼합물(300 μL)이 형질주입 1일 전에 1X106개의 세포가 플레이팅 된 1.5 ml DMEM 배지에 첨가되었다. 상기 세포들을 상기 혼합물의 존재 하 1 내지 10일 간 배양시켰다. 배양 후, 상기 세포들이 수집되었고, 상기 세포의 게놈 DNA가 PureHelixTM genomic DNA preparation kit (NanoHelix)를 사용하거나, Maxwell RSC Cultured cells DNA Kit (Promega)를 사용하여 수작업으로 분리되었다.
실험예 1.4 세포 내 인델 효율 측정
HEK-293 T세포로부터 분리된 게놈 DNA 중, 프로토스페이서를 포함하는 영역을 표적-특이적 프라이머를 사용하여 KAPA HiFi HotStart DNA polymerase (Roche)의 존재 하 PCR을 수행하였다. 상기 증폭 방법은 제조사의 지시를 따랐다. Illumina TruSeq HT dual indexes를 포함하는 상기 증폭의 결과물인 PCR 앰플리콘을 Illumina iSeq 100를 사용하여 150-bp 페어 엔드 시퀀싱을 수행하였다. 인델 빈도는 MAUND를 사용하여 계산되었다. 상기 MAUND는 https://github.com/ibscge/maund 에서 제공된다.
실험예 1.5 Quantitave real-time PCR
HEK293 T세포에 RNeasy Miniprep kit (Qiagen) 또는 Maxwell RSC miRNA Tissue Kit (Promega)또는 DNeasy Blood & Tissue Kit(Qiagen)를 사용하여 가이드 RNA(또는 엔지니어링 된 가이드 RNA) 또는 게놈 DNA를 각각 추출하였다. 가이드 RNA를 정량화하기 위해서, RNA특이적 프라이머를 ligation 하고, crRNA-특이적 프라이머를 사용해 cDNA를 합성하였다. 상기 cDNA는 주형으로써 정량적 real-time PCR에 사용되었다. real-time PCR은 KAFA SYBR FAST qPCR Master Mix(2X) Kit (KAPAbiosystems)를 사용하여 분석되었다.
실험예 1.6 통계 분석
각 실험예 별 실험은 3번씩 수행하였으며, 각 값의 평균값을 분석에 사용하였다.
실험예 2. 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율 비교 1
엔지니어링 된 Cas12f1 가이드 RNA를 사용한 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율을 측정하기 위해, 실험예 1.1 내지 1.2에 의해 각 실시예를 제조하였다. 실험에 사용한 표적 서열은 다음 [표02]에 나타냈다.
[표02]
각 실시예 별 엔지니어링 된 Cas12f1 가이드 RNA의 서열은 다음 [표03] 내지 [표08]에 나타냈다.
[표03]
[표04]
[표05]
[표06]
[표07]
[표08]
이때, 각 표적 서열 별로,
1)
Comparative Example 1.n.1은 자연계에서 발견되는 Cas12f1 tracrRNA 및 자연계에서 발견되는 Cas12f1 crRNA를 5'-GAAA-3'로 연결시킨 싱글 가이드 RNA(서열번호 8),
2)
Comparative Example 1.n.2는 자연계에서 발견되는 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 싱글 가이드 RNA(서열번호 9),
3)
Example 1.n.1 내지 1.n.3은 변형된 제1 영역을 가지는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 엔지니어링 된 Cas12f1 가이드 RNA,
4)
Example 1.n.4 내지 1.n.6는 변형된 제2 영역을 가지는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 엔지니어링 된 Cas12f1 가이드 RNA,
5)
Example 1.n.7 내지 1.n.9는 변형된 제4 영역 및 제5 영역을 가지는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 엔지니어링 된 Cas12f1 가이드 RNA,
6)
Example 1.n.10은 변형된 제1 영역 및 제2 영역을 가지는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 엔지니어링 된 Cas12f1 가이드 RNA,
7)
Example 1.n.11은 변형된 제1 영역 및 제4 영역 및 제5 영역을 가지는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 엔지니어링 된 Cas12f1 가이드 RNA,
8)
Example 1.n.12는 변형된 제2 영역 및 제4 영역 및 제5 영역을 가지는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 엔지니어링 된 Cas12f1 가이드 RNA,
9)
Example 1.n.13은 변형된 제1 영역, 제2 영역, 및 제4 영역 및 제5 영역을 가지는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 엔지니어링 된 Cas12f1 가이드 RNA를 나타낸다.
이때, n은 표적 서열 별로, 1, 2, 또는 3이며, n이 1인 경우 Target 1(DY2), n이 2인 경우, Target 2(DY10), n이 3인 경우, Target3(Intergenic-22 )를 나타낸다.
상기 실시예 별 제조된 벡터를 실험예 1.3에 의해 HEK293 T세포에 형질도입(transfection)하고, 실험예 1.4 내지 1.5에 의해 인델 발생 효율을 측정하였다. 이를 실험예 1.6에 의해 분석한 결과가 도 2 내지 도 13에 나타나있다.
실험예 3. 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율 비교 2
실험예 3.1 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율 비교 2-1
엔지니어링 된 Cas12f1 가이드 RNA를 사용한 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율을 측정하기 위해, 실험예 1.1 내지 1.2에 의해 각 실시예를 제조하였다. 실험에 사용한 표적 서열은 다음 [표09]에 나타냈다.
[표09]
각 실시예 별 엔지니어링 된 Cas12f1 가이드 RNA의 서열은 다음 [표10] 내지 [표13]에 나타냈다.
[표10]
[표11]
[표12]
[표13]
상기 실시예 별 제조된 벡터를 실험예 1.3에 의해 HEK293 T세포에 형질도입(transfection)하고, 실험예 1.4 내지 1.5에 의해 인델 발생 효율을 측정하였다. 이를 실험예 1.6에 의해 분석한 결과가 도 16 내지 도 19에 나타나있다.
실험예 3.2 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율 비교 2-2
엔지니어링 된 Cas12f1 가이드 RNA를 사용한 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율을 측정하기 위해, 실험예 1.1 내지 1.2에 의해 각 실시예를 제조하였다. 실험에 사용한 표적 서열은 [표09]에 나타낸 바와 같다.
각 실시예 별 엔지니어링 된 Cas12f1 가이드 RNA의 서열은 다음 [표14] 내지 [표17]에 나타냈다.
[표14]
[표15]
[표16]
[표17]
상기 실시예 별 제조된 벡터를 실험예 1.3에 의해 HEK293 T세포에 형질도입(transfection)하고, 실험예 1.4 내지 1.5에 의해 인델 발생 효율을 측정하였다. 이를 실험예 1.6에 의해 분석한 결과가 도 20 내지 도 23에 나타나있다.
실험예 3.3 실험 결과
상기 실험 결과를 동일 표적에 대한 이전 실험 데이터와 비교해 보면(도 14 및 도 15 참조), 자연계에서 발견되는 tracrRNA 및 crRNA를 링커로 연결한 Cas12f1 싱글 가이드 RNA보다 실험예 3.1, 실험예 3.2의 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는, 엔지니어링 된 CRISPR/Cas12f1 시스템의 유전자 편집 효율이 더 높은 것을 알 수 있다. 이러한 결과에 따라, 실험예 3.2, 실험예 3.3의 실시예에 나타난 가이드 RNA의 변형이 유전자 편집 효율을 향상시키는 것을 유추할 수 있다. 또한, 실험예 2 및 실험예 3에서 얻어진 실험 결과를 참조하면, 변형된 제1 영역, 및/또는 변형된 제2 영역을 포함하는 엔지니어링된 Cas12f1 가이드 RNA를 포함하는, 엔지니어링 된 CRISPR/Cas12f1 시스템이, 자연계에서 발견되는 CRISPR/Cas12f1 시스템, 및 자연계에서 발견되는 tracrRNA 및 crRNA를 링커로 연결한 Cas12f1 싱글 가이드 RNA를 포함하는 CRISPR/Cas12f1 시스템보다 유전자 편집 효율이 더 높을 것이라 유추할 수 있다.
실험예 4. 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율 비교 4
실험예 4.1 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율 비교 4-1
엔지니어링 된 Cas12f1 가이드 RNA를 사용한 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율을 측정하기 위해, 실험예 1.1 내지 1.2에 의해 각 실시예를 제조하였다. 실험에 사용한 표적 서열은 다음 [표18]에 나타냈다.
[표18]
각 실시예 별 엔지니어링 된 Cas12f1 가이드 RNA의 서열은 다음 [표19]에 나타냈다.
[표19]
상기 실시예 별 제조된 벡터를 실험예 1.3에 의해 HEK293 T세포에 형질도입(transfection)하고, 실험예 1.4 내지 1.5에 의해 인델 발생 효율을 측정하였다. 이를 실험예 1.6에 의해 분석한 결과가 도 24 내지 도 26에 나타나있다.
실험예 4.2 실험 결과
상기 실험 결과, 변형된 제3 영역을 가지는 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는, 엔지니어링 된 CRISPR/Cas12f1 시스템의 유전자 편집 효율이 자연계에서 발견되는 스캐폴드를 가지는 CRISPR/Cas12f1 시스템, 및 자연계에서 발견되는 tracrRNA 및 crRNA를 링커로 연결한 Cas12f1 싱글 가이드 RNA를 포함하는 CRISPR/Cas12f1 시스템보다 유전자 편집 효율이 더 높을 것이라 유추할 수 있다.
실험예 5. Large scale validation
상기 실험예 2 내지 실험예 4는 몇 개의 내인성 표적에 대해서만 인델 효율을 측정한 결과이다. 상기 결과를 보충하기 위해, 더 광범위한 표적에 대해 유전자 편집이 가능한 지 여부를 실험하였다.
1) in silico로, 5'-TTTR-N20-NGG-3' 서열을 가지는 내인성 타겟을 검색하여, 88개의 표적을 무작위로 선택하였다 (표20 내지 표22). 이는, Cas9, Cas12a, 및 Cas12f1 모두로 편집이 가능한 서열이므로, 각 CRISPR/Cas 시스템의 유전자 편집 효율을 비교할 수 있는 표적이다.
[표20]
[표21]
[표22]
2) CRISPR/SpCas9 시스템, CRISPR/AsCas12a 시스템, 자연계에서 발견되는 CRISPR/Cas12f1 시스템 또는 엔지니어링 된 CRISPR/Cas12f1 시스템의 각 구성을 HEK293-T 세포에 형질 감염(transfection) 시켰다. 이때, 엔지니어링 된 CRISPR/Cas12f1 시스템에 사용된 엔지니어링 된 Cas12f1 가이드 RNA는 다음 [표23]에 정리되어 있다.
[표23]
이때, 상기 서열 중 5'-(N)20-3' 부분은 스페이서 서열로, 상기 [표20] 내지 [표22]에 나타난 프로토스페이서 서열에 대응되는 스페이서 서열로 각각 설계되었다.
3) 형질 감염 후, 상기 88개의 표적에 대한 유전자 편집 효율은 도 27 및 표24에 나타내었다.
[표24]
실험 결과, 본 명세서에서 개시하고 있는 엔지니어링 된 CRISPR/Cas12f1 시스템은 1) 자연계에서 발견되는 CRISPR/Cas12f1 시스템에 비해 유전자 편집 효율이 월등히 높으며, 2) 진핵 세포 내 임의의 표적에 대해 CRISPR/SpCas9 시스템 및 CRISPR/AsCas12a 시스템과 견줄 수 있는 유전자 편집 효율을 보이고, 3) 일부 표적에 대해서는 타 CRISPR/Cas 시스템보다 더 높은 유전자 편집 효율을 보일 수 있음을 알 수 있었다.
실험예 6. in vitro cleavage assay
본 명세서에서 개시하고 있는 엔지니어링 된 CRISPR/Cas12f1 시스템의 유전자 절단 양상을 보충적으로 관찰하기 위하여, in vitro cleavage assay를 진행하였다. 실험예 6에서 사용한 표적 protospacer 서열은 5'-TTTAAGAACACATACCCCTGGGCC-3'(서열번호 341, 이하 Intergenic-22)로, 상기 표적의 PAM 서열은 5'-TTTA-3'이다.
실험예 6에서 사용한 (엔지니어링 된) Cas12f1 가이드 RNA는 다음 [표25]에 나타나있다.
[표25]
실험 방법은 다음과 같다.
1) Recombinant Cas14 (2.5 μg)와 Canonical, MS2/MS3/MS4, 및 MS2/MS3/MS4/MS5 의 sgRNA를 각각 2μg을 인큐베이션하여 RNA complex를 형성시켰다.
2) 이를 표적 서열(Intergenic-22)을 포함하고 있는 플라스미드 벡터 (5 μg)와 37에서 3 시간 동안 반응시켜 In vitro cleavage assay를 진행하였다.
3) Positive control로써 Apa1 restriction enzyme cut을 진행하였다.
4) Cleavage가 된 DNA를 Ultrasonicator인 Covaris (M220)를 가지고 다음의 조건에서 DNA shearing을 진행하였다.
Peak incident power: 50W, Duty factor: 20%, Cycles per Burst: 200 cpb, Treatment time: 110 sec.
5) 조각난 DNA를 DNA purification kit를 이용하여 정제하였다.
6) 정제된 DNA를 T4 ligase를 이용하여 End-filling을 수행하였다.
7) 그 후 NEBNext® Ultra?? II DNA Library Prep Kit for Illumina® (NEB, # E7103) kit와 NEBNext® Multiplex Oligos for Illumina® (Dual Index Primers Set 1) (NEB, # E7600) kit를 이용하여 DNA library를 제작하였다.
8) qPCR을 수행하여 각 샘플의 농도를 동일하게 조절하였다.
9) 제작된 library를 Illumina iSeq 100을 사용하여 150-bp paired-end sequencing 하였다.
10) 분석된 서열은 IGV 프로그램으로 alignment하였다.
상기 실험 결과를 도 28에 도시하였다.
실험 결과, 본 명세서에서 개시하는 엔지니어링 된 가이드 RNA를 포함하는, 엔지니어링 된 CRISPR/Cas12f1 시스템은 자연계에서 발견되는 CRISPR/Cas12f1 시스템과 비교하여 비표적 가닥(Non-target strand, NTS)에 대한 절단 활성이 더 높은 것으로 나타났다. 상기 결과는 본 명세서에서 개시하는 엔지니어링 된 CRISPR/Cas12f1 시스템의 향상된 유전자 편집 활성에 영향을 미치는 요인으로 판단된다.
2. 엔지니어링 된 Cas12f1 가이드 RNA를 이용한 CRISPR 발현 조절 시스템의 효과
실험예 1. Dead Cas12f1 단백질
Cas12f1을 발현하는 벡터를 mutagenesis 방법으로 Cas12f1을 dead 형태로 변형시켰다. Dead 형태는 D326A, E422A, R490A 또는 D510A이며, R490Q, R490W, R490L, D510L, D510V 또는 그 외 cleavage 활성을 상실하는 변이가 된 형태이다. 각각의 mutagenesis에 사용한 프라이머는 다음 [표26]에 나타내었다.
[표26]
만들어진 dead Cas12f1의 cleavage 활성이 제거되었는지 확인하기 위하여 HEK293T 세포에 5'-CACACACACAGTGGGCTACCATT-3'(서열번호 668)를 타겟 하여 transfection 하였다. Transfection 96시간 후 gDNA를 추출하여 NGS분석을 통하여 indel 발생을 비교하였다(도 29).
실험예 2. 전사 저해 Cas12f1 융합 단백질을 이용한 CRISPR 발현 조절 시스템
실험예 2.1 전사 저해 Cas12f1 융합 단백질 설계
발현 조절 시스템 모듈 제작을 위해 KRAB, MeCP2, DNMT3A 각각 또는 조합을 Cas12f1의 N 말단 혹은 C 말단에 클로닝 하였다(도 30). template를 사용하여 KOD-one (TOYOBO)로 Vector와 Insert fragment를 증폭 후 Gibson Assembly® Master Mix (NEB)를 사용하여 protocol 대로 Ligation을 진행하였다. 각 vector, insert fragment 제작을 위해 사용한 template DNA와 프라이머는 다음 [표27] 및 [표28]과 같다.
[표27]
[표28]
실험예 2.2 전사 저해 Cas12f1 융합 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는 CRISPR interference 복합체의 발현 억제(또는 저해) 효과
각 모듈 플라스미드를 HEK293T cell에 각 1.5 μg, 타겟팅을 위한 guide RNA cassette를 0.5 μg을 transfection한 후 96시간 후에 cell을 수확하였다. Maxwell® RSC miRNA Tissue Kit (Promega)를 사용하여 RNA를 추출하였다. 1 μg의 RNA를 SuperScript IV Reverse Transcriptase (Invitrogen)를 사용하여 cDNA 합성을 protocol대로 진행하였다. 이 합성된 cDNA를 주형으로 각 타겟의 발현 억제효과를 확인하였다(도 31 내지 45). 비교군으로 사용한 타겟은 18s를 사용하였고 qPCR을 위해 사용한 primer는 다음 [표29]와 같다.
[표29]
실시예 2.3 CRIPSR interference 복합체를 이용한 PCSK9 유전자의 발현 저해 효과
PCSK9 유전자의 발현 저해 효과를 확인하기 위해 promoter에 위치하는 타겟을 선정하여 indel 효율을 확인하였다. HEK293T cell에 Cas12f1과 guide RNA를 코딩하고 있는 벡터 2μg을 각각 transfection 하였고 transfection 96시간 후 cell을수확하여 NGS를 통해 indel효율을 분석하였다(도 46). 이때, 사용된 gRNA 정보는 다음 [표30]과 같다.
[표30]
타겟팅 효율을 높이기 위하여 guide RNA optimization, spacer optimization을 진행하여 최적의 guide RNA 형태를 확인하였다(도 47 내지 49).
또한, PCSK9이 많이 발현하는 Huh7, HepG2, Hep3B cell에서 선정한 타겟에 대하여 유전자 발현 저해를 확인하기 위하여 제작한 각각의 모듈로 mRNA level을 비교하였다(도 50 내지 53).
실험예 3. 전사 활성 Cas12f1 융합 단백질을 이용한 CRISPR 발현 조절 시스템
실험예 3.1 전사 활성 Cas12f1 융합 단백질 설계
Cas12f1을 발현하는 벡터를 mutagenesis 방법으로 Cas12f1을 dead 형태로 변형하였다. Dead 형태는 D326A, E422A, R490A 또는 D510A이고, 그 외 cleavage 활성을 상실하는 변이가 된 형태이다. dCas12f1의 C term 말단에 전사활성 단백질인 VP64를 fusion하여 전사 활성 Cas12f1 융합 단백질을 제작하였다(도 54).
실험예 3.2 전사 활성 Cas12f1 융합 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는 CRISPR activation 복합체의 발현 촉진 효과
OCT4 gene을 타겟팅 하는 타겟을 선정하였다. 선정한 타겟은 다음 [표31]와 같다. 제작한 전사 활성 Cas12f1 융합 단백질과 각각의 guide RNA를 코딩하는 벡터를 HEK293T 세포에 FugeneHD(Promega) reagent를 사용하여 transfection 하였다. transfection방법은 reagent의 protocol을 따른다. Transfection 72시간 후 Cell을 수확하여 RNA를 추출하였다. 추출한 RNA를 사용하여 SuperScript iV(Invitrogen)kit를 사용하여 cDNA를 합성하였다. cDNA를 주형으로 사용하여 qPCR로 expression 변화를 분석하였다(도 55).
[표31]
<110> GenKOre Co., Ltd.
Korea Research Institute of Bioscience and Biotechnology
<120> A method for regulating a gene expression using CRISPR system
<130> P220018KR
<150> KR 10-2021-0050093
<151> 2021-04-16
<160> 730
<170> KoPatentIn 3.0
<210> 1
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<223> mature form of Cas12f1 tracrRNA
<400> 1
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu 140
<210> 2
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> wild-type of Cas12f1 tracrRNA
<400> 2
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca a 161
<210> 3
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> mature form of Cas12f1 crRNA repeat
<400> 3
gaaugaagga augcaac 17
<210> 4
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> wild-type of Cas12f1 crRNA repeat
<400> 4
guugcagaac ccgaauagac gaaugaagga augcaac 37
<210> 5
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> mature form of Cas12f1 crRNA
<400> 5
gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnn 37
<210> 6
<211> 57
<212> RNA
<213> Artificial Sequence
<220>
<223> wild-type of Cas12f1 crRNA
<400> 6
guugcagaac ccgaauagac gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57
<210> 7
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> mature form of Cas12f1 tracrRNA + GAAA + mature form of Cas12f1
crRNA repeat crRNA repeat
<400> 7
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu gaaagaauga aggaaugcaa c 161
<210> 8
<211> 181
<212> RNA
<213> Artificial Sequence
<220>
<223> mature form of Cas12f1 tracrRNA + GAAA + mature form of Cas12f1
crRNA crRNA
<400> 8
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu gaaagaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180
n 181
<210> 9
<211> 190
<212> RNA
<213> Artificial Sequence
<220>
<223> mature form of Cas12f1 tracrRNA - GAAA - mature form of Cas12f1
crRNA - U-rich tail crRNA - U-rich tail
<400> 9
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu gaaagaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180
nuuuuauuuu 190
<210> 10
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st region of Cas12f1 guide RNA
<400> 10
cuucacugau aaaguggaga a 21
<210> 11
<211> 50
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of Cas12f1 guide RNA
<400> 11
ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug 50
<210> 12
<211> 56
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of Cas12f1 guide RNA
<400> 12
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucga 56
<210> 13
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th region of Cas12f1 guide RNA (Mature form)
<400> 13
aacaaauuca uuu 13
<210> 14
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th region of Cas12f1 guide RNA (Wild-type)
<400> 14
aacaaauuca uuuuuccucu ccaauucugc acaa 34
<210> 15
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of Cas12f1 guide RNA (Mature form)
<400> 15
gaaugaagga 10
<210> 16
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of Cas12f1 guide RNA (Wild-type)
<400> 16
guugcagaac ccgaauagac gaaugaagga 30
<210> 17
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> first region, 11nt deletion
<400> 17
aaguggagaa 10
<210> 18
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> first region, 10nt deletion
<400> 18
aaaguggaga a 11
<210> 19
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> first region, 9nt deletion
<400> 19
uaaaguggag aa 12
<210> 20
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> first region, 8nt deletion
<400> 20
auaaagugga gaa 13
<210> 21
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> first region, 7nt deletion
<400> 21
gauaaagugg agaa 14
<210> 22
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> first region, 6nt deletion
<400> 22
ugauaaagug gagaa 15
<210> 23
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> first region, 5nt deletion
<400> 23
cugauaaagu ggagaa 16
<210> 24
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> first region, 4nt deletion
<400> 24
acugauaaag uggagaa 17
<210> 25
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> first region, 3nt deletion
<400> 25
cacugauaaa guggagaa 18
<210> 26
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> first region, 2nt deletion
<400> 26
ucacugauaa aguggagaa 19
<210> 27
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> first region, 1nt deletion
<400> 27
uucacugaua aaguggagaa 20
<210> 28
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> deleted part of the first region, 10nt
<400> 28
aaaguggaga 10
<210> 29
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> deleted part of the first region, 11nt
<400> 29
uaaaguggag a 11
<210> 30
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> deleted part of the first region, 12nt
<400> 30
auaaagugga ga 12
<210> 31
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> deleted part of the first region, 13nt
<400> 31
gauaaagugg aga 13
<210> 32
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> deleted part of the first region, 14nt
<400> 32
ugauaaagug gaga 14
<210> 33
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> deleted part of the first region, 15nt
<400> 33
cugauaaagu ggaga 15
<210> 34
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> deleted part of the first region, 16nt
<400> 34
acugauaaag uggaga 16
<210> 35
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> deleted part of the first region, 17nt
<400> 35
cacugauaaa guggaga 17
<210> 36
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> deleted part of the first region, 18nt
<400> 36
ucacugauaa aguggaga 18
<210> 37
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> deleted part of the first region, 19nt
<400> 37
uucacugaua aaguggaga 19
<210> 38
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> deleted part of the first region, 20nt
<400> 38
cuucacugau aaaguggaga 20
<210> 39
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> second region, 11bp deletion
<400> 39
ccgcuucacc auuagugagu gaaggugg 28
<210> 40
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> second region, 10bp deletion
<400> 40
ccgcuucacc aauuaguuga gugaaggugg 30
<210> 41
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> second region, 9bp deletion
<400> 41
ccgcuucacc aaauuagcuu gagugaaggu gg 32
<210> 42
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> second region, 8bp deletion
<400> 42
ccgcuucacc aaaauuagac uugagugaag gugg 34
<210> 43
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> second region, 7bp deletion
<400> 43
ccgcuucacc aaaaguuaga acuugaguga aggugg 36
<210> 44
<211> 38
<212> RNA
<213> Artificial Sequence
<220>
<223> second region, 6bp deletion
<400> 44
ccgcuucacc aaaagcuuag gaacuugagu gaaggugg 38
<210> 45
<211> 40
<212> RNA
<213> Artificial Sequence
<220>
<223> second region, 5bp deletion
<400> 45
ccgcuucacc aaaagcuuua gagaacuuga gugaaggugg 40
<210> 46
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> second region, 4bp deletion
<400> 46
ccgcuucacc aaaagcuguu aguuagaacu ugagugaagg ugg 43
<210> 47
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> second region, 4bp+1nt deletion
<400> 47
ccgcuucacc aaaagcuguu aguagaacuu gagugaaggu gg 42
<210> 48
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> second region, 3bp deletion
<400> 48
ccgcuucacc aaaagcuguu uagauuagaa cuugagugaa ggugg 45
<210> 49
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> second region, 2bp deletion
<400> 49
ccgcuucacc aaaagcuguc uuaggauuag aacuugagug aaggugg 47
<210> 50
<211> 49
<212> RNA
<213> Artificial Sequence
<220>
<223> second region, 1bp deletion
<400> 50
ccgcuucacc aaaagcuguc cuuagggauu agaacuugag ugaaggugg 49
<210> 51
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> second region, 5' remains
<400> 51
ccgcuucacc a 11
<210> 52
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> second region, 3' remains
<400> 52
ugagugaagg ugg 13
<210> 53
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> upper-deleted part of the second region, 10nt
<400> 53
aaagcugucc 10
<210> 54
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> upper-deleted part of the second region, 11nt
<400> 54
aaagcugucc c 11
<210> 55
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> lower-deleted part of the second region, 10nt
<400> 55
gauuagaacu 10
<210> 56
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> lower-deleted part of the second region, 11nt
<400> 56
ggauuagaac u 11
<210> 57
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> lower-deleted part of the second region, 12nt
<400> 57
gggauuagaa cu 12
<210> 58
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of the second region, 10nt
<400> 58
aaauuagacu 10
<210> 59
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of the second region, 11nt
<400> 59
aaaguuagaa cu 12
<210> 60
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of the second region, 12nt
<400> 60
aaagcuuagg aacu 14
<210> 61
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of the second region, 13nt
<400> 61
aaagcuuuag agaacu 16
<210> 62
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of the second region, 14nt
<400> 62
aaagcuguua guagaacu 18
<210> 63
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of the second region, 15nt
<400> 63
aaagcuguua guuagaacu 19
<210> 64
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of the second region, 16nt
<400> 64
aaagcuguuu agauuagaac u 21
<210> 65
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of the second region, 17nt
<400> 65
aaagcugucu uaggauuaga acu 23
<210> 66
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of the second region, 18nt
<400> 66
aaagcugucc uuagggauua gaacu 25
<210> 67
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(mature form), delete 3nt
<400> 67
aacaaauuca 10
<210> 68
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(mature form), delete 4nt
<400> 68
aacaaauuca u 11
<210> 69
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(mature form), delete 5nt
<400> 69
aacaaauuca uu 12
<210> 70
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 21nt deletion
<400> 70
aacaaauuca uuu 13
<210> 71
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 20nt deletion
<400> 71
aacaaauuca uuuu 14
<210> 72
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 19nt deletion
<400> 72
aacaaauuca uuuuu 15
<210> 73
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 18nt deletion
<400> 73
aacaaauuca uuuuuc 16
<210> 74
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 17nt deletion
<400> 74
aacaaauuca uuuuucc 17
<210> 75
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 16nt deletion
<400> 75
aacaaauuca uuuuuccu 18
<210> 76
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 15nt deletion
<400> 76
aacaaauuca uuuuuccuc 19
<210> 77
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 14nt deletion
<400> 77
aacaaauuca uuuuuccucu 20
<210> 78
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 13nt deletion
<400> 78
aacaaauuca uuuuuccucu c 21
<210> 79
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 12nt deletion
<400> 79
aacaaauuca uuuuuccucu cc 22
<210> 80
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 11nt deletion
<400> 80
aacaaauuca uuuuuccucu cca 23
<210> 81
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 10nt deletion
<400> 81
aacaaauuca uuuuuccucu ccaa 24
<210> 82
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 9nt deletion
<400> 82
aacaaauuca uuuuuccucu ccaau 25
<210> 83
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 8nt deletion
<400> 83
aacaaauuca uuuuuccucu ccaauu 26
<210> 84
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 7nt deletion
<400> 84
aacaaauuca uuuuuccucu ccaauuc 27
<210> 85
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 6nt deletion
<400> 85
aacaaauuca uuuuuccucu ccaauucu 28
<210> 86
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 5nt deletion
<400> 86
aacaaauuca uuuuuccucu ccaauucug 29
<210> 87
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 4nt deletion
<400> 87
aacaaauuca uuuuuccucu ccaauucugc 30
<210> 88
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 3nt deletion
<400> 88
aacaaauuca uuuuuccucu ccaauucugc a 31
<210> 89
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 2nt deletion
<400> 89
aacaaauuca uuuuuccucu ccaauucugc ac 32
<210> 90
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region of the tracrRNA(wild-type), 1nt deletion
<400> 90
aacaaauuca uuuuuccucu ccaauucugc aca 33
<210> 91
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 20nt deletion
<400> 91
gaaugaagga 10
<210> 92
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 19nt deletion
<400> 92
cgaaugaagg a 11
<210> 93
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 18nt deletion
<400> 93
acgaaugaag ga 12
<210> 94
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 17nt deletion
<400> 94
gacgaaugaa gga 13
<210> 95
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 16nt deletion
<400> 95
agacgaauga agga 14
<210> 96
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 15nt deletion
<400> 96
uagacgaaug aagga 15
<210> 97
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 14nt deletion
<400> 97
auagacgaau gaagga 16
<210> 98
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 13nt deletion
<400> 98
aauagacgaa ugaagga 17
<210> 99
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 12nt deletion
<400> 99
gaauagacga augaagga 18
<210> 100
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 11nt deletion
<400> 100
cgaauagacg aaugaagga 19
<210> 101
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 10nt deletion
<400> 101
ccgaauagac gaaugaagga 20
<210> 102
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 9nt deletion
<400> 102
cccgaauaga cgaaugaagg a 21
<210> 103
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 8nt deletion
<400> 103
acccgaauag acgaaugaag ga 22
<210> 104
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 7nt deletion
<400> 104
aacccgaaua gacgaaugaa gga 23
<210> 105
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 6nt deletion
<400> 105
gaacccgaau agacgaauga agga 24
<210> 106
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 5nt deletion
<400> 106
agaacccgaa uagacgaaug aagga 25
<210> 107
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 4nt deletion
<400> 107
cagaacccga auagacgaau gaagga 26
<210> 108
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 3nt deletion
<400> 108
gcagaacccg aauagacgaa ugaagga 27
<210> 109
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 2nt deletion
<400> 109
ugcagaaccc gaauagacga augaagga 28
<210> 110
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth region of the crRNA(wild-type), 1nt deletion
<400> 110
uugcagaacc cgaauagacg aaugaagga 29
<210> 111
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region + Linker + fifth region, 7bp deletion (mature form)
<400> 111
aacaaagaaa gga 13
<210> 112
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region + Linker + fifth region, 6bp deletion (mature form)
<400> 112
aacaaaugaa aagga 15
<210> 113
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region + Linker + fifth region, 5bp deletion (mature form)
<400> 113
aacaaauuga aaaagga 17
<210> 114
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region + Linker + fifth region, 4bp deletion (mature form)
<400> 114
aacaaauucg aaagaagga 19
<210> 115
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region + Linker + fifth region, 3bp deletion (mature form)
<400> 115
aacaaauuca gaaaugaagg a 21
<210> 116
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region + Linker + fifth region, 2bp deletion (mature form)
<400> 116
aacaaauuca ugaaaaugaa gga 23
<210> 117
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region + Linker + fifth region, 1bp deletion (mature form)
<400> 117
aacaaauuca uugaaaaaug aagga 25
<210> 118
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth region + Linker + fifth region (mature form)
<400> 118
aacaaauuca uuugaaagaa ugaagga 27
<210> 119
<211> 120
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 20nt deletion in the first
region)
<400> 119
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 120
120
<210> 120
<211> 121
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 19nt deletion in the first
region)
<400> 120
aaccgcuuca ccaaaagcug ucccuuaggg gauuagaacu ugagugaagg ugggcugcuu 60
gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaauucauu 120
u 121
<210> 121
<211> 122
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 18nt deletion in the first
region)
<400> 121
gaaccgcuuc accaaaagcu gucccuuagg ggauuagaac uugagugaag gugggcugcu 60
ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa acaaauucau 120
uu 122
<210> 122
<211> 123
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 17nt deletion in the first
region)
<400> 122
agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa ggugggcugc 60
uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca 120
uuu 123
<210> 123
<211> 124
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 16nt deletion in the first
region)
<400> 123
gagaaccgcu ucaccaaaag cugucccuua ggggauuaga acuugaguga aggugggcug 60
cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg aaacaaauuc 120
auuu 124
<210> 124
<211> 125
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 15nt deletion in the first
region)
<400> 124
ggagaaccgc uucaccaaaa gcugucccuu aggggauuag aacuugagug aaggugggcu 60
gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120
cauuu 125
<210> 125
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 14nt deletion in the first
region)
<400> 125
uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu gaaggugggc 60
ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaau 120
ucauuu 126
<210> 126
<211> 127
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 13nt deletion in the first
region)
<400> 126
guggagaacc gcuucaccaa aagcuguccc uuaggggauu agaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucauuu 127
<210> 127
<211> 128
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 12nt deletion in the first
region)
<400> 127
aguggagaac cgcuucacca aaagcugucc cuuaggggau uagaacuuga gugaaggugg 60
gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc cucgaaacaa 120
auucauuu 128
<210> 128
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 11nt deletion in the first
region)
<400> 128
aaguggagaa ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuu 129
<210> 129
<211> 130
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 10nt deletion in the first
region)
<400> 129
aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu 60
gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac 120
aaauucauuu 130
<210> 130
<211> 131
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 9nt deletion in the first
region)
<400> 130
uaaaguggag aaccgcuuca ccaaaagcug ucccuuaggg gauuagaacu ugagugaagg 60
ugggcugcuu gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa 120
caaauucauu u 131
<210> 131
<211> 132
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 8nt deletion in the first
region)
<400> 131
auaaagugga gaaccgcuuc accaaaagcu gucccuuagg ggauuagaac uugagugaag 60
gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa 120
acaaauucau uu 132
<210> 132
<211> 133
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 7nt deletion in the first
region)
<400> 132
gauaaagugg agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa 60
ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga 120
aacaaauuca uuu 133
<210> 133
<211> 134
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 6nt deletion in the first
region)
<400> 133
ugauaaagug gagaaccgcu ucaccaaaag cugucccuua ggggauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuu 134
<210> 134
<211> 135
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 5nt deletion in the first
region)
<400> 134
cugauaaagu ggagaaccgc uucaccaaaa gcugucccuu aggggauuag aacuugagug 60
aaggugggcu gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc 120
gaaacaaauu cauuu 135
<210> 135
<211> 136
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 4nt deletion in the first
region)
<400> 135
acugauaaag uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu 60
gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 120
cgaaacaaau ucauuu 136
<210> 136
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 3nt deletion in the first
region)
<400> 136
cacugauaaa guggagaacc gcuucaccaa aagcuguccc uuaggggauu agaacuugag 60
ugaagguggg cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc 120
ucgaaacaaa uucauuu 137
<210> 137
<211> 138
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 2nt deletion in the first
region)
<400> 137
ucacugauaa aguggagaac cgcuucacca aaagcugucc cuuaggggau uagaacuuga 60
gugaaggugg gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc 120
cucgaaacaa auucauuu 138
<210> 138
<211> 139
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 1nt deletion in the first
region)
<400> 138
uucacugaua aaguggagaa ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug 60
agugaaggug ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac 120
ccucgaaaca aauucauuu 139
<210> 139
<211> 117
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 10bp deletion in the second
region)
<400> 139
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa uucauuu 117
<210> 140
<211> 119
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 9bp deletion in the second
region)
<400> 140
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuu 119
<210> 141
<211> 122
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 8bp deletion in the second
region)
<400> 141
cuucacugau aaaguggaga accgcuucac caaauuagac uugagugaag gugggcugcu 60
ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa acaaauucau 120
uu 122
<210> 142
<211> 125
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 7bp deletion in the second
region)
<400> 142
cuucacugau aaaguggaga accgcuucac caaaaguuag aacuugagug aaggugggcu 60
gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120
cauuu 125
<210> 143
<211> 127
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 6bp deletion in the second
region)
<400> 143
cuucacugau aaaguggaga accgcuucac caaaagcuua ggaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucauuu 127
<210> 144
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 5bp deletion in the second
region)
<400> 144
cuucacugau aaaguggaga accgcuucac caaaagcuuu agagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuu 129
<210> 145
<211> 132
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 4bp deletion in the second
region)
<400> 145
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguuagaac uugagugaag 60
gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa 120
acaaauucau uu 132
<210> 146
<211> 131
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 4bp+1nt deletion in the second
region)
<400> 146
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguagaacu ugagugaagg 60
ugggcugcuu gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa 120
caaauucauu u 131
<210> 147
<211> 134
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 3bp deletion in the second
region)
<400> 147
cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuu 134
<210> 148
<211> 136
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 2bp deletion in the second
region)
<400> 148
cuucacugau aaaguggaga accgcuucac caaaagcugu cuuaggauua gaacuugagu 60
gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 120
cgaaacaaau ucauuu 136
<210> 149
<211> 138
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 1bp deletion in the second
region)
<400> 149
cuucacugau aaaguggaga accgcuucac caaaagcugu ccuuagggau uagaacuuga 60
gugaaggugg gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc 120
cucgaaacaa auucauuu 138
<210> 150
<211> 133
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 7nt deletion in the fourth
region)
<400> 150
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaa 133
<210> 151
<211> 134
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 6nt deletion in the fourth
region)
<400> 151
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaau 134
<210> 152
<211> 135
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 5nt deletion in the fourth
region)
<400> 152
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauu 135
<210> 153
<211> 136
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 4nt deletion in the fourth
region)
<400> 153
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauuc 136
<210> 154
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 3nt deletion in the fourth
region)
<400> 154
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauuca 137
<210> 155
<211> 138
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 2nt deletion in the fourth
region)
<400> 155
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucau 138
<210> 156
<211> 139
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, 1nt deletion in the fourth
region)
<400> 156
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauu 139
<210> 157
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, modified first region and
modified second region)
<400> 157
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa uucauuu 97
<210> 158
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, modified first region and
modified fourth and fifth region)
<400> 158
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaa 113
<210> 159
<211> 110
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, modified second region and
modified fourth and fifth region)
<400> 159
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 110
<210> 160
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, modified first region, modified
second region, modified fourth and fifth region)
<400> 160
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa 90
<210> 161
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA repeat(mature form, 7nt deletion in the fifth
region)
<400> 161
ggaaugcaac 10
<210> 162
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA repeat(mature form, 6nt deletion in the fifth
region)
<400> 162
aggaaugcaa c 11
<210> 163
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA repeat(mature form, 5nt deletion in the fifth
region)
<400> 163
aaggaaugca ac 12
<210> 164
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA repeat(mature form, 4nt deletion in the fifth
region)
<400> 164
gaaggaaugc aac 13
<210> 165
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA repeat(mature form, 3nt deletion in the fifth
region)
<400> 165
ugaaggaaug caac 14
<210> 166
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA repeat(mature form, 2nt deletion in the fifth
region)
<400> 166
augaaggaau gcaac 15
<210> 167
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA repeat(mature form, 1nt deletion in the fifth
region)
<400> 167
aaugaaggaa ugcaac 16
<210> 168
<211> 141
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 20nt deletion in the first
region)
<400> 168
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 120
gaaagaauga aggaaugcaa c 141
<210> 169
<211> 142
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 19nt deletion in the first
region)
<400> 169
aaccgcuuca ccaaaagcug ucccuuaggg gauuagaacu ugagugaagg ugggcugcuu 60
gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaauucauu 120
ugaaagaaug aaggaaugca ac 142
<210> 170
<211> 143
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 18nt deletion in the first
region)
<400> 170
gaaccgcuuc accaaaagcu gucccuuagg ggauuagaac uugagugaag gugggcugcu 60
ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa acaaauucau 120
uugaaagaau gaaggaaugc aac 143
<210> 171
<211> 144
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 17nt deletion in the first
region)
<400> 171
agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa ggugggcugc 60
uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca 120
uuugaaagaa ugaaggaaug caac 144
<210> 172
<211> 145
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 16nt deletion in the first
region)
<400> 172
gagaaccgcu ucaccaaaag cugucccuua ggggauuaga acuugaguga aggugggcug 60
cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg aaacaaauuc 120
auuugaaaga augaaggaau gcaac 145
<210> 173
<211> 146
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 15nt deletion in the first
region)
<400> 173
ggagaaccgc uucaccaaaa gcugucccuu aggggauuag aacuugagug aaggugggcu 60
gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120
cauuugaaag aaugaaggaa ugcaac 146
<210> 174
<211> 147
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 14nt deletion in the first
region)
<400> 174
uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu gaaggugggc 60
ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaau 120
ucauuugaaa gaaugaagga augcaac 147
<210> 175
<211> 148
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 13nt deletion in the first
region)
<400> 175
guggagaacc gcuucaccaa aagcuguccc uuaggggauu agaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucauuugaa agaaugaagg aaugcaac 148
<210> 176
<211> 149
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 12nt deletion in the first
region)
<400> 176
aguggagaac cgcuucacca aaagcugucc cuuaggggau uagaacuuga gugaaggugg 60
gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc cucgaaacaa 120
auucauuuga aagaaugaag gaaugcaac 149
<210> 177
<211> 150
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 11nt deletion in the first
region)
<400> 177
aaguggagaa ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuug aaagaaugaa ggaaugcaac 150
<210> 178
<211> 151
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 10nt deletion in the first
region)
<400> 178
aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu 60
gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac 120
aaauucauuu gaaagaauga aggaaugcaa c 151
<210> 179
<211> 152
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 9nt deletion in the first
region)
<400> 179
uaaaguggag aaccgcuuca ccaaaagcug ucccuuaggg gauuagaacu ugagugaagg 60
ugggcugcuu gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa 120
caaauucauu ugaaagaaug aaggaaugca ac 152
<210> 180
<211> 153
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 8nt deletion in the first
region)
<400> 180
auaaagugga gaaccgcuuc accaaaagcu gucccuuagg ggauuagaac uugagugaag 60
gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa 120
acaaauucau uugaaagaau gaaggaaugc aac 153
<210> 181
<211> 154
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 7nt deletion in the first
region)
<400> 181
gauaaagugg agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa 60
ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga 120
aacaaauuca uuugaaagaa ugaaggaaug caac 154
<210> 182
<211> 155
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 6nt deletion in the first
region)
<400> 182
ugauaaagug gagaaccgcu ucaccaaaag cugucccuua ggggauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaac 155
<210> 183
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 5nt deletion in the first
region)
<400> 183
cugauaaagu ggagaaccgc uucaccaaaa gcugucccuu aggggauuag aacuugagug 60
aaggugggcu gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc 120
gaaacaaauu cauuugaaag aaugaaggaa ugcaac 156
<210> 184
<211> 157
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 4nt deletion in the first
region)
<400> 184
acugauaaag uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu 60
gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 120
cgaaacaaau ucauuugaaa gaaugaagga augcaac 157
<210> 185
<211> 158
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 3nt deletion in the first
region)
<400> 185
cacugauaaa guggagaacc gcuucaccaa aagcuguccc uuaggggauu agaacuugag 60
ugaagguggg cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc 120
ucgaaacaaa uucauuugaa agaaugaagg aaugcaac 158
<210> 186
<211> 159
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 2nt deletion in the first
region)
<400> 186
ucacugauaa aguggagaac cgcuucacca aaagcugucc cuuaggggau uagaacuuga 60
gugaaggugg gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc 120
cucgaaacaa auucauuuga aagaaugaag gaaugcaac 159
<210> 187
<211> 160
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 1nt deletion in the first
region)
<400> 187
uucacugaua aaguggagaa ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug 60
agugaaggug ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac 120
ccucgaaaca aauucauuug aaagaaugaa ggaaugcaac 160
<210> 188
<211> 138
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 11bp deletion in the second
region)
<400> 188
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa uucauuugaa 120
agaaugaagg aaugcaac 138
<210> 189
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 10bp deletion in the second
region)
<400> 189
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuug 120
aaagaaugaa ggaaugcaac 140
<210> 190
<211> 142
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 9bp deletion in the second
region)
<400> 190
cuucacugau aaaguggaga accgcuucac caaauuagcu ugagugaagg ugggcugcuu 60
gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaauucauu 120
ugaaagaaug aaggaaugca ac 142
<210> 191
<211> 144
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 8bp deletion in the second
region)
<400> 191
cuucacugau aaaguggaga accgcuucac caaaauuaga cuugagugaa ggugggcugc 60
uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca 120
uuugaaagaa ugaaggaaug caac 144
<210> 192
<211> 146
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 7bp deletion in the second
region)
<400> 192
cuucacugau aaaguggaga accgcuucac caaaaguuag aacuugagug aaggugggcu 60
gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120
cauuugaaag aaugaaggaa ugcaac 146
<210> 193
<211> 148
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 6bp deletion in the second
region)
<400> 193
cuucacugau aaaguggaga accgcuucac caaaagcuua ggaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucauuugaa agaaugaagg aaugcaac 148
<210> 194
<211> 150
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 5bp deletion in the second
region)
<400> 194
cuucacugau aaaguggaga accgcuucac caaaagcuuu agagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuug aaagaaugaa ggaaugcaac 150
<210> 195
<211> 152
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 4bp deletion in the second
region)
<400> 195
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguagaacu ugagugaagg 60
ugggcugcuu gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa 120
caaauucauu ugaaagaaug aaggaaugca ac 152
<210> 196
<211> 153
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 4bp+1nt deletion in the second
region)
<400> 196
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguuagaac uugagugaag 60
gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa 120
acaaauucau uugaaagaau gaaggaaugc aac 153
<210> 197
<211> 155
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 3bp deletion in the second
region)
<400> 197
cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaac 155
<210> 198
<211> 157
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 2bp deletion in the second
region)
<400> 198
cuucacugau aaaguggaga accgcuucac caaaagcugu cuuaggauua gaacuugagu 60
gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 120
cgaaacaaau ucauuugaaa gaaugaagga augcaac 157
<210> 199
<211> 159
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 1bp deletion in the second
region)
<400> 199
cuucacugau aaaguggaga accgcuucac caaaagcugu ccuuagggau uagaacuuga 60
gugaaggugg gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc 120
cucgaaacaa auucauuuga aagaaugaag gaaugcaac 159
<210> 200
<211> 147
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 7bp deletion in the fourth and
fifth region)
<400> 200
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaagaaagga augcaac 147
<210> 201
<211> 149
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 6bp deletion in the fourth and
fifth region)
<400> 201
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaaugaaaag gaaugcaac 149
<210> 202
<211> 151
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 5bp deletion in the fourth and
fifth region)
<400> 202
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauugaaaa aggaaugcaa c 151
<210> 203
<211> 153
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 4bp deletion in the fourth and
fifth region)
<400> 203
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucgaaa gaaggaaugc aac 153
<210> 204
<211> 155
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 3bp deletion in the fourth and
fifth region)
<400> 204
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagaa augaaggaau gcaac 155
<210> 205
<211> 157
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 2bp deletion in the fourth and
fifth region)
<400> 205
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauga aaaugaagga augcaac 157
<210> 206
<211> 159
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, 1bp deletion in the fourth and
fifth region)
<400> 206
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauug aaaaaugaag gaaugcaac 159
<210> 207
<211> 118
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, modified first and second
region)
<400> 207
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa uucauuugaa agaaugaagg aaugcaac 118
<210> 208
<211> 127
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, modified first, fourth and fifth
region)
<400> 208
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaagaaagga 120
augcaac 127
<210> 209
<211> 121
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, modified second, fourth and
fifth region)
<400> 209
cuucacugau aaaguggaga accgcuucac uuagagugaa gguggggcug cuugcaucag 60
ccuaaugucg agaagugcuu ucuucggaaa guaacccucg aaacaaagaa aggaaugcaa 120
c 121
<210> 210
<211> 101
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, modified first, second, fourth
and fifth region)
<400> 210
accgcuucac uuagagugaa gguggggcug cuugcaucag ccuaaugucg agaagugcuu 60
ucuucggaaa guaacccucg aaacaaagaa aggaaugcaa c 101
<210> 211
<211> 189
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 1nt deletion in the first region)
<400> 211
uucacugaua aaguggagaa ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug 60
agugaaggug ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac 120
ccucgaaaca aauucauuug aaagaaugaa ggaaugcaac nnnnnnnnnn nnnnnnnnnn 180
uuuuauuuu 189
<210> 212
<211> 188
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 2nt deletion in the first region)
<400> 212
ucacugauaa aguggagaac cgcuucacca aaagcugucc cuuaggggau uagaacuuga 60
gugaaggugg gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc 120
cucgaaacaa auucauuuga aagaaugaag gaaugcaacn nnnnnnnnnn nnnnnnnnnu 180
uuuauuuu 188
<210> 213
<211> 187
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 3nt deletion in the first region)
<400> 213
cacugauaaa guggagaacc gcuucaccaa aagcuguccc uuaggggauu agaacuugag 60
ugaagguggg cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc 120
ucgaaacaaa uucauuugaa agaaugaagg aaugcaacnn nnnnnnnnnn nnnnnnnnuu 180
uuauuuu 187
<210> 214
<211> 186
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 4nt deletion in the first region)
<400> 214
acugauaaag uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu 60
gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 120
cgaaacaaau ucauuugaaa gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 180
uauuuu 186
<210> 215
<211> 185
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 5nt deletion in the first region)
<400> 215
cugauaaagu ggagaaccgc uucaccaaaa gcugucccuu aggggauuag aacuugagug 60
aaggugggcu gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc 120
gaaacaaauu cauuugaaag aaugaaggaa ugcaacnnnn nnnnnnnnnn nnnnnnuuuu 180
auuuu 185
<210> 216
<211> 184
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 6nt deletion in the first region)
<400> 216
ugauaaagug gagaaccgcu ucaccaaaag cugucccuua ggggauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaacnnnnn nnnnnnnnnn nnnnnuuuua 180
uuuu 184
<210> 217
<211> 183
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 7nt deletion in the first region)
<400> 217
gauaaagugg agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa 60
ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga 120
aacaaauuca uuugaaagaa ugaaggaaug caacnnnnnn nnnnnnnnnn nnnnuuuuau 180
uuu 183
<210> 218
<211> 182
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 8nt deletion in the first region)
<400> 218
auaaagugga gaaccgcuuc accaaaagcu gucccuuagg ggauuagaac uugagugaag 60
gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa 120
acaaauucau uugaaagaau gaaggaaugc aacnnnnnnn nnnnnnnnnn nnnuuuuauu 180
uu 182
<210> 219
<211> 181
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 9nt deletion in the first region)
<400> 219
uaaaguggag aaccgcuuca ccaaaagcug ucccuuaggg gauuagaacu ugagugaagg 60
ugggcugcuu gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa 120
caaauucauu ugaaagaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nnuuuuauuu 180
u 181
<210> 220
<211> 180
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 10nt deletion in the first region)
<400> 220
aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu 60
gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac 120
aaauucauuu gaaagaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn nuuuuauuuu 180
180
<210> 221
<211> 179
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 11nt deletion in the first region)
<400> 221
aaguggagaa ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuug aaagaaugaa ggaaugcaac nnnnnnnnnn nnnnnnnnnn uuuuauuuu 179
<210> 222
<211> 178
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 12nt deletion in the first region)
<400> 222
aguggagaac cgcuucacca aaagcugucc cuuaggggau uagaacuuga gugaaggugg 60
gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc cucgaaacaa 120
auucauuuga aagaaugaag gaaugcaacn nnnnnnnnnn nnnnnnnnnu uuuauuuu 178
<210> 223
<211> 177
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 13nt deletion in the first region)
<400> 223
guggagaacc gcuucaccaa aagcuguccc uuaggggauu agaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucauuugaa agaaugaagg aaugcaacnn nnnnnnnnnn nnnnnnnnuu uuauuuu 177
<210> 224
<211> 176
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 14nt deletion in the first region)
<400> 224
uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu gaaggugggc 60
ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaau 120
ucauuugaaa gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu uauuuu 176
<210> 225
<211> 175
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 15nt deletion in the first region)
<400> 225
ggagaaccgc uucaccaaaa gcugucccuu aggggauuag aacuugagug aaggugggcu 60
gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120
cauuugaaag aaugaaggaa ugcaacnnnn nnnnnnnnnn nnnnnnuuuu auuuu 175
<210> 226
<211> 174
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 16nt deletion in the first region)
<400> 226
gagaaccgcu ucaccaaaag cugucccuua ggggauuaga acuugaguga aggugggcug 60
cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg aaacaaauuc 120
auuugaaaga augaaggaau gcaacnnnnn nnnnnnnnnn nnnnnuuuua uuuu 174
<210> 227
<211> 173
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 17nt deletion in the first region)
<400> 227
agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa ggugggcugc 60
uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca 120
uuugaaagaa ugaaggaaug caacnnnnnn nnnnnnnnnn nnnnuuuuau uuu 173
<210> 228
<211> 172
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 18nt deletion in the first region)
<400> 228
gaaccgcuuc accaaaagcu gucccuuagg ggauuagaac uugagugaag gugggcugcu 60
ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa acaaauucau 120
uugaaagaau gaaggaaugc aacnnnnnnn nnnnnnnnnn nnnuuuuauu uu 172
<210> 229
<211> 171
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 19nt deletion in the first region)
<400> 229
aaccgcuuca ccaaaagcug ucccuuaggg gauuagaacu ugagugaagg ugggcugcuu 60
gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaauucauu 120
ugaaagaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nnuuuuauuu u 171
<210> 230
<211> 170
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 20nt deletion in the first region)
<400> 230
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 120
gaaagaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn nuuuuauuuu 170
<210> 231
<211> 188
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 1bp deletion in the second region)
<400> 231
cuucacugau aaaguggaga accgcuucac caaaagcugu ccuuagggau uagaacuuga 60
gugaaggugg gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc 120
cucgaaacaa auucauuuga aagaaugaag gaaugcaacn nnnnnnnnnn nnnnnnnnnu 180
uuuauuuu 188
<210> 232
<211> 186
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 2bp deletion in the second region)
<400> 232
cuucacugau aaaguggaga accgcuucac caaaagcugu cuuaggauua gaacuugagu 60
gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 120
cgaaacaaau ucauuugaaa gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 180
uauuuu 186
<210> 233
<211> 184
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 3bp deletion in the second region)
<400> 233
cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaacnnnnn nnnnnnnnnn nnnnnuuuua 180
uuuu 184
<210> 234
<211> 182
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 4bp+1nt deletion in the second region)
<400> 234
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguuagaac uugagugaag 60
gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa 120
acaaauucau uugaaagaau gaaggaaugc aacnnnnnnn nnnnnnnnnn nnnuuuuauu 180
uu 182
<210> 235
<211> 181
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 4bp deletion in the second region)
<400> 235
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguagaacu ugagugaagg 60
ugggcugcuu gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa 120
caaauucauu ugaaagaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nnuuuuauuu 180
u 181
<210> 236
<211> 179
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 5bp deletion in the second region)
<400> 236
cuucacugau aaaguggaga accgcuucac caaaagcuuu agagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuug aaagaaugaa ggaaugcaac nnnnnnnnnn nnnnnnnnnn uuuuauuuu 179
<210> 237
<211> 177
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 6bp deletion in the second region)
<400> 237
cuucacugau aaaguggaga accgcuucac caaaagcuua ggaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucauuugaa agaaugaagg aaugcaacnn nnnnnnnnnn nnnnnnnnuu uuauuuu 177
<210> 238
<211> 175
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 7bp deletion in the second region)
<400> 238
cuucacugau aaaguggaga accgcuucac caaaaguuag aacuugagug aaggugggcu 60
gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120
cauuugaaag aaugaaggaa ugcaacnnnn nnnnnnnnnn nnnnnnuuuu auuuu 175
<210> 239
<211> 173
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 8bp deletion in the second region)
<400> 239
cuucacugau aaaguggaga accgcuucac caaaauuaga cuugagugaa ggugggcugc 60
uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca 120
uuugaaagaa ugaaggaaug caacnnnnnn nnnnnnnnnn nnnnuuuuau uuu 173
<210> 240
<211> 171
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 9bp deletion in the second region)
<400> 240
cuucacugau aaaguggaga accgcuucac caaauuagcu ugagugaagg ugggcugcuu 60
gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaauucauu 120
ugaaagaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nnuuuuauuu u 171
<210> 241
<211> 169
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 10bp deletion in the second region)
<400> 241
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuug 120
aaagaaugaa ggaaugcaac nnnnnnnnnn nnnnnnnnnn uuuuauuuu 169
<210> 242
<211> 167
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 11bp deletion in the second region)
<400> 242
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa uucauuugaa 120
agaaugaagg aaugcaacnn nnnnnnnnnn nnnnnnnnuu uuauuuu 167
<210> 243
<211> 188
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 1bp deletion in the fourth and fifth region)
<400> 243
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauug aaaaaugaag gaaugcaacn nnnnnnnnnn nnnnnnnnnu 180
uuuauuuu 188
<210> 244
<211> 186
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 2bp deletion in the fourth and fifth region)
<400> 244
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauga aaaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 180
uauuuu 186
<210> 245
<211> 184
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 3bp deletion in the fourth and fifth region)
<400> 245
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagaa augaaggaau gcaacnnnnn nnnnnnnnnn nnnnnuuuua 180
uuuu 184
<210> 246
<211> 182
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 4bp deletion in the fourth and fifth region)
<400> 246
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucgaaa gaaggaaugc aacnnnnnnn nnnnnnnnnn nnnuuuuauu 180
uu 182
<210> 247
<211> 180
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 5bp deletion in the fourth and fifth region)
<400> 247
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauugaaaa aggaaugcaa cnnnnnnnnn nnnnnnnnnn nuuuuauuuu 180
180
<210> 248
<211> 178
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 6bp deletion in the fourth and fifth region)
<400> 248
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaaugaaaag gaaugcaacn nnnnnnnnnn nnnnnnnnnu uuuauuuu 178
<210> 249
<211> 176
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, 7bp deletion in the fourth and fifth region)
<400> 249
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaagaaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu uauuuu 176
<210> 250
<211> 147
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, modified first and second region)
<400> 250
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa uucauuugaa agaaugaagg aaugcaacnn 120
nnnnnnnnnn nnnnnnnnuu uuauuuu 147
<210> 251
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, modified first, fourth and fifth region)
<400> 251
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaagaaagga 120
augcaacnnn nnnnnnnnnn nnnnnnnuuu uauuuu 156
<210> 252
<211> 153
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, modified second, fourth and fifth region)
<400> 252
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug 120
caacnnnnnn nnnnnnnnnn nnnnuuuuau uuu 153
<210> 253
<211> 130
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA(mature form, modified first, second, fourth and fifth
region)
<400> 253
accgcuucac uuagagugaa gguggggcug cuugcaucag ccuaaugucg agaagugcuu 60
ucuucggaaa guaacccucg aaacaaagaa aggaaugcaa cnnnnnnnnn nnnnnnnnnn 120
nuuuuauuuu 130
<210> 254
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 254
uuuauuuauu u 11
<210> 255
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 255
uuuuauuuuu 10
<210> 256
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 256
uuuuauuuuu u 11
<210> 257
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 257
uuuguuuguu u 11
<210> 258
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 258
uuuuguuuuu 10
<210> 259
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 259
uuuuguuuuu u 11
<210> 260
<211> 529
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas14a1 amino acid sequence
<400> 260
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro
<210> 261
<211> 529
<212> PRT
<213> Artificial Sequence
<220>
<223> dCas12f1 R490A protein
<400> 261
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Ala Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro
<210> 262
<211> 529
<212> PRT
<213> Artificial Sequence
<220>
<223> dCas12f1 R490Q protein
<400> 262
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Gln Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro
<210> 263
<211> 536
<212> PRT
<213> Artificial Sequence
<220>
<223> N/C-terminal NLS + Cas14a1 amino acid sequence
<400> 263
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro Pro Lys Lys Lys Arg Lys Val
530 535
<210> 264
<211> 529
<212> PRT
<213> Artificial Sequence
<220>
<223> dCas12f1 R490L protein
<400> 264
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Leu Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro
<210> 265
<211> 529
<212> PRT
<213> Artificial Sequence
<220>
<223> dCas12f1 R490W protein
<400> 265
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Trp Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro
<210> 266
<211> 529
<212> PRT
<213> Artificial Sequence
<220>
<223> dCas12f1 D510A protein
<400> 266
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Ala Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro
<210> 267
<211> 529
<212> PRT
<213> Artificial Sequence
<220>
<223> dCas12f1 D510L protein
<400> 267
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Leu Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro
<210> 268
<211> 529
<212> PRT
<213> Artificial Sequence
<220>
<223> dCas12f1 D510V protein
<400> 268
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Val Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro
<210> 269
<211> 529
<212> PRT
<213> Artificial Sequence
<220>
<223> dCas12f1 E422A protein
<400> 269
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Ala Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro
<210> 270
<211> 1586
<212> DNA
<213> Artificial Sequence
<220>
<223> human codon-optimized Cas14a1
<400> 270
atggccaaga acacaattac aaagacactg aagctgagga tcgtgagacc atacaacagc 60
gctgaggtcg agaagattgt ggctgatgaa aagaacaaca gggaaaagat cgccctcgag 120
aagaacaagg ataaggtgaa ggaggcctgc tctaagcacc tgaaagtggc cgcctactgc 180
accacacagg tggagaggaa cgcctgtctg ttttgtaaag ctcggaagct ggatgataag 240
ttttaccaga agctgcgggg ccagttcccc gatgccgtct tttggcagga gattagcgag 300
atcttcagac agctgcagaa gcaggccgcc gagatctaca accagagcct gatcgagctc 360
tactacgaga tcttcatcaa gggcaagggc attgccaacg cctcctccgt ggagcactac 420
ctgagcgacg tgtgctacac aagagccgcc gagctcttta agaacgccgc tatcgcttcc 480
gggctgagga gcaagattaa gagtaacttc cggctcaagg agctgaagaa catgaagagc 540
ggcctgccca ctacaaagag cgacaacttc ccaattccac tggtgaagca gaaggggggc 600
cagtacacag ggttcgagat ttccaaccac aacagcgact ttattattaa gatccccttt 660
ggcaggtggc aggtcaagaa ggagattgac aagtacaggc cctgggagaa gtttgatttc 720
gagcaggtgc agaagagccc caagcctatt tccctgctgc tgtccacaca gcggcggaag 780
aggaacaagg ggtggtctaa ggatgagggg accgaggccg agattaagaa agtgatgaac 840
ggcgactacc agacaagcta catcgaggtc aagcggggca gtaagattgg cgagaagagc 900
gcctggatgc tgaacctgag cattgacgtg ccaaagattg ataagggcgt ggatcccagc 960
atcatcggag ggatcgatgt gggggtcaag agccccctcg tgtgcgccat caacaacgcc 1020
ttcagcaggt acagcatctc cgataacgac ctgttccact ttaacaagaa gatgttcgcc 1080
cggcggagga ttttgctcaa gaagaaccgg cacaagcggg ccggacacgg ggccaagaac 1140
aagctcaagc ccatcactat cctgaccgag aagagcgaga ggttcaggaa gaagctcatc 1200
gagagatggg cctgcgagat cgccgatttc tttattaaga acaaggtcgg aacagtgcag 1260
atggagaacc tcgagagcat gaagaggaag gaggattcct acttcaacat tcggctgagg 1320
gggttctggc cctacgctga gatgcagaac aagattgagt ttaagctgaa gcagtacggg 1380
attgagatcc ggaaggtggc ccccaacaac accagcaaga cctgcagcaa gtgcgggcac 1440
ctcaacaact acttcaactt cgagtaccgg aagaagaaca agttcccaca cttcaagtgc 1500
gagaagtgca actttaagga gaacgccgat tacaacgccg ccctgaacat cagcaaccct 1560
aagctgaaga gcactaagga ggagcc 1586
<210> 271
<211> 529
<212> PRT
<213> Artificial Sequence
<220>
<223> dCas12f1 D326A protein
<400> 271
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Ala Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro
<210> 272
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> VP64 protein
<400> 272
Met Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
172 176 181 186
Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp
191 196 201
Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu
206 211 216
Asp Met Leu
221
<210> 273
<211> 1628
<212> DNA
<213> Artificial Sequence
<220>
<223> N/C-terminal NLS + Cas14a1 amino acid sequence
<400> 273
atgccaaaga agaagcggaa agtcgccaag aacacaatta caaagacact gaagctgagg 60
atcgtgagac catacaacag cgctgaggtc gagaagattg tggctgatga aaagaacaac 120
agggaaaaga tcgccctcga gaagaacaag gataaggtga aggaggcctg ctctaagcac 180
ctgaaagtgg ccgcctactg caccacacag gtggagagga acgcctgtct gttttgtaaa 240
gctcggaagc tggatgataa gttttaccag aagctgcggg gccagttccc cgatgccgtc 300
ttttggcagg agattagcga gatcttcaga cagctgcaga agcaggccgc cgagatctac 360
aaccagagcc tgatcgagct ctactacgag atcttcatca agggcaaggg cattgccaac 420
gcctcctccg tggagcacta cctgagcgac gtgtgctaca caagagccgc cgagctcttt 480
aagaacgccg ctatcgcttc cgggctgagg agcaagatta agagtaactt ccggctcaag 540
gagctgaaga acatgaagag cggcctgccc actacaaaga gcgacaactt cccaattcca 600
ctggtgaagc agaagggggg ccagtacaca gggttcgaga tttccaacca caacagcgac 660
tttattatta agatcccctt tggcaggtgg caggtcaaga aggagattga caagtacagg 720
ccctgggaga agtttgattt cgagcaggtg cagaagagcc ccaagcctat ttccctgctg 780
ctgtccacac agcggcggaa gaggaacaag gggtggtcta aggatgaggg gaccgaggcc 840
gagattaaga aagtgatgaa cggcgactac cagacaagct acatcgaggt caagcggggc 900
agtaagattg gcgagaagag cgcctggatg ctgaacctga gcattgacgt gccaaagatt 960
gataagggcg tggatcccag catcatcgga gggatcgatg tgggggtcaa gagccccctc 1020
gtgtgcgcca tcaacaacgc cttcagcagg tacagcatct ccgataacga cctgttccac 1080
tttaacaaga agatgttcgc ccggcggagg attttgctca agaagaaccg gcacaagcgg 1140
gccggacacg gggccaagaa caagctcaag cccatcacta tcctgaccga gaagagcgag 1200
aggttcagga agaagctcat cgagagatgg gcctgcgaga tcgccgattt ctttattaag 1260
aacaaggtcg gaacagtgca gatggagaac ctcgagagca tgaagaggaa ggaggattcc 1320
tacttcaaca ttcggctgag ggggttctgg ccctacgctg agatgcagaa caagattgag 1380
tttaagctga agcagtacgg gattgagatc cggaaggtgg cccccaacaa caccagcaag 1440
acctgcagca agtgcgggca cctcaacaac tacttcaact tcgagtaccg gaagaagaac 1500
aagttcccac acttcaagtg cgagaagtgc aactttaagg agaacgccga ttacaacgcc 1560
gccctgaaca tcagcaaccc taagctgaag agcactaagg aggagcccca aagaagaagc 1620
ggaaagtc 1628
<210> 274
<211> 65
<212> PRT
<213> Artificial Sequence
<220>
<223> KRAB amino acids sequence
<400> 274
Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu
1 5 10 15
Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val
20 25 30
Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr
35 40 45
Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu
50 55 60
Val
65
<210> 275
<211> 286
<212> PRT
<213> Artificial Sequence
<220>
<223> MeCP2 amino acids sequence
<400> 275
Val Gln Val Lys Arg Val Leu Glu Lys Ser Pro Gly Lys Leu Leu Val
1 5 10 15
Lys Met Pro Phe Gln Ala Ser Pro Gly Gly Lys Gly Glu Gly Gly Gly
20 25 30
Ala Thr Thr Ser Ala Gln Val Met Val Ile Lys Arg Pro Gly Arg Lys
35 40 45
Arg Lys Ala Glu Ala Asp Pro Gln Ala Ile Pro Lys Lys Arg Gly Arg
50 55 60
Lys Pro Gly Ser Val Val Ala Ala Ala Ala Ala Glu Ala Lys Lys Lys
65 70 75 80
Ala Val Lys Glu Ser Ser Ile Arg Ser Val Gln Glu Thr Val Leu Pro
85 90 95
Ile Lys Lys Arg Lys Thr Arg Glu Thr Val Ser Ile Glu Val Lys Glu
100 105 110
Val Val Lys Pro Leu Leu Val Ser Thr Leu Gly Glu Lys Ser Gly Lys
115 120 125
Gly Leu Lys Thr Cys Lys Ser Pro Gly Arg Lys Ser Lys Glu Ser Ser
130 135 140
Pro Lys Gly Arg Ser Ser Ser Ala Ser Ser Pro Pro Lys Lys Glu His
145 150 155 160
His His His His His His Ala Glu Ser Pro Lys Ala Pro Met Pro Leu
165 170 175
Leu Pro Pro Pro Pro Pro Pro Glu Pro Gln Ser Ser Glu Asp Pro Ile
180 185 190
Ser Pro Pro Glu Pro Gln Asp Leu Ser Ser Ser Ile Cys Lys Glu Glu
195 200 205
Lys Met Pro Arg Ala Gly Ser Leu Glu Ser Asp Gly Cys Pro Lys Glu
210 215 220
Pro Ala Lys Thr Gln Pro Met Val Ala Ala Ala Ala Thr Thr Thr Thr
225 230 235 240
Thr Thr Thr Thr Thr Val Ala Glu Lys Tyr Lys His Arg Gly Glu Gly
245 250 255
Glu Arg Lys Asp Ile Val Ser Ser Ser Met Pro Arg Pro Asn Arg Glu
260 265 270
Glu Pro Val Asp Ser Arg Thr Pro Val Thr Glu Arg Val Ser
275 280 285
<210> 276
<211> 311
<212> PRT
<213> Artificial Sequence
<220>
<223> DNMT3A amino acids sequence
<400> 276
Pro Ser Arg Leu Gln Met Phe Phe Ala Asn Asn His Asp Gln Glu Phe
1 5 10 15
Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala Glu Lys Arg Lys Pro
20 25 30
Ile Arg Val Leu Ser Leu Phe Asp Gly Ile Ala Thr Gly Leu Leu Val
35 40 45
Leu Lys Asp Leu Gly Ile Gln Val Asp Arg Tyr Ile Ala Ser Glu Val
50 55 60
Cys Glu Asp Ser Ile Thr Val Gly Met Val Arg His Gln Gly Lys Ile
65 70 75 80
Met Tyr Val Gly Asp Val Arg Ser Val Thr Gln Lys His Ile Gln Glu
85 90 95
Trp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu
100 105 110
Ser Ile Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg
115 120 125
Leu Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu
130 135 140
Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met
145 150 155 160
Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro
165 170 175
Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr
180 185 190
Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr Val
195 200 205
Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg Ile Ala
210 215 220
Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn Ser Ile Lys
225 230 235 240
Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn Glu Lys Glu Asp
245 250 255
Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe Gly Phe Pro Val His
260 265 270
Tyr Thr Asp Val Ser Asn Met Ser Arg Leu Ala Arg Gln Arg Leu Leu
275 280 285
Gly Arg Ser Trp Ser Val Pro Val Ile Arg His Leu Phe Ala Pro Leu
290 295 300
Lys Glu Tyr Phe Ala Cys Val
305 310
<210> 277
<211> 428
<212> PRT
<213> Artificial Sequence
<220>
<223> HDAC3 amino acids sequence
<400> 277
Met Ala Lys Thr Val Ala Tyr Phe Tyr Asp Pro Asp Val Gly Asn Phe
1 5 10 15
His Tyr Gly Ala Gly His Pro Met Lys Pro His Arg Leu Ala Leu Thr
20 25 30
His Ser Leu Val Leu His Tyr Gly Leu Tyr Lys Lys Met Ile Val Phe
35 40 45
Lys Pro Tyr Gln Ala Ser Gln His Asp Met Cys Arg Phe His Ser Glu
50 55 60
Asp Tyr Ile Asp Phe Leu Gln Arg Val Ser Pro Thr Asn Met Gln Gly
65 70 75 80
Phe Thr Lys Ser Leu Asn Ala Phe Asn Val Gly Asp Asp Cys Pro Val
85 90 95
Phe Pro Gly Leu Phe Glu Phe Cys Ser Arg Tyr Thr Gly Ala Ser Leu
100 105 110
Gln Gly Ala Thr Gln Leu Asn Asn Lys Ile Cys Asp Ile Ala Ile Asn
115 120 125
Trp Ala Gly Gly Leu His His Ala Lys Lys Phe Glu Ala Ser Gly Phe
130 135 140
Cys Tyr Val Asn Asp Ile Val Ile Gly Ile Leu Glu Leu Leu Lys Tyr
145 150 155 160
His Pro Arg Val Leu Tyr Ile Asp Ile Asp Ile His His Gly Asp Gly
165 170 175
Val Gln Glu Ala Phe Tyr Leu Thr Asp Arg Val Met Thr Val Ser Phe
180 185 190
His Lys Tyr Gly Asn Tyr Phe Phe Pro Gly Thr Gly Asp Met Tyr Glu
195 200 205
Val Gly Ala Glu Ser Gly Arg Tyr Tyr Cys Leu Asn Val Pro Leu Arg
210 215 220
Asp Gly Ile Asp Asp Gln Ser Tyr Lys His Leu Phe Gln Pro Val Ile
225 230 235 240
Asn Gln Val Val Asp Phe Tyr Gln Pro Thr Cys Ile Val Leu Gln Cys
245 250 255
Gly Ala Asp Ser Leu Gly Cys Asp Arg Leu Gly Cys Phe Asn Leu Ser
260 265 270
Ile Arg Gly His Gly Glu Cys Val Glu Tyr Val Lys Ser Phe Asn Ile
275 280 285
Pro Leu Leu Val Leu Gly Gly Gly Gly Tyr Thr Val Arg Asn Val Ala
290 295 300
Arg Cys Trp Thr Tyr Glu Thr Ser Leu Leu Val Glu Glu Ala Ile Ser
305 310 315 320
Glu Glu Leu Pro Tyr Ser Glu Tyr Phe Glu Tyr Phe Ala Pro Asp Phe
325 330 335
Thr Leu His Pro Asp Val Ser Thr Arg Ile Glu Asn Gln Asn Ser Arg
340 345 350
Gln Tyr Leu Asp Gln Ile Arg Gln Thr Ile Phe Glu Asn Leu Lys Met
355 360 365
Leu Asn His Ala Pro Ser Val Gln Ile His Asp Val Pro Ala Asp Leu
370 375 380
Leu Thr Tyr Asp Arg Thr Asp Glu Ala Asp Ala Glu Glu Arg Gly Pro
385 390 395 400
Glu Glu Asn Tyr Ser Arg Pro Glu Ala Pro Asn Glu Phe Tyr Asp Gly
405 410 415
Asp His Asp Asn Asp Lys Glu Ser Asp Val Glu Ile
420 425
<210> 278
<211> 7
<212> PRT
<213> simian virus 40
<400> 278
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 279
<211> 16
<212> PRT
<213> mus musculus
<400> 279
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 280
<211> 9
<212> PRT
<213> homo sapiens
<400> 280
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 281
<211> 11
<212> PRT
<213> Homo sapiens
<400> 281
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 282
<211> 38
<212> PRT
<213> mus musculus
<400> 282
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 283
<211> 42
<212> PRT
<213> Homo sapiens
<400> 283
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 284
<211> 8
<212> PRT
<213> Homo sapiens
<400> 284
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 285
<211> 8
<212> PRT
<213> homo sapiens
<400> 285
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 286
<211> 8
<212> PRT
<213> homo sapiens
<400> 286
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 287
<211> 12
<212> PRT
<213> mus musculus
<400> 287
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 288
<211> 5
<212> PRT
<213> Influenza virus
<400> 288
Asp Arg Leu Arg Arg
1 5
<210> 289
<211> 7
<212> PRT
<213> influenza virus
<400> 289
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 290
<211> 10
<212> PRT
<213> Hepatitis D virus
<400> 290
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 291
<211> 10
<212> PRT
<213> mus musculus
<400> 291
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 292
<211> 20
<212> PRT
<213> homo sapiens
<400> 292
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 293
<211> 17
<212> PRT
<213> Homo sapiens
<400> 293
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 294
<211> 181
<212> RNA
<213> Artificial Sequence
<220>
<223> Comperative Example 1.1.1
<400> 294
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu gaaagaauga aggaaugcaa ccacacacac agugggcuac 180
c 181
<210> 295
<211> 190
<212> RNA
<213> Artificial Sequence
<220>
<223> Comperative Example 1.1.2
<400> 295
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu gaaagaauga aggaaugcaa ccacacacac agugggcuac 180
cuuuuauuuu 190
<210> 296
<211> 183
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.1.1
<400> 296
gauaaagugg agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa 60
ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga 120
aacaaauuca uuugaaagaa ugaaggaaug caaccacaca cacagugggc uaccuuuuau 180
uuu 183
<210> 297
<211> 176
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.1.2
<400> 297
uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu gaaggugggc 60
ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaau 120
ucauuugaaa gaaugaagga augcaaccac acacacagug ggcuaccuuu uauuuu 176
<210> 298
<211> 170
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.1.3
<400> 298
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 120
gaaagaauga aggaaugcaa ccacacacac agugggcuac cuuuuauuuu 170
<210> 299
<211> 184
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.1.4
<400> 299
cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaaccacac acacaguggg cuaccuuuua 180
uuuu 184
<210> 300
<211> 179
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.1.5
<400> 300
cuucacugau aaaguggaga accgcuucac caaaagcuuu agagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuug aaagaaugaa ggaaugcaac cacacacaca gugggcuacc uuuuauuuu 179
<210> 301
<211> 169
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.1.6
<400> 301
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuug 120
aaagaaugaa ggaaugcaac cacacacaca gugggcuacc uuuuauuuu 169
<210> 302
<211> 186
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.1.7
<400> 302
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauga aaaugaagga augcaaccac acacacagug ggcuaccuuu 180
uauuuu 186
<210> 303
<211> 182
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.1.8
<400> 303
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucgaaa gaaggaaugc aaccacacac acagugggcu accuuuuauu 180
uu 182
<210> 304
<211> 176
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.1.9
<400> 304
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaagaaagga augcaaccac acacacagug ggcuaccuuu uauuuu 176
<210> 305
<211> 147
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.1.10
<400> 305
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa uucauuugaa agaaugaagg aaugcaacca 120
cacacacagu gggcuaccuu uuauuuu 147
<210> 306
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.1.11
<400> 306
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaagaaagga 120
augcaaccac acacacagug ggcuaccuuu uauuuu 156
<210> 307
<211> 153
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.1.12
<400> 307
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug 120
caaccacaca cacagugggc uaccuuuuau uuu 153
<210> 308
<211> 133
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.1.13
<400> 308
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug caaccacaca cacagugggc 120
uaccuuuuau uuu 133
<210> 309
<211> 181
<212> RNA
<213> Artificial Sequence
<220>
<223> Comperative Example 1.2.1
<400> 309
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu gaaagaauga aggaaugcaa ccauccccag gacacacaca 180
c 181
<210> 310
<211> 190
<212> RNA
<213> Artificial Sequence
<220>
<223> Comperative Example 1.2.2
<400> 310
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu gaaagaauga aggaaugcaa ccauccccag gacacacaca 180
cuuuuauuuu 190
<210> 311
<211> 183
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.2.1
<400> 311
gauaaagugg agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa 60
ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga 120
aacaaauuca uuugaaagaa ugaaggaaug caaccauccc caggacacac acacuuuuau 180
uuu 183
<210> 312
<211> 176
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.2.2
<400> 312
uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu gaaggugggc 60
ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaau 120
ucauuugaaa gaaugaagga augcaaccau ccccaggaca cacacacuuu uauuuu 176
<210> 313
<211> 170
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.2.3
<400> 313
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 120
gaaagaauga aggaaugcaa ccauccccag gacacacaca cuuuuauuuu 170
<210> 314
<211> 184
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.2.4
<400> 314
cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaaccaucc ccaggacaca cacacuuuua 180
uuuu 184
<210> 315
<211> 178
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.2.5
<400> 315
cuucacugau aaaguggaga accgcuucac caaaagcuua gagaacuuga gugaaggugg 60
gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc cucgaaacaa 120
auucauuuga aagaaugaag gaaugcaacc auccccagga cacacacacu uuuauuuu 178
<210> 316
<211> 167
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.2.6
<400> 316
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa uucauuugaa 120
agaaugaagg aaugcaacca uccccaggac acacacacuu uuauuuu 167
<210> 317
<211> 186
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.2.7
<400> 317
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauga aaaugaagga augcaaccau ccccaggaca cacacacuuu 180
uauuuu 186
<210> 318
<211> 182
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.2.8
<400> 318
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucgaaa gaaggaaugc aaccaucccc aggacacaca cacuuuuauu 180
uu 182
<210> 319
<211> 176
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.2.9
<400> 319
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaagaaagga augcaaccau ccccaggaca cacacacuuu uauuuu 176
<210> 320
<211> 147
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.2.10
<400> 320
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa uucauuugaa agaaugaagg aaugcaacca 120
uccccaggac acacacacuu uuauuuu 147
<210> 321
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.2.11
<400> 321
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaagaaagga 120
augcaaccau ccccaggaca cacacacuuu uauuuu 156
<210> 322
<211> 153
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.2.12
<400> 322
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug 120
caaccauccc caggacacac acacuuuuau uuu 153
<210> 323
<211> 133
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.2.13
<400> 323
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug caaccauccc caggacacac 120
acacuuuuau uuu 133
<210> 324
<211> 181
<212> RNA
<213> Artificial Sequence
<220>
<223> Comperative Example 1.3.1
<400> 324
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu gaaagaauga aggaaugcaa cagaacacau accccugggc 180
c 181
<210> 325
<211> 190
<212> RNA
<213> Artificial Sequence
<220>
<223> Comperative Example 1.3.2
<400> 325
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu gaaagaauga aggaaugcaa cagaacacau accccugggc 180
cuuuuauuuu 190
<210> 326
<211> 183
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.3.1
<400> 326
gauaaagugg agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa 60
ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga 120
aacaaauuca uuugaaagaa ugaaggaaug caacagaaca cauaccccug ggccuuuuau 180
uuu 183
<210> 327
<211> 176
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.3.2
<400> 327
uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu gaaggugggc 60
ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaau 120
ucauuugaaa gaaugaagga augcaacaga acacauaccc cugggccuuu uauuuu 176
<210> 328
<211> 170
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.3.3
<400> 328
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 120
gaaagaauga aggaaugcaa cagaacacau accccugggc cuuuuauuuu 170
<210> 329
<211> 184
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.3.4
<400> 329
cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaacagaac acauaccccu gggccuuuua 180
uuuu 184
<210> 330
<211> 179
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.3.5
<400> 330
cuucacugau aaaguggaga accgcuucac caaaagcuuu agagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuug aaagaaugaa ggaaugcaac agaacacaua ccccugggcc uuuuauuuu 179
<210> 331
<211> 169
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.3.6
<400> 331
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuug 120
aaagaaugaa ggaaugcaac agaacacaua ccccugggcc uuuuauuuu 169
<210> 332
<211> 186
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.3.7
<400> 332
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauga aaaugaagga augcaacaga acacauaccc cugggccuuu 180
uauuuu 186
<210> 333
<211> 182
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.3.8
<400> 333
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucgaaa gaaggaaugc aacagaacac auaccccugg gccuuuuauu 180
uu 182
<210> 334
<211> 176
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.3.9
<400> 334
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaagaaagga augcaacaga acacauaccc cugggccuuu uauuuu 176
<210> 335
<211> 147
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.3.10
<400> 335
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa uucauuugaa agaaugaagg aaugcaacag 120
aacacauacc ccugggccuu uuauuuu 147
<210> 336
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.3.11
<400> 336
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaagaaagga 120
augcaacaga acacauaccc cugggccuuu uauuuu 156
<210> 337
<211> 153
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.3.12
<400> 337
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug 120
caacagaaca cauaccccug ggccuuuuau uuu 153
<210> 338
<211> 133
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 1.3.13
<400> 338
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug caacagaaca cauaccccug 120
ggccuuuuau uuu 133
<210> 339
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer sequence for targeting DY2
<400> 339
cacacacaca gtgggctacc 20
<210> 340
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer sequence for targeting DY10
<400> 340
catccccagg acacacacac 20
<210> 341
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer sequence for targeting Intergenic-22
<400> 341
agaacacata cccctgggcc 20
<210> 342
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 342
ccgcuucacu uaggugaagg ugg 23
<210> 343
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 343
ccguuaggug g 11
<210> 344
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 344
ccgcuuaggg ugg 13
<210> 345
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 345
ccgcuuuaga ggugg 15
<210> 346
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 346
ccgcuuuuag aaggugg 17
<210> 347
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 347
ccgcuucuua ggaaggugg 19
<210> 348
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 348
ccgcuucauu agugaaggug g 21
<210> 349
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 349
ccgcuucacu uaggugaagg ugg 23
<210> 350
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 350
ccgcuucacu uagagugaag gugg 24
<210> 351
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 351
ccgcuucacc uuaggaguga aggugg 26
<210> 352
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 352
ccgcuucacc auuagugagu gaaggugg 28
<210> 353
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 353
ccgcuucacc aauuaguuga gugaaggugg 30
<210> 354
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 354
ccgcuucacc aaauuagcuu gagugaaggu gg 32
<210> 355
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 355
ccgcuucacc aaaauuagac uugagugaag gugg 34
<210> 356
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 356
ccgcuucacc aaaaguuaga acuugaguga aggugg 36
<210> 357
<211> 38
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 357
ccgcuucacc aaaagcuuag gaacuugagu gaaggugg 38
<210> 358
<211> 40
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 358
ccgcuucacc aaaagcuuua gagaacuuga gugaaggugg 40
<210> 359
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 359
ccgcuucacc aaaagcuguu aguagaacuu gagugaaggu gg 42
<210> 360
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 360
ccgcuucacc aaaagcuguu aguuagaacu ugagugaagg ugg 43
<210> 361
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 361
ccgcuucacc aaaagcuguu uagauuagaa cuugagugaa ggugg 45
<210> 362
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region
<400> 362
ccgcuucacc aaaagcuguc uuaggauuag aacuugagug aaggugg 47
<210> 363
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 363
ccgcuuuuag 10
<210> 364
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 364
ccgcuucuua g 11
<210> 365
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 365
ccgcuucauu ag 12
<210> 366
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 366
ccgcuucacu uag 13
<210> 367
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 367
ccgcuucacc uuag 14
<210> 368
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 368
ccgcuucacc auuag 15
<210> 369
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 369
ccgcuucacc aauuag 16
<210> 370
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 370
ccgcuucacc aaauuag 17
<210> 371
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 371
ccgcuucacc aaaauuag 18
<210> 372
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 372
ccgcuucacc aaaaguuag 19
<210> 373
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 373
ccgcuucacc aaaagcuuag 20
<210> 374
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 374
ccgcuucacc aaaagcuuua g 21
<210> 375
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 375
ccgcuucacc aaaagcuguu ag 22
<210> 376
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 376
ccgcuucacc aaaagcuguu uag 23
<210> 377
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 377
ccgcuucacc aaaagcuguc uuag 24
<210> 378
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> modified second region, upper part (5' to UUAG)
<400> 378
ccgcuucacc aaaagcuguc cuuag 25
<210> 379
<211> 119
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, the first region is deleted)
<400> 379
ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuu 119
<210> 380
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, the second region is deleted)
<400> 380
cuucacugau aaaguggaga agcugcuugc aucagccuaa ugucgagaag ugcuuucuuc 60
ggaaaguaac ccucgaaaca aauucauuu 89
<210> 381
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 381
cuucacugau aaaguggaga aggcugcuug caucagccua augucgagaa gugcuuucuu 60
cggaaaguaa cccucgaaac aaauucauuu 90
<210> 382
<211> 94
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 382
cuucacugau aaaguggaga auuagggcug cuugcaucag ccuaaugucg agaagugcuu 60
ucuucggaaa guaacccucg aaacaaauuc auuu 94
<210> 383
<211> 96
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 383
cuucacugau aaaguggaga acuuaggggc ugcuugcauc agccuaaugu cgagaagugc 60
uuucuucgga aaguaacccu cgaaacaaau ucauuu 96
<210> 384
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 384
cuucacugau aaaguggaga acuuaguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa uucauuu 97
<210> 385
<211> 99
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 385
cuucacugau aaaguggaga accuuaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuu 99
<210> 386
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 386
cuucacugau aaaguggaga accguuaggu gggcugcuug caucagccua augucgagaa 60
gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 100
<210> 387
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 387
cuucacugau aaaguggaga accgcuuagg gugggcugcu ugcaucagcc uaaugucgag 60
aagugcuuuc uucggaaagu aacccucgaa acaaauucau uu 102
<210> 388
<211> 104
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 388
cuucacugau aaaguggaga accgcuuuag aggugggcug cuugcaucag ccuaaugucg 60
agaagugcuu ucuucggaaa guaacccucg aaacaaauuc auuu 104
<210> 389
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 389
cuucacugau aaaguggaga accgcuuuua gaaggugggc ugcuugcauc agccuaaugu 60
cgagaagugc uuucuucgga aaguaacccu cgaaacaaau ucauuu 106
<210> 390
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 390
cuucacugau aaaguggaga accgcuucuu aggaaggugg gcugcuugca ucagccuaau 60
gucgagaagu gcuuucuucg gaaaguaacc cucgaaacaa auucauuu 108
<210> 391
<211> 110
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 391
cuucacugau aaaguggaga accgcuucau uagugaaggu gggcugcuug caucagccua 60
augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 110
<210> 392
<211> 112
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 392
cuucacugau aaaguggaga accgcuucac uuaggugaag gugggcugcu ugcaucagcc 60
uaaugucgag aagugcuuuc uucggaaagu aacccucgaa acaaauucau uu 112
<210> 393
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 393
cuucacugau aaaguggaga accgcuucac uuagagugaa ggugggcugc uugcaucagc 60
cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca uuu 113
<210> 394
<211> 115
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 394
cuucacugau aaaguggaga accgcuucac cuuaggagug aaggugggcu gcuugcauca 60
gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu cauuu 115
<210> 395
<211> 117
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 395
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa uucauuu 117
<210> 396
<211> 119
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 396
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuu 119
<210> 397
<211> 121
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 397
cuucacugau aaaguggaga accgcuucac caaauuagcu ugagugaagg ugggcugcuu 60
gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaauucauu 120
u 121
<210> 398
<211> 123
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 398
cuucacugau aaaguggaga accgcuucac caaaauuaga cuugagugaa ggugggcugc 60
uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca 120
uuu 123
<210> 399
<211> 125
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 399
cuucacugau aaaguggaga accgcuucac caaaaguuag aacuugagug aaggugggcu 60
gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120
cauuu 125
<210> 400
<211> 127
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 400
cuucacugau aaaguggaga accgcuucac caaaagcuua ggaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucauuu 127
<210> 401
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 401
cuucacugau aaaguggaga accgcuucac caaaagcuuu agagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuu 129
<210> 402
<211> 131
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 402
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguagaacu ugagugaagg 60
ugggcugcuu gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa 120
caaauucauu u 131
<210> 403
<211> 132
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 403
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguuagaac uugagugaag 60
gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa 120
acaaauucau uu 132
<210> 404
<211> 134
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 404
cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuu 134
<210> 405
<211> 136
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 405
cuucacugau aaaguggaga accgcuucac caaaagcugu cuuaggauua gaacuugagu 60
gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 120
cgaaacaaau ucauuu 136
<210> 406
<211> 138
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified second region)
<400> 406
cuucacugau aaaguggaga accgcuucac caaaagcugu ccuuagggau uagaacuuga 60
gugaaggugg gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc 120
cucgaaacaa auucauuu 138
<210> 407
<211> 110
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, the second region is deleted)
<400> 407
cuucacugau aaaguggaga agcugcuugc aucagccuaa ugucgagaag ugcuuucuuc 60
ggaaaguaac ccucgaaaca aauucauuug aaagaaugaa ggaaugcaac 110
<210> 408
<211> 111
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 408
cuucacugau aaaguggaga aggcugcuug caucagccua augucgagaa gugcuuucuu 60
cggaaaguaa cccucgaaac aaauucauuu gaaagaauga aggaaugcaa c 111
<210> 409
<211> 115
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 409
cuucacugau aaaguggaga auuagggcug cuugcaucag ccuaaugucg agaagugcuu 60
ucuucggaaa guaacccucg aaacaaauuc auuugaaaga augaaggaau gcaac 115
<210> 410
<211> 117
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 410
cuucacugau aaaguggaga acuuaggggc ugcuugcauc agccuaaugu cgagaagugc 60
uuucuucgga aaguaacccu cgaaacaaau ucauuugaaa gaaugaagga augcaac 117
<210> 411
<211> 118
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 411
cuucacugau aaaguggaga acuuaguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa uucauuugaa agaaugaagg aaugcaac 118
<210> 412
<211> 120
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 412
cuucacugau aaaguggaga accuuaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuug aaagaaugaa ggaaugcaac 120
120
<210> 413
<211> 121
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 413
cuucacugau aaaguggaga accguuaggu gggcugcuug caucagccua augucgagaa 60
gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu gaaagaauga aggaaugcaa 120
c 121
<210> 414
<211> 123
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 414
cuucacugau aaaguggaga accgcuuagg gugggcugcu ugcaucagcc uaaugucgag 60
aagugcuuuc uucggaaagu aacccucgaa acaaauucau uugaaagaau gaaggaaugc 120
aac 123
<210> 415
<211> 125
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 415
cuucacugau aaaguggaga accgcuuuag aggugggcug cuugcaucag ccuaaugucg 60
agaagugcuu ucuucggaaa guaacccucg aaacaaauuc auuugaaaga augaaggaau 120
gcaac 125
<210> 416
<211> 127
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 416
cuucacugau aaaguggaga accgcuuuua gaaggugggc ugcuugcauc agccuaaugu 60
cgagaagugc uuucuucgga aaguaacccu cgaaacaaau ucauuugaaa gaaugaagga 120
augcaac 127
<210> 417
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 417
cuucacugau aaaguggaga accgcuucuu aggaaggugg gcugcuugca ucagccuaau 60
gucgagaagu gcuuucuucg gaaaguaacc cucgaaacaa auucauuuga aagaaugaag 120
gaaugcaac 129
<210> 418
<211> 131
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 418
cuucacugau aaaguggaga accgcuucau uagugaaggu gggcugcuug caucagccua 60
augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu gaaagaauga 120
aggaaugcaa c 131
<210> 419
<211> 133
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 419
cuucacugau aaaguggaga accgcuucac uuaggugaag gugggcugcu ugcaucagcc 60
uaaugucgag aagugcuuuc uucggaaagu aacccucgaa acaaauucau uugaaagaau 120
gaaggaaugc aac 133
<210> 420
<211> 134
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 420
cuucacugau aaaguggaga accgcuucac uuagagugaa ggugggcugc uugcaucagc 60
cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca uuugaaagaa 120
ugaaggaaug caac 134
<210> 421
<211> 136
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 421
cuucacugau aaaguggaga accgcuucac cuuaggagug aaggugggcu gcuugcauca 60
gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu cauuugaaag 120
aaugaaggaa ugcaac 136
<210> 422
<211> 138
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 422
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa uucauuugaa 120
agaaugaagg aaugcaac 138
<210> 423
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 423
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuug 120
aaagaaugaa ggaaugcaac 140
<210> 424
<211> 142
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 424
cuucacugau aaaguggaga accgcuucac caaauuagcu ugagugaagg ugggcugcuu 60
gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaauucauu 120
ugaaagaaug aaggaaugca ac 142
<210> 425
<211> 144
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 425
cuucacugau aaaguggaga accgcuucac caaaauuaga cuugagugaa ggugggcugc 60
uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca 120
uuugaaagaa ugaaggaaug caac 144
<210> 426
<211> 146
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 426
cuucacugau aaaguggaga accgcuucac caaaaguuag aacuugagug aaggugggcu 60
gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120
cauuugaaag aaugaaggaa ugcaac 146
<210> 427
<211> 148
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 427
cuucacugau aaaguggaga accgcuucac caaaagcuua ggaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucauuugaa agaaugaagg aaugcaac 148
<210> 428
<211> 150
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 428
cuucacugau aaaguggaga accgcuucac caaaagcuuu agagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuug aaagaaugaa ggaaugcaac 150
<210> 429
<211> 152
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 429
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguagaacu ugagugaagg 60
ugggcugcuu gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa 120
caaauucauu ugaaagaaug aaggaaugca ac 152
<210> 430
<211> 153
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 430
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguuagaac uugagugaag 60
gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa 120
acaaauucau uugaaagaau gaaggaaugc aac 153
<210> 431
<211> 155
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 431
cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaac 155
<210> 432
<211> 157
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 432
cuucacugau aaaguggaga accgcuucac caaaagcugu cuuaggauua gaacuugagu 60
gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 120
cgaaacaaau ucauuugaaa gaaugaagga augcaac 157
<210> 433
<211> 159
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified second region)
<400> 433
cuucacugau aaaguggaga accgcuucac caaaagcugu ccuuagggau uagaacuuga 60
gugaaggugg gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc 120
cucgaaacaa auucauuuga aagaaugaag gaaugcaac 159
<210> 434
<211> 55
<212> RNA
<213> Artificial Sequence
<220>
<223> modified third region
<400> 434
gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc cucga 55
<210> 435
<211> 53
<212> RNA
<213> Artificial Sequence
<220>
<223> modified third region
<400> 435
gcugcuugca ucagccuaau gucgagaagu gcuuuuucga aaguaacccu cga 53
<210> 436
<211> 51
<212> RNA
<213> Artificial Sequence
<220>
<223> modified third region
<400> 436
gcugcuugca ucagccuaau gucgagaagu gcuuuucgaa guaacccucg a 51
<210> 437
<211> 51
<212> RNA
<213> Artificial Sequence
<220>
<223> modified third region
<400> 437
gcugcuugca ucagccuaau gucgagaagu gcucuucgga guaacccucg a 51
<210> 438
<211> 49
<212> RNA
<213> Artificial Sequence
<220>
<223> modified third region
<400> 438
gcugcuugca ucagccuaau gucgagaagu gcuuucgagu aacccucga 49
<210> 439
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> modified third region
<400> 439
gcugcuugca ucagccuaau gucgagaagu gcuucgguaa cccucga 47
<210> 440
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> modified third region
<400> 440
gcugcuugca ucagccuaau gucgagaagu guucguaacc cucga 45
<210> 441
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> modified third region
<400> 441
gcugcuugca ucagccuaau gucgagaagu uucgaacccu cga 43
<210> 442
<211> 41
<212> RNA
<213> Artificial Sequence
<220>
<223> modified third region
<400> 442
gcugcuugca ucagccuaau gucgagaagu ucgacccucg a 41
<210> 443
<211> 40
<212> RNA
<213> Artificial Sequence
<220>
<223> modified third region
<400> 443
gcugcuugca ucagccuaau gucgagaagu ucgcccucga 40
<210> 444
<211> 39
<212> RNA
<213> Artificial Sequence
<220>
<223> modified third region
<400> 444
gcugcuugca ucagccuaau gucgagaauu cgcccucga 39
<210> 445
<211> 38
<212> RNA
<213> Artificial Sequence
<220>
<223> modified third region
<400> 445
gcugcuugca ucagccuaau gucgagaauu cgccucga 38
<210> 446
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> modified third region
<400> 446
gcugcuugca ucagccuaau gucgagauuc gccucga 37
<210> 447
<211> 35
<212> RNA
<213> Artificial Sequence
<220>
<223> modified third region
<400> 447
gcugcuugca ucagccuaau gucgaguucg cucga 35
<210> 448
<211> 138
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified third region)
<400> 448
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuuuuc gaaaguaacc 120
cucgaaacaa auucauuu 138
<210> 449
<211> 136
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified third region)
<400> 449
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuuucg aaguaacccu 120
cgaaacaaau ucauuu 136
<210> 450
<211> 136
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified third region)
<400> 450
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcucuucg gaguaacccu 120
cgaaacaaau ucauuu 136
<210> 451
<211> 134
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified third region)
<400> 451
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucga guaacccucg 120
aaacaaauuc auuu 134
<210> 452
<211> 132
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified third region)
<400> 452
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuucggu aacccucgaa 120
acaaauucau uu 132
<210> 453
<211> 130
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified third region)
<400> 453
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa guguucguaa cccucgaaac 120
aaauucauuu 130
<210> 454
<211> 128
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified third region)
<400> 454
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa guuucgaacc cucgaaacaa 120
auucauuu 128
<210> 455
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified third region)
<400> 455
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa guucgacccu cgaaacaaau 120
ucauuu 126
<210> 456
<211> 125
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified third region)
<400> 456
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa guucgcccuc gaaacaaauu 120
cauuu 125
<210> 457
<211> 124
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified third region)
<400> 457
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa uucgcccucg aaacaaauuc 120
auuu 124
<210> 458
<211> 123
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified third region)
<400> 458
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa uucgccucga aacaaauuca 120
uuu 123
<210> 459
<211> 122
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified third region)
<400> 459
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagau ucgccucgaa acaaauucau 120
uu 122
<210> 460
<211> 120
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA(mature form, having modified third region)
<400> 460
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgaguu cgcucgaaac aaauucauuu 120
120
<210> 461
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified third region)
<400> 461
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu gaaagaauga aggaaugcaa c 161
<210> 462
<211> 159
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified third region)
<400> 462
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuuuuc gaaaguaacc 120
cucgaaacaa auucauuuga aagaaugaag gaaugcaac 159
<210> 463
<211> 157
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified third region)
<400> 463
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuuucg aaguaacccu 120
cgaaacaaau ucauuugaaa gaaugaagga augcaac 157
<210> 464
<211> 157
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified third region)
<400> 464
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcucuucg gaguaacccu 120
cgaaacaaau ucauuugaaa gaaugaagga augcaac 157
<210> 465
<211> 155
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified third region)
<400> 465
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucga guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaac 155
<210> 466
<211> 153
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified third region)
<400> 466
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuucggu aacccucgaa 120
acaaauucau uugaaagaau gaaggaaugc aac 153
<210> 467
<211> 151
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified third region)
<400> 467
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa guguucguaa cccucgaaac 120
aaauucauuu gaaagaauga aggaaugcaa c 151
<210> 468
<211> 149
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified third region)
<400> 468
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa guuucgaacc cucgaaacaa 120
auucauuuga aagaaugaag gaaugcaac 149
<210> 469
<211> 147
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified third region)
<400> 469
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa guucgacccu cgaaacaaau 120
ucauuugaaa gaaugaagga augcaac 147
<210> 470
<211> 146
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified third region)
<400> 470
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa guucgcccuc gaaacaaauu 120
cauuugaaag aaugaaggaa ugcaac 146
<210> 471
<211> 145
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified third region)
<400> 471
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa uucgcccucg aaacaaauuc 120
auuugaaaga augaaggaau gcaac 145
<210> 472
<211> 144
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified third region)
<400> 472
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa uucgccucga aacaaauuca 120
uuugaaagaa ugaaggaaug caac 144
<210> 473
<211> 143
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified third region)
<400> 473
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagau ucgccucgaa acaaauucau 120
uugaaagaau gaaggaaugc aac 143
<210> 474
<211> 141
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, having modified third region)
<400> 474
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgaguu cgcucgaaac aaauucauuu 120
gaaagaauga aggaaugcaa c 141
<210> 475
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> 476%intermediate sequence of modified third region
<400> 475
gcugcuugca ucagccuaau gucgag 26
<210> 476
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of modified third region
<400> 476
aaguucgacc 10
<210> 477
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of modified third region
<400> 477
aaguuucgaa cc 12
<210> 478
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of modified third region
<400> 478
aaguguucgu aacc 14
<210> 479
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of modified third region
<400> 479
aagugcuucg guaacc 16
<210> 480
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of modified third region
<400> 480
aagugcuuuc gaguaacc 18
<210> 481
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of modified third region
<400> 481
aagugcucuu cggaguaacc 20
<210> 482
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of modified third region
<400> 482
aagugcuuuu cgaaguaacc 20
<210> 483
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of modified third region
<400> 483
aagugcuuuu ucgaaaguaa cc 22
<210> 484
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> intermediate sequence of modified third region
<400> 484
aagugcuuuc uucggaaagu aacc 24
<210> 485
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> deleted part of modified third region, upper stream
<400> 485
aagugcuuuc 10
<210> 486
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> deleted part of modified third region, lower stream
<400> 486
gaaaguaacc 10
<210> 487
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered scaffold(mature form, the first region is deleted)
<400> 487
ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuug 120
aaagaaugaa ggaaugcaac 140
<210> 488
<211> 125
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.1.1
<400> 488
accgcuucau uaggaaggug ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc 60
ggaaaguaac ccucgaaaca aagaaaggaa ugcaaccaca cacacagugg gcuaccuuuu 120
auuuu 125
<210> 489
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.1.2
<400> 489
accgcuucau uagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu 60
cggaaaguaa cccucgaaac aaagaaagga augcaaccac acacacagug ggcuaccuuu 120
uauuuu 126
<210> 490
<211> 128
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.1.3
<400> 490
accgcuucac uuaggugaag gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc 60
uucggaaagu aacccucgaa acaaagaaag gaaugcaacc acacacacag ugggcuaccu 120
uuuauuuu 128
<210> 491
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.1.4
<400> 491
accgcuucac uuagagugaa ggugggcugc uugcaucagc cuaaugucga gaagugcuuu 60
cuucggaaag uaacccucga aacaaagaaa ggaaugcaac cacacacaca gugggcuacc 120
uuuuauuuu 129
<210> 492
<211> 131
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.1.5
<400> 492
accgcuucac cuuaggagug aaggugggcu gcuugcauca gccuaauguc gagaagugcu 60
uucuucggaa aguaacccuc gaaacaaaga aaggaaugca accacacaca cagugggcua 120
ccuuuuauuu u 131
<210> 493
<211> 135
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.1.6
<400> 493
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aagaaaggaa ugcaaccaca cacacagugg 120
gcuaccuuuu auuuu 135
<210> 494
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.1.7
<400> 494
accgcuucac caaauuagcu ugagugaagg ugggcugcuu gcaucagccu aaugucgaga 60
agugcuuucu ucggaaagua acccucgaaa caaagaaagg aaugcaacca cacacacagu 120
gggcuaccuu uuauuuu 137
<210> 495
<211> 139
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.1.8
<400> 495
accgcuucac caaaauuaga cuugagugaa ggugggcugc uugcaucagc cuaaugucga 60
gaagugcuuu cuucggaaag uaacccucga aacaaagaaa ggaaugcaac cacacacaca 120
gugggcuacc uuuuauuuu 139
<210> 496
<211> 141
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.1.9
<400> 496
accgcuucac caaaaguuag aacuugagug aaggugggcu gcuugcauca gccuaauguc 60
gagaagugcu uucuucggaa aguaacccuc gaaacaaaga aaggaaugca accacacaca 120
cagugggcua ccuuuuauuu u 141
<210> 497
<211> 143
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.1.10
<400> 497
accgcuucac caaaagcuua ggaacuugag ugaagguggg cugcuugcau cagccuaaug 60
ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug caaccacaca 120
cacagugggc uaccuuuuau uuu 143
<210> 498
<211> 145
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.1.11
<400> 498
accgcuucac caaaagcuuu agagaacuug agugaaggug ggcugcuugc aucagccuaa 60
ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aagaaaggaa ugcaaccaca 120
cacacagugg gcuaccuuuu auuuu 145
<210> 499
<211> 147
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.1.12
<400> 499
accgcuucac caaaagcuuu aguuagaacu ugagugaagg ugggcugcuu gcaucagccu 60
aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaagaaagg aaugcaacca 120
cacacacagu gggcuaccuu uuauuuu 147
<210> 500
<211> 150
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.1.13
<400> 500
accgcuucac caaaagcugu uuagauuaga acuugaguga aggugggcug cuugcaucag 60
ccuaaugucg agaagugcuu ucuucggaaa guaacccucg aaacaaagaa aggaaugcaa 120
ccacacacac agugggcuac cuuuuauuuu 150
<210> 501
<211> 152
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.1.14
<400> 501
accgcuucac caaaagcugu cuuaggauua gaacuugagu gaaggugggc ugcuugcauc 60
agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaag aaaggaaugc 120
aaccacacac acagugggcu accuuuuauu uu 152
<210> 502
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.1.15
<400> 502
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaagaaagga 120
augcaaccac acacacagug ggcuaccuuu uauuuu 156
<210> 503
<211> 125
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.2.1
<400> 503
accgcuucau uaggaaggug ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc 60
ggaaaguaac ccucgaaaca aagaaaggaa ugcaaccauc cccaggacac acacacuuuu 120
auuuu 125
<210> 504
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.2.2
<400> 504
accgcuucau uagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu 60
cggaaaguaa cccucgaaac aaagaaagga augcaaccau ccccaggaca cacacacuuu 120
uauuuu 126
<210> 505
<211> 128
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.2.3
<400> 505
accgcuucac uuaggugaag gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc 60
uucggaaagu aacccucgaa acaaagaaag gaaugcaacc auccccagga cacacacacu 120
uuuauuuu 128
<210> 506
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.2.4
<400> 506
accgcuucac uuagagugaa ggugggcugc uugcaucagc cuaaugucga gaagugcuuu 60
cuucggaaag uaacccucga aacaaagaaa ggaaugcaac cauccccagg acacacacac 120
uuuuauuuu 129
<210> 507
<211> 131
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.2.5
<400> 507
accgcuucac cuuaggagug aaggugggcu gcuugcauca gccuaauguc gagaagugcu 60
uucuucggaa aguaacccuc gaaacaaaga aaggaaugca accaucccca ggacacacac 120
acuuuuauuu u 131
<210> 508
<211> 135
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.2.6
<400> 508
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aagaaaggaa ugcaaccauc cccaggacac 120
acacacuuuu auuuu 135
<210> 509
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.2.7
<400> 509
accgcuucac caaauuagcu ugagugaagg ugggcugcuu gcaucagccu aaugucgaga 60
agugcuuucu ucggaaagua acccucgaaa caaagaaagg aaugcaacca uccccaggac 120
acacacacuu uuauuuu 137
<210> 510
<211> 139
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.2.8
<400> 510
accgcuucac caaaauuaga cuugagugaa ggugggcugc uugcaucagc cuaaugucga 60
gaagugcuuu cuucggaaag uaacccucga aacaaagaaa ggaaugcaac cauccccagg 120
acacacacac uuuuauuuu 139
<210> 511
<211> 141
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.2.9
<400> 511
accgcuucac caaaaguuag aacuugagug aaggugggcu gcuugcauca gccuaauguc 60
gagaagugcu uucuucggaa aguaacccuc gaaacaaaga aaggaaugca accaucccca 120
ggacacacac acuuuuauuu u 141
<210> 512
<211> 143
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.2.10
<400> 512
accgcuucac caaaagcuua ggaacuugag ugaagguggg cugcuugcau cagccuaaug 60
ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug caaccauccc 120
caggacacac acacuuuuau uuu 143
<210> 513
<211> 145
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.2.11
<400> 513
accgcuucac caaaagcuuu agagaacuug agugaaggug ggcugcuugc aucagccuaa 60
ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aagaaaggaa ugcaaccauc 120
cccaggacac acacacuuuu auuuu 145
<210> 514
<211> 147
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.2.12
<400> 514
accgcuucac caaaagcuuu aguuagaacu ugagugaagg ugggcugcuu gcaucagccu 60
aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaagaaagg aaugcaacca 120
uccccaggac acacacacuu uuauuuu 147
<210> 515
<211> 150
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.2.13
<400> 515
accgcuucac caaaagcugu uuagauuaga acuugaguga aggugggcug cuugcaucag 60
ccuaaugucg agaagugcuu ucuucggaaa guaacccucg aaacaaagaa aggaaugcaa 120
ccauccccag gacacacaca cuuuuauuuu 150
<210> 516
<211> 152
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.2.14
<400> 516
accgcuucac caaaagcugu cuuaggauua gaacuugagu gaaggugggc ugcuugcauc 60
agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaag aaaggaaugc 120
aaccaucccc aggacacaca cacuuuuauu uu 152
<210> 517
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2.2.15
<400> 517
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaagaaagga 120
augcaaccau ccccaggaca cacacacuuu uauuuu 156
<210> 518
<211> 122
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.1.1
<400> 518
accgcuuuua gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga 60
aaguaacccu cgaaacaaag aaaggaaugc aaccacacac acagugggcu accuuuuauu 120
uu 122
<210> 519
<211> 120
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.1.2
<400> 519
accgcuuuag aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa 60
guaacccucg aaacaaagaa aggaaugcaa ccacacacac agugggcuac cuuuuauuuu 120
120
<210> 520
<211> 119
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.1.3
<400> 520
accgcuuagu ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag 60
uaacccucga aacaaagaaa ggaaugcaac cacacacaca gugggcuacc uuuuauuuu 119
<210> 521
<211> 116
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.1.4
<400> 521
accguuaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 60
cccucgaaac aaagaaagga augcaaccac acacacagug ggcuaccuuu uauuuu 116
<210> 522
<211> 115
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.1.5
<400> 522
accuuaggug ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac 60
ccucgaaaca aagaaaggaa ugcaaccaca cacacagugg gcuaccuuuu auuuu 115
<210> 523
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.1.6
<400> 523
acuuaguggg cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc 60
ucgaaacaaa gaaaggaaug caaccacaca cacagugggc uaccuuuuau uuu 113
<210> 524
<211> 112
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.1.7
<400> 524
acuuaggggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 60
cgaaacaaag aaaggaaugc aaccacacac acagugggcu accuuuuauu uu 112
<210> 525
<211> 110
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.1.8
<400> 525
auuagggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 60
aaacaaagaa aggaaugcaa ccacacacac agugggcuac cuuuuauuuu 110
<210> 526
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.1.9
<400> 526
aggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac 60
aaagaaagga augcaaccac acacacagug ggcuaccuuu uauuuu 106
<210> 527
<211> 104
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.1.10
<400> 527
gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc cucgaaacaa 60
agaaaggaau gcaaccacac acacaguggg cuaccuuuua uuuu 104
<210> 528
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.1.11
<400> 528
accgcuucac uuagagugaa ggugggcugc uugcaucagc cuaaugucga gaagugcuuu 60
cuucggaaag uaacccucga aacaaagaaa ggaaugcaac cacacacaca gugggcuacc 120
uuuuauuuu 129
<210> 529
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.1.12
<400> 529
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaagaaagga 120
augcaaccac acacacagug ggcuaccuuu uauuuu 156
<210> 530
<211> 122
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.2.1
<400> 530
accgcuuuua gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga 60
aaguaacccu cgaaacaaag aaaggaaugc aaccaucccc aggacacaca cacuuuuauu 120
uu 122
<210> 531
<211> 120
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.2.2
<400> 531
accgcuuuag aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa 60
guaacccucg aaacaaagaa aggaaugcaa ccauccccag gacacacaca cuuuuauuuu 120
120
<210> 532
<211> 119
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.2.3
<400> 532
accgcuuagu ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag 60
uaacccucga aacaaagaaa ggaaugcaac cauccccagg acacacacac uuuuauuuu 119
<210> 533
<211> 116
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.2.4
<400> 533
accguuaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 60
cccucgaaac aaagaaagga augcaaccau ccccaggaca cacacacuuu uauuuu 116
<210> 534
<211> 115
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.2.5
<400> 534
accuuaggug ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac 60
ccucgaaaca aagaaaggaa ugcaaccauc cccaggacac acacacuuuu auuuu 115
<210> 535
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.2.6
<400> 535
acuuaguggg cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc 60
ucgaaacaaa gaaaggaaug caaccauccc caggacacac acacuuuuau uuu 113
<210> 536
<211> 112
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.2.7
<400> 536
acuuaggggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 60
cgaaacaaag aaaggaaugc aaccaucccc aggacacaca cacuuuuauu uu 112
<210> 537
<211> 110
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.2.8
<400> 537
auuagggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 60
aaacaaagaa aggaaugcaa ccauccccag gacacacaca cuuuuauuuu 110
<210> 538
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.2.9
<400> 538
aggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac 60
aaagaaagga augcaaccau ccccaggaca cacacacuuu uauuuu 106
<210> 539
<211> 104
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.2.10
<400> 539
gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc cucgaaacaa 60
agaaaggaau gcaaccaucc ccaggacaca cacacuuuua uuuu 104
<210> 540
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.2.11
<400> 540
accgcuucac uuagagugaa ggugggcugc uugcaucagc cuaaugucga gaagugcuuu 60
cuucggaaag uaacccucga aacaaagaaa ggaaugcaac cauccccagg acacacacac 120
uuuuauuuu 129
<210> 541
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 3.2.12
<400> 541
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaagaaagga 120
augcaaccau ccccaggaca cacacacuuu uauuuu 156
<210> 542
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting FUS
<400> 542
gtgggtaggt ccagtttggg 20
<210> 543
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting GAK
<400> 543
cagagtcccg ggaacaagcc 20
<210> 544
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting MLH
<400> 544
agggaatgaa agtgaagatg 20
<210> 545
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 4.4.1
<400> 545
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cucuucggag uaacccucga aacaaagaaa ggaaugcaac guggguaggu ccaguuuggg 120
uuuuauuuu 129
<210> 546
<211> 123
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 4.4.2
<400> 546
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
uucguaaccc ucgaaacaaa gaaaggaaug caacgugggu agguccaguu uggguuuuau 120
uuu 123
<210> 547
<211> 118
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 4.4.3
<400> 547
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaaguu 60
cgcccucgaa acaaagaaag gaaugcaacg uggguagguc caguuugggu uuuauuuu 118
<210> 548
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 4.4.4
<400> 548
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgaguucgc 60
ucgaaacaaa gaaaggaaug caacgugggu agguccaguu uggguuuuau uuu 113
<210> 549
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 4.5.1
<400> 549
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cucuucggag uaacccucga aacaaagaaa ggaaugcaac cagagucccg ggaacaagcc 120
uuuuauuuu 129
<210> 550
<211> 123
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 4.5.2
<400> 550
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
uucguaaccc ucgaaacaaa gaaaggaaug caaccagagu cccgggaaca agccuuuuau 120
uuu 123
<210> 551
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 4.6.1
<400> 551
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cucuucggag uaacccucga aacaaagaaa ggaaugcaac agggaaugaa agugaagaug 120
uuuuauuuu 129
<210> 552
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting AHRR
<400> 552
ccttaataaa gtataacttc 20
<210> 553
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting APEX1
<400> 553
aagaaggaat ggtagttgag 20
<210> 554
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting BCL2L13
<400> 554
atttccaagt caaccttatg 20
<210> 555
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting CARS
<400> 555
caacagcctc accaggaaca 20
<210> 556
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting CCDC127
<400> 556
ggcaagggtc ttgatgcatc 20
<210> 557
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting CLIC4
<400> 557
ccctggctac ctcccctacc 20
<210> 558
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting COL8A1-1
<400> 558
gattcattct cagtgccatg 20
<210> 559
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting COL8A1-2
<400> 559
aggcaattgc aaccactgaa 20
<210> 560
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting EMX1
<400> 560
tactttgtcc tccggttctg 20
<210> 561
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting FANCF-1
<400> 561
ggttctctct atagccattg 20
<210> 562
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting FANCF-2
<400> 562
actttagtga ctagccgcca 20
<210> 563
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting FUS-1
<400> 563
gtgggtaggt ccagtttggg 20
<210> 564
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting FUS-2
<400> 564
acaaagaaac cagcagtggc 20
<210> 565
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting GAB4
<400> 565
cctggtggct gagaccaggg 20
<210> 566
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting GAK
<400> 566
cagagtcccg ggaacaagcc 20
<210> 567
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting HBB
<400> 567
ccaaagtgat gggccagcac 20
<210> 568
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting INIP
<400> 568
agagcagcga ttgtaaggag 20
<210> 569
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-01
<400> 569
gaaatatgac tggaagtaaa 20
<210> 570
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-02
<400> 570
cttccagtca tatttctaaa 20
<210> 571
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-03
<400> 571
cccttattac aatcctgtgg 20
<210> 572
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-04
<400> 572
cccccacagg attgtaataa 20
<210> 573
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-05
<400> 573
atctccataa caatctttgg 20
<210> 574
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-06
<400> 574
ctatccccat tttacagatg 20
<210> 575
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-07
<400> 575
ctgagatttg cgaagagtta 20
<210> 576
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-08
<400> 576
attaaataga gtcttttgaa 20
<210> 577
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-09
<400> 577
atattaattg caagtttggg 20
<210> 578
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-10
<400> 578
ggccaagtgc gaagtcagag 20
<210> 579
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-11
<400> 579
ggggtgaaca cccaagatcc 20
<210> 580
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-12
<400> 580
gggtgggctc ctggcagggc 20
<210> 581
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-13
<400> 581
agaagcatgc aaaaccggca 20
<210> 582
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-14
<400> 582
aagaggggag gttgactttg 20
<210> 583
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-15
<400> 583
gtcaaataaa gaaaaatacg 20
<210> 584
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-16
<400> 584
atgcatctca gtggttaaca 20
<210> 585
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-17
<400> 585
catacagggc tctgtaccca 20
<210> 586
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-18
<400> 586
caaagacact caccctgttg 20
<210> 587
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-19
<400> 587
agaacacata cccctgggcc 20
<210> 588
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-20
<400> 588
ataataaaag tatttcctca 20
<210> 589
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-21
<400> 589
agccgtggtc agtgagaggc 20
<210> 590
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-22
<400> 590
gagctcatta gcttggggag 20
<210> 591
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-23
<400> 591
gaaaataact aaacttccca 20
<210> 592
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-24
<400> 592
aattctttaa gtaatttaag 20
<210> 593
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-25
<400> 593
cttagtagtc tcagaaccaa 20
<210> 594
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-26
<400> 594
aaaggagcac aagtacaaac 20
<210> 595
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-27
<400> 595
aatgatgcag taatcgtgta 20
<210> 596
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting intergenic-28
<400> 596
ataaaaggaa ctatttacaa 20
<210> 597
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting KLHL29
<400> 597
gagagaccgc tcaggctgga 20
<210> 598
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting LINC01551-1
<400> 598
attttgaagt gaccgtacga 20
<210> 599
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting LINC01551-2
<400> 599
ataatacact ctttacactg 20
<210> 600
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting LOC100128398-1
<400> 600
aagagttatt gtcaatagaa 20
<210> 601
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting LOC100128398-2
<400> 601
caaagaaatg tactgcctta 20
<210> 602
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting LOC100130876
<400> 602
aaataaccgt cggtttctta 20
<210> 603
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting LOC101926886
<400> 603
caaacaaaat aattggctca 20
<210> 604
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting LOC105369597
<400> 604
gccatggtga aggtgaaatc 20
<210> 605
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting LOC105370393-1
<400> 605
gcagtacacc tgagggaaca 20
<210> 606
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting LOC105370393-2
<400> 606
aagaaagcta caggaaagca 20
<210> 607
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting LOC105374431
<400> 607
ctttaaaatg aggtactagg 20
<210> 608
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting LOC105375122
<400> 608
ccaaccaggt accctgtgcc 20
<210> 609
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting LOC105378763
<400> 609
attgaaacat atacgtggta 20
<210> 610
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting LOC107984132
<400> 610
ggaaagcgca gaaaagtaaa 20
<210> 611
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting MLH1-1
<400> 611
agggaatgaa agtgaagatg 20
<210> 612
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting MLH1-2
<400> 612
gatcaattta catcaaacta 20
<210> 613
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting MRPL39
<400> 613
atttcacagg actttgttaa 20
<210> 614
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting NEK10-1
<400> 614
agacaagctg tcttccttca 20
<210> 615
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting NEK10-2
<400> 615
atctgaagat cattgaaaca 20
<210> 616
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting NLGN1
<400> 616
gtctaataga aatatagtac 20
<210> 617
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting NLRC4-1
<400> 617
gagggagaca caagttgata 20
<210> 618
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting NLRC4-2
<400> 618
gtctcagtct tccttgtggg 20
<210> 619
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting NUDT16-1
<400> 619
ggggtagagg tactctacag 20
<210> 620
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting NUDT16-2
<400> 620
ggggtagagg tagtctacag 20
<210> 621
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting OR4K17
<400> 621
acaagttcag aatcacctta 20
<210> 622
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting OSBPL5
<400> 622
gcattaaggc cagcgctggg 20
<210> 623
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting P2RX5-TAX1BP3
<400> 623
cacataggcc attcagaaac 20
<210> 624
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting POLRMT-1
<400> 624
gaaactgccc caaaaccggc 20
<210> 625
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting POLRMT-2
<400> 625
aggactatgt gtggccagtg 20
<210> 626
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting PWAR5
<400> 626
aacaaatcac tgactaacca 20
<210> 627
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting RMST
<400> 627
ataatgcctt ttaggtgata 20
<210> 628
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting RPH3AL-1
<400> 628
attttcaaaa cagccctatg 20
<210> 629
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting RPH3AL-2
<400> 629
cacaagggat ctgagacttg 20
<210> 630
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting RSPO4-1
<400> 630
actcatacat cacctcctcc 20
<210> 631
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting RSPO4-2
<400> 631
aaggaaaggc ttcctggagg 20
<210> 632
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting RSRP1-1
<400> 632
atataggatt tagaaaccaa 20
<210> 633
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting RSRP1-2
<400> 633
gctctaatgt aagtatatcc 20
<210> 634
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting TYW1B
<400> 634
gatccgatgc aattttggga 20
<210> 635
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting UNCX
<400> 635
cctgaactcg ggactcgacc 20
<210> 636
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting WNK1
<400> 636
gaacccagtg aaaaatacca 20
<210> 637
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting ZMYM2
<400> 637
gtaggctgct gttggacaga 20
<210> 638
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting ZNF10-1
<400> 638
aataagtctt accacgtgtc 20
<210> 639
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence for targeting ZNF10-2
<400> 639
attcccacaa taaccctatg 20
<210> 640
<211> 218
<212> RNA
<213> Artificial Sequence
<220>
<223> Canonical Cas12f
<400> 640
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca aguugcagaa cccgaauaga 180
cgaaugaagg aaugcaacnn nnnnnnnnnn nnnnnnnn 218
<210> 641
<211> 218
<212> RNA
<213> Artificial Sequence
<220>
<223> Canonical Cas12f targeting Intergenic22
<400> 641
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca aguugcagaa cccgaauaga 180
cgaaugaagg aaugcaacag aacacauacc ccugggcc 218
<210> 642
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> Linker variants for MF sgRNA
<400> 642
uucgaaagaa 10
<210> 643
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> Linker variants for MF sgRNA
<400> 643
uucagaaaug aa 12
<210> 644
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> Linker variants for MF sgRNA
<400> 644
uucaugaaaa ugaa 14
<210> 645
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> Linker variants for MF sgRNA
<400> 645
uucauugaaa aaugaa 16
<210> 646
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 646
uuuruuuruu u 11
<210> 647
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 647
uuuuruuuuu 10
<210> 648
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 648
uuuuruuuuu u 11
<210> 649
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> MS2/3/4/5
<400> 649
accgcuucac uuagagugaa ggugggcugc uugcaucagc cuaaugucga gaagugcuuu 60
cuucggaaag uaacccucga aacaaagaaa ggaaugcaac agaacacaua ccccugggcc 120
uuuuauuuu 129
<210> 650
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 650
cggagggatc gctgtggggg tca 23
<210> 651
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 651
agtgcagatg gcgaacctcg aga 23
<210> 652
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 652
cttcgagtac gcgaagaaga acaag 25
<210> 653
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 653
cttcgagtac cagaagaaga acaag 25
<210> 654
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 654
cttcgagtac tggaagaaga acaag 25
<210> 655
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 655
cttcgagtac ctgaagaaga acaag 25
<210> 656
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 656
ggagaacgcc gcttacaacg ccg 23
<210> 657
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 657
ggagaacgcc ctttacaacg ccg 23
<210> 658
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 658
ggagaacgcc gtatacaacg ccg 23
<210> 659
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 659
atgatgctgg gatccacgc 19
<210> 660
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 660
gttccgacct tgttcttaat aaag 24
<210> 661
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 661
ttgaagtagt tgttgagg 18
<210> 662
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 662
ttgaagtagt tgttgagg 18
<210> 663
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 663
ttgaagtagt tgttgaggtg 20
<210> 664
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 664
ttgaagtagt tgttgagg 18
<210> 665
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 665
ttaaagttgc acttctcgc 19
<210> 666
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 666
ttaaagttgc acttctcg 18
<210> 667
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 667
ttaaagttgc acttctcgc 19
<210> 668
<211> 23
<212> DNA
<213> Homo sapiens
<400> 668
cacacacaca gtgggctacc att 23
<210> 669
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 669
aagggttcga tcctctagag tc 22
<210> 670
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 670
agtggtggag gaagtggc 18
<210> 671
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 671
gatccagcct ccggactcta gaggatcgaa cccttgccac catggcccca aagaagaagc 60
g 61
<210> 672
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 672
tcgcgtccat cgaccctgac ccgccacttc ctccaccact ctttttcttt tttgcctggc 60
60
<210> 673
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 673
aagggttcga tcctctagag tc 22
<210> 674
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 674
agtggtggag gaagtggc 18
<210> 675
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 675
gcggcggttc tggtggctca ggcggcagcg gccggccacc aaagaagaag cggaaggtcg 60
60
<210> 676
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 676
tttaaactca ttactaaccg gtagggatcg aaccctttca ctttttcttt tttgcctggc 60
60
<210> 677
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 677
aagggttcga tcctctagag tc 22
<210> 678
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 678
agtggtggag gaagtggc 18
<210> 679
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 679
gatccagcct ccggactcta gaggatcgaa cccttgccac catggcccca aagaagaagc 60
g 61
<210> 680
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 680
tcgcgtccat cgaccctgac ccgccacttc ctccaccact ctttttcttt tttgcctggc 60
60
<210> 681
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 681
ggccatggtg gcaagggttc 20
<210> 682
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 682
ccaaagaaga agcggaaggt c 21
<210> 683
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 683
cctccggact ctagaggatc gaacccttgc caccatggcc cccaagaaga agaggaaggt 60
60
<210> 684
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 684
ctgggactcc gtggataccg accttccgct tcttctttgg tgagactctc tcagtcacgg 60
60
<210> 685
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 685
tagaagaatt cgatccctac cgg 23
<210> 686
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 686
ctttttcttt tttgcctggc cg 22
<210> 687
<211> 74
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 687
ccaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ctcgagggcg 60
gaggcgggag cgga 74
<210> 688
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 688
tttaaactca ttactaaccg gtagggatcg aattcttcta cacacacgca aaatactcct 60
60
<210> 689
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 689
tgaaagggtt cgatccctac c 21
<210> 690
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 690
tggccggccg ctgccgcctg ag 22
<210> 691
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 691
agcggcggtt ctggtggctc aggcggcagc ggccggccac caaagaagaa gcggaaggtc 60
60
<210> 692
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 692
ttaaactcat tactaaccgg tagggatcga accctttcac tttttctttt ttgcctggcc 60
60
<210> 693
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 693
aagaattcga tccctaccgg tt 22
<210> 694
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 694
ctttttcttt tttgcctggc cgg 23
<210> 695
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 695
ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag gcggccgctg gatccatggc 60
60
<210> 696
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 696
ccgtttaaac tcattactaa ccggtaggga tcgaattctt ttaaatctcc acatcgcttt 60
60
<210> 697
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 697
tagaagaatt cgatccctac cgg 23
<210> 698
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 698
tgaggcttcc accttccgtt tc 22
<210> 699
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 699
ggaggtggtt cgggtggctc tggatcaagc ccaaagaaga aacggaaggt ggaagcctca 60
agaacactgg ttacgttcaa 80
<210> 700
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 700
gtttcagtta gcctcccccg tttaaactca ttactaaccg gtagggatcg aattcttcta 60
taccagccaa ggttcttccc 80
<210> 701
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 701
agtggtggag gaagtggc 18
<210> 702
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 702
ctttttcttt tttgcctggc cg 22
<210> 703
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 703
ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag agtggtggag gaagtggcgg 60
60
<210> 704
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 704
tcgcgtccat cgaccctgac ccgccacttc ctccaccact taccagccaa ggttcttccc 60
60
<210> 705
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 705
ctttttcttt tttgcctggc cg 22
<210> 706
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 706
tgaaagggtt cgatccctac c 21
<210> 707
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 707
ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag gaagcctcag tgcaggtgaa 60
60
<210> 708
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 708
tttaaactca ttactaaccg gtagggatcg aaccctttca tgagactctc tcagtcacgg 60
60
<210> 709
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 709
ggccatggtg gcaagggttc 20
<210> 710
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 710
ccaaagaaga agcggaaggt c 21
<210> 711
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 711
cctccggact ctagaggatc gaacccttgc caccatggcc cccaagaaga agaggaaggt 60
60
<210> 712
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 712
ctgggactcc gtggataccg accttccgct tcttctttgg tgagactctc tcagtcacgg 60
60
<210> 713
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 713
ccaaagaaga agcggaaggt cgg 23
<210> 714
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 714
ggccatggtg gcaagggttc 20
<210> 715
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 715
cctccggact ctagaggatc gaacccttgc caccatggcc ccaaagaaga aacggaaggt 60
60
<210> 716
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 716
ctgggactcc gtggataccg accttccgct tcttctttgg tgagactctc tcagtcacgg 60
60
<210> 717
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 717
tcaactttcg atggtagtcg cc 22
<210> 718
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 718
ggcctcgaaa gagtcctgta ttgt 24
<210> 719
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid encoding guide sequence
<400> 719
tccgttaatg tttaatcaga 20
<210> 720
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid encoding guide sequence
<400> 720
gaaacctgat cctccagtcc 20
<210> 721
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid encoding guide sequence
<400> 721
gccaggttaa ggccagtgga 20
<210> 722
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid encoding guide sequence
<400> 722
atcagatagg atcgtccgat 20
<210> 723
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid encoding guide sequence
<400> 723
gggagggcga ggccgaaacc 20
<210> 724
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid encoding guide sequence
<400> 724
ggagtttttt cttccctctg 20
<210> 725
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid encoding guide sequence
<400> 725
gaaggctgcc aggttaaggc 20
<210> 726
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid encoding guide sequence
<400> 726
tgcaccctgc acactgacct 20
<210> 727
<211> 20
<212> DNA
<213> Homo sapiens
<400> 727
ttgcccagac tggagtgcag 20
<210> 728
<211> 20
<212> DNA
<213> Homo sapiens
<400> 728
gcccagtaga tcgaggctac 20
<210> 729
<211> 20
<212> DNA
<213> Homo sapiens
<400> 729
cctaatggtg gtggcaatgg 20
<210> 730
<211> 21
<212> DNA
<213> Homo sapiens
<400> 730
agacagggtc tcactttgtt g 21
Claims (22)
- 다음을 포함하는, 표적 유전자의 발현을 억제하기 위한, 유전자 발현 조절용 조성물:
전사 저해 Cas12f1 융합 단백질 또는 이를 암호화하는 핵산; 및
엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산,
이때, 상기 전사 저해 Cas12f1 융합 단백질은 dead Cas12f1(dCas12f1) 단백질 및 전사 저해 단백질을 포함하고,
상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 326번째 아미노산인 아스파트산(D), 422번째 아미노산인 글루탐산(E), 490번째 아미노산인 아르기닌(R) 또는 510번째 아미노산인 아스파트산(D)이 알라닌(A), 글루타민(Q), 류신(L), 트립토판(W) 또는 발린(V)으로 치환된 것이며,
상기 전사 저해 단백질은 유전자의 전사를 저해 또는 억제하는 단백질 또는 펩타이드임,
이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 다음을 포함함:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA의 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 상기 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이뤄진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이뤄진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이뤄진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3'.
- 제1항에 있어서,
상기 dCas12f1 단백질은 dCas12f1 R490A 단백질, dCas12f1 R490Q 단백질, dCas12f1 R490L 단백질 또는 dCas12f1 R490W 단백질인 것을 특징으로 하는 유전자 발현 조절용 조성물.
- 제1항에 있어서,
상기 dCas12f1 단백질은 dCas12f1 D510A 단백질, dCas12f1 D510L 단백질 또는 dCas12f1 D510V 단백질인 것을 특징으로 하는 유전자 발현 조절용 조성물.
- 제1항에 있어서,
상기 dCas12f1 단백질은 dCas12f1 D326A 단백질 또는 dCas12f1 E422A 단백질인 것을 특징으로 하는 유전자 발현 조절용 조성물.
- 제1항에 있어서,
상기 전사 저해 단백질은 RNA 중합효소가 표적 유전자의 프로모터에 부착되는 것을 차단하거나 크로마틴의 구조변화를 유도하여 유전자의 전사를 저해 또는 억제하는 단백질 또는 펩타이드인 것을 특징으로 하는 유전자 발현 조절용 조성물.
- 제1항에 있어서,
상기 전사 저해 단백질은 KRAB, MeCP2, DNMT, LSD 또는 HDAC인 것을 특징으로 하는 유전자 발현 조절용 조성물.
- 제1항에 있어서,
상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 전사 저해 단백질을 추가로 더 포함하는 것을 특징으로 하는 유전자 발현 조절용 조성물.
- 제7항에 있어서,
상기 전사 저해 단백질은 KRAB, MeCP2, DNMT, LSD 또는 HDAC인 것을 특징으로 하는 유전자 발현 조절용 조성물.
- 제1항에 있어서,
상기 전사 저해 Cas12f1 융합 단백질은 하나 이상의 NLS 또는 NES를 추가로 더 포함하는 것을 특징으로 하는 유전자 발현 조절용 조성물.
- 제1항에 있어서,
상기 U-rich tail의 서열은 5'-UUUURUUUU-3'로 표현되는 것을 특징으로 하는 유전자 발현 조절용 조성물.
- 제1항에 있어서,
상기 엔지니어링 된 Cas12f1 가이드 RNA에 포함된 상기 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것을 특징으로 하는 유전자 발현 조절용 조성물:
5'-A-3';
5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11);
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
5'-AACCAAAGAAAGGA-3'(서열번호 111); 및
5'-AUGCAAC-3'.
- 제1항에 있어서,
상기 엔지니어링 된 Cas12f1 가이드 RNA에 포함된 상기 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것을 특징으로 하는 유전자 발현 조절용 조성물:
5'-A-3';
5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350);
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
5'-AACCAAAGAAAGGA-3'(서열번호 111); 및
5'-AUGCAAC-3'.
- 제1항에 있어서,
상기 조성물은 벡터 형태인 것을 특징으로 하는 유전자 발현 조절용 조성물.
- 제13항에 있어서,
상기 조성물은 상기 전사 저해 Cas12f1 융합 단백질을 암호화하는 핵산과 상기 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산을 위한 프로모터를 추가로 더 포함하는 것을 특징으로 하는 유전자 발현 조절용 조성물.
- 제13항에 있어서,
상기 벡터는 플라스미드, 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상인 것을 특징으로 하는 유전자 발현 조절용 조성물.
- 제1항에 있어서,
상기 조성물은 상기 엔지니어링 된 Cas12f1 가이드 RNA 및 전사 저해 Cas12f1 융합 단백질이 결합한 리보뉴클레오프로틴(Ribonucleoprotein, RNP) 형태인 것을 특징으로 하는 유전자 발현 조절용 조성물.
- 다음을 포함하는, 세포 내에서 표적 유전자의 발현을 억제하는 방법:
전사 저해 Cas12f1 융합 단백질 또는 이를 암호화하는 핵산; 및 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 세포 내로 전달하는 것,
이로 인해 상기 세포 내에서 CRISPR interference 복합체가 형성될 수 있으며,
이로 인해 상기 표적 유전자의 전사가 CRISPR interference 복합체에 의해 억제될 수 있고,
이때, 상기 전사 저해 Cas12f1 융합 단백질은 dead Cas12f1(dCas12f1) 단백질 및 전사 저해 단백질을 포함하고,
상기 dCas12f1 단백질은 야생형의 Cas12f1 단백질을 구성하는 아미노산 서열 중 326번째 아미노산인 아스파트산(D), 422번째 아미노산인 글루탐산(E), 490번째 아미노산인 아르기닌(R) 또는 510번째 아미노산인 아스파트산(D)이 알라닌(A), 글루타민(Q), 류신(L), 트립토판(W) 또는 발린(V)으로 치환된 것이며,
상기 전사 저해 단백질은 유전자의 전사를 저해 또는 억제하는 단백질 또는 펩타이드임,
이때, 엔지니어링 된 가이드 Cas12f1 RNA는 다음을 포함함:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
이때, 상기 엔지니어링 된 가이드 Cas12f1 RNA의 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이뤄진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이뤄진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이뤄진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3'.
- 제17항에 있어서,
상기 전달은 상기 전사 저해 Cas12f1 융합 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA를 CRISPR interference 복합체로써 세포 내에 주입하는 것인 방법.
- 제17항에 있어서,
상기 전달은 상기 전사 저해 Cas12f1 융합 단백질을 암호화하는 핵산 및 상기 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산을 포함하는 벡터를 세포 내에 주입하는 것인 방법.
- 제19항에 있어서,
상기 벡터는 플라스미드 벡터 또는 바이러스 벡터인 것을 특징으로 하는 방법.
- 제20항에 있어서,
상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상인 것을 특징으로 하는 방법.
- 제17항에 있어서,
상기 세포는 진핵 세포인 것을 특징으로 하는 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210050093 | 2021-04-16 | ||
KR1020210050093 | 2021-04-16 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220144317A true KR20220144317A (ko) | 2022-10-26 |
Family
ID=83640431
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220043768A KR20220144317A (ko) | 2021-04-16 | 2022-04-08 | Crispr 시스템을 이용한 유전자 발현 조절 시스템 |
KR1020220049512A KR20220144343A (ko) | 2021-04-16 | 2022-04-21 | CRISPR/Cas12f1 시스템 효율화를 위한 U-rich tail을 포함하는 엔지니어링 된 가이드 RNA 및 그 용도 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220049512A KR20220144343A (ko) | 2021-04-16 | 2022-04-21 | CRISPR/Cas12f1 시스템 효율화를 위한 U-rich tail을 포함하는 엔지니어링 된 가이드 RNA 및 그 용도 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20240200105A1 (ko) |
EP (1) | EP4324920A1 (ko) |
KR (2) | KR20220144317A (ko) |
CN (1) | CN116568803A (ko) |
CA (1) | CA3216819A1 (ko) |
WO (1) | WO2022220503A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023250511A2 (en) * | 2022-06-24 | 2023-12-28 | Tune Therapeutics, Inc. | Compositions, systems, and methods for reducing low-density lipoprotein through targeted gene repression |
KR20240062618A (ko) | 2022-11-02 | 2024-05-09 | 현대모비스 주식회사 | 이미지 자동 변환이 가능한 커뮤니케이션 라이팅 시스템 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017197238A1 (en) * | 2016-05-12 | 2017-11-16 | President And Fellows Of Harvard College | Aav split cas9 genome editing and transcriptional regulation |
WO2019089820A1 (en) | 2017-11-01 | 2019-05-09 | The Regents Of The University Of California | Casz compositions and methods of use |
CN111836894B (zh) * | 2017-11-21 | 2023-11-10 | 基恩科雷有限责任公司 | 用于使用CRISPR/Cpf1系统进行基因组编辑的组合物及其用途 |
-
2021
- 2021-10-08 CN CN202180082801.5A patent/CN116568803A/zh active Pending
-
2022
- 2022-04-08 US US18/287,118 patent/US20240200105A1/en active Pending
- 2022-04-08 KR KR1020220043768A patent/KR20220144317A/ko unknown
- 2022-04-08 EP EP22788359.2A patent/EP4324920A1/en active Pending
- 2022-04-08 CA CA3216819A patent/CA3216819A1/en active Pending
- 2022-04-08 WO PCT/KR2022/005135 patent/WO2022220503A1/ko active Application Filing
- 2022-04-21 KR KR1020220049512A patent/KR20220144343A/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
US20240200105A1 (en) | 2024-06-20 |
EP4324920A1 (en) | 2024-02-21 |
KR20220144343A (ko) | 2022-10-26 |
CA3216819A1 (en) | 2022-10-20 |
CN116568803A (zh) | 2023-08-08 |
WO2022220503A1 (ko) | 2022-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Montiel-Gonzalez et al. | Current strategies for site-directed RNA editing using ADARs | |
EP4053285A2 (en) | Engineered guide rna for increasing efficiency of crispr/cas12f1 system, and use of same | |
CN110612353A (zh) | 经由抑制性tRNAs和脱氨酶对突变进行RNA靶向 | |
KR20220144317A (ko) | Crispr 시스템을 이용한 유전자 발현 조절 시스템 | |
KR20210124238A (ko) | Rna 조절을 위한 시스템 및 방법 | |
JP2023508362A (ja) | Crispr-casエフェクターポリペプチド及びその使用方法 | |
KR20240023081A (ko) | CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 | |
US20230374500A1 (en) | Engineered guide rna comprising u-rich tail for optimized crispr/cas12f1 system and use thereof | |
EP4227411A1 (en) | Engineered guide rna for increasing efficiency of crispr/cas12f1 system, and use of same | |
Bhakta et al. | Double MS2 guided restoration of genetic code in amber (TAG), opal (TGA) and ochre (TAA) stop codon | |
CN114144519A (zh) | 单碱基置换蛋白以及包含其的组合物 | |
EP1384783A1 (en) | Novel maxizyme | |
KR20230007218A (ko) | 초소형 염기교정 시스템 및 이의 용도 | |
WO2022204268A2 (en) | Novel crispr enzymes, methods, systems and uses thereof | |
KR20220145438A (ko) | CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도 | |
KR102638799B1 (ko) | CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 | |
EP4368713A1 (en) | Cleavage-inactive cas12f1, cleavage-inactive cas12f1-based fusion protein, crispr gene-editing system comprising same, and preparation method and use thereof | |
CN117916372A (zh) | 无切割活性的cas12f1、基于无切割活性的cas12f1的融合蛋白、包括其的crispr基因编辑系统及其制备方法和用途 | |
KR20240034661A (ko) | 캄필로박터 제주니 유래 Cas9의 가이드 RNA 구조변화를 통한 유전자교정 향상 시스템 | |
AU2018279569B2 (en) | System for DNA editing and application thereof | |
JP2024525602A (ja) | 切断不活性Cas12F1、切断不活性Cas12F1ベースの融合タンパク質、これを含むCRISPR遺伝子調節システム、その製造方法及び用途 | |
CN116568806A (zh) | 用于增加crispr/cas12f1(cas14a1)系统的效率的经工程化的引导rna及其用途 |