KR102638799B1 - CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 - Google Patents
CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 Download PDFInfo
- Publication number
- KR102638799B1 KR102638799B1 KR1020210044152A KR20210044152A KR102638799B1 KR 102638799 B1 KR102638799 B1 KR 102638799B1 KR 1020210044152 A KR1020210044152 A KR 1020210044152A KR 20210044152 A KR20210044152 A KR 20210044152A KR 102638799 B1 KR102638799 B1 KR 102638799B1
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- seq
- engineered
- time
- crrna
- Prior art date
Links
- 108020005004 Guide RNA Proteins 0.000 title claims abstract description 528
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 223
- 238000010354 CRISPR gene editing Methods 0.000 title claims abstract description 219
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 335
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 322
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 322
- 108091079001 CRISPR RNA Proteins 0.000 claims description 528
- 108090000623 proteins and genes Proteins 0.000 claims description 360
- 102000004169 proteins and genes Human genes 0.000 claims description 267
- 239000002773 nucleotide Substances 0.000 claims description 215
- 125000003729 nucleotide group Chemical group 0.000 claims description 215
- 239000000203 mixture Substances 0.000 claims description 155
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical group O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 claims description 134
- 230000000295 complement effect Effects 0.000 claims description 102
- 239000013603 viral vector Substances 0.000 claims description 87
- 239000013598 vector Substances 0.000 claims description 83
- 230000009977 dual effect Effects 0.000 claims description 31
- 239000013612 plasmid Substances 0.000 claims description 25
- 108091093088 Amplicon Proteins 0.000 claims description 21
- 108091005461 Nucleic proteins Proteins 0.000 claims description 14
- 108020004999 messenger RNA Proteins 0.000 claims description 13
- 238000000034 method Methods 0.000 abstract description 73
- 238000005520 cutting process Methods 0.000 abstract description 10
- 229920002477 rna polymer Polymers 0.000 description 537
- 235000018102 proteins Nutrition 0.000 description 251
- 230000004048 modification Effects 0.000 description 92
- 238000012986 modification Methods 0.000 description 92
- 210000004027 cell Anatomy 0.000 description 68
- 150000001413 amino acids Chemical group 0.000 description 65
- 102000053602 DNA Human genes 0.000 description 51
- 108020004414 DNA Proteins 0.000 description 51
- 108091028043 Nucleic acid sequence Proteins 0.000 description 47
- 210000003527 eukaryotic cell Anatomy 0.000 description 46
- 239000002585 base Substances 0.000 description 35
- 230000000694 effects Effects 0.000 description 35
- 230000001965 increasing effect Effects 0.000 description 33
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 30
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 30
- 108090001102 Hammerhead ribozyme Proteins 0.000 description 28
- 102000037865 fusion proteins Human genes 0.000 description 28
- 108020001507 fusion proteins Proteins 0.000 description 28
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical group C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 27
- 230000006870 function Effects 0.000 description 25
- 230000000875 corresponding effect Effects 0.000 description 24
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 22
- 241000282414 Homo sapiens Species 0.000 description 21
- 230000014509 gene expression Effects 0.000 description 21
- 238000003776 cleavage reaction Methods 0.000 description 20
- 230000007017 scission Effects 0.000 description 20
- 238000001890 transfection Methods 0.000 description 20
- 102000004389 Ribonucleoproteins Human genes 0.000 description 18
- 108010081734 Ribonucleoproteins Proteins 0.000 description 18
- 230000027455 binding Effects 0.000 description 18
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 17
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 17
- 230000001404 mediated effect Effects 0.000 description 17
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 17
- 229940045145 uridine Drugs 0.000 description 17
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 16
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 16
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 16
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 16
- 108010034529 leucyl-lysine Proteins 0.000 description 16
- 108090000765 processed proteins & peptides Proteins 0.000 description 16
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 15
- 229960005305 adenosine Drugs 0.000 description 15
- 238000012217 deletion Methods 0.000 description 15
- 230000037430 deletion Effects 0.000 description 15
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 12
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 12
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 12
- 238000003780 insertion Methods 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 230000003252 repetitive effect Effects 0.000 description 12
- 238000006467 substitution reaction Methods 0.000 description 12
- 229940104230 thymidine Drugs 0.000 description 12
- 238000010453 CRISPR/Cas method Methods 0.000 description 11
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 11
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 11
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 11
- 229940029575 guanosine Drugs 0.000 description 11
- 108010009298 lysylglutamic acid Proteins 0.000 description 11
- 108020004705 Codon Proteins 0.000 description 10
- 241000702421 Dependoparvovirus Species 0.000 description 10
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 10
- 108010064235 lysylglycine Proteins 0.000 description 10
- 230000035772 mutation Effects 0.000 description 10
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 9
- 229920002873 Polyethylenimine Polymers 0.000 description 9
- 241000700584 Simplexvirus Species 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 108010050848 glycylleucine Proteins 0.000 description 9
- 108010037850 glycylvaline Proteins 0.000 description 9
- 239000002777 nucleoside Substances 0.000 description 9
- 239000013600 plasmid vector Substances 0.000 description 9
- 108010005652 splenotritin Proteins 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- 230000003612 virological effect Effects 0.000 description 9
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 8
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 8
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 8
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000007385 chemical modification Methods 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 239000002105 nanoparticle Substances 0.000 description 8
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 7
- 241000196324 Embryophyta Species 0.000 description 7
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 7
- 108010065920 Insulin Lispro Proteins 0.000 description 7
- 102100034343 Integrase Human genes 0.000 description 7
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 7
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 7
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 7
- 238000012258 culturing Methods 0.000 description 7
- 238000004520 electroporation Methods 0.000 description 7
- 238000010362 genome editing Methods 0.000 description 7
- 210000005260 human cell Anatomy 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 108010017391 lysylvaline Proteins 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000010076 replication Effects 0.000 description 7
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 7
- 108010073969 valyllysine Proteins 0.000 description 7
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 6
- KLKARCOHVHLAJP-UWJYBYFXSA-N Ala-Tyr-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CS)C(O)=O KLKARCOHVHLAJP-UWJYBYFXSA-N 0.000 description 6
- BHSYMWWMVRPCPA-CYDGBPFRSA-N Arg-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N BHSYMWWMVRPCPA-CYDGBPFRSA-N 0.000 description 6
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 6
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 6
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 6
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 6
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 6
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 6
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 6
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 6
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 6
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 108091027544 Subgenomic mRNA Proteins 0.000 description 6
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- 239000012636 effector Substances 0.000 description 6
- 108010078144 glutaminyl-glycine Proteins 0.000 description 6
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 6
- 238000001638 lipofection Methods 0.000 description 6
- 108010054155 lysyllysine Proteins 0.000 description 6
- 108010051242 phenylalanylserine Proteins 0.000 description 6
- 102000004196 processed proteins & peptides Human genes 0.000 description 6
- 108010029020 prolylglycine Proteins 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 6
- 108010026333 seryl-proline Proteins 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 108700029760 synthetic LTSP Proteins 0.000 description 6
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 6
- 241000701161 unidentified adenovirus Species 0.000 description 6
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 5
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 5
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 5
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 5
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 5
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 5
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 5
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 5
- 241000701022 Cytomegalovirus Species 0.000 description 5
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 5
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 5
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 5
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 5
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 5
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 5
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 5
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 5
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 5
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 5
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 5
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 5
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 5
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 5
- STGXWWBXWXZOER-MBLNEYKQSA-N Thr-Ala-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 STGXWWBXWXZOER-MBLNEYKQSA-N 0.000 description 5
- 241000700618 Vaccinia virus Species 0.000 description 5
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 5
- JMCOXFSCTGKLLB-FKBYEOEOSA-N Val-Phe-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JMCOXFSCTGKLLB-FKBYEOEOSA-N 0.000 description 5
- 108010005233 alanylglutamic acid Proteins 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- 108010062796 arginyllysine Proteins 0.000 description 5
- 108010060035 arginylproline Proteins 0.000 description 5
- 108010038633 aspartylglutamate Proteins 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000006780 non-homologous end joining Effects 0.000 description 5
- 150000003833 nucleoside derivatives Chemical class 0.000 description 5
- 230000030648 nucleus localization Effects 0.000 description 5
- 108010012581 phenylalanylglutamate Proteins 0.000 description 5
- 230000008439 repair process Effects 0.000 description 5
- 108091008146 restriction endonucleases Proteins 0.000 description 5
- 230000001177 retroviral effect Effects 0.000 description 5
- 108010061238 threonyl-glycine Proteins 0.000 description 5
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 4
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 4
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 4
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 4
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 4
- CWRBRVZBMVJENN-UVBJJODRSA-N Ala-Trp-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCSC)C(=O)O)N CWRBRVZBMVJENN-UVBJJODRSA-N 0.000 description 4
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 4
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 4
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 4
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 4
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 4
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 4
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 4
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 4
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 4
- GQNZIAGMRXOFJX-GUBZILKMSA-N Cys-Val-Met Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O GQNZIAGMRXOFJX-GUBZILKMSA-N 0.000 description 4
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N DMSO Substances CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 4
- 229920002307 Dextran Polymers 0.000 description 4
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 4
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 4
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 4
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 4
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 4
- GGJOGFJIPPGNRK-JSGCOSHPSA-N Glu-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 GGJOGFJIPPGNRK-JSGCOSHPSA-N 0.000 description 4
- ZMVCLTGPGWJAEE-JYJNAYRXSA-N Glu-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)O ZMVCLTGPGWJAEE-JYJNAYRXSA-N 0.000 description 4
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 4
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 4
- XZRZILPOZBVTDB-GJZGRUSLSA-N Gly-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CN)C(O)=O)=CNC2=C1 XZRZILPOZBVTDB-GJZGRUSLSA-N 0.000 description 4
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 4
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 4
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 4
- LMMPTUVWHCFTOT-GARJFASQSA-N His-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O LMMPTUVWHCFTOT-GARJFASQSA-N 0.000 description 4
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 4
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 4
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 4
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 4
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 4
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 4
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 4
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 4
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 4
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 4
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 4
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 4
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 4
- RLZDUFRBMQNYIJ-YUMQZZPRSA-N Lys-Cys-Gly Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N RLZDUFRBMQNYIJ-YUMQZZPRSA-N 0.000 description 4
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 4
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 4
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 4
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 4
- VSTNAUBHKQPVJX-IHRRRGAJSA-N Lys-Met-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O VSTNAUBHKQPVJX-IHRRRGAJSA-N 0.000 description 4
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 4
- XFANQCRHTMOEAP-WDSOQIARSA-N Lys-Pro-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XFANQCRHTMOEAP-WDSOQIARSA-N 0.000 description 4
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 4
- MYKLINMAGAIRPJ-CIUDSAMLSA-N Met-Gln-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MYKLINMAGAIRPJ-CIUDSAMLSA-N 0.000 description 4
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 4
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- 108010079364 N-glycylalanine Proteins 0.000 description 4
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 4
- FGXIJNMDRCZVDE-KKUMJFAQSA-N Phe-Cys-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N FGXIJNMDRCZVDE-KKUMJFAQSA-N 0.000 description 4
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 4
- FENSZYFJQOFSQR-FIRPJDEBSA-N Phe-Phe-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FENSZYFJQOFSQR-FIRPJDEBSA-N 0.000 description 4
- APXXVISUHOLGEE-ILWGZMRPSA-N Phe-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CC=CC=C4)N)C(=O)O APXXVISUHOLGEE-ILWGZMRPSA-N 0.000 description 4
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 4
- QGOZJLYCGRYYRW-KKUMJFAQSA-N Pro-Glu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QGOZJLYCGRYYRW-KKUMJFAQSA-N 0.000 description 4
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 4
- VGFFUEVZKRNRHT-ULQDDVLXSA-N Pro-Trp-Glu Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)O)C(=O)O VGFFUEVZKRNRHT-ULQDDVLXSA-N 0.000 description 4
- 241000714474 Rous sarcoma virus Species 0.000 description 4
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 4
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 4
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 4
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 4
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 4
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 4
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 4
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 4
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 4
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 4
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 4
- 108020004682 Single-Stranded DNA Proteins 0.000 description 4
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 4
- MMTOHPRBJKEZHT-BWBBJGPYSA-N Thr-Cys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O MMTOHPRBJKEZHT-BWBBJGPYSA-N 0.000 description 4
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 4
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 4
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 4
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 4
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 4
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 4
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 4
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 4
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 4
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 4
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 4
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 4
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 4
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 4
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 4
- 210000004102 animal cell Anatomy 0.000 description 4
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 230000033228 biological regulation Effects 0.000 description 4
- 229910000389 calcium phosphate Inorganic materials 0.000 description 4
- 239000001506 calcium phosphate Substances 0.000 description 4
- 235000011010 calcium phosphates Nutrition 0.000 description 4
- 125000002091 cationic group Chemical group 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 108010010147 glycylglutamine Proteins 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 108010025306 histidylleucine Proteins 0.000 description 4
- 108010091871 leucylmethionine Proteins 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 239000002502 liposome Substances 0.000 description 4
- 229910052744 lithium Inorganic materials 0.000 description 4
- 125000003835 nucleoside group Chemical group 0.000 description 4
- 150000002972 pentoses Chemical class 0.000 description 4
- 238000001556 precipitation Methods 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 108010015796 prolylisoleucine Proteins 0.000 description 4
- 125000006850 spacer group Chemical group 0.000 description 4
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 4
- 108010051110 tyrosyl-lysine Proteins 0.000 description 4
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 3
- 239000013607 AAV vector Substances 0.000 description 3
- OILNWMNBLIHXQK-ZLUOBGJFSA-N Ala-Cys-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O OILNWMNBLIHXQK-ZLUOBGJFSA-N 0.000 description 3
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 3
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 3
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 3
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 3
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 3
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 3
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 3
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 3
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 3
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 3
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 3
- BRCVLJZIIFBSPF-ZLUOBGJFSA-N Asn-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BRCVLJZIIFBSPF-ZLUOBGJFSA-N 0.000 description 3
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 3
- ODBSSLHUFPJRED-CIUDSAMLSA-N Asn-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ODBSSLHUFPJRED-CIUDSAMLSA-N 0.000 description 3
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 3
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 3
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 3
- QGABLMITFKUQDF-DCAQKATOSA-N Asn-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QGABLMITFKUQDF-DCAQKATOSA-N 0.000 description 3
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 3
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 3
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 3
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 3
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 3
- VXDXZGYXHIADHF-YJRXYDGGSA-N Cys-Tyr-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VXDXZGYXHIADHF-YJRXYDGGSA-N 0.000 description 3
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 3
- ODBLJLZVLAWVMS-GUBZILKMSA-N Gln-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N ODBLJLZVLAWVMS-GUBZILKMSA-N 0.000 description 3
- SYDJILXOZNEEDK-XIRDDKMYSA-N Glu-Arg-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SYDJILXOZNEEDK-XIRDDKMYSA-N 0.000 description 3
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 3
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 3
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 3
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 3
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 3
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 3
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 3
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 3
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 3
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 3
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 3
- 208000009889 Herpes Simplex Diseases 0.000 description 3
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 3
- KYFGGRHWLFZXPU-KKUMJFAQSA-N His-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N KYFGGRHWLFZXPU-KKUMJFAQSA-N 0.000 description 3
- ZFDKSLBEWYCOCS-BZSNNMDCSA-N His-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CC=CC=C1 ZFDKSLBEWYCOCS-BZSNNMDCSA-N 0.000 description 3
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 3
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 3
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 3
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 3
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 3
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 3
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 3
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 3
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 3
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 3
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 3
- 241000713666 Lentivirus Species 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 3
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 3
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 3
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 3
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 3
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 3
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 3
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 3
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 3
- XTONYTDATVADQH-CIUDSAMLSA-N Lys-Cys-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XTONYTDATVADQH-CIUDSAMLSA-N 0.000 description 3
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 3
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 3
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 3
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 3
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 3
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 3
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 3
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 3
- MIAZEQZXAFTCCG-UBHSHLNASA-N Met-Phe-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 MIAZEQZXAFTCCG-UBHSHLNASA-N 0.000 description 3
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- XWBJLKDCHJVKAK-KKUMJFAQSA-N Phe-Arg-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XWBJLKDCHJVKAK-KKUMJFAQSA-N 0.000 description 3
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 3
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 3
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 3
- QHSSUIHLAIWXEE-IHRRRGAJSA-N Pro-Tyr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O QHSSUIHLAIWXEE-IHRRRGAJSA-N 0.000 description 3
- 101100495925 Schizosaccharomyces pombe (strain 972 / ATCC 24843) chr3 gene Proteins 0.000 description 3
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 3
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 3
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 3
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 3
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 3
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 3
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 3
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 3
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 3
- MBFJIHUHHCJBSN-AVGNSLFASA-N Tyr-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MBFJIHUHHCJBSN-AVGNSLFASA-N 0.000 description 3
- BGFCXQXETBDEHP-BZSNNMDCSA-N Tyr-Phe-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O BGFCXQXETBDEHP-BZSNNMDCSA-N 0.000 description 3
- 206010046865 Vaccinia virus infection Diseases 0.000 description 3
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 3
- SVFRYKBZHUGKLP-QXEWZRGKSA-N Val-Met-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVFRYKBZHUGKLP-QXEWZRGKSA-N 0.000 description 3
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 108010069495 cysteinyltyrosine Proteins 0.000 description 3
- 238000012350 deep sequencing Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000005782 double-strand break Effects 0.000 description 3
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 3
- 108010036413 histidylglycine Proteins 0.000 description 3
- 108010018006 histidylserine Proteins 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 3
- 108010000761 leucylarginine Proteins 0.000 description 3
- 108010012058 leucyltyrosine Proteins 0.000 description 3
- 108010038320 lysylphenylalanine Proteins 0.000 description 3
- 235000021317 phosphate Nutrition 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 241001430294 unidentified retrovirus Species 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 3
- 208000007089 vaccinia Diseases 0.000 description 3
- 238000012070 whole genome sequencing analysis Methods 0.000 description 3
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 3
- CNKBMTKICGGSCQ-ACRUOGEOSA-N (2S)-2-[[(2S)-2-[[(2S)-2,6-diamino-1-oxohexyl]amino]-1-oxo-3-phenylpropyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CNKBMTKICGGSCQ-ACRUOGEOSA-N 0.000 description 2
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- IPAMZHCXCQLRJR-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-methylbutanoyl)amino]-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(C(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(N)C(C)C IPAMZHCXCQLRJR-UHFFFAOYSA-N 0.000 description 2
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 2
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 2
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 2
- WCBVQNZTOKJWJS-ACZMJKKPSA-N Ala-Cys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O WCBVQNZTOKJWJS-ACZMJKKPSA-N 0.000 description 2
- CXZFXHGJJPVUJE-CIUDSAMLSA-N Ala-Cys-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O)N CXZFXHGJJPVUJE-CIUDSAMLSA-N 0.000 description 2
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 2
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 2
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 2
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 2
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 2
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 2
- IHRGVZXPTIQNIP-NAKRPEOUSA-N Ala-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)N IHRGVZXPTIQNIP-NAKRPEOUSA-N 0.000 description 2
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 2
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 2
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 2
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 2
- SLNCSSWAIDUUGF-LSJOCFKGSA-N Arg-His-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O SLNCSSWAIDUUGF-LSJOCFKGSA-N 0.000 description 2
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 2
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 2
- LCBSSOCDWUTQQV-SDDRHHMPSA-N Arg-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LCBSSOCDWUTQQV-SDDRHHMPSA-N 0.000 description 2
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 2
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 2
- QQEWINYJRFBLNN-DLOVCJGASA-N Asn-Ala-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QQEWINYJRFBLNN-DLOVCJGASA-N 0.000 description 2
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 2
- LXTGAOAXPSJWOU-DCAQKATOSA-N Asn-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N LXTGAOAXPSJWOU-DCAQKATOSA-N 0.000 description 2
- JJGRJMKUOYXZRA-LPEHRKFASA-N Asn-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O JJGRJMKUOYXZRA-LPEHRKFASA-N 0.000 description 2
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 2
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 2
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 2
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 2
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 2
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 2
- QIRJQYQOIKBPBZ-IHRRRGAJSA-N Asn-Tyr-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QIRJQYQOIKBPBZ-IHRRRGAJSA-N 0.000 description 2
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 2
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 2
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 2
- RATOMFTUDRYMKX-ACZMJKKPSA-N Asp-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N RATOMFTUDRYMKX-ACZMJKKPSA-N 0.000 description 2
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 2
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 2
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 108700004991 Cas12a Proteins 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- TVYMKYUSZSVOAG-ZLUOBGJFSA-N Cys-Ala-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O TVYMKYUSZSVOAG-ZLUOBGJFSA-N 0.000 description 2
- AEJSNWMRPXAKCW-WHFBIAKZSA-N Cys-Ala-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AEJSNWMRPXAKCW-WHFBIAKZSA-N 0.000 description 2
- SFUUYRSAJPWTGO-SRVKXCTJSA-N Cys-Asn-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SFUUYRSAJPWTGO-SRVKXCTJSA-N 0.000 description 2
- CFQVGYWKSLKWFX-KBIXCLLPSA-N Cys-Glu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CFQVGYWKSLKWFX-KBIXCLLPSA-N 0.000 description 2
- MUZAUPFGPMMZSS-GUBZILKMSA-N Cys-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N MUZAUPFGPMMZSS-GUBZILKMSA-N 0.000 description 2
- WZJLBUPPZRZNTO-CIUDSAMLSA-N Cys-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N WZJLBUPPZRZNTO-CIUDSAMLSA-N 0.000 description 2
- 102220644534 Cytoglobin_T2A_mutation Human genes 0.000 description 2
- 230000007018 DNA scission Effects 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 241000721047 Danaus plexippus Species 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 2
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 2
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 2
- QMVCEWKHIUHTSD-GUBZILKMSA-N Gln-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QMVCEWKHIUHTSD-GUBZILKMSA-N 0.000 description 2
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 2
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 2
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 2
- UTKICHUQEQBDGC-ACZMJKKPSA-N Glu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UTKICHUQEQBDGC-ACZMJKKPSA-N 0.000 description 2
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 2
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 2
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 2
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 2
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 2
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 2
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 2
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 2
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 2
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 2
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 2
- DTRUBYPMMVPQPD-YUMQZZPRSA-N Gly-Gln-Arg Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DTRUBYPMMVPQPD-YUMQZZPRSA-N 0.000 description 2
- JUGQPPOVWXSPKJ-RYUDHWBXSA-N Gly-Gln-Phe Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JUGQPPOVWXSPKJ-RYUDHWBXSA-N 0.000 description 2
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 2
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 2
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 2
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 2
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 2
- ICUTTWWCDIIIEE-BQBZGAKWSA-N Gly-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN ICUTTWWCDIIIEE-BQBZGAKWSA-N 0.000 description 2
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 2
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 2
- JBSLJUPMTYLLFH-MELADBBJSA-N His-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O JBSLJUPMTYLLFH-MELADBBJSA-N 0.000 description 2
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 2
- BRQKGRLDDDQWQJ-MBLNEYKQSA-N His-Thr-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O BRQKGRLDDDQWQJ-MBLNEYKQSA-N 0.000 description 2
- WSWAUVHXQREQQG-JYJNAYRXSA-N His-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O WSWAUVHXQREQQG-JYJNAYRXSA-N 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 2
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 2
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 2
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 2
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 2
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 2
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 2
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 2
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 2
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 2
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 2
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 2
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 2
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 2
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 2
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 2
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 2
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- OZTZJMUZVAVJGY-BZSNNMDCSA-N Leu-Tyr-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OZTZJMUZVAVJGY-BZSNNMDCSA-N 0.000 description 2
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 2
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 2
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 2
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 2
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 2
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 2
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 2
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 2
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 2
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 2
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 2
- ZAENPHCEQXALHO-GUBZILKMSA-N Lys-Cys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZAENPHCEQXALHO-GUBZILKMSA-N 0.000 description 2
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 2
- IRRZDAIFYHNIIN-JYJNAYRXSA-N Lys-Gln-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IRRZDAIFYHNIIN-JYJNAYRXSA-N 0.000 description 2
- ZASPELYMPSACER-HOCLYGCPSA-N Lys-Gly-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZASPELYMPSACER-HOCLYGCPSA-N 0.000 description 2
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 2
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 2
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 2
- PGIAYBDRSREMJY-UHFFFAOYSA-N Lys-Lys-Met-Phe Chemical compound NCCCCC(N)C(=O)NC(CCCCN)C(=O)NC(CCSC)C(=O)NC(C(O)=O)CC1=CC=CC=C1 PGIAYBDRSREMJY-UHFFFAOYSA-N 0.000 description 2
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 2
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 2
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 2
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 2
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 2
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 2
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 2
- JQEBITVYKUCBMC-SRVKXCTJSA-N Met-Arg-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JQEBITVYKUCBMC-SRVKXCTJSA-N 0.000 description 2
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 2
- BQVJARUIXRXDKN-DCAQKATOSA-N Met-Asn-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BQVJARUIXRXDKN-DCAQKATOSA-N 0.000 description 2
- NLHSFJQUHGCWSD-PYJNHQTQSA-N Met-Ile-His Chemical compound N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O NLHSFJQUHGCWSD-PYJNHQTQSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241000713869 Moloney murine leukemia virus Species 0.000 description 2
- 108091061960 Naked DNA Proteins 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 2
- 102000002488 Nucleoplasmin Human genes 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 2
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 2
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 2
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 2
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 2
- FINLZXKJWTYYLC-ACRUOGEOSA-N Phe-His-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FINLZXKJWTYYLC-ACRUOGEOSA-N 0.000 description 2
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 2
- OXKJSGGTHFMGDT-UFYCRDLUSA-N Phe-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C1=CC=CC=C1 OXKJSGGTHFMGDT-UFYCRDLUSA-N 0.000 description 2
- QUUCAHIYARMNBL-FHWLQOOXSA-N Phe-Tyr-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N QUUCAHIYARMNBL-FHWLQOOXSA-N 0.000 description 2
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 2
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 2
- AJCRQOHDLCBHFA-SRVKXCTJSA-N Pro-His-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AJCRQOHDLCBHFA-SRVKXCTJSA-N 0.000 description 2
- XQHGISDMVBTGAL-ULQDDVLXSA-N Pro-His-Phe Chemical compound C([C@@H](C(=O)[O-])NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1[NH2+]CCC1)C1=CC=CC=C1 XQHGISDMVBTGAL-ULQDDVLXSA-N 0.000 description 2
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 2
- VWHJZETTZDAGOM-XUXIUFHCSA-N Pro-Lys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VWHJZETTZDAGOM-XUXIUFHCSA-N 0.000 description 2
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 2
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 2
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 2
- 230000006819 RNA synthesis Effects 0.000 description 2
- 238000011529 RT qPCR Methods 0.000 description 2
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 2
- WXWDPFVKQRVJBJ-CIUDSAMLSA-N Ser-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N WXWDPFVKQRVJBJ-CIUDSAMLSA-N 0.000 description 2
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 2
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 2
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 2
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 2
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 2
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 2
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 2
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 2
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 2
- SRKMDKACHDVPMD-SRVKXCTJSA-N Ser-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N SRKMDKACHDVPMD-SRVKXCTJSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 2
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 2
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 2
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 2
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 2
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 2
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 2
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 2
- 108091028113 Trans-activating crRNA Proteins 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- FKAPNDWDLDWZNF-QEJZJMRPSA-N Trp-Asp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FKAPNDWDLDWZNF-QEJZJMRPSA-N 0.000 description 2
- SNWIAPVRCNYFNI-SZMVWBNQSA-N Trp-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SNWIAPVRCNYFNI-SZMVWBNQSA-N 0.000 description 2
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 2
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 2
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 2
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 2
- QHONGSVIVOFKAC-ULQDDVLXSA-N Tyr-Pro-His Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QHONGSVIVOFKAC-ULQDDVLXSA-N 0.000 description 2
- YOTRXXBHTZHKLU-BVSLBCMMSA-N Tyr-Trp-Met Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(O)=O)C1=CC=C(O)C=C1 YOTRXXBHTZHKLU-BVSLBCMMSA-N 0.000 description 2
- DJJCXFVJDGTHFX-UHFFFAOYSA-N Uridinemonophosphate Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-UHFFFAOYSA-N 0.000 description 2
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 2
- CJDZKZFMAXGUOJ-IHRRRGAJSA-N Val-Cys-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CJDZKZFMAXGUOJ-IHRRRGAJSA-N 0.000 description 2
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 2
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 2
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 2
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 2
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 2
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 2
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 2
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 230000021736 acetylation Effects 0.000 description 2
- 238000006640 acetylation reaction Methods 0.000 description 2
- 101150063416 add gene Proteins 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 108010070783 alanyltyrosine Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 108091005948 blue fluorescent proteins Proteins 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 2
- IERHLVCPSMICTF-UHFFFAOYSA-N cytidine monophosphate Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(COP(O)(O)=O)O1 IERHLVCPSMICTF-UHFFFAOYSA-N 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 230000026030 halogenation Effects 0.000 description 2
- 238000005658 halogenation reaction Methods 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 230000009456 molecular mechanism Effects 0.000 description 2
- 229910052754 neon Inorganic materials 0.000 description 2
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 2
- 108060005597 nucleoplasmin Proteins 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- 241000202362 uncultured archaeon Species 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- DQVAZKGVGKHQDS-UHFFFAOYSA-N 2-[[1-[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(O)=O DQVAZKGVGKHQDS-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical group OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- YLZOPXRUQYQQID-UHFFFAOYSA-N 3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]propan-1-one Chemical compound N1N=NC=2CN(CCC=21)CCC(=O)N1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F YLZOPXRUQYQQID-UHFFFAOYSA-N 0.000 description 1
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 1
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 108010052875 Adenine deaminase Proteins 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- SIGTYDNEPYEXGK-ZANVPECISA-N Ala-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 SIGTYDNEPYEXGK-ZANVPECISA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- QPBSRMDNJOTFAL-AICCOOGYSA-N Ala-Leu-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QPBSRMDNJOTFAL-AICCOOGYSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 1
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 1
- JVMKBJNSRZWDBO-FXQIFTODSA-N Arg-Cys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O JVMKBJNSRZWDBO-FXQIFTODSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 1
- CVKOQHYVDVYJSI-QTKMDUPCSA-N Arg-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N)O CVKOQHYVDVYJSI-QTKMDUPCSA-N 0.000 description 1
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- PZBSKYJGKNNYNK-ULQDDVLXSA-N Arg-Leu-Tyr Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O PZBSKYJGKNNYNK-ULQDDVLXSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- ZEBDYGZVMMKZNB-SRVKXCTJSA-N Arg-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCN=C(N)N)N ZEBDYGZVMMKZNB-SRVKXCTJSA-N 0.000 description 1
- QHVRVUNEAIFTEK-SZMVWBNQSA-N Arg-Pro-Trp Chemical compound N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O QHVRVUNEAIFTEK-SZMVWBNQSA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 1
- ZUVMUOOHJYNJPP-XIRDDKMYSA-N Arg-Trp-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZUVMUOOHJYNJPP-XIRDDKMYSA-N 0.000 description 1
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 1
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 1
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 1
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 1
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 1
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- ZPMNECSEJXXNBE-CIUDSAMLSA-N Asn-Cys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZPMNECSEJXXNBE-CIUDSAMLSA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 1
- RZNAMKZJPBQWDJ-SRVKXCTJSA-N Asn-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N RZNAMKZJPBQWDJ-SRVKXCTJSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 1
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 1
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 1
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- HTOZUYZQPICRAP-BPUTZDHNSA-N Asp-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N HTOZUYZQPICRAP-BPUTZDHNSA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- APYNREQHZOGYHV-ACZMJKKPSA-N Asp-Cys-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N APYNREQHZOGYHV-ACZMJKKPSA-N 0.000 description 1
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 1
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 1
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 1
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 1
- OQMGSMNZVHYDTQ-ZKWXMUAHSA-N Asp-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N OQMGSMNZVHYDTQ-ZKWXMUAHSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- 206010061692 Benign muscle neoplasm Diseases 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 101100421200 Caenorhabditis elegans sep-1 gene Proteins 0.000 description 1
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 1
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 102100024343 Contactin-5 Human genes 0.000 description 1
- FMDCYTBSPZMPQE-JBDRJPRFSA-N Cys-Ala-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMDCYTBSPZMPQE-JBDRJPRFSA-N 0.000 description 1
- GCDLPNRHPWBKJJ-WDSKDSINSA-N Cys-Gly-Glu Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GCDLPNRHPWBKJJ-WDSKDSINSA-N 0.000 description 1
- RWAZRMXTVSIVJR-YUMQZZPRSA-N Cys-Gly-His Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CNC=N1)C(O)=O RWAZRMXTVSIVJR-YUMQZZPRSA-N 0.000 description 1
- SSNJZBGOMNLSLA-CIUDSAMLSA-N Cys-Leu-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O SSNJZBGOMNLSLA-CIUDSAMLSA-N 0.000 description 1
- CIBLYQCAZRYWHY-UHFFFAOYSA-N Cys-Leu-Phe-Cys Chemical compound SCC(N)C(=O)NC(CC(C)C)C(=O)NC(C(=O)NC(CS)C(O)=O)CC1=CC=CC=C1 CIBLYQCAZRYWHY-UHFFFAOYSA-N 0.000 description 1
- CAXGCBSRJLADPD-FXQIFTODSA-N Cys-Pro-Asn Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CAXGCBSRJLADPD-FXQIFTODSA-N 0.000 description 1
- NITLUESFANGEIW-BQBZGAKWSA-N Cys-Pro-Gly Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O NITLUESFANGEIW-BQBZGAKWSA-N 0.000 description 1
- BCFXQBXXDSEHRS-FXQIFTODSA-N Cys-Ser-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BCFXQBXXDSEHRS-FXQIFTODSA-N 0.000 description 1
- 108010031325 Cytidine deaminase Proteins 0.000 description 1
- 102100026846 Cytidine deaminase Human genes 0.000 description 1
- 108010080611 Cytosine Deaminase Proteins 0.000 description 1
- 102000000311 Cytosine Deaminase Human genes 0.000 description 1
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 1
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 102100029104 Ferroxidase HEPHL1 Human genes 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 1
- SBHVGKBYOQKAEA-SDDRHHMPSA-N Gln-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SBHVGKBYOQKAEA-SDDRHHMPSA-N 0.000 description 1
- DAAUVRPSZRDMBV-KBIXCLLPSA-N Gln-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DAAUVRPSZRDMBV-KBIXCLLPSA-N 0.000 description 1
- FYAULIGIFPPOAA-ZPFDUUQYSA-N Gln-Ile-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O FYAULIGIFPPOAA-ZPFDUUQYSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 1
- OZEQPCDLCDRCGY-SOUVJXGZSA-N Gln-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O OZEQPCDLCDRCGY-SOUVJXGZSA-N 0.000 description 1
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 1
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 1
- MFHVAWMMKZBSRQ-ACZMJKKPSA-N Gln-Ser-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N MFHVAWMMKZBSRQ-ACZMJKKPSA-N 0.000 description 1
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- UQKVUFGUSVYJMQ-IRIUXVKKSA-N Gln-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N)O UQKVUFGUSVYJMQ-IRIUXVKKSA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 1
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 1
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- OHWJUIXZHVIXJJ-GUBZILKMSA-N Glu-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N OHWJUIXZHVIXJJ-GUBZILKMSA-N 0.000 description 1
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 1
- XNOWYPDMSLSRKP-GUBZILKMSA-N Glu-Met-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O XNOWYPDMSLSRKP-GUBZILKMSA-N 0.000 description 1
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- GUOWMVFLAJNPDY-CIUDSAMLSA-N Glu-Ser-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GUOWMVFLAJNPDY-CIUDSAMLSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- LWYUQLZOIORFFJ-XKBZYTNZSA-N Glu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O LWYUQLZOIORFFJ-XKBZYTNZSA-N 0.000 description 1
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 1
- JDAYMLXPUJRSDJ-XIRDDKMYSA-N Glu-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 JDAYMLXPUJRSDJ-XIRDDKMYSA-N 0.000 description 1
- NTHIHAUEXVTXQG-KKUMJFAQSA-N Glu-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O NTHIHAUEXVTXQG-KKUMJFAQSA-N 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- QGZSAHIZRQHCEQ-QWRGUYRKSA-N Gly-Asp-Tyr Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QGZSAHIZRQHCEQ-QWRGUYRKSA-N 0.000 description 1
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 1
- BIRKKBCSAIHDDF-WDSKDSINSA-N Gly-Glu-Cys Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O BIRKKBCSAIHDDF-WDSKDSINSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 1
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 1
- QVDGHDFFYHKJPN-QWRGUYRKSA-N Gly-Phe-Cys Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O QVDGHDFFYHKJPN-QWRGUYRKSA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- NZOAFWHVAFJERA-OALUTQOASA-N Gly-Phe-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NZOAFWHVAFJERA-OALUTQOASA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- ONSARSFSJHTMFJ-STQMWFEESA-N Gly-Trp-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ONSARSFSJHTMFJ-STQMWFEESA-N 0.000 description 1
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 1
- WRFOZIJRODPLIA-QWRGUYRKSA-N Gly-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)O WRFOZIJRODPLIA-QWRGUYRKSA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- HRGGKHFHRSFSDE-CIUDSAMLSA-N His-Asn-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N HRGGKHFHRSFSDE-CIUDSAMLSA-N 0.000 description 1
- NWGXCPUKPVISSJ-AVGNSLFASA-N His-Gln-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NWGXCPUKPVISSJ-AVGNSLFASA-N 0.000 description 1
- PQKCQZHAGILVIM-NKIYYHGXSA-N His-Glu-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O PQKCQZHAGILVIM-NKIYYHGXSA-N 0.000 description 1
- YADRBUZBKHHDAO-XPUUQOCRSA-N His-Gly-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C)C(O)=O YADRBUZBKHHDAO-XPUUQOCRSA-N 0.000 description 1
- MPXGJGBXCRQQJE-MXAVVETBSA-N His-Ile-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O MPXGJGBXCRQQJE-MXAVVETBSA-N 0.000 description 1
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 1
- OWYIDJCNRWRSJY-QTKMDUPCSA-N His-Pro-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O OWYIDJCNRWRSJY-QTKMDUPCSA-N 0.000 description 1
- CUEQQFOGARVNHU-VGDYDELISA-N His-Ser-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUEQQFOGARVNHU-VGDYDELISA-N 0.000 description 1
- PBJOQLUVSGXRSW-YTQUADARSA-N His-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CN=CN4)N)C(=O)O PBJOQLUVSGXRSW-YTQUADARSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- SYPULFZAGBBIOM-GVXVVHGQSA-N His-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SYPULFZAGBBIOM-GVXVVHGQSA-N 0.000 description 1
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000909507 Homo sapiens Contactin-5 Proteins 0.000 description 1
- 101000988798 Homo sapiens Ferroxidase HEPHL1 Proteins 0.000 description 1
- 101001046960 Homo sapiens Keratin, type II cytoskeletal 1 Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101001072716 Homo sapiens PiggyBac transposable element-derived protein 2 Proteins 0.000 description 1
- 101000740745 Homo sapiens Uncharacterized protein CFAP97D2 Proteins 0.000 description 1
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- QYOGJYIRKACXEP-SLBDDTMCSA-N Ile-Asn-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N QYOGJYIRKACXEP-SLBDDTMCSA-N 0.000 description 1
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 1
- DMZOUKXXHJQPTL-GRLWGSQLSA-N Ile-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N DMZOUKXXHJQPTL-GRLWGSQLSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- UASTVUQJMLZWGG-PEXQALLHSA-N Ile-His-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N UASTVUQJMLZWGG-PEXQALLHSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- UWLHDGMRWXHFFY-HPCHECBXSA-N Ile-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@@H]1C(=O)O)N UWLHDGMRWXHFFY-HPCHECBXSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- RQQCJTLBSJMVCR-DSYPUSFNSA-N Ile-Leu-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N RQQCJTLBSJMVCR-DSYPUSFNSA-N 0.000 description 1
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 1
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 1
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 1
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- UYNXBNHVWFNVIN-HJWJTTGWSA-N Ile-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 UYNXBNHVWFNVIN-HJWJTTGWSA-N 0.000 description 1
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 1
- KWHFUMYCSPJCFQ-NGTWOADLSA-N Ile-Thr-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N KWHFUMYCSPJCFQ-NGTWOADLSA-N 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 102100022905 Keratin, type II cytoskeletal 1 Human genes 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- BOFAFKVZQUMTID-AVGNSLFASA-N Leu-Gln-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BOFAFKVZQUMTID-AVGNSLFASA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 1
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- YESNGRDJQWDYLH-KKUMJFAQSA-N Leu-Phe-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YESNGRDJQWDYLH-KKUMJFAQSA-N 0.000 description 1
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- HQBOMRTVKVKFMN-WDSOQIARSA-N Leu-Trp-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O HQBOMRTVKVKFMN-WDSOQIARSA-N 0.000 description 1
- SXOFUVGLPHCPRQ-KKUMJFAQSA-N Leu-Tyr-Cys Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(O)=O SXOFUVGLPHCPRQ-KKUMJFAQSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 239000006137 Luria-Bertani broth Substances 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 1
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 1
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- URGPVYGVWLIRGT-DCAQKATOSA-N Lys-Met-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O URGPVYGVWLIRGT-DCAQKATOSA-N 0.000 description 1
- SKUOQDYMJFUMOE-ULQDDVLXSA-N Lys-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N SKUOQDYMJFUMOE-ULQDDVLXSA-N 0.000 description 1
- AEIIJFBQVGYVEV-YESZJQIVSA-N Lys-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCCN)N)C(=O)O AEIIJFBQVGYVEV-YESZJQIVSA-N 0.000 description 1
- MSSABBQOBUZFKZ-IHRRRGAJSA-N Lys-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCCN)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O MSSABBQOBUZFKZ-IHRRRGAJSA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- TVOOGUNBIWAURO-KATARQTJSA-N Lys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N)O TVOOGUNBIWAURO-KATARQTJSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 1
- GVIVXNFKJQFTCE-YUMQZZPRSA-N Met-Gly-Gln Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O GVIVXNFKJQFTCE-YUMQZZPRSA-N 0.000 description 1
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 1
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- CGUYGMFQZCYJSG-DCAQKATOSA-N Met-Lys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CGUYGMFQZCYJSG-DCAQKATOSA-N 0.000 description 1
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 1
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 241000714177 Murine leukemia virus Species 0.000 description 1
- 101100078999 Mus musculus Mx1 gene Proteins 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 201000004458 Myoma Diseases 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 1
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- LBSARGIQACMGDF-WBAXXEDZSA-N Phe-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 LBSARGIQACMGDF-WBAXXEDZSA-N 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 1
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 1
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 1
- JOXIIFVCSATTDH-IHPCNDPISA-N Phe-Asn-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JOXIIFVCSATTDH-IHPCNDPISA-N 0.000 description 1
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 1
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 1
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 1
- JQLQUPIYYJXZLJ-ZEWNOJEFSA-N Phe-Ile-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 JQLQUPIYYJXZLJ-ZEWNOJEFSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- CJAHQEZWDZNSJO-KKUMJFAQSA-N Phe-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CJAHQEZWDZNSJO-KKUMJFAQSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- PBWNICYZGJQKJV-BZSNNMDCSA-N Phe-Phe-Cys Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O PBWNICYZGJQKJV-BZSNNMDCSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 1
- GZGPMBKUJDRICD-ULQDDVLXSA-N Phe-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O GZGPMBKUJDRICD-ULQDDVLXSA-N 0.000 description 1
- FZBGMXYQPACKNC-HJWJTTGWSA-N Phe-Pro-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FZBGMXYQPACKNC-HJWJTTGWSA-N 0.000 description 1
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 1
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- UMIHVJQSXFWWMW-JBACZVJFSA-N Phe-Trp-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UMIHVJQSXFWWMW-JBACZVJFSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- 102100036681 PiggyBac transposable element-derived protein 2 Human genes 0.000 description 1
- 101710124239 Poly(A) polymerase Proteins 0.000 description 1
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 1
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 1
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- NOXSEHJOXCWRHK-DCAQKATOSA-N Pro-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 NOXSEHJOXCWRHK-DCAQKATOSA-N 0.000 description 1
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 1
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 1
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 1
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 1
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 1
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 1
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- DLZBBDSPTJBOOD-BPNCWPANSA-N Pro-Tyr-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O DLZBBDSPTJBOOD-BPNCWPANSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- IDCKUIWEIZYVSO-WFBYXXMGSA-N Ser-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C)C(O)=O)=CNC2=C1 IDCKUIWEIZYVSO-WFBYXXMGSA-N 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- COLJZWUVZIXSSS-CIUDSAMLSA-N Ser-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N COLJZWUVZIXSSS-CIUDSAMLSA-N 0.000 description 1
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 1
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- FKZSXTKZLPPHQU-GQGQLFGLSA-N Ser-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CO)N FKZSXTKZLPPHQU-GQGQLFGLSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- JLPMFVAIQHCBDC-CIUDSAMLSA-N Ser-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N JLPMFVAIQHCBDC-CIUDSAMLSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- XQAPEISNMXNKGE-FXQIFTODSA-N Ser-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CS)C(=O)O XQAPEISNMXNKGE-FXQIFTODSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- 102100028948 Serine/threonine-protein kinase TAO1 Human genes 0.000 description 1
- 101710106079 Serine/threonine-protein kinase TAO1 Proteins 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 108010076818 TEV protease Proteins 0.000 description 1
- JMQUAZXYFAEOIH-XGEHTFHBSA-N Thr-Arg-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)O JMQUAZXYFAEOIH-XGEHTFHBSA-N 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- DCCGCVLVVSAJFK-NUMRIWBASA-N Thr-Asp-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O DCCGCVLVVSAJFK-NUMRIWBASA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 1
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- ZEJBJDHSQPOVJV-UAXMHLISSA-N Thr-Trp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZEJBJDHSQPOVJV-UAXMHLISSA-N 0.000 description 1
- NDLHSJWPCXKOGG-VLCNGCBASA-N Thr-Trp-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N)O NDLHSJWPCXKOGG-VLCNGCBASA-N 0.000 description 1
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- GHXXDFDIDHIEIL-WFBYXXMGSA-N Trp-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GHXXDFDIDHIEIL-WFBYXXMGSA-N 0.000 description 1
- MQVGIFJSFFVGFW-XEGUGMAKSA-N Trp-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MQVGIFJSFFVGFW-XEGUGMAKSA-N 0.000 description 1
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 1
- PEYSVKMXSLPQRU-FJHTZYQYSA-N Trp-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O PEYSVKMXSLPQRU-FJHTZYQYSA-N 0.000 description 1
- QNMIVTOQXUSGLN-SZMVWBNQSA-N Trp-Arg-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QNMIVTOQXUSGLN-SZMVWBNQSA-N 0.000 description 1
- KZIQDVNORJKTMO-WDSOQIARSA-N Trp-Arg-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N KZIQDVNORJKTMO-WDSOQIARSA-N 0.000 description 1
- BXKWZPXTTSCOMX-AQZXSJQPSA-N Trp-Asn-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXKWZPXTTSCOMX-AQZXSJQPSA-N 0.000 description 1
- JLTQXEOXIJMCLZ-ZVZYQTTQSA-N Trp-Gln-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 JLTQXEOXIJMCLZ-ZVZYQTTQSA-N 0.000 description 1
- OBAMASZCXDIXSS-SZMVWBNQSA-N Trp-Glu-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N OBAMASZCXDIXSS-SZMVWBNQSA-N 0.000 description 1
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 1
- RQLNEFOBQAVGSY-WDSOQIARSA-N Trp-Met-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQLNEFOBQAVGSY-WDSOQIARSA-N 0.000 description 1
- PWPJLBWYRTVYQS-PMVMPFDFSA-N Trp-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PWPJLBWYRTVYQS-PMVMPFDFSA-N 0.000 description 1
- UHXOYRWHIQZAKV-SZMVWBNQSA-N Trp-Pro-Arg Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O UHXOYRWHIQZAKV-SZMVWBNQSA-N 0.000 description 1
- LORJKYIPJIRIRT-BVSLBCMMSA-N Trp-Pro-Tyr Chemical compound C([C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 LORJKYIPJIRIRT-BVSLBCMMSA-N 0.000 description 1
- WSMVEHPVOYXPAQ-XIRDDKMYSA-N Trp-Ser-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N WSMVEHPVOYXPAQ-XIRDDKMYSA-N 0.000 description 1
- GEGYPBOPIGNZIF-CWRNSKLLSA-N Trp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O GEGYPBOPIGNZIF-CWRNSKLLSA-N 0.000 description 1
- YTHWAWACWGWBLE-MNSWYVGCSA-N Trp-Tyr-Thr Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 YTHWAWACWGWBLE-MNSWYVGCSA-N 0.000 description 1
- MBLJBGZWLHTJBH-SZMVWBNQSA-N Trp-Val-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 MBLJBGZWLHTJBH-SZMVWBNQSA-N 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 1
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 1
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 1
- DKKHULUSOSWGHS-UWJYBYFXSA-N Tyr-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DKKHULUSOSWGHS-UWJYBYFXSA-N 0.000 description 1
- WEFIPBYPXZYPHD-HJPIBITLSA-N Tyr-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WEFIPBYPXZYPHD-HJPIBITLSA-N 0.000 description 1
- YWXMGBUGMLJMIP-IHPCNDPISA-N Tyr-Cys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC3=CC=C(C=C3)O)N YWXMGBUGMLJMIP-IHPCNDPISA-N 0.000 description 1
- ARPONUQDNWLXOZ-KKUMJFAQSA-N Tyr-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ARPONUQDNWLXOZ-KKUMJFAQSA-N 0.000 description 1
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 1
- MPKPIWFFDWVJGC-IRIUXVKKSA-N Tyr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O MPKPIWFFDWVJGC-IRIUXVKKSA-N 0.000 description 1
- FNWGDMZVYBVAGJ-XEGUGMAKSA-N Tyr-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CC=C(C=C1)O)N FNWGDMZVYBVAGJ-XEGUGMAKSA-N 0.000 description 1
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 1
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- UPODKYBYUBTWSV-BZSNNMDCSA-N Tyr-Phe-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=C(O)C=C1 UPODKYBYUBTWSV-BZSNNMDCSA-N 0.000 description 1
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 1
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 1
- JQOMHZMWQHXALX-FHWLQOOXSA-N Tyr-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JQOMHZMWQHXALX-FHWLQOOXSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- 102100037045 Uncharacterized protein CFAP97D2 Human genes 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 1
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 1
- IQQYYFPCWKWUHW-YDHLFZDLSA-N Val-Asn-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N IQQYYFPCWKWUHW-YDHLFZDLSA-N 0.000 description 1
- CWSIBTLMMQLPPZ-FXQIFTODSA-N Val-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N CWSIBTLMMQLPPZ-FXQIFTODSA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- LGXUZJIQCGXKGZ-QXEWZRGKSA-N Val-Pro-Asn Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N LGXUZJIQCGXKGZ-QXEWZRGKSA-N 0.000 description 1
- HPOSMQWRPMRMFO-GUBZILKMSA-N Val-Pro-Cys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HPOSMQWRPMRMFO-GUBZILKMSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- 230000007488 abnormal function Effects 0.000 description 1
- LPQOADBMXVRBNX-UHFFFAOYSA-N ac1ldcw0 Chemical compound Cl.C1CN(C)CCN1C1=C(F)C=C2C(=O)C(C(O)=O)=CN3CCSC1=C32 LPQOADBMXVRBNX-UHFFFAOYSA-N 0.000 description 1
- 239000000370 acceptor Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 1
- LNQVTSROQXJCDD-UHFFFAOYSA-N adenosine monophosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)C(OP(O)(O)=O)C1O LNQVTSROQXJCDD-UHFFFAOYSA-N 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 102000009899 alpha Karyopherins Human genes 0.000 description 1
- 108010077099 alpha Karyopherins Proteins 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000011304 droplet digital PCR Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 239000002515 guano Substances 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 108700032552 influenza virus INS1 Proteins 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- NBQNWMBBSKPBAY-UHFFFAOYSA-N iodixanol Chemical compound IC=1C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C(I)C=1N(C(=O)C)CC(O)CN(C(C)=O)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I NBQNWMBBSKPBAY-UHFFFAOYSA-N 0.000 description 1
- 229960004359 iodixanol Drugs 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 230000025308 nuclear transport Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 239000013646 rAAV2 vector Substances 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Mycology (AREA)
- Cell Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 engineered CRISPR/Cas12f1(Cas14a1) system에 관한 것이다. 보다 구체적으로, 본 발명은 표적 핵산의 절단, 편집 또는 변형을 더욱 효과적으로 수행하기 위한 engineered guide RNA 및 이를 포함한 engineered CRISPR/Cas12f1(Cas14a1) system에 관한 것이다. 또한, 본 발명은 engineered guide RNA 및 이를 포함한 engineered CRISPR/Cas12f1(Cas14a1) system를 이용한 표적 핵산의 절단, 편집 또는 변형 방법에 관한 것이다.
Description
본 발명은 engineered CRISPR/Cas12f1(Cas14a1) system에 관한 것이다. 보다 구체적으로, 본 발명은 표적 핵산의 절단(cleavage), 편집(editing) 또는 변형(modifying)을 더욱 효과적으로 수행하기 위한 engineered guide RNA 및 이를 포함한 engineered CRISPR/Cas12f1(Cas14a1) system에 관한 것이다. 또한, 본 발명은 engineered guide RNA 및 이를 포함한 engineered CRISPR/Cas12f1(Cas14a1) system를 이용한 표적 핵산의 절단, 편집 또는 변형 방법에 관한 것이다.
CRISPR/Cas12f1 system은 Class 2, Type V로 분류되는 CRISPR/Cas 시스템이다. 선행연구(Harrington et al., Science 362, 839-842 (2018))에서 최초로 고균 유래의 CRISPR/Cas 시스템인 CRISPR/Cas14 시스템에 대해 밝혀졌다. 그 후 후속 연구(Tautvydas Karvelis et al., Nucleic Acids Research 48, 5016-5023 (2020))에서 상기 CRISPR/Cas14 시스템을 CRISPR/Cas12f 시스템으로 분류하였다. CRISPR/Cas12f1 system은 상기 Class 2, Type V로 분류되는 CRISPR/Cas 시스템 중 하나의 베리언트인 V-F1 시스템에 속하며, 이는 Cas14a1를 이펙터 단백질로 가지는 CRISPR/Cas14a1 system을 포함한다. 상기 CRISPR/Cas12f1 system은 CRISPR/Cas9 system에 비하여 이펙터 단백질의 크기가 현저히 작다는 특징이 있다. 다만, 선행 연구(Harrington et al., Science 362, 839-842 (2018), US 2020/0190494 A1)에서 밝혀진 바로는, 상기 CRISPR/Cas12f1 시스템, 특히 CRISPR/Cas14a1 system은 이중 가닥 DNA 절단 활성이 없거나, 극히 낮아(Karvelis, T. et al., bioRxiv, 654897 (2019)) 유전자 편집 기술에 응용하는 데 한계가 있다.
본 발명의 일 목적은 CRISPR/Cas12f1(Cas14a1) system을 위한 engineered guide RNA를 제공하는 것이다.
본 발명의 다른 목적은 engineered CRISPR/Cas12f1(Cas14a1) system을 제공하는 것이다.
본 발명의 또 다른 목적은 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물을 제공하는 것이다.
본 발명의 또 다른 목적은 engineered CRISPR/Cas12f1(Cas14a1) system을 이용한 표적 핵산 또는 표적 유전자를 변형하는 방법을 제공하는 것이다.
본 발명은 CRISPR/Cas12f1(Cas14a1) system을 위한 engineered guide RNA를 제공한다. 상기 engineered guide RNA는 engineered tracrRNA(trans-activating CRISPR RNA) 및 crRNA(CRISPR RNA)를 포함한다. 이때, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 tracrRNA이다. 또는, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형되고, wildtype tracrRNA보다 길이가 짧도록 변형된 tracrRNA이다.
일 구현예로서, 상기 engineered guide RNA는 engineered tracrRNA(trans-activating crispr RNA) 및 crRNA(crispr RNA)를 포함할 수 있다.
상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 tracrRNA일 수 있다.
상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5서열을 3'말단에서 5'말단 방향으로 순서대로 포함할 수 있다.
이때, 상기 제1 서열은 5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 194) 서열 또는 SEQ ID NO: 194 서열의 일부 서열일 수 있다. 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 V는 A, C 또는 G일 수 있다. 상기 SEQ ID NO: 194 서열의 일부 서열은 상기 SEQ ID NO: 194 서열 중 5'-CAAAUUCANNNVN-3' (SEQ ID NO: 193) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 일 구체예로, 상기 제1 서열은 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 111) 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 상기 SEQ ID NO: 111 서열의 일부 서열은 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACA-3' (SEQ ID NO: 273) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCAC-3' (SEQ ID NO: 274) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 275) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGC-3' (SEQ ID NO: 276) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUG-3' (SEQ ID NO: 277) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCU-3' (SEQ ID NO: 278) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUC-3' (SEQ ID NO: 279) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUU-3' (SEQ ID NO: 280) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAU-3' (SEQ ID NO: 281) 서열, 5'-CAAAUUCANNNCNCCUCUCCAA-3' (SEQ ID NO: 282) 서열, 5'-CAAAUUCANNNCNCCUCUCCA-3' (SEQ ID NO: 283) 서열, 5'-CAAAUUCANNNCNCCUCUCC-3' (SEQ ID NO: 284) 서열, 5'-CAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 285) 서열, 5'-CAAAUUCANNNCNCCUCU-3' (SEQ ID NO: 286) 서열, 5'-CAAAUUCANNNCNCCUC-3' (SEQ ID NO: 287) 서열, 5'-CAAAUUCANNNCNCCU-3' (SEQ ID NO: 288) 서열, 5'-CAAAUUCANNNCNCC-3' (SEQ ID NO: 289) 서열, 5'-CAAAUUCANNNCNC-3' (SEQ ID NO: 290) 서열 또는 5'-CAAAUUCANNNCN-3' (SEQ ID NO: 272) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 일 예로, 상기 SEQ ID NO: 111 또는 이의 일부 서열 내에 존재하는 5'-NNNCN-3' 서열은 5'-UUUCU-3' 서열, 5'-GUUCU-3' 서열, 5'-UCUCU-3' 서열, 5'-UUGCU-3' 서열, 5'-UUUCC-3' 서열, 5'-GCUCU-3' 서열, 5'-GUUCC-3' 서열, 5'-UCGCU-3' 서열, 5'-UCUCC-3' 서열, 5'-UUGCC-3' 서열, 5'-GCGCU-3' 서열, 5'-GCUCC-3' 서열, 5'-GUGCC-3' 서열, 5'-UCGCC-3' 서열, 5'-GCGCC-3' 서열 또는 5'-GUGCU-3' 서열일 수 있다.
이때, 상기 제2 서열은 5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO: 211) 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
이때, 상기 제3 서열은 5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO: 212) 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
이때, 상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 213) 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 상기 SEQ ID NO: 213 서열의 일부 서열은 5'-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 214) 서열, 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 215) 서열, 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 216) 서열, 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 217) 서열, 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 231) 서열, 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 232) 서열, 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 233) 서열, 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 234) 서열, 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUG-3' (SEQ ID NO: 235) 서열, 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUG-3' (SEQ ID NO: 236) 서열, 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUG-3' (SEQ ID NO: 237) 서열, 5'-CCGCUUCACCAUUAGUGAGUGAAGGUG-3' (SEQ ID NO: 238) 서열, 5'-CCGCUUCACCUUAGGAGUGAAGGUG-3' (SEQ ID NO:239) 서열, 5'-CCGCUUCACUUAGAGUGAAGGUG-3' (SEQ ID NO: 240) 서열, 5'-CCGCUUCACUUAGGUGAAGGUG-3' (SEQ ID NO: 241) 서열, 5'-CCGCUUCAUUAGUGAAGGUG-3' (SEQ ID NO: 242) 서열, 5'-CCGCUUCUUAGGAAGGUG-3' (SEQ ID NO: 243) 서열, 5'-CCGCUUUUAGAAGGUG-3' (SEQ ID NO: 244) 서열, 5'-CCGCUUUAGAGGUG-3' (SEQ ID NO: 245) 서열, 5'-CCGCUUAGGGUG-3' (SEQ ID NO: 246) 서열, 5'-CCGUUAGGUG-3' (SEQ ID NO: 247) 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 또는 5'-UUAG-3' 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열 내에 포함된 5'-UUAG-3' 서열은 선택적으로 5'-GAAA-3' 서열로 치환될 수 있다.
이때, 상기 제5 서열은 5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 248) 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열일 수 있다. 상기 SEQ ID NO: 248 서열의 일부 서열은 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열, 5'-AAGUGGAGAA-3' (SEQ ID NO: 249) 서열, 5'-AAAGUGGAGAA-3' (SEQ ID NO: 250) 서열, 5'-UAAAGUGGAGAA-3' (SEQ ID NO: 251) 서열, 5'-AUAAAGUGGAGAA-3' (SEQ ID NO: 252) 서열, 5'-GAUAAAGUGGAGAA-3' (SEQ ID NO: 253) 서열, 5'-UGAUAAAGUGGAGAA-3' (SEQ ID NO: 254) 서열, 5'-CUGAUAAAGUGGAGAA-3' (SEQ ID NO: 255) 서열, 5'-ACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 256) 서열, 5'-CACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 257) 서열, 5'-UCACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 258) 서열 또는 5'-UUCACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 259) 서열일 수 있다.
상기 crRNA은 야생형 crRNA 또는 engineered crRNA일 수 있다.
이때, 상기 야생형 crRNA는 야생형 반복 서열(repeat sequence) 및 가이드 서열(guide sequence)을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다. 상기 야생형 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열일 수 있다.
이때, 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다.
이때, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3’ (SEQ ID NO: 373) 서열 또는 SEQ ID NO: 373 서열의 일부 서열일 수 있다. 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 SEQ ID NO: 373 서열의 일부 서열은 상기 SEQ ID NO: 373 서열 중 5'-NBNNNUGAAGGA-3' (SEQ ID NO: 372) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 일 구체예로, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 408) 서열 또는 SEQ ID NO: 408 서열의 일부 서열일 수 있다. 상기 SEQ ID NO: 408 서열의 일부 서열은 5’-UUGCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 413) 서열, 5’-UGCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 414) 서열, 5’-GCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 415) 서열, 5’-CAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 416) 서열, 5’-AGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 417) 서열, 5’-GAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 418) 서열, 5’-AACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 419) 서열, 5’-ACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 420) 서열, 5’-CCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 421) 서열, 5’-CCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 422) 서열, 5’-CGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 423) 서열, 5’-GAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 424) 서열, 5’-AAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 425) 서열, 5’-AUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 426) 서열, 5’-UAGNGNNNUGAAGGA-3’ (SEQ ID NO: 427) 서열, 5’-AGNGNNNUGAAGGA-3’ (SEQ ID NO: 428) 서열 또는 5’-NGNNNUGAAGGA-3’ (SEQ ID NO: 412) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 일 예로, 상기 SEQ ID NO: 408 서열 또는 이의 일부 서열 내에 존재하는 5'-NGNNN-3' 서열은 5'-AGGAA-3' 서열, 5'-AGCAA-3' 서열, 5'-AGAAA-3' 서열, 5'-AGCAU-3' 서열, 5'-AGCAG-3' 서열, 5'-AGCAC-3' 서열, 5'-AGCUA-3' 서열, 5'-AGCGA-3' 서열, 5'-AGCCA-3' 서열, 5'-UGCAA-3' 서열, 5'-UGCUA-3' 서열, 5'-UGCGA-3' 서열, 5'-UGCCA-3' 서열, 5'-GGCAA-3' 서열, 5'-GGCUA-3' 서열, 5'-GGCGA-3' 서열, 5'-GGCCA-3' 서열, 5'-CGCAA-3' 서열, 5'-CGCUA-3' 서열, 5'-CGCGA-3' 서열 또는 5'-CGCCA-3' 서열일 수 있다.
이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
이때, 상기 가이드 서열은 표적 서열과 혼성화(hybridizing)할 수 있는 서열 또는 표적 서열과 상보적인 결합을 형성하는 서열로, 15 내지 30 nt(nucleotide) 서열일 수 있다.
상기 crRNA는 U-rich tail 서열을 추가로 더 포함할 수 있다. 이때, 상기 U-rich tail 서열은 상기 crRNA의 3'말단에 위치할 수 있다. 이때, 상기 U-rich tail 서열은 5’-(UaN)dUe-3’ 서열, 5’-UaVUaVUe-3’ 서열 또는 5’-UaVUaVUaVUe-3’ 서열일 수 있다. 상기 N은 A, C, G 또는 U일 수 있다. 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 상기 d는 0 내지 3의 정수일 수 있다. 상기 e는 0 내지 10의 정수일 수 있다.
상기 engineered guide RNA는 dual guide RNA 또는 single guide RNA일 수 있다.
상기 engineered guide RNA가 single guide RNA일 때, 상기 engineered guide RNA는 linker 서열을 추가로 더 포함할 수 있다. 이때, 상기 linker 서열은 상기 engineered tracrRNA와 상기 crRNA 사이에 위치할 수 있다.
일 구체예로, 상기 engineered tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 269) 서열, 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 304) 서열, 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 590) 서열 또는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 301) 서열을 포함할 수 있다. 상기 engineered crRNA는 5’-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAAC-3’ (SEQ ID NO: 591) 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 일 예로, 상기 engineered tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 270) 서열, 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 308) 서열, 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 595) 서열 또는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 306) 서열을 포함할 수 있다. 상기 engineered crRNA는 5’-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC-3’ (SEQ ID NO: 539) 서열 및 가이드 서열을 포함할 수 있다.
다른 일 구체예로, 상기 engineered tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 592) 서열, 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 305) 서열, 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 593) 서열 또는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 300) 서열을 포함할 수 있다. 상기 engineered crRNA는 5’-GAAUAGNGNNNUGAAGGAAUGCAAC-3’ (SEQ ID NO: 594) 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 일 예로, 상기 engineered tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCGUGCUCCUCUC-3' (SEQ ID NO: 596) 서열, 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 309) 서열, 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 597) 서열 또는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 307) 서열을 포함할 수 있다. 상기 engineered crRNA는 5’-GAAUAGAGCAAUGAAGGAAUGCAAC-3’ (SEQ ID NO: 598) 서열 및 가이드 서열을 포함할 수 있다.
본 발명은 engineered CRISPR/Cas12f1(Cas14a1) system을 위한 벡터를 제공한다. 상기 벡터는 engineered guide RNA를 암호화하는 핵산을 포함한다.
일 구현예로서, 상기 벡터는 engineered guide RNA를 암호화하는 핵산을 포함할 수 있다.
상기 engineered guide RNA는 engineered tracrRNA 및 crRNA를 포함할 수 있다. 이때, 상기 engineered guide RNA는 앞서 설명한 engineered guide RNA의 구현예 와 동일한 구성을 가질 수 있다.
상기 벡터는 상기 engineered guide RNA를 암호화하는 핵산을 위한 프로모터를 더 포함할 수 있다. 이때, 상기 프로모터는 U6 프로모터, H1 프로모터 또는 7SK 프로모터일 수 있다.
상기 벡터는 플라스미드, PCR 엠플리콘 또는 바이러스 벡터일 수 있다. 이때, 상기 바이러스 벡터는 레트로바이러스 벡터(retroviral(retrovirus) vector), 렌티바이러스 벡터(lentiviral(lentivirus) vector), 아데노바이러스 벡터(adenoviral(adenovirus vector), 아데노-연관 바이러스 벡터(adeno-associated viral (adeno-associated virus; AAV) vector), 백시니아바이러스 벡터(vaccinia viral(vaccinia virus) vector), 폭스바이러스 벡터(poxviral(poxvirus) vector) 및 단순포진 바이러스 벡터(herpes simplex viral(herpes simplex virus) vector)로 구성된 군에서 선택되는 적어도 하나의 바이러스 벡터일 수 있다.
본 발명은 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물을 제공한다. 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 engineered guide RNA 또는 이를 암호화하는 핵산; 및 Cas14a1 단백질 또는 이를 암호화하는 핵산을 포함한다.
일 구현예로서, 상기 조성물은 engineered guide RNA 또는 이를 암호화하는 핵산; 및 Cas14a1 단백질 또는 이를 암호화하는 핵산을 포함할 수 있다.
상기 engineered guide RNA는 engineered tracrRNA 및 crRNA를 포함할 수 있다. 이때, 상기 engineered guide RNA는 앞서 설명한 engineered guide RNA의 구현예 와 동일한 구성을 가질 수 있다.
상기 조성물은 벡터 형태일 수 있다. 이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산; 및 Cas14a1 단백질을 암호화하는 핵산을 포함할 수 있다. 이때, 상기 벡터는 플라스미드, mRNA(전사물), PCR 엠플리콘 또는 바이러스 벡터일 수 있다. 이때, 상기 바이러스 벡터는 레트로바이러스 벡터(retroviral(retrovirus) vector), 렌티바이러스 벡터(lentiviral(lentivirus) vector), 아데노바이러스 벡터(adenoviral(adenovirus vector), 아데노-연관 바이러스 벡터(adeno-associated viral (adeno-associated virus; AAV) vector), 백시니아바이러스 벡터(vaccinia viral(vaccinia virus) vector), 폭스바이러스 벡터(poxviral(poxvirus) vector) 및 단순포진 바이러스 벡터(herpes simplex viral(herpes simplex virus) vector)로 구성된 군에서 선택되는 하나 이상의 바이러스 벡터일 수 있다.
이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산; 및 Cas14a1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 벡터를 포함할 수 있다. 상기 벡터는 상기 engineered guide RNA를 암호화하는 핵산을 위한 프로모터를 추가로 더 포함할 수 있고, 상기 프로모터는 U6 프로모터, H1 프로모터 또는 7SK 프로모터일 수 있다. 또한, 상기 벡터는 상기 Cas14a1 단백질을 암호화하는 핵산을 위한 프로모터를 추가로 더 포함할 수 있고, 상기 프로모터는 CMV 프로모터, LTR 프로모터, Ad MLP 프로모터, HSV 프로모터, SV40 프로모터, CBA 프로모터 또는 RSV 프로모터일 수 있다. 또는 상기 조성물은 상기 engineered guide RNA를 암호화하는 핵산을 포함하는 제1 벡터 및 Cas14a1 단백질을 암호화하는 핵산을 포함하는 제2 벡터를 포함할 수 있다. 상기 제1 벡터는 상기 engineered guide RNA를 암호화하는 핵산을 위한 프로모터를 추가로 더 포함할 수 있고, 상기 프로모터는 U6 프로모터, H1 프로모터 또는 7SK 프로모터일 수 있다. 또한, 상기 제2 벡터는 상기 Cas14a1 단백질을 암호화하는 핵산을 위한 프로모터를 추가로 더 포함할 수 있고, 상기 프로모터는 CMV 프로모터, LTR 프로모터, Ad MLP 프로모터, HSV 프로모터, SV40 프로모터, CBA 프로모터 또는 RSV 프로모터일 수 있다.
또는 상기 조성물은 핵산 및 단백질 혼합 형태일 수 있다. 이때, 상기 조성물은 engineered guide RNA 및 Cas14a1 단백질을 포함할 수 있다. 상기 조성물은 engineered CRISPR/Cas14a1 복합체 형태인 ribonucleoprotein (RNP)형태일 수 있다.
또한, 본 발명은 engineered CRISPR/Cas12f1(Cas14a1) system을 이용한 대상 세포에 존재하는 표적 핵산 또는 표적 유전자를 변형시키는 방법을 제공한다. 상기 방법은 표적 핵산 또는 표적 유전자가 존재하는 대상 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물을 처리하는 것을 포함한다.
일 구현예로서, 상기 방법은 표적 핵산 또는 표적 유전자가 존재하는 진핵 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물을 처리하는 것을 포함할 수 있다.
상기 진핵 세포는 효모(yeast), 식물 세포, 비인간-동물 세포 또는 인간 세포일 수 있다.
상기 표적 핵산 또는 표적 유전자는 표적 서열을 가지는 표적 가닥을 포함하는 이중 가닥 DNA 또는 단일 가닥 DNA일 수 있다.
상기 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물은 앞서 설명한 조성물의 구현예와 동일할 수 있다.
상기 방법은 in vitro, ex vivo 또는 비인간 동물 생체 내에서 수행될 수 있다.
상기 방법은 선택적으로 상기 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물을 처리한 진핵 세포를 배양하는 것을 추가로 더 포함할 수 있다.
상기 방법을 통해, 상기 표적 핵산 또는 표적 유전자는 상기 engineered CRISPR/Cas12f1(Cas14a1) system에 의한 변형을 포함할 수 있다. 이때, 상기 변형은 상기 표적 핵산 또는 표적 유전자에 적어도 하나 이상의 뉴클레오타이드의 삭제, 치환 및/또는 삽입일 수 있다.
본 발명은 engineered CRISPR/Cas12f1(Cas14a1) system에 관한 것이다. 본 명세서에 의해 개시되는 기술을 통해, engineered guide RNA 및 이를 포함한 engineered CRISPR/Cas12f1(Cas14a1) system을 제공할 수 있다. 또한, engineered guide RNA 및 이를 포함한 engineered CRISPR/Cas12f1(Cas14a1) system를 이용한 효과적인 표적 핵산의 절단, 편집 또는 변형 방법을 제공할 수 있다.
도 1은 야생형 tracrRNA(SEQ ID NO: 1) 및 야생형 crRNA(SEQ ID NO: 405)를 나타내며, 각 영역을 표시하였다. 야생형 tracrRNA는 stem 형성에 따라 영역 1(region 1), 영역 2(region 2), 영역 3(region 3), 영역 4(region 4) 및 영역 5(region 5)로 나뉘어 표시하였다. 야생형 crRNA는 반복 서열(repeat sequence; repeat seq.) 및 가이드 서열(guide sequence; guide seq., 또는 스페이서 서열(spacer sequence))로 나누어 표시하였다. 이때, 상기 가이드 서열은 표적에 따라 서열 및 서열의 길이가 달라지며, 각각의 N는 독립적으로 A, C, G 또는 U일 수 있다.
도 2는 engineered tracrRNA의 구조를 간결하게 나타낸 것으로, 각각의 서열을 야생형 tracrRNA(SEQ ID NO: 1)에 비교 매칭하여 나타냈다. 상기 engineered tracrRNA는 제1 서열(first sequence; 1st seq.), 제2 서열(second sequence; 2nd seq.), 제3 서열(third sequence; 3rd seq.)을 3'말단에서 5'말단 방향으로 순서대로 포함한다. 또한, 상기 engineered tracrRNA는 선택적으로 5' 말단에 제4 서열(fourth sequence; 4th seq.) 및/또는 제5 서열(fifth sequence; 5th seq.)을 더 포함할 수 있다.
도 3은 engineered crRNA의 구조를 간결하게 나타낸 것으로, 각각의 서열을 야생형 crRNA(SEQ ID NO: 405)와 비교하여 나타냈다. 상기 engineered crRNA는 i) 야생형 반복 서열의 일부 및 가이드 서열; ii) 야생형 반복 서열의 일부, 가이드 서열 및 U-rich tail 서열(U-rich tail sequence; U-rich tail seq.); iii) 야생형 반복 서열, 가이드 서열 및 U-rich tail 서열; iv) 제6 서열(sixth sequence; 6th seq.), 제7 서열(seventh sequence; 7th seq.) 및 가이드 서열; 또는 v) 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 제6 서열 및 제7 서열은 야생형 crRNA의 반복 서열과 연관된다. 이때, 상기 가이드 서열은 표적에 따라 서열 및 서열의 길이가 달라지며, 각각의 N는 독립적으로 A, C, G 또는 U일 수 있다.
도 4 내지 10은 gRNA 엔지니어링의 다양한 예시에 대한 모식도이다. 이때, 상기 가이드 서열은 표적에 따라 서열 및 서열의 길이가 달라질 수 있다. 각각의 N는 독립적으로 A, C, G 또는 U일 수 있고, 각각의 V는 A, C 또는 G일 수 있고, 각각의 B는 U, C 또는 G일 수 있다.
도 11은 야생형 tracrRNA 내에 존재하는 연속된 다섯 개의 유리딘 서열을 각각 아데노신, 사이티딘 또는 구아노신으로 치환하여 indel(%)을 확인한 결과이다.
도 12는 도 11의 결과를 토대로 141번때 유리딘을 사이티딘으로 치환하여 고정하고, 나머지 4개의 유리딘 서열을 각각 사이티딘 또는 구아노신으로 치환하여 indel(%)을 확인하였다. (n=3, *, p<0.05)
도 13은 도 12의 결과를 토대로 tracrRNA의 변형된 서열에 대응되는 crRNA의 5'-ACGAA-3'을 각각 아데노신, 유리딘, 사이티딘 또는 구아노신으로 치환하여 indel(%)을 확인한 결과이다.
도 14은 도 13의 결과를 토대로 crRNA의 5'-ACGAA-3' 중 사이티딘과 구아노신을 각각 아데노신, 유리딘, 사이티딘 또는 구아노신으로 치환하여 indel(%)을 확인한 결과이다. (n=3, *, p<0.05)
도 15는 도 14의 결과를 토대로 crRNA의 5'-AGCAA-3'중 아데노신을 각각 유리딘, 사이티딘 또는 구아노신으로 치환하여 indel(%)을 확인한 결과이다. (n=3, n.s., not significant)
도 16은 M1-1을 포함하는 engineered tracrRNA 및/또는 engineered crRNA를 이용한 경우의 indel(%)을 확인한 결과이다. engineered crRNA(M1-1)는 engineered tracrRNA(M1-1)와 함께 사용하였을 때 indel(%)이 증가하는 것을 확인하였다. (n=3, *, p<0.05, n.s., not significant)
도 17은 M1-1 및 M1-2를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, M1-2는 MS1 (즉, stem 5를 구성하는 영역)에서 각각 13nt, 25nt 및 37nt를 삭제한 변형이다. (n=3)
도 18은 M1-1 및 M2를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, M2는 MS2 (즉, stem 2를 구성하는 영역)에서 각각 6nt, 13nt 및 21nt를 삭제한 변형이다. (n=3)
도 19는 M1-1 및 M3를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, M3는 MS3 (즉, stem 1를 구성하는 영역)에서 각각 7nt, 14nt 및 20nt를 삭제한 변형이다. (n=3)
도 20은 M1-1 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. (n=3, n.s., not significant)
도 21은 M1-1 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, M4는 앞선 도 20의 결과를 기초로 하여 U4VU6로 설계하고, 상기 V는 A, C 또는 G이다. (n=3, n.s., not significant)
도 22는 M1-1 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다.
도 23은 M1-1 및/또는 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. M1-1 및 M4를 모두 포함하는 engineered gRNA를 이용하였을 때 indel(%)이 증가하는 것을 확인하였다. (n=3, *, p<0.05; **, p<0.01; ***, p<0.001. n.s., not significant)
도 24는 M1-1, M3 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, 상기 engineered gRNA는 M1-1 및 M4을 포함하고 있고, M3를 부가하여 그 효과를 비교하였다. 이때, M3는 MS3 (즉, stem 1를 구성하는 영역)에서 각각 12nt, 13nt,14nt, 15nt, 16nt, 17nt, 18nt, 19nt, 20nt 및 21nt를 삭제한 변형이다. (n=3)
도 25는 M1-1, M1-2, M3 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, 상기 engineered gRNA는 M1-1, M3 및 M4을 포함하고 있고, M1-2를 부가하여 그 효과를 비교하였다. 이때, M1-2는 MS1 (즉, stem 5를 구성하는 영역)에서 각각 10bp, 12bp 및 18bp를 삭제한 변형이다. (n=3, n.s., not significant)
도 26은 M1-1, M1-2, M3 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, 상기 engineered gRNA는 M1-1, M3 및 M4을 포함하고 있고, M1-2를 부가하여 그 효과를 비교하였다. 이때, M1-2는 MS1 (즉, stem 5를 구성하는 영역)에서 각각 1nt, 3nt, 5nt, 7nt, 9nt, 11nt, 13nt, 15nt, 17nt, 19nt, 21nt, 23nt, 25nt, 27nt, 29nt, 31nt, 33nt, 35nt 및 37nt를 삭제한 변형이다. (n=3)
도 27은 M1-1, M1-2, M3 및 M4를 포함하는 engineered gRNA를 추가 변형하여 indel(%)을 확인한 결과이다. 이때, 상기 추가 변형은 engineered tracrRNA의 3' 말단과 engineered crRNA의 5'말단을 hammerhead ribozyme 뉴클레오타이드 서열을 이용해 연결한 것이다. 상기 hammerhead ribozyme 뉴클레오타이드 서열을 포함하는 engineered gRNA는 hammerhead ribozyme에 의해 engineered tracrRNA의 3' 말단에 연결된 hammerhead ribozyme 뉴클레오타이드 서열이 self-cleavage 되고, 이로 인해 engineered gRNA는 dual gRNA로 작용할 수 있다. (n=3)
도 28은 M1-1, M1-2, M2, M3 및/또는 M4를 포함하는 engineered gRNA를 추가 변형하여 indel(%)을 확인한 결과이다. (n=3)
도 29는 M1-1, M1-2, M3 및 M4를 포함하는 engineered gRNA를 이용한 engineered CRISPR/Cas14a1 system인 geCas14a1_3.0 system에 의한 인델 패턴을 확인한 결과이다.
도 30은 gRNA 엔지니어링(M1-M4)의 효과의 기초가 되는 분자 메커니즘을 조사하기 위한 실험 설계 모식도(A) 및 이의 결과(B 및 C)이다. A에 대한 구체적인 설명은 아래에 기재한 실험방법의 "8. Quantitative analysis of gRNA expression" 섹션을 참고할 수 있다. B 및 C에서 gRNA 엔지니어링(M1-M4)에 의해 완전한 서열을 가지는 gRNA의 발현을 급격히 증가함을 보여준다.
도 31은 gRNA 엔지니어링(M1-M4)의 시험 관내 이중 가닥 DNA (dsDNA) 분해 분석 결과이다. 특히, M3의 유무에 따른 이중 가닥 DNA (dsDNA) 분해 효과에 차이가 있음을 보여준다.
도 32 내지 34는 Cas9, Cas12a 및 Cas12f1으로 편집할 수 있는 5'-TTTR-N20-NGG-3' 서열을 가지는 내인성 타겟을 in silico로 검색하여 무작위로 선정한 88 개의 내인성 유전자좌의 프로토스페이서 서열을 정리한 표이다.
도 35는 CRISPR/SpCas9 system, CRISPR/AsCas12a system, canonical CRISPR/Cas14a1 system 또는 geCas14a1_3.0 system을 이용한 도 32 내지 34에서 선별한 88개의 내인성 유전자좌에서의 인델(%)을 확인한 결과이다. A는 CRISPR/SpCas9 system, CRISPR/AsCas12a system, canonical CRISPR/Cas14a1 system 및 geCas14a1_3.0 system가 가지는 각각의 가이드 RNA를 모식화한 것으로, 이때, DR은 가이드 RAN에서 스페이서 서열을 제외한 나머지 부분이다. B는 각각의 CRISPR/Cas system을 이용해 88개의 내인성 유전자좌에서의 인델(%)을 확인한 결과이다.
도 36은 앞선 도35의 결과를 다양한 방법으로 정리한 것으로, A는 각 CRISPR/Cas system에 의한 88개의 내인성 유전자좌에서의 인델(%)에 대한 box-and-whisker plot으로, 청록색 가로선은 각 CRISPR/Cas system의 평균값을 나타낸다. B는 각 CRISPR/Cas system에 의한 인델(%)를 세분화하여 특정 인델 범위 당 표적 수의 분포를 정리한 표이다. C는 각 CRISPR/Cas system에 의해 얻은 표적 당 인델(%)에 대한 heat map이다.
도 37은 in vitro cleavage assay 결과이다. 프로토스페이서 서열인 Intergenic22 서열 (5'-TTTAAGAACACATACCCCTGGGCC-3' (SEQ ID NO: 490))을 포함하는 플라스미드를 이용해 실험하였고, 대조군을 위해 상기 플라스미드에 ApaI 제한 효소 사이트(5'-GGGCCC-3')도 포함한다. 도면 상에 표시된 서열은 5'-GGGCGAATTGGGCCCTCTAGATGCATGCTCGAGCGGCCGCCAGTGTGATGGATATCTGCAGAATTCGCCCTTTGCATTTAAGAACACATACCCCTGGGCCAGGATGCATGCATGCATGCATG-3' (SEQ ID NO: 737)이고, ApaI 제한 효소 사이트 및 프로토스페이서는 밑줄로 표시하였다.
도 2는 engineered tracrRNA의 구조를 간결하게 나타낸 것으로, 각각의 서열을 야생형 tracrRNA(SEQ ID NO: 1)에 비교 매칭하여 나타냈다. 상기 engineered tracrRNA는 제1 서열(first sequence; 1st seq.), 제2 서열(second sequence; 2nd seq.), 제3 서열(third sequence; 3rd seq.)을 3'말단에서 5'말단 방향으로 순서대로 포함한다. 또한, 상기 engineered tracrRNA는 선택적으로 5' 말단에 제4 서열(fourth sequence; 4th seq.) 및/또는 제5 서열(fifth sequence; 5th seq.)을 더 포함할 수 있다.
도 3은 engineered crRNA의 구조를 간결하게 나타낸 것으로, 각각의 서열을 야생형 crRNA(SEQ ID NO: 405)와 비교하여 나타냈다. 상기 engineered crRNA는 i) 야생형 반복 서열의 일부 및 가이드 서열; ii) 야생형 반복 서열의 일부, 가이드 서열 및 U-rich tail 서열(U-rich tail sequence; U-rich tail seq.); iii) 야생형 반복 서열, 가이드 서열 및 U-rich tail 서열; iv) 제6 서열(sixth sequence; 6th seq.), 제7 서열(seventh sequence; 7th seq.) 및 가이드 서열; 또는 v) 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 제6 서열 및 제7 서열은 야생형 crRNA의 반복 서열과 연관된다. 이때, 상기 가이드 서열은 표적에 따라 서열 및 서열의 길이가 달라지며, 각각의 N는 독립적으로 A, C, G 또는 U일 수 있다.
도 4 내지 10은 gRNA 엔지니어링의 다양한 예시에 대한 모식도이다. 이때, 상기 가이드 서열은 표적에 따라 서열 및 서열의 길이가 달라질 수 있다. 각각의 N는 독립적으로 A, C, G 또는 U일 수 있고, 각각의 V는 A, C 또는 G일 수 있고, 각각의 B는 U, C 또는 G일 수 있다.
도 11은 야생형 tracrRNA 내에 존재하는 연속된 다섯 개의 유리딘 서열을 각각 아데노신, 사이티딘 또는 구아노신으로 치환하여 indel(%)을 확인한 결과이다.
도 12는 도 11의 결과를 토대로 141번때 유리딘을 사이티딘으로 치환하여 고정하고, 나머지 4개의 유리딘 서열을 각각 사이티딘 또는 구아노신으로 치환하여 indel(%)을 확인하였다. (n=3, *, p<0.05)
도 13은 도 12의 결과를 토대로 tracrRNA의 변형된 서열에 대응되는 crRNA의 5'-ACGAA-3'을 각각 아데노신, 유리딘, 사이티딘 또는 구아노신으로 치환하여 indel(%)을 확인한 결과이다.
도 14은 도 13의 결과를 토대로 crRNA의 5'-ACGAA-3' 중 사이티딘과 구아노신을 각각 아데노신, 유리딘, 사이티딘 또는 구아노신으로 치환하여 indel(%)을 확인한 결과이다. (n=3, *, p<0.05)
도 15는 도 14의 결과를 토대로 crRNA의 5'-AGCAA-3'중 아데노신을 각각 유리딘, 사이티딘 또는 구아노신으로 치환하여 indel(%)을 확인한 결과이다. (n=3, n.s., not significant)
도 16은 M1-1을 포함하는 engineered tracrRNA 및/또는 engineered crRNA를 이용한 경우의 indel(%)을 확인한 결과이다. engineered crRNA(M1-1)는 engineered tracrRNA(M1-1)와 함께 사용하였을 때 indel(%)이 증가하는 것을 확인하였다. (n=3, *, p<0.05, n.s., not significant)
도 17은 M1-1 및 M1-2를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, M1-2는 MS1 (즉, stem 5를 구성하는 영역)에서 각각 13nt, 25nt 및 37nt를 삭제한 변형이다. (n=3)
도 18은 M1-1 및 M2를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, M2는 MS2 (즉, stem 2를 구성하는 영역)에서 각각 6nt, 13nt 및 21nt를 삭제한 변형이다. (n=3)
도 19는 M1-1 및 M3를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, M3는 MS3 (즉, stem 1를 구성하는 영역)에서 각각 7nt, 14nt 및 20nt를 삭제한 변형이다. (n=3)
도 20은 M1-1 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. (n=3, n.s., not significant)
도 21은 M1-1 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, M4는 앞선 도 20의 결과를 기초로 하여 U4VU6로 설계하고, 상기 V는 A, C 또는 G이다. (n=3, n.s., not significant)
도 22는 M1-1 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다.
도 23은 M1-1 및/또는 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. M1-1 및 M4를 모두 포함하는 engineered gRNA를 이용하였을 때 indel(%)이 증가하는 것을 확인하였다. (n=3, *, p<0.05; **, p<0.01; ***, p<0.001. n.s., not significant)
도 24는 M1-1, M3 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, 상기 engineered gRNA는 M1-1 및 M4을 포함하고 있고, M3를 부가하여 그 효과를 비교하였다. 이때, M3는 MS3 (즉, stem 1를 구성하는 영역)에서 각각 12nt, 13nt,14nt, 15nt, 16nt, 17nt, 18nt, 19nt, 20nt 및 21nt를 삭제한 변형이다. (n=3)
도 25는 M1-1, M1-2, M3 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, 상기 engineered gRNA는 M1-1, M3 및 M4을 포함하고 있고, M1-2를 부가하여 그 효과를 비교하였다. 이때, M1-2는 MS1 (즉, stem 5를 구성하는 영역)에서 각각 10bp, 12bp 및 18bp를 삭제한 변형이다. (n=3, n.s., not significant)
도 26은 M1-1, M1-2, M3 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, 상기 engineered gRNA는 M1-1, M3 및 M4을 포함하고 있고, M1-2를 부가하여 그 효과를 비교하였다. 이때, M1-2는 MS1 (즉, stem 5를 구성하는 영역)에서 각각 1nt, 3nt, 5nt, 7nt, 9nt, 11nt, 13nt, 15nt, 17nt, 19nt, 21nt, 23nt, 25nt, 27nt, 29nt, 31nt, 33nt, 35nt 및 37nt를 삭제한 변형이다. (n=3)
도 27은 M1-1, M1-2, M3 및 M4를 포함하는 engineered gRNA를 추가 변형하여 indel(%)을 확인한 결과이다. 이때, 상기 추가 변형은 engineered tracrRNA의 3' 말단과 engineered crRNA의 5'말단을 hammerhead ribozyme 뉴클레오타이드 서열을 이용해 연결한 것이다. 상기 hammerhead ribozyme 뉴클레오타이드 서열을 포함하는 engineered gRNA는 hammerhead ribozyme에 의해 engineered tracrRNA의 3' 말단에 연결된 hammerhead ribozyme 뉴클레오타이드 서열이 self-cleavage 되고, 이로 인해 engineered gRNA는 dual gRNA로 작용할 수 있다. (n=3)
도 28은 M1-1, M1-2, M2, M3 및/또는 M4를 포함하는 engineered gRNA를 추가 변형하여 indel(%)을 확인한 결과이다. (n=3)
도 29는 M1-1, M1-2, M3 및 M4를 포함하는 engineered gRNA를 이용한 engineered CRISPR/Cas14a1 system인 geCas14a1_3.0 system에 의한 인델 패턴을 확인한 결과이다.
도 30은 gRNA 엔지니어링(M1-M4)의 효과의 기초가 되는 분자 메커니즘을 조사하기 위한 실험 설계 모식도(A) 및 이의 결과(B 및 C)이다. A에 대한 구체적인 설명은 아래에 기재한 실험방법의 "8. Quantitative analysis of gRNA expression" 섹션을 참고할 수 있다. B 및 C에서 gRNA 엔지니어링(M1-M4)에 의해 완전한 서열을 가지는 gRNA의 발현을 급격히 증가함을 보여준다.
도 31은 gRNA 엔지니어링(M1-M4)의 시험 관내 이중 가닥 DNA (dsDNA) 분해 분석 결과이다. 특히, M3의 유무에 따른 이중 가닥 DNA (dsDNA) 분해 효과에 차이가 있음을 보여준다.
도 32 내지 34는 Cas9, Cas12a 및 Cas12f1으로 편집할 수 있는 5'-TTTR-N20-NGG-3' 서열을 가지는 내인성 타겟을 in silico로 검색하여 무작위로 선정한 88 개의 내인성 유전자좌의 프로토스페이서 서열을 정리한 표이다.
도 35는 CRISPR/SpCas9 system, CRISPR/AsCas12a system, canonical CRISPR/Cas14a1 system 또는 geCas14a1_3.0 system을 이용한 도 32 내지 34에서 선별한 88개의 내인성 유전자좌에서의 인델(%)을 확인한 결과이다. A는 CRISPR/SpCas9 system, CRISPR/AsCas12a system, canonical CRISPR/Cas14a1 system 및 geCas14a1_3.0 system가 가지는 각각의 가이드 RNA를 모식화한 것으로, 이때, DR은 가이드 RAN에서 스페이서 서열을 제외한 나머지 부분이다. B는 각각의 CRISPR/Cas system을 이용해 88개의 내인성 유전자좌에서의 인델(%)을 확인한 결과이다.
도 36은 앞선 도35의 결과를 다양한 방법으로 정리한 것으로, A는 각 CRISPR/Cas system에 의한 88개의 내인성 유전자좌에서의 인델(%)에 대한 box-and-whisker plot으로, 청록색 가로선은 각 CRISPR/Cas system의 평균값을 나타낸다. B는 각 CRISPR/Cas system에 의한 인델(%)를 세분화하여 특정 인델 범위 당 표적 수의 분포를 정리한 표이다. C는 각 CRISPR/Cas system에 의해 얻은 표적 당 인델(%)에 대한 heat map이다.
도 37은 in vitro cleavage assay 결과이다. 프로토스페이서 서열인 Intergenic22 서열 (5'-TTTAAGAACACATACCCCTGGGCC-3' (SEQ ID NO: 490))을 포함하는 플라스미드를 이용해 실험하였고, 대조군을 위해 상기 플라스미드에 ApaI 제한 효소 사이트(5'-GGGCCC-3')도 포함한다. 도면 상에 표시된 서열은 5'-GGGCGAATTGGGCCCTCTAGATGCATGCTCGAGCGGCCGCCAGTGTGATGGATATCTGCAGAATTCGCCCTTTGCATTTAAGAACACATACCCCTGGGCCAGGATGCATGCATGCATGCATG-3' (SEQ ID NO: 737)이고, ApaI 제한 효소 사이트 및 프로토스페이서는 밑줄로 표시하였다.
용어 정의
본 명세서에서 사용되는 용어에 대한 정의는 이하와 같다.
핵산(Nucleic acid), 뉴클레오타이드(Nucleotide), 뉴클레오사이드(Nucleoside) 및 염기(Base)
"핵산(nucleic acid)"은 뉴클레오타이드 단위체로 구성된 생체 분자(또는 생체 고분자)이며, 폴리뉴클레오타이드(polynucleotide)로도 불린다. 핵산은 DNA와 RNA를 모두 포함한다. "뉴클레오타이드(nucleotide)"는 인산, 오탄당 및 염기(또는 핵염기)로 이루어진 단위체이다. RNA(리보핵산)은 오탄당이 리보오스이며, DNA(디옥시리보핵산)은 오탄당이 디옥시리보오스이다. 뉴클레오타이드는 핵염기로 아데닌(adenine; A), 구아닌(guanine; G), 사이토신(cytosine; C), 티민(Thymine; T) 및 유라실(uracil; U) 중 선택된 하나를 가진다. 이때, 아데닌, 구아닌 및 사이토신은 RNA와 DNA에 공통적으로 존재하고, 티민은 DNA에만 존재하며, 유라실은 RNA에만 존재한다. 또한, 뉴클레오타이드는 인산과 뉴클레오사이드로 구성된다고도 할 수 있다. 이때, "뉴클레오사이드(nucleoside)"는 오탄당과 핵 염기로 이루어진다. 뉴클레오사이드는 핵염기의 종류에 따라 아데노신, 티미딘, 사이티딘(시티딘), 구아노신 및 유리딘으로 분류된다. 각 뉴클레오사이드는 U(유리딘), A(아데노신), T(티미딘), C(사이티딘 또는 시티딘) 및 G(구아노신)으로 약칭된다. 더불어, 뉴클레오타이드는 뉴클레오사이드의 종류에 따라 U(유리딘 일인산), A(아데노신 일인산), T(티미딘 일인산), C(사이티딘 일인산 또는 시티딘 일인산) 및 G(구아노신 일인산)으로 약칭된다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
본 명세서에서 염기, 뉴클레오사이드, 뉴클레오타이드, 핵산, RNA 및 DNA는 염기의 종류에 따라 A, T, G, C 및 U로 약칭하여 기재한다. 상기 약칭은 문맥에 따라 적절히 해석될 수 있다. 예를 들어, 5'-UUUUU-3' 서열은 연속된 5개의 염기(유라실) 서열, 연속된 5개의 뉴클레오사이드(유리딘) 서열 및/또는 연속된 5개의 뉴클레오타이드(유리딘 일인산) 서열일 수 있다. 또한, 핵산, RNA 및 DNA의 경우, 핵산, RNA 및 DNA를 구성하는 뉴클레오타이드는 뉴클레오사이드의 종류에 따라 유리딘, 아데노신, 티미딘, 사이티딘 및 구아노신으로 약칭하여 기재한다. 상기 약칭은 문맥에 따라 적절히 해석될 수 있다. 예를 들어, 연속된 4개의 유리딘 서열을 포함하는 RNA는 연속된 4개의 유리딘 일인산 뉴클레오타이드를 포함하는 RNA로 해석될 수 있다.
RNA duplex
"RNA duplex"는 두 개의 RNA 절편(fragment) 사이에 상보적인 결합(또는 염기쌍 간의 결합)에 의해 형성된 이중가닥 RNA 구조를 의미한다. 이때, 상기 두 개의 RNA 절편은 서로 다른 가닥(strand)에 존재하거나, 또는 하나의 가닥(단일 가닥)에 존재할 수 있다. 상기 두 개의 RNA 절편이 단일 가닥에 존재하는 경우, 단일 가닥 내의 일부 영역(즉, 두 개의 RNA 절편)은 염기쌍 간의 결합을 형성하여 스템-루프(stem-loop 또는 헤어핀(hairpin)) 구조를 형성한다. 상기 RNA duplex는 "RNA stem" 또는 "stem"으로도 불리며, 이하에서 RNA stem 또는 stem과 혼용되어 사용된다. 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
표적 핵산(Target nucleic acid) 또는 표적 유전자(Target gene)
"표적 핵산(Target nucleic acid)" 또는 "표적 유전자(Target gene)"는 CRISPR/Cas12f1 시스템(또는 CRISPR/Cas14a1 시스템)에 의한 편집의 대상이 되는 핵산 또는 유전자를 의미한다. 상기 표적 핵산 또는 표적 유전자는 세포 내에 존재하거나 인위적으로 합성된 핵산 또는 유전자일 수 있다. 세포 내에 존재하는 경우, 상기 표적 핵산 또는 표적 유전자는 세포가 가진 고유한 유전자 또는 핵산(즉, endogenous gene or nucleic acid), 또는 외부 유래의 유전자 또는 핵산(즉, exogenous gene or nucleic acid) 모두를 의미할 수 있으며, CRISPR/Cas12f1 시스템(또는 CRISPR/Cas14a1 시스템)에 의한 편집의 대상이 될 수 있다면 특별히 제한되지 않는다. 상기 표적 핵산 또는 표적 유전자는 단일가닥 DNA, 이중가닥 DNA, 단일가닥 RNA, 이중가닥 RNA 및/또는 DNA-RNA hybrid 일 수 있다. 상기 표적 핵산 또는 표적 유전자는 혼용될 수 있으며, 서로 동일한 대상을 지칭할 수 있다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
표적 서열(Target sequence), 표적 가닥(Target strand) 및 비표적 가닥(Non-target strand)
"표적 서열(target sequence)"는 표적 핵산 또는 표적 유전자 내에 존재하는 서열로, CRISPR/Cas12f1 시스템(또는 CRISPR/Cas14a1 시스템)의 가이드 RNA에 의해 인식되는 서열 또는 CRISPR/Cas12f1 시스템(또는 CRISPR/Cas14a1 시스템)에 의해 변형되는 대상 서열을 의미한다. 구체적으로, 상기 표적 서열은 가이드 RNA에 포함된 가이드 서열에 상보성을 가지는 서열 또는 가이드 서열과 상보적으로 결합하는 서열을 의미한다.
"표적 가닥(target strand)"는 표적 서열을 포함하는 가닥을 의미한다. 표적 핵산 또는 표적 유전자가 단일 가닥인 경우, 해당 가닥은 표적 가닥일 수 있다. 또는 표적 핵산 또는 표적 유전자가 이중가닥인 경우, 상기 이중가닥 중 하나는 표적 가닥일 수 있으며, 상기 표적 가닥에 상보적인 가닥이 존재할 수 있다. 이때, 상기 표적 가닥에 상보적인 가닥은 "비표적 가닥(non-target strand)"로 지칭된다.
비표적 가닥(non-target strand)은 PAM(Protospacer Adjacent Motif) 서열 및 프로토스페이서(protospacer) 서열을 포함한다. 상기 PAM 서열은 CRISPR/Cas12f1 시스템(또는 CRISPR/Cas14a1 시스템)의 Cas12f1(또는 Cas14a1) 단백질이 인식하는 서열이다. 상기 프로토스페이서 서열은 PAM 서열의 5' 말단 또는 3' 말단에 위치하는 서열로, 상기 프로토스페이서 서열은 표적 서열에 상보성을 가지는 서열 또는 표적 서열과 상보적인 결합을 하는 서열이다. 프로토스페이서 서열과 표적 서열 간의 상관관계는 표적 서열과 가이드 서열 간의 상관관계와 유사하다. 이러한 특징에 의해, 일반적으로 가이드 서열 설계시 프로토스페이서 서열을 이용하여 설계할 수 있다. 즉, 표적 서열에 상보적으로 결합하는 가이드 서열을 설계시, 가이드 서열은 프로토스페이서 서열과 동일한 염기서열을 가지는 뉴클레오타이드 서열로 설계할 수 있다. 이때, 프로토스페이서 서열의 염기서열 중 T는 U로 대체하여 가이드 서열을 설계한다.
벡터(Vector)
"벡터(vector)"는 달리 특정되지 않는 한, 유전 물질을 세포 내로 운반할 수 있는 모든 물질을 통틀어 일컫는다. 예를 들어, 벡터는 대상이 되는 유전 물질, 예를 들어, CRISPR/Cas 시스템의 이펙터 단백질(Cas 단백질)을 암호화하는 핵산, 및/또는 가이드 RNA를 암호화하는 핵산을 포함하는 DNA 분자일 수 있으나, 이에 제한되는 것은 아니다. 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
작동 가능하게 연결된(Operably linked)
"작동 가능하게 연결된(operably linked)"이라는 용어는 특정 구성이 다른 구성과 기능적 관계로 배치되어, 상기 특정 구성이 의도된 방식대로 기능할 수 있도록 다른 구성에 연결되어 있는 것을 의미한다. 예를 들어, 프로모터 서열이 A 단백질을 암호화하는 서열과 작동 가능하게 연결되었다고 할 때, 상기 프로모터가 세포 내에서 상기 A 단백질을 암호화하는 서열을 전사 및/또는 발현하도록 A 단백질을 암호화하는 서열에 연결된 것을 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
엔지니어링 된(Engineered)
"엔지니어링 된(engineered)"이란 용어는 자연계에 이미 존재하는 구성을 가진 물질, 분자 등과 구분하기 위해 사용하는 용어로, 상기 물질, 분자 등에 인위적인 변형이 가해진 것을 의미한다. 예를 들어, "엔지니어링 된 가이드 RNA(engineered guide RNA)"의 경우, 자연계에 존재하는 가이드 RNA의 구성에 인위적인 변경이 가해진 가이드 RNA를 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
NLS (Nuclear localization sequence, or signal)
"NLS(Nuclear Localization Sequence, or Signal)"라 함은, 핵 수송(nuclear transport) 작용으로 세포 핵 외부의 물질을 핵 내부로 수송할 때, 수송 대상인 단백질에 붙어 일종의 "태그" 역할을 하는 일정 길이의 펩타이드, 또는 그 서열을 의미한다. 본 명세서에서 사용되는 "NLS"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
태그(Tag)
"태그(tag)"라 함은, 펩타이드 또는 단백질의 추적 및/또는 분리정제를 쉽게 하기 위하여 부가되는 기능적 도메인을 통틀어 일컫는다. 구체적으로, 상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루 티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등의 태그 단백질; 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 청록색 형관 단백질(CFP), 청색 형광 단백질(BFP), HcRED, DsRed 등의 형광 단백질; 및 글루타티온-S-트랜스 퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타 -글루쿠로니다제, 루시퍼라제 등의 리포터 단백질(효소)를 포함하나, 이에 제한되는 것은 아니다. 본 명세서에서 사용되는 "태그"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기재된 것과 유사 또는 동일한 방법 및 물질이 본 발명의 실행 또는 시험에서 사용될 수 있지만, 적합한 방법 및 물질이 이하에 기재된다. 본 명세서에서 언급된 모든 간행물, 특허 및 기타 다른 참고문헌은 전체가 참고로 포함된다. 추가로, 물질, 방법 및 실시예는 단지 예시적이며, 제한되는 것으로 의도되지 않는다.
이하 본 발명을 설명한다.
개괄 - CRISPR/Cas12f1 system (또는 CRISPR/Cas14a1 system), 이의 한계 및 해결방안
CRISPR/Cas12f1 시스템은 Class 2, Type V로 분류되는 CRISPR/Cas 시스템이다. 선행연구(Harrington et al., Science 362, 839-842 (2018))에서 최초로 고균 유래의 CRISPR/Cas 시스템인 CRISPR/Cas14 시스템에 대해 밝혀졌다. 그 후 후속 연구(Tautvydas Karvelis et al., Nucleic Acids Research 48, 5016-5023 (2020))에서 상기 CRISPR/Cas14 시스템을 CRISPR/Cas12f 시스템으로 분류하였다. CRISPR/Cas12f1 시스템은 상기 Class 2, Type V로 분류되는 CRISPR/Cas 시스템 중 하나의 올솔로그(ortholog)인 V-F1 시스템에 속하며, 이는 Cas14a를 이펙터 단백질로 가지는 CRISPR/Cas14a 시스템을 포함한다. 본 명세서에서 개시하는 CRISPR/Cas12f1 system은 CRISPR/Cas14a1 system에 관한 것으로, 명세서에 기재된 CRISPR/Cas12f1 system은 CRISPR/Cas14a1 system을 지칭하며, CRISPR/Cas12f1 system과 CRISPR/Cas14a1 system은 혼용되어 사용되며, 또한 CRISPR/Cas12f1 system은 CRISPR/Cas12f1(Cas14a1) system 또는 CRISPR/Cas14a1 system 로도 지칭된다.
상기 CRISPR/Cas12f1 시스템은 CRISPR/Cas9 시스템에 비하여 이펙터 단백질의 크기가 현저히 작다는 특징이 있다. 이러한 특징은 기존에 연구된 대부분의 Cas 뉴클레아제의 크기로 인한 AAV (아데노 관련 바이러스)에 탑재의 어려움 및 이로 인한 유전자 치료제로서 적용 어려움을 해결 가능하게 한다. 하지만 이러한 장점에도 불구하고, 선행 연구(Harrington et al., Science 362, 839-842 (2018), Tautvydas Karvelis et al., Nucleic Acids Research 48, 5016-5023 (2020))에서 밝혀진 바로는, 상기 CRISPR/Cas12f1 시스템, 특히 CRISPR/Cas14a1 시스템은 세포 내에서 이중가닥 DNA에 대한 절단 활성을 보이지 않거나, 절단 활성을 보이더라도 그 효율이 매우 낮아 이를 적극적으로 유전자 편집에 활용하기 힘들다는 한계를 가지고 있다.
이에 본 발명자들은 CRISPR/Cas14a1 시스템의 표적 핵산 또는 표적 유전자의 편집 또는 변형 효율을 증가시키기 위해 가이드 RNA(guide RNA)를 인위적으로 조작하였다. 보다 구체적으로, 본 발명자들은 가이드 RNA를 구성하는 tracrRNA의 일부 서열을 인위적으로 조작하였다. 이러한 조작은 야생형 tracrRNA가 가지는 서열 상의 문제를 해결하기 위함이다. 야생형 tracrRNA은 다섯 개의 연속된 유리딘 서열을 포함하고 있다(야생형 tracrRNA(wildtype tracrRNA)는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3'(서열번호 1(SEQ ID NO: 1)) 서열을 가진다.). 야생형 tracrRNA을 세포 내에서 벡터 등을 이용하여 발현시키고자 할 때, 야생형 tracrRNA의 다섯 개의 연속된 유리딘 서열은 이에 대응되는 다섯 개의 연속된 티미딘 서열로 벡터 내에 포함되게 된다. 이 경우, 상기 다섯 개의 연속된 티미딘 서열은 특정 조건에서 전사 종결 신호로서 작용할 수 있다. 이러한 종결 신호로의 작용은 tracrRNA의 정상적인 발현을 저해하고, 더불어 정상적인 가이드 RNA의 형성을 저해하여, 최종적으로 CRISPR/Cas14a1 시스템의 표적 핵산 또는 표적 유전자의 편집 또는 변형 효율을 감소시킬 수 있다. 이에 본 발명자들은 야생형 tracrRNA의 다섯 개의 연속된 유리딘 서열을 인위적으로 변형한 engineered tracrRNA를 개발하였다. 더불어, 본 발명자들은 가이드 RNA를 구성하는 tracrRNA 및 crRNA의 길이를 최적화하기 위해 인위적으로 조작하였다. 이러한 조작은 긴 길이의 tracrRNA 및 crRNA를 최적의 길이를 가지도록 하여 guide RNA 합성 비용 절감 또는 바이러스 벡터에 삽입시 추가 공간(용량) 확보 등 치료제 적용에 더욱 효과적일 수 있다. 또한, 최적화된 guide RNA를 이용한 CRISPR/Cas14a1 시스템은 표적 핵산 또는 표적 유전자의 편집 또는 변형 효율을 증가시킬 수 있다. 이에 본 발명자는 tracrRNA 및 crRNA의 길이를 조절하여 최적화된 engineered tracrRNA 및 engineered crRNA를 개발하였다. 또한, 이를 포함한 engineered guide RNA 및 engineered CRISPR/Cas14a1 시스템을 완성하였다.
이하에서 engineered guide RNA 및 engineered CRISPR/Cas14a1 시스템에 대해 자세히 설명한다.
<Engineered Guide RNA>
본 명세서에 의해 개시되는 일 태양은 CRISPR/Cas12f1(Cas14a1) system을 위한 engineered guide RNA에 관한 것이다. 상기 engineered guide RNA는 CRISPR/Cas12f1(Cas14a1) system의 표적 핵산 또는 표적 유전자의 절단, 편집 또는 변형을 더욱 효과적으로 수행되도록 한다. 특히, 상기 engineered guide RNA는 다음과 같은 효과를 수반할 수 있다:
Guide RNA의 길이 최적화, 및 이에 따른 guide RNA 합성 비용 절감 또는 바이러스 벡터에 삽입시 추가 공간(용량) 확보;
tracrRNA의 정상적인 발현;
기능(작동) 가능한 guide RNA 발현 증가;
guide RNA의 stability 증가;
guide RNA-Cas12f1 protein complex의 stability 증가;
효과적인 guide RNA-Cas12f1 protein complex 형성 유도;
CRISPR/Cas12f1(Cas14a1) system에 의한 표적 핵산의 절단 효율 증가; 및
CRISPR/Cas12f1(Cas14a1) system에 의한 표적 핵산의 편집 또는 변형 효율 증가.
보다 구체적으로, 상기 engineered guide RNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형, wildtype tracrRNA보다 길이가 짧도록 변형 및/또는 U-rich tail 서열을 포함하도록 변형된 engineered guide RNA로, engineered tracrRNA(trans-activating crispr RNA) 및 crRNA(crispr RNA)를 포함한다. 이때, 상기 crRNA는 야생형(wildtype) crRNA 또는 engineered crRNA이다. 즉, 상기 engineered guide RNA는 engineered tracrRNA 및 wildtype crRNA를 포함하거나, 또는 engineered tracrRNA 및 engineered crRNA를 포함한다.
상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 tracrRNA로, 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는다. 또는 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않으면서 wildtype tracrRNA보다 길이가 짧도록 변형된 tracrRNA로, 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않으며 wildtype tracrRNA의 5'말단 및/또는 3'말단의 일부 뉴클레오타이드 서열을 포함하지 않는다.
상기 야생형 crRNA는 야생형(wildtype) 반복 서열을 포함하는 crRNA이다. 상기 engineered crRNA는 engineered 반복 서열을 포함하는 crRNA로, 이때, engineered 반복 서열은 wildtype 반복 서열보다 길이가 짧도록 변형되거나 일부 뉴클레오타이드 서열이 변형된 서열이다. 상기 야생형 crRNA 및 engineered crRNA는 선택적으로 3'말단에 U-rich tail 서열을 추가로 더 포함할 수 있다.
또한, 상기 engineered guide RNA는 선택적으로 linker을 더 포함할 수 있다.
이하에서 각 구성을 자세히 설명한다.
1. Engineered tracrRNA
Engineered tracrRNA는 야생형(wildtype) tracrRNA의 일부 뉴클레오타이드 서열이 인위적으로 변형되거나 및/또는 wildtype tracrRNA보다 길이가 짧도록 변형된 tracrRNA이다.
보다 구체적으로, engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 tracrRNA이다. 또는, engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형되고, 더불어 wildtype tracrRNA보다 길이가 짧도록 변형된 tracrRNA이다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함한다. 또는 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는다.
상기 engineered tracrRNA는 다음의 그룹 중 선택된 하나이다:
i) 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 tracrRNA;
ii) 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형, 및 wildtype tracrRNA의 5'말단의 일부 뉴클레오타이드 서열을 포함하지 않도록 변형된 tracrRNA;
iii) 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형, 및 wildtype tracrRNA의 3'말단의 일부 뉴클레오타이드 서열을 포함하지 않도록 변형된 tracrRNA;
iv) 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형, 및 wildtype tracrRNA의 중간의 일부 뉴클레오타이드 서열을 포함하지 않도록 변형된 tracrRNA; 및
v) 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형되고, 더불어, wildtype tracrRNA의 5'말단의 일부 뉴클레오타이드 서열을 포함하지 않도록 변형, wildtype tracrRNA의 중간의 일부 뉴클레오타이드 서열을 포함하지 않도록 변형 및/또는 wildtype tracrRNA의 3'말단의 일부 뉴클레오타이드 서열을 포함하지 않도록 변형된 tracrRNA.
상기 engineered tracrRNA는 crRNA와 상호작용하거나 및/또는 Cas12f1(Cas14a1)과 상호작용할 수 있다.
상기 engineered tracrRNA는 적어도 2개 이상의 RNA stem을 형성할 수 있다. 이때, 상기 RNA stem은 Cas12f1(Cas14a1) 단백질과 상호작용할 수 있다.
상기 engineered tracrRNA는 wildtype tracrRNA의 일 영역이 변형된 것이다. 이때, 상기 wildtype tracrRNA의 일 영역은 wildtype tracrRNA의 변형 대상 영역 중 하나 이상일 수 있다. 이때, 상기 wildtype tracrRNA의 변형 대상 영역은 RNA duplex 형성하는 영역을 기준으로 나눠 설정할 수 있다(도 1).
상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열 중 적어도 3개 이상의 서열을 포함한다. 이때, 상기 적어도 3개 이상의 서열은 제1 서열, 제2 서열 및 제3 서열이다. 이때, 상기 제1 서열, 제2 서열 및 제3 서열은 engineered tracrRNA의 3'말단에서 5'말단 방향으로 순서대로 위치한다. 또는, 상기 제3 서열, 제2 서열 및 제1 서열은 engineered tracrRNA의 5'말단에서 3'말단 방향으로 순서대로 위치한다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 wildtype tracrRNA의 변형 대상 영역을 기준으로 나눈 것으로, 상기 각 서열은 RNA duplex 형성하거나 RNA duplex 형성에 참여한다. 따라서, 상기 engineered tracrRNA은 적어도 둘 이상의 RNA duplex를 포함할 수 있다(도 2). 이하에서, wildtype tracrRNA의 변형 대상 영역 및 각 서열에 대해 상세히 기술한다.
Wildtype tracrRNA의 변형 대상 영역(region to be modified)
본 명세서의 기재된 engineered tracrRNA는 wildtype tracrRNA의 일 영역이 변형된 것이다. 상기 wildtype tracrRNA의 일 영역은 wildtype tracrRNA의 변형 대상 영역 중 하나 이상이다. 이때, 상기 wildtype tracrRNA의 변형 대상 영역은 wildtype tracrRNA 내에서 RNA duplex 형성하거나 또는 RNA duplex 형성에 참여하는 영역을 기준으로 나눠 설정한다. 상기 wildtype tracrRNA은 4개의 RNA duplexes를 형성하고 1개의 RNA duplex 형성에 참여한다. 즉, 상기 wildtype tracrRNA은 총 5개의 RNA duplex 형성에 관여한다. 따라서, 상기 wildtype tracrRNA의 변형 대상 영역은 총 5개의 영역으로 나뉠 수 있으며, 상기 5개의 영역은 변형 대상 영역 1(region 1 to be modified), 변형 대상 영역 2 (region 2 to be modified), 변형 대상 영역 3 (region 3 to be modified), 변형 대상 영역 4 (region 4 to be modified) 및 변형 대상 영역 5 (region 5 to be modified)일 수 있다. 이때, 상기 변형 대상 영역 1은 상기 wildtype tracrRNA의 5' 말단에서 130번째 시티딘(C)부터 161번째 아데노신(A)까지의 영역일 수 있다. 이때, 상기 변형 대상 영역 2은 상기 wildtype tracrRNA의 5' 말단에서 91번째 아데노신(A)부터 129번째 아데노신(A)까지의 영역일 수 있다. 이때, 상기 변형 대상 영역 3은 상기 wildtype tracrRNA의 5' 말단에서 72번째 구아노신(G)부터 90번째 아데노신(A)까지의 영역일 수 있다. 이때, 상기 변형 대상 영역 4은 상기 wildtype tracrRNA의 5' 말단에서 22번째 시티딘(C)부터 71번째 구아노신(G)까지의 영역일 수 있다. 이때, 상기 변형 대상 영역 5은 상기 wildtype tracrRNA의 5' 말단에서 1번째 시티딘(C)부터 21번째 아데노신(A)까지의 영역일 수 있다(도 1). 이러한 wildtype tracrRNA의 변형 대상 영역 설정은 engineered tracrRNA가 포함하는 각 서열(제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열)을 설명하기 위함이다.
1-1) First sequence (one strand for Stem 5) - 필수 서열
상기 engineered tracrRNA는 제1 서열(first sequence)를 포함한다. 상기 제1 서열은 상기 wildtype tracrRNA의 변형 대상 영역 1에 대응된다(도 2). 상기 제1 서열은 상기 engineered tracrRNA에 포함되는 필수 서열이다. 상기 제1 서열은 crRNA의 일부 서열과 상보적인 결합을 하는 서열이다. 이때, 상기 제1 서열은 crRNA의 일부 서열과 상보적인 결합을 통해 RNA duplex를 형성한다. 이때, 상기 제1 서열과 crRNA에 의해 형성된 RNA duplex는 본 명세서에서 스템 5(stem 5)로 명명된다. 상기 스템 5를 형성하는 적어도 하나 이상의 뉴클레오타이드는 Cas12f1 단백질의 WED 도메인 및/또는 ZF 도메인과 상호작용할 수 있다.
상기 제1 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는다.
상기 제1 서열은 연속된 네 개 이하의 유리딘 서열을 포함한다. 이때, 상기 제1 서열은 연속된 네 개의 유리딘 서열을 포함할 수 있다. 또는, 상기 제1 서열은 연속된 세 개의 유리딘 서열을 포함할 수 있다. 또는, 상기 제1 서열은 연속된 두 개의 유리딘 서열을 포함할 수 있다. 또는, 상기 제1 서열은 한 개의 유리딘 서열을 포함할 수 있다. 또는, 상기 제1 서열은 유리딘 서열을 포함하지 않을 수 있다.
상기 제1 서열은 crRNA와 상보적 결합을 형성하는 적어도 하나 이상의 뉴클레오타이드를 포함한다. 이때, 상기 제1 서열은 crRNA와 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드를 포함할 수 있다. 이때, 상기 제1 서열은 crRNA와 적어도 하나 이상의 상보적 결합을 형성할 수 있다.
상기 제1 서열은 crRNA와 적어도 하나 이상의 염기 페어링(base pairing)을 형성하는 뉴클레오타이드를 포함한다. 이때, 상기 제1 서열은 crRNA와 적어도 하나 이상의 염기 페어링을 형성하지 않는 뉴클레오타이드를 포함할 수있다. 이때, 상기 제1 서열은 crRNA와 적어도 하나 이상의 염기 페어링을 형성할 수 있다.
상기 제1 서열은 상기 engineered tracrRNA의 3' 말단에 위치한다.
상기 제1 서열은 다음의 서열들 중 선택된 하나의 서열일 수 있다:
5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열;
5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열;
5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열;
5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열;
5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열;
5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및
SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열.
이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다.
이때, 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다.
이때, 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 예를 들어, 상기 d가 3인 경우, (N)3은 5'-NNN-3' 서열을 의미하며, 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
이때, 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 예를 들어, 상기 a가 4인 경우, (V)4는 5'-VVVV-3' 서열을 의미하며, 이때, 각각의 V는 독립적으로 A, C 또는 G일 수 있다.
이때, 상기 SEQ ID NO: 2 내지 7 서열의 5'말단에 위치하는 5'-CAAAUUCA-3' 서열 및/또는 3'말단에 위치하는 5'-CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 8) 서열은 선택적으로 변형될 수 있다. 상기 변형은 5'-CAAAUUCA-3' 서열 및/또는 5'-CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 8) 서열 중 적어도 하나 이상의 뉴클레오타이드가 삭제 또는 다른 뉴클레오타이드로 치환되는 것일 수 있다. 또는 상기 변형은 5'-CAAAUUCA-3' 서열 및/또는 5'-CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 8) 서열에 하나 이상의 뉴클레오타이드가 삽입되는 것일 수 있다.
5'-CAAAUUCA(N)
a
CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열
일 구현예로서, 상기 제1 서열은 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열일 수 있다.
상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
상기 a는 0 내지 4의 정수일 수 있다.
일 구체예에서, 상기 제1 서열은 5'-CAAAUUCACCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 9) 서열일 수 있다.
다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 10) 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCAACCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 11) 서열, 5'-CAAAUUCACCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 12) 서열, 5'-CAAAUUCAGCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 13) 서열 또는 5'-CAAAUUCAUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 14) 서열 일 수 있다.
또 다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 15) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCAAUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 16) 서열, 5'-CAAAUUCACUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 17) 서열, 5'-CAAAUUCAGUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 18) 서열 또는 5'-CAAAUUCAUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 19) 서열 일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 20) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 21) 서열, 5'-CAAAUUCAGUGCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 22) 서열, 5'-CAAAUUCAGUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 23) 서열 또는 5'-CAAAUUCAUAUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 24) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO: 25) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 26) 서열, 5'-CAAAUUCAGUGCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 27) 서열, 5'-CAAAUUCAGUUCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 28) 서열, 5'-CAAAUUCAGUGUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 29) 서열, 5'-CAAAUUCAUUGCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 30) 서열 또는 5'-CAAAUUCAUUUCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 31) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5'-CAAAUUCAVNNNN(V)
a
CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열
일 구현예로서, 상기 제1 서열은 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열일 수 있다.
상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다.
상기 a는 0 내지 4의 정수일 수 있다.
일 구체예에서, 상기 제1 서열은 5'-CAAAUUCAANNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 32) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 a가 0인 경우, 상기 제1 서열은 5'-CAAAUUCAANNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 33) 서열일 수 있다. 또는 상기 a가 1인 경우, 상기 제1 서열은 5'-CAAAUUCAANNNNVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 34) 서열일 수 있다. 또는 상기 a가 2인 경우, 상기 제1 서열은 5'-CAAAUUCAANNNNVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 35) 서열일 수 있다. 또는 상기 a가 3인 경우, 상기 제1 서열은 5'-CAAAUUCAANNNNVVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 36) 서열일 수 있다. 또는 상기 a가 4인 경우, 상기 제1 서열은 5'-CAAAUUCAANNNNVVVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 37) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAAUUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 38) 서열, 5'-CAAAUUCAAUUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 39) 서열, 5'-CAAAUUCAAUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 40) 서열 또는 5'-CAAAUUCAAUGCUACCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 41) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCACNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 42)서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 a가 0인 경우, 상기 제1 서열은 5'-CAAAUUCACNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 43) 서열일 수 있다. 또는 상기 a가 1인 경우, 상기 제1 서열은 5'-CAAAUUCACNNNNVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 44) 서열일 수 있다. 또는 상기 a가 2인 경우, 상기 제1 서열은 5'-CAAAUUCACNNNNVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 45) 서열일 수 있다. 또는 상기 a가 3인 경우, 상기 제1 서열은 5'-CAAAUUCACNNNNVVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 46) 서열일 수 있다. 또는 상기 a가 4인 경우, 상기 제1 서열은 5'-CAAAUUCACNNNNVVVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 47) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCACUUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 48) 서열, 5'-CAAAUUCACUUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 49) 서열, 5'-CAAAUUCACUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 50) 서열 또는 5'-CAAAUUCACUGCUCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 51) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCAGNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 52) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 a가 0인 경우, 상기 제1 서열은 5'-CAAAUUCAGNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 53) 서열일 수 있다. 또는 상기 a가 1인 경우, 상기 제1 서열은 5'-CAAAUUCAGNNNNVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 54) 서열일 수 있다. 또는 상기 a가 2인 경우, 상기 제1 서열은 5'-CAAAUUCAGNNNNVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 55) 서열일 수 있다. 또는 상기 a가 3인 경우, 상기 제1 서열은 5'-CAAAUUCAGNNNNVVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 56) 서열일 수 있다. 또는 상기 a가 4인 경우, 상기 제1 서열은 5'-CAAAUUCAGNNNNVVVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 57) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAGUUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 58) 서열, 5'-CAAAUUCAGUUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 59) 서열, 5'-CAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 60) 서열 또는 5'-CAAAUUCAGUGCUGCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 61) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5'-CAAAUUCANVNNN(N)
b
CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열
일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열일 수 있다.
상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
상기 V는 A, C 또는 G 일 수 있다.
상기 b는 0 내지 1의 정수일 수 있다.
일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANANNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 62) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 b는 0 또는 1의 정수일 수 있다. 이때, 상기 b가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANANNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 63) 서열일 수 있다. 또는 상기 b가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANANNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 64) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUAUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 65) 서열, 5'-CAAAUUCAUAUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 66) 서열 또는 5'-CAAAUUCAUAGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 67) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구체예서, 상기 제1 서열은 5'-CAAAUUCANCNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 68) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 b는 0 또는 1의 정수일 수 있다. 이때, 상기 b가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANCNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 69) 서열일 수 있다. 또는 상기 b가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANCNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 70) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAGCUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 71) 서열, 5'-CAAAUUCAUCUCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 72) 서열, 5'-CAAAUUCAUCUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 73) 서열 또는 5'-CAAAUUCAUCGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 74) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구체예서, 상기 제1 서열은 5'-CAAAUUCANGNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 75) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 b는 0 또는 1의 정수일 수 있다. 이때, 상기 b가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANGNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 76) 서열일 수 있다. 또는 상기 b가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANGNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 77) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUGUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 78) 서열, 5'-CAAAUUCAUGUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 79) 서열 또는 5'-CAAAUUCAUGGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 80) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5'-CAAAUUCANNVNN(N)
c
CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열
일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열일 수 있다.
상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
상기 V는 A, C 또는 G 일 수 있다.
상기 c는 0 내지 2의 정수일 수 있다.
일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNANN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 81) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 c는 0 내지 2의 정수일 수 있다. 이때, 상기 c가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANNANNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 82) 서열일 수 있다. 또는 상기 c가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANNANNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 83) 서열일 수 있다. 또는 상기 c가 2인 경우, 상기 제1 서열은 5'-CAAAUUCANNANNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 84) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUAUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 85) 서열, 5'-CAAAUUCAUUACUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 86) 서열 또는 5'-CAAAUUCAUCACUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 87) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNCNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 88) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 c는 0 내지 2의 정수일 수 있다. 이때, 상기 c가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANNCNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 89) 서열일 수 있다. 또는 상기 c가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANNCNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 90) 서열일 수 있다. 또는 상기 c가 2인 경우, 상기 제1 서열은 5'-CAAAUUCANNCNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 91) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUCUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 92) 서열, 5'-CAAAUUCAUUCCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 93) 서열 또는 5'-CAAAUUCAGUCUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 94) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNGNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 95) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 c는 0 내지 2의 정수일 수 있다. 이때, 상기 c가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANNGNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 96) 서열일 수 있다. 또는 상기 c가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANNGNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 97) 서열일 수 있다. 또는 상기 c가 2인 경우, 상기 제1 서열은 5'-CAAAUUCANNGNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 98) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 99) 서열, 5'-CAAAUUCAUCGCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 100) 서열 또는 5'-CAAAUUCAGCGCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 101) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5'-CAAAUUCANNNVN(N)
d
CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열
일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열일 수 있다.
상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
상기 V는 A, C 또는 G 일 수 있다.
상기 d는 0 내지 3의 정수일 수 있다.
일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNAN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 102) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 d는 0 내지 3의 정수일 수 있다. 이때, 상기 d가 0인 경우, 제1 서열은 5'-CAAAUUCANNNANCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 103) 서열일 수 있다. 또는 상기 d가 1인 경우, 제1 서열은 5'-CAAAUUCANNNANNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 104) 서열일 수 있다. 또는 상기 d가 2인 경우, 제1 서열은 5'-CAAAUUCANNNANNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 105) 서열일 수 있다. 또는 상기 d가 3인 경우, 제1 서열은 5'-CAAAUUCANNNANNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 106) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUUAUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 107) 서열, 5'-CAAAUUCAGUUAUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 108) 서열 또는 5'-CAAAUUCAUUGAUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 109) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNCN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 110) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 d는 0 내지 3의 정수일 수 있다. 이때, 상기 d가 0인 경우, 제1 서열은 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 111) 서열일 수 있다. 또는 상기 d가 1인 경우, 제1 서열은 5'-CAAAUUCANNNCNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 112) 서열일 수 있다. 또는 상기 d가 2인 경우, 제1 서열은 5'-CAAAUUCANNNCNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 113) 서열일 수 있다. 또는 상기 d가 3인 경우, 제1 서열은 5'-CAAAUUCANNNCNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 114) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 115) 서열, 5'-CAAAUUCAGUGCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 116) 서열, 5'-CAAAUUCAGCGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 117) 서열, 5'-CAAAUUCAUUGCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 118) 서열 또는 5'-CAAAUUCAGCUCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 119) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNGN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 120) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 d는 0 내지 3의 정수일 수 있다. 이때, 상기 d가 0인 경우, 제1 서열은 5'-CAAAUUCANNNGNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 121) 서열일 수 있다. 또는 상기 d가 1인 경우, 제1 서열은 5'-CAAAUUCANNNGNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 122) 서열일 수 있다. 또는 상기 d가 2인 경우, 제1 서열은 5'-CAAAUUCANNNGNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 123) 서열일 수 있다. 또는 상기 d가 3인 경우, 제1 서열은 5'-CAAAUUCANNNGNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 124) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUUGUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 125) 서열, 5'-CAAAUUCAUUGGUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 126) 서열 또는 5'-CAAAUUCAGUCGUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 127) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5'-CAAAUUCANNNNV(N)
a
CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열
일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열일 수 있다.
상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
상기 V는 A, C 또는 G 일 수 있다.
상기 a는 0 내지 4의 정수일 수 있다.
일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNNA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 128) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 a가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNACCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 129) 서열일 수 있다. 또는 상기 a가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNANCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 130) 서열일 수 있다. 또는 상기 a가 2인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNANNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 131) 서열일 수 있다. 또는 상기 a가 3인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNANNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 132) 서열일 수 있다. 또는 상기 a가 4인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNANNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 133) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUUUACCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 134) 서열, 5'-CAAAUUCAUUUCACCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 135) 서열 또는 5'-CAAAUUCAUUGCACCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 136) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNNC(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 137) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 a가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 138) 서열일 수 있다. 또는 상기 a가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 139) 서열일 수 있다. 또는 상기 a가 2인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNCNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 140) 서열일 수 있다. 또는 상기 a가 3인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNCNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 141) 서열일 수 있다. 또는 상기 a가 4인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNCNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 142) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUCUCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 143) 서열, 5'-CAAAUUCAGUUCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 144) 서열 또는 5'-CAAAUUCAUUUCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 145) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNNG(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 146) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 a가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNGCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 147) 서열일 수 있다. 또는 상기 a가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNGNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 148) 서열일 수 있다. 또는 상기 a가 2인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNGNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 149) 서열일 수 있다. 또는 상기 a가 3인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNGNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 150) 서열일 수 있다. 또는 상기 a가 4인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNGNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 151) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUUCGCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 152) 서열, 5'-CAAAUUCAGUGCGCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 153) 서열 또는 5'-CAAAUUCAGUUCGCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 154) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열
일 구현예로서, 상기 제1 서열은 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열의 일부 서열로, SEQ ID NO: 2 서열 중 5'-CAAAUUCA(N)a-3'서열을 포함하면서 SEQ ID NO: 2 서열의 3'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다.
일 구체예로서, 상기 제1 서열은 5'-CAAAUUCANNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 25) 서열의 일부 서열로, 5'-CAAAUUCANNNN-3' (SEQ ID NO: 155) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCANNNNCCUCUCCAAUUCUGCAC-3' (SEQ ID NO: 156) 서열, 5'-CAAAUUCANNNNCCUCUCCAAUUCUGC-3' (SEQ ID NO: 157) 서열, 5'-CAAAUUCANNNNCCUCUCCAAUUCU-3' (SEQ ID NO: 158) 서열, 5'-CAAAUUCANNNNCCUCUCCAAUU-3' (SEQ ID NO: 159) 서열, 5'-CAAAUUCANNNNCCUCUCCAA-3' (SEQ ID NO: 160) 서열, 5'-CAAAUUCANNNNCCUCUCC-3' (SEQ ID NO: 161) 서열, 5'-CAAAUUCANNNNCCUCU-3' (SEQ ID NO: 162) 서열, 5'-CAAAUUCANNNNCCU-3' (SEQ ID NO: 163) 서열, 5'-CAAAUUCANNNNC-3' (SEQ ID NO: 164) 서열 또는 5'-CAAAUUCANNNN-3' (SEQ ID NO: 155) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구현예로서, 상기 제1 서열은 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열의 일부 서열로, SEQ ID NO: 3 서열 중 5'-CAAAUUCAVNNNN-3' (SEQ ID NO: 165) 서열을 포함하면서 SEQ ID NO: 3 서열의 3'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 V는 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다.
일 구체예로서, 상기 제1 서열은 5'-CAAAUUCAVNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 166) 서열의 일부 서열로, 5'-CAAAUUCAVNNNN-3' (SEQ ID NO: 165) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCAVNNNNCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 167) 서열, 5'-CAAAUUCAVNNNNCCUCUCCAAUUCUG-3' (SEQ ID NO: 168) 서열, 5'-CAAAUUCAVNNNNCCUCUCCAAUUCU-3' (SEQ ID NO: 169) 서열, 5'-CAAAUUCAVNNNNCCUCUCCAAUU-3' (SEQ ID NO: 170) 서열, 5'-CAAAUUCAVNNNNCCUCUCCAA-3' (SEQ ID NO: 171) 서열, 5'-CAAAUUCAVNNNNCCUCUCC-3' (SEQ ID NO: 172) 서열, 5'-CAAAUUCAVNNNNCCUCU-3' (SEQ ID NO: 173) 서열, 5'-CAAAUUCAVNNNNCCU-3' (SEQ ID NO: 174) 서열 또는 5'-CAAAUUCAVNNNN-3' (SEQ ID NO: 165) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA -3' (SEQ ID NO: 4) 서열의 일부 서열로, SEQ ID NO: 4 서열 중 5'-CAAAUUCANVNNN-3' (SEQ ID NO: 175) 서열을 포함하면서 SEQ ID NO: 4 서열의 3'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 V는 A, C 또는 G 일 수 있다. 상기 b는 0 내지 1의 정수일 수 있다.
일 구체예로서, 상기 제1 서열은 5'-CAAAUUCANVNNNCCUCUCCAAUUCUGCACAA -3' (SEQ ID NO: 176) 서열의 일부 서열로, 5'-CAAAUUCANVNNN-3' (SEQ ID NO: 175) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCANVNNNCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 177) 서열, 5'-CAAAUUCANVNNNCCUCUCCAAUUCU-3' (SEQ ID NO: 178) 서열, 5'-CAAAUUCANVNNNCCUCUCCAAUU-3' (SEQ ID NO: 179) 서열, 5'-CAAAUUCANVNNNCCUCUCCAA-3' (SEQ ID NO: 180) 서열, 5'-CAAAUUCANVNNNCCUCUCC-3' (SEQ ID NO: 181) 서열, 5'-CAAAUUCANVNNNCCUCU-3' (SEQ ID NO: 182) 서열, 5'-CAAAUUCANVNNNCC-3' (SEQ ID NO: 183) 서열 또는 5'-CAAAUUCANVNNN-3' (SEQ ID NO: 175) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열의 일부 서열로, SEQ ID NO: 5 서열 중 5'-CAAAUUCANNVNN-3' (SEQ ID NO: 184) 서열을 포함하면서 SEQ ID NO: 5 서열의 3'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 V는 A, C 또는 G 일 수 있다. 상기 c는 0 내지 2의 정수일 수 있다.
일 구체예로서, 상기 제1 서열은 5'-CAAAUUCANNVNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 185) 서열의 일부 서열로, 5'-CAAAUUCANNVNN-3' (SEQ ID NO: 184) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCANNVNNCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 186) 서열, 5'-CAAAUUCANNVNNCCUCUCCAAUUCU-3' (SEQ ID NO: 187) 서열, 5'-CAAAUUCANNVNNCCUCUCCAAUU-3' (SEQ ID NO: 188) 서열, 5'-CAAAUUCANNVNNCCUCUCCAA-3' (SEQ ID NO: 189) 서열, 5'-CAAAUUCANNVNNCCUCUCC-3' (SEQ ID NO: 190) 서열, 5'-CAAAUUCANNVNNCCUCU-3' (SEQ ID NO: 191) 서열, 5'-CAAAUUCANNVNNCC-3' (SEQ ID NO: 192) 서열 또는 5'-CAAAUUCANNVNN-3' (SEQ ID NO: 184) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열의 일부 서열로, SEQ ID NO: 6 서열 중 5'-CAAAUUCANNNVN-3' (SEQ ID NO: 193) 서열을 포함하면서 SEQ ID NO: 6 서열의 3'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 V는 A, C 또는 G 일 수 있다. 상기 d는 0 내지 3의 정수일 수 있다.
일 구체예로서, 상기 제1 서열은 5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 194) 서열의 일부 서열로, 5'-CAAAUUCANNNVN-3' (SEQ ID NO: 193) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 195) 서열, 5'-CAAAUUCANNNVNCCUCUCCAAUUCU-3' (SEQ ID NO: 196) 서열, 5'-CAAAUUCANNNVNCCUCUCCAAUU-3' (SEQ ID NO: 197) 서열, 5'-CAAAUUCANNNVNCCUCUCCAA-3' (SEQ ID NO: 198) 서열, 5'-CAAAUUCANNNVNCCUCUCC-3' (SEQ ID NO: 199) 서열, 5'-CAAAUUCANNNVNCCUCU-3' (SEQ ID NO: 200) 서열, 5'-CAAAUUCANNNVNCC-3' (SEQ ID NO: 201) 서열 또는 5'-CAAAUUCANNNVN-3' (SEQ ID NO: 193) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열의 일부 서열로, SEQ ID NO: 7 서열 중 5'-CAAAUUCANNNNV-3' (SEQ ID NO: 202) 서열을 포함하면서 SEQ ID NO: 7 서열의 3'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 V는 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다.
일 구체예로서, 상기 제1 서열은 5'-CAAAUUCANNNNVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 203) 서열의 일부 서열로, 5'-CAAAUUCANNNNV-3' (SEQ ID NO: 202) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCANNNNVCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 204) 서열, 5'-CAAAUUCANNNNVCCUCUCCAAUUCU-3' (SEQ ID NO: 205) 서열, 5'-CAAAUUCANNNNVCCUCUCCAAUU-3' (SEQ ID NO: 206) 서열, 5'-CAAAUUCANNNNVCCUCUCCAA-3' (SEQ ID NO: 207) 서열, 5'-CAAAUUCANNNNVCCUCUCC-3' (SEQ ID NO: 208) 서열, 5'-CAAAUUCANNNNVCCUCU-3' (SEQ ID NO: 209) 서열, 5'-CAAAUUCANNNNVCC-3' (SEQ ID NO: 210) 서열 또는 5'-CAAAUUCANNNNV-3' (SEQ ID NO: 202) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
1-2) Second sequence (Stem 4) - 필수 서열
상기 engineered tracrRNA는 제2 서열(second sequence)를 포함한다. 상기 제1 서열은 상기 wildtype tracrRNA의 변형 대상 영역 2에 대응된다 (도 2). 상기 제2 서열은 상기 engineered tracrRNA에 포함되는 필수 서열이다. 상기 제2 서열은 해당 서열 내에서 상보적인 결합을 통해 RNA duplex를 형성한다. 이때, 상기 제2 서열 내에서 형성된 RNA duplex는 본 명세서에서 스템 4(stem 4)로 명명된다. 상기 스템 4를 형성하는 적어도 하나 이상의 뉴클레오타이드는 Cas12f1 단백질의 REC 도메인 및/또는 RuvC 도메인과 상호작용할 수 있다.
상기 제2 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는다.
상기 제2 서열은 상기 제1 서열의 5' 말단에 위치한다.
상기 제2 서열은 상기 제1 서열의 5'말단과 공유결합으로 연결된다.
일 구현예로서, 상기 제2 서열은 5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO: 211) 서열일 수 있다.
다른 일 구현예로서, 상기 제2 서열은 SEQ ID NO: 211 서열과 적어도 70% 이상 동일한(identical) 또는 유사한(similar) 서열일 수 있다. 또는 상기 제2 서열은 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성(sequence identity) 또는 서열 유사성(sequence similarity)을 가지는 서열일 수 있다.
또 다른 일 구현예로서, 상기 제2 서열은 SEQ ID NO: 211 서열과 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100% 동일한(identical) 또는 유사한(similar) 서열일 수 있다. 또는 상기 제2 서열은 SEQ ID NO: 211 서열에 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 제2 서열은 SEQ ID NO: 211 서열과 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제2 서열은 SEQ ID NO: 211 서열에 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 제2 서열은 SEQ ID NO: 211 서열과 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제2 서열은 SEQ ID NO: 211 서열에 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
또 다른 일 구현예로서, 상기 제2 서열은 SEQ ID NO: 211 서열과 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제2 서열은 SEQ ID NO: 211 서열에 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
1-3) Third sequence (Stem 3) - 필수 서열
상기 engineered tracrRNA는 제3 서열(third sequence)를 포함한다. 상기 제1 서열은 상기 wildtype tracrRNA의 변형 대상 영역 3에 대응된다 (도 2). 상기 제3 서열은 상기 engineered tracrRNA에 포함되는 필수 서열이다. 상기 제3 서열은 crRNA의 일부 서열과 상보적인 결합을 하는 서열이다. 이때, 상기 제3 서열은 crRNA의 일부 서열과 상보적인 결합을 통해 RNA duplex를 형성한다. 또한, 상기 제3 서열은 해당 서열 내에서 상보적인 결합을 통해 RNA duplex를 형성한다. 이때, 상기 crRNA의 일부 서열과 상보적인 결합 및 상기 제3 서열 내의 상보적인 결합에 의해 형성된 RNA duplex는 본 명세서에서 스템 3(stem 3)으로 명명된다. 상기 스템 3을 형성하는 적어도 하나 이상의 뉴클레오타이드는 Cas12f1 단백질의 WED 도메인 및/또는 RuvC 도메인과 상호작용할 수 있다.
상기 제3 서열은 crRNA와 상보적 결합을 형성하는 적어도 하나 이상의 뉴클레오타이드를 포함한다. 이때, 상기 제3 서열은 crRNA와 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드를 포함할 수 있다. 이때, 상기 제3 서열은 crRNA와 적어도 하나 이상의 상보적 결합을 형성할 수 있다.
상기 제3 서열은 crRNA와 적어도 하나 이상의 염기 페어링을 형성하는 뉴클레오타이드를 포함한다. 이때, 상기 제3 서열은 crRNA와 적어도 하나 이상의 염기 페어링을 형성하지 않는 뉴클레오타이드를 포함할 수 있다. 이때, 상기 제3 서열은 crRNA와 적어도 하나 이상의 염기 페어링을 형성할 수 있다.
상기 제3 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는다.
상기 제3 서열은 상기 제2 서열의 5' 말단에 위치한다.
상기 제3 서열은 상기 제2 서열의 5'말단과 공유결합으로 연결된다.
일 구현예로서, 상기 제3 서열은 5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO: 212) 서열일 수 있다.
다른 일 구현예로서, 상기 제3 서열은 SEQ ID NO: 212 서열과 적어도 70% 이상 동일한 또는 유사한 서열일 수 있다. 또는 상기 제3 서열은 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
또 다른 일 구현예로서, 상기 제3 서열은 SEQ ID NO: 212 서열과 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제3 서열은 SEQ ID NO: 212 서열에 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 제3 서열은 SEQ ID NO: 212 서열과 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제3 서열은 SEQ ID NO: 212 서열에 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 제3 서열은 SEQ ID NO: 212 서열과 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제3 서열은 SEQ ID NO: 212 서열에 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
또 다른 일 구현예로서, 상기 제3 서열은 SEQ ID NO: 212 서열과 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제3 서열은 SEQ ID NO: 212 서열에 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
1-4) Fourth sequence (Stem 2)
상기 engineered tracrRNA는 제4 서열(fourth sequence)를 포함할 수 있다. 상기 제1 서열은 상기 wildtype tracrRNA의 변형 대상 영역 4에 대응된다 (도 2). 상기 제4 서열은 다양하게 변형이 가능한 뉴클레오타이드 서열로, 1 내지 50개의 뉴클레오타이드 서열(1 내지 50nt 서열)이다. 상기 제4 서열은 engineered tracrRNA의 필수 서열인 제3 서열의 5'말단에 위치한다. 상기 제4 서열은 해당 서열 내에서 상보적인 결합을 통해 RNA duplex를 형성한다. 이때, 상기 제4 서열 내에서 형성된 RNA duplex는 본 명세서에서 스템 2(stem 2)로 명명된다. 상기 스템 2를 형성하는 적어도 하나 이상의 뉴클레오타이드는 Cas12f1 단백질의 RuvC 도메인과 상호작용할 수 있다.
상기 제4 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는다.
상기 제4 서열은 상기 제3 서열의 5'말단과 공유결합으로 연결된다.
일 구현예로서, 상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 213) 서열일 수 있다. 이때, 상기 제4 서열은 해당 서열 내에서 상보적인 결합을 통해 RNA duplex를 형성할 수 있으며, 형성된 RNA duplex는 야생형 스템 2(wildtype stem 2)으로 명명한다.
다른 일 구현예로서, 상기 제4 서열은 SEQ ID NO: 213 서열의 일부 서열로, 상기 SEQ ID NO: 213 서열에 의해 형성된 야생형 스템 2의 길이가 짧아지도록 변형된 서열일 수 있다. 이때, 상기 제4 서열은 상기 야생형 스템 2보다 길이가 짧은 변형된 스템 2(modified stem 2)을 포함하거나 RNA duplex를 형성하지 않을 수 있다. 일 구체예로서, 상기 제4 서열은 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 예를 들어, 상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 214) 서열, 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 215) 서열, 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 216) 서열, 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 217) 서열, 5'-CCGCUUCACCAAAAGCGUUAGUUGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 218) 서열, 5'-CCGCUUCACCAAAAGGUUAGUUAACUUGAGUGAAGGUG-3' (SEQ ID NO: 219) 서열, 5'-CCGCUUCACCAAAGGUUAGUUAACUGAGUGAAGGUG-3' (SEQ ID NO: 220) 서열, 5'-CCGCUUCACCAAGGUUAGUUAACGAGUGAAGGUG-3' (SEQ ID NO: 221) 서열, 5'-CCGCUUCACAAGGUUAGUUAACAGUGAAGGUG-3' (SEQ ID NO: 222) 서열, 5'-CCGCUUCAAAGGUUAGUUAACAUGAAGGUG-3' (SEQ ID NO: 223) 서열, 5'-CCGCUUCAAGGUUAGUUAACAGAAGGUG-3' (SEQ ID NO: 224) 서열, 5'-CCGCUUAAGGUUAGUUAACAAAGGUG-3' (SEQ ID NO: 225) 서열, 5'-CCGCUAAGGUUAGUUAACAAGGUG-3' (SEQ ID NO: 226) 서열, 5'-CCGCAAGGUUAGUUAACAGGUG-3' (SEQ ID NO: 227) 서열, 5'-CCGAAGGUUAGUUAACAGUG-3' (SEQ ID NO: 228) 서열, 5'-CGAAGGUUAGUUAACAUG-3' (SEQ ID NO: 229) 서열 또는 5'-GAAGGUUAGUUAACAU-3' (SEQ ID NO: 230) 서열일 수 있으며, 이때, 상기 SEQ ID NO: 214 내지 230 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 다른 일 구체예로서, 상기 제4 서열은 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 예를 들어, 상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 214) 서열, 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 215) 서열, 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 216) 서열, 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 217) 서열, 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 231) 서열, 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 232) 서열, 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 233) 서열, 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 234) 서열, 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUG-3' (SEQ ID NO: 235) 서열, 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUG-3' (SEQ ID NO: 236) 서열, 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUG-3' (SEQ ID NO: 237) 서열, 5'-CCGCUUCACCAUUAGUGAGUGAAGGUG-3' (SEQ ID NO: 238) 서열, 5'-CCGCUUCACCUUAGGAGUGAAGGUG-3' (SEQ ID NO:239) 서열, 5'-CCGCUUCACUUAGAGUGAAGGUG-3' (SEQ ID NO: 240) 서열, 5'-CCGCUUCACUUAGGUGAAGGUG-3' (SEQ ID NO: 241) 서열, 5'-CCGCUUCAUUAGUGAAGGUG-3' (SEQ ID NO: 242) 서열, 5'-CCGCUUCUUAGGAAGGUG-3' (SEQ ID NO: 243) 서열, 5'-CCGCUUUUAGAAGGUG-3' (SEQ ID NO: 244) 서열, 5'-CCGCUUUAGAGGUG-3' (SEQ ID NO: 245) 서열, 5'-CCGCUUAGGGUG-3' (SEQ ID NO: 246) 서열, 5'-CCGUUAGGUG-3' (SEQ ID NO: 247) 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 또는 5'-UUAG-3' 서열일 수 있으며, 이때, 상기 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 또 다른 일 구체예로서, 상기 제4 서열은 SEQ ID NO: 213 서열에서 임의로 선정된 하나 이상의 뉴클레오타이드 서열이 삭제된 서열일 수 있다. 이때, 상기 임의로 선정된 하나 이상의 뉴클레오타이드 서열은 SEQ ID NO: 213 서열 내에서 순서 또는 방향에 상관없이 무작위적으로 선정된 서열일 수 있고, 이때, 상기 임의로 선정된 하나 이상의 뉴클레오타이드 서열이 둘 이상의 뉴클레오타이드 서열인 경우, 연속적인 둘 이상의 뉴클레오타이드 서열 또는 비 연속적인 둘 이상의 뉴클레오타이드 서열일 수 있다.
또 다른 일 구현예로서, 상기 제4 서열은 임의의 뉴클레오타이드 서열 또는 임의로 배열된 뉴클레오타이드 서열일 수 있다. 이때, 상기 임의의 뉴클레오타이드 서열 또는 임의로 배열된 뉴클레오타이드 서열은 1 내지 50nt 서열일 수 있다.
1-5) Fifth sequence (Stem 1)
상기 engineered tracrRNA는 제5 서열(fifth sequence)를 포함할 수 있다. 상기 제1 서열은 상기 wildtype tracrRNA의 변형 대상 영역 5에 대응된다 (도 2). 상기 제5 서열은 다양하게 변형이 가능한 뉴클레오타이드 서열로, 1 내지 21개의 뉴클레오타이드 서열(1 내지 21nt 서열)이다. 상기 제5 서열은 해당 서열 내에서 상보적인 결합을 통해 RNA duplex를 형성한다. 이때, 상기 제5 서열 내에서 형성된 RNA duplex는 본 명세서에서 스템 1(stem 1)로 명명된다.
상기 제5 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는다.
상기 제5 서열은 상기 제4 서열의 5'말단에 위치한다.
상기 제5 서열은 상기 제4 서열의 5'말단과 공유결합으로 연결된다.
일 구현예로서, 상기 제5 서열은 5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 248) 서열일 수 있다.
다른 일 구현예로서, 상기 제5 서열은 SEQ ID NO: 248 서열의 일부 서열로, SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열일 수 있다. 일 구체예로서, 상기 제5 서열은 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열, 5'-AAGUGGAGAA-3' (SEQ ID NO: 249) 서열, 5'-AAAGUGGAGAA-3' (SEQ ID NO: 250) 서열, 5'-UAAAGUGGAGAA-3' (SEQ ID NO: 251) 서열, 5'-AUAAAGUGGAGAA-3' (SEQ ID NO: 252) 서열, 5'-GAUAAAGUGGAGAA-3' (SEQ ID NO: 253) 서열, 5'-UGAUAAAGUGGAGAA-3' (SEQ ID NO: 254) 서열, 5'-CUGAUAAAGUGGAGAA-3' (SEQ ID NO: 255) 서열, 5'-ACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 256) 서열, 5'-CACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 257) 서열, 5'-UCACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 258) 서열 또는 5'-UUCACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 259) 서열일 수 있다.
또 다른 일 구현예로서, 상기 제5 서열은 SEQ ID NO: 248 서열에서 임의로 선정된 하나 이상의 뉴클레오타이드 서열이 삭제된 서열일 수 있다. 이때, 상기 임의로 선정된 하나 이상의 뉴클레오타이드 서열은 SEQ ID NO: 248 서열 내에서 순서 또는 방향에 상관없이 무작위적으로 선정된 서열일 수 있고, 이때, 상기 임의로 선정된 하나 이상의 뉴클레오타이드 서열이 둘 이상의 뉴클레오타이드 서열인 경우, 연속적인 둘 이상의 뉴클레오타이드 서열 또는 비 연속적인 둘 이상의 뉴클레오타이드 서열일 수 있다.
또 다른 일 구현예로서, 상기 제5 서열은 임의의 뉴클레오타이드 서열 또는 임의로 배열된 뉴클레오타이드 서열일 수 있다. 이때, 상기 임의의 뉴클레오타이드 서열 또는 임의로 배열된 뉴클레오타이드 서열은 1 내지 21nt 서열일 수 있다.
1-6) 추가 서열(additional sequence)
상기 engineered tracrRNA는 추가 서열(additional sequence)을 선택적으로 더 포함할 수 있다. 상기 추가 서열은 engineered tracrRNA의 3'말단에 위치할 수 있다. 상기 추가 서열은 상기 제1 서열의 3'말단에 위치할 수 있다. 상기 추가 서열은 engineered tracrRNA의 5'말단에 위치할 수 있다. 상기 추가 서열은 상기 제5 서열의 5'말단에 위치할 수 있다.
상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다.
일 구현예로서, 상기 추가 서열은 1 내지 5개, 1 내지 10개, 1 내지 15개, 1 내지 20개, 1 내지 25개, 1 내지 30개, 1 내지 35개, 1 내지 40개, 5 내지 10개, 5 내지 15개, 5 내지 20개, 5 내지 25개, 5 내지 30개, 5 내지 35개 또는 5 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 추가 서열은 10 내지 15개, 10 내지 20개, 10 내지 25개, 10 내지 30개, 10 내지 35개, 10 내지 40개, 15 내지 20개, 15 내지 25개, 15 내지 30개, 15 내지 35개 또는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 추가 서열은 20 내지 25개, 20 내지 30개, 20 내지 35개, 20 내지 40개, 25 내지 30개, 25 내지 35개 또는 25 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 추가 서열은 30 내지 35개, 30 내지 40개 또는 35 내지 40개의 뉴클레오타이드 서열일 수 있다.
다른 일 구현예로서, 상기 추가 서열은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 뉴클레오타이드 서열일 수 있다.
상기 추가 서열은 임의의 뉴클레오타이드 서열 또는 임의로 배열된 뉴클레오타이드 서열일 수 있다. 예를 들어, 상기 추가 서열은 5'-AUAAAGGUGA-3'(SEQ ID NO: 260) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
상기 추가 서열은 공지된 뉴클레오타이드 서열일 수 있다. 예를 들어, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 이때, 상기 hammerhead ribozyme 뉴클레오타이드 서열은 5'-CUGAUGAGUCCGUGAGGACGAAACGAGUAAGCUCGUC-3'(SEQ ID NO: 261) 서열 또는 5'-CUGCUCGAAUGAGCAAAGCAGGAGUGCCUGAGUAGUC-3'(SEQ ID NO: 262) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
1-7) 화학적 변형(Chemical modification)
앞서 설명한 engineered tracrRNA는 선택적으로 적어도 하나 이상의 뉴클레오타이드의 화학적 변형을 포함할 수 있다. 이때, 상기 화학적 변형은 뉴클레오타이드의 염기 및/또는 당에서 발생할 수 있는 다양한 공유 결합의 변형일 수 있으며, 예를 들어, 상기 화학적 변형은 methylation, halogenation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있고, 또는 WO 2019/089820 A1에 기재된 핵산의 변형을 모두 포함할 수 있으나, 이에 제한되지 않는다.
1-8) Engineered tracrRNA의 예시
앞선 설명을 기초로, engineered tracrRNA의 예시를 설명한다. 이하의 예시에 포함된 구성요소의 구체적인 설명은 앞서 해당 구성요소에 대해 기재한 바와 같다. 이하의 예시는 단순 예시로, 이에 제한되지 않다.
일 구현예로서, engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열일 수 있다. 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다.
일 구체예로서, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열 및 제3 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열 및 제3 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열, 제2 서열 및 제3 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 및 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO: 211) 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO: 212) 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다(5'-[제3 서열]-[제2 서열]-[제1 서열]-[추가 서열]-3').
예를 들어, 상기 engineered tracrRNA는 제1 서열, 제2 서열 및 제3 서열을 포함할 수 있다. 이때, 상기 제1 서열은 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 111) 서열 또는 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성(sequence identity)을 가지는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열은 5'-CANNNCNC-3'서열 외에 나머지 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열 및 제3 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[SEQ ID NO: 212 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 211 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 111 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-3'). 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 상기 hammerhead ribozyme 뉴클레오타이드 서열은 SEQ ID NO: 261 서열 또는 SEQ ID NO: 262 서열일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다. 일 예로, 상기 engineered tracrRNA는 5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 263) 서열을 포함할 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered tracrRNA는 5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 264) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered tracrRNA는 5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 265) 서열을 포함할 수 있다.
다른 일 구체예로서, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열 및 제4 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열 및 제4 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열, 제2 서열, 제3 서열 및 제4 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 및 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 213) 서열 또는 SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다(5'-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-[추가 서열]-3').
예를 들어, 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열 및 제4 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열은 5'-CANNNCNC-3'서열 외에 나머지 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열 및 제4 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[SEQ ID NO: 213 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 212 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 211 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 111 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-3'). 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 상기 hammerhead ribozyme 뉴클레오타이드 서열은 SEQ ID NO: 261 서열 또는 SEQ ID NO: 262 서열일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다. 일 예로, 상기 engineered tracrRNA는 5'- CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 266) 서열을 포함할 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered tracrRNA는 5'- CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 267) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered tracrRNA는 5'- CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAUUUCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 268) 서열을 포함할 수 있다.
또 다른 일 구체예로서, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 및 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제5 서열은 5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 248) 서열 또는 SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-[추가 서열]-3').
예를 들어, 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열은 5'-CANNNCNC-3'서열 외에 나머지 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열 또는 SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[SEQ ID NO: 248 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 213 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 212 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 211 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 111 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-3'). 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 상기 hammerhead ribozyme 뉴클레오타이드 서열은 SEQ ID NO: 261 서열 또는 SEQ ID NO: 262 서열일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다. 일 예로, 상기 engineered tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 269) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 270) 서열일 수 있다. 또 다른 일 예로, 상기 engineered tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 271) 서열일 수 있다.
다른 일 구현예로서, engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않고, wildtype tracrRNA보다 길이가 짧도록 변형된 서열일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있고, wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다.
일 구체예로서, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않고, wildtype tracrRNA보다 길이가 짧도록 변형된 서열일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있고, wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열 및 제3 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열 및 제3 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열, 제2 서열 및 제3 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열의 일부 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열의 일부 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열의 일부 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열의 일부 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열의 일부 서열; 및 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다(5'-[제3 서열]-[제2 서열]-[제1 서열]-[추가 서열]-3').
예를 들어, 상기 engineered tracrRNA는 제1 서열, 제2 서열 및 제3 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 5'-CAAAUUCANNNCN-3' (SEQ ID NO: 272) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACA-3' (SEQ ID NO: 273) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCAC-3' (SEQ ID NO: 274) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 275) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGC-3' (SEQ ID NO: 276) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUG-3' (SEQ ID NO: 277) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCU-3' (SEQ ID NO: 278) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUC-3' (SEQ ID NO: 279) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUU-3' (SEQ ID NO: 280) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAU-3' (SEQ ID NO: 281) 서열, 5'-CAAAUUCANNNCNCCUCUCCAA-3' (SEQ ID NO: 282) 서열, 5'-CAAAUUCANNNCNCCUCUCCA-3' (SEQ ID NO: 283) 서열, 5'-CAAAUUCANNNCNCCUCUCC-3' (SEQ ID NO: 284) 서열, 5'-CAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 285) 서열, 5'-CAAAUUCANNNCNCCUCU-3' (SEQ ID NO: 286) 서열, 5'-CAAAUUCANNNCNCCUC-3' (SEQ ID NO: 287) 서열, 5'-CAAAUUCANNNCNCCU-3' (SEQ ID NO: 288) 서열, 5'-CAAAUUCANNNCNCC-3' (SEQ ID NO: 289) 서열, 5'-CAAAUUCANNNCNC-3' (SEQ ID NO: 290) 서열 또는 5'-CAAAUUCANNNCN-3' (SEQ ID NO: 272) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열 및 제3 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[SEQ ID NO: 212 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 211 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열]-3'). 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 상기 hammerhead ribozyme 뉴클레오타이드 서열은 SEQ ID NO: 261 서열 또는 SEQ ID NO: 262 서열일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다. 일 예로, 상기 engineered tracrRNA는 5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 291) 서열을 포함할 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered tracrRNA는 5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 292) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered tracrRNA는 5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUCUCCUCUC-3' (SEQ ID NO: 293) 서열을 포함할 수 있다.
다른 일 구체예로서, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않고, wildtype tracrRNA보다 길이가 짧도록 변형된 서열일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있고, wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열 및 제4 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열 및 제4 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열, 제2 서열, 제3 서열 및 제4 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및 SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다(5'-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-[추가 서열]-3').
예를 들어, 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열 및 제4 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 SEQ ID NO: 272 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 상기 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 214 내지 217 서열, SEQ ID NO: 231 내지 247 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 및 5'-UUAG-3' 서열로 구성된 군에서 선택된 하나의 서열일 수 있으며, 이때, 상기 선택된 하나의 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열 및 제4 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[SEQ ID NO: 213 서열 또는 이의 일부 서열]-[SEQ ID NO: 212 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 211 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 111 서열 또는 이의 일부 서열]-3'). 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 상기 hammerhead ribozyme 뉴클레오타이드 서열은 SEQ ID NO: 261 서열 또는 SEQ ID NO: 262 서열일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다. 일 예로, 상기 engineered tracrRNA는 5'-CCGCUUCACCUUAGGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 294) 서열 또는 5'-CCGCUUCACCGAAAGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 295) 서열을 포함할 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered tracrRNA는 5'-CCGCUUUUAGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 296) 서열 또는 5'-CCGCUUGAAAAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 297) 서열을 포함할 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 또 다른 일 예로, 상기 engineered tracrRNA는 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 298) 서열 또는 5'-CCGCUUCACCAAGAAAUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 299) 서열을 포함할 수 있다.
또 다른 일 구체예로서, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않고, wildtype tracrRNA보다 길이가 짧도록 변형된 서열일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있고, wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및 SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-[추가 서열]-3').
예를 들어, 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 111) 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 SEQ ID NO: 272 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 상기 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 214 내지 217 서열, SEQ ID NO: 231 내지 247 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 및 5'-UUAG-3' 서열로 구성된 군에서 선택된 하나의 서열일 수 있으며, 이때, 상기 선택된 하나의 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열로, 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열 및 SEQ ID NO: 249 내지 259 서열로 구성된 군에서 선택된 하나의 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[SEQ ID NO: 248 서열 또는 이의 일부 서열]-[SEQ ID NO: 213 서열 또는 이의 일부 서열]-[SEQ ID NO: 212 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 211 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 111 서열 또는 이의 일부 서열]-3'). 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 상기 hammerhead ribozyme 뉴클레오타이드 서열은 SEQ ID NO: 261 서열 또는 SEQ ID NO: 262 서열일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다. 일 예로, 상기 engineered tracrRNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 300) 서열, 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 301) 서열, 5'-ACCGCUUCACCAAGAAAUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 302) 서열 또는 5'-ACCGCUUCACCAAGAAAUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 303) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered tracrRNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 304) 서열 또는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 305) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 또 다른 일 예로, 상기 engineered tracrRNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 306) 서열, 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 307) 서열, 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 308) 서열 또는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 309) 서열일 수 있다. 또 다른 일 예로, 상기 engineered tracrRNA는 5'-ACCGCUUCACCAAGAAAUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 310) 서열 또는 5'-ACCGCUUCACCAAGAAAUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 311) 서열일 수 있다.
2. Wildtype crRNA or Engineered crRNA
crRNA(crispr RNA)는 표적 핵산과 상호작용하는 서열과 Cas12f1(Cas14a1) 단백질과 상호작용하는 서열(tracrRNA와 상호작용하는 서열)을 포함한다. 상기 crRNA는 표적 핵산을 인식, 결합 또는 타겟할 수 있고, 상기 crRNA는 tracrRNA를 인식 또는 결합할 수 있다. 또한 상기 crRNA는 Cas12f1(Cas14a1) 단백질을 인식 또는 결합할 수 있다. 본 명세서에 의해 설명되는 crRNA는 야생형 crRNA 및 engineered crRNA를 모두 포함한다.
야생형 crRNA는 야생형(wildtype) 반복 서열(repeat sequence) 및 가이드 서열(guide sequence)을 포함한다. 이때, 상기 야생형 반복 서열과 가이드 서열은 wildtype crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치한다. 이때, 상기 야생형 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열이다.
Engineered crRNA는 wildtype crRNA의 일부 뉴클레오타이드 서열이 인위적으로 변형되거나, wildtype crRNA보다 길이가 짧도록 변형되거나 및/또는 3' 말단에 U-rich tail 서열이 부가된 crRNA이다 (도 3). 이때, 상기 engineered crRNA는 앞서 설명한 engineered tracrRNA와의 상호작용 또는 engineered guide RNA(또는 engineered CRISPR/Cas12f1(Cas14a1) system)의 추가적인 기능 향상을 위해 야생형 crRNA가 변형된 것이다.
상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함한다. 이때, 상기 제6 서열, 제7 서열 및 가이드 서열은 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다.
또는 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 포함한다. 이때, 상기 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열은 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다. 이때, 상기 제6 서열 및 제7 서열은 각각 상기 engineered tracrRNA와 결합하는 영역을 기준으로 나눈 것이다 (도 3).
또는 상기 engineered crRNA는 야생형 반복 서열, 가이드 서열 및 U-rich tail 서열을 포함한다. 이때, 상기 야생형 반복 서열, 가이드 서열 및 U-rich tail 서열은 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다. 이때, 상기 야생형 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열이다.
또는 상기 engineered crRNA는 야생형 반복 서열의 일부 서열 및 가이드 서열을 포함하거나 또는 야생형 반복 서열의 일부 서열, 가이드 서열 및 U-rich tail 서열을 포함한다. 이때, 상기 야생형 반복 서열의 일부 서열 및 가이드 서열; 또는 야생형 반복 서열의 일부 서열, 가이드 서열 및 U-rich tail 서열은 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다. 이때, 상기 야생형 반복 서열의 일부 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열의 일부 서열로, SEQ ID NO: 312 서열의 5'말단부에서 순차적인 일부 서열을 포함하지 않는 서열이다.
이하에서, 상기 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열에 대해 상세히 기술한다.
2-1) Sixth sequence (the other strand for Stem 5 / a part of Repeat sequence)
상기 engineered crRNA는 제6 서열(sixth sequence)를 포함한다. 상기 제6 서열은 상기 engineered crRNA에 포함되는 필수 서열이다. 상기 제6 서열은 상기 engineered tracrRNA의 일부 서열과 상보적인 결합을 하는 서열이다. 이때, 상기 제6 서열은 상기 engineered tracrRNA의 상기 제1 서열과 상보적인 결합을 통해 RNA duplex를 형성한다. 이때, 상기 제6 서열과 상기 제1 서열에 의해 형성된 RNA duplex는 스템 5(stem 5)이다. 상기 스템 5을 형성하는 적어도 하나 이상의 뉴클레오타이드는 Cas12f1 단백질의 WED 도메인 및/또는 ZF 도메인과 상호작용할 수 있다.
상기 제6 서열은 5'-ACGAA-3'서열을 포함하지 않는다.
상기 제6 서열은 상기 제1 서열와 상보적 결합을 형성하는 적어도 하나 이상의 뉴클레오타이드를 포함한다. 이때, 상기 제6 서열은 상기 제1 서열와 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드를 포함할 수 있다. 이때, 상기 제6 서열은 상기 제1 서열와 적어도 하나 이상의 상보적 결합을 형성할 수 있다.
상기 제6 서열은 상기 제1 서열와 적어도 하나 이상의 염기 페어링을 형성하는 뉴클레오타이드를 포함한다. 이때, 상기 제6 서열은 상기 제1 서열와 적어도 하나 이상의 염기 페어링을 형성하지 않는 뉴클레오타이드를 포함할 수있다. 이때, 상기 제6 서열은 상기 제1 서열와 적어도 하나 이상의 염기 페어링을 형성할 수 있다.
상기 제6 서열은 상기 engineered crRNA의 5' 말단에 위치한다.
상기 제6 서열은 앞서 설명한 engineered tracrRNA의 제1 서열에 따라 다양하게 변형된 서열일 수 있다. 즉, 상기 제6 서열은 상기 제1 서열 내에 존재하는 N 및/또는 V에 따라 다양하게 변형된 서열일 수 있다. 이때, 상기 제6 서열은 상기 제1 서열에 존재하는 적어도 하나의 N 및/또는 V와 상보적인 결합을 형성하는 뉴클레오타이드를 포함하는 서열일 수 있다.
상기 제6 서열은 다음의 서열들 중 선택된 하나의 서열일 수 있다:
5’-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3’ (SEQ ID NO: 313) 서열;
5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열;
5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열;
5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열;
5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열;
5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열; 및
SEQ ID NO: 313 내지 318 서열 중 선택된 하나의 일부 서열.
이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 독립적으로 U, C 또는 G 일 수 있다.
이때, 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다.
이때, 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 예를 들어, 상기 d가 3인 경우, (N)3은 5’-NNN-3’ 서열을 의미하며, 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
이때, 상기 (B)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (B)a의 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 예를 들어, 상기 a가 4인 경우, (B)4는 5’-BBBB-3’ 서열을 의미하며, 이때, 각각의 B는 독립적으로 U, C 또는 G일 수 있다.
이때, 상기 SEQ ID NO: 313 내지 318 서열의 5’말단에 위치하는 5’-GUUGCAGAACCCGAAUAG-3’ (SEQ ID NO: 319) 서열 및/또는 3’말단에 위치하는 5’-UGAAGGA-3’서열은 선택적으로 변형될 수 있다. 상기 변형은 SEQ ID NO: 319 서열 및/또는 5’-UGAAGGA-3’서열 중 적어도 하나 이상의 뉴클레오타이드가 삭제 또는 다른 뉴클레오타이드로 치환되는 것일 수 있다. 또는 상기 변형은 SEQ ID NO: 319 서열 및/또는 5’-UGAAGGA-3’서열에 하나 이상의 뉴클레오타이드가 삽입되는 것일 수 있다.
상기 제6 서열은 engineered tracrRNA의 제1 서열에 따라 상기 SEQ ID NO: 313 내지 318 서열 중 선택된 하나의 서열일 수 있다. 이때, 상기 제6 서열은 상기 제1 서열과 유기적인 관계를 가질 수 있다. 상기 제6 서열은 상기 제1 서열에 따라 다양하게 설계될 수 있다. 즉, 상기 제6 서열은 상기 제1 서열 내에 존재하는 N 및/또는 V에 따라 다양하게 설계될 수 있다. 이때, 상기 제6 서열은 상기 제1 서열에 존재하는 적어도 하나 이상의 N 및/또는 V와 상보적인 결합을 형성하는 뉴클레오타이드를 포함할 수 있다.
5’-GUUGCAGAACCCGAAUAG(N)
a
UGAAGGA-3’ (SEQ ID NO: 313) 서열
일 구현예로서, 제1 서열이 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열인 경우, 상기 제6 서열은 5'-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3' (SEQ ID NO: 313) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 제6 서열의 (N)a 중 적어도 하나의 N은 상기 제1 서열의 (N)a 중 적어도 하나의 N과 상보적인 결합을 형성할 수 있다. 예를 들어, 제1 서열이 5’-CAAAUUCAUUCUCCUCUCCAAUUCUGCACAA-3’ (SEQ ID NO: 320) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGUGCCUGAAGGA-3’ (SEQ ID NO: 321) 서열일 수 있다((N)a에 대응되는 뉴클레오타이드 중 서로 상보적 결합을 형성하는 뉴클레오타이드는 각각 밑줄로 표시함). 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5’-GUUGCAGAACCCGAAUAG(B)
a
NNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열
일 구현예로서, 제1 서열이 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 U, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 제6 서열의 (B)aNNNNB 중 적어도 하나의 N 및/또는 B는 상기 제1 서열의 VNNNN(V)a 중 적어도 하나의 N 및/또는 V와 상보적인 결합을 형성할 수 있다. 예를 들어, 제1 서열이 5’-CAAAUUCACAUUCCCCUCUCCAAUUCUGCACAA-3’ (SEQ ID NO: 322) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGGAAAGCUGAAGGA-3’ (SEQ ID NO: 323) 서열일 수 있다((B)aNNNNB 및 VNNNN(V)a에 대응되는 뉴클레오타이드 중 서로 상보적 결합을 형성하는 뉴클레오타이드는 각각 밑줄로 표시함). 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5’-GUUGCAGAACCCGAAUAG(N)
b
NNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열
일 구현예로서, 제1 서열이 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, B는 U, C 또는 G일 수 있다. 상기 b는 0 내지 1의 정수일 수 있다. 이때, 상기 제6 서열의 (N)bNNNBN 중 적어도 하나의 N 및/또는 B는 상기 제1 서열의 NVNNN(N)b 중 적어도 하나의 N 및/또는 V와 상보적인 결합을 형성할 수 있다. 예를 들어, 제1 서열이 5’-CAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3’ (SEQ ID NO: 324) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGAGCAAUGAAGGA-3’ (SEQ ID NO: 325) 서열일 수 있다((N)bNNNBN 및 NVNNN(N)b에 대응되는 뉴클레오타이드 중 서로 상보적 결합을 형성하는 뉴클레오타이드는 각각 밑줄로 표시함). 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5’-GUUGCAGAACCCGAAUAG(N)
c
NNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열
일 구현예로서, 제1 서열이 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, B는 U, C 또는 G일 수 있다. 상기 c는 0 내지 2의 정수일 수 있다. 이때, 상기 제6 서열의 (N)cNNBNN 중 적어도 하나의 N 및/또는 B는 상기 제1 서열의 NNVNN(N)c 중 적어도 하나의 N 및/또는 V와 상보적인 결합을 형성할 수 있다. 예를 들어, 제1 서열이 5’-CAAAUUCAUUUCUCCUCUCCAAUUCUGCACAA-3’ (SEQ ID NO: 326) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGAGGAAUGAAGGA-3’ (SEQ ID NO: 327) 서열일 수 있다((N)cNNBNN 및 NNVNN(N)c에 대응되는 뉴클레오타이드 중 서로 상보적 결합을 형성하는 뉴클레오타이드는 각각 밑줄로 표시함). 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5’-GUUGCAGAACCCGAAUAG(N)
d
NBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열
일 구현예로서, 제1 서열이 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, B는 U, C 또는 G일 수 있다. 상기 d는 0 내지 3의 정수일 수 있다. 이때, 상기 제6 서열의 (N)dNBNNN 중 적어도 하나의 N 및/또는 B는 상기 제1 서열의 NNNVN(N)d 중 적어도 하나의 N 및/또는 V와 상보적인 결합을 형성할 수 있다. 예를 들어, 제1 서열이 5’-CAAAUUCACUGCCUUCCUCUCCAAUUCUGCACAA-3’ (SEQ ID NO: 328) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGAAGGCAGUGAAGGA-3’ (SEQ ID NO: 329) 서열일 수 있다((N)dNBNNN 및 NNNVN(N)d에 대응되는 뉴클레오타이드 중 서로 상보적 결합을 형성하는 뉴클레오타이드는 각각 밑줄로 표시함). 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5’-GUUGCAGAACCCGAAUAG(N)
a
BNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열
일 구현예로서, 제1 서열이 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, B는 U, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 제6 서열의 (N)aBNNNN 중 적어도 하나의 N 및/또는 B는 상기 제1 서열의 NNNNV(N)a 중 적어도 하나의 N 및/또는 V와 상보적인 결합을 형성할 수 있다. 예를 들어, 제1 서열이 5’-CAAAUUCACAUUGAUCCUCUCCAAUUCUGCACAA-3’ (SEQ ID NO: 330) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGACGAAAGUGAAGGA-3’ (SEQ ID NO: 331) 서열일 수 있다((N)aBNNNN 및 NNNNV(N)a에 대응되는 뉴클레오타이드 중 서로 상보적 결합을 형성하는 뉴클레오타이드는 각각 밑줄로 표시함). 상기 예시는 단순 예시로, 이에 제한되지 않는다.
SEQ ID NO: 313 내지 318 서열 중 선택된 하나의 일부 서열
일 구현예로서, 상기 제6 서열은 5'-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3' (SEQ ID NO: 313) 서열의 일부 서열로, SEQ ID NO: 313 서열 중 5'-(N)aUGAAGGA-3'서열을 포함하면서 SEQ ID NO: 313 서열의 5'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다.
일 구체예로서, 상기 제6 서열은 5'-GUUGCAGAACCCGAAUAGNNNNUGAAGGA-3' (SEQ ID NO: 332) 서열의 일부 서열로, 5'-NNNNUGAAGGA-3' (SEQ ID NO: 333) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제6 서열은 5'-UGCAGAACCCGAAUAGNNNNUGAAGGA-3' (SEQ ID NO: 334) 서열, 5'-CAGAACCCGAAUAGNNNNUGAAGGA-3' (SEQ ID NO: 335) 서열, 5'-GAACCCGAAUAGNNNNUGAAGGA-3' (SEQ ID NO: 336) 서열, 5'-ACCCGAAUAGNNNNUGAAGGA-3' (SEQ ID NO: 337) 서열, 5'-CCGAAUAGNNNNUGAAGGA-3' (SEQ ID NO: 338) 서열, 5'-GAAUAGNNNNUGAAGGA-3' (SEQ ID NO: 339) 서열, 5'-AUAGNNNNUGAAGGA-3' (SEQ ID NO: 340) 서열, 5'-AGNNNNUGAAGGA-3' (SEQ ID NO: 341) 서열 또는 5'-NNNNUGAAGGA-3' (SEQ ID NO: 333) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구현예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열의 일부 서열로, SEQ ID NO: 314 서열 중 5'-NNNNBUGAAGGA-3' (SEQ ID NO: 342) 서열을 포함하면서 SEQ ID NO: 314 서열의 5'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다.
일 구체예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGNNNNBUGAAGGA-3’ (SEQ ID NO: 343) 서열의 일부 서열로, 5'-NNNNBUGAAGGA-3' (SEQ ID NO: 342) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제6 서열은 5'-UGCAGAACCCGAAUAGNNNNBUGAAGGA-3' (SEQ ID NO: 344) 서열, 5'-CAGAACCCGAAUAGNNNNBUGAAGGA-3' (SEQ ID NO: 345) 서열, 5'-GAACCCGAAUAGNNNNBUGAAGGA-3' (SEQ ID NO: 346) 서열, 5'-ACCCGAAUAGNNNNBUGAAGGA-3' (SEQ ID NO: 347) 서열, 5'-CCGAAUAGNNNNBUGAAGGA-3' (SEQ ID NO: 348) 서열, 5'-GAAUAGNNNNBUGAAGGA-3' (SEQ ID NO: 349) 서열, 5'-AUAGNNNNBUGAAGGA-3' (SEQ ID NO: 350) 서열, 5'-AGNNNNBUGAAGGA-3' (SEQ ID NO: 351) 서열 또는 5'-NNNNBUGAAGGA-3' (SEQ ID NO: 342) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구현예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열의 일부 서열로, SEQ ID NO: 315 서열 중 5'-NNNBNUGAAGGA-3' (SEQ ID NO: 352) 서열을 포함하면서 SEQ ID NO: 315 서열의 5'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 b는 0 내지 1의 정수일 수 있다.
일 구체예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGNNNBNUGAAGGA-3’ (SEQ ID NO: 353) 서열의 일부 서열로, 5'-NNNBNUGAAGGA-3' (SEQ ID NO: 352) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제6 서열은 5'-UGCAGAACCCGAAUAGNNNBNUGAAGGA-3' (SEQ ID NO: 354) 서열, 5'-CAGAACCCGAAUAGNNNBNUGAAGGA-3' (SEQ ID NO: 355) 서열, 5'-GAACCCGAAUAGNNNBNUGAAGGA-3' (SEQ ID NO: 356) 서열, 5'-ACCCGAAUAGNNNBNUGAAGGA-3' (SEQ ID NO: 357) 서열, 5'-CCGAAUAGNNNBNUGAAGGA-3' (SEQ ID NO: 358) 서열, 5'-GAAUAGNNNBNUGAAGGA-3' (SEQ ID NO: 359) 서열, 5'-AUAGNNNBNUGAAGGA-3' (SEQ ID NO: 360) 서열, 5'-AGNNNBNUGAAGGA-3' (SEQ ID NO: 361) 서열 또는 5'-NNNBNUGAAGGA-3' (SEQ ID NO: 352) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구현예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열의 일부 서열로, SEQ ID NO: 316 서열 중 5'-NNBNNUGAAGGA-3' (SEQ ID NO: 362) 서열을 포함하면서 SEQ ID NO: 316 서열의 5'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 c는 0 내지 2의 정수일 수 있다.
일 구체예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGNNBNNUGAAGGA-3’ (SEQ ID NO: 363) 서열의 일부 서열로, 5'-NNBNNUGAAGGA-3' (SEQ ID NO: 362) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제6 서열은 5'-UGCAGAACCCGAAUAGNNBNNUGAAGGA-3' (SEQ ID NO: 364) 서열, 5'-CAGAACCCGAAUAGNNBNNUGAAGGA-3' (SEQ ID NO: 365) 서열, 5'-GAACCCGAAUAGNNBNNUGAAGGA-3' (SEQ ID NO: 366) 서열, 5'-ACCCGAAUAGNNBNNUGAAGGA-3' (SEQ ID NO: 367) 서열, 5'-CCGAAUAGNNBNNUGAAGGA-3' (SEQ ID NO: 368) 서열, 5'-GAAUAGNNBNNUGAAGGA-3' (SEQ ID NO: 369) 서열, 5'-AUAGNNBNNUGAAGGA-3' (SEQ ID NO: 370) 서열, 5'-AGNNBNNUGAAGGA-3' (SEQ ID NO: 371) 서열 또는 5'-NNBNNUGAAGGA-3' (SEQ ID NO: 362) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구현예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열의 일부 서열로, SEQ ID NO: 317 서열 중 5'-NBNNNUGAAGGA-3' (SEQ ID NO: 372) 서열을 포함하면서 SEQ ID NO: 317 서열의 5'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 d는 0 내지 3의 정수일 수 있다.
일 구체예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3’ (SEQ ID NO: 373) 서열의 일부 서열로, 5'-NBNNNUGAAGGA-3' (SEQ ID NO: 372) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제6 서열은 5'-UGCAGAACCCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 374) 서열, 5'-CAGAACCCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 375) 서열, 5'-GAACCCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 376) 서열, 5'-ACCCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 377) 서열, 5'-CCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 378) 서열, 5'-GAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 379) 서열, 5'-AUAGNBNNNUGAAGGA-3' (SEQ ID NO: 380) 서열, 5'-AGNBNNNUGAAGGA-3' (SEQ ID NO: 381) 서열 또는 5'-NBNNNUGAAGGA-3' (SEQ ID NO: 372) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구현예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열의 일부 서열로, SEQ ID NO: 318 서열 중 5'-BNNNNUGAAGGA-3' (SEQ ID NO: 382) 서열을 포함하면서 SEQ ID NO: 318 서열의 5'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다.
일 구체예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGBNNNNUGAAGGA-3’ (SEQ ID NO: 383) 서열의 일부 서열로, 5'-BNNNNUGAAGGA-3' (SEQ ID NO: 382) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제6 서열은 5'-UGCAGAACCCGAAUAGBNNNNUGAAGGA-3' (SEQ ID NO: 384) 서열, 5'-CAGAACCCGAAUAGBNNNNUGAAGGA-3' (SEQ ID NO: 385) 서열, 5'-GAACCCGAAUAGBNNNNUGAAGGA-3' (SEQ ID NO: 386) 서열, 5'-ACCCGAAUAGBNNNNUGAAGGA-3' (SEQ ID NO: 387) 서열, 5'-CCGAAUAGBNNNNUGAAGGA-3' (SEQ ID NO: 388) 서열, 5'-GAAUAGBNNNNUGAAGGA-3' (SEQ ID NO: 389) 서열, 5'-AUAGBNNNNUGAAGGA-3' (SEQ ID NO: 390) 서열, 5'-AGBNNNNUGAAGGA-3' (SEQ ID NO: 391) 서열 또는 5'-BNNNNUGAAGGA-3' (SEQ ID NO: 382) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
2-2) Seventh sequence (interaction with the third sequence (or Stem 3) / a part of Repeat sequence)
상기 engineered crRNA는 제7 서열(seventh sequence)를 포함한다. 상기 제7 서열은 상기 engineered crRNA에 포함되는 필수 서열이다. 상기 제7 서열은 상기 engineered tracrRNA의 일부 서열과 상보적인 결합을 하는 서열이다. 이때, 상기 제7 서열은 상기 engineered tracrRNA의 상기 제3 서열의 일부 서열과 상보적인 결합을 통해 RNA duplex를 형성한다.
상기 제7 서열은 상기 제3 서열와 상보적 결합을 형성하는 적어도 하나 이상의 뉴클레오타이드를 포함한다. 이때, 상기 제7 서열은 상기 제3 서열와 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드를 포함할 수 있다. 이때, 상기 제7 서열은 상기 제3 서열와 적어도 하나 이상의 상보적 결합을 형성할 수 있다.
상기 제7 서열은 상기 제3 서열와 적어도 하나 이상의 염기 페어링을 형성하는 뉴클레오타이드를 포함한다. 이때, 상기 제7 서열은 상기 제3 서열와 적어도 하나 이상의 염기 페어링을 형성하지 않는 뉴클레오타이드를 포함할 수 있다. 이때, 상기 제7 서열은 상기 제3 서열와 적어도 하나 이상의 염기 페어링을 형성할 수 있다.
상기 제7 서열은 상기 제6 서열의 3' 말단에 위치한다.
상기 제7 서열은 상기 제6 서열의 3'말단과 공유결합으로 연결된다.
일 구현예로서, 상기 제7 서열은 5’-AUGCAAC-3’ 서열일 수 있다.
다른 일 구현예로서, 상기 제7 서열은 5’-AUGCAAC-3’ 서열과 적어도 70% 이상 동일한 또는 유사한 서열일 수 있다. 또는 상기 제7 서열은 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
또 다른 일 구현예로서, 상기 제7 서열은 5’-AUGCAAC-3’ 서열과 적어도 70% 내지 85%, 적어도 70% 내지 100% 또는 적어도 85% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제7 서열은 5’-AUGCAAC-3’ 서열에 적어도 적어도 70% 내지 85%, 적어도 70% 내지 100% 또는 적어도 85% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
또 다른 일 구현예로서, 상기 제7 서열은 5’-AUGCAAC-3’ 서열과 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제7 서열은 5’-AUGCAAC-3’ 서열에 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
2-3) 가이드 서열 (Guide sequence)
상기 wildtype crRNA 및 engineered crRNA는 가이드 서열를 포함한다. 가이드 서열은 표적 핵산을 인식(recognizing), 결합(binding) 또는 타겟(targeting)하는 RNA 서열이다. 보다 구체적으로, 가이드 서열은 표적 서열과 상보적으로 결합하는 RNA 서열, 표적 서열과 상보적인 결합을 형성할 수 있는 RNA 서열 또는 표적 서열에 상보성을 가지는 RNA 서열이다. 또는 가이드 서열은 프로토스페이서 서열과 동일하거나 유사한 RNA 서열이다. 이때, 프로토스페이서 서열은 표적 서열과 유기적인 관계를 가지며, 이와 관련된 설명은 상기 용어의 정의 섹션의 “표적 서열, 표적 가닥 및 비표적 가닥”에서 설명한 바와 같다. 가이드 서열은 표적 서열에 따라 변경되는 서열로, 가이드 서열은 표적 서열에 따라 달라진다. 또한, 가이드 서열은 RNA 서열로, 표적 핵산이 DNA인 경우에 표적 서열 내에 존재하는 아데노신(A)에 대해, 상기 가이드 서열은 상보적인 결합을 형성할 수 있는 유리딘(U)을 포함한다. 또는 표적 핵산이 DNA인 경우에 프로토스페이서 서열 내에 존재하는 티미딘(T)에 대해, 상기 가이드 서열은 티미딘(T) 대신에 유리딘(U)을 포함한다. 또한, 상기 가이드 서열은 스페이서 서열(spacer sequence)로도 지칭되며, 이하에서 가이드 서열과 스페이서 서열은 병용되어 사용된다.
상기 가이드 서열은 상기 야생형 반복 서열의 3' 말단에 위치한다. 또는 상기 가이드 서열은 상기 제7 서열의 3' 말단에 위치한다.
상기 가이드 서열은 상기 야생형 반복 서열의 3' 말단과 공유결합으로 연결된다. 또는 상기 가이드 서열은 상기 제7 서열의 3'말단과 공유결합으로 연결된다.
상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다.
일 구현예로서, 상기 가이드 서열은 15 내지 20개, 15 내지 25개, 15 내지 30개, 15 내지 35개 또는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 가이드 서열은 20 내지 25개, 20 내지 30개, 20 내지 35개 또는 20 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 가이드 서열은 25 내지 30개, 25 내지 35개 또는 25 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 가이드 서열은 30 내지 35개 또는 30 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 가이드 서열은 35 내지 40개의 뉴클레오타이드 서열일 수 있다.
다른 일 구현예로서, 상기 가이드 서열은 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 뉴클레오타이드 서열일 수 있다.
상기 가이드 서열은 표적 서열과 상보적인 결합을 하는 서열일 수 있다. 이때, 상기 상보적인 결합은 선택적으로 적어도 하나 이상의 미스매칭 결합을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 표적 서열과 상보적인 결합을 하는 서열로, 이때, 상기 상보적인 결합은 0 내지 5개의 미스매칭 결합을 포함할 수 있다.
상기 가이드 서열은 표적 서열에 대해 상보적인 서열일 수 있다. 이때, 상기 상보적인 서열은 표적 서열에 대해 0 내지 5개의 미스매치된(mismatched) 뉴클레오타이드 서열을 포함할 수 있다. 또는 상기 가이드 서열은 표적 서열에 대해 적어도 70% 이상 상보적인 뉴클레오타이드 서열일 수 있다. 이때, 표적 서열이 DNA인 경우에 표적 서열 내에 존재하는 아데노신(A)에 대해, 상기 가이드 서열은 상기 아데노신(A)에 상보적인 결합을 형성할 수 있는 유리딘(U)을 포함할 수 있다.
일 구현예로서, 상기 가이드 서열은 표적 서열에 대해 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100% 상보적인 서열일 수 있다. 또는 상기 가이드 서열은 표적 서열에 대해 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100% 상보적인 서열일 수 있다. 또는 상기 가이드 서열은 표적 서열에 대해 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100% 상보적인 서열일 수 있다. 또는 상기 가이드 서열은 표적 서열에 대해 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 상보적인 서열일 수 있다.
상기 가이드 서열은 프로토스페이서 서열과 동일한 또는 유사한 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열에 대해 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 이때, 상기 서열 동일성 또는 서열 유사성은 적어도 70% 이상인 것일 수 있다. 이때, 프로토스페이서 서열이 DNA인 경우에 프로토스페이서 서열 내에 존재하는 티미딘(T)에 대해, 상기 가이드 서열은 티미딘(T) 대신에 유리딘(U)을 포함할 수 있다.
일 구현예로서, 상기 가이드 서열은 프로토스페이서 서열과 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열과 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열과 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열과 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 동일한 또는 유사한 서열일 수 있다.
다른 일 구현예로서, 상기 가이드 서열은 프로토스페이서 서열에 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열에 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열에 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열에 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
2-4) U-rich tail sequence
상기 engineered crRNA는 U-rich tail 서열을 선택적으로 더 포함할 수 있다. U-rich tail 서열은 상기 engineered crRNA의 3’ 말단에 부가되는 유리딘(U)가 풍부한 서열이다. 상기 U-rich tail 서열은 engineered guide RNA(또는 engineered CRISPR/Cas12f1(Cas14a1) system)을 이용한 표적 유전자(표적 핵산) 에디팅 효율을 높이는 역할을 한다고 알려져 있다(PCT/KR2020/014961).
상기 U-rich tail 서열은 5’-(UaN)dUe-3’ 서열, 5’-UaVUaVUe-3’ 서열 또는 5’-UaVUaVUaVUe-3’ 서열일 수 있다.
이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다.
이때, 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다.
일 구현예로서, 상기 U-rich tail 서열은 5’-(UaU)dUe-3’ 서열, 즉, Ux 서열일 수 있다. 이때, 상기 x는 0 내지 22의 정수일 수 있다. 예를 들어, 상기 U-rich tail 서열은 U, UU, UUU, UUUU, UUUUU, UUUUUU, UUUUUUU, UUUUUUUU, UUUUUUUUU 또는 UUUUUUUUUU (SEQ ID NO: 392) 일 수 있다.
다른 일 구현예로서, 상기 U-rich tail 서열은 5’-(UaA)dUe-3’ 서열일 수 있다. 예를 들어, 상기 U-rich tail 서열은 UAU, UUAUUAU, UUUUAUUUU, UUUAUUUUU 또는 UUUAUUUAUUUAU (SEQ ID NO: 393) 일 수 있다.
또 다른 일 구현예로서, 상기 U-rich tail 서열은 5’-(UaG)dUe-3’ 서열일 수 있다. 예를 들어, 상기 U-rich tail 서열은 UUG, UUUGU, UUGUUGU, UUUUGUUUU, UGUGUGUUUU (SEQ ID NO: 394) 또는 UUUGUUUGUUUU (SEQ ID NO: 395) 일 수 있다.
다른 일 구현예로서, 상기 U-rich tail 서열은 5’-(UaC)dUe-3’ 서열일 수 있다. 예를 들어, 상기 U-rich tail 서열은 CUUUUU, UCUCUUU, UUCUU, UUUCU, UUUUCUUUU 또는 UUUUCUUUUCUUUU (SEQ ID NO: 396) 일 수 있다.
또 다른 일 구현예로서, 상기 U-rich tail 서열은 5’-UaAUaAUe-3’ 서열, 5’-UaAUaCUe-3’ 서열, 5’-UaAUaGUe-3’ 서열, 5’-UaCUaAUe-3’ 서열, 5’-UaCUaCUe-3’ 서열, 5’-UaCUaGUe-3’ 서열, 5’-UaGUaAUe-3’ 서열, 5’-UaGUaCUe-3’ 서열 또는 5’-UaGUaGUe-3’ 서열일 수 있다. 예를 들어, 상기 U-rich tail 서열은 UUAUUUAUU, UUUCUAUUUU (SEQ ID NO: 397), UGUCU, UUAUGUUUUU (SEQ ID NO: 398) 또는 UCUUUUGUU일 수 있다.
또 다른 일 구현예로서, 상기 U-rich tail 서열은 5’-UaAUaAUaAUe-3’ 서열, 5’-UaAUaAUaCUe-3’ 서열, 5’-UaAUaAUaGUe-3’ 서열, 5’-UaAUaCUaAUe-3’ 서열, 5’-UaAUaCUaCUe-3’ 서열, 5’-UaAUaCUaGUe-3’ 서열, 5’-UaAUaGUaAUe-3’ 서열, 5’-UaAUaGUaCUe-3’ 서열, 5’-UaAUaGUaGUe-3’ 서열, 5’-UaCUaAUaAUe-3’ 서열, 5’-UaCUaAUaCUe-3’ 서열, 5’-UaCUaAUaGUe-3’ 서열, 5’-UaCUaCUaAUe-3’ 서열, 5’-UaCUaCUaCUe-3’ 서열, 5’-UaCUaCUaGUe-3’ 서열, 5’-UaCUaGUaAUe-3’ 서열, 5’-UaCUaGUaCUe-3’ 서열, 5’-UaCUaGUaGUe-3’ 서열, 5’-UaGUaAUaAUe-3’ 서열, 5’-UaGUaAUaCUe-3’ 서열, 5’-UaGUaAUaGUe-3’ 서열, 5’-UaGUaCUaAUe-3’ 서열, 5’-UaGUaCUaCUe-3’ 서열, 5’-UaGUaCUaGUe-3’ 서열, 5’-UaGUaGUaAUe-3’ 서열, 5’-UaGUaGUaCUe-3’ 서열 또는 5’-UaGUaGUaGUe-3’ 서열일 수 있다. 예를 들어, 상기 U-rich tail 서열은 UUUAUUCUGUU (SEQ ID NO: 399), UUCUCUUUCUUU (SEQ ID NO: 400), UGUUAUUUAUU (SEQ ID NO: 401), UUUCUUUAUGUUU (SEQ ID NO: 402), UAUUUGUUUC (SEQ ID NO: 403) 또는 UUCUUGUUUUAUU (SEQ ID NO: 404) 일 수 있다.
2-5) 추가 서열(additional sequence)
상기 wildtype crRNA 및/또는 engineered crRNA는 추가 서열(additional sequence)을 선택적으로 더 포함할 수 있다. 상기 추가 서열은 wildtype crRNA 및/또는 engineered crRNA의 5’말단에 위치할 수 있다. 상기 추가 서열은 상기 야생형 반복 서열 또는 engineered 반복 서열의 5’말단에 위치할 수 있다. 상기 추가 서열은 상기 제6 서열의 5’말단에 위치할 수 있다.
상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다.
일 구현예로서, 상기 추가 서열은 1 내지 5개, 1 내지 10개, 1 내지 15개, 1 내지 20개, 1 내지 25개, 1 내지 30개, 1 내지 35개, 1 내지 40개, 5 내지 10개, 5 내지 15개, 5 내지 20개, 5 내지 25개, 5 내지 30개, 5 내지 35개 또는 5 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 추가 서열은 10 내지 15개, 10 내지 20개, 10 내지 25개, 10 내지 30개, 10 내지 35개, 10 내지 40개, 15 내지 20개, 15 내지 25개, 15 내지 30개, 15 내지 35개 또는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 추가 서열은 20 내지 25개, 20 내지 30개, 20 내지 35개, 20 내지 40개, 25 내지 30개, 25 내지 35개 또는 25 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 추가 서열은 30 내지 35개, 30 내지 40개 또는 35 내지 40개의 뉴클레오타이드 서열일 수 있다.
다른 일 구현예로서, 상기 추가 서열은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 뉴클레오타이드 서열일 수 있다.
상기 추가 서열은 임의의 뉴클레오타이드 서열 또는 임의로 배열된 뉴클레오타이드 서열일 수 있다.
상기 추가 서열은 공지된 뉴클레오타이드 서열일 수 있다. 예를 들어, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 이때, 상기 hammerhead ribozyme 뉴클레오타이드 서열은 SEQ ID NO: 261 서열 또는 SEQ ID NO: 262 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
2-6) 화학적 변형(Chemical modification)
앞서 설명한 wildtype crRNA 또는 engineered crRNA는 선택적으로 적어도 하나 이상의 뉴클레오타이드의 화학적 변형을 포함할 수 있다. 이때, 상기 화학적 변형은 뉴클레오타이드의 염기 및/또는 당에서 발생할 수 있는 다양한 공유 결합의 변형일 수 있으며, 예를 들어, 상기 화학적 변형은 methylation, halogenation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있고, 또는 WO 2019/089820 A1에 기재된 핵산의 변형을 모두 포함할 수 있으나, 이에 제한되지 않는다.
2-7) crRNA의 예시 (Engineered crRNA의 예시)
앞선 설명을 기초로, wildtype crRNA 및 engineered crRNA의 예시를 설명한다. 이하의 예시에 포함된 구성요소의 구체적인 설명은 앞서 해당 구성요소에 대해 기재한 바와 같다. 이하의 예시는 단순 예시로, 이에 제한되지 않는다.
일 구현예로서, wildtype crRNA는 wildtype 반복 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 wildtype 반복 서열과 가이드 서열은 wildtype crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열]-[가이드 서열]-3'). 일 예로, 상기 wildtype crRNA는 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 405) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
일 구현예로서, engineered crRNA는 wildtype crRNA의 3' 말단에 U-rich tail 서열이 부가된 crRNA일 수 있다.
일 구체예로서, 상기 engineered crRNA는 wildtype 반복 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다. 상기 wildtype 반복 서열, 가이드 서열 및 U-rich tail 서열은 wildtype crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 상기 engineered crRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered crRNA의 5' 말단에 위치할 수 있다(5'-[추가 서열]-[wildtype 반복 서열]-[가이드 서열]-[U-rich tail 서열]-3').
예를 들어, 상기 engineered crRNA는 SEQ ID NO: 312 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-UUUU-3' 서열, 5'-UUUUAUU-3' 서열 또는 5'-UUUUAUUUU-3' 서열일 수 있다. 상기 engineered crRNA는 SEQ ID NO: 312 서열, 가이드 서열 및 U-rich tail 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다(5'-[SEQ ID NO: 312 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 일 예로, 상기 engineered crRNA는 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUUAUUUU-3'(SEQ ID NO: 406) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered crRNA는 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 407) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
다른 일 구현예로서, engineered crRNA는 야생형(wildtype) crRNA의 일부 뉴클레오타이드 서열이 인위적으로 변형된 서열일 수 있다.
일 구체예로서, 상기 engineered crRNA는 wildtype 반복 서열과 비교하여 적어도 하나 이상의 뉴클레오타이드가 다른 서열로 치환된 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열, 제7 서열 및 가이드 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[제6 서열]-[제7 서열]-[가이드 서열]-3'). 이때, 상기 제6 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5’-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3’ (SEQ ID NO: 313) 서열; 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열; 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열; 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열; 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열; 및 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 독립적으로 U, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (B)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (B)a의 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 engineered crRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered crRNA의 5' 말단에 위치할 수 있다(5'-[추가 서열]-[제6 서열]-[제7 서열]-[가이드 서열]-3').
예를 들어, 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 408) 서열 또는 SEQ ID NO: 408 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열은 5'-GNGNNNUG-3'서열 외에 나머지 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다(5'-[SEQ ID NO: 408 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[5’-AUGCAAC-3’ 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[가이드 서열]-3'). 일 예로, 상기 engineered crRNA는 5’-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3’ (SEQ ID NO: 409) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered crRNA는 5’-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3’ (SEQ ID NO: 410) 서열을 포함할 수 있다.
또 다른 일 구현예로서, engineered crRNA는 야생형(wildtype) crRNA의 일부 뉴클레오타이드 서열이 인위적으로 변형되거나, 및/또는 wildtype crRNA보다 길이가 짧도록 변형된 서열일 수 있다.
일 구체예로서, 상기 engineered crRNA는 wildtype 반복 서열 중 일부 뉴클레오타이드 서열이 삭제된 서열일 수 있다. 상기 engineered crRNA는 wildtype 반복 서열의 일부 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열의 일부 서열 및 가이드 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열의 일부 서열]-[가이드 서열]-3'). 이때, 상기 wildtype 반복 서열의 일부 서열은 SEQ ID NO: 312 서열의 일부 서열로, SEQ ID NO: 312 서열의 5' 말단부 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 engineered crRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered crRNA의 5' 말단에 위치할 수 있다(5'-[추가 서열]-[wildtype 반복 서열의 일부 서열]-[가이드 서열]-3'). 일 예로, 상기 engineered crRNA는 5'-GAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 411) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
다른 일 구체예로서, 상기 engineered crRNA는 wildtype 반복 서열과 비교하여 적어도 하나 이상의 뉴클레오타이드가 다른 서열로 치환되고, wildtype 반복 서열 중 일부 뉴클레오타이드 서열이 삭제된 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열, 제7 서열 및 가이드 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[제6 서열]-[제7 서열]-[가이드 서열]-3'). 이때, 상기 제6 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5’-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3’ (SEQ ID NO: 313) 서열; 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열; 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열; 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열; 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열; 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열; 및 SEQ ID NO: 313 내지 318 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 독립적으로 U, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (B)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (B)a의 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 engineered crRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered crRNA의 5' 말단에 위치할 수 있다(5'-[추가 서열]-[제6 서열]-[제7 서열]-[가이드 서열]-3').
예를 들어, 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열은 SEQ ID NO: 408 서열 또는 SEQ ID NO: 408 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 SEQ ID NO: 408 서열 중 5'-NGNNNUGAAGGA-3' (SEQ ID NO: 412) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 5’-UUGCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 413) 서열, 5’-UGCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 414) 서열, 5’-GCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 415) 서열, 5’-CAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 416) 서열, 5’-AGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 417) 서열, 5’-GAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 418) 서열, 5’-AACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 419) 서열, 5’-ACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 420) 서열, 5’-CCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 421) 서열, 5’-CCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 422) 서열, 5’-CGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 423) 서열, 5’-GAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 424) 서열, 5’-AAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 425) 서열, 5’-AUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 426) 서열, 5’-UAGNGNNNUGAAGGA-3’ (SEQ ID NO: 427) 서열, 5’-AGNGNNNUGAAGGA-3’ (SEQ ID NO: 428) 서열 또는 5’-NGNNNUGAAGGA-3’ (SEQ ID NO: 412) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다(5'-[SEQ ID NO: 408 서열 또는 이의 일부 서열]-[5’-AUGCAAC-3’ 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[가이드 서열]-3'). 일 예로, 상기 engineered crRNA는 5’-GAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3’ (SEQ ID NO: 429) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered crRNA는 5’-GAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3’ (SEQ ID NO: 430) 서열을 포함할 수 있다.
다른 일 구현예로서, engineered crRNA는 야생형(wildtype) crRNA의 일부 뉴클레오타이드 서열이 인위적으로 변형되거나, wildtype crRNA보다 길이가 짧도록 변형되거나, 및/또는 3' 말단에 U-rich tail 서열이 부가된 서열일 수 있다.
일 구체예로서, 상기 engineered crRNA는 wildtype 반복 서열 중 일부 뉴클레오타이드 서열이 삭제되고, 3' 말단에 U-rich tail 서열이 부가된 서열일 수 있다. 상기 engineered crRNA는 wildtype 반복 서열의 일부 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열의 일부 서열, 가이드 서열 및 U-rich tail 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열의 일부 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 이때, 상기 wildtype 반복 서열의 일부 서열은 SEQ ID NO: 312 서열의 일부 서열로, SEQ ID NO: 312 서열의 5' 말단부 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다. 상기 engineered crRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered crRNA의 5' 말단에 위치할 수 있다(5'-[추가 서열]-[wildtype 반복 서열의 일부 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 일 예로, 상기 engineered crRNA는 5'-GAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 431) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
다른 일 구체예로서, 상기 engineered crRNA는 wildtype 반복 서열과 비교하여 적어도 하나 이상의 뉴클레오타이드가 다른 서열로 치환되고, 3' 말단에 U-rich tail 서열이 부가된 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[제6 서열]-[제7 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 이때, 상기 제6 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5’-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3’ (SEQ ID NO: 313) 서열; 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열; 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열; 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열; 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열; 및 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 독립적으로 U, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (B)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (B)a의 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다. 상기 engineered crRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered crRNA의 5' 말단에 위치할 수 있다(5'-[추가 서열]-[제6 서열]-[제7 서열]-[가이드 서열]-[U-rich tail 서열]-3').
예를 들어, 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열은 SEQ ID NO: 408 서열 또는 SEQ ID NO: 408 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열은 5'-GNGNNNUG-3'서열 외에 나머지 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-UUUU-3' 서열, 5'-UUUUAUU-3' 서열 또는 5'-UUUUAUUUU-3' 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다(5'-[SEQ ID NO: 408 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[5’-AUGCAAC-3’ 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 일 예로, 상기 engineered crRNA는 5’-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3’ (SEQ ID NO: 432) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered crRNA는 5’-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3’ (SEQ ID NO: 433) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered crRNA는 5’-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUUAUUUU-3’ (SEQ ID NO: 434) 서열을 포함할 수 있다.
또 다른 일 구체예로서, 상기 engineered crRNA는 wildtype 반복 서열과 비교하여 적어도 하나 이상의 뉴클레오타이드가 다른 서열로 치환되거나, wildtype 반복 서열 중 일부 뉴클레오타이드 서열이 삭제되거나, 및/또는 3' 말단에 U-rich tail 서열이 부가된 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[제6 서열]-[제7 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 이때, 상기 제6 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5’-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3’ (SEQ ID NO: 313) 서열; 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열; 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열; 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열; 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열; 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열; 및 SEQ ID NO: 313 내지 318 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 독립적으로 U, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (B)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (B)a의 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다. 상기 engineered crRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered crRNA의 5' 말단에 위치할 수 있다(5'-[추가 서열]-[제6 서열]-[제7 서열]-[가이드 서열]-[U-rich tail 서열]-3').
예를 들어, 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열은 SEQ ID NO: 408 서열 또는 SEQ ID NO: 408 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 SEQ ID NO: 408 서열 중 5'-NGNNNUGAAGGA-3' (SEQ ID NO: 412) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 SEQ ID NO: 412 내지 428 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-UUUU-3' 서열, 5'-UUUUAUU-3' 서열 또는 5'-UUUUAUUUU-3' 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다(5'-[SEQ ID NO: 408 서열의 일부 서열]-[5’-AUGCAAC-3’ 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 일 예로, 상기 engineered crRNA는 5’-GAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3’ (SEQ ID NO: 435) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered crRNA는 5’-GAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3’ (SEQ ID NO: 436) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered crRNA는 5’-GAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUUAUUUU-3’ (SEQ ID NO: 545) 서열을 포함할 수 있다.
3. Engineered guide RNA
Engineered guide RNA는 engineered tracrRNA(trans-activating crispr RNA)과 crRNA(crispr RNA)을 포함한다. 이때, 상기 crRNA는 wildtype crRNA 또는 engineered crRNA일 수 있다. 이때, 상기 engineered tracrRNA, wildtype crRNA 및 engineered crRNA 관련 설명은 앞서 기재한 바와 같다.
상기 engineered guide RNA는 engineered dual guide RNA 또는 engineered single guide RNA일 수 있다.
이하에서, engineered dual guide RNA 및 engineered single guide RNA에 대해 자세히 설명한다.
3-1) Dual guide RNA
Engineered dual guide RNA는 두 개의 분자로, engineered tracrRNA 및 crRNA 각각을 별개의 RNA 분자로 포함한다. 즉, 상기 engineered dual guide RNA는 engineered tracrRNA 및 crRNA가 각각 독립적으로 존재한다.
이때, 상기 crRNA는 wildtype crRNA 또는 engineered crRNA일 수 있다.
이때, 상기 engineered tracrRNA, wildtype crRNA 및 engineered crRNA 관련 설명은 앞서 기재한 바와 같다.
3-2) Single guide RNA
Engineered single guide RNA는 하나의 RNA 분자로, engineered tracrRNA, 링커(linker) 및 crRNA를 포함한다. 이때, 상기 engineered single guide RNA는 engineered tracrRNA, linker 및 crRNA가 연결된 하나의 RNA 분자이다.
Engineered single guide RNA는 5'-[engineered tracrRNA]-[linker]-[crRNA]-3' 서열일 수 있다.
이때, 상기 crRNA는 wildtype crRNA 또는 engineered crRNA일 수 있다.
이때, 상기 engineered tracrRNA, wildtype crRNA 및 engineered crRNA 관련 설명은 앞서 기재한 바와 같다.
이때, 상기 linker는 상기 engineered tracrRNA 및 crRNA를 연결하는 역할을 하는 서열이다. 즉, 상기 engineered single guide RNA는 engineered tracrRNA와 crRNA가 linker를 통해 연결된 하나의 RNA 분자이다.
상기 linker는 engineered tracrRNA 및/또는 crRNA의 기능에 영향을 주지 않는 서열일 수 있다. 또는 상기 linker는 engineered tracrRNA 및/또는 crRNA와 RNA duplex를 형성하지 않는 서열일 수 있다.
상기 linker는 1 내지 30개의 뉴클레오타이드 서열일 수 있다.
일 구현예로서, 상기 linker는 1 내지 5개, 5 내지 10개, 10 내지 15개, 15 내지 20개, 20개 내지 25개 또는 25 내지 30개의 뉴클레오타이드 서열일 수 있다.
다른 일 구현예로서, 상기 linker는 1 내지 30개, 5 내지 30개, 10 내지 30개, 15 내지 30개, 20 내지 30개 또는 25 내지 30개의 뉴클레오타이드 서열일 수 있다.
또 다른 일 구현예로서, 상기 linker는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 뉴클레오타이드 서열일 수 있다. 예를 들어, 상기 linker는 5'-GAAA-3' 서열일 수 있으나, 이에 제한된 것은 아니다.
3-3) Engineered guide RNA의 예시
앞선 설명을 기초로, engineered guide RNA의 예시를 설명한다. 이하의 예시에 포함된 구성요소의 구체적인 설명은 앞서 해당 구성요소에 대해 기재한 바와 같다. 이하의 예시는 단순 예시로, 이에 제한되지 않는다.
일 구현예로서, engineered guide RNA는 engineered tracrRNA 및 crRNA를 포함할 수 있다. 이때, 상기 crRNA는 wildtype crRNA 또는 engineered crRNA일 수 있다. 상기 engineered tracrRNA는 앞서 기재한 "1-8) Engineered tracrRNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다. 상기 crRNA는 "2-7) crRNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA일 수 있다. 이때, 상기 engineered dual guide RNA는 engineered tracrRNA와 crRNA를 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 engineered guide RNA는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 crRNA는 linker를 통해 연결되어 있을 수 있다.
다른 일 구현예로서, engineered guide RNA는 engineered tracrRNA 및 wildtype crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA보다 길이가 짧도록 추가로 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다.
일 구체예로서, 상기 engineered guide RNA는 engineered tracrRNA 및 wildtype crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것일 수 있다. 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 및 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열 또는 SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 wildtype crRNA는 wildtype 반복 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열은 SEQ ID NO: 312 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 wildtype 반복 서열과 가이드 서열은 wildtype crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열]-[가이드 서열]-3'). 상기 engineered guide RNA는 engineered dual guide RNA일 수 있다. 이때, 상기 engineered dual guide RNA는 engineered tracrRNA와 wildtype crRNA를 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 engineered guide RNA는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 wildtype crRNA는 linker를 통해 연결되어 있을 수 있다.
예를 들어, 상기 engineered guide RNA는 engineered tracrRNA 및 wildtype crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열은 5'-CANNNCNC-3'서열 외에 나머지 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열 또는 SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다. 상기 wildtype crRNA는 wildtype 반복 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열은 SEQ ID NO: 312 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 wildtype crRNA은 wildtype 반복 서열과 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA 또는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 wildtype crRNA는 linker를 통해 연결되어 있을 수 있다. 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 269) 서열 및 wildtype crRNA인 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 405) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 437) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 270) 서열 및 wildtype crRNA인 SEQ ID NO: 405 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 438) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
다른 일 구체예로서, 상기 engineered guide RNA는 engineered tracrRNA 및 wildtype crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 포함하지 않고, wildtype tracrRNA보다 길이가 짧도록 변형된 것일 수 있다. 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있고, wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및 SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 상기 wildtype crRNA는 wildtype 반복 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열은 SEQ ID NO: 312 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 wildtype 반복 서열과 가이드 서열은 wildtype crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열]-[가이드 서열]-3'). 상기 engineered guide RNA는 engineered dual guide RNA일 수 있다. 이때, 상기 engineered dual guide RNA는 engineered tracrRNA와 wildtype crRNA를 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 engineered guide RNA는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 wildtype crRNA는 linker를 통해 연결되어 있을 수 있다.
예를 들어, 상기 engineered guide RNA는 engineered tracrRNA 및 wildtype crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 SEQ ID NO: 272 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 상기 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 214 내지 217 서열, SEQ ID NO: 231 내지 247 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 및 5'-UUAG-3' 서열로 구성된 군에서 선택된 하나의 서열일 수 있으며, 이때, 상기 선택된 하나의 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열로, 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열 및 SEQ ID NO: 249 내지 259 서열로 구성된 군에서 선택된 하나의 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다. 상기 wildtype crRNA는 wildtype 반복 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열은 SEQ ID NO: 312 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 wildtype crRNA은 wildtype 반복 서열과 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA 또는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 wildtype crRNA는 linker를 통해 연결되어 있을 수 있다. 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 301) 서열 및 wildtype crRNA인 SEQ ID NO: 405 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 439) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 304) 서열 및 wildtype crRNA인 SEQ ID NO: 405 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 440) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 306) 서열 및 wildtype crRNA인 SEQ ID NO: 405 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 441) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 308) 서열 및 wildtype crRNA인 SEQ ID NO: 405 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 442) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
또 다른 일 구현예로서, engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA보다 길이가 짧도록 추가로 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered crRNA는 wildtype crRNA보다 반복 길이가 짧도록 변형되거나, 및/또는 wildtype crRNA의 3' 말단에 U-rich tail 서열이 부가된 것일 수 있다.
일 구체예로서, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 포함하지 않도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA보다 길이가 짧도록 추가로 변형된 것일 수 있다. 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및 SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 상기 engineered crRNA는 wildtype 반복 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열은 SEQ ID NO: 312 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다. 상기 wildtype 반복 서열, 가이드 서열 및 U-rich tail 서열은 wildtype crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 상기 engineered guide RNA는 engineered dual guide RNA일 수 있다. 이때, 상기 engineered dual guide RNA는 engineered tracrRNA와 engineered crRNA를 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 engineered guide RNA는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다.
예를 들어, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 SEQ ID NO: 272 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 상기 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 214 내지 217 서열, SEQ ID NO: 231 내지 247 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 및 5'-UUAG-3' 서열로 구성된 군에서 선택된 하나의 서열일 수 있으며, 이때, 상기 선택된 하나의 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열로, 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열 및 SEQ ID NO: 249 내지 259 서열로 구성된 군에서 선택된 하나의 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다. 상기 engineered crRNA는 SEQ ID NO: 312 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-UUUU-3' 서열, 5'-UUUUAUU-3' 서열 또는 5'-UUUUAUUUU-3' 서열일 수 있다. 상기 engineered crRNA는 SEQ ID NO: 312 서열, 가이드 서열 및 U-rich tail 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA 또는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다. 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 301 서열 및 engineered crRNA인 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 407) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 443) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 304 서열 및 engineered crRNA인 SEQ ID NO: 407 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 444) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 306 서열 및 engineered crRNA인 SEQ ID NO: 407 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 445) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 308 서열 및 engineered crRNA인 SEQ ID NO: 407 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 446) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 269 서열 및 engineered crRNA인 SEQ ID NO: 407 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 447) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 270 서열 및 engineered crRNA인 SEQ ID NO: 407 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 448) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
다른 일 구체예로서, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 포함하지 않도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA보다 길이가 짧도록 추가로 변형된 것일 수 있다. 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및 SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 상기 engineered crRNA는 wildtype 반복 서열 중 일부 뉴클레오타이드 서열이 삭제된 서열일 수 있다. 상기 engineered crRNA는 wildtype 반복 서열의 일부 서열 및 가이드 서열을 포함할 수 있다. 상기 engineered crRNA는 선택적으로 U-rich tail 서열을 더 포함할 수 있다. 이때, 상기 wildtype 반복 서열의 일부 서열은 SEQ ID NO: 312 서열의 일부 서열로, SEQ ID NO: 312 서열의 5' 말단부 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다. 상기 wildtype 반복 서열의 일부 서열 및 가이드 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열의 일부 서열]-[가이드 서열]-3'). 이때, 선택적으로 U-rich tail 서열을 더 포함하는 경우, 상기 U-rich tail 서열은 상기 engineered crRNA의 3' 말단에 위치할 수 있다(5'-[wildtype 반복 서열의 일부 서열]-[가이드 서열]-[U-rich tail]-3'). 상기 engineered guide RNA는 engineered dual guide RNA일 수 있다. 이때, 상기 engineered dual guide RNA는 engineered tracrRNA와 engineered crRNA를 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 engineered guide RNA는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다.
예를 들어, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 SEQ ID NO: 272 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 상기 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 214 내지 217 서열, SEQ ID NO: 231 내지 247 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 및 5'-UUAG-3' 서열로 구성된 군에서 선택된 하나의 서열일 수 있으며, 이때, 상기 선택된 하나의 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열로, 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열 및 SEQ ID NO: 249 내지 259 서열로 구성된 군에서 선택된 하나의 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다. 상기 engineered crRNA는 SEQ ID NO: 312 서열의 일부 서열 및 가이드 서열을 포함할 수 있다. 상기 engineered crRNA는 선택적으로 U-rich tail 서열을 더 포함할 수 있다. 이때, 상기 SEQ ID NO: 312 서열의 일부 서열은 SEQ ID NO: 312 서열의 5' 말단부 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-UUUU-3' 서열, 5'-UUUUAUU-3' 서열 또는 5'-UUUUAUUUU-3' 서열일 수 있다. 상기 engineered crRNA는 SEQ ID NO: 312 서열의 일부 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있고, U-rich tail 서열을 더 포함하는 경우, 상기 U-rich tail 서열은 3' 말단에 포함될 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA 또는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다. 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 305) 서열 및 engineered crRNA인 5'-GAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 411) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCGAAAGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 449) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 305 서열 및 engineered crRNA인 5'-GAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 431) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCGAAAGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 450) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 307) 서열 및 engineered crRNA인 SEQ ID NO: 431 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCUUAGGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCGAAAGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 451) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 309) 서열 및 engineered crRNA인 SEQ ID NO: 431 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCGAAAGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 452) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
또 다른 일 구현예로서, engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA보다 길이가 짧도록 추가로 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered crRNA는 야생형 crRNA의 일부 뉴클레오타이드 서열이 인위적으로 변형되거나, wildtype crRNA보다 길이가 짧도록 변형되거나, 및/또는 3' 말단에 U-rich tail 서열이 부가된 것일 수 있다.
일 구체예로서, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 포함하지 않도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA보다 길이가 짧도록 추가로 변형된 것일 수 있다. 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및 SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 상기 engineered crRNA는 wildtype 반복 서열과 비교하여 적어도 하나 이상의 뉴클레오타이드가 다른 서열로 치환된 것일 수 있다. 상기 engineered crRNA는 선택적으로 wildtype 반복 서열 중 일부 뉴클레오타이드 서열이 삭제된 것일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열, 제7 서열 및 가이드 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[제6 서열]-[제7 서열]-[가이드 서열]-3'). 이때, 상기 제6 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5’-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3’ (SEQ ID NO: 313) 서열; 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열; 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열; 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열; 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열; 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열; 및 SEQ ID NO: 313 내지 318 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 독립적으로 U, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (B)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (B)a의 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA일 수 있다. 이때, 상기 engineered dual guide RNA는 engineered tracrRNA와 engineered crRNA를 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 engineered guide RNA는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다.
예를 들어, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 SEQ ID NO: 272 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 상기 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 214 내지 217 서열, SEQ ID NO: 231 내지 247 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 및 5'-UUAG-3' 서열로 구성된 군에서 선택된 하나의 서열일 수 있으며, 이때, 상기 선택된 하나의 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열로, 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열 및 SEQ ID NO: 249 내지 259 서열로 구성된 군에서 선택된 하나의 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열은 SEQ ID NO: 408 서열 또는 SEQ ID NO: 408 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 SEQ ID NO: 408 서열 중 5'-NGNNNUGAAGGA-3' (SEQ ID NO: 412) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 SEQ ID NO: 412 내지 428 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA 또는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다. 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 301 서열 및 engineered crRNA인 5’-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3’ (SEQ ID NO: 409) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 453) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 304 서열 및 engineered crRNA인 SEQ ID NO: 409 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 454) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 306 서열 및 engineered crRNA인 5’-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3’ (SEQ ID NO: 410) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 455) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 308 서열 및 engineered crRNA인 SEQ ID NO: 410 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 456) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 269 서열 및 engineered crRNA인 SEQ ID NO: 409 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 457) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 270 서열 및 engineered crRNA인 SEQ ID NO: 410 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 458) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
다른 일 구체예로서, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 포함하지 않도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA보다 길이가 짧도록 추가로 변형된 것일 수 있다. 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및 SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 상기 engineered crRNA는 wildtype 반복 서열과 비교하여 적어도 하나 이상의 뉴클레오타이드가 다른 서열로 치환되고, 3' 말단에 U-rich tail 서열이 부가된 것일 수 있다. 상기 engineered crRNA는 선택적으로 wildtype 반복 서열 중 일부 뉴클레오타이드 서열이 삭제된 것일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[제6 서열]-[제7 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 이때, 상기 제6 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5’-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3’ (SEQ ID NO: 313) 서열; 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열; 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열; 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열; 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열; 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열; 및 SEQ ID NO: 313 내지 318 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 독립적으로 U, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (B)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (B)a의 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA일 수 있다. 이때, 상기 engineered dual guide RNA는 engineered tracrRNA와 engineered crRNA를 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 engineered guide RNA는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다.
예를 들어, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 SEQ ID NO: 272 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 상기 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 214 내지 217 서열, SEQ ID NO: 231 내지 247 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 및 5'-UUAG-3' 서열로 구성된 군에서 선택된 하나의 서열일 수 있으며, 이때, 상기 선택된 하나의 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열로, 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열 및 SEQ ID NO: 249 내지 259 서열로 구성된 군에서 선택된 하나의 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 제6 서열은 SEQ ID NO: 408 서열 또는 SEQ ID NO: 408 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 SEQ ID NO: 408 서열 중 5'-NGNNNUGAAGGA-3' (SEQ ID NO: 412) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 SEQ ID NO: 412 내지 428 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-UUUU-3' 서열, 5'-UUUUAUU-3' 서열 또는 5'-UUUUAUUUU-3' 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA 또는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다. 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 301 서열 및 engineered crRNA인 5’-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3’ (SEQ ID NO: 432) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 459) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 304 서열 및 engineered crRNA인 SEQ ID NO: 432 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 460) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 306 서열 및 engineered crRNA인 5’-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3’ (SEQ ID NO: 433) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 461) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 308 서열 및 engineered crRNA인 SEQ ID NO: 433 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 462) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 269 서열 및 engineered crRNA인 SEQ ID NO: 432 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 463) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 270 서열 및 engineered crRNA인 SEQ ID NO: 433 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 464) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
4. Engineered guide RNA의 용도
상기 engineered guide RNA는 Cas12f1(Cas14a1)와 함께 engineered CRISPR/Cas12f1(Cas14a1) system을 구성할 수 있다.
상기 engineered guide RNA는 Cas12f1(Cas14a1) 단백질과 결합하여 engineered CRISPR/Cas12f1 복합체(또는 CRISPR/Cas14a1 복합체)를 이룰 수 있다.
상기 engineered guide RNA는 engineered CRISPR/Cas12f1(Cas14a1) system의 표적 핵산의 절단, 편집 또는 변형을 위한 용도로 사용될 수 있으며, 이를 더욱 효과적으로 수행되도록 할 수 있다.
<Engineered CRISPR/Cas12f1(Cas14a1) system>
본 명세서에 의해 개시되는 다른 일 태양은 engineered CRISPR/Cas12f1(Cas14a1) system에 관한 것이다. 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 engineered guide RNA 및 Cas12f1(Cas14a1) 단백질이 정상적으로 발현하고 및/또는 정상적으로 작동하도록 하는 모든 형태를 포함한다. 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 표적 핵산 또는 표적 유전자의 절단, 편집 또는 변형을 더욱 효과적으로 수행되도록 한다. 특히, 상기 engineered CRISPR/Cas12f1(Cas14a1) system는 다음과 같은 효과를 수반할 수 있다:
guide RNA-Cas12f1 protein complex의 stability 증가;
CRISPR/Cas12f1(Cas14a1) system에 의한 표적 핵산의 절단 효율 증가; 및
CRISPR/Cas12f1(Cas14a1) system에 의한 표적 핵산의 편집 또는 변형 효율 증가.
보다 구체적으로, 상기 engineered CRISPR/Cas12f1(Cas14a1) system은
engineered guide RNA 또는 이를 암호화하는 핵산; 및
Cas12f1(Cas14a1) 단백질 또는 이를 암호화하는 핵산
을 포함한다.
이하에서 각 구성을 자세히 설명한다.
1. Engineered guide RNA
본 명세서에 의해 개시되는 engineered CRISPR/Cas12f1(Cas14a1) system은 표적 핵산 또는 표적 유전자에 존재하는 표적 서열을 인식하는 engineered guide RNA을 포함한다. 일반적으로 하나의 engineered guide RNA는 하나의 표적 서열을 인식할 수 있다. 상기 engineered guide RNA는 앞서 설명한 "<Engineered guide RNA>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
또한, engineered guide RNA를 암호화하는 핵산은 engineered guide RNA를 전사하기 위해 engineered guide RNA를 암호화하는 DNA일 수 있다.
2. Cas12f1(Cas14a1) protein
Cas12f1 단백질은 CRISPR/Cas12f1(Cas14a1) system의 주요 단백질 구성요소로, 선행연구(Harrington et al., Science, 362, 839-842 (2018))에서 Cas14로 명명된 이펙터 단백질 중 하나로, Cas14a1 단백질로도 불린다. 본 명세서에서, Cas12f1 단백질은 Cas14a1 단백질 또는 Cas12f1(Cas14a1) 단백질과 혼용되어 사용된다. 본 명세서에 의해 개시되는 Cas12f1 단백질은 자연계에 존재하는 야생형(wildtype) Cas12f1 단백질(야생형 Cas14a1 단백질)일 수 있다. 또는, Cas12f1 단백질은 야생형 Cas12f1 단백질의 변이체(variant)일 수 있으며, 이때, 상기 변이체는 "Cas12f1 변이체(Cas12f1 variant)" 또는 "Cas14a1 변이체(Cas14a1 variant)"로 지칭한다. 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질과 동일한 기능을 가지는 변이체, 기능 일부 또는 전부가 변형된 변이체 및/또는 추가적인 기능이 부가된 변이체일 수 있다. Cas12f1 단백질의 의미는 문맥에 따라 적절히 해석될 수 있고, 특별한 경우가 아닌 한 가장 넓은 의미로 해석된다. 이하에서 Cas12f1 단백질에 대해 자세히 설명한다.
2-1) Wildtype Cas12f1(Cas14a1) protein
상기 Cas12f1 단백질은 야생형 Cas12f1 단백질일 수 있다. 이때, 상기 Cas12f1 단백질은 표적 핵산 또는 표적 유전자의 이중 가닥 또는 단일 가닥을 절단할 수 있다. 상기 Cas12f1 단백질은 표적 핵산 또는 표적 유전자 내에 존재하는 Protospacer Adjacent Motif(PAM) 서열을 인식할 수 있다. 이때, PAM 서열은 상기 Cas14a1 단백질에 따라 정해지는 고유한 서열이다. 상기 Cas12f1 단백질을 위한 PAM 서열은 T-rich 서열일 수 있다. 상기 Cas12f1 단백질을 위한 PAM 서열은 5'-TTTR-3'서열일 수 있다. 이때, 상기 R은 A 또는 G일 수 있다. 예를 들어, 상기 PAM 서열은 5'-TTTA-3' 또는 5'-TTTG-3' 서열일 수 있다.
일 구현예로서, 상기 Cas12f1 단백질은 Cas14 패밀리(Harrington et al., Science 362, 839-842 (2018); US 2020/0172886 A1)에서 유래한 것일 수 있다.
다른 일 구현예로서, 상기 Cas12f1 단백질은 Uncultured archaeon 유래의 Cas14a1 단백질(Harrington et al., Science 362, 839-842 (2018); US 2020/0172886 A1)일 수 있다. 예를 들어, 상기 Cas14a1 단백질은 SEQ ID NO: 465 아미노산 서열일 수 있다.
Name | Amino acid sequence |
Cas12f1 단백질 | mAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLF CKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLS DVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSD FIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQ TSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFN KKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLES MKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPH FKCEKCNFKENADYNAALNISNPKLKSTKEEP (SEQ ID NO: 465) |
2-2) Cas12f1(Cas14a1) variant - Cas12f1(Cas14a1) mutant
상기 Cas12f1 단백질은 Cas12f1 변이체일 수 있다. 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질의 아미노산 서열 중 적어도 하나 이상의 아미노산이 변형된 것일 수 있다. 이때, 상기 변형은 삭제(deletion) 및/또는 치환(substitution)일 수 있다. 이때, 상기 Cas12f1 변이체는 "Cas12f1 돌연변이(Cas12f1 mutant)" 또는 "Cas14a1 돌연변이(Cas14a1 mutant)"로 지칭한다.
일 구현예로서, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질의 아미노산 서열 중 적어도 하나 이상의 아미노산이 삭제된 것일 수 있다. 예를 들어, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 RuvC 도메인 내 적어도 하나 이상의 아미노산이 삭제된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 PAM을 인식하는 도메인 내 적어도 하나 이상의 아미노산이 삭제된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 SEQ ID NO: 465 아미노산 서열 중 적어도 하나 이상의 아미노산이 삭제된 것일 수 있다.
다른 일 구현예로서, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질의 아미노산 서열 중 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다. 이때, 상기 치환은 하나의 아미노산이 하나의 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 치환은 하나의 아미노산이 다수개의 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 치환은 다수개의 아미노산이 하나의 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 치환은 다수개의 아미노산이 다수개의 다른 아미노산으로 치환된 것일 수 있으며, 이때, 치환되는 아미노산의 수와 치환하는 아미노산의 수는 서로 동일하거나 다를 수 있다. 예를 들어, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 RuvC 도메인 내 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 PAM을 인식하는 도메인 내 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 SEQ ID NO: 465 아미노산 서열 중 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다.
상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질과 동일한 기능을 가지는 변이체 또는 기능 일부 또는 전부가 변형된 변이체일 수 있다. 예를 들어, 상기 Cas12f1 돌연변이는 표적 핵산의 이중 가닥 중 하나의 가닥만 절단하도록 변경된 것일 수 있다. 또는 상기 Cas12f1 돌연변이는 5'-TTTA-3' 또는 5'-TTTG-3'이 아닌 다른 PAM 서열을 인식하도록 변형된 것일 수 있다.
2-3) Cas12f1(Cas14a1) variant - Cas12f1(Cas14a1) fusion protein
상기 Cas12f1 단백질은 Cas12f1 변이체일 수 있다. 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질 또는 Cas12f1 돌연변이에 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질이 부가된 변이체일 수 있다. 이때, 상기 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질이 부가된 변이체는 "Cas12f1 융합 단백질" 또는 "Cas14a1 융합 단백질"로 지칭된다. 상기 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질은 야생형 Cas12f1 단백질 또는 Cas12f1 돌연변이의 N 말단, C 말단 및/또는 아미노산 서열 내에 부가될 수 있다. 상기 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질은 야생형 Cas12f1 단백질과 동일하거나 다른 기능을 가지는 도메인, 펩타이드 또는 단백질일 수 있다. 예를 들어, 상기 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인, 펩타이드 또는 단백질 일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 단백질일 수 있으나, 이에 제한되지 않는다. 또는, 상기 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질은 역전사 효소(reverse transcriptase) 또는 디아미네이즈(deaminase)일 수 있다.
일 구현예로서, 상기 Cas12f1 융합 단백질은 야생형 Cas12f1 단백질 및 디아미네이즈를 포함할 수 있다. 이때, 상기 디아미네이즈는 시토신 디아미네이즈(cytosine deaminase), 시티딘 디아미네이즈(cytidine deaminase) 또는 아데닌 디아미네이즈(adenine deaminase)일 수 있다. 이때, 상기 Cas12f1 융합 단백질은 선택적으로 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질을 더 포함할 수 있다. 일 구체예로서, 상기 Cas12f1 융합 단백질은 SEQ ID NO: 466 아미노산 서열 또는 SEQ ID NO: 467 아미노산 서열일 수 있다. 다른 일 구체예로서, 상기 Cas12f1 융합 단백질은 SEQ ID NO: 468 아미노산 서열 또는 SEQ ID NO: 469 아미노산 서열일 수 있다.
다른 일 구현예로서, 상기 Cas12f1 융합 단백질은 야생형 Cas12f1 단백질 및 역전사 효소(reverse transcriptase)를 포함할 수 있다. 이때, 상기 역전사 효소는 Moloney Murine Leukemia Virus(M-MLV) 역전사 효소 또는 이의 변이체일 수 있다. 이때, 상기 Cas12f1 융합 단백질은 선택적으로 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질을 더 포함할 수 있다. 일 구체예로서, 상기 Cas12f1 융합 단백질은 SEQ ID NO: 470 아미노산 서열일 수 있다.
상기 Cas12f1 융합 단백질은 야생형 Cas12f1 단백질과 동일한 기능 및 추가적인 기능을 가지는 변이체일 수 있다. 또는 상기 Cas12f1 융합 단백질은 야생형 Cas12f1 단백질의 기능 일부 또는 전부의 변형 및 추가적인 기능을 가지는 변이체일 수 있다. 예를 들어, 상기 Cas12f1 융합 단백질은 표적 핵산의 이중가닥 중 하나의 가닥만 절단할 수 있고, 절단하지 않는 가닥에 대해 베이스 에디팅(Base editing) 또는 프라임 에디팅(Prime editing)을 할 수 있도록 변경된 것일 수 있다. 이때, 상기 Cas12f1 융합 단백질은 Cas12f1 돌연변이 및 디아미네이즈를 포함할 수 있고, 이 경우, 상기 베이스 에디팅은 디아미네이즈에 의한 것일 수 있다. 또는 상기 Cas12f1 융합 단백질은 Cas12f1 돌연변이 및 역전사 효소를 포함할 수 있고, 이 경우, 상기 프라임 에디팅은 역전사 효소에 의한 것일 수 있다.
2-4) Cas12f1(Cas14a1) variant - 기타
상기 Cas12f1 단백질은 Cas12f1 변이체일 수 있다. 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질, Cas12f1 돌연변이 또는 Cas12f1 융합 단백질에 선택적으로 NLS(Nuclear Localization Sequence) 또는 NES(Nuclear Export Sequence)가 더 포함된 것일 수 있다. 상기 NLS 및 NES는 세포 내 또는 외에서 Cas12f1 단백질의 위치 결정을 위한 시그널 펩타이드로, 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다. 예를 들어, 상기 NLS는 아미노산 서열 PKKKRKV (SEQ ID NO: 471)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK (SEQ ID NO: 472)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD (SEQ ID NO: 473) 또는 RQRRNELKRSP (SEQ ID NO: 474)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: 475)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부 터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO: 476); 마이오마(myoma) T 단백질의 서열 VSRKRPRP (SEQ ID NO: 477) 및 PPKKARED (SEQ ID NO: 478); 인간 p53의 서열 PQPKKKPL (SEQ ID NO: 479); 마 우스 c-abl IV의 서열 SALIKKKKKMAP (SEQ ID NO: 480); 인플루엔자 바이러스 NS1의 서열 DRLRR (SEQ ID NO: 481) 및 PKQKKRK (SEQ ID NO: 482); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL (SEQ ID NO: 483); 마우스 Mx1 단백질의 서열 REKKKFLKRR (SEQ ID NO: 484); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: 485); 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK (SEQ ID NO: 486)로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다.
또한, 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질, Cas12f1 돌연변이 또는 Cas12f1 융합 단백질에 선택적으로 태그가 더 포함된 것일 수 있다. 상기 태그는 Cas12f1 단백질의 분리 정제 및/또는 추적을 위한 기능적 도메인, 펩타이드 또는 단백질로, 앞서 기재한 용어 정의 중 "태그" 섹션에 예시된 것 중 하나일 수 있으나, 이에 제한되지 않는다.
2-5) Nucleic acid encoding Cas12f1(Cas14a1) protein
Cas12f1 단백질을 암호화하는 핵산은 야생형 Cas12f1 단백질을 암호화하는 핵산 또는 Cas12f1 변이체를 암호화하는 핵산일 수 있다. 상기 Cas12f1 단백질을 암호화하는 핵산은 Cas12f1 단백질을 도입하고자 하는 대상에 맞추어 코돈 최적화(codon optimization)된 것일 수 있다.
“코돈 최적화"는 고유 서열의 적어도 하나의 코돈을 대상 세포의 유전자에 더욱 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하면서, 고유 아미노산 서열을 유지함으로써 관심 대상 세포에서의 발현의 증진을 위해 핵산서열을 변형시키는 과정을 의미한다. 다양한 종은 특정 아미노산의 특정 코돈에 대한 특정 편향을 가지며, 코돈 편향(유기체 간의 코돈 사용의 차이)은 종종 mRNA의 번역의 효율과 상호관련 되며, 이는 번역되는 코돈의 특성 및 특정 tRNA 분자의 이용가능성에 의해 좌우되는 것으로 여겨진다. 세포에서 선택된 tRNA의 우세는 일반적으로 펩타이드 합성에 가장 빈번하게 사용되는 코돈을 반영한 것이다. 따라서, 유전자는 코돈 최적화에 기초하여 주어진 유기체에서 최적의 유전자 발현을 위해 맞춤화될 수 있다.
일 구현예로서, 상기 Cas12f1 단백질을 암호화하는 핵산은 인간 코돈 최적화된 Cas12f1 단백질을 암호화하는 핵산일 수 있다. 예를 들어, 상기 인간 코돈 최적화된 Cas12f1 단백질을 암호화하는 핵산은 SEQ ID NO: 487 서열일 수 있다.
Name | Sequence |
인간 코돈 최적화된 Cas12f1 단백질을 암호화하는 핵산 | ATGGCCAAGAACACAATTACAAAGACACTGAAGCTGAGGATCGTGAGACCATACAACAGCGCTGAG GTCGAGAAGATTGTGGCTGATGAAAAGAACAACAGGGAAAAGATCGCCCTCGAGAAGAACAAGGAT AAGGTGAAGGAGGCCTGCTCTAAGCACCTGAAAGTGGCCGCCTACTGCACCACACAGGTGGAGAGG AACGCCTGTCTGTTTTGTAAAGCTCGGAAGCTGGATGATAAGTTTTACCAGAAGCTGCGGGGCCAG TTCCCCGATGCCGTCTTTTGGCAGGAGATTAGCGAGATCTTCAGACAGCTGCAGAAGCAGGCCGCC GAGATCTACAACCAGAGCCTGATCGAGCTCTACTACGAGATCTTCATCAAGGGCAAGGGCATTGCC AACGCCTCCTCCGTGGAGCACTACCTGAGCGACGTGTGCTACACAAGAGCCGCCGAGCTCTTTAAG AACGCCGCTATCGCTTCCGGGCTGAGGAGCAAGATTAAGAGTAACTTCCGGCTCAAGGAGCTGAAG AACATGAAGAGCGGCCTGCCCACTACAAAGAGCGACAACTTCCCAATTCCACTGGTGAAGCAGAAG GGGGGCCAGTACACAGGGTTCGAGATTTCCAACCACAACAGCGACTTTATTATTAAGATCCCCTTT GGCAGGTGGCAGGTCAAGAAGGAGATTGACAAGTACAGGCCCTGGGAGAAGTTTGATTTCGAGCAG GTGCAGAAGAGCCCCAAGCCTATTTCCCTGCTGCTGTCCACACAGCGGCGGAAGAGGAACAAGGGG TGGTCTAAGGATGAGGGGACCGAGGCCGAGATTAAGAAAGTGATGAACGGCGACTACCAGACAAGC TACATCGAGGTCAAGCGGGGCAGTAAGATTGGCGAGAAGAGCGCCTGGATGCTGAACCTGAGCATT GACGTGCCAAAGATTGATAAGGGCGTGGATCCCAGCATCATCGGAGGGATCGATGTGGGGGTCAAG AGCCCCCTCGTGTGCGCCATCAACAACGCCTTCAGCAGGTACAGCATCTCCGATAACGACCTGTTC CACTTTAACAAGAAGATGTTCGCCCGGCGGAGGATTTTGCTCAAGAAGAACCGGCACAAGCGGGCC GGACACGGGGCCAAGAACAAGCTCAAGCCCATCACTATCCTGACCGAGAAGAGCGAGAGGTTCAGG AAGAAGCTCATCGAGAGATGGGCCTGCGAGATCGCCGATTTCTTTATTAAGAACAAGGTCGGAACA GTGCAGATGGAGAACCTCGAGAGCATGAAGAGGAAGGAGGATTCCTACTTCAACATTCGGCTGAGG GGGTTCTGGCCCTACGCTGAGATGCAGAACAAGATTGAGTTTAAGCTGAAGCAGTACGGGATTGAG ATCCGGAAGGTGGCCCCCAACAACACCAGCAAGACCTGCAGCAAGTGCGGGCACCTCAACAACTAC TTCAACTTCGAGTACCGGAAGAAGAACAAGTTCCCACACTTCAAGTGCGAGAAGTGCAACTTTAAG GAGAACGCCGATTACAACGCCGCCCTGAACATCAGCAACCCTAAGCTGAAGAGCACTAAGGAGGAG CCC (SEQ ID NO: 487) |
3. Engineered guide RNA-Cas12f1(Cas14a1) protein(s) complex (CRISPR complex)
본 명세서에 의해 개시되는 engineered CRISPR/Cas12f1(Cas14a1) system은 CRISPR complex 형태로 제공될 수 있다. 상기 CRISPR complex는 engineered guide RNA 및 Cas12f1 단백질을 포함한다. 이때, 상기 CRISPR complex는 engineered guide RNA 및 두 개의 Cas12f1 단백질을 포함한다(Satoru N. Takeda et al., Molecular Cell, 81, 1-13, (2021)). 상기 CRISPR complex는 engineered guide RNA와 Cas12f1 단백질 사이의 상호작용에 의해 형성된 ribonucleoprotein (RNP)일 수 있다. 이때, 상기 CRISPR complex는 engineered guide RNA와 하나의 Cas12f1 단백질 사이의 상호작용에 의해 형성된 ribonucleoprotein (RNP) 또는 engineered guide RNA와 두 개의 Cas12f1 단백질 사이의 상호작용에 의해 형성된 RNP일 수 있다(Satoru N. Takeda et al., Molecular Cell, 81, 1-13, (2021)). 상기 CRISPR complex는 "engineered guide RNA-Cas12f1(Cas14a1) 단백질 복합체", "engineered CRISPR/Cas12f1 복합체" 또는 "engineered CRISPR/Cas14a1 복합체"로 지칭되며, 상기 용어는 본 명세서에서 혼용되어 사용된다. 이하의 예시에 포함된 구성요소의 구체적인 설명은 앞서 해당 구성요소에 대해 기재한 바와 같다. 이하의 예시는 단순 예시로, 이에 제한되지 않는다.
일 구현예로서, 상기 CRISPR complex는 야생형 Cas12f1 단백질 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 CRISPR complex는 두 개의 야생형 Cas12f1 단백질 및 engineered guide RNA을 포함할 수 있다. 이때, 상기 야생형 Cas12f1 단백질은 SEQ ID NO: 465 아미노산 서열일 수 있다. 이때, 상기 engineered guide RNA은 engineered tracrRNA 및 crRNA를 포함하며, 이때, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것 또는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않고 wildtype tracrRNA보다 길이가 짧도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열일 수 있다. 또는 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않으면서, wildtype tracrRNA의 5'말단에 위치한 1 내지 24개의 뉴클레오타이드 서열 및/또는 wildtype tracrRNA의 3'말단에 위치한 1 내지 28개의 뉴클레오타이드 서열을 포함하지 않는 서열일 수 있다. 이때, 상기 crRNA는 wildtype crRNA 또는 engineered crRNA일 수 있다.
일 구체예로서, 상기 CRISPR complex는 야생형 Cas12f1 단백질 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 CRISPR complex는 두 개의 야생형 Cas12f1 단백질 및 engineered guide RNA을 포함할 수 있다. 이때, 상기 야생형 Cas12f1 단백질은 SEQ ID NO: 465 아미노산 서열일 수 있다. 이때, 상기 engineered guide RNA은 앞서 기재한 "3-3) Engineered guide RNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다.
다른 일 구현예로서, 상기 CRISPR complex는 Cas12f1 변이체 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 CRISPR complex는 두 개의 Cas12f1 변이체 및 engineered guide RNA을 포함할 수 있다. 이때, 상기 Cas12f1 변이체는 Cas12f1 돌연변이 또는 Cas12f1 융합 단백질일 수 있다. 이때, 상기 engineered guide RNA은 engineered tracrRNA 및 crRNA를 포함하며, 이때, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것 또는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않고 wildtype tracrRNA보다 길이가 짧도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열일 수 있다. 또는 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않으면서, wildtype tracrRNA의 5'말단에 위치한 1 내지 24개의 뉴클레오타이드 서열 및/또는 wildtype tracrRNA의 3'말단에 위치한 1 내지 28개의 뉴클레오타이드 서열을 포함하지 않는 서열일 수 있다. 이때, 상기 crRNA는 wildtype crRNA 또는 engineered crRNA일 수 있다.
일 구체예로서, 상기 CRISPR complex는 Cas12f1 변이체 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 CRISPR complex는 두 개의 Cas12f1 변이체 및 engineered guide RNA을 포함할 수 있다. 이때, 상기 Cas12f1 변이체는 SEQ ID NO: 465 아미노산 서열 중 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 Cas14a1 돌연변이일 수 있다. 이때, 상기 두 개의 Cas12f1 변이체는 동일하거나 다를 수 있다. 이때, 상기 engineered guide RNA은 앞서 기재한 "3-3) Engineered guide RNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다.
다른 일 구체예로서, 상기 CRISPR complex는 Cas12f1 변이체 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 CRISPR complex는 두 개의 Cas12f1 변이체 및 engineered guide RNA을 포함할 수 있다. 이때, 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질 또는 Cas12f1 돌연변이에 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질이 부가된 Cas12f1 융합 단백질일 수 있다. 상기 Cas12f1 융합 단백질은 SEQ ID NO: 466 아미노산 서열, SEQ ID NO: 467 아미노산 서열, SEQ ID NO: 468 아미노산 서열, SEQ ID NO: 469 아미노산 서열 또는 SEQ ID NO: 470 아미노산 서열을 가지는 단백질일 수 있다. 이때, 상기 두 개의 Cas12f1 변이체는 동일하거나 다를 수 있다. 이때, 상기 engineered guide RNA은 앞서 기재한 "3-3) Engineered guide RNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다.
또 다른 일 구현예로서, 상기 CRISPR complex는 야생형 Cas12f1 단백질, Cas12f1 변이체 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 야생형 Cas12f1 단백질은 SEQ ID NO: 465 아미노산 서열일 수 있다. 이때, 상기 Cas12f1 변이체는 Cas12f1 돌연변이 또는 Cas12f1 융합 단백질일 수 있다. 이때, 상기 engineered guide RNA은 engineered tracrRNA 및 crRNA를 포함하며, 이때, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것 또는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않고 wildtype tracrRNA보다 길이가 짧도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열일 수 있다. 또는 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않으면서, wildtype tracrRNA의 5'말단에 위치한 1 내지 24개의 뉴클레오타이드 서열 및/또는 wildtype tracrRNA의 3'말단에 위치한 1 내지 28개의 뉴클레오타이드 서열을 포함하지 않는 서열일 수 있다. 이때, 상기 crRNA는 wildtype crRNA 또는 engineered crRNA일 수 있다.
일 구체예로서, 상기 CRISPR complex는 야생형 Cas12f1 단백질, Cas12f1 변이체 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 야생형 Cas12f1 단백질은 SEQ ID NO: 465 아미노산 서열일 수 있다. 이때, 상기 Cas12f1 변이체는 SEQ ID NO: 465 아미노산 서열 중 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 Cas12f1 돌연변이일 수 있다. 이때, 상기 engineered guide RNA은 앞서 기재한 "3-3) Engineered guide RNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다.
다른 일 구체예로서, 상기 CRISPR complex는 야생형 Cas12f1 단백질, Cas12f1 변이체 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 야생형 Cas12f1 단백질은 SEQ ID NO: 465 아미노산 서열일 수 있다. 이때, 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질 또는 Cas12f1 돌연변이에 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질이 부가된 Cas12f1 융합 단백질일 수 있다. 상기 Cas12f1 융합 단백질은 SEQ ID NO: 466 아미노산 서열, SEQ ID NO: 467 아미노산 서열, SEQ ID NO: 468 아미노산 서열, SEQ ID NO: 469 아미노산 서열 또는 SEQ ID NO: 470 아미노산 서열을 가지는 단백질일 수 있다. 이때, 상기 engineered guide RNA은 앞서 기재한 "3-3) Engineered guide RNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다.
4. Engineered CRISPR/Cas12f1(Cas14a1) system의 용도
상기 engineered CRISPR/Cas12f1(Cas14a1) system은 표적 핵산 또는 표적 유전자의 절단, 편집 또는 변형을 위한 용도로 사용할 수 있으며, 이를 더욱 효과적으로 수행되도록 할 수 있다.
일 구현예로서, 상기 용도는 engineered CRISPR/Cas14a1 복합체가 대상 세포 내에서 표적 핵산 또는 표적 유전자와 접촉하는 것을 포함할 수 있다.
다른 일 구현예로서, 상기 용도는 engineered CRISPR/Cas14a1 복합체가 대상 세포 내에서 표적 핵산 또는 표적 유전자와 접촉하도록 유도하는 것을 포함할 수 있다. 이때, 상기 유도는 상기 engineered CRISPR/Cas14a1 복합체가 세포 내에서 표적 핵산과 접촉하도록 하는 방법이라면 특별히 제한되지 않는다. 예를 들어, 상기 유도는 engineered guide RNA 또는 이를 암호화하는 핵산, 및 Cas14a1 단백질 또는 이를 암호화하는 핵산을 세포 내에 전달하는 것일 수 있다.
<Modification of target using engineered CRISPR/Cas12f1(Cas14a1) system>
본 명세서에 의해 개시되는 또 다른 일 태양은 engineered CRISPR/Cas12f1(Cas14a1) system을 이용한 표적의 변형에 관한 것이다. 보다 구체적으로, 상기 태양은 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물 및 이를 이용한 방법에 의해 표적 핵산 또는 표적 유전자를 변형시키는 것에 관한 것이다. 상기 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물 및 이를 이용한 방법은 표적 핵산 또는 표적 유전자의 절단, 편집 또는 변형을 더욱 효과적으로 수행되도록 한다. 특히, 상기 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물의 이용은 다음과 같은 효과를 수반할 수 있다:
guide RNA-Cas12f1 protein complex의 stability 증가;
CRISPR/Cas12f1(Cas14a1) system에 의한 표적 핵산의 절단 효율 증가; 및
CRISPR/Cas12f1(Cas14a1) system에 의한 표적 핵산의 편집 또는 변형 효율 증가.
이하에서, 조성물 및 이를 이용한 방법에 대해 자세히 설명한다.
1. Composition
본 명세서에서 개시하는 조성물은 engineered CRISPR/Cas12f1(Cas14a1) system을 포함할 수 있다. 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 앞서 설명한 "<Engineered CRISPR/Cas12f1(Cas14a1) system>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
보다 구체적으로, 상기 조성물은
engineered guide RNA 또는 이를 암호화하는 핵산; 및
Cas12f1(Cas14a1) 단백질 또는 이를 암호화하는 핵산
을 포함할 수 있다.
이때, 상기 조성물은 선택적으로 하나 이상의 engineered guide RNA 또는 이를 암호화하는 핵산을 더 포함할 수 있다. 이 경우, 상기 조성물은 다수의 engineered guide RNA를 포함할 수 있고, 다수의 engineered guide RNA는 각각 서로 다른 표적 서열을 인식할 수 있다.
이때, 상기 조성물은 선택적으로 하나 이상의 Cas12f1(Cas14a1) 단백질 또는 이를 암호화하는 핵산을 더 포함할 수 있다. 이 경우, 상기 조성물은 서로 다른 아미노산 서열을 가지는 둘 이상의 Cas12f1(Cas14a1) 단백질을 포함할 수 있다. 이때, 상기 서로 다른 아미노산 서열을 가지는 둘 이상의 Cas12f1(Cas14a1) 단백질은 야생형 Cas12f1(Cas14a1) 단백질 및 Cas14a1 변이체일 수 있다.
상기 engineered guide RNA는 앞서 설명한 "<Engineered guide RNA>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 Cas12f1(Cas14a1) 단백질은 앞서 설명한 "2. Cas12f1(Cas14a1) protein" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 조성물은 핵산 형태일 수 있다. 또는 상기 조성물은 핵산 및 단백질이 혼합된 형태일 수 있다. 이하에서 조성물의 형태에 대해 자세히 설명한다.
1-1) 핵산 형태
상기 조성물은 핵산 형태일 수 있다. 상기 핵산 형태는 DNA, RNA 또는 이의 혼합 형태일 수 있다. 상기 핵산 형태는 벡터 형태일 수 있다. 이때, 상기 벡터는 바이러스 벡터 또는 비바이러스 벡터일 수 있다.
또한, 상기 핵산의 형태는 원형 또는 선형일 수 있다.
또한, 상기 핵산의 형태는 이중 가닥 또는 단일 가닥일 수 있다.
a) Viral vector
상기 조성물은 바이러스 벡터 형태일 수 있다. 예를 들어, 상기 바이러스 벡터는 레트로바이러스 벡터(retroviral(retrovirus) vector), 렌티바이러스 벡터(lentiviral(lentivirus) vector), 아데노바이러스 벡터(adenoviral(adenovirus vector), 아데노-연관 바이러스 벡터(adeno-associated viral (adeno-associated virus; AAV) vector), 백시니아바이러스 벡터(vaccinia viral(vaccinia virus) vector), 폭스바이러스 벡터(poxviral(poxvirus) vector) 및 단순포진 바이러스 벡터(herpes simplex viral(herpes simplex virus) vector)로 구성된 군에서 선택되는 하나 이상의 바이러스 벡터일 수 있다.
일 구현예로서, 상기 조성물은 바이러스 벡터 형태일 수 있다. 즉, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1(Cas14a1) 단백질을 암호화하는 핵산을 바이러스 벡터 형태로 포함할 수 있다. 이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 제1 바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 바이러스 벡터를 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 아데노-연관 바이러스 벡터를 포함할 수 있다.
다른 구현예로서, 상기 조성물이 다수개의 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 경우, 상기 조성물은 다수개의 engineered guide RNA를 암호화하는 핵산을 모두 포함하는 제1 바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 바이러스 벡터를 포함할 수 있다. 또는, 상기 조성물은 다수개의 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 바이러스 벡터 형태일 수 있다. 또는, 상기 조성물은 하나의 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 바이러스 벡터가 다수 개(engineered guide RNA의 수만큼)로 포함될 수 있다.
또 다른 구현예로서, 상기 조성물이 engineered guide RNA를 암호화하는 핵산 및 둘 이상의 Cas12f1 단백질(예를 들어, 제1 Cas12f1 단백질 및 제2 Cas12f1 단백질)을 암호화하는 핵산을 포함하는 경우, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 제1 바이러스 벡터, 제1 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 바이러스 벡터 및 제2 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제3 바이러스 벡터를 포함할 수 있다. 또는, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 둘 이상의 Cas12f1 단백질(예를 들어, 제1 Cas12f1 단백질 및 제2 Cas12f1 단백질)을 암호화하는 핵산을 모두 포함하는 하나의 바이러스 벡터 형태일 수 있다. 또는, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 제1 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제1 바이러스 벡터 및 제2 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 바이러스 벡터를 포함할 수 있다.
b) Non-viral vector
상기 조성물은 비바이러스 벡터 형태일 수 있다. 이 경우, 상기 조성물의 engineered guide RNA는 RNA 형태 또는 이를 암호화하는 핵산 형태일 수 있다.
상기 비바이러스 벡터는 플라스미드, 파지, 네이키드 DNA, DNA 복합체, mRNA(전사물) 또는 PCR 앰플리콘(amplicon)일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 상기 플라스미드는 pcDNA 시리즈, pSC101, pGV1106, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈, 및 pUC19으로 이뤄진 군에서 선택된 것일 수 있다. 예를 들어, 상기 파지는 λgt4λB, λ-Charon, λΔz1, 및 M13으로 이뤄진 군에서 선택된 것일 수 있다.
일 구현예로서, 상기 조성물은 비바이러스 벡터 형태일 수 있다. 즉, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 비바이러스 벡터 형태로 포함할 수 있다. 이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 제1 비바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 비바이러스 벡터를 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 비바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 플라스미드를 포함할 수 있다. 다른 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 mRNA를 포함할 수 있다. 또 다른 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 네이키드 DNA를 포함할 수 있다.
다른 구현예로서, 상기 조성물은 비바이러스 벡터 형태일 수 있다. 즉, 상기 조성물은 engineered guide RNA 및 Cas12f1 단백질을 암호화하는 핵산을 비바이러스 벡터 형태로 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA, 및 Cas12f1 단백질을 암호화하는 mRNA를 포함할 수 있다. 다른 일 구체예로서, 상기 조성물은 engineered guide RNA, 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 플라스미드를 포함할 수 있다.
c) 바이러스 벡터 및 비바이러스 벡터 혼합
상기 조성물은 바이러스 벡터 및 비바이러스 벡터 혼합 형태일 수 있다. 상기 바이러스 벡터 및 비바이러스 벡터에 관한 설명은 앞서 기재한 바와 같다. 이 경우, 상기 조성물의 engineered guide RNA는 RNA 형태 또는 이를 암호화하는 핵산 형태일 수 있다.
일 구현예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 비바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 아데노-연관 바이러스 벡터 및 Cas12f1 단백질을 암호화하는 mRNA를 포함할 수 있다. 다른 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 렌티바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 플라스미드를 포함할 수 있다.
다른 일 구현예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 비바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 아데노-연관 바이러스 벡터를 포함할 수 있다. 다른 일구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 플라스미드 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 렌티바이러스 벡터를 포함할 수 있다.
또 다른 일 구현예로서, 상기 조성물은 engineered guide RNA, 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA, 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 아데노-연관 바이러스 벡터를 포함할 수 있다.
다른 일 구현예로서, 상기 조성물은 engineered guide RNA, 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 비바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA, 및 Cas12f1 단백질을 암호화하는 mRNA를 포함할 수 있다. 다른 구체예로서, 상기 조성물은 engineered guide RNA, 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 플라스미드를 포함할 수 있다.
d) 기타 - 벡터의 추가 구성
앞서 설명한 벡터는 선택적으로 조절/제어 구성요소, 프로모터 및/또는 부가 발현 요소를 추가로 포함할 수 있다.
조절/제어 구성요소
상기 벡터는 선택적으로 조절/제어 구성요소를 포함할 수 있다. 이때, 상기 조절/제어 구성요소는 벡터에 포함된 각 구성요소를 암호화하는 서열(즉, engineered guide RNA를 암호화하는 핵산 및/또는 Cas12f1 단백질을 암호화하는 핵산)에 작동 가능하게 연결될 수 있다. 상기 조절/제어 구성요소는 인핸서, 인트론, 종결 신호, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(IRES, Internal Ribosome Entry Site), 스플라이스 억셉터, 2A 서열 및/또는 복제원점(replication origin)일 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 복제원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점, 및/또는 BBV 복제원점일 수 있으나, 이에 제한되는 것은 아니다.
프로모터
상기 벡터는 선택적으로 프로모터를 포함할 수 있다. 이때, 상기 프로모터는 벡터에 포함된 각 구성요소를 암호화하는 서열(즉, engineered guide RNA를 암호화하는 핵산 및/또는 Cas12f1 단백질을 암호화하는 핵산)에 작동 가능하게 연결될 수 있다. 상기 프로모터는 벡터에 포함된 각 구성요소를 암호화하는 서열(즉, engineered guide RNA를 암호화하는 핵산 및/또는 Cas12f1 단백질을 암호화하는 핵산)을 적절히 발현시킬 수 있는 것이라면 제한되지 않는다. 일 구현예로서, 상기 프로모터 서열은 RNA 중합효소(예를 들어, pol I, pol II, 또는 pol III)의 전사를 촉진시키는 프로모터일 수 있다. 예를 들어, 상기 프로모터는 SV40 초기 프로모터, mouse mammary tumor virus long terminal repeat(LTR) 프로모터, adenovirus major late 프로모터 (Ad MLP), herpes simplex virus (HSV) 프로모터, CMV immediate early promoter region (CMVIE)와 같은 cytomegalovirus (CMV) 프로모터, rous sarcoma virus (RSV) 프로모터, CBA 프로모터, human U6 small nuclear 프로모터 (U6) (Miyagishi et al., Nature Biotechnology 20, 497 - 500 (2002)), enhanced U6 프로모터 (e.g., Xia et al., Nucleic Acids Res. 2003 Sep 1;31(17)), 7SK 프로모터 및 human H1 프로모터 (H1) 중 하나 수 있으나, 이에 제한되는 것은 아니다.
부가 발현 요소
상기 벡터는 선택적으로 부가 발현 요소를 포함할 수 있다. 상기 벡터는 engineered guide RNA를 암호화하는 핵산 및/또는 Cas12f1 단백질을 암호화하는 핵산 외에 통상의 기술자가 필요에 의해 발현시키고자 하는 부가 발현 요소를 암호화하는 핵산 서열을 포함하고 있을 수 있다. 예를 들어, 상기 부가 발현 요소는, 앞서 기재한 용어 정의 중 "태그" 섹션에서 설명된 태그 중 하나일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 상기 부가 발현 요소는, 글리포세이트(glyphosate), 글루포시네이트암모늄 (glufosinate ammonium) 또는 포스피노트리신(phosphinothricin)과 같은 제초제 저항성 유전자; 또는 암피실린(ampicillin), 카나마이신(kanamycin), G418, 블레오마이신 (Bleomycin), 하이그로마이신(hygromycin) 또는 클로람페니콜(chloramphenicol)과 같은 항생제 내성 유전자일 수 있으나, 이에 제한되는 것은 아니다.
1-2) 핵산 및 단백질의 혼합 형태
상기 조성물은 핵산 및 단백질 혼합 형태일 수 있다. 이때, 상기 핵산은 앞서 기재한 "1-1) 핵산 형태"에 기재한 바와 같다. 이 경우, 상기 조성물은 Cas12f1 단백질을 포함한다. 이때, 상기 조성물은 두 개의 Cas12f1 단백질을 포함할 수 있으며, 상기 두 개의 Cas12f1 단백질은 동일한 아미노산 서열을 가지는 Cas12f1 단백질 또는 서로 다른 아미노산 서열을 가지는 Cas12f1 단백질일 수 있다.
일 구현예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 바이러스 벡터 및 Cas12f1 단백질을 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 아데노-연관 바이러스 벡터 및 Cas12f1 단백질을 포함할 수 있다.
다른 일 구현예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 비바이러스 벡터 및 Cas12f1 단백질을 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 플라스미드 및 Cas12f1 단백질을 포함할 수 있다. 다른 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 포함할 수 있다.
또 다른 일 구현예로서, 상기 조성물은 engineered guide RNA 및 Cas12f1 단백질을 포함할 수 있다. 이 경우, 상기 조성물은 engineered CRISPR/Cas12f1 복합체 형태인 RNP 형태일 수 있다. 만약 다수의 engineered guide RNA 및 Cas12f1 단백질을 포함하는 조성물의 경우, 상기 조성물은 다수개의 engineered CRISPR/Cas12f1 복합체를 포함할 수 있으며, 다수개의 engineered CRISPR/Cas12f1 복합체는 각각 서로 다른 표적 서열을 인지할 수 있다.
1-3) Composition의 용도
상기 조성물은 engineered CRISPR/Cas12f1(Cas14a1) system을 이용한 표적 핵산 또는 표적 유전자의 절단, 편집 또는 변형을 위한 용도로 사용할 수 있으며, 이를 더욱 효과적으로 수행되도록 할 수 있다.
2. Method for modifying a target using engineered CRISPR/Cas12f1(Cas14a1) system
본 명세서에서 개시하는 방법은 engineered CRISPR/Cas12f1(Cas14a1) system을 이용한 방법에 관한 것이다. 보다 구체적으로, 상기 방법은 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물을 대상체 및/또는 대상 세포에 도입(또는 전달)하여 대상체 및/또는 대상 세포 내에 존재하는 표적 핵산 또는 표적 유전자를 변형시키는 방법에 관한 것이다. 또는 상기 방법은 engineered guide RNA를 대상체 및/또는 대상 세포에 도입(또는 전달)하여 대상체 및/또는 대상 세포 내에 존재하는 표적 핵산 또는 표적 유전자를 표적하는 방법에 관한 것이다. 이때, 대상체는 식물, 동물 또는 이의 일부 조직이며, 상기 동물은 인간 또는 비인간 동물일 수 있다. 이때, 대상 세포는 원핵 세포 또는 진핵 세포일 수 있다. 이때, 상기 진핵 세포는 효모(yeast), 식물 세포, 동물 세포, 및/또는 인간 세포일 수 있으나, 이에 제한되지 않는다. 상기 방법은 in vitro, ex vivo 또는 생체 내(in vivo)에서 수행될 수 있다. 이때, 상기 생체 내는 인간 생체 내 또는 비인간 동물 생체 내일 수 있다.
상기 방법은 engineered guide RNA 또는 engineered CRISPR/Cas12f1(Cas14a1) system을 대상체 및/또는 대상 세포에 도입(또는 전달, 처리)하는 것을 포함하는 방법일 수 있다. 상기 engineered guide RNA는 앞서 설명한 "<Engineered guide RNA>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 앞서 설명한 "<Engineered CRISPR/Cas12f1(Cas14a1) system>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
이하에서, 상기 방법의 구현예를 이용해 자세히 설명한다.
2-1) Method 예시(1)
일 구현예로서, 상기 방법은 진핵 세포에 조성물을 처리하는 것을 포함하는 표적 핵산 또는 표적 유전자를 변형시키는 방법일 수 있다.
이때, 상기 조성물은
engineered guide RNA 또는 이를 암호화하는 핵산; 및
Cas12f1 단백질 또는 이를 암호화하는 핵산
을 포함할 수 있다.
상기 조성물은 앞서 설명한 "1. Composition" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 engineered guide RNA는 앞서 설명한 "<Engineered guide RNA>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 Cas12f1 단백질은 앞서 설명한 <Engineered CRISPR/Cas14a1 system> 중 "2. Cas12f1(Cas14a1) protein" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 조성물은 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태일 수 있다. 또는 상기 조성물은 핵산 및 단백질 혼합 형태일 수 있다. 상기 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태는 앞서 설명한 "1-1) 핵산 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 핵산 및 단백질 혼합 형태는 앞서 설명한 "1-2) 핵산 및 단백질 혼합 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 바이러스 벡터 형태일 수 있다. 이때, 상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택되는 하나 이상일 수 있다. 이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 바이러스 벡터를 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 각각 포함하는 두 개의 바이러스 벡터를 포함할 수 있다.
다른 일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 비바이러스 벡터 형태일 수 있다. 이때, 상기 비바이러스 벡터는 플라스미드일 수 있다. 이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 플라스미드를 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 각각 포함하는 두 개의 플라스미드를 포함할 수 있다.
또 다른 일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 mRNA을 포함할 수 있다.
또 다른 일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA 및 Cas12f1 단백질이 결합한 engineered CRISPR/Cas12f1(Cas14a1) 복합체를 포함할 수 있다.
상기 진핵 세포는 표적 핵산 또는 표적 유전자를 포함할 수 있다. 상기 진핵 세포는 효모(yeast), 식물 세포, 동물 세포, 및/또는 인간 세포일 수 있으나, 이에 제한되지 않는다.
상기 진핵 세포에 조성물을 처리하는 것은 진핵 세포로 engineered CRISPR/Cas12f1(Cas14a1) system이 도입되기 위한 것일 수 있다. 또는 상기 진핵 세포에 조성물을 처리하는 것은 진핵 세포에 존재하는 표적 핵산 또는 표적 유전자에 engineered CRISPR/Cas12f1(Cas14a1) system이 접촉되기 위한 것일 수 있다.
상기 진핵 세포에 조성물을 처리하는 것은 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 나노파티클 방법 및/또는 일시적인 세포 압축 또는 스퀴징 방법을 이용한 것일 수 있다. 또는 상기 진핵 세포에 조성물을 처리하는 것은 양이온성 리포좀법, 초산 리튬-DMSO, 지질-매개 형질감염(transfection), 인산칼슘 침전법(precipitation), lipofection, PEI(Polyethyleneimine)-매개 형질감염, DEAE-dextran 매개 형질감염, 및/또는 나노파티클-매개 핵산 전달(Panyam et al., Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조)을 이용한 것일 수 있으나, 이에 제한되는 것은 아니다.
상기 방법은 선택적으로 진핵 세포를 배양하는 것을 더 포함할 수 있다. 이 경우, 상기 배양은 조성물을 처리한 후 진핵 세포를 배양하는 것일 수 있다.
2-2. Method 예시(2)
다른 일 구현예로서, 상기 방법은 진핵 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 처리하는 것을 포함하는 표적 핵산 또는 표적 유전자를 변형시키는 방법일 수 있다.
이때, 상기 engineered CRISPR/Cas12f1(Cas14a1) system은
engineered guide RNA 또는 이를 암호화하는 핵산; 및
Cas12f1 단백질 또는 이를 암호화하는 핵산
을 포함할 수 있다.
상기 engineered CRISPR/Cas12f1(Cas14a1) system은 앞서 설명한 "<Engineered CRISPR/Cas12f1(Cas14a1) system>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 engineered CRISPR/Cas12f1(Cas14a1) system은 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태일 수 있다. 또는 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 핵산 및 단백질 혼합 형태일 수 있다. 상기 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태는 앞서 설명한 "1-1) 핵산 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 핵산 및 단백질 혼합 형태는 앞서 설명한 "1-2) 핵산 및 단백질 혼합 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
일 구체예에서, 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 mRNA을 포함할 수 있다.
다른 일 구체예에서, 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 포함할 수 있다.
또 다른 일 구체예에서 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 engineered guide RNA 및 Cas12f1 단백질이 결합한 engineered CRISPR/Cas12f1(Cas14a1) 복합체를 포함할 수 있다.
상기 진핵 세포는 표적 핵산 또는 표적 유전자를 포함할 수 있다. 상기 진핵 세포는 효모(yeast), 식물 세포, 동물 세포, 및/또는 인간 세포일 수 있으나, 이에 제한되지 않는다.
상기 진핵 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 처리하는 것은 진핵 세포에서 engineered CRISPR/Cas12f1(Cas14a1) 복합체를 형성하기 위한 것일 수 있다. 또는 상기 진핵 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 처리하는 것은 진핵 세포에 존재하는 표적 핵산 또는 표적 유전자에 engineered CRISPR/Cas12f1(Cas14a1) 복합체를 접촉시키기 위한 것일 수 있다.
상기 진핵 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 처리하는 것은 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 나노파티클 방법 및/또는 일시적인 세포 압축 또는 스퀴징 방법을 이용한 것일 수 있다. 또는 상기 진핵 세포에 조성물을 처리하는 것은 양이온성 리포좀법, 초산 리튬-DMSO, 지질-매개 형질감염(transfection), 인산칼슘 침전법(precipitation), lipofection, PEI(Polyethyleneimine)-매개 형질감염, DEAE-dextran 매개 형질감염, 및/또는 나노파티클-매개 핵산 전달(Panyam et al., Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조)을 이용한 것일 수 있으나, 이에 제한되는 것은 아니다.
상기 진핵 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 처리하는 것은 engineered guide RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 동시에 처리하는 것일 수 있다. 또는 상기 진핵 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 처리하는 것은 engineered guide RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 순차적으로 처리하는 것일 수 있다.
상기 방법은 선택적으로 진핵 세포를 배양하는 것을 더 포함할 수 있다. 이 경우, 상기 배양은 조성물을 처리한 후 진핵 세포를 배양하는 것일 수 있다.
2-3. Method 예시(3)
또 다른 일 구현예로서, 상기 방법은 진핵 세포에 engineered guide RNA 또는 이를 암호화하는 핵산을 처리하는 것을 포함하는 표적 핵산 또는 표적 유전자를 변형시키는 방법일 수 있다.
이때, 상기 진핵 세포는 Cas12f1 단백질 또는 이를 암호화하는 핵산을 포함하는 세포일 수 있다. 또한, 상기 진핵 세포는 표적 핵산 또는 표적 유전자를 포함할 수 있다. 상기 진핵 세포는 효모(yeast), 식물 세포, 동물 세포, 및/또는 인간 세포일 수 있으나, 이에 제한되지 않는다.
상기 engineered guide RNA는 앞서 설명한 "<Engineered guide RNA>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 engineered guide RNA를 암호화하는 핵산은 바이러스 벡터 또는 비바이러스 벡터 형태일 수 있다. 상기 바이러스 벡터 또는 비바이러스 벡터 형태는 앞서 설명한 "1-1) 핵산 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
일 구체예에서, 상기 engineered guide RNA를 암호화하는 핵산은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 형태일 수 있다.
다른 일 구체예에서, 상기 engineered guide RNA를 암호화하는 핵산은 engineered guide RNA를 암호화하는 핵산을 포함하는 아데노 연관 바이러스 벡터 형태일 수 있다.
상기 진핵 세포에 engineered guide RNA 또는 이를 암호화하는 핵산을 처리하는 것은 진핵 세포에서 engineered CRISPR/Cas12f1 복합체를 형성하기 위한 것일 수 있다. 또는 상기 진핵 세포에 engineered guide RNA 또는 이를 암호화하는 핵산을 처리하는 것은 진핵 세포에 존재하는 표적 핵산 또는 표적 유전자에 engineered CRISPR/Cas12f1 복합체를 접촉시키기 위한 것일 수 있다.
상기 진핵 세포에 engineered CRISPR/Cas12f1 system을 처리하는 것은 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 나노파티클 방법 및/또는 일시적인 세포 압축 또는 스퀴징 방법을 이용한 것일 수 있다. 또는 상기 진핵 세포에 engineered CRISPR/Cas12f1 system을 처리하는 것은 양이온성 리포좀법, 초산 리튬-DMSO, 지질-매개 형질감염(transfection), 인산칼슘 침전법(precipitation), lipofection, PEI(Polyethyleneimine)-매개 형질감염, DEAE-dextran 매개 형질감염, 및/또는 나노파티클-매개 핵산 전달(Panyam et al., Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조)을 이용한 것일 수 있으나, 이에 제한되는 것은 아니다.
상기 방법은 선택적으로 진핵 세포를 배양하는 것을 더 포함할 수 있다. 이 경우, 상기 배양은 조성물을 처리한 후 진핵 세포를 배양하는 것일 수 있다.
2-4. Method 예시(4)
일 구현예로서, 상기 방법은 대상체에 조성물을 도입(주입)하는 것을 포함하는 표적 핵산 또는 표적 유전자를 변형시키는 방법일 수 있다.
이때, 상기 조성물은
engineered guide RNA 또는 이를 암호화하는 핵산; 및
Cas12f1 단백질 또는 이를 암호화하는 핵산
을 포함할 수 있다.
상기 조성물은 앞서 설명한 "1. Composition" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 engineered guide RNA는 앞서 설명한 "<Engineered guide RNA>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 Cas12f1 단백질은 앞서 설명한 <Engineered CRISPR/Cas14a1 system> 중 "2. Cas12f1(Cas14a1) protein" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 조성물은 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태일 수 있다. 또는 상기 조성물은 핵산 및 단백질 혼합 형태일 수 있다. 상기 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태는 앞서 설명한 "1-1) 핵산 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 핵산 및 단백질 혼합 형태는 앞서 설명한 "1-2) 핵산 및 단백질 혼합 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 바이러스 벡터 형태일 수 있다. 이때, 상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택되는 하나 이상일 수 있다. 이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 바이러스 벡터를 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 각각 포함하는 두 개의 바이러스 벡터를 포함할 수 있다.
다른 일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 비바이러스 벡터 형태일 수 있다. 이때, 상기 비바이러스 벡터는 플라스미드일 수 있다. 이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 플라스미드를 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 각각 포함하는 두 개의 플라스미드를 포함할 수 있다.
또 다른 일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 mRNA을 포함할 수 있다.
또 다른 일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA 및 Cas12f1 단백질이 결합한 engineered CRISPR/Cas12f1(Cas14a1) 복합체를 포함할 수 있다.
상기 대상체는 표적 핵산 또는 표적 유전자를 포함한 게놈을 가질 수 있다. 상기 대상체는 식물, 비인간 동물, 인간 또는 이의 일부 조직일 수 있으나, 이에 제한되지 않는다.
상기 대상체에 조성물을 도입(주입)하는 것은 대상체에 존재하는 표적 핵산 또는 표적 유전자에 engineered CRISPR/Cas12f1(Cas14a1) system이 접촉되기 위한 것일 수 있다.
상기 대상체에 조성물을 도입(주입)하는 것은 미세주입(microinjection), 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 나노파티클 방법 및/또는 일시적인 세포 압축 또는 스퀴징 방법을 이용한 것일 수 있다. 또는 상기 대상체에 조성물을 도입(주입)하는 것은 양이온성 리포좀법, 초산 리튬-DMSO, 지질-매개 형질감염(transfection), 인산칼슘 침전법(precipitation), lipofection, PEI(Polyethyleneimine)-매개 형질감염, DEAE-dextran 매개 형질감염, 및/또는 나노파티클-매개 핵산 전달(Panyam et al., Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조)을 이용한 것일 수 있으나, 이에 제한되는 것은 아니다.
3. Modification of target
본 명세서에서 개시하는 조성물 및 방법을 통해 표적 유전자 또는 표적 핵산을 변형될 수 있다. 보다 구체적으로, 표적 유전자 또는 표적 핵산은 engineered CRISPR/Cas12f1(Cas14a1) system에 의해 변형될 수 있다. 이때, 상기 변형은 i) engineered CRISPR/Cas12f1(Cas14a1) system에 의한 표적 유전자 또는 표적 핵산의 절단 또는 손상 및 ii) 절단된(또는 손상된) 표적 유전자 또는 표적 핵산의 수선 또는 수복을 모두 포함할 수 있다. 이때, 상기 변형은 표적 유전자 또는 표적 핵산 서열의 제거 또는 치환일 수 있다. 또는 상기 변형은 표적 유전자 또는 표적 핵산에 추가적인 핵산 서열의 삽입(insertion)일 수 있다. 또는 상기 변형은 표적 유전자 또는 표적 핵산의 일부 서열 제거되고 추가 서열 삽입되는 인델(insertion and deletion; indel)일 수 있다. 이하에서 상기 변형에 대해 자세히 설명한다.
3-1) 삭제 (Deletion)
본 명세서에서 제공하는 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 서열의 전부 또는 일부가 제거될 수 있다. 상기 제거는 상기 표적 유전자 또는 상기 표적 핵산 내 일부 염기 서열을 제거하는 것을 의미한다. 일 구현예로, 상기 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산, 제1 engineered guide RNA 또는 이를 암호화하는 핵산, 및 제2 engineered guide RNA 또는 이를 암호화하는 핵산을 표적 유전자 또는 표적 핵산을 포함하는 세포 내에 도입하는 것을 포함한다. 이로 인해, 상기 표적 유전자 또는 표적 핵산 내에 특정 서열 부분의 제거가 일어난다.
3-2) 삽입 (Insertion)
본 명세서에서 제공하는 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 녹인(knockin)이 발생할 수 있다. 상기 녹인은 표적 유전자 또는 표적 핵산 서열 내에 추가적인 핵산 서열을 삽입하는 것을 의미한다. 상기 녹인이 일어나려면, engineered CRISPR/Cas12f1(Cas14a1) system 외에 상기 추가적인 핵산 서열을 포함하는 도너가 더 필요하다. 세포 내에서 engineered CRISPR/Cas12f1(Cas14a1) system이 표적 유전자 또는 표적 핵산을 절단하는 경우, 상기 절단된 표적 유전자 또는 표적 핵산의 수복이 일어나게 된다. 이 경우, 상동 재조합 수리(homology directed repairing, HDR)을 이용하여 수복할 수 있으며, 이때, 상기 도너가 상기 수복 과정에 관여하여 상기 추가적인 핵산 서열을 표적 유전자 또는 표적 핵산 내에 삽입한다. 일 구현예로, 상기 방법은 대상 세포 내로 도너를 전달하는 것을 추가적으로 포함할 수 있다. 이때, 상기 도너는 추가 대상 핵산을 포함하며, 상기 도너에 의해 상기 표적 유전자 또는 상기 표적 핵산 내 상기 추가 대상 핵산의 삽입이 유도된다. 이때, 상기 도너를 대상 세포 내로 전달할 때, 전술한 engineered CRISPR/Cas12f1(Cas14a1) system을 처리하는 방법 중 하나의 방법이 사용될 수 있다.
3-3) 삽입 및 삭제 (또는 인델, Insertion and deletion (Indel))
본 명세서에서 제공하는 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 인델(deletion and insertion; indel)이 발생할 수 있다. 상기 인델은 비-상동성 말단-결합 (Non-homologous end joining, NHEJ)에 의해 발생할 수 있다. 일반적으로, NHEJ는 이중 가닥의 파손(예를 들어, 절단)에 의해 형성된 2 개의 적합성 말단이 빈번한 접촉을 반복하여 DNA 내 이중 가닥 파손을 수복 또는 수선하는 방법이다. NHEJ를 이용한 손상된 유전자 또는 핵산의 수복은 NHEJ 수선 부위에 핵산 서열의 일부 삽입 및/또는 결실(삽입결실)을 초래한다. 이러한 삽입 및/또는 결실은 리딩 프레임을 변경시키고, 프레임쉬프트 된 전사체 mRNA를 만들어내고, 결과적으로 넌센스-매개 붕괴(nonsense mediated decay)를 겪거나 정상적인 단백질을 합성하는데 실패함으로써 본래의 기능을 상실하게 된다. 따라서, 표적 유전자 또는 표적 핵산 서열 내 인델이 일어나면, 해당 유전자 또는 핵산이 불활성화될 수 있다. 일 구현예로, 상기 방법의 수행 결과, 표적 유전자 또는 표적 핵산 내 하나 이상의 염기가 결실 및/또는 추가될 수 있다.
3-4) 치환 (Substitution) 또는 염기 편집 (Base editing)
본 명세서에서 제공하는 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 베이스 에디팅이 일어날 수 있다. 이는 표적 유전자 또는 표적 핵산 내 임의의 뉴클레오타이드가 결실 및/또는 삽입되는 인델과는 달리, 핵산 내 하나 이상의 특정 염기를 의도한 대로 변경하는 것을 의미한다. 달리 표현하면, 표적 유전자 또는 표적 핵산 내 특정 위치에서, 미리 의도한 점 돌연변이(point mutation)를 일으키는 것이다. 일 구현예로, 상기 방법의 수행 결과, 표적 유전자 또는 표적 핵산 내 하나 이상의 염기가 다른 염기로 치환될 수 있다.
3-5) 표적 변형에 의한 표현형 (Phenotype by modification of target)
표적 핵산 또는 표적 유전자의 변형은 녹아웃(knockout), 녹다운(knockdown), 녹인(knockin)의 효과를 초래할 수 있다. "녹아웃(knockout)"은 표적 유전자 또는 표적 핵산을 불활성화 시키는 것을 의미하며, "표적 유전자 또는 표적 핵산의 불활성화"는 표적 유전자 또는 표적 핵산의 전사 및/또는 번역이 되지 못하는 상태를 의미한다. 녹아웃을 통해 질병을 유발하는 유전자 또는 비정상적 기능을 가지는 유전자의 전사 및 번역을 억제하여 단백질의 발현을 막을 수 있다. "녹다운(knockdown)"은 표적 유전자 또는 표적 핵산의 전사 및/또는 번역을 감소시키거나 표적 단백질의 발현이 감소하는 것을 의미한다. 녹다운을 통해 과발현 되는 유전자 또는 단백질의 발현을 조절하여 질병의 발생을 막거나 질병을 치료할 수 있다. "녹인(knockin)"은 표적 유전자 또는 표적 핵산에 특정 핵산 또는 유전자를 삽입하는 것을 의미하며, 이때, "특정 핵산 또는 유전자"는 삽입하고자 하는 또는 발현시키기 원하는 유전자 또는 핵산을 의미한다. 녹인을 통해 질병을 유발하는 돌연변이 유전자를 올바르게 교정하거나, 정상 유전자를 삽입하여 정상 유전자의 발현을 유도하여 질병 치료에 이용할 수 있다.
이하, 실시예를 통해 본 발명을 상세히 설명하고자 한다.
이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 범위가 이들의 실시예에 의해 제한되지 않는다는 것은 본 발명이 속한 기술 분야에서 통상의 지식을 가진 자에게 있어 자명할 것이다.
실시예
실험 방법
1. Plasmid vector construction
Cas12f1(Cas14a1)의 인간 코돈 최적화 서열(SEQ ID NO: 487)을 적용하여 chicken b-actin 프로모터, 5'말단 및 3'말단 양쪽에 nuclear-localization signal 서열 및 T2A-linked eGFP를 포함하는 올리고뉴클레오타이드(Bionics)를 합성하였다. 가이드 RNA를 위한 주형 DNA를 합성하고 pTwist Amp 플라스미드 벡터 (Twist Bioscience)에 복제하였다. 필요한 경우, 복제된 벡터는 U6-complementary forward primer 및 protospacer-complementary reverse primer를 사용하여 gRNA-encoding PCR amplicon을 위한 주형으로 사용되었다. dual guide RNA의 구성을 위해, tracrRNA 및 crRNA를 암호화하는 올리고뉴클레오타이드는 BamHI 및 HindIII 제한 효소 (New England Biolabs)를 사용하여 pSilencer 2.0 (ThermoFisher Scientific)에 클로닝 되었다. Engineered CRISPR/Cas14as1 system_3.0(geCas14a_3.0) 벡터는 Cas12f1(Cas14a1)의 인간 코돈 최적화 올리고뉴클레오타이드 및 Cas14a1을 위한 engineered gRNA 서열로 구성된다. SpCas9의 경우, SpCas9의 인간 코돈 최적화 올리고뉴클레오타이드 및 SpCas9을 위한 single guide RNA(sgRNA)는 pSpCas9 (BB) -2A-EGFP (PX458) V2.0 (Addgene)을 백본 플라스미드로 사용하여 Gibson 어셈블리 하였다.
2. Guide RNA engineering
gRNA의 내부 변형(i. stem 5를 구성하는 뉴클레오타이드 서열의 변형, 이하에서 상기 i 변형을 modification 1 (M1)로 기재함, 이때, stem 5를 구성하는 tracrRNA 및/또는 crRNA의 뉴클레오타이드 서열의 변형은 M1-1으로, stem 5를 구성하는 뉴클레오타이드 서열의 삭제 변형은 M1-2으로 기재함; 및 ii. stem 2를 구성하는 뉴클레오타이드 서열의 변형, 이하에서 상기 ii 변형을 modification 2 (M2)로 기재함)은 ApoI 및 BamHI 제한 효소를 사용하여 선형화 된 gRNA 인코딩 벡터에 변형된 서열을 운반하는 합성 올리고뉴클레오타이드(Macrogen)를 클로닝하여 수행되었다. tracrRNA의 5'말단 변형(stem 1를 구성하는 뉴클레오타이드 서열의 변형, 이하에서 상기 변형을 modification 3 (M3)로 기재함)은 U6 프로모터 영역을 표적으로 하는 역방향 프라이머와 tracrRNA의 5'말단 영역을 표적으로 하는 정방향 프라이머를 사용하여 canonical 또는 engineered 템플릿 플라스미드 벡터의 PCR 증폭에 의해 수행되었다. PCR 증폭은 Q5 Hot Start high-fidelity DNA polymerase (NEB)를 이용하여 수행되었으며, PCR 산물은 KLD Enzyme Mix (NEB)를 사용하여 ligation 시켰다. ligation 된 생성물을 사용하여 DH5α E. coli 세포를 형질 전환시켰다. 돌연변이 유발은 Sanger 시퀀싱 분석에 의해 확인되었다. 변형된 플라스미드 벡터는 NucleoBond ® Xtra Midi EF kit (MN)를 사용하여 정제되었다. 정제된 플라스미드 1 μg을 T7 RNA 중합 효소 (NEB) 및 NTP (Jena Bioscience)를 사용하여 mRNA 합성을 위한 주형으로 사용하였다. 가이드 RNA는 Monarch® RNA cleanup kit (NEB)를 사용하여 정제하고 액체 질소에 보관하기 전에 cryogenic vial에 분주하였다.
crRNA의 3'말단 변형 (U-rich tail 부가, 이하에서 상기 U-rich tail 부가 변형을 modification 4 (M4)로 기재함)은 염기 서열 변형된 프라이머와 canonical gRNA 플라스미드 벡터가 있는 상태에서 Pfu PCR Master Mix5 (Biofact)를 사용하여 수행되었다. PCR 앰플리콘은 HiGeneTM Gel&PCR Purification System (Biofact)을 사용하여 정제하였다.
3. Human cell culture and transfection
HEK-293T 세포 (ATCC CRL-11268)를 5 % CO2 인큐베이터에서 37 ℃에서 10 % heat-inactivated FBS (Corning) 및 1 % 페니실린/스트렙토 마이신을 보충된 DMEM에서 배양하였다. 세포 형질 감염은 electroporation 또는 lipofection 방법을 통해 수행되었다. Electroporation을 위해, 2 - 5 μg의 Cas14a1, AsCpf1 또는 SpCas9을 암호화하는 핵산을 포함하는 플라스미드 벡터를 2 - 5 μg의 gRNA 암호화하는 DNA와 함께 Neon transfection system (Invitrogen)을 사용하여 4 X 105 HEK-293T 세포로 형질 감염시켰다. Electroporation 조건은 다음과 같습니다: 1,300V, 10mA, 3 펄스. Lipofection을 위해, 6 - 15 μL FuGene 시약 (Promega)을 2 - 5 μg의 Cas14a1 암호화하는 핵산을 포함하는 플라스미드 벡터 및 1.5 - 5 μg의 PCR 앰플리콘과 15 분 동안 혼합하였다. 혼합물(300 μL)을 1.5 ml DMEM 배지에 첨가하고, 여기서 1 X 106 세포를 형질 감염 1 일 전에 플레이팅하고, 세포를 혼합물의 존재하에 72 - 96 시간 동안 배양시켰다. 배양 후, 세포를 수확하고, PureHelixTM genomic DNA preparation kit (NanoHelix)를 사용하거나 MaxwellTM RSC nucleic acid isolation workstation (Promega)을 사용하여 genomic DNA를 준비하였다. 형질 감염에 대한 표적의 정보는 아래의 표 3에 정리하였다.
Target Name | Gene Name | Protospacer sequence with PAM sequence (SEQ ID NO) | Chromosome | Location a |
Target_1 | Intergene | TTTGCACACACACAGTGGGCTACC (SEQ ID NO: 488) | chr3 | 120228353 |
Target_2 | KRT1 | TTTGCATCCCCAGGACACACACAC (SEQ ID NO: 489) | chr12 | 52679076 |
Target_3 | Intergene | TTTAAGAACACATACCCCTGGGCC (SEQ ID NO: 490) | chr5 | 171540057 |
Target_a | PGBD2 | TTTGACTCAGCAATCCTATTACTG (SEQ ID NO: 491) | chr1 | 248902470 |
TTTATATTCCTGTGGGTATATGCC (SEQ ID NO: 492) | ||||
Target_b | LINC02045 | TTTAAGAGGTGATTAGGTCATGGC (SEQ ID NO: 493) | chr3 | 148270685 |
TTTAATCCATTCATGAGGGTGGTG (SEQ ID NO: 494) | ||||
Target_c | Intergene | TTTAGCTCAAATCTGTACTACTAA (SEQ ID NO: 495) | chr3 | 175897710 |
TTTATTATTATAGTGTGTACTTGA (SEQ ID NO: 496) | ||||
Target_d | LOC105379078 | TTTATGTCCTCATAGCTTACCTTC (SEQ ID NO: 497) | chr5 | 91689633 |
TTTAATTGTATGTTCTCACTCATA (SEQ ID NO: 498) | ||||
Target_e | LOC100133077 | TTTGGGTCTGTGGCTGTTGGGCTG (SEQ ID NO: 499) | chr9 | 137891128 |
TTTAGAGCCCATCTCAGATCCCTG (SEQ ID NO: 500) | ||||
Target_f | CNTN5 | TTTACCAGTGAAGATATAACATTA (SEQ ID NO: 501) | chr11 | 100207471 |
TTTAGTGAGGCTTCTTAAGATGTC (SEQ ID NO: 502) | ||||
Target_g | HEPHL1 | TTTGCTGCTGGTAACAAGGTCATA (SEQ ID NO: 503) | chr11 | 94033294 |
TTTAGATCTGAGACCCAGCTGCTC (SEQ ID NO: 504) | ||||
Target_h | CFAP97D2 | TTTGTCCTTGACCACGGCATCAGC (SEQ ID NO: 505) | chr13 | 114162274 |
TTTAAGTGGGAATAATATAGTTCC (SEQ ID NO: 506) | ||||
Target_i | Intergene | TTTGAAGACATCTTGCTGTCAGAC (SEQ ID NO: 507) | chr13 | 105892482 |
TTTGTGTATAATTATTCAGAGTAG (SEQ ID NO: 508) | ||||
Target_j | TAOK1 | TTTGGCATCAAGTTAACATCACAC (SEQ ID NO: 509) | chr17 | 29544381 |
TTTAGCACTGAGGCTTGAGACTTG (SEQ ID NO: 510) |
a Listed information is based on the Genome Reference Consortium Human Build 38 patch release 11 (GRCh38.p11).
4. Measurement of indel efficiency
PureHelixTM genomic DNA preparation kit (NanoHelix)를 사용하여 HEK-293T 세포에서 genomic DNA를 분리하였다. Target-specific primer는 합성되었고, 제조업체의 지침에 따라 KAPA HiFi HotStart DNA polymerase (Roche)가 있는 상태에서 protospacer-함유 영역을 증폭하는 데 사용되었다. 생성된 PCR 앰플리콘은 Illumina TruSeq HT dual index로 라벨링 되었다. 최종 PCR 산물은 Illumina iSeq 100을 사용하여 150-bp paired-end sequencing 하였다. Indel frequency는 MAUND (https://github.com/ibs-cge/maund)에 의해 계산되었다.
5. Recombinant Cas14a1
Cas12f1 유전자는 변형된 pMAL-c2x 플라스미드 벡터 (Addgene)로 클로닝되었고,상기 벡터 구축물을 사용하여 BL21 (DE3) E. coli 세포를 형질 전환하였다. E. coli 형질 전환체 콜로니는 0.7의 광학 밀도에 도달할 때까지 LB broth에서 37 ℃에서 성장시켰다. 상기 세포를 0.1 mM isopropylthio-β-D-galactoside의 존재하에 30 ℃에서 밤새 배양한 후, 30 분 동안 3,500g에서 원심 분리하여 수집하였다. 수집된 세포를 20mM Tris-HCl (pH 7.6), 500mM NaCl, 5mM β-mercaptoethanol, 5 % 글리세롤에 재현탁시켰다. Cell lysate은 초음파 처리하고, 15,000g에서 30 분 동안 원심 분리한 다음 0.45μm 주사기 필터 (Millipore)를 통해 여과하여 준비하였다. cleared lysate를 FPLC 정제 시스템 (AKTA Purifier, GE Healthcare)을 사용하여 Ni2+- affinity column에 로드하였다. Ni2+- affinity column에 결합된 분획은 80-400 mM imidazole gradients에서 20 mM Tris-HCl (pH 7.5)로 용출 되었다. 용출된 단백질은 1mg의 TEV protease 로 6 시간 동안 처리되었다. 절단된 단백질은 0.15 - 1.6 M NaCl의 선형 구배로 Heparin column에서 정제되었다. 재조합 Cas14a1 단백질은 20mM Tris pH7.6, 150mM NaCl, 5mM β-mercaptoethanol, 5 % 글리세롤에 대해 투석 되었다. 투석 된 단백질을 0.5 - 1.2M NaCl의 선형 구배로 monoS column (GE Healthcare)에서 다시 정제하였다. 선택된 분획을 풀링하고 20mM Tris pH7.6, 150mM NaCl, 5mM β-mercaptoethanol, 5 % 글리세롤에 대해 투석하였다. 수득된 단백질의 농도는 bovine serum albumin을 표준으로 사용하여 coomassie blue-stained SDS-PAGE 겔에서 전기구형적으로(electropherometrically) 측정되었다.
6. Off-target analysis using Digenome-seq method
Genome-wide off-target 분석은 Digenome-seq 방법을 통해 수행되었다. 간단히 설명하면, genomic DNA를 HEK-293T 세포에서 분리하고, 분리한 genomic DNA에 10μg Cas12f1 또는 AsCas12a 재조합 단백질과 900nM engineered guide RNA를 실온에서 2 시간 동안 사전 인큐베이션하여 형성된 ribonucleoprotein complex를 처리하였다. genomic DNA의 분해(digestion)는 100mM NaCl, 10mM MgCl2, 100μg/ml BSA, 50mM Tris-HCl (pH 7.9)를 포함하는 반응 버퍼에서 37 ℃에서 8 시간 동안 수행되었다. 분해된 genomic DNA는 RNase A (50μg/ml)로 처리한 후 DNeasy Tissue kit (Qiagen)를 사용하여 정제하였다. 정제된 genomic DNA는 Illumina HiSeq X Ten Sequencer를 사용하여 30x 내지 40x의 sequencing depth에서 전체 게놈 시퀀싱 (whole genome sequencing; WGS)에 적용되었다. DNA cleavage score는 방정식에 따라 WGS 데이터를 사용하여 전체 게놈에 걸쳐 각 뉴클레오타이드 위치에 할당되었다. 2.5의 컷오프 값은 온 타겟 시퀀스에서 6 개 이하의 불일치 기준이 추가된 Digenome-seq 프로그램 (https://github.com/chizksh/digenome-toolkit2)을 사용하여 잠재적 인 오프 타겟을 스크리닝 하기 위해 할당되었다. 선별된 잠재적인 오프-타겟은 HEK293-T 세포로의 가이드 RNA와 함께 Cas14a1을 처리한 후 targeted deep sequencing 분석에 의해 검증되었다.
7. Droplet digital PCR
Guide RNA 또는 genomic DNA는 각각 RNeasy Miniprep kit (Qiagen) 또는 PureHelixTM genomic DNA preparation kit (NanoHelix)를 사용하여 HEK-293T 세포에서 추출되었다. Guide RNA의 정량화를 위해, cDNA 합성에 crRNA-specific primer를 사용하였으며, 합성된 cDNA는 정량적 실시간 PCR을 주형으로 사용하였다. 엑손 결실은 iCycler (Bio-Rad)에서 QuantiTect SYBR Green RT-PCR kit (Qiagen)를 사용하여 분석되었다.
8. Quantitative analysis of gRNA expression
Canonical 또는 engineered gRNA를 암호화하는 PCR 앰플리콘 (3μg)을 Neon transfection system (Invitrogen)을 사용하여 HEK293-T 세포로 형질 감염시키고, 형질 감염 2 일 후에 세포를 수확하였다. 수확한 세포로부터 maxwell® RSC miRNA Tissue Kit (Promega, AS1460)를 사용하여 총 RNA를 수득하였다. 수득한 RNA를 5μg의 RNA 제제를 E. coli Poly(A) Polymerase (NEB, M0276)와 함께 37 ℃에서 30분 동안 배양하여 폴리아데닐화 시켰다. RNA를 Monarch® RNA Cleanup Kit (NEB, T2050)로 정제하였다. 500 μg의 poly(A)-tailed RNA를 3'말단에 T6 서열과 어댑터 서열을 전달하는 RT-specific primer의 존재하에 SuperScript IV Reverse Transcriptase (Invitrogen)를 사용하여 역전사시켰다. Guide RNA는 어댑터 및 gRNA-specific primer를 사용하여 PCR 증폭되었다. PCR 산물을 2 % 아가 로스 겔에서 분리하였다.
9. Production of AAV vectors and transduction
인간 코돈 최적화된 Cas12f1 유전자 및 sgRNA 서열은 역 말단 반복을 가지는 AAV 벡터 플라스미드로 클로닝되었다. 상기 Cas12f1 유전자는 nuclear localization signal 및 자가 절단 T2A 서열을 통해 enhanced green fluorescent protein (eGFP) 유전자와 연결된다. Cas12f1 및 sgRNA 전사는 각각 chicken -actin 프로모터 및 U6 프로모터에 의해 유도되었다. rAAV2 벡터를 생산하기 위해, pAAV-ITR-sgRNA-Cas12f1 또는 pAAV-ITR-sgRNA-SaCas9; pAAVED2/9; 및 헬퍼 플라스미드를 HEK-293T 세포에 형질주입하였다. 상기 형질주입된 HEK-293T 세포를 2 % FBS가 포함된 DMEM에서 배양하였다. PEIpro (Polyplus-transfection)와 PEI coprecipitation 및 HEK-293T 세포에서 동일한 몰비로 플라스미드를 사용한 삼중-형질주입(triple-transfection)을 사용하여 재조합 pseudotyped AAV vector stock을 생성하였다. 72 시간의 인큐베이션 후, 세포를 용해시키고 particle을 iodixanol (Sigma-Aldrich) step-gradient ultracentrifugation를 이용해 정제하였다. 벡터 게놈의 수는 정량적 PCR에 의해 결정되었다. HEK-293T 세포는 정량적 PCR에 의해 결정된 바와 같이 1, 5, 10, 50 및 100의 상이한 감염 다중도 (multiplicity of infection; MOI)에서 rAAV2-Cas12f1-sgRNA 또는 rAAV2-SaCas9-sgRNA로 감염되었다. 형질 도입된 세포는 2 % FBS가 있는 DMEM에서 2 주까지 유지되었다. 다른 time points에서 genomic DNA의 분리를 위해 세포를 수집하였다.
10. Statistical analysis
two-tailed Student's t-test에 의한 통계적 유의성 검증이 Sigma Plot software (ver. 14.0)에 의해 수행되었다. 0.05 미만의 p-value가 나타나는 경우 통계적으로 유의한 것으로 간주하였으며, p-value는 각 도면에 도시되어 있다. 박스 플롯(box plot) 및 점 플롯(dot plot)에서 데이터 포인트들은 전체 값 범위를 나타내며, 각 박스는 4분위 범위 (25-75 percentile)에 걸쳐 있다. 중위값 및 평균값은 각각 검은색 및 빨간색 평행선으로 표시되었다. 모든 점 플롯(dot plot) 및 바 플롯(bar plot) 데이터의 에러바들은 Sigmaplot (v. 41.0)을 사용하여 도시되었으며, 각 데이터의 표준편차 값을 의미한다. 통계적 방법을 기반으로 샘플 크기를 미리 결정하지는 않았다. Cas 유형에 대한 블라인드 정보로 대규모 검증이 수행되었다.
11. In vitro cleavage assay
Recombinant Cas14 (2.5 μg)와 Canonical 및 M1-1/4, M1-1/3/4의 sgRNA를 각각 2μg을 인큐베이션하여 RNA complex를 형성시켰다. 이를 Intergenic22 서열 (5'-TTTAAGAACACATACCCCTGGGCC-3' (SEQ ID NO: 490))을 포함하고 있는 플라즈미드 벡터 (5 μg)와 37℃에서 3 시간 동안 반응시켜 In vitro cleavage assay를 진행하였다. Positive control로써 Apa1 restriction enzyme cut을 진행하였다. Cleavage가 된 DNA를 Ultrasonicator인 Covaris (M220)를 가지고 다음의 조건에서 DNA shearing을 진행하였다. Peak incident power: 50W, Duty factor: 20%, Cycles per Burst: 200 cpb, Treatment time: 110 sec. 조각난 DNA를 DNA purification kit를 이용하여 정제하였다. 정제된 DNA를 T4 ligase를 이용하여 End-filling을 수행하였다. 그 후 NEBNext® Ultra?? II DNA Library Prep Kit for Illumina® (NEB, # E7103) kit와 NEBNext® Multiplex Oligos for Illumina® (Dual Index Primers Set 1) (NEB, # E7600) kit를 이용하여 DNA library를 제작하였다. qPCR을 수행하여 각 샘플의 농도를 동일하게 조절하였다. 제작된 library를 Illumina iSeq 100을 사용하여 150-bp paired-end sequencing 하였다. 분석된 서열은 IGV 프로그램으로 alignment하였다.
실시예 1. Guide RNA engineering
선행연구(Harrington et al., Science 362, 839-842 (2018), Tautvydas Karvelis et al., Nucleic Acids Research 48, 5016-5023 (2020))를 통해 CRISPR/Cas14a1 system이 단일 가닥 DNA (ssDNA)을 절단하는 것처럼 보고되었고, CRISPR/Cas14a1 system 자체가 진핵 세포의 게놈 편집에 적합하지 않을 수 있다고 가정하였다. 이러한 문제를 인식하고, CRISPR/Cas12f1 system을 진핵 세포에 적용하기 위해, CRISPR/Cas14a1 system을 위한 가이드 RNA(gRNA)를 최적화하는 연구를 수행하였다.
gRNA 엔지니어링은 CRISPR/Cas14a1 system의 gRNA를 구성하는 tracrRNA 및 crRNA 전체에 걸쳐 4 개의 변형 부위 (modification site; MS)를 다음과 같이 지정하였다 (도 2):
1) MS1 - tracrRNA의 penta-uridinylate (UUUUU) 서열을 포함하는 stem 5를 구성하는 영역 (wildtype tracrRNA의 변형 대상 영역 1에 대응됨) 및 이에 대응되는 crRNA의 영역;
2) MS2 - stem 2를 구성하는 tracrRNA의 내부 영역 (wildtype tracrRNA의 변형 대상 영역 4에 대응됨);
3) MS3 - stem 1을 구성하는 tracrRNA의 5' 말단 영역 (wildtype tracrRNA의 변형 대상 영역 5에 대응됨); 및
4) MS4 - crRNA의 3'말단 영역.
gRNA 엔지니어링은 MS1, MS2, MS3 및 MS4에서 각각 개별적으로 수행하거나 다양한 조합으로 수행하여 매우 효율적인 CRISPR-Cas14a1 시스템을 도출하였다. 안정된 tracrRNA-crRNA 복합체의 형성을 위해 일부 engineered guide RNA의 경우, tracrRNA와 crRNA를 linker인 GAAA 서열로 연결한 단일 가이드 RNA (single guide RNA; sgRNA)로 사용하였다.
실시예 2. Engineered guide RNA (MS1)
선행연구(Harrington et al., Science 362, 839-842 (2018)에 의해 보고된 Cas14a1에 대한 canonical gRNA 서열을 면밀히 조사하였다. 그 결과, wildtype tracrRNA (SEQ ID NO: 1)가 진핵 세포에서 정상적으로 전사되기 어려운 부적절한 서열을 포함하고 있음을 확인하였다. wildtype tracrRNA는 tracrRNA의 5'말단에서 3'말단 방향으로 138번째부터 142번째 위치에 내부 UUUUU(U5) 서열을 포함한다 (도 1). 따라서, tracrRNA를 전사하기 위해서 tracrRNA를 암호화하는 핵산은 연속하는 5 개의 티미딘(T5) 서열을 포함하게 된다. 이때, 연속하는 5 개의 티미딘(T5) 서열은 U6 프로모터 아래에서 종결 서열로 작용할 수 있으며, 이로 인해 tracrRNA이 정상적으로 전사되지 못하여 불완전한 tracrRNA가 생성될 가능성이 높다. 따라서 본 발명자는 tracrRNA의 penta-uridinylate (UUUUU) 서열을 포함하는 stem 5를 구성하는 영역 (MS1)을 gRNA 엔지니어링을 위한 핫스팟으로 간주하였다.
실시예 2-1. Engineered tracrRNA (M1-1): tracrRNA의 penta-uridinylate (UUUUU) 서열을 포함하는 stem 5를 구성하는 영역 변형
이하에서, tracrRNA 내에 UUUUU(U5) 서열을 포함하는 영역이 변형된 경우 M1-1 또는 MS1 엔지니어링으로 표시하였다. 즉, 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 경우, tracrRNA는 M1-1 변형을 포함하는 engineered tracrRNA 또는 engineered tracrRNA (M1-1)로 표시하였다. 또한, 앞서 서술한 상세한 설명을 기초로, MS1 엔지니어링에 의해 생성된 engineered tracrRNA(M1-1)는 앞서 1. Engineered tracrRNA 설명 중 "1-1) 제1 서열"섹션에 기재된 제1 서열(연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열)을 가질 수 있다(도 4A).
종결 신호로 작용할 수 있는 연속된 다섯 개 이상의 유리딘 서열를 제거하기 위해 각각의 유리딘(U)을 유리딘 외의 다른 뉴클레오타이드(A, C 또는 G)로 치환하여 engineered tracrRNA를 생성하였다 (표 4). 생성된 engineered tracrRNA를 이용하여 HEK293T 세포에서 내인성 표적 (Target 1)에 대한 인델 효율을 조사하였다. Deep sequencing 분석 결과, 각각의 치환이 최소 4 배의 인델 효율 증가를 가져왔고, 특히, 141번째 유리딘(U141)이 시티딘(C)로 치환되었을 때 인델 효율이 약 50 배 정도 현저히 증가함을 확인하였다(도 11). 시티딘은 종결 신호를 제거할 뿐만 아니라 그 위치에 구조적으로 적합하도록 작용한 것으로 추측된다.
Label | Sequence (5' to 3') | SEQ ID NO |
Wildtype tracrRNA (canonical tracrRNA) |
CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCA AUUCUGCACAA |
1 |
U138A | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAAUUUUCCUCUCCA AUUCUGCACAA |
511 |
U138G | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUUUUCCUCUCCA AUUCUGCACAA |
512 |
U138C | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCACUUUUCCUCUCCA AUUCUGCACAA |
513 |
U139A | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUAUUUCCUCUCCA AUUCUGCACAA |
514 |
U139G | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUGUUUCCUCUCCA AUUCUGCACAA |
515 |
U139C | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUCUUUCCUCUCCA AUUCUGCACAA |
516 |
U140A | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUAUUCCUCUCCA AUUCUGCACAA |
517 |
U140G | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUGUUCCUCUCCA AUUCUGCACAA |
518 |
U140C | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUCUUCCUCUCCA AUUCUGCACAA |
519 |
U141A | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUAUCCUCUCCA AUUCUGCACAA |
520 |
U141G | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGUCCUCUCCA AUUCUGCACAA |
521 |
U141C | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUCUCCUCUCCA AUUCUGCACAA |
271 |
U142A | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUACCUCUCCA AUUCUGCACAA |
522 |
U142G | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUGCCUCUCCA AUUCUGCACAA |
523 |
U142C | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUCCCUCUCCA AUUCUGCACAA |
524 |
더불어, 추가적인 치환에 의해 효과를 확인하기 위해, 141번째 U를 C로 고정하고, 나머지 유리딘을 도 12를 기초로 다양하게 치환하여 조합한 16가지의 engineered tracrRNA을 비교하였다(표 5). 비교 분석한 결과, 대부분의 engineered tracrRNA은 UUUUU를 포함하는 canonical tracrRNA(즉, 야생형 tarcrRNA)보다 높은 인델 효율을 보였다. 특히, tracrRNA에서 UUUUU 서열을 'GUGCU'서열로 대체한 경우, 인델 효율이 더욱 증가하는 것으로 나타났다(도 12).
Label | Sequence (5' to 3') | SEQ ID NO |
UUUUU (Wildtype tracrRNA) |
CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUG CACAA |
1 |
UUUCU | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUCUCCUCUCCAAUUCUG CACAA |
271 |
GUUCU | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUUCUCCUCUCCAAUUCUG CACAA |
525 |
UCUCU | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUCUCUCCUCUCCAAUUCUG CACAA |
526 |
UUGCU | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUGCUCCUCUCCAAUUCUG CACAA |
527 |
UUUCC | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUCCCCUCUCCAAUUCUG CACAA |
528 |
GCUCU | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGCUCUCCUCUCCAAUUCUG CACAA |
529 |
GUGCU | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUG CACAA |
270 |
GUUCC | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUUCCCCUCUCCAAUUCUG CACAA |
530 |
UCGCU | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUCGCUCCUCUCCAAUUCUG CACAA |
531 |
UCUCC | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUCUCCCCUCUCCAAUUCUG CACAA |
532 |
UUGCC | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUGCCCCUCUCCAAUUCUG CACAA |
533 |
GCGCU | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGCGCUCCUCUCCAAUUCUG CACAA |
534 |
GCUCC | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGCUCCCCUCUCCAAUUCUG CACAA |
535 |
GUGCC | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCCCCUCUCCAAUUCUG CACAA |
536 |
UCGCC | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUCGCCCCUCUCCAAUUCUG CACAA |
537 |
GCGCC | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGCGCCCCUCUCCAAUUCUG CACAA |
538 |
실시예 2-2. Engineered crRNA (M1-1): engineered tracrRNA (M1-1)에 대응되는 crRNA의 변형
더불어, 인델 효율을 극대화하기 위해, 상기 engineered tracrRNA(M1-1)에 대응되는 crRNA를 조작하였다. 이하에서, 상기 engineered tracrRNA(M1-1)에 따라 변형되는 crRNA는 engineered crRNA(M1-1)로 표시하였다(도 4A). 또한, 앞서 서술한 상세한 설명을 기초로, engineered crRNA(MS1-1)는 앞서 2. Wildtype crRNA or Engineered crRNA 설명 중 "2-1) 제6 서열"섹션에 기재된 제6 서열(5'-ACGAA-3'서열을 포함하지 않는 서열)을 가질 수 있다.
상기 engineered tracrRNA(M1-1)의 5'-GUGCU-3' 서열에 대응되는 crRNA의 최적의 서열을 찾기 위해, 앞서 tracrRNA의 조작 방법과 유사한 방법을 이용해 다양한 서열로의 치환에 따른 효과를 분석하였다. 상기 engineered tracrRNA(M1-1)의 5'-GUGCU-3' 서열에 대응되는 crRNA의 5'-ACGAA-3'서열의 각각의 뉴클레오타이드를 다양한 뉴클레오타이드로 치환하고 다양하게 조합하여 engineered crRNA를 생성하였다. 생성된 engineered crRNA를 이용하여 HEK293T 세포에서 세 개의 표적 유전자에 대한 인델 효율을 확인한 결과, 5'-AGCAA-3' 서열이 tracrRNA의 5'-GUGCU-3' 서열에 대한 최적의 대응 서열임을 확인하였다 (도 13 내지 15).
또한, HEK293T 세포에서 세 개의 표적 유전자에서 MS1 변형을 포함한 engineered gRNA의 효과를 확인하였다. 그 결과, crRNA의 단독 변형(즉, engineered crRNA(M1-1)는 5'-AGCAA-3' 서열을 포함하며, 즉, 5'-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 539)을 포함함)은 Cas12f1에 의한 인델 활성에 영향을 주지 않았지만, tracrRNA의 단독 변형(즉, engineered tracrRNA(M1-1)은 5'-GUGCU-3' 서열을 포함하는 SEQ ID NO: 270 서열임)은 모든 표적 유전자에 대해 인델 효율을 현저히 증가시켰다. 또한, 상기 tracrRNA과 crRNA를 함께 변형시킨 결과, tracrRNA을 단독 변형한 경우보다 인델 효율의 더욱 증가하였다 (도 16).
간단히 정리하면, 상기 tracrRNA 및 crRNA의 engineering 결과, engineered tracrRNA(M1-1)는 5'-UUUUU-3' 서열 대신에 5'-GUGCU-3' 서열을 포함하고, engineered crRNA(M1-1)는 5'-ACGAA-3' 서열 대신에 5'-AGCAA-3' 서열을 포함하는 경우, 인델 효과가 극대화되는 것을 확인하였다. 이하에서, engineered tracrRNA(M1-1) 및 engineered crRNA(M1-1)를 포함하는 engineered gRNA는 engineered gRNA(M-1)로 표시하였다.
실시예 2-3.
Engineered tracrRNA(M1-2) and engineered crRNA(M1-2): Truncation of tracrRNA-crRNA complementary sequence in stem 5
앞선 실시예 2-1 및 2-3에 의해 생성된 engineered tracrRNA(M1-1) 및 engineered crRNA(M1-1)을 추가로 조작하였다. Cas14a1을 위한 gRNA는 tracrRNA와 crRNA로 구성되며 긴 서열을 가진다. 이에, 본 발명자는 indel 효율을 감소시키지 않으면서 gRNA의 길이를 줄이기 위해 gRNA의 crRNA-tracrRNA 상보적으로 결합하는 영역, 즉, stem 5를 구성하는 영역(MS1)을 추가 변형하였다. 이는 향후 임상 적용을 고려한 것으로, 길이가 200nt 이상인 sgRNA의 화학적 합성은 임상 환경에서 부담이 될 수 있다. 이하에서, tracrRNA-crRNA 상보적으로 결합하는 영역, 즉, stem 5를 구성하는 영역에 일부 염기 쌍 서열을 삭제하는 경우 M1-2로 표시하였다. 즉, tracrRNA의 3'말단 및 crRNA의 5'말단에 존재하는 상보적으로 결합하는 서열이 전체 또는 일부가 삭제된 경우, tracrRNA는 engineered tracrRNA(M1-2)로 표시하고, crRNA는 engineered crRNA(M1-2)로 표시하거나, 또는 engineered sgRNA(M1-2)로 표시한다. 또한, MS1의 변형을 모두 포함한 경우, 즉, M1-1 및 M1-2를 모두 포함한 경우, engineered tracrRNA(M1) 및 engineered crRNA(M1)으로 표시하거나, 또는 engineered gRNA(M1)로 표시한다(도 4B).
인델 효율에 미치는 영향을 확인하기 위해, 다양한 길이의 stem 5(tracrRNA-crRNA 상보적으로 결합하는 영역)를 가지는 sgRNA를 생성하여 테스트하였다 (표 6, 도 17). 그 결과, tracrRNA-crRNA 상보적으로 결합하는 영역이 삭제된 sgRNA는 거의 인델 효율이 유지되었다.
Label | Sequence (5' to 3') | SEQ ID NO |
M1-1(sgRNA) | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAG GGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAA UGAAGGAAUGCAAC |
540 |
Δ6bp(Δ13nt) | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAG GGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUCCAAUUCGAAAGAACCCGAAUAGAGCAAUGAAGGAAUGCAA C |
541 |
Δ12bp(Δ25nt) | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAG GGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUCGAAAGAAUAGAGCAAUGAAGGAAUGCAAC |
542 |
Δ18bp(Δ37nt) | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAG GGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UGAAAAGCAAUGAAGGAAUGCAAC |
543 |
실시예 3. Engineered guide RNA (MS1 and MS2): Truncation of tracrRNA-crRNA complementary sequence in stem 2 (engineered tracrRNA(M2))
Cas14a1은 다른 class II CRISPR syetem에 비해 tracrRNA의 큰 크기로 인해 매우 긴 gRNA를 가진다. 이에 본 발명자는 Cas12f1의 컴팩트한 크기를 고려할 때 전체 tracrRNA 서열이 Cas12f1과의 상호 작용에 참여할 가능성이 낮다는 가설을 세웠다. 이 가설을 확인하기 위해, tracrRNA의 stem 2를 구성하는 영역(MS2)을 추가 변형하였다. 이는 향후 임상 적용을 고려한 것으로, 길이가 200nt 이상인 sgRNA의 화학적 합성은 임상 환경에서 부담이 될 수 있다. 이하에서, stem 2를 구성하는 영역에 일부 염기 쌍 서열을 삭제하는 경우 M2로 또는 MS2 엔지니어링으로 표시하였다. 즉, tracrRNA의 3'말단 및 crRNA의 5'말단에 존재하는 상보적으로 결합하는 서열이 전체 또는 일부가 삭제된 경우, tracrRNA는 engineered tracrRNA(M2)로 표시하거나, 또는 engineered gRNA(M2)로 표시한다. 또한, MS1의 일부 변형을 포함한 경우, 즉, M1-1를 포함한 경우, engineered tracrRNA(M1-1/2)로 표시하거나, 또는 engineered gRNA(M1-1/2)로 표시한다. 또한, MS1의 변형을 모두 포함한 경우, 즉, M1-1 및 M1-2를 포함한 경우, engineered tracrRNA(M1/2)로 표시하거나, 또는 engineered gRNA(M1/2)로 표시한다(도 5).
인델 효율에 미치는 영향을 확인하기 위해, 다양한 길이의 stem 2를 가지는 sgRNA를 생성하여 테스트하였다 (표 7, 도 18). 그 결과, tracrRNA-crRNA 상보적으로 결합하는 영역이 삭제된 sgRNA는 거의 인델 효율이 유지되었다.
Label | Sequence (5' to 3') | SEQ ID NO |
M1-1(sgRNA) | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGG GAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAG AAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCU CCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAA UGCAAC |
540 |
Δ3bp(Δ6nt) | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUUAGAUUAG AACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUU CUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC |
544 |
Δ6bp(Δ13nt) | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUUAGGAACUUGA GUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUC GGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACA AGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC |
546 |
Δ10bp(Δ21nt) | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGU GGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUA ACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUU GCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC |
547 |
실시예 4. Engineered guide RNA (MS1 and MS3): 5'-Truncation of tracrRNA (engineered tracrRNA(M3))
Cas14a1은 다른 class II CRISPR syetem에 비해 tracrRNA의 큰 크기로 인해 매우 긴 gRNA를 가진다. 이에 본 발명자는 Cas12f1의 컴팩트한 크기를 고려할 때 전체 tracrRNA 서열이 Cas12f1과의 상호 작용에 참여할 가능성이 낮다는 가설을 세웠다. 이 가설을 확인하기 위해, tracrRNA의 5'말단 영역(stem 1을 구성하는 tracrRNA의 5' 말단 영역)을 삭제하도록 tracrRNA을 설계하였다. 이하에서, tracrRNA의 5'말단에 일부 서열을 삭제하는 경우 M3 또는 MS3 엔지니어링으로 표시하였다. 즉, tracrRNA의 5'말단에 일부 서열이 삭제된 경우, tracrRNA는 MS3 변형을 포함하는 engineered tracrRNA 또는 engineered tracrRNA(M3)로 표시하였다. 또한, MS1의 일부 변형을 포함한 경우, 즉, M1-1를 포함한 경우, engineered tracrRNA(M1-1/3)로 표시하거나, 또는 engineered gRNA(M1-1/3)로 표시한다. 또한, MS1의 변형을 모두 포함한 경우, 즉, M1-1 및 M1-2를 포함한 경우, engineered tracrRNA(M1/3)으로 표시하거나, 또는 engineered gRNA(M1/3)으로 표시한다(도 6).
tracrRNA의 5'말단 영역을 삭제하도록 설계한 engineered tracrRNA(M1-1/3)를 이용해 실험한 결과 (표 8), 20nt가 삭제된 tracrRNA를 이용한 경우 인델 효율이 현저히 증가하는 것을 확인하였다 (도 19).
Label | Sequence (5' to 3') | SEQ ID NO |
M1-1 | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUA GAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUC UUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA |
270 |
-7nt | GAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUG AGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAA AGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA |
548 |
-14nt | UGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAG GUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACC CUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA |
549 |
-20nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA |
308 |
실시예 5. Engineered guide RNA (MS1 and MS4): Addition of 3'-poly-uridinylates in crRNA (engineered crRNA(M4))
이전 연구에서 crRNA에 U-rich tail 서열을 부가하는 변형을 통해 CRISPR/Cas12f1 system의 향상된 인델 효율을 확인한바 있다(PCT/KR2020/014961 참고). 이를 기초로 crRNA의 3'말단에 U-rich tail 서열을 부가하는 변형을 설계하였다. crRNA의 3'말단에 U-rich tail 서열을 포함하는 경우 M4 또는 MS4 엔지니어링으로 표시하였다. 즉, crRNA의 3'말단에 U-rich tail 서열이 부가된 경우, crRNA는 MS4 변형을 포함하는 engineered crRNA 또는 engineered crRNA(M4)로 표시하였다. 또한, MS1의 일부 변형을 포함한 경우, 즉, M1-1를 포함한 경우, engineered crRNA(M1-1/4)로 표시하거나, 또는 engineered gRNA(M1-1/4)로 표시한다. 또한, MS1의 변형을 모두 포함한 경우, 즉, M1-1 및 M1-2를 포함한 경우, engineered crRNA(M1/4)으로 표시하거나, 또는 engineered gRNA(M1/4)으로 표시한다(도 7).
실시예 2의 engineered tracrRNA(M1-1)과 더불어 U-rich tail 서열이 부가된 engineered crRNA(M1-1/4)를 포함한 engineered gRNA(M1-1/4)의 인델 효율을 확인하였다.
Engineered crRNA(M1-1/4)를 위해, Cas12f1를 위한 engineered crRNA(M1-1)의 3' 말단에 다양한 길이의 U-rich tail 서열을 포함하도록 설계하였다. 이때, crRNA를 암호화하는 핵산의 3' 말단에 티미딘의 길이를 단계적으로 늘려 다양한 길이의 U-rich tail 서열을 가지는 engineered crRNA(M1-1/4)를 설계하였다 (표 9). 특히, 티미딘이 5개 이상인 경우 더욱 인델 효율이 증가하였다 (도 20). 이때, T4A, T4AT 등 연속된 티미딘 서열 중간에 A는 U6 프로모터 하에서 종결 신호로 작용하는 연속하는 5 개의 티미딘(T5) 서열을 제거하기 위함으로 설계되었으며, 더불어 A 대신 C 또는 G를 TTTT 후에 부가하여 그 효과를 확인하였다 (도 21).
Label | U-rich tail Sequence (5' to 3') |
T | U |
T2 | UU |
T3 | UUU |
T4 | UUUU |
T5 | UUUUU |
T6 | UUUUUU |
T4A | UUUUA |
T4AT | UUUUAU |
T4AT2 | UUUUAUU |
T4AT3 | UUUUAUUU |
T4AT4 | UUUUAUUUU |
T4AT5 | UUUUAUUUUU (SEQ ID NO: 550) |
T4AT6 | UUUUAUUUUUU (SEQ ID NO: 551) |
T4AT7 | UUUUAUUUUUUU (SEQ ID NO: 552) |
T4AT8 | UUUUAUUUUUUUU (SEQ ID NO: 553) |
T4AT9 | UUUUAUUUUUUUUU (SEQ ID NO: 554) |
T4AT10 | UUUUAUUUUUUUUUU (SEQ ID NO: 555) |
그 결과, 티미딘의 길이가 증가할수록 인델 효율이 증가하는 것을 확인하였다. 특히, U4AU4를 포함한 engineered crRNA(M1-1/4)과 engineered tracrRNA(M1-1)을 함께 이용한 경우, 각각을 단독으로 변형한 것보다 큰 시너지 효과를 보였고, Target 1에 대해 최대 1,148 배까지 인델 효율이 크게 향상됨을 확인하였다 (도 22 및 23).
실시예 6. Engineered guide RNA (MS1, MS3 and MS4)
앞선 실시예들을 기초로 MS1 엔지니어링, MS3 엔지니어링 및 MS4 엔지니어링을 포함한 engineered tracrRNA(M1-1/3)(표 9) 및 engineered crRNA(M1-1/4)(5'-[SEQ ID NO: 516]-[가이드 서열]-[U4AU4]-3')를 설계하였다. 이를 이용해 실험한 결과, 세 개의 타겟에서 모두 높은 인델 효율을 확인하였다. 특히, 단독 변형(M1-1)이나 두 개의 조합 변형(M1-1/3 또는 M1-1/4)보다 세 개의 조합 변형(M1-1/3/4) 경우 약 3 내지 6 배의 인델 효율이 더 증가하였다.
이러한 효과를 확인한 후, tracrRNA의 5'말단 영역에 삭제 서열을 최적화하기 위해, tracrRNA의 5'말단 길이를 -12 ~ -21 범위 내에서 미세 조정하여 3 개의 표적에 대한 인델 효과를 비교하였다 (표 10). 그 결과, tracrRNA 5'말단의 18nt에서 21nt까지의 범위로 삭제(truncation)하는 것이 인델 효율에 가장 효과적임을 확인하였다 (도 24). 특히, 5'말단에 20nt 서열이 삭제된(truncated) tracrRNA가 가장 효과적이었다.
Label | Sequence (5' to 3') | SEQ ID NO |
M1-1 | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUU AGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUU UCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCAC AA |
270 |
-12nt | AGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUG AAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGU AACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA |
556 |
-13nt | GUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGA AGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUA ACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA |
557 |
-14nt | UGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAA GGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA |
549 |
-15nt | GGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAG GUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAAC CCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA |
558 |
-16nt | GAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGG UGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACC CUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA |
559 |
-17nt | AGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGU GGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCC UCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA |
560 |
-18nt | GAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCU CGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA |
561 |
-19nt | AACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUC GAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA |
562 |
-20nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGG CUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCG AAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA |
308 |
-21nt | CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA AACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA |
563 |
실시예 7. Engineered guide RNA (MS1, MS3 and MS4)
앞선 실시예들을 기초로 MS1 엔지니어링, MS3 엔지니어링 및 MS4 엔지니어링을 포함한 engineered tracrRNA(M1/3) 및 engineered crRNA(M1/4)를 설계하였다.
앞선 실시예 6에 의해 세 개의 조합 변형(M1-1/3/4) 경우 인델 효율이 증가함을 확인하였다. 하지만, tracrRNA의 5'말단 삭제(truncation)에도 Cas14a1을 위한 gRNA는 여전히 긴 서열을 가진다. 이에, 본 발명자는 gRNA의 길이를 최적화하기 위한 M1-2 변형 더 포함하도록 추가 설계하였다 (표 11). Engineered tracrRNA(M1/3) 및 engineered crRNA(M1/4)를 포함하는 engineered sgRNA(M1/3/4)을 이용한 경우, 실시예 6에서 engineered tracrRNA(M1-1/3) 및 engineered crRNA(M1-1/4)을 이용한 인델 효율과 비슷하거나 약간 증가된 인델 효율이 확인되었다 (도 25).
Label | Sequence (5' to 3') | SEQ ID NO |
M1-1/3/4(sgRNA) | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAG GUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAA GUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAA AGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC |
564 |
Δ10bp(Δ21nt) | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAG GUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAA GUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAGAAACCGAAUAGAG CAAUGAAGGAAUGCAAC |
565 |
Δ12bp(Δ25nt) | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAG GUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAA GUAACCCUCGAAACAAAUUCAGUGCUCCUCUCGAAAGAAUAGAGCAAU GAAGGAAUGCAAC |
566 |
Δ18bp(Δ37nt) | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAG GUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAA GUAACCCUCGAAACAAAUUCAGUGCUGAAAAGCAAUGAAGGAAUGCAA C |
567 |
이러한 결과를 기초로 Cas14a1과의 상호작용에 영향을 주지 않으면서 최적의 길이를 가지는 sgRNA를 찾기 위해 추가적인 스크리닝을 수행하였다. tracrRNA-crRNA 상보적으로 결합하는 영역(stem 5)의 전체 범위에 걸쳐 1bp씩 차이를 가지도록 다양한 sgRNA를 설계하고 테스트하였다 (표 12, 도 26).
Label | Sequence (5' to 3') | SEQ ID NO |
M1-1/3/4 (sgRNA) |
ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUA GAGCAAUGAAGGAAUGCAAC |
564 |
-1nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAGAAAGUUGCAGAACCCGAAUAG AGCAAUGAAGGAAUGCAAC |
568 |
-3nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUCCAAUUCUGCACGAAAUUGCAGAACCCGAAUAGAG CAAUGAAGGAAUGCAAC |
569 |
-5nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUCCAAUUCUGCAGAAAUGCAGAACCCGAAUAGAGCA AUGAAGGAAUGCAAC |
570 |
-7nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUCCAAUUCUGCGAAAGCAGAACCCGAAUAGAGCAAU GAAGGAAUGCAAC |
571 |
-9nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUCCAAUUCUGGAAACAGAACCCGAAUAGAGCAAUGA AGGAAUGCAAC |
572 |
-11nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUCCAAUUCUGAAAAGAACCCGAAUAGAGCAAUGAAG GAAUGCAAC |
573 |
-13nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUCCAAUUCGAAAGAACCCGAAUAGAGCAAUGAAGGA AUGCAAC |
574 |
-15nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUCCAAUUGAAAAACCCGAAUAGAGCAAUGAAGGAAU GCAAC |
575 |
-17nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUCCAAUGAAAACCCGAAUAGAGCAAUGAAGGAAUGC AAC |
576 |
-19nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUCCAAGAAACCCGAAUAGAGCAAUGAAGGAAUGCAA C |
577 |
-21nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUCCAGAAACCGAAUAGAGCAAUGAAGGAAUGCAAC |
578 |
-23nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUCCGAAACGAAUAGAGCAAUGAAGGAAUGCAAC |
579 |
-25nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUCGAAAGAAUAGAGCAAUGAAGGAAUGCAAC |
566 |
-27nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUCUGAAAAAUAGAGCAAUGAAGGAAUGCAAC |
580 |
-29nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC.UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA CAAAUUCAGUGCUCCUCGAAAAUAGAGCAAUGAAGGAAUGCAAC |
581 |
-31nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCUGAAAUAGAGCAAUGAAGGAAUGCAAC |
582 |
-33nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCCGAAAAGAGCAAUGAAGGAAUGCAAC |
583 |
-35nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUCGAAAGAGCAAUGAAGGAAUGCAAC |
584 |
-37nt | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA ACAAAUUCAGUGCUGAAAAGCAAUGAAGGAAUGCAAC |
585 |
한편, sgRNA의 linker 서열을 이용한 추가 변형을 시도하였다. 일반적으로 sgRNA을 위해 링커로 GAAA를 이용한다. 이 경우, gRNA는 하나의 RNA 분자로 작동한다. 반면에 GAAA 서열을 hammerhead ribozyme 서열으로 대체하는 경우, 발현 단계에서 sgRNA가 생성되지만 hammerhead ribozyme에 의해 자체 절단(self-cleavage)되어 tracrRNA 또는 crRNA에 오버행이 있는 이중 가이드 RNA가 생성된다. 즉, tracrRNA 및 crRNA와 hammerhead ribozyme의 결합은 3'-truncated tracrRNA와 5'-elongated crRNA을 생성할 수 있다 (도 27). 또는 반대로, hammerhead ribozyme 서열을 반대 방향으로 통합하면 5'-elongated tracrRNA 및 3'-truncated crRNA가 생성된다. 이러한 hammerhead ribozyme 서열의 특성을 이용한 gRNA 구조 변형을 테스트하여 게놈 편집을 더 향상시킬 수 있는지 여부를 조사하였다. 그 결과, hammerhead ribozyme 서열을 가지도록 설계된 gRNA 중 어느 것도 총 25nt-trucated sgRNA(즉, crRNA 및 tracrRNA의 경우 각각 12nt 및 13nt 절단)에 비해 증가된 효율을 나타내지 않았다 (도 27).
실시예 8. 다양한 engineered guide RNA: MS1, MS2, MS3 및/또는 MS4
앞서 실시한 실시예2 내지 5에서 확인한 다양한 gRNA 엔지니어링을 기초로, MS1, MS2, MS3 및 MS4 엔지니어링을 다양하게 조합하여 다양한 engineered gRNA를 설계하여 그 효과를 확인하였다 (도 4 내지 10 및 표 13). 그 결과, 다양한 gRAN의 엔지니어링은 인델 효율을 향상시켰다 (도 28). 특히, M1/3/4 조합 및 M1/2/3/4 조합으로 엔지니어링 된 gRNA를 이용한 CRISPR/Cas14a1 system이 가장 우수한 게놈 편집 성능을 보여주었다. 이하에서는 M1/3/4 조합으로 엔지니어링 된 gRNA를 포함하는 engineered CRISPR/Cas14a1 system은 geCas14a1_3.0 system으로 표시하였다. 또한, HEK293T 세포에서 geCas14a1_3.0 system을 이용한 인델 패턴을 확인하였다(도 29). 종합하면, 광범위한 gRNA 엔지니어링을 통해 강력하고 더욱 컴팩트한 CRISPR/Cas12f1 시스템을 개발하였고, 이를 이용해 진핵 세포에서 기존 CRISPR/Cas12f1 시스템(즉, 야생형 CRISPR/Cas12f1 시스템)으로 달성할 수 없었던 고효율의 게놈 편집을 가능하게 하였다.
Label | Sequence (5' to 3') (SEQ ID NO) | 5'-UUUUAUUUU-3' 서열 포함 여부 |
Canonical (Wildtype sgRNA) |
CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUU AGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUU UCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCAC AAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC (SEQ ID NO: 586) |
미포함 |
M1-1 | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUU AGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUU UCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCAC AAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 540) |
미포함 |
M1 | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUU AGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUU UCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCGAAAGAAUAGA GCAAUGAAGGAAUGCAAC (SEQ ID NO: 542) |
미포함 |
M1-1/2 | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA AACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAA UAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 547) |
미포함 |
M1/2 | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA AACAAAUUCAGUGCUCCUCUCGAAAGAAUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 587) |
미포함 |
M1-1/3 | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGG CUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCG AAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGA AUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 564) |
미포함 |
M1/3 | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGG CUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCG AAACAAAUUCAGUGCUCCUCUCGAAAGAAUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 566) |
미포함 |
M1-1/4 | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUU AGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUU UCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCAC AAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 540) |
포함 |
M1/4 | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUU AGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUU UCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCGAAAGAAUAGA GCAAUGAAGGAAUGCAAC (SEQ ID NO: 542) |
포함 |
M1-1/2/3 | ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCU CCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCA AC (SEQ ID NO: 588) |
미포함 |
M1/2/3 | ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCU CGAAAGAAUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 589) |
미포함 |
M1-1/2/4 | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA AACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAA UAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 547) |
포함 |
M1/2/4 | CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGC UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA AACAAAUUCAGUGCUCCUCUCGAAAGAAUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 587) |
포함 |
M1-1/3/4 | ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGG CUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCG AAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGA AUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 564) |
포함 |
M1/3/4 (geCas14a1_3.0) |
ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGG CUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCG AAACAAAUUCAGUGCUCCUCUCGAAAGAAUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 566) |
포함 |
M1-1/2/3/4 | ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCU CCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCA AC (SEQ ID NO: 588) |
포함 |
M1/2/3/4 | ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCU CGAAAGAAUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 589) |
포함 |
실시예 9. gRNA 엔지니어링에 의한 효과
더불어, 본 발명자는 증가된 인델 효율에 대한 gRNA 엔지니어링(M1-M4)의 효과의 기초가 되는 분자 메커니즘을 조사하였다. 그 결과, 예상대로 M1-1은 표적 RNA-seq 분석에 의해 평가된 바와 같이 완전한 서열로 gRNA의 발현을 급격히 증가시킴을 확인하였다 (도 30). 대조적으로 M3와 M4는 gRNA 발현의 변화와 관련이 없었다. M4와 관련하여 U-rich tail 서열은 효율적인 RNP 형성을 유도하였다. 그러나 M3의 효과에 대한 구체적인 정보를 확인할 수 없었다. 다만, 시험 관내 이중 가닥 DNA (dsDNA) 분해 분석을 통해, MS3 엔지니어링이 추가된 engineered gRNA의 경우, 이중 가닥 절단이 더 잘 발생함을 확인할 수 있었다. 아직 구체적인 메커니즘을 알 수 없으나, MS3 엔지니어링에 의해 gRNA의 5' 말단에 일부 서열이 제거됨에 따라 Cas12f1의 표적 가닥에 대한 접근성이 증가되었을 것으로 예측되며, MS3 엔지니어링으로 인해 야생형 CRISPR/Cas12f1 시스템의 표적 가닥에 대한 낮은 절단 효율을 향상시켰을 것으로 사료된다 (도 31). 다시 말해, 야생형 CRISPR/Cas12f1 시스템은 표적 가닥의 저효율 절단에 의해 주로 단일 가닥만 절단하는 nick을 생성하여 현저히 낮은 인델 효율을 가진다. 그러나, MS3 엔지니어링을 한 경우, CRISPR/Cas12f1 시스템의 절단 패턴을 변경하지 않으면서 표적 가닥의 절단을 현저하게 증가시켜 결과적으로 이중 가닥 절단에 의한 현저히 증가한 인델 효과를 보였다.
실시예 10. Large-scale validation of engineered CRISPR/Cas12f1 as an efficient genome editor
앞서 실시한 gRNA 엔지니어링은 3 개의 내인성 표적에 대해서만 인델 효율의 변화를 모니터링하여 구현되었기 때문에 engineered CRISPR/Cas12f1 시스템(이하에서, geCas14a1 system와 혼용하여 사용함)이 광범위한 표적에 대한 게놈 편집을 가능한지 여부를 실험하였다. 이를 위해, Cas9, Cas12a 및 Cas12f1으로 편집할 수 있는 in silico로 5'-TTTR-N20-NGG-3' 서열을 가지는 내인성 타겟을 검색하여 88 개의 내인성 유전자좌를 무작위로 선택하였다 (도 32 내지 34). CRISPR/SpCas9 system, CRISPR/AsCas12a system, canonical CRISPR/Cas14a1 system 또는 geCas14a1_3.0 system을 이용한 HEK293-T 세포로 형질 감염 후 deep sequencing 분석을 통해 선별한 88개의 내인성 유전자좌에서의 인델 효율을 확인하였다 (도 35). 그 결과, canonical CRISPR/Cas14a1 system이 표적의 91 % (80/88)가 인델 효율이 0.1 % 미만으로 나타났다. 그러나, geCas14a1_3.0 system은 광범위한 표적에 대한 인델 효율을 크게 향상시켰다 (도 35). geCas14a1_3.0 system의 평균 효율은 AsCas12a (p> 0.05)의 효율과 거의 비슷했으며 SpCas9의 효율보다 약간 낮았다.
이러한 대규모 분석에 대한 box-and-whisker 플롯(도 36)을 통해 다음과 같은 결론을 도출했습니다: 1) canonical CRISPR/Cas14a1 system 자체는 인간 세포에서 평균 인델 효율이 0.1 % 미만으로 게놈 편집기로의 사용이 어려움; 2) gRNA 엔지니어링에 의한 인델 효율의 평균 증가는 540 배임; 3) geCas14a1_3.0 system은 진핵 세포에서 CRISPR/SpCas9 system 및 CRISPR/AsCas12a system와 함께 게놈 편집기로 사용할 수 있음, 특히 CRISPR/SpCas9 system 및 CRISPR/AsCas12a system에 비해 geCas14a1_3.0 system이 더 높은 효율을 보인 표적(26 %, 23/88)이 있었음; 4) geCas14a1_3.0 system은 CRISPR/SpCas9 system 및 CRISPR/AsCas12a system과 달리 Gaussian 분포를 보여주지 않았으며 오히려 표적이 전체 범위의 indel 효율에 더 고르게 분포되어 있음 (도 36).
실시예 11. Canonical gRNA 및 engineered gRNA의 cleavage pattern 비교
canonical gRNA 및 engineered gRNA를 이용하여 target strand (TS)와 non-target strand (NTS)의 cleavage pattern을 NGS로 분석하였다. 그 결과, canonical gRNA는 NTS의 cleavage가 상대적으로 덜 되는 것을 확인하였다. 그에 반해 engineered gRNA의 경우, gRNA가 engineering이 되어 가면서 NTS의 cleavage가 점점 증가하는 것을 확인하였다. 또한, TS의 cleavage도 약간씩 증가하는 것도 확인하였다. 이러한 결과를 통해, engineered gRNA가 NTS와 TS에서 발생되는 cleavage 차이를 줄임으로 double-strand cleavage를 높이는 것으로 이해될 수 있다 (도 37).
<110> Genkore
<120> An engineered guide RNA for the optimized CRISPR/Cas12f1(Cas14a1)
system and use thereof
<130> CP20-226
<150> KR 10-2020-0129937
<151> 2020-10-08
<150> KR 10-2020-0185528
<151> 2020-12-29
<160> 737
<170> KoPatentIn 3.0
<210> 1
<211> 161
<212> RNA
<213> Unknown
<220>
<223> wildtype tracrRNA for CRISPR/Cas12f1 system
<400> 1
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca a 161
<210> 2
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (9)
<223> N is (N)a, wherein the each N is independently A, C, G or U,
wherein the a is an integer of 0 to 4.
<400> 2
caaauucanc cucuccaauu cugcacaa 28
<210> 3
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> V is (V)a, wherein the each V is independently A, C or G, wherein
the a is an integer of 0 to 4.
<400> 3
caaauucavn nnnvccucuc caauucugca caa 33
<210> 4
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)b, wherein the each N is independently A, C, G or U,
wherein the b is an integer of 0 to 1.
<400> 4
caaauucanv nnnnccucuc caauucugca caa 33
<210> 5
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)c, wherein the each N is independently A, C, G or U,
wherein the c is an integer of 0 to 2.
<400> 5
caaauucann vnnnccucuc caauucugca caa 33
<210> 6
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)d, wherein the each N is independently A, C, G or U,
wherein the d is an integer of 0 to 3.
<400> 6
caaauucann nvnnccucuc caauucugca caa 33
<210> 7
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)a, wherein the each N is independently A, C, G or U,
wherein the a is an integer of 0 to 4.
<400> 7
caaauucann nnvnccucuc caauucugca caa 33
<210> 8
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> a part of first sequence for engineered tracrRNA
<400> 8
ccucuccaau ucugcacaa 19
<210> 9
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 9
caaauucacc ucuccaauuc ugcacaa 27
<210> 10
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 10
caaauucanc cucuccaauu cugcacaa 28
<210> 11
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 11
caaauucaac cucuccaauu cugcacaa 28
<210> 12
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 12
caaauucacc cucuccaauu cugcacaa 28
<210> 13
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 13
caaauucagc cucuccaauu cugcacaa 28
<210> 14
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 14
caaauucauc cucuccaauu cugcacaa 28
<210> 15
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 15
caaauucann ccucuccaau ucugcacaa 29
<210> 16
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 16
caaauucaau ccucuccaau ucugcacaa 29
<210> 17
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 17
caaauucacu ccucuccaau ucugcacaa 29
<210> 18
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 18
caaauucagu ccucuccaau ucugcacaa 29
<210> 19
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 19
caaauucauu ccucuccaau ucugcacaa 29
<210> 20
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 20
caaauucann nccucuccaa uucugcacaa 30
<210> 21
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 21
caaauucauu uccucuccaa uucugcacaa 30
<210> 22
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 22
caaauucagu gccucuccaa uucugcacaa 30
<210> 23
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 23
caaauucagu uccucuccaa uucugcacaa 30
<210> 24
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 24
caaauucaua uccucuccaa uucugcacaa 30
<210> 25
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 25
caaauucann nnccucucca auucugcaca a 31
<210> 26
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 26
caaauucauu uuccucucca auucugcaca a 31
<210> 27
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 27
caaauucagu gcccucucca auucugcaca a 31
<210> 28
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 28
caaauucagu ucccucucca auucugcaca a 31
<210> 29
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 29
caaauucagu guccucucca auucugcaca a 31
<210> 30
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 30
caaauucauu gcccucucca auucugcaca a 31
<210> 31
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 31
caaauucauu ucccucucca auucugcaca a 31
<210> 32
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> V is (V)a, wherein the each V is independently A, C or G, wherein
the a is an integer of 0 to 4.
<400> 32
caaauucaan nnnvccucuc caauucugca caa 33
<210> 33
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 33
caaauucaan nnnccucucc aauucugcac aa 32
<210> 34
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 34
caaauucaan nnnvccucuc caauucugca caa 33
<210> 35
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 35
caaauucaan nnnvvccucu ccaauucugc acaa 34
<210> 36
<211> 35
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 36
caaauucaan nnnvvvccuc uccaauucug cacaa 35
<210> 37
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 37
caaauucaan nnnvvvvccu cuccaauucu gcacaa 36
<210> 38
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 38
caaauucaau uuuccucucc aauucugcac aa 32
<210> 39
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 39
caaauucaau ucuccucucc aauucugcac aa 32
<210> 40
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 40
caaauucaau gcuccucucc aauucugcac aa 32
<210> 41
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 41
caaauucaau gcuaccucuc caauucugca caa 33
<210> 42
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> V is (V)a, wherein the each V is independently A, C or G, wherein
the a is an integer of 0 to 4.
<400> 42
caaauucacn nnnvccucuc caauucugca caa 33
<210> 43
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 43
caaauucacn nnnccucucc aauucugcac aa 32
<210> 44
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 44
caaauucacn nnnvccucuc caauucugca caa 33
<210> 45
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 45
caaauucacn nnnvvccucu ccaauucugc acaa 34
<210> 46
<211> 35
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 46
caaauucacn nnnvvvccuc uccaauucug cacaa 35
<210> 47
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 47
caaauucacn nnnvvvvccu cuccaauucu gcacaa 36
<210> 48
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 48
caaauucacu uuuccucucc aauucugcac aa 32
<210> 49
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 49
caaauucacu ucuccucucc aauucugcac aa 32
<210> 50
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 50
caaauucacu gcuccucucc aauucugcac aa 32
<210> 51
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 51
caaauucacu gcucccucuc caauucugca caa 33
<210> 52
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> V is (V)a, wherein the each V is independently A, C or G, wherein
the a is an integer of 0 to 4.
<400> 52
caaauucagn nnnvccucuc caauucugca caa 33
<210> 53
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 53
caaauucagn nnnccucucc aauucugcac aa 32
<210> 54
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 54
caaauucagn nnnvccucuc caauucugca caa 33
<210> 55
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 55
caaauucagn nnnvvccucu ccaauucugc acaa 34
<210> 56
<211> 35
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 56
caaauucagn nnnvvvccuc uccaauucug cacaa 35
<210> 57
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 57
caaauucagn nnnvvvvccu cuccaauucu gcacaa 36
<210> 58
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 58
caaauucagu uuuccucucc aauucugcac aa 32
<210> 59
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 59
caaauucagu ucuccucucc aauucugcac aa 32
<210> 60
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 60
caaauucagu gcuccucucc aauucugcac aa 32
<210> 61
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 61
caaauucagu gcugccucuc caauucugca caa 33
<210> 62
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)b, wherein the each N is independently A, C, G or U,
wherein the b is an integer of 0 to 1.
<400> 62
caaauucana nnnnccucuc caauucugca caa 33
<210> 63
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 63
caaauucana nnnccucucc aauucugcac aa 32
<210> 64
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 64
caaauucana nnnnccucuc caauucugca caa 33
<210> 65
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 65
caaauucaua uuuccucucc aauucugcac aa 32
<210> 66
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 66
caaauucaua ucuccucucc aauucugcac aa 32
<210> 67
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 67
caaauucaua gcuccucucc aauucugcac aa 32
<210> 68
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)b, wherein the each N is independently A, C, G or U,
wherein the b is an integer of 0 to 1.
<400> 68
caaauucanc nnnnccucuc caauucugca caa 33
<210> 69
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 69
caaauucanc nnnccucucc aauucugcac aa 32
<210> 70
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 70
caaauucanc nnnnccucuc caauucugca caa 33
<210> 71
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 71
caaauucagc ucuccucucc aauucugcac aa 32
<210> 72
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 72
caaauucauc uccccucucc aauucugcac aa 32
<210> 73
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 73
caaauucauc ucuccucucc aauucugcac aa 32
<210> 74
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 74
caaauucauc gcuccucucc aauucugcac aa 32
<210> 75
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)b, wherein the each N is independently A, C, G or U,
wherein the b is an integer of 0 to 1.
<400> 75
caaauucang nnnnccucuc caauucugca caa 33
<210> 76
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 76
caaauucang nnnccucucc aauucugcac aa 32
<210> 77
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 77
caaauucang nnnnccucuc caauucugca caa 33
<210> 78
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 78
caaauucaug uuuccucucc aauucugcac aa 32
<210> 79
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 79
caaauucaug ucuccucucc aauucugcac aa 32
<210> 80
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 80
caaauucaug gcuccucucc aauucugcac aa 32
<210> 81
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)c, wherein the each N is independently A, C, G or U,
wherein the c is an integer of 0 to 2.
<400> 81
caaauucann annnccucuc caauucugca caa 33
<210> 82
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 82
caaauucann annccucucc aauucugcac aa 32
<210> 83
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 83
caaauucann annnccucuc caauucugca caa 33
<210> 84
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 84
caaauucann annnnccucu ccaauucugc acaa 34
<210> 85
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 85
caaauucauu auuccucucc aauucugcac aa 32
<210> 86
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 86
caaauucauu acuccucucc aauucugcac aa 32
<210> 87
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 87
caaauucauc acuccucucc aauucugcac aa 32
<210> 88
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)c, wherein the each N is independently A, C, G or U,
wherein the c is an integer of 0 to 2.
<400> 88
caaauucann cnnnccucuc caauucugca caa 33
<210> 89
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 89
caaauucann cnnccucucc aauucugcac aa 32
<210> 90
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 90
caaauucann cnnnccucuc caauucugca caa 33
<210> 91
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 91
caaauucann cnnnnccucu ccaauucugc acaa 34
<210> 92
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 92
caaauucauu cuuccucucc aauucugcac aa 32
<210> 93
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 93
caaauucauu ccuccucucc aauucugcac aa 32
<210> 94
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 94
caaauucagu cuuccucucc aauucugcac aa 32
<210> 95
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)c, wherein the each N is independently A, C, G or U,
wherein the c is an integer of 0 to 2.
<400> 95
caaauucann gnnnccucuc caauucugca caa 33
<210> 96
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 96
caaauucann gnnccucucc aauucugcac aa 32
<210> 97
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 97
caaauucann gnnnccucuc caauucugca caa 33
<210> 98
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 98
caaauucann gnnnnccucu ccaauucugc acaa 34
<210> 99
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 99
caaauucauu gcuccucucc aauucugcac aa 32
<210> 100
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 100
caaauucauc gccccucucc aauucugcac aa 32
<210> 101
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 101
caaauucagc gccccucucc aauucugcac aa 32
<210> 102
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)d, wherein the each N is independently A, C, G or U,
wherein the d is an integer of 0 to 3.
<400> 102
caaauucann nannccucuc caauucugca caa 33
<210> 103
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 103
caaauucann nanccucucc aauucugcac aa 32
<210> 104
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 104
caaauucann nannccucuc caauucugca caa 33
<210> 105
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 105
caaauucann nannnccucu ccaauucugc acaa 34
<210> 106
<211> 35
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 106
caaauucann nannnnccuc uccaauucug cacaa 35
<210> 107
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 107
caaauucauu uauccucucc aauucugcac aa 32
<210> 108
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 108
caaauucagu uauccucucc aauucugcac aa 32
<210> 109
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 109
caaauucauu gauccucucc aauucugcac aa 32
<210> 110
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)d, wherein the each N is independently A, C, G or U,
wherein the d is an integer of 0 to 3.
<400> 110
caaauucann ncnnccucuc caauucugca caa 33
<210> 111
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 111
caaauucann ncnccucucc aauucugcac aa 32
<210> 112
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 112
caaauucann ncnnccucuc caauucugca caa 33
<210> 113
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 113
caaauucann ncnnnccucu ccaauucugc acaa 34
<210> 114
<211> 35
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 114
caaauucann ncnnnnccuc uccaauucug cacaa 35
<210> 115
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 115
caaauucauu ucuccucucc aauucugcac aa 32
<210> 116
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 116
caaauucagu gccccucucc aauucugcac aa 32
<210> 117
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 117
caaauucagc gcuccucucc aauucugcac aa 32
<210> 118
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 118
caaauucauu gccccucucc aauucugcac aa 32
<210> 119
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 119
caaauucagc uccccucucc aauucugcac aa 32
<210> 120
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)d, wherein the each N is independently A, C, G or U,
wherein the d is an integer of 0 to 3.
<400> 120
caaauucann ngnnccucuc caauucugca caa 33
<210> 121
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 121
caaauucann ngnccucucc aauucugcac aa 32
<210> 122
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 122
caaauucann ngnnccucuc caauucugca caa 33
<210> 123
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 123
caaauucann ngnnnccucu ccaauucugc acaa 34
<210> 124
<211> 35
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 124
caaauucann ngnnnnccuc uccaauucug cacaa 35
<210> 125
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 125
caaauucauu uguccucucc aauucugcac aa 32
<210> 126
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 126
caaauucauu gguccucucc aauucugcac aa 32
<210> 127
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 127
caaauucagu cguccucucc aauucugcac aa 32
<210> 128
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)a, wherein the each N is independently A, C, G or U,
wherein the a is an integer of 0 to 4.
<400> 128
caaauucann nnanccucuc caauucugca caa 33
<210> 129
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 129
caaauucann nnaccucucc aauucugcac aa 32
<210> 130
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 130
caaauucann nnanccucuc caauucugca caa 33
<210> 131
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 131
caaauucann nnannccucu ccaauucugc acaa 34
<210> 132
<211> 35
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 132
caaauucann nnannnccuc uccaauucug cacaa 35
<210> 133
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 133
caaauucann nnannnnccu cuccaauucu gcacaa 36
<210> 134
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 134
caaauucauu uuaccucucc aauucugcac aa 32
<210> 135
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 135
caaauucauu ucaccucucc aauucugcac aa 32
<210> 136
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 136
caaauucauu gcaccucucc aauucugcac aa 32
<210> 137
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)a, wherein the each N is independently A, C, G or U,
wherein the a is an integer of 0 to 4.
<400> 137
caaauucann nncnccucuc caauucugca caa 33
<210> 138
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 138
caaauucann nncccucucc aauucugcac aa 32
<210> 139
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 139
caaauucann nncnccucuc caauucugca caa 33
<210> 140
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 140
caaauucann nncnnccucu ccaauucugc acaa 34
<210> 141
<211> 35
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 141
caaauucann nncnnnccuc uccaauucug cacaa 35
<210> 142
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 142
caaauucann nncnnnnccu cuccaauucu gcacaa 36
<210> 143
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 143
caaauucauc uccccucucc aauucugcac aa 32
<210> 144
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 144
caaauucagu uccccucucc aauucugcac aa 32
<210> 145
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 145
caaauucauu uccccucucc aauucugcac aa 32
<210> 146
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<220>
<221> misc_difference
<222> (14)
<223> N is (N)a, wherein the each N is independently A, C, G or U,
wherein the a is an integer of 0 to 4.
<400> 146
caaauucann nngnccucuc caauucugca caa 33
<210> 147
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 147
caaauucann nngccucucc aauucugcac aa 32
<210> 148
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 148
caaauucann nngnccucuc caauucugca caa 33
<210> 149
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 149
caaauucann nngnnccucu ccaauucugc acaa 34
<210> 150
<211> 35
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 150
caaauucann nngnnnccuc uccaauucug cacaa 35
<210> 151
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 151
caaauucann nngnnnnccu cuccaauucu gcacaa 36
<210> 152
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 152
caaauucauu ucgccucucc aauucugcac aa 32
<210> 153
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 153
caaauucagu gcgccucucc aauucugcac aa 32
<210> 154
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 154
caaauucagu ucgccucucc aauucugcac aa 32
<210> 155
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 155
caaauucann nn 12
<210> 156
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 156
caaauucann nnccucucca auucugcac 29
<210> 157
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 157
caaauucann nnccucucca auucugc 27
<210> 158
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 158
caaauucann nnccucucca auucu 25
<210> 159
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 159
caaauucann nnccucucca auu 23
<210> 160
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 160
caaauucann nnccucucca a 21
<210> 161
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 161
caaauucann nnccucucc 19
<210> 162
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 162
caaauucann nnccucu 17
<210> 163
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 163
caaauucann nnccu 15
<210> 164
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 164
caaauucann nnc 13
<210> 165
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 165
caaauucavn nnn 13
<210> 166
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 166
caaauucavn nnnccucucc aauucugcac aa 32
<210> 167
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 167
caaauucavn nnnccucucc aauucugca 29
<210> 168
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 168
caaauucavn nnnccucucc aauucug 27
<210> 169
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 169
caaauucavn nnnccucucc aauucu 26
<210> 170
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 170
caaauucavn nnnccucucc aauu 24
<210> 171
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 171
caaauucavn nnnccucucc aa 22
<210> 172
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 172
caaauucavn nnnccucucc 20
<210> 173
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 173
caaauucavn nnnccucu 18
<210> 174
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 174
caaauucavn nnnccu 16
<210> 175
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 175
caaauucanv nnn 13
<210> 176
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 176
caaauucanv nnnccucucc aauucugcac aa 32
<210> 177
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 177
caaauucanv nnnccucucc aauucugca 29
<210> 178
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 178
caaauucanv nnnccucucc aauucu 26
<210> 179
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 179
caaauucanv nnnccucucc aauu 24
<210> 180
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 180
caaauucanv nnnccucucc aa 22
<210> 181
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 181
caaauucanv nnnccucucc 20
<210> 182
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 182
caaauucanv nnnccucu 18
<210> 183
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 183
caaauucanv nnncc 15
<210> 184
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 184
caaauucann vnn 13
<210> 185
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 185
caaauucann vnnccucucc aauucugcac aa 32
<210> 186
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 186
caaauucann vnnccucucc aauucugca 29
<210> 187
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 187
caaauucann vnnccucucc aauucu 26
<210> 188
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 188
caaauucann vnnccucucc aauu 24
<210> 189
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 189
caaauucann vnnccucucc aa 22
<210> 190
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 190
caaauucann vnnccucucc 20
<210> 191
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 191
caaauucann vnnccucu 18
<210> 192
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 192
caaauucann vnncc 15
<210> 193
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 193
caaauucann nvn 13
<210> 194
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 194
caaauucann nvnccucucc aauucugcac aa 32
<210> 195
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 195
caaauucann nvnccucucc aauucugca 29
<210> 196
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 196
caaauucann nvnccucucc aauucu 26
<210> 197
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 197
caaauucann nvnccucucc aauu 24
<210> 198
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 198
caaauucann nvnccucucc aa 22
<210> 199
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 199
caaauucann nvnccucucc 20
<210> 200
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 200
caaauucann nvnccucu 18
<210> 201
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 201
caaauucann nvncc 15
<210> 202
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 202
caaauucann nnv 13
<210> 203
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 203
caaauucann nnvccucucc aauucugcac aa 32
<210> 204
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 204
caaauucann nnvccucucc aauucugca 29
<210> 205
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 205
caaauucann nnvccucucc aauucu 26
<210> 206
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 206
caaauucann nnvccucucc aauu 24
<210> 207
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 207
caaauucann nnvccucucc aa 22
<210> 208
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 208
caaauucann nnvccucucc 20
<210> 209
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 209
caaauucann nnvccucu 18
<210> 210
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 210
caaauucann nnvcc 15
<210> 211
<211> 39
<212> RNA
<213> Artificial Sequence
<220>
<223> second sequence for engineered tracrRNA
<400> 211
augucgagaa gugcuuucuu cggaaaguaa cccucgaaa 39
<210> 212
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> third sequence for engineered tracrRNA
<400> 212
ggcugcuugc aucagccua 19
<210> 213
<211> 50
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 213
ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug 50
<210> 214
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 214
ccgcuucacc aaaagcuguc cuuagggauu agaacuugag ugaaggug 48
<210> 215
<211> 46
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 215
ccgcuucacc aaaagcuguc uuaggauuag aacuugagug aaggug 46
<210> 216
<211> 44
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 216
ccgcuucacc aaaagcuguu uagauuagaa cuugagugaa ggug 44
<210> 217
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 217
ccgcuucacc aaaagcuguu aguuagaacu ugagugaagg ug 42
<210> 218
<211> 40
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 218
ccgcuucacc aaaagcguua guugaacuug agugaaggug 40
<210> 219
<211> 38
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 219
ccgcuucacc aaaagguuag uuaacuugag ugaaggug 38
<210> 220
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 220
ccgcuucacc aaagguuagu uaacugagug aaggug 36
<210> 221
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 221
ccgcuucacc aagguuaguu aacgagugaa ggug 34
<210> 222
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 222
ccgcuucaca agguuaguua acagugaagg ug 32
<210> 223
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 223
ccgcuucaaa gguuaguuaa caugaaggug 30
<210> 224
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 224
ccgcuucaag guuaguuaac agaaggug 28
<210> 225
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 225
ccgcuuaagg uuaguuaaca aaggug 26
<210> 226
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 226
ccgcuaaggu uaguuaacaa ggug 24
<210> 227
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 227
ccgcaagguu aguuaacagg ug 22
<210> 228
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 228
ccgaagguua guuaacagug 20
<210> 229
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 229
cgaagguuag uuaacaug 18
<210> 230
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 230
gaagguuagu uaacau 16
<210> 231
<211> 41
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 231
ccgcuucacc aaaagcuguu aguagaacuu gagugaaggu g 41
<210> 232
<211> 39
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 232
ccgcuucacc aaaagcuuua gagaacuuga gugaaggug 39
<210> 233
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 233
ccgcuucacc aaaagcuuag gaacuugagu gaaggug 37
<210> 234
<211> 35
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 234
ccgcuucacc aaaaguuaga acuugaguga aggug 35
<210> 235
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 235
ccgcuucacc aaaauuagac uugagugaag gug 33
<210> 236
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 236
ccgcuucacc aaauuagcuu gagugaaggu g 31
<210> 237
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 237
ccgcuucacc aauuaguuga gugaaggug 29
<210> 238
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 238
ccgcuucacc auuagugagu gaaggug 27
<210> 239
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 239
ccgcuucacc uuaggaguga aggug 25
<210> 240
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 240
ccgcuucacu uagagugaag gug 23
<210> 241
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 241
ccgcuucacu uaggugaagg ug 22
<210> 242
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 242
ccgcuucauu agugaaggug 20
<210> 243
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 243
ccgcuucuua ggaaggug 18
<210> 244
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 244
ccgcuuuuag aaggug 16
<210> 245
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 245
ccgcuuuaga ggug 14
<210> 246
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 246
ccgcuuaggg ug 12
<210> 247
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> fourth sequence for engineered tracrRNA
<400> 247
ccguuaggug 10
<210> 248
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth sequence for engineered tracrRNA
<400> 248
cuucacugau aaaguggaga a 21
<210> 249
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth sequence for engineered tracrRNA
<400> 249
aaguggagaa 10
<210> 250
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth sequence for engineered tracrRNA
<400> 250
aaaguggaga a 11
<210> 251
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth sequence for engineered tracrRNA
<400> 251
uaaaguggag aa 12
<210> 252
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth sequence for engineered tracrRNA
<400> 252
auaaagugga gaa 13
<210> 253
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth sequence for engineered tracrRNA
<400> 253
gauaaagugg agaa 14
<210> 254
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth sequence for engineered tracrRNA
<400> 254
ugauaaagug gagaa 15
<210> 255
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth sequence for engineered tracrRNA
<400> 255
cugauaaagu ggagaa 16
<210> 256
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth sequence for engineered tracrRNA
<400> 256
acugauaaag uggagaa 17
<210> 257
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth sequence for engineered tracrRNA
<400> 257
cacugauaaa guggagaa 18
<210> 258
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth sequence for engineered tracrRNA
<400> 258
ucacugauaa aguggagaa 19
<210> 259
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> fifth sequence for engineered tracrRNA
<400> 259
uucacugaua aaguggagaa 20
<210> 260
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> additional sequence for engineered gRNA
<400> 260
auaaagguga 10
<210> 261
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> hammerhead ribozyme nucleotide seqeunce
<400> 261
cugaugaguc cgugaggacg aaacgaguaa gcucguc 37
<210> 262
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> hammerhead ribozyme nucleotide seqeunce
<400> 262
cugcucgaau gagcaaagca ggagugccug aguaguc 37
<210> 263
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 263
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 60
aauucannnc nccucuccaa uucugcacaa 90
<210> 264
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 264
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 60
aauucagugc uccucuccaa uucugcacaa 90
<210> 265
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 265
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 60
aauucauuuc uccucuccaa uucugcacaa 90
<210> 266
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 266
ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc 120
nccucuccaa uucugcacaa 140
<210> 267
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 267
ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc 120
uccucuccaa uucugcacaa 140
<210> 268
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 268
ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaau uucuuucuuc ggaaaguaac ccucgaaaca aauucagugc 120
uccucuccaa uucugcacaa 140
<210> 269
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 269
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucannn cnccucucca auucugcaca a 161
<210> 270
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 270
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagug cuccucucca auucugcaca a 161
<210> 271
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 271
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu cuccucucca auucugcaca a 161
<210> 272
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 272
caaauucann ncn 13
<210> 273
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 273
caaauucann ncnccucucc aauucugcac a 31
<210> 274
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 274
caaauucann ncnccucucc aauucugcac 30
<210> 275
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 275
caaauucann ncnccucucc aauucugca 29
<210> 276
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 276
caaauucann ncnccucucc aauucugc 28
<210> 277
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 277
caaauucann ncnccucucc aauucug 27
<210> 278
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 278
caaauucann ncnccucucc aauucu 26
<210> 279
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 279
caaauucann ncnccucucc aauuc 25
<210> 280
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 280
caaauucann ncnccucucc aauu 24
<210> 281
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 281
caaauucann ncnccucucc aau 23
<210> 282
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 282
caaauucann ncnccucucc aa 22
<210> 283
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 283
caaauucann ncnccucucc a 21
<210> 284
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 284
caaauucann ncnccucucc 20
<210> 285
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 285
caaauucann ncnccucuc 19
<210> 286
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 286
caaauucann ncnccucu 18
<210> 287
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 287
caaauucann ncnccuc 17
<210> 288
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 288
caaauucann ncnccu 16
<210> 289
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 289
caaauucann ncncc 15
<210> 290
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 290
caaauucann ncnc 14
<210> 291
<211> 77
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 291
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 60
aauucannnc nccucuc 77
<210> 292
<211> 77
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 292
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 60
aauucagugc uccucuc 77
<210> 293
<211> 77
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 293
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 60
aauucauuuc uccucuc 77
<210> 294
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 294
ccgcuucacc uuaggaguga aggugggcug cuugcaucag ccuaaugucg agaagugcuu 60
ucuucggaaa guaacccucg aaacaaauuc annncnccuc uc 102
<210> 295
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 295
ccgcuucacc gaaagaguga aggugggcug cuugcaucag ccuaaugucg agaagugcuu 60
ucuucggaaa guaacccucg aaacaaauuc annncnccuc uc 102
<210> 296
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 296
ccgcuuuuag aaggugggcu gcuugcauca gccuaauguc gagaagugcu uucuucggaa 60
aguaacccuc gaaacaaauu cannncnccu cuccaauucu gcacaa 106
<210> 297
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 297
ccgcuugaaa aaggugggcu gcuugcauca gccuaauguc gagaagugcu uucuucggaa 60
aguaacccuc gaaacaaauu cannncnccu cuccaauucu gcacaa 106
<210> 298
<211> 119
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 298
ccgcuucacc aauuaguuga gugaaggugg gcugcuugca ucagccuaau gucgagaagu 60
gcuuucuucg gaaaguaacc cucgaaacaa auucagugcu ccucuccaau ucugcacaa 119
<210> 299
<211> 119
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 299
ccgcuucacc aagaaauuga gugaaggugg gcugcuugca ucagccuaau gucgagaagu 60
gcuuucuucg gaaaguaacc cucgaaacaa auucagugcu ccucuccaau ucugcacaa 119
<210> 300
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 300
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuc 107
<210> 301
<211> 120
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 301
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuccaa uucugcacaa 120
120
<210> 302
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 302
accgcuucac caagaaauug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuc 107
<210> 303
<211> 120
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 303
accgcuucac caagaaauug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuccaa uucugcacaa 120
120
<210> 304
<211> 141
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 304
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120
cnccucucca auucugcaca a 141
<210> 305
<211> 128
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 305
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120
cnccucuc 128
<210> 306
<211> 120
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 306
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuccaa uucugcacaa 120
120
<210> 307
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 307
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuc 107
<210> 308
<211> 141
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 308
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auucugcaca a 141
<210> 309
<211> 128
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 309
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucuc 128
<210> 310
<211> 120
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 310
accgcuucac caagaaauug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuccaa uucugcacaa 120
120
<210> 311
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 311
accgcuucac caagaaauug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuc 107
<210> 312
<211> 37
<212> RNA
<213> Unknown
<220>
<223> wildtype repeat sequence of wildtype crRNA for CRISPR/Cas12f1
system
<400> 312
guugcagaac ccgaauagac gaaugaagga augcaac 37
<210> 313
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<220>
<221> misc_difference
<222> (19)
<223> N is (N)a, wherein the each N is independently A, C, G or U, and
the a is an integer of 0 to 4.
<400> 313
guugcagaac ccgaauagnu gaagga 26
<210> 314
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<220>
<221> misc_difference
<222> (19)
<223> B is (B)a, wherein the each B is independently C, G or U, and the
a is an integer of 0 to 4.
<400> 314
guugcagaac ccgaauagbn nnnbugaagg a 31
<210> 315
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<220>
<221> misc_difference
<222> (19)
<223> N is (N)b, wherein the each N is independently A, C, G or U, and
the b is an integer of 0 to 1.
<400> 315
guugcagaac ccgaauagnn nnbnugaagg a 31
<210> 316
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<220>
<221> misc_difference
<222> (19)
<223> N is (N)c, wherein the each N is independently A, C, G or U, and
the c is an integer of 0 to 2.
<400> 316
guugcagaac ccgaauagnn nbnnugaagg a 31
<210> 317
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<220>
<221> misc_difference
<222> (19)
<223> N is (N)d, wherein the each N is independently A, C, G or U, and
the d is an integer of 0 to 3.
<400> 317
guugcagaac ccgaauagnn bnnnugaagg a 31
<210> 318
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<220>
<221> misc_difference
<222> (19)
<223> N is (N)a, wherein the each N is independently A, C, G or U, and
the a is an integer of 0 to 4.
<400> 318
guugcagaac ccgaauagnb nnnnugaagg a 31
<210> 319
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> a part of sixth sequence for engineered crRNA
<400> 319
guugcagaac ccgaauag 18
<210> 320
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 320
caaauucauu cuccucucca auucugcaca a 31
<210> 321
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 321
guugcagaac ccgaauagug ccugaagga 29
<210> 322
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 322
caaauucaca uuccccucuc caauucugca caa 33
<210> 323
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 323
guugcagaac ccgaauagga aagcugaagg a 31
<210> 324
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 324
caaauucagu gcuccucucc aauucugcac aa 32
<210> 325
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 325
guugcagaac ccgaauagag caaugaagga 30
<210> 326
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 326
caaauucauu ucuccucucc aauucugcac aa 32
<210> 327
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 327
guugcagaac ccgaauagag gaaugaagga 30
<210> 328
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 328
caaauucacu gccuuccucu ccaauucugc acaa 34
<210> 329
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 329
guugcagaac ccgaauagaa ggcagugaag ga 32
<210> 330
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> first sequence for engineered tracrRNA
<400> 330
caaauucaca uugauccucu ccaauucugc acaa 34
<210> 331
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 331
guugcagaac ccgaauagac gaaagugaag ga 32
<210> 332
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 332
guugcagaac ccgaauagnn nnugaagga 29
<210> 333
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 333
nnnnugaagg a 11
<210> 334
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 334
ugcagaaccc gaauagnnnn ugaagga 27
<210> 335
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 335
cagaacccga auagnnnnug aagga 25
<210> 336
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 336
gaacccgaau agnnnnugaa gga 23
<210> 337
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 337
acccgaauag nnnnugaagg a 21
<210> 338
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 338
ccgaauagnn nnugaagga 19
<210> 339
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 339
gaauagnnnn ugaagga 17
<210> 340
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 340
auagnnnnug aagga 15
<210> 341
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 341
agnnnnugaa gga 13
<210> 342
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 342
nnnnbugaag ga 12
<210> 343
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 343
guugcagaac ccgaauagnn nnbugaagga 30
<210> 344
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 344
ugcagaaccc gaauagnnnn bugaagga 28
<210> 345
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 345
cagaacccga auagnnnnbu gaagga 26
<210> 346
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 346
gaacccgaau agnnnnbuga agga 24
<210> 347
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 347
acccgaauag nnnnbugaag ga 22
<210> 348
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 348
ccgaauagnn nnbugaagga 20
<210> 349
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 349
gaauagnnnn bugaagga 18
<210> 350
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 350
auagnnnnbu gaagga 16
<210> 351
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 351
agnnnnbuga agga 14
<210> 352
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 352
nnnbnugaag ga 12
<210> 353
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 353
guugcagaac ccgaauagnn nbnugaagga 30
<210> 354
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 354
ugcagaaccc gaauagnnnb nugaagga 28
<210> 355
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 355
cagaacccga auagnnnbnu gaagga 26
<210> 356
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 356
gaacccgaau agnnnbnuga agga 24
<210> 357
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 357
acccgaauag nnnbnugaag ga 22
<210> 358
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 358
ccgaauagnn nbnugaagga 20
<210> 359
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 359
gaauagnnnb nugaagga 18
<210> 360
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 360
auagnnnbnu gaagga 16
<210> 361
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 361
agnnnbnuga agga 14
<210> 362
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 362
nnbnnugaag ga 12
<210> 363
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 363
guugcagaac ccgaauagnn bnnugaagga 30
<210> 364
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 364
ugcagaaccc gaauagnnbn nugaagga 28
<210> 365
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 365
cagaacccga auagnnbnnu gaagga 26
<210> 366
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 366
gaacccgaau agnnbnnuga agga 24
<210> 367
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 367
acccgaauag nnbnnugaag ga 22
<210> 368
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 368
ccgaauagnn bnnugaagga 20
<210> 369
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 369
gaauagnnbn nugaagga 18
<210> 370
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 370
auagnnbnnu gaagga 16
<210> 371
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 371
agnnbnnuga agga 14
<210> 372
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 372
nbnnnugaag ga 12
<210> 373
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 373
guugcagaac ccgaauagnb nnnugaagga 30
<210> 374
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 374
ugcagaaccc gaauagnbnn nugaagga 28
<210> 375
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 375
cagaacccga auagnbnnnu gaagga 26
<210> 376
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 376
gaacccgaau agnbnnnuga agga 24
<210> 377
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 377
acccgaauag nbnnnugaag ga 22
<210> 378
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 378
ccgaauagnb nnnugaagga 20
<210> 379
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 379
gaauagnbnn nugaagga 18
<210> 380
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 380
auagnbnnnu gaagga 16
<210> 381
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 381
agnbnnnuga agga 14
<210> 382
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 382
bnnnnugaag ga 12
<210> 383
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 383
guugcagaac ccgaauagbn nnnugaagga 30
<210> 384
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 384
ugcagaaccc gaauagbnnn nugaagga 28
<210> 385
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 385
cagaacccga auagbnnnnu gaagga 26
<210> 386
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 386
gaacccgaau agbnnnnuga agga 24
<210> 387
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 387
acccgaauag bnnnnugaag ga 22
<210> 388
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 388
ccgaauagbn nnnugaagga 20
<210> 389
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 389
gaauagbnnn nugaagga 18
<210> 390
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 390
auagbnnnnu gaagga 16
<210> 391
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 391
agbnnnnuga agga 14
<210> 392
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 392
uuuuuuuuuu 10
<210> 393
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 393
uuuauuuauu uau 13
<210> 394
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 394
uguguguuuu 10
<210> 395
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 395
uuuguuuguu uu 12
<210> 396
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 396
uuuucuuuuc uuuu 14
<210> 397
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 397
uuucuauuuu 10
<210> 398
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 398
uuauguuuuu 10
<210> 399
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 399
uuuauucugu u 11
<210> 400
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 400
uucucuuucu uu 12
<210> 401
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 401
uguuauuuau u 11
<210> 402
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 402
uuucuuuaug uuu 13
<210> 403
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 403
uauuuguuuc 10
<210> 404
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 404
uucuuguuuu auu 13
<210> 405
<211> 57
<212> RNA
<213> Unknown
<220>
<223> wildtype crRNA for CRISPR/Cas12f1 system
<400> 405
guugcagaac ccgaauagac gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57
<210> 406
<211> 66
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 406
guugcagaac ccgaauagac gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 60
uauuuu 66
<210> 407
<211> 61
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 407
guugcagaac ccgaauagac gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 60
u 61
<210> 408
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 408
guugcagaac ccgaauagng nnnugaagga 30
<210> 409
<211> 57
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 409
guugcagaac ccgaauagng nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57
<210> 410
<211> 57
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 410
guugcagaac ccgaauagag caaugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57
<210> 411
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 411
gaauagacga augaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45
<210> 412
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 412
ngnnnugaag ga 12
<210> 413
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 413
uugcagaacc cgaauagngn nnugaagga 29
<210> 414
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 414
ugcagaaccc gaauagngnn nugaagga 28
<210> 415
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 415
gcagaacccg aauagngnnn ugaagga 27
<210> 416
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 416
cagaacccga auagngnnnu gaagga 26
<210> 417
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 417
agaacccgaa uagngnnnug aagga 25
<210> 418
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 418
gaacccgaau agngnnnuga agga 24
<210> 419
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 419
aacccgaaua gngnnnugaa gga 23
<210> 420
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 420
acccgaauag ngnnnugaag ga 22
<210> 421
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 421
cccgaauagn gnnnugaagg a 21
<210> 422
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 422
ccgaauagng nnnugaagga 20
<210> 423
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 423
cgaauagngn nnugaagga 19
<210> 424
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 424
gaauagngnn nugaagga 18
<210> 425
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 425
aauagngnnn ugaagga 17
<210> 426
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 426
auagngnnnu gaagga 16
<210> 427
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 427
uagngnnnug aagga 15
<210> 428
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> sixth sequence for engineered crRNA
<400> 428
agngnnnuga agga 14
<210> 429
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 429
gaauagngnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45
<210> 430
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 430
gaauagagca augaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45
<210> 431
<211> 49
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 431
gaauagacga augaaggaau gcaacnnnnn nnnnnnnnnn nnnnnuuuu 49
<210> 432
<211> 61
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 432
guugcagaac ccgaauagng nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 60
u 61
<210> 433
<211> 61
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 433
guugcagaac ccgaauagag caaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 60
u 61
<210> 434
<211> 66
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 434
guugcagaac ccgaauagag caaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 60
uauuuu 66
<210> 435
<211> 49
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 435
gaauagngnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnnuuuu 49
<210> 436
<211> 49
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 436
gaauagagca augaaggaau gcaacnnnnn nnnnnnnnnn nnnnnuuuu 49
<210> 437
<211> 222
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 437
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucannn cnccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nn 222
<210> 438
<211> 222
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 438
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagug cuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nn 222
<210> 439
<211> 181
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 439
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuccaa uucugcacaa 120
gaaaguugca gaacccgaau agacgaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180
n 181
<210> 440
<211> 202
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 440
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120
cnccucucca auucugcaca agaaaguugc agaacccgaa uagacgaaug aaggaaugca 180
acnnnnnnnn nnnnnnnnnn nn 202
<210> 441
<211> 181
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 441
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuccaa uucugcacaa 120
gaaaguugca gaacccgaau agacgaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180
n 181
<210> 442
<211> 202
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 442
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auucugcaca agaaaguugc agaacccgaa uagacgaaug aaggaaugca 180
acnnnnnnnn nnnnnnnnnn nn 202
<210> 443
<211> 185
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 443
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuccaa uucugcacaa 120
gaaaguugca gaacccgaau agacgaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180
nuuuu 185
<210> 444
<211> 206
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 444
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120
cnccucucca auucugcaca agaaaguugc agaacccgaa uagacgaaug aaggaaugca 180
acnnnnnnnn nnnnnnnnnn nnuuuu 206
<210> 445
<211> 185
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 445
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuccaa uucugcacaa 120
gaaaguugca gaacccgaau agacgaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180
nuuuu 185
<210> 446
<211> 206
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 446
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auucugcaca agaaaguugc agaacccgaa uagacgaaug aaggaaugca 180
acnnnnnnnn nnnnnnnnnn nnuuuu 206
<210> 447
<211> 226
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 447
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucannn cnccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nnuuuu 226
<210> 448
<211> 226
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 448
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagug cuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nnuuuu 226
<210> 449
<211> 177
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 449
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120
cnccucucga aagaauagac gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnn 177
<210> 450
<211> 181
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 450
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120
cnccucucga aagaauagac gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 180
u 181
<210> 451
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 451
accgcuucac cuuaggagug aaggugggcu gcuugcauca gccuaauguc gagaagugcu 60
uucuucggaa aguaacccuc gaaacaaauu cagugcuccu cucgaaagaa uagacgaaug 120
aaggaaugca acnnnnnnnn nnnnnnnnnn nnuuuu 156
<210> 452
<211> 181
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 452
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucga aagaauagac gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 180
u 181
<210> 453
<211> 181
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 453
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuccaa uucugcacaa 120
gaaaguugca gaacccgaau agngnnnuga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180
n 181
<210> 454
<211> 202
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 454
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120
cnccucucca auucugcaca agaaaguugc agaacccgaa uagngnnnug aaggaaugca 180
acnnnnnnnn nnnnnnnnnn nn 202
<210> 455
<211> 181
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 455
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuccaa uucugcacaa 120
gaaaguugca gaacccgaau agagcaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180
n 181
<210> 456
<211> 202
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 456
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auucugcaca agaaaguugc agaacccgaa uagagcaaug aaggaaugca 180
acnnnnnnnn nnnnnnnnnn nn 202
<210> 457
<211> 222
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 457
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucannn cnccucucca auucugcaca agaaaguugc agaacccgaa 180
uagngnnnug aaggaaugca acnnnnnnnn nnnnnnnnnn nn 222
<210> 458
<211> 222
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 458
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagug cuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagagcaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nn 222
<210> 459
<211> 185
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 459
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuccaa uucugcacaa 120
gaaaguugca gaacccgaau agngnnnuga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180
nuuuu 185
<210> 460
<211> 206
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 460
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120
cnccucucca auucugcaca agaaaguugc agaacccgaa uagngnnnug aaggaaugca 180
acnnnnnnnn nnnnnnnnnn nnuuuu 206
<210> 461
<211> 185
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 461
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuccaa uucugcacaa 120
gaaaguugca gaacccgaau agagcaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180
nuuuu 185
<210> 462
<211> 206
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 462
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auucugcaca agaaaguugc agaacccgaa uagagcaaug aaggaaugca 180
acnnnnnnnn nnnnnnnnnn nnuuuu 206
<210> 463
<211> 226
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 463
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucannn cnccucucca auucugcaca agaaaguugc agaacccgaa 180
uagngnnnug aaggaaugca acnnnnnnnn nnnnnnnnnn nnuuuu 226
<210> 464
<211> 226
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA
<400> 464
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagug cuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagagcaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nnuuuu 226
<210> 465
<211> 529
<212> PRT
<213> Unknown
<220>
<223> Uncultured archaeon Cas12f1 protein
<400> 465
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro
<210> 466
<211> 1003
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas12f1 fusion protein with CBE (N terminal -Cytidine deaminase)
<400> 466
Pro Lys Lys Lys Arg Lys Val Ser Ser Glu Thr Gly Pro Val Ala Val
1 5 10 15
Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe
20 25 30
Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile
35 40 45
Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr
50 55 60
Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg
65 70 75 80
Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp
85 90 95
Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg
100 105 110
Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His His
115 120 125
Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly
130 135 140
Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg
145 150 155 160
Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr
165 170 175
Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile
180 185 190
Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln
195 200 205
Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu
210 215 220
Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Gly Ser Ser
225 230 235 240
Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr
245 250 255
Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Ala Lys Asn Thr
260 265 270
Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala
275 280 285
Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile
290 295 300
Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His
305 310 315 320
Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys
325 330 335
Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu
340 345 350
Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile
355 360 365
Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu
370 375 380
Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn
385 390 395 400
Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala
405 410 415
Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys
420 425 430
Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly
435 440 445
Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln
450 455 460
Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp
465 470 475 480
Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile
485 490 495
Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys
500 505 510
Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg
515 520 525
Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys
530 535 540
Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly
545 550 555 560
Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp
565 570 575
Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile
580 585 590
Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe
595 600 605
Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys
610 615 620
Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg
625 630 635 640
Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr
645 650 655
Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys
660 665 670
Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met
675 680 685
Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile
690 695 700
Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu
705 710 715 720
Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn
725 730 735
Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe
740 745 750
Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu
755 760 765
Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile
770 775 780
Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro Ser Gly Gly Ser
785 790 795 800
Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
805 810 815
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu
820 825 830
Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val
835 840 845
His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
850 855 860
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser
865 870 875 880
Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser
885 890 895
Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys
900 905 910
Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu
915 920 925
Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala
930 935 940
Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala
945 950 955 960
Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu
965 970 975
Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly
980 985 990
Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val
995 1000
<210> 467
<211> 1003
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas12f1 fusion protein with CBE (C terminal -Cytidine deaminase)
<400> 467
Pro Lys Lys Lys Arg Lys Val Met Ala Lys Asn Thr Ile Thr Lys Thr
1 5 10 15
Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala Glu Val Glu Lys
20 25 30
Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile Ala Leu Glu Lys
35 40 45
Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His Leu Lys Val Ala
50 55 60
Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys Leu Phe Cys Lys
65 70 75 80
Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu Arg Gly Gln Phe
85 90 95
Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile Phe Arg Gln Leu
100 105 110
Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu Ile Glu Leu Tyr
115 120 125
Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn Ala Ser Ser Val
130 135 140
Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala Ala Glu Leu Phe
145 150 155 160
Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys Ile Lys Ser Asn
165 170 175
Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly Leu Pro Thr Thr
180 185 190
Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln Lys Gly Gly Gln
195 200 205
Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp Phe Ile Ile Lys
210 215 220
Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile Asp Lys Tyr Arg
225 230 235 240
Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys Ser Pro Lys Pro
245 250 255
Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg Asn Lys Gly Trp
260 265 270
Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys Val Met Asn Gly
275 280 285
Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly Ser Lys Ile Gly
290 295 300
Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp Val Pro Lys Ile
305 310 315 320
Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile Asp Val Gly Val
325 330 335
Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe Ser Arg Tyr Ser
340 345 350
Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys Met Phe Ala Arg
355 360 365
Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg Ala Gly His Gly
370 375 380
Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr Glu Lys Ser Glu
385 390 395 400
Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys Glu Ile Ala Asp
405 410 415
Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met Glu Asn Leu Glu
420 425 430
Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile Arg Leu Arg Gly
435 440 445
Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu Phe Lys Leu Lys
450 455 460
Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn Asn Thr Ser Lys
465 470 475 480
Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe Asn Phe Glu Tyr
485 490 495
Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu Lys Cys Asn Phe
500 505 510
Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile Ser Asn Pro Lys
515 520 525
Leu Lys Ser Thr Lys Glu Glu Pro Ser Gly Gly Ser Ser Gly Gly Ser
530 535 540
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
545 550 555 560
Ser Gly Gly Ser Ser Gly Gly Ser Ser Ser Glu Thr Gly Pro Val Ala
565 570 575
Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val
580 585 590
Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu
595 600 605
Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn
610 615 620
Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu
625 630 635 640
Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser
645 650 655
Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser
660 665 670
Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His
675 680 685
His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser
690 695 700
Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp
705 710 715 720
Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg
725 730 735
Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile
740 745 750
Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro
755 760 765
Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg
770 775 780
Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Gly Ser
785 790 795 800
Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
805 810 815
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu
820 825 830
Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val
835 840 845
His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
850 855 860
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser
865 870 875 880
Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser
885 890 895
Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys
900 905 910
Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu
915 920 925
Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala
930 935 940
Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala
945 950 955 960
Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu
965 970 975
Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly
980 985 990
Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val
995 1000
<210> 468
<211> 941
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas12f1 fusion protein with ABE (N terminal-Adenine deaminase)
<400> 468
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
195 200 205
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
210 215 220
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
225 230 235 240
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
245 250 255
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
260 265 270
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
275 280 285
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
290 295 300
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
305 310 315 320
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
325 330 335
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln
340 345 350
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly
355 360 365
Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
370 375 380
Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ala Lys Asn
385 390 395 400
Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser
405 410 415
Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys
420 425 430
Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys
435 440 445
His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala
450 455 460
Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys
465 470 475 480
Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu
485 490 495
Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser
500 505 510
Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala
515 520 525
Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg
530 535 540
Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser
545 550 555 560
Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser
565 570 575
Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys
580 585 590
Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser
595 600 605
Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu
610 615 620
Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln
625 630 635 640
Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys
645 650 655
Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys
660 665 670
Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg
675 680 685
Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile
690 695 700
Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly
705 710 715 720
Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala
725 730 735
Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys
740 745 750
Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys
755 760 765
Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu
770 775 780
Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala
785 790 795 800
Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln
805 810 815
Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn
820 825 830
Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile
835 840 845
Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro
850 855 860
Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr
865 870 875 880
Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys
885 890 895
Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn
900 905 910
Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro Lys Arg Pro
915 920 925
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
930 935 940
<210> 469
<211> 941
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas12f1 fusion protein with ABE (C terminal-Adenine deaminase)
<400> 469
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly
530 535 540
Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly
545 550 555 560
Ser Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
565 570 575
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
580 585 590
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
595 600 605
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
610 615 620
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
625 630 635 640
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
645 650 655
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
660 665 670
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
675 680 685
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
690 695 700
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
705 710 715 720
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
725 730 735
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
740 745 750
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
755 760 765
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
770 775 780
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
785 790 795 800
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
805 810 815
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
820 825 830
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
835 840 845
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
850 855 860
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
865 870 875 880
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
885 890 895
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln
900 905 910
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Lys Arg Pro
915 920 925
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
930 935 940
<210> 470
<211> 1267
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas12f1 fusion protein with MLV
<400> 470
Pro Lys Lys Lys Arg Lys Val Met Ala Lys Asn Thr Ile Thr Lys Thr
1 5 10 15
Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala Glu Val Glu Lys
20 25 30
Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile Ala Leu Glu Lys
35 40 45
Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His Leu Lys Val Ala
50 55 60
Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys Leu Phe Cys Lys
65 70 75 80
Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu Arg Gly Gln Phe
85 90 95
Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile Phe Arg Gln Leu
100 105 110
Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu Ile Glu Leu Tyr
115 120 125
Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn Ala Ser Ser Val
130 135 140
Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala Ala Glu Leu Phe
145 150 155 160
Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys Ile Lys Ser Asn
165 170 175
Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly Leu Pro Thr Thr
180 185 190
Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln Lys Gly Gly Gln
195 200 205
Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp Phe Ile Ile Lys
210 215 220
Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile Asp Lys Tyr Arg
225 230 235 240
Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys Ser Pro Lys Pro
245 250 255
Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg Asn Lys Gly Trp
260 265 270
Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys Val Met Asn Gly
275 280 285
Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly Ser Lys Ile Gly
290 295 300
Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp Val Pro Lys Ile
305 310 315 320
Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile Asp Val Gly Val
325 330 335
Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe Ser Arg Tyr Ser
340 345 350
Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys Met Phe Ala Arg
355 360 365
Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg Ala Gly His Gly
370 375 380
Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr Glu Lys Ser Glu
385 390 395 400
Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys Glu Ile Ala Asp
405 410 415
Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met Glu Asn Leu Glu
420 425 430
Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile Arg Leu Arg Gly
435 440 445
Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu Phe Lys Leu Lys
450 455 460
Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn Asn Thr Ser Lys
465 470 475 480
Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe Asn Phe Glu Tyr
485 490 495
Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu Lys Cys Asn Phe
500 505 510
Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile Ser Asn Pro Lys
515 520 525
Leu Lys Ser Thr Lys Glu Glu Pro Ser Gly Gly Ser Ser Gly Gly Ser
530 535 540
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
545 550 555 560
Ser Gly Gly Ser Ser Gly Gly Ser Ser Thr Leu Asn Ile Glu Asp Glu
565 570 575
Tyr Arg Leu His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser
580 585 590
Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met
595 600 605
Gly Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr
610 615 620
Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg
625 630 635 640
Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu
645 650 655
Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys Lys
660 665 670
Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu Val Asn
675 680 685
Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro Tyr Asn Leu
690 695 700
Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr Val Leu Asp Leu
705 710 715 720
Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro Thr Ser Gln Pro Leu
725 730 735
Phe Ala Phe Glu Trp Arg Asp Pro Glu Met Gly Ile Ser Gly Gln Leu
740 745 750
Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe
755 760 765
Asn Glu Ala Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His Pro
770 775 780
Asp Leu Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr
785 790 795 800
Ser Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu
805 810 815
Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln
820 825 830
Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp
835 840 845
Leu Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys
850 855 860
Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg
865 870 875 880
Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu
885 890 895
Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala
900 905 910
Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu
915 920 925
Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu Lys Gln Gly
930 935 940
Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro
945 950 955 960
Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val Ala Ala Gly Trp Pro
965 970 975
Pro Cys Leu Arg Met Val Ala Ala Ile Ala Val Leu Thr Lys Asp Ala
980 985 990
Gly Lys Leu Thr Met Gly Gln Pro Leu Val Ile Leu Ala Pro His Ala
995 1000 1005
Val Glu Ala Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala
1010 1015 1020
Arg Met Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln
1025 1030 1035 1040
Phe Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro
1045 1050 1055
Glu Glu Gly Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala His
1060 1065 1070
Gly Thr Arg Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His
1075 1080 1085
Thr Trp Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys
1090 1095 1100
Ala Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys Ala
1105 1110 1115 1120
Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr
1125 1130 1135
Gln Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp
1140 1145 1150
Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly Glu Ile Tyr Arg
1155 1160 1165
Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp
1170 1175 1180
Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser
1185 1190 1195 1200
Ile Ile His Cys Pro Gly His Gln Lys Gly His Ser Ala Glu Ala Arg
1205 1210 1215
Gly Asn Arg Met Ala Asp Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu
1220 1225 1230
Thr Pro Asp Thr Ser Thr Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly
1235 1240 1245
Gly Ser Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys
1250 1255 1260
Arg Lys Val
1265
<210> 471
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 471
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 472
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 472
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 473
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 473
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 474
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 474
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 475
<211> 38
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 475
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 476
<211> 42
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 476
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 477
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 477
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 478
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 478
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 479
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 479
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 480
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 480
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 481
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 481
Asp Arg Leu Arg Arg
1 5
<210> 482
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 482
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 483
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 483
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 484
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 484
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 485
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 485
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 486
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 486
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 487
<211> 1587
<212> DNA
<213> Artificial Sequence
<220>
<223> human codon optimized nucleic acid encoding Cas12f1 protein
<400> 487
atggccaaga acacaattac aaagacactg aagctgagga tcgtgagacc atacaacagc 60
gctgaggtcg agaagattgt ggctgatgaa aagaacaaca gggaaaagat cgccctcgag 120
aagaacaagg ataaggtgaa ggaggcctgc tctaagcacc tgaaagtggc cgcctactgc 180
accacacagg tggagaggaa cgcctgtctg ttttgtaaag ctcggaagct ggatgataag 240
ttttaccaga agctgcgggg ccagttcccc gatgccgtct tttggcagga gattagcgag 300
atcttcagac agctgcagaa gcaggccgcc gagatctaca accagagcct gatcgagctc 360
tactacgaga tcttcatcaa gggcaagggc attgccaacg cctcctccgt ggagcactac 420
ctgagcgacg tgtgctacac aagagccgcc gagctcttta agaacgccgc tatcgcttcc 480
gggctgagga gcaagattaa gagtaacttc cggctcaagg agctgaagaa catgaagagc 540
ggcctgccca ctacaaagag cgacaacttc ccaattccac tggtgaagca gaaggggggc 600
cagtacacag ggttcgagat ttccaaccac aacagcgact ttattattaa gatccccttt 660
ggcaggtggc aggtcaagaa ggagattgac aagtacaggc cctgggagaa gtttgatttc 720
gagcaggtgc agaagagccc caagcctatt tccctgctgc tgtccacaca gcggcggaag 780
aggaacaagg ggtggtctaa ggatgagggg accgaggccg agattaagaa agtgatgaac 840
ggcgactacc agacaagcta catcgaggtc aagcggggca gtaagattgg cgagaagagc 900
gcctggatgc tgaacctgag cattgacgtg ccaaagattg ataagggcgt ggatcccagc 960
atcatcggag ggatcgatgt gggggtcaag agccccctcg tgtgcgccat caacaacgcc 1020
ttcagcaggt acagcatctc cgataacgac ctgttccact ttaacaagaa gatgttcgcc 1080
cggcggagga ttttgctcaa gaagaaccgg cacaagcggg ccggacacgg ggccaagaac 1140
aagctcaagc ccatcactat cctgaccgag aagagcgaga ggttcaggaa gaagctcatc 1200
gagagatggg cctgcgagat cgccgatttc tttattaaga acaaggtcgg aacagtgcag 1260
atggagaacc tcgagagcat gaagaggaag gaggattcct acttcaacat tcggctgagg 1320
gggttctggc cctacgctga gatgcagaac aagattgagt ttaagctgaa gcagtacggg 1380
attgagatcc ggaaggtggc ccccaacaac accagcaaga cctgcagcaa gtgcgggcac 1440
ctcaacaact acttcaactt cgagtaccgg aagaagaaca agttcccaca cttcaagtgc 1500
gagaagtgca actttaagga gaacgccgat tacaacgccg ccctgaacat cagcaaccct 1560
aagctgaaga gcactaagga ggagccc 1587
<210> 488
<211> 24
<212> DNA
<213> Homo sapiens
<400> 488
tttgcacaca cacagtgggc tacc 24
<210> 489
<211> 24
<212> DNA
<213> Homo sapiens
<400> 489
tttgcatccc caggacacac acac 24
<210> 490
<211> 24
<212> DNA
<213> Homo sapiens
<400> 490
tttaagaaca catacccctg ggcc 24
<210> 491
<211> 24
<212> DNA
<213> Homo sapiens
<400> 491
tttgactcag caatcctatt actg 24
<210> 492
<211> 24
<212> DNA
<213> Homo sapiens
<400> 492
tttatattcc tgtgggtata tgcc 24
<210> 493
<211> 24
<212> DNA
<213> Homo sapiens
<400> 493
tttaagaggt gattaggtca tggc 24
<210> 494
<211> 24
<212> DNA
<213> Homo sapiens
<400> 494
tttaatccat tcatgagggt ggtg 24
<210> 495
<211> 24
<212> DNA
<213> Homo sapiens
<400> 495
tttagctcaa atctgtacta ctaa 24
<210> 496
<211> 24
<212> DNA
<213> Homo sapiens
<400> 496
tttattatta tagtgtgtac ttga 24
<210> 497
<211> 24
<212> DNA
<213> Homo sapiens
<400> 497
tttatgtcct catagcttac cttc 24
<210> 498
<211> 24
<212> DNA
<213> Homo sapiens
<400> 498
tttaattgta tgttctcact cata 24
<210> 499
<211> 24
<212> DNA
<213> Homo sapiens
<400> 499
tttgggtctg tggctgttgg gctg 24
<210> 500
<211> 24
<212> DNA
<213> Homo sapiens
<400> 500
tttagagccc atctcagatc cctg 24
<210> 501
<211> 24
<212> DNA
<213> Homo sapiens
<400> 501
tttaccagtg aagatataac atta 24
<210> 502
<211> 24
<212> DNA
<213> Homo sapiens
<400> 502
tttagtgagg cttcttaaga tgtc 24
<210> 503
<211> 24
<212> DNA
<213> Homo sapiens
<400> 503
tttgctgctg gtaacaaggt cata 24
<210> 504
<211> 24
<212> DNA
<213> Homo sapiens
<400> 504
tttagatctg agacccagct gctc 24
<210> 505
<211> 24
<212> DNA
<213> Homo sapiens
<400> 505
tttgtccttg accacggcat cagc 24
<210> 506
<211> 24
<212> DNA
<213> Homo sapiens
<400> 506
tttaagtggg aataatatag ttcc 24
<210> 507
<211> 24
<212> DNA
<213> Homo sapiens
<400> 507
tttgaagaca tcttgctgtc agac 24
<210> 508
<211> 24
<212> DNA
<213> Homo sapiens
<400> 508
tttgtgtata attattcaga gtag 24
<210> 509
<211> 24
<212> DNA
<213> Homo sapiens
<400> 509
tttggcatca agttaacatc acac 24
<210> 510
<211> 24
<212> DNA
<213> Homo sapiens
<400> 510
tttagcactg aggcttgaga cttg 24
<210> 511
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 511
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucaauu uuccucucca auucugcaca a 161
<210> 512
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 512
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucaguu uuccucucca auucugcaca a 161
<210> 513
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 513
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucacuu uuccucucca auucugcaca a 161
<210> 514
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 514
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauau uuccucucca auucugcaca a 161
<210> 515
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 515
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucaugu uuccucucca auucugcaca a 161
<210> 516
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 516
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucaucu uuccucucca auucugcaca a 161
<210> 517
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 517
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauua uuccucucca auucugcaca a 161
<210> 518
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 518
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauug uuccucucca auucugcaca a 161
<210> 519
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 519
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuc uuccucucca auucugcaca a 161
<210> 520
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 520
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu auccucucca auucugcaca a 161
<210> 521
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 521
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu guccucucca auucugcaca a 161
<210> 522
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 522
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uaccucucca auucugcaca a 161
<210> 523
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 523
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu ugccucucca auucugcaca a 161
<210> 524
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 524
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu ucccucucca auucugcaca a 161
<210> 525
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 525
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucaguu cuccucucca auucugcaca a 161
<210> 526
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 526
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucaucu cuccucucca auucugcaca a 161
<210> 527
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 527
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauug cuccucucca auucugcaca a 161
<210> 528
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 528
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu ccccucucca auucugcaca a 161
<210> 529
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 529
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagcu cuccucucca auucugcaca a 161
<210> 530
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 530
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucaguu ccccucucca auucugcaca a 161
<210> 531
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 531
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucaucg cuccucucca auucugcaca a 161
<210> 532
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 532
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucaucu ccccucucca auucugcaca a 161
<210> 533
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 533
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauug ccccucucca auucugcaca a 161
<210> 534
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 534
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagcg cuccucucca auucugcaca a 161
<210> 535
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 535
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagcu ccccucucca auucugcaca a 161
<210> 536
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 536
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagug ccccucucca auucugcaca a 161
<210> 537
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 537
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucaucg ccccucucca auucugcaca a 161
<210> 538
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 538
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagcg ccccucucca auucugcaca a 161
<210> 539
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> repeat sequence of engineered crRNA
<400> 539
guugcagaac ccgaauagag caaugaagga augcaac 37
<210> 540
<211> 202
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence
<400> 540
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagug cuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagagcaaug aaggaaugca ac 202
<210> 541
<211> 189
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence
<400> 541
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagug cuccucucca auucgaaaga acccgaauag agcaaugaag 180
gaaugcaac 189
<210> 542
<211> 177
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence
<400> 542
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagug cuccucucga aagaauagag caaugaagga augcaac 177
<210> 543
<211> 165
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence
<400> 543
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagug cugaaaagca augaaggaau gcaac 165
<210> 544
<211> 196
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence
<400> 544
cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc agugcuccuc uccaauucug cacaagaaag uugcagaacc cgaauagagc 180
aaugaaggaa ugcaac 196
<210> 545
<211> 54
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 545
gaauagagca augaaggaau gcaacnnnnn nnnnnnnnnn nnnnnuuuua uuuu 54
<210> 546
<211> 189
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence
<400> 546
cuucacugau aaaguggaga accgcuucac caaaagcuua ggaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucagugcuc cucuccaauu cugcacaaga aaguugcaga acccgaauag agcaaugaag 180
gaaugcaac 189
<210> 547
<211> 181
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence
<400> 547
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc 120
uccucuccaa uucugcacaa gaaaguugca gaacccgaau agagcaauga aggaaugcaa 180
c 181
<210> 548
<211> 154
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 548
gauaaagugg agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa 60
ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga 120
aacaaauuca gugcuccucu ccaauucugc acaa 154
<210> 549
<211> 147
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 549
uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu gaaggugggc 60
ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaau 120
ucagugcucc ucuccaauuc ugcacaa 147
<210> 550
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 550
uuuuauuuuu 10
<210> 551
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 551
uuuuauuuuu u 11
<210> 552
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 552
uuuuauuuuu uu 12
<210> 553
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 553
uuuuauuuuu uuu 13
<210> 554
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 554
uuuuauuuuu uuuu 14
<210> 555
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 555
uuuuauuuuu uuuuu 15
<210> 556
<211> 149
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 556
aguggagaac cgcuucacca aaagcugucc cuuaggggau uagaacuuga gugaaggugg 60
gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc cucgaaacaa 120
auucagugcu ccucuccaau ucugcacaa 149
<210> 557
<211> 148
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 557
guggagaacc gcuucaccaa aagcuguccc uuaggggauu agaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucagugcuc cucuccaauu cugcacaa 148
<210> 558
<211> 146
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 558
ggagaaccgc uucaccaaaa gcugucccuu aggggauuag aacuugagug aaggugggcu 60
gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120
cagugcuccu cuccaauucu gcacaa 146
<210> 559
<211> 145
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 559
gagaaccgcu ucaccaaaag cugucccuua ggggauuaga acuugaguga aggugggcug 60
cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg aaacaaauuc 120
agugcuccuc uccaauucug cacaa 145
<210> 560
<211> 144
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 560
agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa ggugggcugc 60
uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca 120
gugcuccucu ccaauucugc acaa 144
<210> 561
<211> 143
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 561
gaaccgcuuc accaaaagcu gucccuuagg ggauuagaac uugagugaag gugggcugcu 60
ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa acaaauucag 120
ugcuccucuc caauucugca caa 143
<210> 562
<211> 142
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 562
aaccgcuuca ccaaaagcug ucccuuaggg gauuagaacu ugagugaagg ugggcugcuu 60
gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaauucagu 120
gcuccucucc aauucugcac aa 142
<210> 563
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 563
ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc 120
uccucuccaa uucugcacaa 140
<210> 564
<211> 182
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 564
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auucugcaca agaaaguugc agaacccgaa uagagcaaug aaggaaugca 180
ac 182
<210> 565
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 565
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca gaaaccgaau agagcaauga aggaaugcaa c 161
<210> 566
<211> 157
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 566
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucga aagaauagag caaugaagga augcaac 157
<210> 567
<211> 145
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 567
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cugaaaagca augaaggaau gcaac 145
<210> 568
<211> 181
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 568
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auucugcaca gaaaguugca gaacccgaau agagcaauga aggaaugcaa 180
c 181
<210> 569
<211> 179
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 569
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auucugcacg aaauugcaga acccgaauag agcaaugaag gaaugcaac 179
<210> 570
<211> 177
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 570
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auucugcaga aaugcagaac ccgaauagag caaugaagga augcaac 177
<210> 571
<211> 175
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 571
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auucugcgaa agcagaaccc gaauagagca augaaggaau gcaac 175
<210> 572
<211> 173
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 572
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auucuggaaa cagaacccga auagagcaau gaaggaaugc aac 173
<210> 573
<211> 171
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 573
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auucugaaaa gaacccgaau agagcaauga aggaaugcaa c 171
<210> 574
<211> 169
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 574
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auucgaaaga acccgaauag agcaaugaag gaaugcaac 169
<210> 575
<211> 167
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 575
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auugaaaaac ccgaauagag caaugaagga augcaac 167
<210> 576
<211> 165
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 576
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca augaaaaccc gaauagagca augaaggaau gcaac 165
<210> 577
<211> 163
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 577
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca agaaacccga auagagcaau gaaggaaugc aac 163
<210> 578
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 578
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca gaaaccgaau agagcaauga aggaaugcaa c 161
<210> 579
<211> 159
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 579
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucuccg aaacgaauag agcaaugaag gaaugcaac 159
<210> 580
<211> 155
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 580
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucugaa aaauagagca augaaggaau gcaac 155
<210> 581
<211> 153
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 581
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucgaaa auagagcaau gaaggaaugc aac 153
<210> 582
<211> 151
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 582
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccugaaau agagcaauga aggaaugcaa c 151
<210> 583
<211> 149
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 583
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccgaaaag agcaaugaag gaaugcaac 149
<210> 584
<211> 147
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 584
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cucgaaagag caaugaagga augcaac 147
<210> 585
<211> 145
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence and U-rich tail sequence
<400> 585
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cugaaaagca augaaggaau gcaac 145
<210> 586
<211> 202
<212> RNA
<213> Artificial Sequence
<220>
<223> wildtype gRNA
<400> 586
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca ac 202
<210> 587
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence
<400> 587
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc 120
uccucucgaa agaauagagc aaugaaggaa ugcaac 156
<210> 588
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence
<400> 588
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuccaa uucugcacaa 120
gaaaguugca gaacccgaau agagcaauga aggaaugcaa c 161
<210> 589
<211> 136
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA without guide sequence
<400> 589
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucucgaa agaauagagc 120
aaugaaggaa ugcaac 136
<210> 590
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 590
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc 120
nccucuccaa uucugcacaa 140
<210> 591
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> repeat sequence of engineered crRNA
<400> 591
guugcagaac ccgaauagng nnnugaagga augcaac 37
<210> 592
<211> 148
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 592
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucannn cnccucuc 148
<210> 593
<211> 127
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 593
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc 120
nccucuc 127
<210> 594
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> repeat sequence of engineered crRNA
<400> 594
gaauagngnn nugaaggaau gcaac 25
<210> 595
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 595
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc 120
uccucuccaa uucugcacaa 140
<210> 596
<211> 147
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 596
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucgugc uccucuc 147
<210> 597
<211> 127
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 597
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc 120
uccucuc 127
<210> 598
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> repeat sequence of engineered crRNA
<400> 598
gaauagagca augaaggaau gcaac 25
<210> 599
<211> 210
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered gRNA including hammerhead ribozyme nucleotide sequence
without guide sequence
<400> 599
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauug cuccucuccu gaugaguccg ugaggacgaa acgaguaagc 180
ucgucgaaua gagcaaugaa ggaaugcaac 210
<210> 600
<211> 62
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA including hammerhead ribozyme nucleotide
sequence without guide sequence
<400> 600
cugaugaguc cgugaggacg aaacgaguaa gcucgucgaa uagagcaaug aaggaaugca 60
ac 62
<210> 601
<211> 89
<212> DNA
<213> Homo sapiens
<400> 601
ttcctcagga gcacctgggg tgcttttaag aacacatacc cctgggccgg gcatggtggc 60
tcacgcctgt aatcccagca ctttgggaa 89
<210> 602
<211> 78
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 602
ttcctcagga gcacctgggg tgcttttaag aacacatacc catggtggct cacgcctgta 60
atcccagcac tttgggaa 78
<210> 603
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 603
ttcctcagga gcacctgggg tgcttttaag aacacatacc ccatggtggc tcacgcctgt 60
aatcccagca ctttgggaa 79
<210> 604
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 604
ttcctcagga gcacctgggg tgcttttaag aacacatacc cctgtaatcc cagcactttg 60
ggaa 64
<210> 605
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 605
ttcctcagga gcacctgggg tgcttttaag aacacatacc cctatggtgg ctcacgcctg 60
taatcccagc actttgggaa 80
<210> 606
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 606
ttcctcagga gcacctgggg tgcttttaag aacacatacc cctgatggtg gctcacgcct 60
gtaatcccag cactttggga a 81
<210> 607
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 607
ttcctcagga gcacctgggg tgcttttaag aacacatacc atggtggctc acgcctgtaa 60
tcccagcact ttgggaa 77
<210> 608
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 608
ttcctcagga gcacctgggg tgcttttaag aacacatacg cctgtaatcc cagcactttg 60
ggaa 64
<210> 609
<211> 82
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 609
ttcctcagga gcacctgggg tgcttttaag aacacatacc cctggatggt ggctcacgcc 60
tgtaatccca gcactttggg aa 82
<210> 610
<211> 78
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 610
ttcctcagga gcacctgggg tgcttttaag aacacatacc cctggtggct cacgcctgta 60
atcccagcac tttgggaa 78
<210> 611
<211> 71
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 611
ttcctcagga gcacctgggg tgcttttaag aacacatacc cctcacgcct gtaatcccag 60
cactttggga a 71
<210> 612
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 612
ttcctcagga gcacctgggg tgcttttaag aacacatacc cctggctcac gcctgtaatc 60
ccagcacttt gggaa 75
<210> 613
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 613
ttcctcagga gcacctgtaa tcccagcact ttgggaa 37
<210> 614
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 614
ttcctcagga gcacctgggg tgcttttaag aacacatacc ctgtaatccc agcactttgg 60
gaa 63
<210> 615
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 615
ttcctcagga gcacctgggg tgcttttaag aacacatacc cctgggccgt ggtggctcac 60
gcctgtaatc ccagcacttt gggaa 85
<210> 616
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 616
ttcctcagga gcacctgggg tgcttttaag aacacatacc tgtaatccca gcactttggg 60
aa 62
<210> 617
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 617
ttcctcagga gcacctgggg tgcttttaag aacacatacc cctgggcatg gtggctcacg 60
cctgtaatcc cagcactttg ggaa 84
<210> 618
<211> 86
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 618
ttcctcagga gcacctgggg tgcttttaag aacacatacc cctgggccga tggtggctca 60
cgcctgtaat cccagcactt tgggaa 86
<210> 619
<211> 86
<212> DNA
<213> Artificial Sequence
<220>
<223> protospacer sequence modified by engineered CRISPR/Cas12f1 system
<400> 619
ttcctcagga gcacctgggg tgcttttaag aacacatacc cctgggccca tggtggctca 60
cgcctgtaat cccagcactt tgggaa 86
<210> 620
<211> 20
<212> DNA
<213> Homo sapiens
<400> 620
ccttaataaa gtataacttc 20
<210> 621
<211> 20
<212> DNA
<213> Homo sapiens
<400> 621
aagaaggaat ggtagttgag 20
<210> 622
<211> 20
<212> DNA
<213> Homo sapiens
<400> 622
atttccaagt caaccttatg 20
<210> 623
<211> 20
<212> DNA
<213> Homo sapiens
<400> 623
caacagcctc accaggaaca 20
<210> 624
<211> 20
<212> DNA
<213> Homo sapiens
<400> 624
ggcaagggtc ttgatgcatc 20
<210> 625
<211> 20
<212> DNA
<213> Homo sapiens
<400> 625
ccctggctac ctcccctacc 20
<210> 626
<211> 20
<212> DNA
<213> Homo sapiens
<400> 626
gattcattct cagtgccatg 20
<210> 627
<211> 20
<212> DNA
<213> Homo sapiens
<400> 627
aggcaattgc aaccactgaa 20
<210> 628
<211> 20
<212> DNA
<213> Homo sapiens
<400> 628
tactttgtcc tccggttctg 20
<210> 629
<211> 20
<212> DNA
<213> Homo sapiens
<400> 629
ggttctctct atagccattg 20
<210> 630
<211> 20
<212> DNA
<213> Homo sapiens
<400> 630
actttagtga ctagccgcca 20
<210> 631
<211> 20
<212> DNA
<213> Homo sapiens
<400> 631
gtgggtaggt ccagtttggg 20
<210> 632
<211> 20
<212> DNA
<213> Homo sapiens
<400> 632
acaaagaaac cagcagtggc 20
<210> 633
<211> 20
<212> DNA
<213> Homo sapiens
<400> 633
cctggtggct gagaccaggg 20
<210> 634
<211> 20
<212> DNA
<213> Homo sapiens
<400> 634
cagagtcccg ggaacaagcc 20
<210> 635
<211> 20
<212> DNA
<213> Homo sapiens
<400> 635
ccaaagtgat gggccagcac 20
<210> 636
<211> 20
<212> DNA
<213> Homo sapiens
<400> 636
agagcagcga ttgtaaggag 20
<210> 637
<211> 20
<212> DNA
<213> Homo sapiens
<400> 637
gaaatatgac tggaagtaaa 20
<210> 638
<211> 20
<212> DNA
<213> Homo sapiens
<400> 638
cttccagtca tatttctaaa 20
<210> 639
<211> 20
<212> DNA
<213> Homo sapiens
<400> 639
cccttattac aatcctgtgg 20
<210> 640
<211> 20
<212> DNA
<213> Homo sapiens
<400> 640
cccccacagg attgtaataa 20
<210> 641
<211> 20
<212> DNA
<213> Homo sapiens
<400> 641
atctccataa caatctttgg 20
<210> 642
<211> 20
<212> DNA
<213> Homo sapiens
<400> 642
ctatccccat tttacagatg 20
<210> 643
<211> 20
<212> DNA
<213> Homo sapiens
<400> 643
ctgagatttg cgaagagtta 20
<210> 644
<211> 20
<212> DNA
<213> Homo sapiens
<400> 644
attaaataga gtcttttgaa 20
<210> 645
<211> 20
<212> DNA
<213> Homo sapiens
<400> 645
atattaattg caagtttggg 20
<210> 646
<211> 20
<212> DNA
<213> Homo sapiens
<400> 646
ggccaagtgc gaagtcagag 20
<210> 647
<211> 20
<212> DNA
<213> Homo sapiens
<400> 647
ggggtgaaca cccaagatcc 20
<210> 648
<211> 20
<212> DNA
<213> Homo sapiens
<400> 648
gggtgggctc ctggcagggc 20
<210> 649
<211> 20
<212> DNA
<213> Homo sapiens
<400> 649
agaagcatgc aaaaccggca 20
<210> 650
<211> 20
<212> DNA
<213> Homo sapiens
<400> 650
aagaggggag gttgactttg 20
<210> 651
<211> 20
<212> DNA
<213> Homo sapiens
<400> 651
gtcaaataaa gaaaaatacg 20
<210> 652
<211> 20
<212> DNA
<213> Homo sapiens
<400> 652
atgcatctca gtggttaaca 20
<210> 653
<211> 20
<212> DNA
<213> Homo sapiens
<400> 653
catacagggc tctgtaccca 20
<210> 654
<211> 20
<212> DNA
<213> Homo sapiens
<400> 654
caaagacact caccctgttg 20
<210> 655
<211> 20
<212> DNA
<213> Homo sapiens
<400> 655
agaacacata cccctgggcc 20
<210> 656
<211> 20
<212> DNA
<213> Homo sapiens
<400> 656
ataataaaag tatttcctca 20
<210> 657
<211> 20
<212> DNA
<213> Homo sapiens
<400> 657
agccgtggtc agtgagaggc 20
<210> 658
<211> 20
<212> DNA
<213> Homo sapiens
<400> 658
gagctcatta gcttggggag 20
<210> 659
<211> 20
<212> DNA
<213> Homo sapiens
<400> 659
gaaaataact aaacttccca 20
<210> 660
<211> 20
<212> DNA
<213> Homo sapiens
<400> 660
aattctttaa gtaatttaag 20
<210> 661
<211> 20
<212> DNA
<213> Homo sapiens
<400> 661
cttagtagtc tcagaaccaa 20
<210> 662
<211> 20
<212> DNA
<213> Homo sapiens
<400> 662
aaaggagcac aagtacaaac 20
<210> 663
<211> 20
<212> DNA
<213> Homo sapiens
<400> 663
aatgatgcag taatcgtgta 20
<210> 664
<211> 20
<212> DNA
<213> Homo sapiens
<400> 664
ataaaaggaa ctatttacaa 20
<210> 665
<211> 20
<212> DNA
<213> Homo sapiens
<400> 665
gagagaccgc tcaggctgga 20
<210> 666
<211> 20
<212> DNA
<213> Homo sapiens
<400> 666
attttgaagt gaccgtacga 20
<210> 667
<211> 20
<212> DNA
<213> Homo sapiens
<400> 667
ataatacact ctttacactg 20
<210> 668
<211> 20
<212> DNA
<213> Homo sapiens
<400> 668
aagagttatt gtcaatagaa 20
<210> 669
<211> 20
<212> DNA
<213> Homo sapiens
<400> 669
caaagaaatg tactgcctta 20
<210> 670
<211> 20
<212> DNA
<213> Homo sapiens
<400> 670
aaataaccgt cggtttctta 20
<210> 671
<211> 20
<212> DNA
<213> Homo sapiens
<400> 671
caaacaaaat aattggctca 20
<210> 672
<211> 20
<212> DNA
<213> Homo sapiens
<400> 672
gccatggtga aggtgaaatc 20
<210> 673
<211> 20
<212> DNA
<213> Homo sapiens
<400> 673
gcagtacacc tgagggaaca 20
<210> 674
<211> 20
<212> DNA
<213> Homo sapiens
<400> 674
aagaaagcta caggaaagca 20
<210> 675
<211> 20
<212> DNA
<213> Homo sapiens
<400> 675
ctttaaaatg aggtactagg 20
<210> 676
<211> 20
<212> DNA
<213> Homo sapiens
<400> 676
ccaaccaggt accctgtgcc 20
<210> 677
<211> 20
<212> DNA
<213> Homo sapiens
<400> 677
attgaaacat atacgtggta 20
<210> 678
<211> 20
<212> DNA
<213> Homo sapiens
<400> 678
ggaaagcgca gaaaagtaaa 20
<210> 679
<211> 20
<212> DNA
<213> Homo sapiens
<400> 679
agggaatgaa agtgaagatg 20
<210> 680
<211> 20
<212> DNA
<213> Homo sapiens
<400> 680
gatcaattta catcaaacta 20
<210> 681
<211> 20
<212> DNA
<213> Homo sapiens
<400> 681
atttcacagg actttgttaa 20
<210> 682
<211> 20
<212> DNA
<213> Homo sapiens
<400> 682
agacaagctg tcttccttca 20
<210> 683
<211> 20
<212> DNA
<213> Homo sapiens
<400> 683
atctgaagat cattgaaaca 20
<210> 684
<211> 20
<212> DNA
<213> Homo sapiens
<400> 684
gtctaataga aatatagtac 20
<210> 685
<211> 20
<212> DNA
<213> Homo sapiens
<400> 685
gagggagaca caagttgata 20
<210> 686
<211> 20
<212> DNA
<213> Homo sapiens
<400> 686
gtctcagtct tccttgtggg 20
<210> 687
<211> 20
<212> DNA
<213> Homo sapiens
<400> 687
ggggtagagg tactctacag 20
<210> 688
<211> 20
<212> DNA
<213> Homo sapiens
<400> 688
ggggtagagg tagtctacag 20
<210> 689
<211> 20
<212> DNA
<213> Homo sapiens
<400> 689
acaagttcag aatcacctta 20
<210> 690
<211> 20
<212> DNA
<213> Homo sapiens
<400> 690
gcattaaggc cagcgctggg 20
<210> 691
<211> 20
<212> DNA
<213> Homo sapiens
<400> 691
cacataggcc attcagaaac 20
<210> 692
<211> 20
<212> DNA
<213> Homo sapiens
<400> 692
gaaactgccc caaaaccggc 20
<210> 693
<211> 20
<212> DNA
<213> Homo sapiens
<400> 693
aggactatgt gtggccagtg 20
<210> 694
<211> 20
<212> DNA
<213> Homo sapiens
<400> 694
aacaaatcac tgactaacca 20
<210> 695
<211> 20
<212> DNA
<213> Homo sapiens
<400> 695
ataatgcctt ttaggtgata 20
<210> 696
<211> 20
<212> DNA
<213> Homo sapiens
<400> 696
attttcaaaa cagccctatg 20
<210> 697
<211> 20
<212> DNA
<213> Homo sapiens
<400> 697
cacaagggat ctgagacttg 20
<210> 698
<211> 20
<212> DNA
<213> Homo sapiens
<400> 698
actcatacat cacctcctcc 20
<210> 699
<211> 20
<212> DNA
<213> Homo sapiens
<400> 699
aaggaaaggc ttcctggagg 20
<210> 700
<211> 20
<212> DNA
<213> Homo sapiens
<400> 700
atataggatt tagaaaccaa 20
<210> 701
<211> 20
<212> DNA
<213> Homo sapiens
<400> 701
gctctaatgt aagtatatcc 20
<210> 702
<211> 20
<212> DNA
<213> Homo sapiens
<400> 702
gatccgatgc aattttggga 20
<210> 703
<211> 20
<212> DNA
<213> Homo sapiens
<400> 703
cctgaactcg ggactcgacc 20
<210> 704
<211> 20
<212> DNA
<213> Homo sapiens
<400> 704
gaacccagtg aaaaatacca 20
<210> 705
<211> 20
<212> DNA
<213> Homo sapiens
<400> 705
gtaggctgct gttggacaga 20
<210> 706
<211> 20
<212> DNA
<213> Homo sapiens
<400> 706
aataagtctt accacgtgtc 20
<210> 707
<211> 20
<212> DNA
<213> Homo sapiens
<400> 707
attcccacaa taaccctatg 20
<210> 708
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 708
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucannn vnccucucca auucugcaca a 161
<210> 709
<211> 57
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 709
guugcagaac ccgaauagnb nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57
<210> 710
<211> 148
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 710
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucannn vnccucuc 148
<210> 711
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 711
gaauagnbnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45
<210> 712
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 712
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnv 120
nccucuccaa uucugcacaa 140
<210> 713
<211> 57
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 713
guugcagaac ccgaauagnb nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57
<210> 714
<211> 127
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 714
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnv 120
nccucuc 127
<210> 715
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 715
gaauagnbnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45
<210> 716
<211> 141
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 716
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120
vnccucucca auucugcaca a 141
<210> 717
<211> 57
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 717
guugcagaac ccgaauagnb nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57
<210> 718
<211> 128
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 718
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120
vnccucuc 128
<210> 719
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 719
gaauagnbnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45
<210> 720
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 720
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucannn vnccucucca auucugcaca a 161
<210> 721
<211> 57
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA without U-rich tail sequence
<400> 721
guugcagaac ccgaauagnb nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57
<210> 722
<211> 148
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 722
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucannn vnccucuc 148
<210> 723
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA without U-rich tail sequence
<400> 723
gaauagnbnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45
<210> 724
<211> 120
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 724
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnv nccucuccaa uucugcacaa 120
120
<210> 725
<211> 57
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 725
guugcagaac ccgaauagnb nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57
<210> 726
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 726
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnv nccucuc 107
<210> 727
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA
<400> 727
gaauagnbnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45
<210> 728
<211> 141
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 728
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120
vnccucucca auucugcaca a 141
<210> 729
<211> 57
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA without U-rich tail sequence
<400> 729
guugcagaac ccgaauagnb nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57
<210> 730
<211> 128
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 730
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120
vnccucuc 128
<210> 731
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA without U-rich tail sequence
<400> 731
gaauagnbnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45
<210> 732
<211> 120
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 732
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnv nccucuccaa uucugcacaa 120
120
<210> 733
<211> 57
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA without U-rich sequence
<400> 733
guugcagaac ccgaauagnb nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57
<210> 734
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 734
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnv nccucuc 107
<210> 735
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered crRNA without U-rich tail sequence
<400> 735
gaauagnbnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45
<210> 736
<211> 148
<212> RNA
<213> Artificial Sequence
<220>
<223> engineered tracrRNA
<400> 736
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauug cuccucuc 148
<210> 737
<211> 122
<212> DNA
<213> Artificial Sequence
<220>
<223> a sequence comprising a protospacer and a site recognized by ApaI
restriction enzyme
<400> 737
gggcgaattg ggccctctag atgcatgctc gagcggccgc cagtgtgatg gatatctgca 60
gaattcgccc tttgcattta agaacacata cccctgggcc aggatgcatg catgcatgca 120
tg 122
Claims (25)
- CRISPR/Cas12f1(Cas14a1) 시스템을 위한 엔지니어링된 가이드 RNA로서,
엔지니어링된 tracrRNA(trans-activating crispr RNA) 및 crRNA(crispr RNA)를 포함하고,
상기 엔지니어링된 tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것이고, 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3'말단에서 5'말단 방향으로 순서대로 포함하고,
상기 제1 서열은 5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 194) 서열 또는 SEQ ID NO: 194 서열의 일부 서열이고, 상기 각각의 N은 독립적으로 A, C, G 또는 U이고, 상기 V는 A, C 또는 G이며, 상기 SEQ ID NO: 194 서열의 일부 서열은 상기 SEQ ID NO: 194 서열 중 5'-CAAAUUCANNNVN-3' (SEQ ID NO: 193) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열이고,
상기 제2 서열은 5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO: 211) 서열 또는 SEQ ID NO: 211 서열에 적어도 90% 이상의 서열 동일성 또는 서열 유사성을 가지고, Cas12f1 단백질의 REC 도메인 또는 RuvC 도메인과 상호작용하는 서열이고,
상기 제3 서열은 5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO: 212) 서열 또는 SEQ ID NO: 212 서열에 적어도 90% 이상의 서열 동일성 또는 서열 유사성을 가지고, Cas12f1 단백질의 WED 도메인, ZF 도메인 또는 RuvC 도메인과 상호작용하는 서열이고,
상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 213) 서열 또는 SEQ ID NO: 213 서열의 일부 서열이고, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열이고,
상기 제5 서열은 5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 248) 서열 또는 SEQ ID NO: 248 서열의 일부 서열이고, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열이며,
상기 crRNA은 야생형 crRNA 또는 엔지니어링된 crRNA이며,
상기 야생형 crRNA는 야생형 반복 서열(repeat sequence) 및 가이드 서열(guide sequence)을 5' 말단에서 3' 말단 방향으로 순서대로 포함하고, 상기 야생형 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열이며,
상기 엔지니어링된 crRNA는 제6 서열, 제7 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함하고,
상기 제6 서열은 5'-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 373) 서열 또는 SEQ ID NO: 373 서열의 일부 서열이고, 상기 각각의 N은 독립적으로 A, C, G 또는 U이고, 상기 B는 U, C 또는 G이며, 상기 SEQ ID NO: 373 서열의 일부 서열은 상기 SEQ ID NO: 373 서열 중 5'-NBNNNUGAAGGA-3' (SEQ ID NO: 372) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열이고,
상기 제7 서열은 5'-AUGCAAC-3' 서열 또는 5'-AUGCAAC-3' 서열에 적어도 80% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열이고,
상기 가이드 서열은 표적 서열과 혼성화(hybridizing)할 수 있는 서열 또는 표적 서열과 상보적인 결합을 형성하는 서열이고, 15 내지 30 nt(nucleotide) 서열인,
엔지니어링된 가이드 RNA. - 제1항에 있어서,
상기 제1 서열은 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 111) 서열 또는 SEQ ID NO: 111 서열의 일부 서열이고,
상기 SEQ ID NO: 111 서열의 일부 서열은
5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACA-3' (SEQ ID NO: 273) 서열,
5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCAC-3' (SEQ ID NO: 274) 서열,
5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 275) 서열,
5'-CAAAUUCANNNCNCCUCUCCAAUUCUGC-3' (SEQ ID NO: 276) 서열,
5'-CAAAUUCANNNCNCCUCUCCAAUUCUG-3' (SEQ ID NO: 277) 서열,
5'-CAAAUUCANNNCNCCUCUCCAAUUCU-3' (SEQ ID NO: 278) 서열,
5'-CAAAUUCANNNCNCCUCUCCAAUUC-3' (SEQ ID NO: 279) 서열,
5'-CAAAUUCANNNCNCCUCUCCAAUU-3' (SEQ ID NO: 280) 서열,
5'-CAAAUUCANNNCNCCUCUCCAAU-3' (SEQ ID NO: 281) 서열,
5'-CAAAUUCANNNCNCCUCUCCAA-3' (SEQ ID NO: 282) 서열,
5'-CAAAUUCANNNCNCCUCUCCA-3' (SEQ ID NO: 283) 서열,
5'-CAAAUUCANNNCNCCUCUCC-3' (SEQ ID NO: 284) 서열,
5'-CAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 285) 서열,
5'-CAAAUUCANNNCNCCUCU-3' (SEQ ID NO: 286) 서열,
5'-CAAAUUCANNNCNCCUC-3' (SEQ ID NO: 287) 서열,
5'-CAAAUUCANNNCNCCU-3' (SEQ ID NO: 288) 서열,
5'-CAAAUUCANNNCNCC-3' (SEQ ID NO: 289) 서열,
5'-CAAAUUCANNNCNC-3' (SEQ ID NO: 290) 서열, 또는
5'-CAAAUUCANNNCN-3' (SEQ ID NO: 272) 서열이며,
상기 각각의 N은 독립적으로 A, C, G 또는 U인,
엔지니어링된 가이드 RNA. - 제1항에 있어서,
상기 SEQ ID NO: 213 서열의 일부 서열은
5'-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 214) 서열,
5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 215) 서열,
5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 216) 서열,
5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 217) 서열,
5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 231) 서열,
5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 232) 서열,
5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 233) 서열,
5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 234) 서열,
5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUG-3' (SEQ ID NO: 235) 서열,
5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUG-3' (SEQ ID NO: 236) 서열,
5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUG-3' (SEQ ID NO: 237) 서열,
5'-CCGCUUCACCAUUAGUGAGUGAAGGUG-3' (SEQ ID NO: 238) 서열,
5'-CCGCUUCACCUUAGGAGUGAAGGUG-3' (SEQ ID NO:239) 서열,
5'-CCGCUUCACUUAGAGUGAAGGUG-3' (SEQ ID NO: 240) 서열,
5'-CCGCUUCACUUAGGUGAAGGUG-3' (SEQ ID NO: 241) 서열,
5'-CCGCUUCAUUAGUGAAGGUG-3' (SEQ ID NO: 242) 서열,
5'-CCGCUUCUUAGGAAGGUG-3' (SEQ ID NO: 243) 서열,
5'-CCGCUUUUAGAAGGUG-3' (SEQ ID NO: 244) 서열,
5'-CCGCUUUAGAGGUG-3' (SEQ ID NO: 245) 서열,
5'-CCGCUUAGGGUG-3' (SEQ ID NO: 246) 서열,
5'-CCGUUAGGUG-3' (SEQ ID NO: 247) 서열,
5'-CCUUAGGUG-3' 서열,
5'-CUUAGUG-3' 서열,
5'-CUUAGG-3' 서열, 또는
5'-UUAG-3' 서열이고,
상기 SEQ ID NO: 213 서열의 일부 서열 내에 포함된 5'-UUAG-3' 서열은 선택적으로 5'-GAAA-3' 서열로 치환되는,
엔지니어링된 가이드 RNA. - 제1항에 있어서,
상기 SEQ ID NO: 248 서열의 일부 서열은 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열, 5'-AAGUGGAGAA-3' (SEQ ID NO: 249) 서열, 5'-AAAGUGGAGAA-3' (SEQ ID NO: 250) 서열, 5'-UAAAGUGGAGAA-3' (SEQ ID NO: 251) 서열, 5'-AUAAAGUGGAGAA-3' (SEQ ID NO: 252) 서열, 5'-GAUAAAGUGGAGAA-3' (SEQ ID NO: 253) 서열, 5'-UGAUAAAGUGGAGAA-3' (SEQ ID NO: 254) 서열, 5'-CUGAUAAAGUGGAGAA-3' (SEQ ID NO: 255) 서열, 5'-ACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 256) 서열, 5'-CACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 257) 서열, 5'-UCACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 258) 서열 또는 5'-UUCACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 259) 서열인,
엔지니어링된 가이드 RNA. - 제1항에 있어서,
상기 제6 서열은 5'-GUUGCAGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 408) 서열 또는 SEQ ID NO: 408 서열의 일부 서열이고,
이때, 상기 SEQ ID NO: 408 서열의 일부 서열은
5'-UUGCAGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 413) 서열,
5'-UGCAGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 414) 서열,
5'-GCAGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 415) 서열,
5'-CAGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 416) 서열,
5'-AGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 417) 서열,
5'-GAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 418) 서열,
5'-AACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 419) 서열,
5'-ACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 420) 서열,
5'-CCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 421) 서열,
5'-CCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 422) 서열,
5'-CGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 423) 서열,
5'-GAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 424) 서열,
5'-AAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 425) 서열,
5'-AUAGNGNNNUGAAGGA-3' (SEQ ID NO: 426) 서열,
5'-UAGNGNNNUGAAGGA-3' (SEQ ID NO: 427) 서열,
5'-AGNGNNNUGAAGGA-3' (SEQ ID NO: 428) 서열, 또는
5'-NGNNNUGAAGGA-3' (SEQ ID NO: 412) 서열이며,
상기 각각의 N은 독립적으로 A, C, G 또는 U인,
엔지니어링된 가이드 RNA. - 제1항에 있어서,
상기 crRNA는 U-rich tail 서열을 추가로 더 포함하고,
상기 U-rich tail 서열은 상기 crRNA의 3'말단에 위치하는,
엔지니어링된 가이드 RNA. - 제6항에 있어서,
상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열이며,
상기 N은 A, C, G 또는 U이고, 상기 각각의 V는 독립적으로 A, C 또는 G이며, 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수인,
엔지니어링된 가이드 RNA. - 제1항에 있어서,
상기 엔지니어링된 가이드 RNA는 듀얼 가이드 RNA 또는 싱글 가이드 RNA이고,
상기 엔지니어링된 가이드 RNA가 싱글 가이드 RNA일 때, 상기 엔지니어링된 가이드 RNA는 링커 서열을 더 포함하며, 상기 링커 서열은 상기 엔지니어링된 tracrRNA와 상기 crRNA 사이에 위치하는,
엔지니어링된 가이드 RNA. - 제1항에 있어서,
상기 엔지니어링된 tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 269) 서열,
5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 304) 서열,
5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 590) 서열,
5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 301) 서열,
5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 592) 서열,
5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 305) 서열,
5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 593) 서열, 또는
5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 300) 서열을 포함하며,
상기 각각의 N은 독립적으로 A, C, G 또는 U인,
엔지니어링된 가이드 RNA. - 제9항에 있어서,
상기 엔지니어링된 crRNA는 5'-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAAC-3' (SEQ ID NO: 591) 서열 및 가이드 서열을 포함하거나, 또는 5'-GAAUAGNGNNNUGAAGGAAUGCAAC-3' (SEQ ID NO: 594) 서열 및 가이드 서열을 포함하며,
상기 각각의 N은 독립적으로 A, C, G 또는 U인,
엔지니어링된 가이드 RNA. - 제2항에 있어서,
상기 제1 서열 내에 존재하는 5'-NNNCN-3' 서열이 5'-UUUCU-3' 서열, 5'-GUUCU-3' 서열, 5'-UCUCU-3' 서열, 5'-UUGCU-3' 서열, 5'-UUUCC-3' 서열, 5'-GCUCU-3' 서열, 5'-GUUCC-3' 서열, 5'-UCGCU-3' 서열, 5'-UCUCC-3' 서열, 5'-UUGCC-3' 서열, 5'-GCGCU-3' 서열, 5'-GCUCC-3' 서열, 5'-GUGCC-3' 서열, 5'-UCGCC-3' 서열, 5'-GCGCC-3' 서열 또는 5'-GUGCU-3' 서열인,
엔지니어링된 가이드 RNA. - 제5항에 있어서,
상기 제6 서열 내에 존재하는 5'-NGNNN-3' 서열이 5'-AGGAA-3' 서열, 5'-AGCAA-3' 서열, 5'-AGAAA-3' 서열, 5'-AGCAU-3' 서열, 5'-AGCAG-3' 서열, 5'-AGCAC-3' 서열, 5'-AGCUA-3' 서열, 5'-AGCGA-3' 서열, 5'-AGCCA-3' 서열, 5'-UGCAA-3' 서열, 5'-UGCUA-3' 서열, 5'-UGCGA-3' 서열, 5'-UGCCA-3' 서열, 5'-GGCAA-3' 서열, 5'-GGCUA-3' 서열, 5'-GGCGA-3' 서열, 5'-GGCCA-3' 서열, 5'-CGCAA-3' 서열, 5'-CGCUA-3' 서열, 5'-CGCGA-3' 서열 또는 5'-CGCCA-3' 서열인,
엔지니어링된 가이드 RNA. - 제11항에 있어서,
상기 엔지니어링된 tracrRNA는
5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 270) 서열,
5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 308) 서열,
5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 595) 서열,
5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 306) 서열,
5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCGUGCUCCUCUC-3' (SEQ ID NO: 596) 서열,
5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 309) 서열,
5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 597) 서열, 또는
5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 307) 서열을 포함하는,
엔지니어링된 가이드 RNA. - 제13항에 있어서,
상기 엔지니어링된 crRNA는 5'-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 539) 서열 및 가이드 서열을 포함하거나, 또는 5'-GAAUAGAGCAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 598) 서열 및 가이드 서열을 포함하는,
엔지니어링된 가이드 RNA. - CRISPR/Cas12f1(Cas14a1) 시스템을 위한, 엔지니어링된 가이드 RNA를 암호화하는 핵산을 포함하는 벡터로서,
상기 엔지니어링된 가이드 RNA는 엔지니어링된 tracrRNA(trans-activating crispr RNA) 및 crRNA(crispr RNA)를 포함하고,
상기 엔지니어링된 tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형되고, 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3'말단에서 5'말단 방향으로 순서대로 포함하고,
상기 제1 서열은 5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 194) 서열 또는 SEQ ID NO: 194 서열의 일부 서열이며, 상기 각각의 N은 독립적으로 A, C, G 또는 U이고, 상기 V는 A, C 또는 G이며, 상기 SEQ ID NO: 194 서열의 일부 서열은 상기 SEQ ID NO: 194 서열 중 5'-CAAAUUCANNNVN-3' (SEQ ID NO: 193) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열이고,
상기 제2 서열은 5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO: 211) 서열 또는 SEQ ID NO: 211 서열에 적어도 90% 이상의 서열 동일성 또는 서열 유사성을 가지고, Cas12f1 단백질의 REC 도메인 또는 RuvC 도메인과 상호작용하는 서열이고,
상기 제3 서열은 5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO: 212) 서열 또는 SEQ ID NO: 212 서열에 적어도 90% 이상의 서열 동일성 또는 서열 유사성을 가지고, Cas12f1 단백질의 WED 도메인, ZF 도메인 또는 RuvC 도메인과 상호작용하는 서열이고
상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 213) 서열 또는 SEQ ID NO: 213 서열의 일부 서열이며, 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열이고,
상기 제5 서열은 5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 248) 서열 또는 SEQ ID NO: 248 서열의 일부 서열로, 이때, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열이며,
상기 crRNA은 야생형 crRNA 또는 엔지니어링된 crRNA이며,
상기 야생형 crRNA는 야생형 반복 서열(repeat sequence) 및 가이드 서열(guide sequence)을 5' 말단에서 3' 말단 방향으로 순서대로 포함하고,
상기 야생형 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열이며,
상기 엔지니어링된 crRNA는 제6 서열, 제7 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함하고,
이때, 상기 제6 서열은 5'-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 373) 서열 또는 SEQ ID NO: 373 서열의 일부 서열이며, 상기 각각의 N은 독립적으로 A, C, G 또는 U이고, 상기 B는 U, C 또는 G이며, 상기 SEQ ID NO: 373 서열의 일부 서열은 상기 SEQ ID NO: 373 서열 중 5'-NBNNNUGAAGGA-3' (SEQ ID NO: 372) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열이며,
이때, 상기 제7 서열은 5'-AUGCAAC-3' 서열 또는 5'-AUGCAAC-3' 서열에 적어도 80% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열이고,
상기 가이드 서열은 표적 서열과 혼성화(hybridizing)할 수 있는 서열 또는 표적 서열과 상보적인 결합을 형성하는 서열이고, 15 내지 30 nt(nucleotide) 서열인,
벡터. - 제15항에 있어서,
상기 벡터는 상기 엔지니어링된 가이드 RNA를 암호화하는 핵산을 위한 프로모터를 더 포함하는, 벡터. - 제16항에 있어서,
상기 프로모터는 U6 프로모터, H1 프로모터 또는 7SK 프로모터인, 벡터.
- 제15항에 있어서,
상기 벡터는 플라스미드, PCR 엠플리콘 또는 바이러스 벡터인, 벡터.
- 엔지니어링된 CRISPR/Cas12f1(Cas14a1) 시스템을 포함하는 조성물로서,
상기 엔지니어링된 CRISPR/Cas12f1(Cas14a1) 시스템은 엔지니어링된 가이드 RNA 또는 이를 암호화하는 핵산; 및 Cas12f1(Cas14a1)단백질 또는 이를 암호화하는 핵산을 포함하며,
상기 엔지니어링된 가이드 RNA는 엔지니어링된 tracrRNA(trans-activating crispr RNA) 및 crRNA(crispr RNA)를 포함하고,
상기 엔지니어링된 tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형되고, 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5서열을 3'말단에서 5'말단 방향으로 순서대로 포함하고,
상기 제1 서열은 5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 194) 서열 또는 SEQ ID NO: 194 서열의 일부 서열이며, 상기 각각의 N은 독립적으로 A, C, G 또는 U이고, 상기 V는 A, C 또는 G이며, 상기 SEQ ID NO: 194 서열의 일부 서열은 상기 SEQ ID NO: 194 서열 중 5'-CAAAUUCANNNVN-3' (SEQ ID NO: 193) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열이고,
상기 제2 서열은 5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO: 211) 서열 또는 SEQ ID NO: 211 서열에 적어도 90% 이상의 서열 동일성 또는 서열 유사성을 가지고, Cas12f1 단백질의 REC 도메인 또는 RuvC 도메인과 상호작용하는 서열이고,
상기 제3 서열은 5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO: 212) 서열 또는 SEQ ID NO: 212 서열에 적어도 90% 이상의 서열 동일성 또는 서열 유사성을 가지고, Cas12f1 단백질의 WED 도메인, ZF 도메인 또는 RuvC 도메인과 상호작용하는 서열이고,
상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 213) 서열 또는 SEQ ID NO: 213 서열의 일부 서열이며, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열이고,
상기 제5 서열은 5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 248) 서열 또는 SEQ ID NO: 248 서열의 일부 서열이고, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열이며,
상기 crRNA은 야생형 crRNA 또는 엔지니어링된 crRNA이며,
상기 야생형 crRNA는 야생형 반복 서열(repeat sequence) 및 가이드 서열(guide sequence)을 5' 말단에서 3' 말단 방향으로 순서대로 포함하고,
상기 야생형 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열이며,
상기 엔지니어링된 crRNA는 제6 서열, 제7 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함하고,
상기 제6 서열은 5'-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 373) 서열 또는 SEQ ID NO: 373 서열의 일부 서열이며, 상기 각각의 N은 독립적으로 A, C, G 또는 U이고, 상기 B는 U, C 또는 G이며, 상기 SEQ ID NO: 373 서열의 일부 서열은 상기 SEQ ID NO: 373 서열 중 5'-NBNNNUGAAGGA-3' (SEQ ID NO: 372) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열이며,
상기 제7 서열은 5'-AUGCAAC-3' 서열 또는 5'-AUGCAAC-3' 서열에 적어도 80% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열이고,
상기 가이드 서열은 표적 서열과 혼성화(hybridizing)할 수 있는 서열 또는 표적 서열과 상보적인 결합을 형성하는 서열로, 15 내지 30 nt(nucleotide) 서열인,
조성물. - 제19항에 있어서,
상기 조성물은 상기 엔지니어링된 가이드 RNA를 암호화하는 핵산 및 Cas12f1(Cas14a1)단백질을 암호화하는 핵산을 하나의 벡터에 포함하는, 조성물. - 제20항에 있어서,
상기 벡터는 상기 엔지니어링된 가이드 RNA를 암호화하는 핵산을 위한 프로모터 및 상기 Cas12f1(Cas14a1)단백질을 암호화하는 핵산을 위한 프로모터를 더 포함하는, 조성물. - 제21항에 있어서,
상기 프로모터는 U6 프로모터, H1 프로모터, 7SK 프로모터, CMV 프로모터, LTR 프로모터, Ad MLP 프로모터, HSV 프로모터, SV40 프로모터, CBA 프로모터 또는 RSV 프로모터인, 조성물.
- 제20항에 있어서,
상기 벡터는 플라스미드, mRNA(전사물), PCR 엠플리콘 또는 바이러스 벡터인, 조성물. - 제19항에 있어서,
상기 조성물은 핵산 및 단백질 혼합 형태로, 엔지니어링된 가이드 RNA 및 Cas14a1 단백질이 결합된 엔지니어링된 CRISPR/Cas14a1 복합체 형태로 포함하는, 조성물. - 제1항 내지 제14항 중 어느 한 항의 엔지니어링된 가이드 RNA를 암호화하는 핵산.
Priority Applications (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US18/030,575 US20230416784A1 (en) | 2020-10-08 | 2021-10-08 | Engineered guide rna for optimized crispr/cas12f1 (cas14a1) system and use thereof |
CA3198435A CA3198435A1 (en) | 2020-10-08 | 2021-10-08 | Engineered guide rna for optimized crispr/cas12f1 (cas14a1) system and use thereof |
AU2021358805A AU2021358805A1 (en) | 2020-10-08 | 2021-10-08 | Engineered guide RNA for optimized CRISPR/Cas12f1 (Cas14a1) system and use thereof |
CN202180082971.3A CN116568806A (zh) | 2020-10-08 | 2021-10-08 | 用于增加crispr/cas12f1(cas14a1)系统的效率的经工程化的引导rna及其用途 |
PCT/KR2021/013933 WO2022075816A1 (ko) | 2020-10-08 | 2021-10-08 | Crispr/cas12f1(cas14a1) 시스템 효율화를 위한 엔지니어링 된 가이드 rna 및 이의 용도 |
JP2023521490A JP2023544826A (ja) | 2020-10-08 | 2021-10-08 | CRISPR/Cas12f1(Cas14a1)システム効率化のためのエンジニアリングされたガイドRNAおよびその用途 |
EP21878066.6A EP4227412A1 (en) | 2020-10-08 | 2021-10-08 | Engineered guide rna for increasing efficiency of crispr/cas12f1 (cas14a1) system, and use thereof |
KR1020240019104A KR20240023081A (ko) | 2020-10-08 | 2024-02-07 | CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200129937 | 2020-10-08 | ||
KR20200129937 | 2020-10-08 | ||
KR20200185528 | 2020-12-29 | ||
KR1020200185528 | 2020-12-29 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020240019104A Division KR20240023081A (ko) | 2020-10-08 | 2024-02-07 | CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220047502A KR20220047502A (ko) | 2022-04-18 |
KR102638799B1 true KR102638799B1 (ko) | 2024-02-22 |
Family
ID=81390843
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210044152A KR102638799B1 (ko) | 2020-10-08 | 2021-04-05 | CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 |
KR1020210065125A KR20220047503A (ko) | 2020-10-08 | 2021-05-20 | CRISPR/Cas12f1 시스템의 유전자 편집 효율 향상을 위한, cas12f1의 페어드 가이드 RNA(paired gRNA) 설계 방법 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210065125A KR20220047503A (ko) | 2020-10-08 | 2021-05-20 | CRISPR/Cas12f1 시스템의 유전자 편집 효율 향상을 위한, cas12f1의 페어드 가이드 RNA(paired gRNA) 설계 방법 |
Country Status (1)
Country | Link |
---|---|
KR (2) | KR102638799B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116622810B (zh) * | 2023-01-10 | 2024-06-28 | 南华大学 | 一种新型的工程化CRISPR-Cas14a1检测系统、方法及应用 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200172886A1 (en) | 2017-11-01 | 2020-06-04 | The Regents Of The University Of California | Casz compositions and methods of use |
US20200190494A1 (en) | 2018-12-14 | 2020-06-18 | Pioneer Hi-Bred International, Inc. | Novel crispr-cas systems for genome editing |
CN111363763A (zh) | 2020-03-31 | 2020-07-03 | 海南大学 | 一种RNA激活Cas14a酶附带切割效应的方法 |
-
2021
- 2021-04-05 KR KR1020210044152A patent/KR102638799B1/ko active IP Right Grant
- 2021-05-20 KR KR1020210065125A patent/KR20220047503A/ko not_active Application Discontinuation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200172886A1 (en) | 2017-11-01 | 2020-06-04 | The Regents Of The University Of California | Casz compositions and methods of use |
US20200190494A1 (en) | 2018-12-14 | 2020-06-18 | Pioneer Hi-Bred International, Inc. | Novel crispr-cas systems for genome editing |
CN111363763A (zh) | 2020-03-31 | 2020-07-03 | 海南大学 | 一种RNA激活Cas14a酶附带切割效应的方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20220047502A (ko) | 2022-04-18 |
KR20220047503A (ko) | 2022-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12084692B2 (en) | Guide scaffolds | |
US20220307018A1 (en) | ENGINEERED GUIDE RNA FOR THE OPTIMIZED CRISPR/Cas12f1 SYSTEM AND USE THEREOF | |
Montiel-Gonzalez et al. | Current strategies for site-directed RNA editing using ADARs | |
KR20240023081A (ko) | CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 | |
GB2617658A (en) | Class II, type V CRISPR systems | |
CN109415729A (zh) | 具有降低毒性的基因编辑试剂 | |
KR102690083B1 (ko) | CRISPR/Cas12f1 시스템 효율화를 위한 U-rich tail을 포함하는 엔지니어링 된 가이드 RNA 및 그 용도 | |
CN116438313A (zh) | 用于真核生物基因组工程的合成微型crispr-cas(casmini)系统 | |
WO2018172798A1 (en) | Argonaute system | |
JP2023544817A (ja) | CRISPR/Cas12f1システム効率化のためのエンジニアリングされたガイドRNAおよびその用途 | |
US20230374500A1 (en) | Engineered guide rna comprising u-rich tail for optimized crispr/cas12f1 system and use thereof | |
CN114144519A (zh) | 单碱基置换蛋白以及包含其的组合物 | |
KR102638799B1 (ko) | CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 | |
US20240218339A1 (en) | Class ii, type v crispr systems | |
KR20230121569A (ko) | 상동지정복구를 위한 TaRGET 시스템 및 이를 이용한 유전자 편집 방법 | |
KR102703683B1 (ko) | 유전자 편집을 위한 TaRGET 시스템 및 이의 용도 | |
KR20230007218A (ko) | 초소형 염기교정 시스템 및 이의 용도 | |
KR20220145438A (ko) | CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도 | |
CN116568806A (zh) | 用于增加crispr/cas12f1(cas14a1)系统的效率的经工程化的引导rna及其用途 | |
KR102700253B1 (ko) | 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도 | |
KR20230142365A (ko) | 어셔 증후군 치료를 위한 유전자 편집 시스템 | |
KR20230134097A (ko) | Nhej 복구 경로 조절을 통해 핵산 세그먼트의 결실 효율을 증가시키기 위한 조성물 및 방법 | |
KR20240034661A (ko) | 캄필로박터 제주니 유래 Cas9의 가이드 RNA 구조변화를 통한 유전자교정 향상 시스템 | |
KR20230166041A (ko) | 확장된 표적 범위를 갖는 엔지니어링된 Cas12f 단백질 및 이의 용도 | |
CN117916372A (zh) | 无切割活性的cas12f1、基于无切割活性的cas12f1的融合蛋白、包括其的crispr基因编辑系统及其制备方法和用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |