KR20220155553A - RNA-guided Nuclease를 이용한 LCA10 치료용 조성물 및 치료방법 - Google Patents
RNA-guided Nuclease를 이용한 LCA10 치료용 조성물 및 치료방법 Download PDFInfo
- Publication number
- KR20220155553A KR20220155553A KR1020220059167A KR20220059167A KR20220155553A KR 20220155553 A KR20220155553 A KR 20220155553A KR 1020220059167 A KR1020220059167 A KR 1020220059167A KR 20220059167 A KR20220059167 A KR 20220059167A KR 20220155553 A KR20220155553 A KR 20220155553A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- sequence
- cas12f1
- guide
- protein
- Prior art date
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 244
- 238000000034 method Methods 0.000 title claims abstract description 138
- 101710163270 Nuclease Proteins 0.000 title description 2
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 438
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 385
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 352
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 339
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 303
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 303
- 108091033409 CRISPR Proteins 0.000 claims abstract description 298
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract description 283
- 208000036318 CEP290-related ciliopathy Diseases 0.000 claims abstract description 274
- 101150078156 Cep290 gene Proteins 0.000 claims abstract description 216
- 208000004609 Leber congenital amaurosis 10 Diseases 0.000 claims abstract description 158
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 91
- 238000011282 treatment Methods 0.000 claims abstract description 66
- 108020004414 DNA Proteins 0.000 claims description 197
- 210000004027 cell Anatomy 0.000 claims description 191
- 239000013598 vector Substances 0.000 claims description 167
- 241000282414 Homo sapiens Species 0.000 claims description 149
- 230000035772 mutation Effects 0.000 claims description 149
- 102220000558 rs281865192 Human genes 0.000 claims description 111
- 239000013603 viral vector Substances 0.000 claims description 95
- 239000002773 nucleotide Substances 0.000 claims description 93
- 125000003729 nucleotide group Chemical group 0.000 claims description 93
- 230000000694 effects Effects 0.000 claims description 89
- 230000000295 complement effect Effects 0.000 claims description 53
- 125000006850 spacer group Chemical group 0.000 claims description 33
- 108020004999 messenger RNA Proteins 0.000 claims description 31
- 239000004055 small Interfering RNA Substances 0.000 claims description 27
- 241000702421 Dependoparvovirus Species 0.000 claims description 24
- 108091027967 Small hairpin RNA Proteins 0.000 claims description 23
- 239000003814 drug Substances 0.000 claims description 23
- 239000013612 plasmid Substances 0.000 claims description 20
- 108091093088 Amplicon Proteins 0.000 claims description 16
- 241000700584 Simplexvirus Species 0.000 claims description 16
- 239000008194 pharmaceutical composition Substances 0.000 claims description 16
- 229940124597 therapeutic agent Drugs 0.000 claims description 15
- 230000003612 virological effect Effects 0.000 claims description 14
- 238000010362 genome editing Methods 0.000 claims description 9
- 241000700618 Vaccinia virus Species 0.000 claims description 8
- 230000001177 retroviral effect Effects 0.000 claims description 8
- 102100027828 DNA repair protein XRCC4 Human genes 0.000 claims description 7
- 101000649315 Homo sapiens DNA repair protein XRCC4 Proteins 0.000 claims description 7
- 101000720958 Homo sapiens Protein artemis Proteins 0.000 claims description 7
- 102100025918 Protein artemis Human genes 0.000 claims description 7
- 102100036976 X-ray repair cross-complementing protein 6 Human genes 0.000 claims description 7
- -1 XLF-1 Proteins 0.000 claims description 7
- 241000701161 unidentified adenovirus Species 0.000 claims description 7
- 208000009889 Herpes Simplex Diseases 0.000 claims description 6
- 241000713666 Lentivirus Species 0.000 claims description 6
- 206010046865 Vaccinia virus infection Diseases 0.000 claims description 6
- 241001430294 unidentified retrovirus Species 0.000 claims description 6
- 208000007089 vaccinia Diseases 0.000 claims description 6
- 101100161469 Arabidopsis thaliana ABCB23 gene Proteins 0.000 claims description 5
- 101100132433 Arabidopsis thaliana VIII-1 gene Proteins 0.000 claims description 5
- 102100033195 DNA ligase 4 Human genes 0.000 claims description 5
- 241000282412 Homo Species 0.000 claims description 5
- 101000927810 Homo sapiens DNA ligase 4 Proteins 0.000 claims description 5
- 108010025026 Ku Autoantigen Proteins 0.000 claims description 5
- 101100324822 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) fes-4 gene Proteins 0.000 claims description 5
- 210000004102 animal cell Anatomy 0.000 claims description 5
- 101150115605 atm1 gene Proteins 0.000 claims description 5
- 210000005260 human cell Anatomy 0.000 claims description 5
- 238000002360 preparation method Methods 0.000 claims description 5
- 239000000539 dimer Substances 0.000 claims description 4
- 239000003937 drug carrier Substances 0.000 claims description 4
- 241001465754 Metazoa Species 0.000 claims description 3
- 125000003275 alpha amino acid group Chemical group 0.000 claims 7
- 235000018102 proteins Nutrition 0.000 description 327
- 102000053602 DNA Human genes 0.000 description 196
- 229920002477 rna polymer Polymers 0.000 description 135
- 108091028113 Trans-activating crRNA Proteins 0.000 description 115
- 230000006780 non-homologous end joining Effects 0.000 description 77
- 150000001413 amino acids Chemical group 0.000 description 61
- 238000012217 deletion Methods 0.000 description 46
- 230000037430 deletion Effects 0.000 description 46
- 108091028043 Nucleic acid sequence Proteins 0.000 description 44
- 101710198317 Centrosomal protein of 290 kDa Proteins 0.000 description 40
- 102100035673 Centrosomal protein of 290 kDa Human genes 0.000 description 39
- 230000008685 targeting Effects 0.000 description 34
- 238000001890 transfection Methods 0.000 description 30
- 238000002474 experimental method Methods 0.000 description 29
- 239000000047 product Substances 0.000 description 25
- 230000035897 transcription Effects 0.000 description 25
- 238000013518 transcription Methods 0.000 description 25
- 230000006870 function Effects 0.000 description 24
- 102000004389 Ribonucleoproteins Human genes 0.000 description 21
- 108010081734 Ribonucleoproteins Proteins 0.000 description 21
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 21
- 239000002585 base Substances 0.000 description 21
- 230000036961 partial effect Effects 0.000 description 20
- 230000009977 dual effect Effects 0.000 description 19
- 230000030648 nucleus localization Effects 0.000 description 19
- 238000003757 reverse transcription PCR Methods 0.000 description 19
- 230000027455 binding Effects 0.000 description 18
- 230000001404 mediated effect Effects 0.000 description 18
- 230000004048 modification Effects 0.000 description 18
- 238000012986 modification Methods 0.000 description 18
- 238000012216 screening Methods 0.000 description 17
- 108090000765 processed proteins & peptides Proteins 0.000 description 16
- 238000003780 insertion Methods 0.000 description 15
- 230000037431 insertion Effects 0.000 description 15
- 238000011529 RT qPCR Methods 0.000 description 14
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 14
- 238000009739 binding Methods 0.000 description 14
- 238000005119 centrifugation Methods 0.000 description 14
- 238000011144 upstream manufacturing Methods 0.000 description 14
- 241000341655 Human papillomavirus type 16 Species 0.000 description 13
- 239000002299 complementary DNA Substances 0.000 description 13
- 108091005461 Nucleic proteins Proteins 0.000 description 12
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 12
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 12
- 230000002441 reversible effect Effects 0.000 description 12
- 239000000243 solution Substances 0.000 description 12
- 238000013519 translation Methods 0.000 description 12
- 230000001965 increasing effect Effects 0.000 description 11
- 238000006467 substitution reaction Methods 0.000 description 11
- 108010062796 arginyllysine Proteins 0.000 description 10
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 10
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 10
- 230000037361 pathway Effects 0.000 description 10
- 230000008439 repair process Effects 0.000 description 10
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 10
- 229940045145 uridine Drugs 0.000 description 10
- 241000701022 Cytomegalovirus Species 0.000 description 9
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 9
- 101150034049 cep gene Proteins 0.000 description 9
- 238000010367 cloning Methods 0.000 description 9
- 238000012790 confirmation Methods 0.000 description 9
- 239000000499 gel Substances 0.000 description 9
- 108010034529 leucyl-lysine Proteins 0.000 description 9
- 239000002777 nucleoside Substances 0.000 description 9
- 108020004705 Codon Proteins 0.000 description 8
- 229920002873 Polyethylenimine Polymers 0.000 description 8
- 241000714474 Rous sarcoma virus Species 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 7
- 101150082239 G gene Proteins 0.000 description 7
- 108091092584 GDNA Proteins 0.000 description 7
- 206010064571 Gene mutation Diseases 0.000 description 7
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 7
- 238000002123 RNA extraction Methods 0.000 description 7
- 238000000137 annealing Methods 0.000 description 7
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- 229940079593 drug Drugs 0.000 description 7
- 108020001507 fusion proteins Proteins 0.000 description 7
- 102000037865 fusion proteins Human genes 0.000 description 7
- 108010009298 lysylglutamic acid Proteins 0.000 description 7
- 102000004196 processed proteins & peptides Human genes 0.000 description 7
- 230000010076 replication Effects 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 230000001225 therapeutic effect Effects 0.000 description 7
- 229940104230 thymidine Drugs 0.000 description 7
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 6
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N DMSO Substances CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 6
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 229960005305 adenosine Drugs 0.000 description 6
- 238000010804 cDNA synthesis Methods 0.000 description 6
- 239000001506 calcium phosphate Substances 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 108010017391 lysylvaline Proteins 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 239000002105 nanoparticle Substances 0.000 description 6
- 238000001556 precipitation Methods 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 229950010131 puromycin Drugs 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- KZEVSDGEBAJOTK-UHFFFAOYSA-N 1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-2-[5-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]-1,3,4-oxadiazol-2-yl]ethanone Chemical compound N1N=NC=2CN(CCC=21)C(CC=1OC(=NN=1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)=O KZEVSDGEBAJOTK-UHFFFAOYSA-N 0.000 description 5
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 5
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 5
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 5
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 5
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 5
- 229920002307 Dextran Polymers 0.000 description 5
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 5
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 5
- 102100028156 Non-homologous end-joining factor 1 Human genes 0.000 description 5
- 101710127639 Non-homologous end-joining factor 1 Proteins 0.000 description 5
- 229960000643 adenine Drugs 0.000 description 5
- 229910000389 calcium phosphate Inorganic materials 0.000 description 5
- 235000011010 calcium phosphates Nutrition 0.000 description 5
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 5
- 238000001962 electrophoresis Methods 0.000 description 5
- 108010064235 lysylglycine Proteins 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 150000003833 nucleoside derivatives Chemical class 0.000 description 5
- 108010012581 phenylalanylglutamate Proteins 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 4
- ZRPAUEVGEGEPFQ-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]pyrazol-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C=1C=NN(C=1)CC(=O)N1CC2=C(CC1)NN=N2 ZRPAUEVGEGEPFQ-UHFFFAOYSA-N 0.000 description 4
- JVKRKMWZYMKVTQ-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]pyrazol-1-yl]-N-(2-oxo-3H-1,3-benzoxazol-6-yl)acetamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C=1C=NN(C=1)CC(=O)NC1=CC2=C(NC(O2)=O)C=C1 JVKRKMWZYMKVTQ-UHFFFAOYSA-N 0.000 description 4
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 4
- KLKARCOHVHLAJP-UWJYBYFXSA-N Ala-Tyr-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CS)C(O)=O KLKARCOHVHLAJP-UWJYBYFXSA-N 0.000 description 4
- BHSYMWWMVRPCPA-CYDGBPFRSA-N Arg-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N BHSYMWWMVRPCPA-CYDGBPFRSA-N 0.000 description 4
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 4
- 238000010453 CRISPR/Cas method Methods 0.000 description 4
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 4
- 230000033616 DNA repair Effects 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 241001245662 Eragrostis rigidior Species 0.000 description 4
- 108010070675 Glutathione transferase Proteins 0.000 description 4
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 4
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 4
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 4
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 4
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 4
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 4
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 4
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 4
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 4
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 4
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 4
- 108020004459 Small interfering RNA Proteins 0.000 description 4
- 102100036407 Thioredoxin Human genes 0.000 description 4
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 4
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 4
- 239000011543 agarose gel Substances 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 108091005948 blue fluorescent proteins Proteins 0.000 description 4
- 125000002091 cationic group Chemical group 0.000 description 4
- 108010082025 cyan fluorescent protein Proteins 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 4
- 239000005090 green fluorescent protein Substances 0.000 description 4
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 238000001638 lipofection Methods 0.000 description 4
- 239000002502 liposome Substances 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 108091070501 miRNA Proteins 0.000 description 4
- 239000002679 microRNA Substances 0.000 description 4
- 239000013642 negative control Substances 0.000 description 4
- 125000003835 nucleoside group Chemical group 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 150000002972 pentoses Chemical class 0.000 description 4
- 238000012257 pre-denaturation Methods 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 4
- 108010005652 splenotritin Proteins 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 235000000346 sugar Nutrition 0.000 description 4
- 108060008226 thioredoxin Proteins 0.000 description 4
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 4
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 3
- OILNWMNBLIHXQK-ZLUOBGJFSA-N Ala-Cys-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O OILNWMNBLIHXQK-ZLUOBGJFSA-N 0.000 description 3
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 3
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 3
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 3
- ODBSSLHUFPJRED-CIUDSAMLSA-N Asn-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ODBSSLHUFPJRED-CIUDSAMLSA-N 0.000 description 3
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 3
- QGABLMITFKUQDF-DCAQKATOSA-N Asn-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QGABLMITFKUQDF-DCAQKATOSA-N 0.000 description 3
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 3
- VXDXZGYXHIADHF-YJRXYDGGSA-N Cys-Tyr-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VXDXZGYXHIADHF-YJRXYDGGSA-N 0.000 description 3
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 3
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 3
- 108700024394 Exon Proteins 0.000 description 3
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 3
- ODBLJLZVLAWVMS-GUBZILKMSA-N Gln-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N ODBLJLZVLAWVMS-GUBZILKMSA-N 0.000 description 3
- SYDJILXOZNEEDK-XIRDDKMYSA-N Glu-Arg-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SYDJILXOZNEEDK-XIRDDKMYSA-N 0.000 description 3
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 3
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 3
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 3
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 3
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 3
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- KYFGGRHWLFZXPU-KKUMJFAQSA-N His-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N KYFGGRHWLFZXPU-KKUMJFAQSA-N 0.000 description 3
- ZFDKSLBEWYCOCS-BZSNNMDCSA-N His-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CC=CC=C1 ZFDKSLBEWYCOCS-BZSNNMDCSA-N 0.000 description 3
- 101000715664 Homo sapiens Centrosomal protein of 290 kDa Proteins 0.000 description 3
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 3
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 3
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 3
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 3
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 3
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 3
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 3
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 3
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 3
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 3
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 3
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 3
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 3
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 3
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 3
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 3
- 102000002488 Nucleoplasmin Human genes 0.000 description 3
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 3
- 239000002202 Polyethylene glycol Substances 0.000 description 3
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 108020005067 RNA Splice Sites Proteins 0.000 description 3
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 3
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 3
- 108090000631 Trypsin Proteins 0.000 description 3
- 102000004142 Trypsin Human genes 0.000 description 3
- MBFJIHUHHCJBSN-AVGNSLFASA-N Tyr-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MBFJIHUHHCJBSN-AVGNSLFASA-N 0.000 description 3
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 3
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 3
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 3
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 238000001415 gene therapy Methods 0.000 description 3
- 108010010147 glycylglutamine Proteins 0.000 description 3
- 229940029575 guanosine Drugs 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 108010000761 leucylarginine Proteins 0.000 description 3
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 108060005597 nucleoplasmin Proteins 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000007480 sanger sequencing Methods 0.000 description 3
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 3
- 239000012588 trypsin Substances 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 3
- HMUNWXXNJPVALC-UHFFFAOYSA-N 1-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-2-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)C(CN1CC2=C(CC1)NN=N2)=O HMUNWXXNJPVALC-UHFFFAOYSA-N 0.000 description 2
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 2
- 102000000872 ATM Human genes 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 2
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 2
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 2
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 2
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 2
- CWRBRVZBMVJENN-UVBJJODRSA-N Ala-Trp-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCSC)C(=O)O)N CWRBRVZBMVJENN-UVBJJODRSA-N 0.000 description 2
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 2
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 2
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 2
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 2
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 2
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 2
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 2
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 2
- ZUVMUOOHJYNJPP-XIRDDKMYSA-N Arg-Trp-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZUVMUOOHJYNJPP-XIRDDKMYSA-N 0.000 description 2
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 2
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 2
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 2
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 2
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 2
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 2
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 2
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 2
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 2
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 2
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 2
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 2
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 2
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 2
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 2
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 2
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 2
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 2
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 2
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 2
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 2
- 108010004586 Ataxia Telangiectasia Mutated Proteins Proteins 0.000 description 2
- 206010061692 Benign muscle neoplasm Diseases 0.000 description 2
- 102100026189 Beta-galactosidase Human genes 0.000 description 2
- 102100021277 Beta-secretase 2 Human genes 0.000 description 2
- 101710150190 Beta-secretase 2 Proteins 0.000 description 2
- 108091079001 CRISPR RNA Proteins 0.000 description 2
- 241001643283 Candidatus Woesearchaeota archaeon Species 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- SFUUYRSAJPWTGO-SRVKXCTJSA-N Cys-Asn-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SFUUYRSAJPWTGO-SRVKXCTJSA-N 0.000 description 2
- CFQVGYWKSLKWFX-KBIXCLLPSA-N Cys-Glu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CFQVGYWKSLKWFX-KBIXCLLPSA-N 0.000 description 2
- RWAZRMXTVSIVJR-YUMQZZPRSA-N Cys-Gly-His Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CNC=N1)C(O)=O RWAZRMXTVSIVJR-YUMQZZPRSA-N 0.000 description 2
- CIBLYQCAZRYWHY-UHFFFAOYSA-N Cys-Leu-Phe-Cys Chemical compound SCC(N)C(=O)NC(CC(C)C)C(=O)NC(C(=O)NC(CS)C(O)=O)CC1=CC=CC=C1 CIBLYQCAZRYWHY-UHFFFAOYSA-N 0.000 description 2
- WZJLBUPPZRZNTO-CIUDSAMLSA-N Cys-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N WZJLBUPPZRZNTO-CIUDSAMLSA-N 0.000 description 2
- 102100039524 DNA endonuclease RBBP8 Human genes 0.000 description 2
- 108050008316 DNA endonuclease RBBP8 Proteins 0.000 description 2
- 102100039116 DNA repair protein RAD50 Human genes 0.000 description 2
- 102100029764 DNA-directed DNA/RNA polymerase mu Human genes 0.000 description 2
- 108050003960 DNA-directed DNA/RNA polymerase mu Proteins 0.000 description 2
- 102100033996 Double-strand break repair protein MRE11 Human genes 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 108010010803 Gelatin Proteins 0.000 description 2
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 2
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 2
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 2
- OZEQPCDLCDRCGY-SOUVJXGZSA-N Gln-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O OZEQPCDLCDRCGY-SOUVJXGZSA-N 0.000 description 2
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 2
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 2
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 2
- ZMVCLTGPGWJAEE-JYJNAYRXSA-N Glu-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)O ZMVCLTGPGWJAEE-JYJNAYRXSA-N 0.000 description 2
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 2
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 2
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 2
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 2
- OHWJUIXZHVIXJJ-GUBZILKMSA-N Glu-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N OHWJUIXZHVIXJJ-GUBZILKMSA-N 0.000 description 2
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 2
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 2
- NTHIHAUEXVTXQG-KKUMJFAQSA-N Glu-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O NTHIHAUEXVTXQG-KKUMJFAQSA-N 0.000 description 2
- 102000053187 Glucuronidase Human genes 0.000 description 2
- 108010060309 Glucuronidase Proteins 0.000 description 2
- XZRZILPOZBVTDB-GJZGRUSLSA-N Gly-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CN)C(O)=O)=CNC2=C1 XZRZILPOZBVTDB-GJZGRUSLSA-N 0.000 description 2
- JUGQPPOVWXSPKJ-RYUDHWBXSA-N Gly-Gln-Phe Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JUGQPPOVWXSPKJ-RYUDHWBXSA-N 0.000 description 2
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 2
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 2
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 2
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 2
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 2
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 2
- ONSARSFSJHTMFJ-STQMWFEESA-N Gly-Trp-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ONSARSFSJHTMFJ-STQMWFEESA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 2
- YADRBUZBKHHDAO-XPUUQOCRSA-N His-Gly-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C)C(O)=O YADRBUZBKHHDAO-XPUUQOCRSA-N 0.000 description 2
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 2
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 101000743929 Homo sapiens DNA repair protein RAD50 Proteins 0.000 description 2
- 101000591400 Homo sapiens Double-strand break repair protein MRE11 Proteins 0.000 description 2
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 2
- 101001128138 Homo sapiens NACHT, LRR and PYD domains-containing protein 2 Proteins 0.000 description 2
- 101000981336 Homo sapiens Nibrin Proteins 0.000 description 2
- 101001094809 Homo sapiens Polynucleotide 5'-hydroxyl-kinase Proteins 0.000 description 2
- 101000785063 Homo sapiens Serine-protein kinase ATM Proteins 0.000 description 2
- 101000777293 Homo sapiens Serine/threonine-protein kinase Chk1 Proteins 0.000 description 2
- 101000777277 Homo sapiens Serine/threonine-protein kinase Chk2 Proteins 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 2
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 2
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 2
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 2
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 2
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 2
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 2
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 2
- UYNXBNHVWFNVIN-HJWJTTGWSA-N Ile-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 UYNXBNHVWFNVIN-HJWJTTGWSA-N 0.000 description 2
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 2
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 2
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 2
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 2
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- 101710128836 Large T antigen Proteins 0.000 description 2
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 2
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 2
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 2
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 2
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 2
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 2
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 2
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 2
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108060001084 Luciferase Proteins 0.000 description 2
- 239000005089 Luciferase Substances 0.000 description 2
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 2
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 2
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 2
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 2
- RLZDUFRBMQNYIJ-YUMQZZPRSA-N Lys-Cys-Gly Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N RLZDUFRBMQNYIJ-YUMQZZPRSA-N 0.000 description 2
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 2
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 2
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 2
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 2
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 2
- ZASPELYMPSACER-HOCLYGCPSA-N Lys-Gly-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZASPELYMPSACER-HOCLYGCPSA-N 0.000 description 2
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 2
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 2
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 2
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 2
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 2
- SKUOQDYMJFUMOE-ULQDDVLXSA-N Lys-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N SKUOQDYMJFUMOE-ULQDDVLXSA-N 0.000 description 2
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 2
- AEIIJFBQVGYVEV-YESZJQIVSA-N Lys-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCCN)N)C(=O)O AEIIJFBQVGYVEV-YESZJQIVSA-N 0.000 description 2
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 2
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 2
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 2
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 2
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 2
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 2
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 2
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 2
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 2
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 2
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 2
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 2
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 2
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 2
- 101100078999 Mus musculus Mx1 gene Proteins 0.000 description 2
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 2
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 2
- 201000004458 Myoma Diseases 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 102100031897 NACHT, LRR and PYD domains-containing protein 2 Human genes 0.000 description 2
- 108091061960 Naked DNA Proteins 0.000 description 2
- 229930193140 Neomycin Natural products 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 239000012124 Opti-MEM Substances 0.000 description 2
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 2
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 2
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 2
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 2
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 2
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 2
- FGXIJNMDRCZVDE-KKUMJFAQSA-N Phe-Cys-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N FGXIJNMDRCZVDE-KKUMJFAQSA-N 0.000 description 2
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 2
- FENSZYFJQOFSQR-FIRPJDEBSA-N Phe-Phe-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FENSZYFJQOFSQR-FIRPJDEBSA-N 0.000 description 2
- FZBGMXYQPACKNC-HJWJTTGWSA-N Phe-Pro-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FZBGMXYQPACKNC-HJWJTTGWSA-N 0.000 description 2
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 2
- UMIHVJQSXFWWMW-JBACZVJFSA-N Phe-Trp-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UMIHVJQSXFWWMW-JBACZVJFSA-N 0.000 description 2
- APXXVISUHOLGEE-ILWGZMRPSA-N Phe-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CC=CC=C4)N)C(=O)O APXXVISUHOLGEE-ILWGZMRPSA-N 0.000 description 2
- 102100023712 Poly [ADP-ribose] polymerase 1 Human genes 0.000 description 2
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 2
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 2
- 102100035460 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 2
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 2
- VWHJZETTZDAGOM-XUXIUFHCSA-N Pro-Lys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VWHJZETTZDAGOM-XUXIUFHCSA-N 0.000 description 2
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 2
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 2
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 2
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 2
- VGFFUEVZKRNRHT-ULQDDVLXSA-N Pro-Trp-Glu Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)O)C(=O)O VGFFUEVZKRNRHT-ULQDDVLXSA-N 0.000 description 2
- 230000007022 RNA scission Effects 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 108020005091 Replication Origin Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 2
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 2
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 2
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 2
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- 102100020824 Serine-protein kinase ATM Human genes 0.000 description 2
- 102100031081 Serine/threonine-protein kinase Chk1 Human genes 0.000 description 2
- 102100031075 Serine/threonine-protein kinase Chk2 Human genes 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- MMTOHPRBJKEZHT-BWBBJGPYSA-N Thr-Cys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O MMTOHPRBJKEZHT-BWBBJGPYSA-N 0.000 description 2
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 2
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 2
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 2
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 2
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 2
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 2
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 2
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- OBAMASZCXDIXSS-SZMVWBNQSA-N Trp-Glu-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N OBAMASZCXDIXSS-SZMVWBNQSA-N 0.000 description 2
- RQLNEFOBQAVGSY-WDSOQIARSA-N Trp-Met-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQLNEFOBQAVGSY-WDSOQIARSA-N 0.000 description 2
- LORJKYIPJIRIRT-BVSLBCMMSA-N Trp-Pro-Tyr Chemical compound C([C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 LORJKYIPJIRIRT-BVSLBCMMSA-N 0.000 description 2
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 2
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 2
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 2
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 2
- MPKPIWFFDWVJGC-IRIUXVKKSA-N Tyr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O MPKPIWFFDWVJGC-IRIUXVKKSA-N 0.000 description 2
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 2
- FNWGDMZVYBVAGJ-XEGUGMAKSA-N Tyr-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CC=C(C=C1)O)N FNWGDMZVYBVAGJ-XEGUGMAKSA-N 0.000 description 2
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 2
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 2
- DJJCXFVJDGTHFX-UHFFFAOYSA-N Uridinemonophosphate Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-UHFFFAOYSA-N 0.000 description 2
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 2
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 2
- CWSIBTLMMQLPPZ-FXQIFTODSA-N Val-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N CWSIBTLMMQLPPZ-FXQIFTODSA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- JMCOXFSCTGKLLB-FKBYEOEOSA-N Val-Phe-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JMCOXFSCTGKLLB-FKBYEOEOSA-N 0.000 description 2
- 102100036973 X-ray repair cross-complementing protein 5 Human genes 0.000 description 2
- 101710124921 X-ray repair cross-complementing protein 5 Proteins 0.000 description 2
- 101710124907 X-ray repair cross-complementing protein 6 Proteins 0.000 description 2
- XLOMVQKBTHCTTD-UHFFFAOYSA-N Zinc monoxide Chemical compound [Zn]=O XLOMVQKBTHCTTD-UHFFFAOYSA-N 0.000 description 2
- 230000001594 aberrant effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 102000009899 alpha Karyopherins Human genes 0.000 description 2
- 108010077099 alpha Karyopherins Proteins 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 208000025341 autosomal recessive disease Diseases 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 2
- IERHLVCPSMICTF-UHFFFAOYSA-N cytidine monophosphate Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(COP(O)(O)=O)O1 IERHLVCPSMICTF-UHFFFAOYSA-N 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 108010021843 fluorescent protein 583 Proteins 0.000 description 2
- 108091006047 fluorescent proteins Proteins 0.000 description 2
- 102000034287 fluorescent proteins Human genes 0.000 description 2
- 239000008273 gelatin Substances 0.000 description 2
- 229920000159 gelatin Polymers 0.000 description 2
- 235000019322 gelatine Nutrition 0.000 description 2
- 235000011852 gelatine desserts Nutrition 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 238000003205 genotyping method Methods 0.000 description 2
- 239000003862 glucocorticoid Substances 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 208000006454 hepatitis Diseases 0.000 description 2
- 231100000283 hepatitis Toxicity 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 238000002513 implantation Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 206010022000 influenza Diseases 0.000 description 2
- 108700032552 influenza virus INS1 Proteins 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 230000004777 loss-of-function mutation Effects 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 238000002715 modification method Methods 0.000 description 2
- 229960004927 neomycin Drugs 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 108020003113 steroid hormone receptors Proteins 0.000 description 2
- 102000005969 steroid hormone receptors Human genes 0.000 description 2
- 229960005322 streptomycin Drugs 0.000 description 2
- 229960004793 sucrose Drugs 0.000 description 2
- 229940094937 thioredoxin Drugs 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 238000002054 transplantation Methods 0.000 description 2
- 238000011269 treatment regimen Methods 0.000 description 2
- 241000202362 uncultured archaeon Species 0.000 description 2
- 239000001993 wax Substances 0.000 description 2
- CNKBMTKICGGSCQ-ACRUOGEOSA-N (2S)-2-[[(2S)-2-[[(2S)-2,6-diamino-1-oxohexyl]amino]-1-oxo-3-phenylpropyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CNKBMTKICGGSCQ-ACRUOGEOSA-N 0.000 description 1
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 1
- OHVLMTFVQDZYHP-UHFFFAOYSA-N 1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-2-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]ethanone Chemical compound N1N=NC=2CN(CCC=21)C(CN1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)=O OHVLMTFVQDZYHP-UHFFFAOYSA-N 0.000 description 1
- WZFUQSJFWNHZHM-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 WZFUQSJFWNHZHM-UHFFFAOYSA-N 0.000 description 1
- YJLUBHOZZTYQIP-UHFFFAOYSA-N 2-[5-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]-1,3,4-oxadiazol-2-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1=NN=C(O1)CC(=O)N1CC2=C(CC1)NN=N2 YJLUBHOZZTYQIP-UHFFFAOYSA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical group OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 208000036443 AIPL1-related retinopathy Diseases 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- WCBVQNZTOKJWJS-ACZMJKKPSA-N Ala-Cys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O WCBVQNZTOKJWJS-ACZMJKKPSA-N 0.000 description 1
- CXZFXHGJJPVUJE-CIUDSAMLSA-N Ala-Cys-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O)N CXZFXHGJJPVUJE-CIUDSAMLSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 1
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 1
- 229920000945 Amylopectin Polymers 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 1
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 1
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- GIMTZGADWZTZGV-DCAQKATOSA-N Arg-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GIMTZGADWZTZGV-DCAQKATOSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- OMKZPCPZEFMBIT-SRVKXCTJSA-N Arg-Met-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OMKZPCPZEFMBIT-SRVKXCTJSA-N 0.000 description 1
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- WTUZDHWWGUQEKN-SRVKXCTJSA-N Arg-Val-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O WTUZDHWWGUQEKN-SRVKXCTJSA-N 0.000 description 1
- BRCVLJZIIFBSPF-ZLUOBGJFSA-N Asn-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BRCVLJZIIFBSPF-ZLUOBGJFSA-N 0.000 description 1
- QQEWINYJRFBLNN-DLOVCJGASA-N Asn-Ala-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QQEWINYJRFBLNN-DLOVCJGASA-N 0.000 description 1
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 1
- LXTGAOAXPSJWOU-DCAQKATOSA-N Asn-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N LXTGAOAXPSJWOU-DCAQKATOSA-N 0.000 description 1
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 1
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 1
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 101100421200 Caenorhabditis elegans sep-1 gene Proteins 0.000 description 1
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 229920002261 Corn starch Polymers 0.000 description 1
- MUZAUPFGPMMZSS-GUBZILKMSA-N Cys-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N MUZAUPFGPMMZSS-GUBZILKMSA-N 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 1
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 235000019739 Dicalciumphosphate Nutrition 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 1
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 1
- QMVCEWKHIUHTSD-GUBZILKMSA-N Gln-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QMVCEWKHIUHTSD-GUBZILKMSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- QXQDADBVIBLBHN-FHWLQOOXSA-N Gln-Tyr-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QXQDADBVIBLBHN-FHWLQOOXSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- UTKICHUQEQBDGC-ACZMJKKPSA-N Glu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UTKICHUQEQBDGC-ACZMJKKPSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 1
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- ICUTTWWCDIIIEE-BQBZGAKWSA-N Gly-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN ICUTTWWCDIIIEE-BQBZGAKWSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- OCPPBNKYGYSLOE-IUCAKERBSA-N Gly-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN OCPPBNKYGYSLOE-IUCAKERBSA-N 0.000 description 1
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 1
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 1
- 101100005863 Homo sapiens CEP290 gene Proteins 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 1
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 1
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- TWVKGYNQQAUNRN-ACZMJKKPSA-N Ile-Ser Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O TWVKGYNQQAUNRN-ACZMJKKPSA-N 0.000 description 1
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- 101150090152 Lig1 gene Proteins 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- ZAENPHCEQXALHO-GUBZILKMSA-N Lys-Cys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZAENPHCEQXALHO-GUBZILKMSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- PGIAYBDRSREMJY-UHFFFAOYSA-N Lys-Lys-Met-Phe Chemical compound NCCCCC(N)C(=O)NC(CCCCN)C(=O)NC(CCSC)C(=O)NC(C(O)=O)CC1=CC=CC=C1 PGIAYBDRSREMJY-UHFFFAOYSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- MYKLINMAGAIRPJ-CIUDSAMLSA-N Met-Gln-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MYKLINMAGAIRPJ-CIUDSAMLSA-N 0.000 description 1
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 1
- YCUSPBPZVJDMII-YUMQZZPRSA-N Met-Gly-Glu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O YCUSPBPZVJDMII-YUMQZZPRSA-N 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 101000715663 Mus musculus Centrosomal protein of 290 kDa Proteins 0.000 description 1
- 101100155034 Mus musculus Ubap2 gene Proteins 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 101100290388 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) rnp-2 gene Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 1
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 1
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 1
- FINLZXKJWTYYLC-ACRUOGEOSA-N Phe-His-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FINLZXKJWTYYLC-ACRUOGEOSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- QUUCAHIYARMNBL-FHWLQOOXSA-N Phe-Tyr-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N QUUCAHIYARMNBL-FHWLQOOXSA-N 0.000 description 1
- 108010064218 Poly (ADP-Ribose) Polymerase-1 Proteins 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- XQHGISDMVBTGAL-ULQDDVLXSA-N Pro-His-Phe Chemical compound C([C@@H](C(=O)[O-])NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1[NH2+]CCC1)C1=CC=CC=C1 XQHGISDMVBTGAL-ULQDDVLXSA-N 0.000 description 1
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- INDVYIOKMXFQFM-SRVKXCTJSA-N Pro-Lys-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O INDVYIOKMXFQFM-SRVKXCTJSA-N 0.000 description 1
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- QHSSUIHLAIWXEE-IHRRRGAJSA-N Pro-Tyr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O QHSSUIHLAIWXEE-IHRRRGAJSA-N 0.000 description 1
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- WXWDPFVKQRVJBJ-CIUDSAMLSA-N Ser-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N WXWDPFVKQRVJBJ-CIUDSAMLSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- SWIQQMYVHIXPEK-FXQIFTODSA-N Ser-Cys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O SWIQQMYVHIXPEK-FXQIFTODSA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- SRKMDKACHDVPMD-SRVKXCTJSA-N Ser-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N SRKMDKACHDVPMD-SRVKXCTJSA-N 0.000 description 1
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- GHXXDFDIDHIEIL-WFBYXXMGSA-N Trp-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GHXXDFDIDHIEIL-WFBYXXMGSA-N 0.000 description 1
- YCQXZDHDSUHUSG-FJHTZYQYSA-N Trp-Thr-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 YCQXZDHDSUHUSG-FJHTZYQYSA-N 0.000 description 1
- BGFCXQXETBDEHP-BZSNNMDCSA-N Tyr-Phe-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O BGFCXQXETBDEHP-BZSNNMDCSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- CJDZKZFMAXGUOJ-IHRRRGAJSA-N Val-Cys-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CJDZKZFMAXGUOJ-IHRRRGAJSA-N 0.000 description 1
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 1
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- 102000002258 X-ray Repair Cross Complementing Protein 1 Human genes 0.000 description 1
- 108010000443 X-ray Repair Cross Complementing Protein 1 Proteins 0.000 description 1
- 230000007488 abnormal function Effects 0.000 description 1
- 239000000370 acceptor Substances 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 1
- LNQVTSROQXJCDD-UHFFFAOYSA-N adenosine monophosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)C(OP(O)(O)=O)C1O LNQVTSROQXJCDD-UHFFFAOYSA-N 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 235000010419 agar Nutrition 0.000 description 1
- 239000002386 air freshener Substances 0.000 description 1
- 108010087049 alanyl-alanyl-prolyl-valine Proteins 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 239000010775 animal oil Substances 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 239000000440 bentonite Substances 0.000 description 1
- 229910000278 bentonite Inorganic materials 0.000 description 1
- SVPXDRXYRYOSEX-UHFFFAOYSA-N bentoquatam Chemical compound O.O=[Si]=O.O=[Al]O[Al]=O SVPXDRXYRYOSEX-UHFFFAOYSA-N 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- CJZGTCYPCWQAJB-UHFFFAOYSA-L calcium stearate Chemical compound [Ca+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O CJZGTCYPCWQAJB-UHFFFAOYSA-L 0.000 description 1
- 235000013539 calcium stearate Nutrition 0.000 description 1
- 239000008116 calcium stearate Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 201000006754 cone-rod dystrophy Diseases 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- NEFBYIFKOOEVPA-UHFFFAOYSA-K dicalcium phosphate Chemical compound [Ca+2].[Ca+2].[O-]P([O-])([O-])=O NEFBYIFKOOEVPA-UHFFFAOYSA-K 0.000 description 1
- 229910000390 dicalcium phosphate Inorganic materials 0.000 description 1
- 229940038472 dicalcium phosphate Drugs 0.000 description 1
- 235000013681 dietary sucrose Nutrition 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000007884 disintegrant Substances 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- MVPICKVDHDWCJQ-UHFFFAOYSA-N ethyl 3-pyrrolidin-1-ylpropanoate Chemical compound CCOC(=O)CCN1CCCC1 MVPICKVDHDWCJQ-UHFFFAOYSA-N 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000010685 fatty oil Substances 0.000 description 1
- 235000003599 food sweetener Nutrition 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 102000054767 gene variant Human genes 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000003144 genetic modification method Methods 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 239000002515 guano Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 239000010687 lubricating oil Substances 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 235000019359 magnesium stearate Nutrition 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 150000004712 monophosphates Chemical class 0.000 description 1
- 229910052754 neon Inorganic materials 0.000 description 1
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 230000025308 nuclear transport Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 108010091617 pentalysine Proteins 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 210000000608 photoreceptor cell Anatomy 0.000 description 1
- 210000004598 photoreceptor connecting cilium Anatomy 0.000 description 1
- 230000016732 phototransduction Effects 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 229920001592 potato starch Polymers 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000009256 replacement therapy Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000008159 sesame oil Substances 0.000 description 1
- 235000011803 sesame oil Nutrition 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 229940045902 sodium stearyl fumarate Drugs 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 235000010356 sorbitol Nutrition 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 108700029760 synthetic LTSP Proteins 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
- 108010000998 wheylin-2 peptide Proteins 0.000 description 1
- 239000011787 zinc oxide Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Epidemiology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Ophthalmology & Optometry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 CRISPR/Cas12f1(Cas14a1) system을 이용한 LCA10 질환 치료에 관한 것이다. 보다 구체적으로, 본 발명은 LCA10 질환 치료를 위한 CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물 및 이를 이용한 치료 방법에 관한 것이다. 또한, 본 발명은 CEP290 유전자를 인위적으로 조작하기 위한 CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물 및 이를 이용한 CEP290 유전자의 조작 방법에 관한 것이다.
Description
본 발명은 CRISPR/Cas12f1(Cas14a1) system을 이용한 LCA10 질환 치료에 관한 것이다. 보다 구체적으로, 본 발명은 LCA10 질환 치료를 위한 CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물 및 이를 이용한 치료 방법에 관한 것이다. 또한, 본 발명은 인간 CEP290 유전자를 인위적으로 조작하기 위한 CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물 및 이를 이용한 CEP290 유전자의 조작 방법에 관한 것이다.
레베르 선천성 흑암시 10 (Leber congenital amaurosis type 10; LCA10)은 CEP290 유전자의 이대립 인자성(biallelic) 기능 상실 돌연변이(loss-of-function mutation)로 인한 상 염색체 열성 질환이다. LCA10을 야기하는 가장 흔한 CEP290 유전자의 돌연변이는 CEP290 유전자의 인트론 26 내에 위치한 아데닌이 구아닌으로 점 돌연변이 (c.2991 + 1655A> G라고 함)로, 이로 인해 새로운 스플라이스 공여자 부위(splice donor site)가 생성되어 그 결과 128 염기쌍의 cryptic exon에 대한 영역이 mRNA(messenger RNA)에 포함되어 조기 종결 코돈을 생성하게 된다. 현재, LCA10에 대한 승인된 치료법은 없는 상황이다. 유전자 보충 치료가 잠재적인 치료법일 수 있으나, 정상 CEP290 유전자의 큰 크기(약 7.5kb)로 인하여 AAV(Adeno-associated virus)의 패키징에 한계가 있어 치료제로서의 개발이 어려운 상황이다. 이러한 한계를 극복하기 위해, 현재 CRISPR/Cas9 시스템을 이용한 치료가 주목받아 개발되고 있다.
본 발명의 일 목적은 LCA10 질환 치료를 위한 CRISPR/Cas12f1(Cas14a1) system을 제공하는 것이다.
본 발명의 다른 목적은 LCA10 질환 치료를 위한 CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물을 제공하는 것이다.
본 발명의 또 다른 목적은 CRISPR/Cas12f1(Cas14a1) system을 이용한 LCA10 질환 치료 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 CEP290 유전자를 인위적으로 조작 또는 변형시키기 위한 CRISPR/Cas12f1(Cas14a1) system 및 이를 이용한 방법을 제공하는 것이다.
본 발명은 CRISPR/Cas12f1 system을 포함하는 유전자 조작용 조성물을 제공한다.
상기 CRISPR/Cas12f1 system은
a) 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산,
상기 가이드 RNA는 스캐폴드 영역 및 가이드 영역을 가지며,
이때, 상기 스캐폴드 영역은 Cas12f1 단백질과 상호작용할 수 있는 영역으로 crRNA 스캐폴드 서열 및 tracrRNA 스캐폴드 서열을 포함하며, 상기 스캐폴드 영역은 상기 가이드 영역의 5' 말단에 위치하고,
이때, 상기 가이드 영역은 CEP290 유전자에 존재하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 가지며, 상기 가이드 서열은 SEQ ID NOs: 51 내지 100 중 선택된 하나 이상의 서열이고, 이때, 상기 상보적인 결합은 0 내지 5개의 미스매칭 결합을 포함하며; 및
b) Cas12f1 단백질 또는 이를 암호화하는 핵산
을 포함하는 조성물일 수 있다.
상기 crRNA 스캐폴드 서열은 SEQ ID NOs: 101 내지 109 서열 중 선택된 하나의 서열일 수 있다.
상기 tracrRNA 스캐폴드 서열은 SEQ ID NOs: 110 내지 121 서열 중 선택된 하나의 서열일 수 있다.
상기 스캐폴드 영역은 링커를 추가로 더 포함할 수 있다. 이때, 스캐폴드 영역은 SEQ ID NOs: 122 내지 126 서열 중 선택된 하나의 서열일 수 있다.
상기 가이드 서열은 SEQ ID NOs: 60, 64, 66, 67, 79, 81, 92, 94, 96 및 100 서열로 구성된 군에서 선택된 하나의 서열일 수 있다.
상기 조성물은 둘 이상의 가이드 RNA 또는 이를 암호화하는 핵산을 포함할 수 있다. 이때, 상기 둘 이상의 가이드 RNA는 제1 가이드 RNA 및 제2 가이드 RNA를 포함할 수 있다. 이때, 상기 제1 가이드 RNA는 SEQ ID NOs: 51 내지 74 중 선택된 하나의 가이드 서열을 포함할 수 있고, 상기 제2 가이드 RNA는 SEQ ID NOs: 75 내지 100 중 선택된 하나의 가이드 서열을 포함할 수 있다. 이때, 상기 제1 가이드 RNA는 SEQ ID NOs: 60, 64, 66 및 67 서열로 구성된 군에서 선택된 하나의 가이드 서열을 포함할 수 있고, 상기 제2 가이드 RNA는 SEQ ID NOs: 79, 81, 92, 94, 96 및 100 서열로 구성된 군에서 선택된 하나의 가이드 서열을 포함할 수 있다.
상기 가이드 RNA는 선택적으로 3' 말단에 U-rich tail 서열을 추가로 더 포함할수 있다. 이때, 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U일 수 있다. 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 상기 d는 0 내지 3의 정수일 수 있다. 상기 e는 1 내지 10의 정수일 수 있다.
상기 조성물은 하나 이상의 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 하나의 벡터에 포함할 수 있다. 이때, 상기 벡터는 상기 하나의 가이드 RNA를 암호화하는 핵산을 위한 프로모터 및 상기 Cas12f1 단백질을 암호화하는 핵산을 위한 프로모터를 더 포함할 수 있다. 이때, 상기 조성물이 둘 이상의 가이드 RNA를 포함하는 경우, 상기 벡터는 각각의 가이드 RNA를 암호화하는 핵산을 위해 프로모터를 포함할 수 있다. 이때, 상기 프로모터는 U6 프로모터, H1 프로모터, 7SK 프로모터, CMV 프로모터, LTR 프로모터, Ad MLP 프로모터, HSV 프로모터, SV40 프로모터, CBA 프로모터 또는 RSV 프로모터일 수 있다. 이때, 상기 벡터는 플라스미드, mRNA(전사물), PCR 엠플리콘 또는 바이러스 벡터일 수 있다. 이때, 상기 바이러스 벡터는 레트로바이러스 벡터(retroviral(retrovirus) vector), 렌티바이러스 벡터(lentiviral(lentivirus) vector), 아데노바이러스 벡터(adenoviral(adenovirus vector), 아데노-연관 바이러스 벡터(adeno-associated viral (adeno-associated virus; AAV) vector), 백시니아바이러스 벡터(vaccinia viral(vaccinia virus) vector), 폭스바이러스 벡터(poxviral(poxvirus) vector) 및 단순포진 바이러스 벡터(herpes simplex viral(herpes simplex virus) vector)로 구성된 군에서 선택되는 적어도 하나의 바이러스 벡터일 수 있다.
상기 조성물은 핵산 및 단백질 혼합 형태로, 가이드 RNA 및 Cas12f1 단백질이 결합된 CRISPR/Cas12f1 복합체 형태로 포함할 수 있다.
본 발명은 CRISPR/Cas12f1(Cas14a1) system을 이용한 LCA10 질환 치료에 관한 것이다. 본 명세서에 의해 개시되는 기술을 통해, LCA10 질환 치료를 위한 CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물 및 이를 이용한 치료 방법을 제공할 수 있다. 또한, CEP290 유전자를 인위적으로 조작 또는 변형하기 위한 CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물 및 이를 이용한 조작 또는 변형 방법을 제공할 수 있다.
도 1은 LCA10을 야기하는 CEP290 유전자의 돌연변이인 IVS26 돌연변이에 의해 생성되는 cryptic exon을 설명하는 모식도이다.
도 2는 CRISPR/Cas12f1 system을 위한 표적 영역을 설정하여 나타낸 모식도이다. 상기 표적 영역은 IVS26 돌연변이를 기준으로 Upstream 1654bp 부분을 Forward 영역(F 영역)으로, downstream 2000bp 부분을 Reverse 영역(R 영역)으로 나눠서 설정하였다.
도 3은 상기 F 영역 및 상기 R 영역을 각각 표적하는 가이드 RNA의 조합(두 개의 가이드 RNA)을 이용한 CRISPR/Cas12f1 system에 의한 변이 fragment의 결실을 확인한 결과이다.
도 4는 HEK-293T세포에서 상기 F 영역 및 상기 R 영역을 각각 표적하는 가이드 RNA의 조합(가이드 서열로 F14를 가지는 가이드 RNA와 가이드 서열로 R22를 가지는 가이드 RNA)을 이용한 CRISPR/Cas12f1 system에 의한 fragment의 결실을 확인한 결과이다.
도 5는 ARPE19-HPV 세포에서 상기 F 영역 및 상기 R 영역을 각각 표적하는 가이드 RNA의 조합(가이드 서열로 F14를 가지는 가이드 RNA와 가이드 서열로 R22를 가지는 가이드 RNA)을 이용한 CRISPR/Cas12f1 system에 의한 fragment의 결실을 확인한 결과이다.
도 6은 CRIPSR/Cas9 system 및 single-stranded oligonucleotide(ssODN)을 이용하여 CEP290 유전자좌의 인트론 26에 점 돌연변이(c.2991+1655A>G)를 도입하기 위한 실험 설계에 대한 모식도이다.
도 7은 CRISPR/Cas9 system 발현 벡터 및 ssODN를 함께 ARPE19 세포에 transfection하여 생성된 ARPE19/HPV16-LCA10 cell에서 표 18의 프라이머 세트를 이용하여 점 돌연변이(c.2991+1655A>G)의 도입 여부를 PCR을 이용해 확인한 결과이다.
도 8은 도 7에서 확인된 ARPE19/HPV16-LCA10 cell에서 점 돌연변이(c.2991+1655A>G)를 도입 여부를 시퀀싱 분석을 통해 확인한 결과이다. 이때, 점 돌연변이(c.2991+1655A>G)의 포함하지 않는 야생형 서열(오리지널 서열)은 5'-CCTGGCCCCAGTTGTAATTGTGAATATCTCAT-3'(SEQ ID NO: 283) 서열이며, 점 돌연변이(c.2991+1655A>G)가 도입된 서열은 5'-CCTGGCCCCAGTTGTAATTGTGAGTATCTCAT-3' (SEQ ID NO: 284) 서열이다. 일부 결과에서 다른 점 돌연변이가 확인되었고, 다른 점 돌연변이를 포함하는 서열은 5'-CCTGGCCCCAATTGTAATTGTGAATATCTCAT-3' (SEQ ID NO: 285) 서열이다. 이때, 상기 서열 중 밑줄로 표시한 서열이 점 돌연변이이다.
도 9는 제작한 AC7 세포(이하, LCA10-AC7 세포)의 clone과 ARPE19/HPV16 (WT)의 cell에서 각각 RNA를 추출하여 qRT-PCR를 이용해 CEP290 유전자의 야생형(WT) mRNA 발현양을 비교한 결과이다.
도 10는 제작한 LCA10-AC7 세포의 clone과 ARPE19/HPV16 (WT)의 cell에서 각각 RNA를 추출하여 qRT-PCR를 이용해 CEP290 유전자의 돌연변이(c.2991+1655A>G)에 의해 생성된 cryptic exon X의 발현양을 비교한 결과이다.
도 11은 LCA10-AC7 세포의 CEP290 유전자좌의 인트론 26에 점 돌연변이(c.2991+1655A>G)에 의해 cryptic exon X이 생성됨을 확인한 RT-PCR 결과이다.
도 12는 LCA10-BC8 cell, LCA10-BD5 cell에서 게놈 DNA를 추출하여 CEP290 유전자좌의 인트론 26에 점 돌연변이(c.2991+1655A>G)를 확인한 시퀀싱 결과 및 LCA10-BC8 cell, LCA10-BD5 cell에서 RNA를 추출하여 분석한 결과이다. 이때, 점 돌연변이(c.2991+1655A>G)를 포함하지 않는 야생형 서열(오리지널 서열)은 5'-CTCCTAAAGTGCTGGGATTACAGATGTGAGCCACCGCACCTGGCCCCAGTTGTAATTGTGAATATCTCA-3' (SEQ ID NO: 286) 서열이며, 점 돌연변이(c.2991+1655A>G)가 도입된 서열은 5'-CTCCTAAAGTGCTGGGATTACAGATGTGAGCCACCGCACCTGGCCCCAGTTGTAATTGTGAGTATCTCA-3' (SEQ ID NO: 287) 서열이다. 이때, 상기 서열 중 밑줄로 표시한 서열이 점 돌연변이이다. 이때, RNA를 추출하여 분석한 결과에서 엑손 26과 엑손 27 사이에 여러 서열이 섞여 있는 양상을 보이므로 돌연변이 mRNA를 포함하는 것으로 보인다.
도 13은 LCA10-AC7 cell, LCA10-BC8 cell, LCA10-BD5 cell에서 CEP290 유전자좌의 인트론 26에 점 돌연변이(c.2991+1655A>G)에 의해 cryptic exon X이 생성됨을 RT-PCR을 이용하여 확인한 결과이다.
도 14는 LCA10-BC8 cell, LCA10-BD5 cell에서 cryptic exon X의 발현양을 확인한 결과이다.
도 15는 제작된 LCA10-BC8 cell를 이용해 F14를 가이드 서열로 가지는 가이드 RNA와 R22를 가이드 서열로 가지는 가이드 RNA에 의해 CEP290 유전자의 X-27의 발현이 감소하는 것을 확인한 결과이다. 이때, 비교군은 EDIT101이다.
도 16은 제작된 LCA10-BC8 cell를 이용해 F14를 가이드 서열로 가지는 가이드 RNA와 R22를 가이드 서열로 가지는 가이드 RNA에 의해 CEP290 유전자의 26-X-27의 발현이 감소하는 것을 확인한 결과이다. 이때, 비교군은 EDIT101이다.
도 17은 661W/LCA10 cell line 제작 방법을 모식적으로 나타낸 것이다.
도 18은 실시예 6-2에 따라, 661W/LCA10 cell line의 26-X-27(X는 Cryptic exon X를 의미함) 발현을 확인하기 위한 RT-PCR 결과를 나타낸 것이다.
도 19는 실시예 6-2에 따라, 661W/LCA10 cell line의 X-27(X는 Cryptic exon X를 의미함) 발현을 확인하기 위한 RT-PCR 결과를 나타낸 것이다.
도 20은 실시예 6-2에 따른, 661W/LCA10 cell line 각 클론의 X-27 발현량을 나타낸 그래프이다. 여기서, 각각의 레이블은 다음 명명법에 따라 이름을 붙인 것이다: A~H, 1~12 숫자 (A ~ H: 96well의 행 문자; 1 ~ 12 숫자: 각 행의 열에 해당하는 숫자, 예를 들어, E08: 96well E행, 8번째 열의 clone)
도 21은 실시예 7에 따라, 661W/LCA10-E08 cell line에 대해, LCA10 Cas12f1 치료제의 CEP290 유전자의 일부 영역 결실(deletion)을 확인하기 위한 RT-PCR 결과를 나타낸 것이다. 여기서, F14+R18, F14+R22는 각각의 가이드 영역 조합을 의미하며, EDIT101은 비교군이다.
도 22는 실시예 7에 따라, CEP290 유전자의 일부 영역 결실(deletion)을 확인하기 위한 q-PCR 결과를 나타낸 것이다. 여기서, F14+R18, F14+R22는 각각의 가이드 영역 조합을 의미하며, EDIT101은 대조군이다.
도 23은 실시예 8-1에 따른 Cas12f1 변이체에 대한 F-region의 Target screening 결과를 나타낸 것이다. 각 레이블은 [표 1]에서 개시한 표적 서열을 의미하며, 그래프 아래 표의 각 행은 반복 실험 결과 나타난 인델 수치를 나타낸다.
도 24는 실시예 8-1에 따른 Cas12f1 변이체에 대한 R-region의 Target screening 결과를 나타낸 것이다. 각 레이블은 [표 2]에서 개시한 표적 서열을 의미하며, 그래프 아래 표의 각 행은 반복 실험 결과 나타난 인델 수치를 나타낸다.
도 25는 실시예 8-2에 따른 Cas12f1 변이체에 대한 가이드 RNA 스캐폴드에 따른 표적 서열에 대한 인델 효율을 나타낸 것이다. F14, F18, 및 R22는 각각 [표 1] 및 [표 2]에 개시된 표적 서열을 의미하며, ver4.0은 서열번호 477의 가이드 RNA 스캐폴드 서열, ver4.1은 서열번호 478의 가이드 RNA 스캐폴드 서열을 의미한다.
도 26은 실시예 8-2에 따른 Cas12f1 변이체 및 가이드 RNA를 발현하는 One vector system을 모식적으로 나타낸 것이다. 구체적으로, 서열번호 288의 Cas12f1 변이체 및 서열번호 477의 가이드 RNA 스캐폴드 서열을 포함하는 가이드 RNA를 발현할 수 있는 One vector system을 나타낸다.
도 27은 실시예 8-2에 따른 Cas12f1 변이체 및 가이드 RNA를 발현하는 One vector system을 모식적으로 나타낸 것이다. 구체적으로, 서열번호 288의 Cas12f1 변이체 및 서열번호 478의 가이드 RNA 스캐폴드 서열을 포함하는 가이드 RNA를 발현할 수 있는 One vector system을 나타낸다.
도 28은 실시예 8-3에 따른 Cas12f1 변이체에 대한 가이드 서열 길이에 따른 표적 서열에 대한 인델 효율을 나타낸 것이다. F14-19mer 내지 F14-25mer는 [표 23]에 개시된 각각의 가이드 서열을 나타내고, ver4.0은 서열번호 277의 가이드 RNA 스캐폴드 서열이 사용되었음을 의미한다. 그래프 아래의 표의 각 행은 반복 실험 결과 나타난 인델 수치를 나타낸다.
도 29는 실시예 8-3에 따른 Cas12f1 변이체에 대한 가이드 서열 길이에 따른 표적 서열에 대한 인델 효율을 나타낸 것이다. R18-20mer 내지 R18-25mer는 [표 23]에 개시된 각각의 가이드 서열을 나타내고, ver4.0은 서열번호 277의 가이드 RNA 스캐폴드 서열이 사용되었음을 의미한다. 그래프 아래의 표의 각 행은 반복 실험 결과 나타난 인델 수치를 나타낸다.
도 30은 실시예 8-3에 따른 Cas12f1 변이체에 대한 가이드 서열 길이에 따른 표적 서열에 대한 인델 효율을 나타낸 것이다. R22-20mer 내지 R22-25mer는 [표 23]에 개시된 각각의 가이드 서열을 나타내고, ver4.0은 서열번호 277의 가이드 RNA 스캐폴드 서열이 사용되었음을 의미한다. 그래프 아래의 표의 각 행은 반복 실험 결과 나타난 인델 수치를 나타낸다.
도 31은 실시예 9에 따른 LCA10 Cas12f1 변이체 치료제의 ARPE19/LCA10-BC08 Cell line에 대한 X-27 발현 저해 효과를 나타낸 것이다. 여기서, ARPE19/LCA10-BC08 (no treat)는 상기 치료제를 처리하지 않은 음성 대조군, F14+R18, F14+F22는 [표 1] 및 [표 2]에 개시된 각각의 표적 서열을 조합한 LCA10 Cas12f1 변이체 치료제를 처리한 것을 의미하며, EDIT101은 비교군이다.
도 32는 실시예 9에 따른 LCA10 Cas12f1 변이체 치료제의 661W/LCA10-E08 Cell line에 대한 X-27 발현 저해 효과를 나타낸 것이다. 여기서, 661W/LCA10-E08 (no treat)는 상기 치료제를 처리하지 않은 음성 대조군, F14+R18, F14+F22는 [표 1] 및 [표 2]에 개시된 각각의 표적 서열을 조합한 LCA10 Cas12f1 변이체 치료제를 처리한 것을 의미하며, EDIT101은 비교군이다.
도 33은 실시예 10에 따른 LCA10 Cas12f1 치료제 및 NHEJ 활성 감소 인자를 같이 사용하였을 때, CEP290의 인트론 26 영역 제거(deletion) 효과를 나타낸 것이다. 여기서, Cas12f F14/R22는 Cas12f1 단백질 및 F14 및 R22를 각각 표적하는 가이드 RNA를 포함하는 LCA10 Cas12f1 치료제를 나타내고, TnpB F14/R22는 서열번호 288의 Cas12f1 단백질 변이체 및 F14 및 R22를 각각 표적하는 가이드 RNA를 포함하는 LCA10 Cas12f1 변이체 치료제를 나타낸다. 또한, Empty vecotr는 음성 대조군, shscramble은 양성 대조군이며, shDCLRE1C-3은 서열번호 473의 shRNA를 암호화하는 핵산 1개 포함 결과, shDCLRE1C-3+shDCLRE1C-3은 서열번호 473의 shRNA를 암호화하는 핵산 2개 포함 결과를 나타낸다.
도 2는 CRISPR/Cas12f1 system을 위한 표적 영역을 설정하여 나타낸 모식도이다. 상기 표적 영역은 IVS26 돌연변이를 기준으로 Upstream 1654bp 부분을 Forward 영역(F 영역)으로, downstream 2000bp 부분을 Reverse 영역(R 영역)으로 나눠서 설정하였다.
도 3은 상기 F 영역 및 상기 R 영역을 각각 표적하는 가이드 RNA의 조합(두 개의 가이드 RNA)을 이용한 CRISPR/Cas12f1 system에 의한 변이 fragment의 결실을 확인한 결과이다.
도 4는 HEK-293T세포에서 상기 F 영역 및 상기 R 영역을 각각 표적하는 가이드 RNA의 조합(가이드 서열로 F14를 가지는 가이드 RNA와 가이드 서열로 R22를 가지는 가이드 RNA)을 이용한 CRISPR/Cas12f1 system에 의한 fragment의 결실을 확인한 결과이다.
도 5는 ARPE19-HPV 세포에서 상기 F 영역 및 상기 R 영역을 각각 표적하는 가이드 RNA의 조합(가이드 서열로 F14를 가지는 가이드 RNA와 가이드 서열로 R22를 가지는 가이드 RNA)을 이용한 CRISPR/Cas12f1 system에 의한 fragment의 결실을 확인한 결과이다.
도 6은 CRIPSR/Cas9 system 및 single-stranded oligonucleotide(ssODN)을 이용하여 CEP290 유전자좌의 인트론 26에 점 돌연변이(c.2991+1655A>G)를 도입하기 위한 실험 설계에 대한 모식도이다.
도 7은 CRISPR/Cas9 system 발현 벡터 및 ssODN를 함께 ARPE19 세포에 transfection하여 생성된 ARPE19/HPV16-LCA10 cell에서 표 18의 프라이머 세트를 이용하여 점 돌연변이(c.2991+1655A>G)의 도입 여부를 PCR을 이용해 확인한 결과이다.
도 8은 도 7에서 확인된 ARPE19/HPV16-LCA10 cell에서 점 돌연변이(c.2991+1655A>G)를 도입 여부를 시퀀싱 분석을 통해 확인한 결과이다. 이때, 점 돌연변이(c.2991+1655A>G)의 포함하지 않는 야생형 서열(오리지널 서열)은 5'-CCTGGCCCCAGTTGTAATTGTGAATATCTCAT-3'(SEQ ID NO: 283) 서열이며, 점 돌연변이(c.2991+1655A>G)가 도입된 서열은 5'-CCTGGCCCCAGTTGTAATTGTGAGTATCTCAT-3' (SEQ ID NO: 284) 서열이다. 일부 결과에서 다른 점 돌연변이가 확인되었고, 다른 점 돌연변이를 포함하는 서열은 5'-CCTGGCCCCAATTGTAATTGTGAATATCTCAT-3' (SEQ ID NO: 285) 서열이다. 이때, 상기 서열 중 밑줄로 표시한 서열이 점 돌연변이이다.
도 9는 제작한 AC7 세포(이하, LCA10-AC7 세포)의 clone과 ARPE19/HPV16 (WT)의 cell에서 각각 RNA를 추출하여 qRT-PCR를 이용해 CEP290 유전자의 야생형(WT) mRNA 발현양을 비교한 결과이다.
도 10는 제작한 LCA10-AC7 세포의 clone과 ARPE19/HPV16 (WT)의 cell에서 각각 RNA를 추출하여 qRT-PCR를 이용해 CEP290 유전자의 돌연변이(c.2991+1655A>G)에 의해 생성된 cryptic exon X의 발현양을 비교한 결과이다.
도 11은 LCA10-AC7 세포의 CEP290 유전자좌의 인트론 26에 점 돌연변이(c.2991+1655A>G)에 의해 cryptic exon X이 생성됨을 확인한 RT-PCR 결과이다.
도 12는 LCA10-BC8 cell, LCA10-BD5 cell에서 게놈 DNA를 추출하여 CEP290 유전자좌의 인트론 26에 점 돌연변이(c.2991+1655A>G)를 확인한 시퀀싱 결과 및 LCA10-BC8 cell, LCA10-BD5 cell에서 RNA를 추출하여 분석한 결과이다. 이때, 점 돌연변이(c.2991+1655A>G)를 포함하지 않는 야생형 서열(오리지널 서열)은 5'-CTCCTAAAGTGCTGGGATTACAGATGTGAGCCACCGCACCTGGCCCCAGTTGTAATTGTGAATATCTCA-3' (SEQ ID NO: 286) 서열이며, 점 돌연변이(c.2991+1655A>G)가 도입된 서열은 5'-CTCCTAAAGTGCTGGGATTACAGATGTGAGCCACCGCACCTGGCCCCAGTTGTAATTGTGAGTATCTCA-3' (SEQ ID NO: 287) 서열이다. 이때, 상기 서열 중 밑줄로 표시한 서열이 점 돌연변이이다. 이때, RNA를 추출하여 분석한 결과에서 엑손 26과 엑손 27 사이에 여러 서열이 섞여 있는 양상을 보이므로 돌연변이 mRNA를 포함하는 것으로 보인다.
도 13은 LCA10-AC7 cell, LCA10-BC8 cell, LCA10-BD5 cell에서 CEP290 유전자좌의 인트론 26에 점 돌연변이(c.2991+1655A>G)에 의해 cryptic exon X이 생성됨을 RT-PCR을 이용하여 확인한 결과이다.
도 14는 LCA10-BC8 cell, LCA10-BD5 cell에서 cryptic exon X의 발현양을 확인한 결과이다.
도 15는 제작된 LCA10-BC8 cell를 이용해 F14를 가이드 서열로 가지는 가이드 RNA와 R22를 가이드 서열로 가지는 가이드 RNA에 의해 CEP290 유전자의 X-27의 발현이 감소하는 것을 확인한 결과이다. 이때, 비교군은 EDIT101이다.
도 16은 제작된 LCA10-BC8 cell를 이용해 F14를 가이드 서열로 가지는 가이드 RNA와 R22를 가이드 서열로 가지는 가이드 RNA에 의해 CEP290 유전자의 26-X-27의 발현이 감소하는 것을 확인한 결과이다. 이때, 비교군은 EDIT101이다.
도 17은 661W/LCA10 cell line 제작 방법을 모식적으로 나타낸 것이다.
도 18은 실시예 6-2에 따라, 661W/LCA10 cell line의 26-X-27(X는 Cryptic exon X를 의미함) 발현을 확인하기 위한 RT-PCR 결과를 나타낸 것이다.
도 19는 실시예 6-2에 따라, 661W/LCA10 cell line의 X-27(X는 Cryptic exon X를 의미함) 발현을 확인하기 위한 RT-PCR 결과를 나타낸 것이다.
도 20은 실시예 6-2에 따른, 661W/LCA10 cell line 각 클론의 X-27 발현량을 나타낸 그래프이다. 여기서, 각각의 레이블은 다음 명명법에 따라 이름을 붙인 것이다: A~H, 1~12 숫자 (A ~ H: 96well의 행 문자; 1 ~ 12 숫자: 각 행의 열에 해당하는 숫자, 예를 들어, E08: 96well E행, 8번째 열의 clone)
도 21은 실시예 7에 따라, 661W/LCA10-E08 cell line에 대해, LCA10 Cas12f1 치료제의 CEP290 유전자의 일부 영역 결실(deletion)을 확인하기 위한 RT-PCR 결과를 나타낸 것이다. 여기서, F14+R18, F14+R22는 각각의 가이드 영역 조합을 의미하며, EDIT101은 비교군이다.
도 22는 실시예 7에 따라, CEP290 유전자의 일부 영역 결실(deletion)을 확인하기 위한 q-PCR 결과를 나타낸 것이다. 여기서, F14+R18, F14+R22는 각각의 가이드 영역 조합을 의미하며, EDIT101은 대조군이다.
도 23은 실시예 8-1에 따른 Cas12f1 변이체에 대한 F-region의 Target screening 결과를 나타낸 것이다. 각 레이블은 [표 1]에서 개시한 표적 서열을 의미하며, 그래프 아래 표의 각 행은 반복 실험 결과 나타난 인델 수치를 나타낸다.
도 24는 실시예 8-1에 따른 Cas12f1 변이체에 대한 R-region의 Target screening 결과를 나타낸 것이다. 각 레이블은 [표 2]에서 개시한 표적 서열을 의미하며, 그래프 아래 표의 각 행은 반복 실험 결과 나타난 인델 수치를 나타낸다.
도 25는 실시예 8-2에 따른 Cas12f1 변이체에 대한 가이드 RNA 스캐폴드에 따른 표적 서열에 대한 인델 효율을 나타낸 것이다. F14, F18, 및 R22는 각각 [표 1] 및 [표 2]에 개시된 표적 서열을 의미하며, ver4.0은 서열번호 477의 가이드 RNA 스캐폴드 서열, ver4.1은 서열번호 478의 가이드 RNA 스캐폴드 서열을 의미한다.
도 26은 실시예 8-2에 따른 Cas12f1 변이체 및 가이드 RNA를 발현하는 One vector system을 모식적으로 나타낸 것이다. 구체적으로, 서열번호 288의 Cas12f1 변이체 및 서열번호 477의 가이드 RNA 스캐폴드 서열을 포함하는 가이드 RNA를 발현할 수 있는 One vector system을 나타낸다.
도 27은 실시예 8-2에 따른 Cas12f1 변이체 및 가이드 RNA를 발현하는 One vector system을 모식적으로 나타낸 것이다. 구체적으로, 서열번호 288의 Cas12f1 변이체 및 서열번호 478의 가이드 RNA 스캐폴드 서열을 포함하는 가이드 RNA를 발현할 수 있는 One vector system을 나타낸다.
도 28은 실시예 8-3에 따른 Cas12f1 변이체에 대한 가이드 서열 길이에 따른 표적 서열에 대한 인델 효율을 나타낸 것이다. F14-19mer 내지 F14-25mer는 [표 23]에 개시된 각각의 가이드 서열을 나타내고, ver4.0은 서열번호 277의 가이드 RNA 스캐폴드 서열이 사용되었음을 의미한다. 그래프 아래의 표의 각 행은 반복 실험 결과 나타난 인델 수치를 나타낸다.
도 29는 실시예 8-3에 따른 Cas12f1 변이체에 대한 가이드 서열 길이에 따른 표적 서열에 대한 인델 효율을 나타낸 것이다. R18-20mer 내지 R18-25mer는 [표 23]에 개시된 각각의 가이드 서열을 나타내고, ver4.0은 서열번호 277의 가이드 RNA 스캐폴드 서열이 사용되었음을 의미한다. 그래프 아래의 표의 각 행은 반복 실험 결과 나타난 인델 수치를 나타낸다.
도 30은 실시예 8-3에 따른 Cas12f1 변이체에 대한 가이드 서열 길이에 따른 표적 서열에 대한 인델 효율을 나타낸 것이다. R22-20mer 내지 R22-25mer는 [표 23]에 개시된 각각의 가이드 서열을 나타내고, ver4.0은 서열번호 277의 가이드 RNA 스캐폴드 서열이 사용되었음을 의미한다. 그래프 아래의 표의 각 행은 반복 실험 결과 나타난 인델 수치를 나타낸다.
도 31은 실시예 9에 따른 LCA10 Cas12f1 변이체 치료제의 ARPE19/LCA10-BC08 Cell line에 대한 X-27 발현 저해 효과를 나타낸 것이다. 여기서, ARPE19/LCA10-BC08 (no treat)는 상기 치료제를 처리하지 않은 음성 대조군, F14+R18, F14+F22는 [표 1] 및 [표 2]에 개시된 각각의 표적 서열을 조합한 LCA10 Cas12f1 변이체 치료제를 처리한 것을 의미하며, EDIT101은 비교군이다.
도 32는 실시예 9에 따른 LCA10 Cas12f1 변이체 치료제의 661W/LCA10-E08 Cell line에 대한 X-27 발현 저해 효과를 나타낸 것이다. 여기서, 661W/LCA10-E08 (no treat)는 상기 치료제를 처리하지 않은 음성 대조군, F14+R18, F14+F22는 [표 1] 및 [표 2]에 개시된 각각의 표적 서열을 조합한 LCA10 Cas12f1 변이체 치료제를 처리한 것을 의미하며, EDIT101은 비교군이다.
도 33은 실시예 10에 따른 LCA10 Cas12f1 치료제 및 NHEJ 활성 감소 인자를 같이 사용하였을 때, CEP290의 인트론 26 영역 제거(deletion) 효과를 나타낸 것이다. 여기서, Cas12f F14/R22는 Cas12f1 단백질 및 F14 및 R22를 각각 표적하는 가이드 RNA를 포함하는 LCA10 Cas12f1 치료제를 나타내고, TnpB F14/R22는 서열번호 288의 Cas12f1 단백질 변이체 및 F14 및 R22를 각각 표적하는 가이드 RNA를 포함하는 LCA10 Cas12f1 변이체 치료제를 나타낸다. 또한, Empty vecotr는 음성 대조군, shscramble은 양성 대조군이며, shDCLRE1C-3은 서열번호 473의 shRNA를 암호화하는 핵산 1개 포함 결과, shDCLRE1C-3+shDCLRE1C-3은 서열번호 473의 shRNA를 암호화하는 핵산 2개 포함 결과를 나타낸다.
용어 정의
본 명세서에서 사용되는 용어에 대한 정의는 이하와 같다.
핵산(Nucleic acid), 뉴클레오타이드(Nucleotide), 뉴클레오사이드(Nucleoside) 및 염기(Base)
"핵산(nucleic acid)"은 뉴클레오타이드 단위체로 구성된 생체 분자(또는 생체 고분자)이며, 폴리뉴클레오타이드(polynucleotide)로도 불린다. 핵산은 DNA와 RNA를 모두 포함한다. "뉴클레오타이드(nucleotide)"는 인산, 오탄당 및 염기(또는 핵염기)로 이루어진 단위체이다. RNA(리보핵산)은 오탄당이 리보오스이며, DNA(디옥시리보핵산)은 오탄당이 디옥시리보오스이다. 뉴클레오타이드는 핵염기로 아데닌(adenine; A), 구아닌(guanine; G), 사이토신(cytosine; C), 티민(Thymine; T) 및 유라실(uracil; U) 중 선택된 하나를 가진다. 이때, 아데닌, 구아닌 및 사이토신은 RNA와 DNA에 공통적으로 존재하고, 티민은 DNA에만 존재하며, 유라실은 RNA에만 존재한다. 또한, 뉴클레오타이드는 인산과 뉴클레오사이드로 구성된다고도 할 수 있다. 이때, "뉴클레오사이드(nucleoside)"는 오탄당과 핵 염기로 이루어진다. 뉴클레오사이드는 핵염기의 종류에 따라 아데노신, 티미딘, 사이티딘(시티딘), 구아노신 및 유리딘으로 분류된다. 각 뉴클레오사이드는 U(유리딘), A(아데노신), T(티미딘), C(사이티딘 또는 시티딘) 및 G(구아노신)으로 약칭된다. 더불어, 뉴클레오타이드는 뉴클레오사이드의 종류에 따라 U(유리딘 일인산), A(아데노신 일인산), T(티미딘 일인산), C(사이티딘 일인산 또는 시티딘 일인산) 및 G(구아노신 일인산)으로 약칭된다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
본 명세서에서 염기, 뉴클레오사이드, 뉴클레오타이드, 핵산, RNA 및 DNA는 염기의 종류에 따라 A, T, G, C 및 U로 약칭하여 기재한다. 상기 약칭은 문맥에 따라 적절히 해석될 수 있다. 예를 들어, 5'-UUUUU-3' 서열은 연속된 5개의 염기(유라실) 서열, 연속된 5개의 뉴클레오사이드(유리딘) 서열 및/또는 연속된 5개의 뉴클레오타이드(유리딘 일인산) 서열일 수 있다. 또한, 핵산, RNA 및 DNA의 경우, 핵산, RNA 및 DNA를 구성하는 뉴클레오타이드는 뉴클레오사이드의 종류에 따라 유리딘, 아데노신, 티미딘, 사이티딘 및 구아노신으로 약칭하여 기재한다. 상기 약칭은 문맥에 따라 적절히 해석될 수 있다. 예를 들어, 연속된 4개의 유리딘 서열을 포함하는 RNA는 연속된 4개의 유리딘 일인산 뉴클레오타이드를 포함하는 RNA로 해석될 수 있다.
표적 서열(Target sequence), 표적 가닥(Target strand), 비표적 가닥(Non-target strand)
"표적 서열(target sequence)"는 표적 핵산 또는 표적 유전자 내에 존재하는 서열로, CRISPR/Cas12f1 시스템(또는 CRISPR/Cas14a1 시스템)의 가이드 RNA에 의해 인식되는 서열 또는 CRISPR/Cas12f1 시스템(또는 CRISPR/Cas14a1 시스템)에 의해 변형되는 대상 서열을 의미한다. 구체적으로, 상기 표적 서열은 가이드 RNA에 포함된 가이드 서열에 상보성을 가지는 서열 또는 가이드 서열과 상보적으로 결합하는 서열을 의미한다.
"표적 가닥(target strand)"는 표적 서열을 포함하는 가닥을 의미한다. 표적 핵산 또는 표적 유전자가 단일 가닥인 경우, 해당 가닥은 표적 가닥일 수 있다. 또는 표적 핵산 또는 표적 유전자가 이중 가닥인 경우, 상기 이중 가닥 중 하나는 표적 가닥일 수 있으며, 상기 표적 가닥에 상보적인 가닥이 존재할 수 있다. 이때, 상기 표적 가닥에 상보적인 가닥은 "비표적 가닥(non-target strand)"로 지칭된다.
비표적 가닥(non-target strand)은 PAM(Protospacer Adjacent Motif) 서열 및 프로토스페이서(protospacer) 서열을 포함한다. 상기 PAM 서열은 CRISPR/Cas12f1 시스템(또는 CRISPR/Cas14a1 시스템)의 Cas12f1(또는 Cas14a1) 단백질이 인식하는 서열이다. 상기 프로토스페이서 서열은 PAM 서열의 5' 말단 또는 3' 말단에 위치하는 서열로, 상기 프로토스페이서 서열은 표적 서열에 상보성을 가지는 서열 또는 표적 서열과 상보적인 결합을 하는 서열이다. 프로토스페이서 서열과 표적 서열 간의 상관관계는 표적 서열과 가이드 서열 간의 상관관계와 유사하다. 이러한 특징에 의해, 일반적으로 가이드 서열 설계시 프로토스페이서 서열을 이용하여 설계할 수 있다. 즉, 표적 서열에 상보적으로 결합하는 가이드 서열을 설계시, 가이드 서열은 프로토스페이서 서열과 동일한 염기서열을 가지는 뉴클레오타이드 서열로 설계할 수 있다. 이때, 프로토스페이서 서열의 염기서열 중 T는 U로 대체하여 가이드 서열을 설계한다.
벡터(Vector)
"벡터(vector)"는 달리 특정되지 않는 한, 유전 물질을 세포 내로 운반할 수 있는 모든 물질을 통틀어 일컫는다. 예를 들어, 벡터는 대상이 되는 유전 물질, 예를 들어, CRISPR/Cas 시스템의 이펙터 단백질(Cas 단백질)을 암호화하는 핵산, 및/또는 가이드 RNA를 암호화하는 핵산을 포함하는 DNA 분자일 수 있으나, 이에
제한되는 것은 아니다. 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
작동 가능하게 연결된(Operably linked)
"작동 가능하게 연결된(operably linked)"이라는 용어는 특정 구성이 다른 구성과 기능적 관계로 배치되어, 상기 특정 구성이 의도된 방식대로 기능할 수 있도록 다른 구성에 연결되어 있는 것을 의미한다. 예를 들어, 프로모터 서열이 A 단백질을 암호화하는 서열과 작동 가능하게 연결되었다고 할 때, 상기 프로모터가 세포 내에서 상기 A 단백질을 암호화하는 서열을 전사 및/또는 발현하도록 A 단백질을 암호화하는 서열에 연결된 것을 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
엔지니어링 된(Engineered)
"엔지니어링 된(engineered)"이란 용어는 자연계에 이미 존재하는 구성을 가진 물질, 분자 등과 구분하기 위해 사용하는 용어로, 상기 물질, 분자 등에 인위적인 변형이 가해진 것을 의미한다. 예를 들어, "엔지니어링 된 가이드 RNA(engineered guide RNA)"의 경우, 자연계에 존재하는 가이드 RNA의 구성에 인위적인 변경이 가해진 가이드 RNA를 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
NLS (Nuclear localization sequence, or signal)
"NLS(Nuclear Localization Sequence, or Signal)"라 함은, 핵 수송(nuclear transport) 작용으로 세포 핵 외부의 물질을 핵 내부로 수송할 때, 수송 대상인 단백질에 붙어 일종의 "태그" 역할을 하는 일정 길이의 펩타이드, 또는 그 서열을 의미한다. 본 명세서에서 사용되는 "NLS"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기재된 것과 유사 또는 동일한 방법 및 물질이 본 발명의 실행 또는 시험에서 사용될 수 있지만, 적합한 방법 및 물질이 이하에 기재된다. 본 명세서에서 언급된 모든 간행물, 특허 및 기타 다른 참고문헌은 전체가 참고로 포함된다. 추가로, 물질, 방법 및 실시예는 단지 예시적이며, 제한되는 것으로 의도되지 않는다.
이하 본 발명을 설명한다.
개괄 - CRISPR/Cas9을 이용한 LCA10 질환 치료
레베르 선천성 흑암시 10 (Leber congenital amaurosis type 10; LCA10)은 CEP290 유전자의 이대립 인자성(biallelic) 기능 상실 돌연변이(loss-of-function mutation)로 인한 상 염색체 열성 질환이다. 대부분의 환자는 초기 유아로, 임상적으로 심각한 원뿔세포-막대세포 이상증(cone-rod dystrophy) 및 시력 저하 또는 상실을 보인다. 정상 CEP290 유전자에 의해 암호화된 단백질은 광수용체 연결 섬모(photoreceptor-connecting cilium)에 위치하고, 광 변환(phototransduction) 및 외부 세그먼트(outer segment) 재생에 필요한 인자이다. LCA10을 야기하는 가장 흔한 CEP290 유전자의 돌연변이는 IVS26 돌연변이이다. 상기 IVS26 돌연변이는 CEP290 유전자의 엑손 26과 엑손 27사이의 인트론 26내에 위치한 아데닌이 구아닌으로 점 돌연변이 (c.2991 + 1655A> G라고 함) 된 것으로, 이로 인해 새로운 스플라이스 공여자 부위(splice donor site)가 생성되어 그 결과 128 염기쌍의 cryptic exon에 대한 영역이 mRNA(messenger RNA)에 포함되어 엑손 26과 엑손 27사이에 cryptic 엑손 X를 추가로 생성하게 된다(도 1). 이러한 비정상적인 스플라이싱(splicing)은 다른 세포 유형보다 인간 광수용체 세포에서 더 두드러진다. 현재, LCA10에 대한 승인된 치료법은 없는 상황이다. 유전자 치료가 잠재적인 치료법이나, 정상 CEP290 유전자의 큰 크기(약 7.5kb)는 AAV(Adeno-associated virus)의 패키징 용량을 초과한다. 이러한 한계를 극복하기 위해, 현재 CRISPR/Cas9 시스템을 이용한 치료가 주목받아 개발되고 있다. 특히, CEP290-특이적 가이드 RNA와 Staphylococcus aureus Cas9(SaCas9)를 이용한 치료제인 EDIT-101를 Editas에서 개발 중에 있다. EDIT-101은 CEP290 locus에 높은 특이성을 보이는 2개의 가이드 RNA를 이용하여 돌연변이 부분을 결실하는 유전자 편집을 통해 CEP290 스플라이싱 결함을 제거하도록 한다. 이는 한 쌍의 가이드 RNA를 이용해 IVS26 돌연변이의 역위(inversion) 또는 제거를 유도하여 정상적인 스플라이싱 및 기능적 CEP290 발현의 복원하도록 한다(Morgan L. Maeder et al., Nature Medicine, 25, 229-233 (2019)).
한편, 본 발명자들은 앞선 연구를 통해 새로운 CRISPR/Cas 시스템인 CRISPR/Cas12f1 시스템의 효율을 증가시켜 이를 CRISPR/Cas12f1-ge 시스템으로 명명하였다. CRISPR/Cas12f1 시스템은 선행연구(Harrington et al., Science, 362, 839-842 (2018))에서 최초로 보고된 새로운 CRISPR/Cas 시스템으로, 현저히 작은 크기의 장점에도 불구하고 이중 가닥 DNA 절단 활성이 없거나, 극히 낮아 유전자 편집 기술에 응용하는 데 한계가 있다고 보고되었다. 이러한 한계를 극복하기 위해 본 발명자들은 이중 가닥 DNA(double strand DNA; dsDNA) 절단 활성을 높이는 engineered guide RNA를 연구 개발하고 완성하여 유전자 편집에 활용할 수 있도록 하였다(한국특허 출원번호 제10-2021-0051552호, 제10-2021-0050093호 및 제10-2021-0044152호). 상기 CRISPR/Cas12f1 시스템은 CRISPR/Cas9 시스템에 비하여 Cas 단백질의 크기가 현저히 작아 기존에 연구된 대부분의 Cas 단백질의 크기로 인한 AAV (아데노 관련 바이러스)에 탑재의 어려움 및 이로 인한 유전자 치료제로서 적용 어려움을 해결 가능하게 한다. 또한, 상기 CRISPR/Cas12f1 시스템은 프로토스페이서 서열 외부에서 dsDNA 절단을 유도하는 특징을 가진다. 이러한 특징은 NHEJ 매개 인델 돌연변이의 첫 번째 시도 이후에도 프로토스페이서 서열이 크게 변형될 때까지 추가적인 시도를 통해 dsDNA 절단-NHEJ 프로세스가 실행될 수 있음을 의미한다. 이러한 여러 번의 절단 및 수복 프로세스는 확실한 표적 서열(및 프로토스페이서 서열) 절단을 위한 더 많은 기회를 제공할 수 있으며, 이러한 특징을 가진 CRISPR/Cas12f1 시스템은 유전자 치료 영역에서 우수한 임상적 유용성을 가진다고 할 수 있다.
앞선 LCA10 질환을 치료하기 위한 접근 방법을 기초로 하여, 본 발명자들은 LCA10 질환 치료에 새로운 CRISPR/Cas12f1 시스템을 도입하였다. CRISPR/Cas12f1 시스템의 도입은 기존 CRISPR/Cas9 시스템보다 AAV (아데노 관련 바이러스)에 탑재의 용이성 및 여러 번의 절단과 수복 프로세스에 따른 확실한 유전자 편집 등의 장점을 가진다. 이에 본 발명자들은 상기와 같은 장점을 가진 CRISPR/Cas12f1 시스템을 이용한 LCA10 질환 치료제 및 치료 방법을 개발하였다.
이하에서, CRISPR/Cas12f1 시스템을 이용한 LCA10 질환 치료제 및 치료 방법에 대해 자세히 설명한다.
<LCA10 질환 치료를 위한 CRISPR/Cas12f1 시스템>
본 명세서에 의해 개시되는 일 태양은 LCA10 질환 치료를 위한 CRISPR/Cas12f1 시스템에 관한 것이다. 상기 LCA10 질환은 앞서 설명한 바와 같이 CEP290 유전자의 IVS26 돌연변이로 인해 야기되는 질환이다. 이러한 LCA10 질환을 치료하기 위해, 원인이 되는 IVS26 돌연변이에 의해 생성되는 128 염기쌍의 cryptic exon의 전체 또는 일부의 제거 또는 역위(inversion)를 유도함으로써 정상적인 CEP290 유전자가 발현되도록 하는 치료하는 전략을 이용할 수 있다.
이러한 치료 전략을 위해, 본 명세서에 개시되는 일 태양은 CRISPR/Cas12f1 시스템을 이용한다. 본 명세서에 개시되는 CRISPR/Cas12f1 시스템은 야생형 CRISPR/Cas12f1 시스템 및 인위적으로 변형된 CRISPR/Cas12f1 시스템을 모두 포함한다. 이때, 상기 인위적으로 변형된 CRISPR/Cas12f1 시스템은 CRISPR/Cas12f1 시스템을 구성하는 요소, 즉, 가이드 RNA 및 Cas12f1 단백질 중 적어도 하나 이상을 인위적으로 변형시킨 CRISPR/Cas12f1 시스템을 의미한다. 예를 들어, 상기 인위적으로 변형된 CRISPR/Cas12f1 시스템은 인위적으로 변형된 가이드 RNA, 및 Cas12f1 단백질을 포함할 수 있다. 상기 인위적으로 변형된 CRISPR/Cas12f1 시스템은 CRISPR/Cas12f1-ge 시스템을 포함한다. 따라서, 본 명세서에 개시되는 CRISPR/Cas12f1 시스템은 야생형 CRISPR/Cas12f1 시스템 및 인위적으로 변형된 CRISPR/Cas12f1 시스템(예를 들어, CRISPR/Cas12f1-ge 시스템)을 모두 포함한다.
상기 CRISPR/Cas12f1 시스템은 128 염기쌍의 cryptic exon의 전체 또는 일부의 제거 또는 역위를 유도하기 위해 이용된다. 상기 CRISPR/Cas12f1 시스템은 여러 번의 절단과 수복 프로세스에 따른 확실한 유전자 편집을 통해 원인이 되는 cryptic exon의 전체 또는 일부를 더욱 효과적으로 제거 또는 역위시키므로 치료 효과를 증가시킬 수 있다. 또한, 상기 CRISPR/Cas12f1 시스템은 기존 CRISPR/Cas9 시스템에 비해 현저히 작은 사이즈로 AAV 등의 바이러스 벡터에 삽입 시 추가 공간(용량) 확보 등 치료제 적용에 더욱 효과적일 수 있다.
보다 구체적으로, LCA10 질환을 치료하기 위한 CRISPR/Cas12f1 시스템은 CEP290 유전자를 표적하는 가이드 RNA 및 Cas12f1 단백질을 포함한다.
상기 가이드 RNA는 CEP290 유전자 내의 인트론 26 영역을 표적한다. 이때, 상기 인트론 26 영역은 IVS26 돌연변이, 즉, 인트론 26 내에 위치한 아데닌이 구아닌으로 변형된 점 돌연변이(c.2991 + 1655A> G라고 함)를 포함한다.
이하에서, LCA10 질환 치료를 위한 CRISPR/Cas12f1 system의 각 구성 및 표적 대상에 대해 자세히 설명한다.
1. 표적 유전자(Target gene)
LCA10 질환은 CEP290 유전자의 인트론 26 영역에 생성된 점 돌연변이(c.2991 + 1655A> G)에 기인한 것으로 알려져 있다. 이러한 점 돌연변이, 즉, IVS26 돌연변이(c.2991 + 1655A> G)는 인트론 26 영역 내에 새로운 스플라이스 공여자 부위(splice donor site)를 생성시키고 그로 인한 비정상적인 스플라이싱에 의해 CEP290 유전자의 전사 시 mRNA 내에 128 염기쌍의 cryptic exon의 형성을 초래하여 비정상적인 CEP290 단백질을 발현하거나 정상적인 CEP290 단백질의 발현을 저해한다. 따라서, LCA10 질환의 치료를 위해, 상기 CEP290 유전자는 CRISPR/Cas12f1 system의 표적 대상, 즉, 표적 유전자로 선정되었다. 특히, 상기 CEP290 유전자는 IVS26 돌연변이(c.2991 + 1655A> G)를 포함한다. 본 명세서 내에 기재된 "CEP290 유전자"는 IVS26 돌연변이(c.2991 + 1655A> G)를 포함하는 CEP290 유전자를 지칭한다. 이때, 상기 IVS26 돌연변이(c.2991 + 1655A> G)를 포함하는 CEP290 유전자는 "비정상 CEP290 유전자", "CEP290 유전자 변이체" 또는 "CEP290 유전자(IVS26)"로도 지칭되며, 상기 용어는 본 명세서에서 혼용되어 사용된다. 더불어, IVS26 돌연변이(c.2991 + 1655A> G)를 포함하지 않는 CEP290 유전자 또는 정상적으로 CEP290 단백질을 발현하는 CEP 유전자는 "야생형 CEP290 유전자" "정상 CEP290 유전자" 또는 "기능적 CEP290 유전자"로 지칭되며, 상기 용어는 본 명세서에서 혼용되어 사용된다.
1-1) 표적 영역(Target region)
LCA10 질환 치료를 위해, CRISPR/Cas12f1 system은 CEP290 유전자를 표적한다. 보다 구체적으로 상기 CRISPR/Cas12f1 system은 CEP290 유전자의 일 영역을 표적한다. 상기 CEP290 유전자의 일 영역은 상기 CRISPR/Cas12f1 system을 위한 표적 영역(target region)으로, 상기 표적 영역은 상기 CRISPR/Cas12f1 system을 구성하는 가이드 RNA와 상보적으로 결합하는 표적 서열(target sequence)를 포함한다.
상기 CEP290 유전자의 일 영역, 즉, 표적 영역은 CEP290 유전자 내의 인트론 26 영역이다. 이때, 상기 인트론 26 영역은 IVS26 돌연변이(c.2991 + 1655A> G)를 포함한다. 이때, 상기 인트론 26 영역은 상기 IVS26 돌연변이(c.2991 + 1655A> G)를 기준으로 두 개의 영역으로 나뉠 수 있다. 즉, 상기 인트론 26 영역은 상기 IVS26 돌연변이(c.2991 + 1655A> G)를 기준으로 상류 영역과 하류 영역으로 나뉠 수 있다. 이때, 상기 상류 영역은 상기 CEP290 유전자의 엑손 26의 3'말단과 상기 IVS26 돌연변이(c.2991 + 1655A> G) 사이의 영역일 수 있다. 이때, 상기 하류 영역은 상기 IVS26 돌연변이(c.2991 + 1655A> G)와 상기 CEP290 유전자의 엑손 27의 5' 말단 사이의 영역일 수 있다.
일 구현예로서, 상기 표적 영역은 상기 IVS26 돌연변이(c.2991 + 1655A> G)를 포함하는 인트론 26 영역의 일부 영역일 수 있다.
다른 일 구현예로서, 상기 표적 영역은 상기 인트론 26 영역 중 IVS26 돌연변이(c.2991 + 1655A> G)를 기준으로 상류 영역일 수 있다. 또는 상기 표적 영역은 상기 CEP290 유전자의 엑손 26의 3'말단과 상기 IVS26 돌연변이(c.2991 + 1655A> G) 사이의 영역일 수 있다.
또 다른 일 구현예에서, 상기 표적 영역은 상기 인트론 26 영역 중 IVS26 돌연변이(c.2991 + 1655A> G)를 기준으로 하류 영역일 수 있다. 또는 상기 표적 영역은 상기 IVS26 돌연변이(c.2991 + 1655A> G)와 상기 CEP290 유전자의 엑손 27의 5' 말단 사이의 영역일 수 있다.
상기 표적 영역은 이중 가닥 DNA로, 표적 가닥 및 비표적 가닥으로 구성된다. 이때, 상기 표적 가닥은 표적 서열을 포함하며, 상기 CRISPR/Cas12f1 system을 구성하는 가이드 RNA가 결합하는 가닥(strand)이다. 상기 비표적 가닥은 상기 표적 가닥에 상보적인 가닥으로, PAM(Protospacer Adjacent Motif) 서열 및 프로토스페이서(protospacer) 서열을 포함한다. 이때, 상기 프로토스페이서 서열은 표적 서열에 상보성을 가지는 서열 또는 표적 서열과 상보적인 결합을 하는 서열이다. 상기 설명된 표적 서열, 표적 가닥, 비표적 가닥 및 프로토스페이서 서열은 앞서 "용어 정의" 섹션에 기재한 바와 같다.
i) 표적 서열(Target sequence)
표적 서열은 상기 표적 영역에 존재하는 일부 서열로, 상기 CRISPR/Cas12f1 system을 구성하는 가이드 RNA와 상보적으로 결합하는 서열이다. 또한, 상기 표적 서열은 앞서 "용어 정의" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 표적 서열, 표적 가닥, 비표적 가닥 및 프로토스페이서 서열과 동일한 특징 및 관계를 가진다.
상기 표적 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 일 예로, 상기 표적 서열은 15 내지 20개, 15 내지 25개, 15 내지 30개, 15 내지 35개 또는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 표적 서열은 20 내지 25개, 20 내지 30개, 20 내지 35개 또는 20 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 표적 서열은 25 내지 30개, 25 내지 35개 또는 25 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 표적 서열은 30 내지 35개 또는 30 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 표적 서열은 35 내지 40개의 뉴클레오타이드 서열일 수 있다. 다른 일 예로, 상기 표적 서열은 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 뉴클레오타이드 서열일 수 있다.
일 구현예로서, 상기 표적 서열은 상기 IVS26 돌연변이(c.2991 + 1655A> G)를 포함하는 인트론 26 영역의 일부 영역에 존재하는 15 내지 40개의 뉴클레오타이드 서열일 수 있다.
다른 일 구현예로서, 상기 표적 서열은 상기 인트론 26 영역 중 IVS26 돌연변이(c.2991 + 1655A> G)를 기준으로 상류 영역에 존재하는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 표적 서열은 상기 CEP290 유전자의 엑손 26의 3'말단과 상기 IVS26 돌연변이(c.2991 + 1655A> G) 사이의 영역에 존재하는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 일 구체예로, 상기 표적 서열은 표 1에 정리하였다. 표 1은 c.2991+1655A>G 유전자 돌연변이를 기준으로 Upstream 1654bp 부분을 Forward 영역(F 영역)으로 나눠서 구분하였고, F 영역에 존재하는 프로토스페이서 서열들을 기준으로 표적 서열을 정리하였다. 각 서열을 쉽게 구분하기 위해 F 영역에 존재하는 서열은 F로 구분하여 넘버링하여 표 1에 정리하였다.
Name | Target sequence | SEQ ID NO |
Target-F01 | 5'-TAAATAGGCATAATTTTCTA-3' | 1 |
Target-F02 | 5'-TTGCTTTCTGCTGCTTTTGC-3' | 2 |
Target-F03 | 5'-GTAGCTTTCAGGATTCCTAC-3' | 3 |
Target-F04 | 5'-GGAGCTTGTTCTGTCCTCAG-3' | 4 |
Target-F05 | 5'-GTTTAACGTTATCATTTTCC-3' | 5 |
Target-F06 | 5'-GCTCATAGAGACACATTCAG-3' | 6 |
Target-F07 | 5'-TTTCTGATGAGGAAGATGAA-3' | 7 |
Target-F08 | 5'-GATCTTAGATAAGAATAATC-3' | 8 |
Target-F09 | 5'-TTACTTCTAAATAATATTGA-3' | 9 |
Target-F10 | 5'-TGGACCATGGATGCACTCTG-3' | 10 |
Target-F11 | 5'-GCTACATCCATTCCAAGGAA-3' | 11 |
Target-F12 | 5'-TTTTCTCTTAGATGTCTGGT-3' | 12 |
Target-F13 | 5'-TGTAGAATTTTAATGTAGAA-3' | 13 |
Target-F14 | 5'-TCTTACCCCTGTACCCAGAA-3' | 14 |
Target-F15 | 5'-CTTGCATGATTTAGCTGAAT-3' | 15 |
Target-F16 | 5'-CAGAAGTCATTCAGCCACTA-3' | 16 |
Target-F17 | 5'-GTGTGTGTGTTATGTGGGAA-3' | 17 |
Target-F18 | 5'-TTATTCATTCAGTTTAGTTA-3' | 18 |
Target-F19 | 5'-GGGATTTGGCAGATTTTAAT-3' | 19 |
Target-F20 | 5'-CTGCCAAATCCCCCCAAACA-3' | 20 |
Target-F21 | 5'-CACAAGGTTCAAGAATCACA-3' | 21 |
Target-F22 | 5'-CATCATTTTTTATTGTAGAA-3' | 22 |
Target-F23 | 5'-GAATGTGTCTCTATGAGCCAG-3' | 23 |
Target-F24 | 5'-TAAGATCTAATTCTATTAGCT-3' | 24 |
또 다른 일 구현예로서, 상기 표적 서열은 상기 인트론 26 영역 중 IVS26 돌연변이(c.2991 + 1655A> G)를 기준으로 하류 영역에 존재하는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 표적 서열은 상기 IVS26 돌연변이(c.2991 + 1655A> G)와 상기 CEP290 유전자의 엑손 27의 5' 말단 사이의 영역에 존재하는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 일 구체예로, 상기 표적 서열은 표 2에 정리하였다. 표 2는 c.2991+1655A>G 유전자 돌연변이를 기준으로 downstream 2000bp 부분을 Reverse 영역(R 영역)으로 나눠서 구분하였고, R 영역에 존재하는 프로토스페이서 서열들을 기준으로 표적 서열을 정리하였다. 각 서열을 쉽게 구분하기 위해 R 영역에 존재하는 서열은 R로 구분하여 넘버링하여 표 2에 정리하였다.
Name | Target sequence (20nt) | SEQ ID NO |
Target-R01 | 5'-TCTCATGAACCTTTACCTCT-3' | 25 |
Target-R02 | 5'-TATTAGCTTGAACTCTGTGC-3' | 26 |
Target-R03 | 5'-CATTAAGGAAGACAGATATG-3' | 27 |
Target-R04 | 5'-CAGGAGTGACTTTGTTCCAT-3' | 28 |
Target-R05 | 5'-GCTACCGGTTACCTGAAGGG-3' | 29 |
Target-R06 | 5'-TGCCACAAGAATGATCATTC-3' | 30 |
Target-R07 | 5'-TCCCATGTGACTCCCCGCCT-3' | 31 |
Target-R08 | 5'-TATTGTTGCTTTTTGAGAGG-3' | 32 |
Target-R09 | 5'-GTGAATTTCTATTCCTGTTT-3' | 33 |
Target-R10 | 5'-GCATACTTTTTTTAATGGAA-3' | 34 |
Target-R11 | 5'-CTCAACACACAGAAACAAAT-3' | 35 |
Target-R12 | 5'-GAATAGATAATAAGGAAATA-3' | 36 |
Target-R13 | 5'-TTTCTTTTTTCTTCTACTAT-3' | 37 |
Target-R14 | 5'-CCTGTGTTTCAAGGGGATCT-3' | 38 |
Target-R15 | 5'-CCCTTGAAACACAGGAATTG-3' | 39 |
Target-R16 | 5'-TAAGCAATGGATTTCAGTGA-3' | 40 |
Target-R17 | 5'-CAATGGATTTCAGTGATAAA-3' | 41 |
Target-R18 | 5'-TATTTTCCAGGTACTCCACT-3' | 42 |
Target-R19 | 5'-TACAAACAGGGTAATGAGAC-3' | 43 |
Target-R20 | 5'-TCCTGTGTATTCATAGTATA-3' | 44 |
Target-R21 | 5'-GATAATCCTATTGTTTGTTA-3' | 45 |
Target-R22 | 5'-CACTCTCTCCCTAGTAACTC-3' | 46 |
Target-R23 | 5'-GAAACTTCACTGGTCTCCTT-3' | 47 |
Target-R24 | 5'-CTGGCGGATTACCTGAGATC-3' | 48 |
Target-R25 | 5'-CTATAATTATGTACTTTACT-3' | 49 |
Target-R26 | 5'-CATGTTGGCCGGGCTGGTCT-3' | 50 |
2. 가이드 RNA(Guide RNA)
LCA10 질환 치료를 위한 CRISPR/Cas12f1 시스템은 가이드 RNA를 포함한다. 상기 가이드 RNA는 tracrRNA(trans-activating CRISPR RNA) 및 crRNA(CRISPR RNA)를 포함한다. 이때, 상기 crRNA는 상기 표적 서열과 상보적으로 결합할 수 있는 가이드 서열(guide sequence)을 포함한다. 상기 crRNA는 tracrRNA 및/또는 Cas12f1 단백질과 결합 및/또는 상호작용하는 스캐폴드 서열을 포함한다. 이때, 상기 tracrRNA는 crRNA 및/또는 Cas12f1 단백질과 결합 및/또는 상호작용하는 스캐폴드 서열을 가진다. 따라서, 상기 가이드 RNA는 가이드 영역 및 스캐폴드 영역을 포함한다. 이때, 상기 가이드 영역은 가이드 서열을 가지고, 상기 스캐폴드 영역은 상기 crRNA의 스캐폴드 서열(이하에서, crRNA 스캐폴드 서열로 기재) 및 상기 tracrRNA의 스캐폴드 서열(이하에서, tracrRNA 스캐폴드 서열로 기재)을 가진다.
상기 가이드 RNA는 선택적으로 3' 말단에 U-rich tail 서열을 더 포함할 수 있다. 이때, 상기 U-rich tail 서열은 유리딘(U)가 풍부한 서열로, 상기 U-rich tail 서열은 engineered guide RNA(또는 engineered CRISPR/Cas12f1(Cas14a1) system)을 이용한 표적 유전자(표적 핵산) 에디팅 효율을 높이는 역할을 한다고 알려져 있다(PCT/KR2020/014961).
이하에서, 가이드 RNA의 각 구성에 대해 상세히 기술한다.
2-1) 가이드 영역(Guide region)
가이드 RNA는 가이드 영역을 포함한다. 상기 가이드 영역은 가이드 RNA를 표적 유전자에 특이적으로 결합하는 역할을 한다. 이때, 가이드 영역은 가이드 서열(guide sequence)을 가진다. 상기 가이드 서열은 표적 유전자를 인식(recognizing), 결합(binding) 또는 타겟(targeting)하는 RNA 서열이다. 보다 구체적으로, 가이드 서열은 표적 서열과 상보적으로 결합하는 RNA 서열, 표적 서열과 상보적인 결합을 형성할 수 있는 RNA 서열 또는 표적 서열에 상보성을 가지는 RNA 서열이다. 또는 가이드 서열은 프로토스페이서 서열과 동일하거나, 유사하거나 또는 그에 대응되는 RNA 서열이다. 이때, 프로토스페이서 서열은 표적 서열과 유기적인 관계를 가지며, 이와 관련된 설명은 상기 용어의 정의 섹션의 “표적 서열, 표적 가닥 및 비표적 가닥”에서 설명한 바와 같다. 가이드 서열은 표적 서열에 따라 변경되는 서열로, 가이드 서열은 표적 서열에 따라 달라진다. 또한, 가이드 서열은 RNA 서열로, 표적 유전자의 표적 서열 내에 존재하는 아데노신(A)에 대해, 상기 가이드 서열은 상보적인 결합을 형성할 수 있는 유리딘(U)을 포함한다. 또는 표적 유전자의 프로토스페이서 서열 내에 존재하는 티미딘(T)에 대해, 상기 가이드 서열은 티미딘(T) 대신에 유리딘(U)을 포함한다. 또한, 상기 가이드 서열은 스페이서 서열(spacer sequence)로도 지칭되며, 이하에서 가이드 서열과 스페이서 서열은 병용되어 사용된다.
상기 가이드 서열은 crRNA의 3' 말단에 위치한다. 또는 상기 가이드 서열은 crRNA 스캐폴드 서열의 3' 말단에 위치한다.
상기 가이드 서열은 crRNA 스캐폴드 서열의 3' 말단과 공유결합으로 연결된다.
상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다.
일 구현예로서, 상기 가이드 서열은 15 내지 20개, 15 내지 25개, 15 내지 30개, 15 내지 35개 또는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 가이드 서열은 20 내지 25개, 20 내지 30개, 20 내지 35개 또는 20 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 가이드 서열은 25 내지 30개, 25 내지 35개 또는 25 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 가이드 서열은 30 내지 35개 또는 30 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 가이드 서열은 35 내지 40개의 뉴클레오타이드 서열일 수 있다.
다른 일 구현예로서, 상기 가이드 서열은 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 뉴클레오타이드 서열일 수 있다.
상기 가이드 서열은 표적 서열과 상보적인 결합을 하는 서열일 수 있다. 이때, 상기 상보적인 결합은 선택적으로 적어도 하나 이상의 미스매칭 결합을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 표적 서열과 상보적인 결합을 하는 서열로, 이때, 상기 상보적인 결합은 0 내지 5개의 미스매칭 결합을 포함할 수 있거나, 또는 상기 상보적인 결합은 0 내지 5개의 미스매치를 포함할 수 있다.
상기 가이드 서열은 표적 서열에 대해 상보적인 서열일 수 있다. 이때, 상기 상보적인 서열은 표적 서열에 대해 0 내지 5개의 미스매치된(mismatched) 뉴클레오타이드 서열을 포함할 수 있다. 또는 상기 가이드 서열은 표적 서열에 대해 적어도 70% 이상 상보적인 뉴클레오타이드 서열일 수 있다. 이때, 표적 서열이 DNA인 경우에 표적 서열 내에 존재하는 아데노신(A)에 대해, 상기 가이드 서열은 상기 아데노신(A)에 상보적인 결합을 형성할 수 있는 유리딘(U)을 포함할 수 있다.
일 구현예로서, 상기 가이드 서열은 표적 서열에 대해 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100% 상보적인 서열일 수 있다. 또는 상기 가이드 서열은 표적 서열에 대해 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100% 상보적인 서열일 수 있다. 또는 상기 가이드 서열은 표적 서열에 대해 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100% 상보적인 서열일 수 있다. 또는 상기 가이드 서열은 표적 서열에 대해 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 상보적인 서열일 수 있다.
상기 가이드 서열은 프로토스페이서 서열과 동일한 또는 유사한 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열에 대해 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 이때, 상기 서열 동일성 또는 서열 유사성은 적어도 70% 이상인 것일 수 있다. 이때, 프로토스페이서 서열 내에 존재하는 티미딘(T)에 대해, 상기 가이드 서열은 티미딘(T) 대신에 유리딘(U)을 포함할 수 있다.
일 구현예로서, 상기 가이드 서열은 프로토스페이서 서열과 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열과 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열과 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열과 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 동일한 또는 유사한 서열일 수 있다.
다른 일 구현예로서, 상기 가이드 서열은 프로토스페이서 서열에 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열에 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열에 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열에 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
일 구현예로서, 상기 가이드 서열은 상기 CEP290 유전자의 IVS26 돌연변이(c.2991 + 1655A> G)를 포함하는 인트론 26 영역의 일부 영역에 존재하는 표적 서열과 상보적 결합을 하는 15 내지 40개의 뉴클레오타이드 서열일 수 있다.
일 구현예로서, 상기 가이드 서열은 상기 CEP290 유전자의 인트론 26 영역 중 IVS26 돌연변이(c.2991 + 1655A> G)를 기준으로 상류 영역에 존재하는 표적 서열과 상보적 결합을 하는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 가이드 서열은 상기 CEP290 유전자의 엑손 26의 3'말단과 상기 IVS26 돌연변이(c.2991 + 1655A> G) 사이의 영역에 존재하는 표적 서열과 상보적 결합을 하는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 일 구체예로, 상기 가이드 서열은 상기 표 1에 정리된 표적 서열 중 선택된 하나의 서열과 상보적 결합을 하는 서열일 수 있다. 이때, 상기 가이드 서열은 표 3에 정리하였다. 표 3은 c.2991+1655A>G 유전자 돌연변이를 기준으로 Upstream 1654bp 부분을 Forward 영역(F 영역)에 존재하는 표적 서열과 상보적으로 결합하는 가이드 서열을 정리하였다. 각 서열을 쉽게 구분하기 위해 F 영역을 표적하는 가이드 서열은 F로 구분하여 넘버링하여 표 3에 정리하였다.
Name | Guide sequence (20nt) | SEQ ID NO |
Guide-F01 | UAGAAAAUUAUGCCUAUUUA | 51 |
Guide-F02 | GCAAAAGCAGCAGAAAGCAA | 52 |
Guide-F03 | GUAGGAAUCCUGAAAGCUAC | 53 |
Guide-F04 | CUGAGGACAGAACAAGCUCC | 54 |
Guide-F05 | GGAAAAUGAUAACGUUAAAC | 55 |
Guide-F06 | CUGAAUGUGUCUCUAUGAGC | 56 |
Guide-F07 | UUCAUCUUCCUCAUCAGAAA | 57 |
Guide-F08 | GAUUAUUCUUAUCUAAGAUC | 58 |
Guide-F09 | UCAAUAUUAUUUAGAAGUAA | 59 |
Guide-F10 | CAGAGUGCAUCCAUGGUCCA | 60 |
Guide-F11 | UUCCUUGGAAUGGAUGUAGC | 61 |
Guide-F12 | ACCAGACAUCUAAGAGAAAA | 62 |
Guide-F13 | UUCUACAUUAAAAUUCUACA | 63 |
Guide-F14 | UUCUGGGUACAGGGGUAAGA | 64 |
Guide-F15 | AUUCAGCUAAAUCAUGCAAG | 65 |
Guide-F16 | UAGUGGCUGAAUGACUUCUG | 66 |
Guide-F17 | UUCCCACAUAACACACACAC | 67 |
Guide-F18 | UAACUAAACUGAAUGAAUAA | 68 |
Guide-F19 | AUUAAAAUCUGCCAAAUCCC | 69 |
Guide-F20 | UGUUUGGGGGGAUUUGGCAG | 70 |
Guide-F21 | UGUGAUUCUUGAACCUUGUG | 71 |
Guide-F22 | UUCUACAAUAAAAAAUGAUG | 72 |
Guide-F23 | CUGGCUCAUAGAGACACAUUC | 73 |
Guide-F24 | AGCUAAUAGAAUUAGAUCUUA | 74 |
또 다른 일 구현예로서, 상기 가이드 서열은 상기 CEP290 유전자의 인트론 26 영역 중 IVS26 돌연변이(c.2991 + 1655A> G)를 기준으로 하류 영역에 존재하는 표적 서열과 상보적 결합을 하는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 가이드 서열은 상기 IVS26 돌연변이(c.2991 + 1655A> G)와 상기 CEP290 유전자의 엑손 27의 5' 말단 사이의 영역에 존재하는 표적 서열과 상보적 결합을 하는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 일 구체예로, 상기 가이드 서열은 상기 표 2에 정리된 표적 서열 중 선택된 하나의 서열과 상보적 결합을 하는 서열일 수 있다. 이때, 상기 가이드 서열은 표 4에 정리하였다. 표 4는 c.2991+1655A>G 유전자 돌연변이를 기준으로 downstream 2000bp 부분을 Reverse 영역(R 영역)에 존재하는 표적 서열과 상보적으로 결합하는 가이드 서열을 정리하였다. 각 서열을 쉽게 구분하기 위해 R 영역을 표적하는 가이드 서열은 R로 구분하여 넘버링하여 표 4에 정리하였다.
Name | Guide sequence (20nt) | SEQ ID NO |
Guide-R01 | AGAGGUAAAGGUUCAUGAGA | 75 |
Guide-R02 | GCACAGAGUUCAAGCUAAUA | 76 |
Guide-R03 | CAUAUCUGUCUUCCUUAAUG | 77 |
Guide-R04 | AUGGAACAAAGUCACUCCUG | 78 |
Guide-R05 | CCCUUCAGGUAACCGGUAGC | 79 |
Guide-R06 | GAAUGAUCAUUCUUGUGGCA | 80 |
Guide-R07 | AGGCGGGGAGUCACAUGGGA | 81 |
Guide-R08 | CCUCUCAAAAAGCAACAAUA | 82 |
Guide-R09 | AAACAGGAAUAGAAAUUCAC | 83 |
Guide-R10 | UUCCAUUAAAAAAAGUAUGC | 84 |
Guide-R11 | AUUUGUUUCUGUGUGUUGAG | 85 |
Guide-R12 | UAUUUCCUUAUUAUCUAUUC | 86 |
Guide-R13 | AUAGUAGAAGAAAAAAGAAA | 87 |
Guide-R14 | AGAUCCCCUUGAAACACAGG | 88 |
Guide-R15 | CAAUUCCUGUGUUUCAAGGG | 89 |
Guide-R16 | UCACUGAAAUCCAUUGCUUA | 90 |
Guide-R17 | UUUAUCACUGAAAUCCAUUG | 91 |
Guide-R18 | AGUGGAGUACCUGGAAAAUA | 92 |
Guide-R19 | GUCUCAUUACCCUGUUUGUA | 93 |
Guide-R20 | UAUACUAUGAAUACACAGGA | 94 |
Guide-R21 | UAACAAACAAUAGGAUUAUC | 95 |
Guide-R22 | GAGUUACUAGGGAGAGAGUG | 96 |
Guide-R23 | AAGGAGACCAGUGAAGUUUC | 97 |
Guide-R24 | GAUCUCAGGUAAUCCGCCAG | 98 |
Guide-R25 | AGUAAAGUACAUAAUUAUAG | 99 |
Guide-R26 | AGACCAGCCCGGCCAACAUG | 100 |
2-2) 스캐폴드 영역(Scaffold region)
상기 가이드 RNA는 스캐폴드 영역을 포함한다. 상기 스캐폴드 영역은 Cas12f1 단백질과 상호작용 및 CRISPR/Cas12f1 complex 형성을 위해 역할 한다. 이때, 상기 스캐폴드 영역은 crRNA 스캐폴드 서열 및 tracrRNA 스캐폴드 서열을 포함한다. 상기 스캐폴드 영역은 상기 가이드 영역의 5' 말단에 위치한다.
상기 스캐폴드 영역은 dual 스캐폴드 서열 또는 single 스캐폴드 서열을 가질 수 있다. 이때, 상기 dual 스캐폴드 서열은 두 개의 분자로 구성되며, crRNA 스캐폴드 서열 및 tracrRNA 스캐폴드 서열을 각각 별개의 분자로 포함할 수 있다. 이 경우, 상기 가이드 RNA는 dual guide RNA로, 두 개의 분자로 구성될 수 있다. 즉, 상기 dual guide RNA는 crRNA 및 tracrRNA가 각각 독립적으로 존재할 수 있다. 이때, 상기 single 스캐폴드 서열은 하나의 분자로 구성되며, crRNA스캐폴드 서열, 링커(linker) 및 tracrRNA 스캐폴드 서열을 포함할 수 있다. 상기 single 스캐폴드 서열은 crRNA스캐폴드 서열, 링커(linker) 및 tracrRNA 스캐폴드 서열이 연결된 하나의 RNA 분자일 수 있으며, 5'-[tracrRNA 스캐폴드 서열]-[linker]-[crRNA 스캐폴드 서열]-3' 서열일 수 있다. 이 경우, 상기 가이드 RNA는 single guide RNA로, 하나의 RNA 분자로 구성되며, tracrRNA, linker 및 crRNA가 연결된 5'-[tracrRNA]-[linker]-[crRNA]-3' 서열을 가질 수 있다.
이하에서 crRNA 스캐폴드 서열, tracrRNA 스캐폴드 서열 및 링커에 대해 자세히 설명한다.
i) crRNA 스캐폴드 서열(crRNA scaffold sequence)
상기 스캐폴드 영역은 crRNA 스캐폴드 서열을 포함한다. 상기 crRNA 스캐폴드 서열은 tracrRNA 및/또는 Cas12f1 단백질과 결합 및/또는 상호작용하는 crRNA 내에 존재하는 일부 서열이다.
상기 crRNA 스캐폴드 서열은 야생형 crRNA 스캐폴드 서열 또는 engineered crRNA 스캐폴드 서열일 수 있다. 이때, 상기 engineered crRNA 스캐폴드 서열은 상기 야생형 crRNA 스캐폴드 서열의 일부 뉴클레오타이드 서열이 인위적으로 변형(치환, 결실 또는 삽입)되거나, 야생형 crRNA 스캐폴드 서열보다 길이가 짧도록 변형된 서열일 수 있다.
상기 crRNA 스캐폴드 서열은 상기 가이드 서열의 5' 말단에 위치할 수 있다. 또는 상기 crRNA 스캐폴드 서열은 상기 crRNA의 5' 말단에 위치할 수 있다.
상기 crRNA 스캐폴드 서열은 상기 가이드 서열의 5' 말단과 공유결합 할 수 있다.
일 구현예로서, 상기 crRNA 스캐폴드 서열은 야생형 crRNA 스캐폴드 서열일 수 있다. 이때, 상기 야생형 crRNA 스캐폴드 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 101) 서열일 수 있다.
다른 일 구현예로서, 상기 crRNA 스캐폴드 서열은 engineered crRNA 스캐폴드 서열일 수 있다. 이때, 상기 engineered crRNA 스캐폴드 서열은 SEQ ID NO: 101 서열 중 일부 뉴클레오타이드 서열이 인위적으로 치환, 결실 또는 삽입된 서열일 수 있다. 또는 상기 engineered crRNA 스캐폴드 서열은 SEQ ID NO: 101 서열의 길이가 짧아지도록 변형된 서열일 수 있다.
일 구체예로, 상기 engineered crRNA 스캐폴드 서열은 SEQ ID NO: 101 서열의 일부 서열로, SEQ ID NO: 101 서열의 5' 말단부 또는 3' 말단부 일부 서열을 포함하지 않는 서열일 수 있다. 예를 들어, 상기 engineered crRNA 스캐폴드 서열은 5'-UGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 102) 서열, 5'-CAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 103) 서열, 5'-GAAUAGACGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 104) 서열, 5'-ACGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 105) 서열 또는 5'-GGAAUGCAAC-3' (SEQ ID NO: 106) 서열일 수 있으나, 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구체예로, 상기 engineered crRNA 스캐폴드 서열은 SEQ ID NO: 101 서열 중 일부 뉴클레오타이드 서열이 인위적으로 변형된 서열로, 적어도 하나 이상의 뉴클레오타이드가 치환, 결실 및/또는 부가된 서열일 수 있다. 예를 들어, 상기 engineered crRNA 스캐폴드 서열은 5'-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 107) 서열, 5'-GAAUAGAGCAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 108) 서열 또는 5'-AGCAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 109) 서열일 수 있으나, 상기 예시는 단순 예시로, 이에 제한되지 않는다.
ii) tracrRNA 스캐폴드 서열(tracrRNA scaffold sequence)
상기 스캐폴드 영역은 tracrRNA 스캐폴드 서열을 포함한다. 상기 tracrRNA 스캐폴드 서열은 crRNA 및/또는 Cas12f1 단백질과 결합 및/또는 상호작용하는 tracrRNA 전체 또는 일부 서열이다.
상기 tracrRNA 스캐폴드 서열은 야생형 tracrRNA 스캐폴드 서열 또는 engineered tracrRNA 스캐폴드 서열일 수 있다. 이때, 상기 engineered tracrRNA 스캐폴드 서열은 상기 야생형 tracrRNA 스캐폴드 서열의 일부 뉴클레오타이드 서열이 인위적으로 변형(치환, 결실 또는 삽입)되거나, 야생형 tracrRNA 스캐폴드 서열보다 길이가 짧도록 변형된 서열일 수 있다.
일 구현예로서, 상기 tracrRNA 스캐폴드 서열은 야생형 tracrRNA 스캐폴드 서열일 수 있다. 이때, 상기 야생형 tracrRNA 스캐폴드 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO: 110) 서열일 수 있다.
다른 일 구현예로서, 상기 tracrRNA 스캐폴드 서열은 engineered tracrRNA 스캐폴드 서열일 수 있다. 이때, 상기 engineered tracrRNA 스캐폴드 서열은 SEQ ID NO: 110 서열 중 일부 뉴클레오타이드 서열이 인위적으로 치환, 결실 또는 삽입된 서열일 수 있다. 또는 상기 engineered tracrRNA 스캐폴드 서열은 SEQ ID NO: 110 서열의 길이가 짧아지도록 변형된 서열일 수 있다.
일 구체예로, 상기 engineered tracrRNA 스캐폴드 서열은 SEQ ID NO: 110 서열의 일부 서열로, SEQ ID NO: 110 서열의 5' 말단부 또는 3' 말단부 일부 서열을 포함하지 않는 서열일 수 있다. 예를 들어, 상기 engineered tracrRNA 스캐폴드 서열은 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 111) 서열, 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3' (SEQ ID NO: 112) 서열, 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3' (SEQ ID NO: 113) 서열, 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAA-3' (SEQ ID NO: 114) 서열, 5'-ACCGCUUCACCUUAGGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3' (SEQ ID NO: 115) 서열, 또는 5'-ACCGCUUCACUUAGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAA-3' (SEQ ID NO: 116) 서열일 수 있으나, 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구체예로, 상기 engineered tracrRNA 스캐폴드 서열은 SEQ ID NO: 110 서열 중 일부 뉴클레오타이드 서열이 인위적으로 변형된 서열로, 적어도 하나 이상의 뉴클레오타이드가 치환, 결실 및/또는 부가된 서열일 수 있다. 예를 들어, 상기 engineered tracrRNA 스캐폴드 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 117) 서열, 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 118) 서열, 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 119) 서열, 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 120) 서열 또는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCU-3' (SEQ ID NO: 121) 서열일 수 있으나, 상기 예시는 단순 예시로, 이에 제한되지 않는다.
iii) 링커(Linker)
상기 스캐폴드 영역이 single 스캐폴드 서열인 경우, 상기 스캐폴드 영역은 링커를 더 포함한다. 상기 linker는 상기 tracrRNA 스캐폴드 서열 및 crRNA 스캐폴드 서열을 연결하는 역할을 하는 서열이다. 즉, 상기 스캐폴드 영역은 tracrRNA 스캐폴드 서열과 crRNA 스캐폴드 서열이 linker를 통해 연결된 하나의 RNA 분자이다.
상기 linker는 tracrRNA 스캐폴드 서열 및/또는 crRNA 스캐폴드 서열의 기능에 영향을 주지 않는 서열일 수 있다. 또는 상기 linker는 tracrRNA 스캐폴드 서열 및/또는 crRNA 스캐폴드 서열과 RNA duplex를 형성하지 않는 서열일 수 있다.
상기 linker는 1 내지 30개의 뉴클레오타이드 서열일 수 있다.
일 구현예로서, 상기 linker는 1 내지 5개, 5 내지 10개, 10 내지 15개, 15 내지 20개, 20개 내지 25개 또는 25 내지 30개의 뉴클레오타이드 서열일 수 있다.
다른 일 구현예로서, 상기 linker는 1 내지 30개, 5 내지 30개, 10 내지 30개, 15 내지 30개, 20 내지 30개 또는 25 내지 30개의 뉴클레오타이드 서열일 수 있다.
또 다른 일 구현예로서, 상기 linker는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 뉴클레오타이드 서열일 수 있다. 예를 들어, 상기 linker는 5'-GAAA-3' 서열일 수 있으나, 이에 제한된 것은 아니다.
iv) 스캐폴드 영역의 예시
앞선 설명을 기초로, 스캐폴드 영역의 예시를 설명한다. 이하의 예시에 포함된 구성요소의 구체적인 설명은 앞서 해당 구성요소에 대해 기재한 바와 같다. 이하의 예시는 단순 예시로, 이에 제한되지 않는다.
일 구현예로, 스캐폴드 영역은 야생형 crRNA 스캐폴드 서열 및 야생형 tracrRNA 스캐폴드 서열을 포함할 수 있다. 상기 스캐폴드 영역은 dual 스캐폴드 서열을 가질 수 있다. 이때, 상기 dual 스캐폴드 서열은 상기 야생형 crRNA 스캐폴드 서열 및 상기 야생형 tracrRNA 스캐폴드 서열을 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 스캐폴드 영역은 single 스캐폴드 서열을 가질 수 있다. 이때, 상기 스캐폴드 영역은 링커를 더 포함할 수 있으며, 상기 야생형 crRNA 스캐폴드 서열과 상기 야생형 tracrRNA 스캐폴드 서열은 linker를 통해 연결되어 있을 수 있다.
일 구체예로, 상기 스캐폴드 영역은 SEQ ID NO: 101 및 110 서열을 포함할 수 있다. 이때, 상기 스캐폴드 영역은 선택적으로 링커를 더 포함할 수 있다. 일 예로, 상기 스캐폴드 영역은 SEQ ID NO: 110 서열, 링커 및 SEQ ID NO: 101 서열을 5'말단에서 3'말단 방향으로 순서대로 포함할 수 있다. 예를 들어, 상기 스캐폴드 영역은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 122) 서열을 가질 수 있다.
다른 일 구현예로, 스캐폴드 영역은 야생형 crRNA 스캐폴드 서열 및 engineered tracrRNA 스캐폴드 서열을 포함할 수 있다. 상기 스캐폴드 영역은 dual 스캐폴드 서열을 가질 수 있다. 이때, 상기 dual 스캐폴드 서열은 상기 야생형 crRNA 스캐폴드 서열 및 상기 engineered tracrRNA 스캐폴드 서열을 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 스캐폴드 영역은 single 스캐폴드 서열을 가질 수 있다. 이때, 상기 스캐폴드 영역은 링커를 더 포함할 수 있으며, 상기 야생형 crRNA 스캐폴드 서열과 상기 engineered tracrRNA 스캐폴드 서열은 linker를 통해 연결되어 있을 수 있다.
일 구체예로서, 상기 스캐폴드 영역은 i) SEQ ID NO: 101 서열, 및 ii) SEQ ID NO: 110 서열 중 적어도 하나 이상의 뉴클레오타이드가 치환 및/또는 결실되거나, 및/또는 하나 이상의 다른 뉴클레오타이드가 삽입된 서열을 포함할 수 있다. 이때, 상기 스캐폴드 영역은 선택적으로 링커를 더 포함할 수 있다. 일 예로, 상기 스캐폴드 영역은 SEQ ID NO: 101 서열 및 SEQ ID NO: 117 서열을 가질 수 있다. 또는 상기 스캐폴드 영역은 SEQ ID NO: 117 서열, 링커 및 SEQ ID NO: 101 서열을 5'말단에서 3'말단 방향으로 순서대로 포함할 수 있다. 예를 들어, 상기 스캐폴드 영역은 5'- CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 123) 서열을 가질 수 있다.
또 다른 일 구현예로, 스캐폴드 영역은 engineered crRNA 스캐폴드 서열 및 engineered tracrRNA 스캐폴드 서열을 포함할 수 있다. 상기 스캐폴드 영역은 dual 스캐폴드 서열을 가질 수 있다. 이때, 상기 dual 스캐폴드 서열은 상기 engineered crRNA 스캐폴드 서열 및 상기 engineered tracrRNA 스캐폴드 서열을 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 스캐폴드 영역은 single 스캐폴드 서열을 가질 수 있다. 이때, 상기 스캐폴드 영역은 링커를 더 포함할 수 있으며, 상기 engineered crRNA 스캐폴드 서열과 상기 engineered tracrRNA 스캐폴드 서열은 linker를 통해 연결되어 있을 수 있다.
일 구체예로서, 상기 스캐폴드 영역은 i) SEQ ID NO: 101 서열 중 적어도 하나 이상의 뉴클레오타이드가 치환 및/또는 결실되거나, 및/또는 하나 이상의 다른 뉴클레오타이드가 삽입된 서열, 및 ii) SEQ ID NO: 110 서열 중 적어도 하나 이상의 뉴클레오타이드가 치환 및/또는 결실되거나, 및/또는 하나 이상의 다른 뉴클레오타이드가 삽입된 서열을 포함할 수 있다. 이때, 상기 스캐폴드 영역은 선택적으로 링커를 더 포함할 수 있다. 일 예로, 상기 스캐폴드 영역은 SEQ ID NO: 106 서열 및 SEQ ID NO: 116 서열을 가질 수 있다. 또는 상기 스캐폴드 영역은 SEQ ID NO: 116 서열, 링커 및 SEQ ID NO: 106 서열을 5'말단에서 3'말단 방향으로 순서대로 포함할 수 있다. 예를 들어, 상기 스캐폴드 영역은 5'-ACCGCUUCACUUAGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3' (SEQ ID NO: 124) 서열을 가질 수 있다. 다른 일 예로, 상기 스캐폴드 영역은 SEQ ID NO: 106 서열 및 SEQ ID NO: 114 서열을 가질 수 있다. 또는 상기 스캐폴드 영역은 SEQ ID NO: 114 서열, 링커 및 SEQ ID NO: 106 서열을 5'말단에서 3'말단 방향으로 순서대로 포함할 수 있다. 예를 들어, 상기 스캐폴드 영역은 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3' (SEQ ID NO: 125) 서열을 가질 수 있다. 또 다른 일 예로, 상기 스캐폴드 영역은 SEQ ID NO: 107 서열 및 SEQ ID NO: 118 서열을 가질 수 있다. 또는 상기 스캐폴드 영역은 SEQ ID NO: 118 서열, 링커 및 SEQ ID NO: 107 서열을 5'말단에서 3'말단 방향으로 순서대로 포함할 수 있다. 예를 들어, 상기 스캐폴드 영역은 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 126) 서열을 가질 수 있다.
2-3) U-rich tail 서열(U-rich tail sequence)
가이드 RNA는 U-rich tail 서열을 선택적으로 더 포함할 수 있다. 상기 U-rich tail 서열은 상기 가이드 RNA의 3' 말단에 부가되는 유리딘(U)가 풍부한 서열이다.
상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 1 내지 10의 정수일 수 있다.
일 구현예로서, 상기 U-rich tail 서열은 5'-(UaU)dUe-3' 서열, 즉, Ux 서열일 수 있다. 이때, 상기 x는 0 내지 22의 정수일 수 있다. 예를 들어, 상기 U-rich tail 서열은 U, UU, UUU, UUUU, UUUUU, UUUUUU, UUUUUUU, UUUUUUUU 또는 UUUUUUUUU 일 수 있다.
다른 일 구현예로서, 상기 U-rich tail 서열은 5'-(UaA)dUe-3' 서열, 5'-(UaG)dUe-3' 서열 또는 5'-(UaC)dUe-3' 서열일 수 있다. 예를 들어, 상기 U-rich tail 서열은 UUUUAUUUU, UUUAUUUUU, UUUUGUUUU, UGUGUGUU, UUUUCUUUU 또는 UUCUUCUUU 일 수 있다.
또 다른 일 구현예로서, 상기 U-rich tail 서열은 5'-UaAUaAUe-3' 서열, 5'-UaAUaCUe-3' 서열, 5'-UaAUaGUe-3' 서열, 5'-UaCUaAUe-3' 서열, 5'-UaCUaCUe-3' 서열, 5'-UaCUaGUe-3' 서열, 5'-UaGUaAUe-3' 서열, 5'-UaGUaCUe-3' 서열 또는 5'-UaGUaGUe-3' 서열일 수 있다. 예를 들어, 상기 U-rich tail 서열은 UUAUUUAUU, UUUCUAUUUU (SEQ ID NO: 127), UGUCU, UUAUGUUUUU (SEQ ID NO: 128) 또는 UCUUUUGUU 일 수 있다.
또 다른 일 구현예로서, 상기 U-rich tail 서열은 5'-UaAUaAUaAUe-3' 서열, 5'-UaAUaAUaCUe-3' 서열, 5'-UaAUaAUaGUe-3' 서열, 5'-UaAUaCUaAUe-3' 서열, 5'-UaAUaCUaCUe-3' 서열, 5'-UaAUaCUaGUe-3' 서열, 5'-UaAUaGUaAUe-3' 서열, 5'-UaAUaGUaCUe-3' 서열, 5'-UaAUaGUaGUe-3' 서열, 5'-UaCUaAUaAUe-3' 서열, 5'-UaCUaAUaCUe-3' 서열, 5'-UaCUaAUaGUe-3' 서열, 5'-UaCUaCUaAUe-3' 서열, 5'-UaCUaCUaCUe-3' 서열, 5'-UaCUaCUaGUe-3' 서열, 5'-UaCUaGUaAUe-3' 서열, 5'-UaCUaGUaCUe-3' 서열, 5'-UaCUaGUaGUe-3' 서열, 5'-UaGUaAUaAUe-3' 서열, 5'-UaGUaAUaCUe-3' 서열, 5'-UaGUaAUaGUe-3' 서열, 5'-UaGUaCUaAUe-3' 서열, 5'-UaGUaCUaCUe-3' 서열, 5'-UaGUaCUaGUe-3' 서열, 5'-UaGUaGUaAUe-3' 서열, 5'-UaGUaGUaCUe-3' 서열 또는 5'-UaGUaGUaGUe-3' 서열일 수 있다. 예를 들어, 상기 U-rich tail 서열은 UUAUUCUG, UUCUCUUCU 또는 UGUUAUAUU 일 수 있다.
2-4) 가이드 RNA의 예시
앞선 설명을 기초로, 가이드 RNA의 예시를 설명한다. 이하의 예시에 포함된 구성요소의 구체적인 설명은 앞서 해당 구성요소에 대해 기재한 바와 같다. 이하의 예시는 단순 예시로, 이에 제한되지 않는다.
일 구현예로서, 가이드 RNA는 가이드 서열, 야생형 crRNA 스캐폴드 서열 및 야생형 tracrRNA 스캐폴드 서열을 포함할 수 있다. 또는 가이드 RNA는 가이드 서열, 야생형 crRNA 스캐폴드 서열, 링커 및 야생형 tracrRNA 스캐폴드 서열을 포함할 수 있다. 상기 가이드 RNA는 선택적으로 U-rich tail 서열을 더 포함할 수 있다.
일 구체예로서, 상기 가이드 RNA는 야생형 tracrRNA 스캐폴드 서열, 야생형 crRNA 스캐폴드 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 가이드 서열은 상기 야생형 crRNA 스캐폴드 서열의 3'말단에 공유결합으로 연결될 수 있다. 이때, 상기 야생형 tracrRNA 스캐폴드 서열과 야생형 crRNA 스캐폴드 서열은 각각 독립적인 RNA 분자일 수 있다. 이때, 상기 가이드 RNA는 dual 가이드 RNA일 수 있다. 상기 가이드 RNA는 선택적으로 U-rich tail 서열을 더 포함할 수 있다. 이때, 상기 U-rich tail 서열은 상기 가이드 서열의 3'말단에 공유결합으로 연결될 수 있다. 일 예로, 상기 가이드 RNA는 SEQ ID NO: 110 서열 및 5'-[SEQ ID NO: 101 서열]-[가이드 서열]-3'서열을 포함할 수 있다. 이때, 상기 가이드 서열은 상기 표 3 또는 표 4에 기재된 서열 중 선택된 하나의 서열일 수 있다. 다른 일 예로, 상기 가이드 RNA는 SEQ ID NO: 110 서열 및 5'-[SEQ ID NO: 101 서열]-[가이드 서열]-[U-rich-tail 서열]-3'서열을 포함할 수 있다. 이때, 상기 가이드 서열은 상기 표 3 또는 표 4에 기재된 서열 중 선택된 하나의 서열일 수 있다.
다른 일 구체예로서, 상기 가이드 RNA는 야생형 tracrRNA 스캐폴드 서열, 링커, 야생형 crRNA 스캐폴드 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 야생형 tracrRNA 스캐폴드 서열, 링커, 야생형 crRNA 스캐폴드 서열 및 가이드 서열은 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[야생형 tracrRNA 스캐폴드 서열]-[링커]-[야생형 crRNA 스캐폴드 서열]-[가이드 서열]-3'). 상기 가이드 RNA는 single guide RNA일 수 있다. 상기 가이드 RNA는 선택적으로 U-rich tail 서열을 더 포함할 수 있다. 이때, 상기 U-rich tail 서열은 상기 가이드 서열의 3'말단에 공유결합으로 연결될 수 있다. 일 예로, 상기 가이드 RNA는 5'-[SEQ ID NO: 110 서열]-[링커]-[SEQ ID NO: 101 서열]-[가이드 서열]-3'서열을 포함할 수 있다. 이때, 상기 가이드 서열은 상기 표 3 또는 표 4에 기재된 서열 중 선택된 하나의 서열일 수 있다. 다른 일 예로, 상기 가이드 RNA는 5'-[SEQ ID NO: 110 서열]-[링커]-[SEQ ID NO: 101 서열]-[가이드 서열]-[U-rich tail 서열]-3'서열을 포함할 수 있다. 이때, 상기 가이드 서열은 상기 표 3 또는 표 4에 기재된 서열 중 선택된 하나의 서열일 수 있다.
다른 일 구현예로서, 가이드 RNA는 가이드 서열, engineered crRNA 스캐폴드 서열 및 engineered tracrRNA 스캐폴드 서열을 포함할 수 있다. 또는 가이드 RNA는 가이드 서열, engineered crRNA 스캐폴드 서열, 링커 및 engineered tracrRNA 스캐폴드 서열을 포함할 수 있다. 상기 가이드 RNA는 선택적으로 U-rich tail 서열을 더 포함할 수 있다.
일 구체예로서, 상기 가이드 RNA는 engineered tracrRNA 스캐폴드 서열, engineered crRNA 스캐폴드 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 가이드 서열은 상기 engineered crRNA 스캐폴드 서열의 3'말단에 공유결합으로 연결될 수 있다. 이때, 상기 engineered tracrRNA 스캐폴드 서열과 engineered crRNA 스캐폴드 서열은 각각 독립적인 RNA 분자일 수 있다. 이때, 상기 가이드 RNA는 dual 가이드 RNA일 수 있다. 상기 가이드 RNA는 선택적으로 U-rich tail 서열을 더 포함할 수 있다. 이때, 상기 U-rich tail 서열은 상기 가이드 서열의 3'말단에 공유결합으로 연결될 수 있다. 일 예로, 상기 가이드 RNA는 SEQ ID NO: 116 서열 및 5'-[SEQ ID NO: 106 서열]-[가이드 서열]-3'서열을 포함할 수 있다. 또는 상기 가이드 RNA는 SEQ ID NO: 116 서열 및 5'-[SEQ ID NO: 106 서열]-[가이드 서열]-[U-rich tail 서열]-3'서열을 포함할 수 있다. 이때, 상기 가이드 서열은 상기 표 3 또는 표 4에 기재된 서열 중 선택된 하나의 서열일 수 있다. 다른 일 예로, 상기 가이드 RNA는 SEQ ID NO: 114 서열 및 5'-[SEQ ID NO: 106 서열]-[가이드 서열]-3'서열을 포함할 수 있다. 또는 상기 가이드 RNA는 SEQ ID NO: 114 서열 및 5'-[SEQ ID NO: 106 서열]-[가이드 서열]-[U-rich tail 서열]-3'서열을 포함할 수 있다. 이때, 상기 가이드 서열은 상기 표 3 또는 표 4에 기재된 서열 중 선택된 하나의 서열일 수 있다. 또 다른 일 예로, 상기 가이드 RNA는 SEQ ID NO: 118 서열 및 5'-[SEQ ID NO: 107 서열]-[가이드 서열]-3'서열을 포함할 수 있다. 또는 상기 가이드 RNA는 SEQ ID NO: 118 서열 및 5'-[SEQ ID NO: 107 서열]-[가이드 서열]-[U-rich tail 서열]-3'서열을 포함할 수 있다. 이때, 상기 가이드 서열은 상기 표 3 또는 표 4에 기재된 서열 중 선택된 하나의 서열일 수 있다.
다른 일 구체예로서, 상기 가이드 RNA는 engineered tracrRNA 스캐폴드 서열, 링커, engineered crRNA 스캐폴드 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 engineered tracrRNA 스캐폴드 서열, 링커, engineered crRNA 스캐폴드 서열 및 가이드 서열은 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[engineered tracrRNA 스캐폴드 서열]-[링커]-[engineered crRNA 스캐폴드 서열]-[가이드 서열]-3'). 상기 가이드 RNA는 single guide RNA일 수 있다. 상기 가이드 RNA는 선택적으로 U-rich tail 서열을 더 포함할 수 있다. 이때, 상기 U-rich tail 서열은 상기 가이드 서열의 3'말단에 공유결합으로 연결될 수 있다. 일 예로, 상기 가이드 RNA는 5'-[SEQ ID NO: 116 서열]-[링커]-[SEQ ID NO: 106 서열]-[가이드 서열]-3'서열을 포함할 수 있다. 또는 상기 가이드 RNA는 5'-[SEQ ID NO: 116 서열]-[링커]-[SEQ ID NO: 106 서열]-[가이드 서열]-[U-rich tail 서열]-3'서열을 포함할 수 있다. 이때, 상기 가이드 서열은 상기 표 3 또는 표 4에 기재된 서열 중 선택된 하나의 서열일 수 있다. 다른 일 예로, 상기 가이드 RNA는 5'-[SEQ ID NO: 114 서열]-[링커]-[SEQ ID NO: 106 서열]-[가이드 서열]-3'서열을 포함할 수 있다. 또는 상기 가이드 RNA는 5'-[SEQ ID NO: 114 서열]-[링커]-[SEQ ID NO: 106 서열]-[가이드 서열]-[U-rich tail 서열]-3'서열을 포함할 수 있다. 이때, 상기 가이드 서열은 상기 표 3 또는 표 4에 기재된 서열 중 선택된 하나의 서열일 수 있다. 또 다른 일 예로, 상기 가이드 RNA는 5'-[SEQ ID NO: 118 서열]-[링커]-[SEQ ID NO: 107 서열]-[가이드 서열]-3'서열을 포함할 수 있다. 또는 상기 가이드 RNA는 5'-[SEQ ID NO: 118 서열]-[링커]-[SEQ ID NO: 107 서열]-[가이드 서열]-[U-rich tail 서열]-3'서열을 포함할 수 있다. 이때, 상기 가이드 서열은 상기 표 3 또는 표 4에 기재된 서열 중 선택된 하나의 서열일 수 있다.
3. Cas12f1(Cas14a1) 단백질
LCA10 질환 치료를 위한 CRISPR/Cas12f1 시스템은 Cas12f1(Cas14a1) 단백질을 포함한다. Cas12f1 단백질은 CRISPR/Cas12f1(Cas14a1) system의 주요 단백질 구성요소로, 선행연구(Harrington et al., Science, 362, 839-842 (2018))에서 Cas14로 명명된 이펙터 단백질 중 하나로, Cas14a1 단백질로도 불린다. 본 명세서에서, Cas12f1 단백질은 Cas14a1 단백질 또는 Cas12f1(Cas14a1) 단백질과 혼용되어 사용된다. 본 명세서에 의해 개시되는 Cas12f1 단백질은 자연계에 존재하는 야생형(wildtype) Cas12f1 단백질(야생형 Cas14a1 단백질)일 수 있다. 또는, Cas12f1 단백질은 야생형 Cas12f1 단백질의 변이체(variant)일 수 있으며, 이때, 상기 변이체는 "Cas12f1 변이체(Cas12f1 variant)" 또는 "Cas14a1 변이체(Cas14a1 variant)"로 지칭한다. 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질과 동일한 기능을 가지는 변이체, 기능 일부 또는 전부가 변형된 변이체 및/또는 추가적인 기능이 부가된 변이체일 수 있다. Cas12f1 단백질의 의미는 문맥에 따라 적절히 해석될 수 있고, 특별한 경우가 아닌 한 가장 넓은 의미로 해석된다. 이하에서 Cas12f1 단백질에 대해 자세히 설명한다.
3-1) Wildtype Cas12f1(Cas14a1) protein
상기 Cas12f1 단백질은 야생형 Cas12f1 단백질일 수 있다. 이때, 상기 Cas12f1 단백질은 표적 핵산 또는 표적 유전자의 이중 가닥 또는 단일 가닥을 절단할 수 있다. 상기 Cas12f1 단백질은 표적 핵산 또는 표적 유전자 내에 존재하는 Protospacer Adjacent Motif(PAM) 서열을 인식할 수 있다. 이때, PAM 서열은 상기 Cas14a1 단백질에 따라 정해지는 고유한 서열이다. 상기 Cas12f1 단백질을 위한 PAM 서열은 T-rich 서열일 수 있다. 상기 Cas12f1 단백질을 위한 PAM 서열은 5'-TTTR-3'서열일 수 있다. 이때, 상기 R은 A 또는 G일 수 있다. 예를 들어, 상기 PAM 서열은 5'-TTTA-3' 또는 5'-TTTG-3' 서열일 수 있다.
일 구현예로서, 상기 Cas12f1 단백질은 Cas14 패밀리(Harrington et al., Science 362, 839-842 (2018); US 2020/0172886 A1)에서 유래한 것일 수 있다.
다른 일 구현예로서, 상기 Cas12f1 단백질은 Uncultured archaeon 유래의 Cas14a1 단백질(Harrington et al., Science 362, 839-842 (2018); US 2020/0172886 A1)일 수 있다. 예를 들어, 상기 Cas14a1 단백질은 SEQ ID NO: 129 아미노산 서열일 수 있다.
Name | Amino acid sequence |
Cas12f1 protein | mAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP (SEQ ID NO: 129) |
3-2) Cas12f1(Cas14a1) variant - Cas12f1(Cas14a1) mutant
상기 Cas12f1 단백질은 Cas12f1 변이체일 수 있다. 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질의 아미노산 서열 중 적어도 하나 이상의 아미노산이 변형된 것일 수 있다. 이때, 상기 변형은 삭제(deletion) 및/또는 치환(substitution)일 수 있다. 또는 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질의 아미노산 서열의 양 말단 및 또는 서열 내에 적어도 하나 이상의 아미노산 서열이 추가된 것일 수 있다. 이때, 상기 변형은 삽입(insertion)일 수 있다. 이때, 상기 Cas12f1 변이체는 "Cas12f1 돌연변이(Cas12f1 mutant)" 또는 "Cas14a1 돌연변이(Cas14a1 mutant)"로 지칭한다.
일 구현예로서, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질의 아미노산 서열 중 적어도 하나 이상의 아미노산이 제거된 것일 수 있다. 예를 들어, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 RuvC 도메인 내 적어도 하나 이상의 아미노산이 제거된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 PAM을 인식하는 도메인 내 적어도 하나 이상의 아미노산이 제거된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 SEQ ID NO: 129 아미노산 서열 중 적어도 하나 이상의 아미노산이 제거된 것일 수 있다.
다른 일 구현예로서, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질의 아미노산 서열 중 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다. 이때, 상기 치환은 하나의 아미노산이 하나의 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 치환은 하나의 아미노산이 다수개의 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 치환은 다수개의 아미노산이 하나의 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 치환은 다수개의 아미노산이 다수개의 다른 아미노산으로 치환된 것일 수 있으며, 이때, 치환되는 아미노산의 수와 치환하는 아미노산의 수는 서로 동일하거나 다를 수 있다. 예를 들어, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 RuvC 도메인 내 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 PAM을 인식하는 도메인 내 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 SEQ ID NO: 129 아미노산 서열 중 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다.
상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질과 동일한 기능을 가지는 변이체 또는 기능 일부 또는 전부가 변형된 변이체일 수 있다. 예를 들어, 상기 Cas12f1 돌연변이는 표적 핵산의 이중 가닥 중 하나의 가닥만 절단하도록 변경된 것일 수 있다. 또는 상기 Cas12f1 돌연변이는 5'-TTTA-3' 또는 5'-TTTG-3'이 아닌 다른 PAM 서열을 인식하도록 변형된 것일 수 있다.
본 출원 발명자들은 연구를 통해 상기 야생형의 Cas12f1 단백질의 아미노산 서열의 N말단 및/또는 C말단에 아미노산이 추가된 돌연변이체 중, 상기 Cas12f1 단백질과 동일한 기능을 가지는 Cas12f1 변이체가 있음을 밝혔다. 더 나아가, 상기 야생형의 Cas12f1 단백질의 N말단에 일정 길이의 아미노산 서열을 추가하여, 상기 야생 Cas12f1 단백질과 동일한 기능을 하는 Cas12f1 변이체를 발명하였다. 상기 Cas12f1 변이체에 대해서는 한국 특허출원 제10-2021-0181875호에 자세히 개시되어 있으며, 본 명세서에서도 상기 Cas12f1 변이체, 또는 기능적 유사체에 대한 내용을 원용하는 것으로 한다.
일 구현예로서, 상기 Cas12f1 변이체는 야생형의 Cas12f1 단백질의 N말단 및/또는 C말단에 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 또는 30개의 아미노산이 추가된 것일 수 있다.
일 구현예로서, 상기 Cas12f1 변이체는 야생형의 Cas12f1 단백질의 N말단 및/또는 C말단에 전술한 두 개의 수치범위 내의 아미노산이 추가된 것일 수 있다. 예를 들어, 상기 Cas12f1 변이체는 야생형의 Cas12f1 단백질의 N말단에 26개 내지 28개의 아미노산이 추가된 것일 수 있다.
일 구현예로서, 상기 Cas12f1 변이체는 서열번호 288 내지 서열번호 291 중 선택된 아미노산 서열로 표현되는 단백질일 수 있다. 이 중 상기 서열번호 288로 표현되는 단백질은, Candidatus Woesearchaeota archaeon 유래의 Transposon-associated transposase B (TnpB)로도 알려져있으며, 본 명세서에서는 Cas12f1 단백질, Cas12f1 변이체, Cas12f1 기능적 유사체, TnpB, TnpB 기능적 유사체 등의 용어를 혼용하여 사용할 수 있다.
3-3) Cas12f1(Cas14a1) variant - Cas12f1(Cas14a1) fusion protein
상기 Cas12f1 단백질은 Cas12f1 변이체일 수 있다. 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질 또는 Cas12f1 돌연변이에 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질이 부가된 변이체일 수 있다. 이때, 상기 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질이 부가된 변이체는 "Cas12f1 융합 단백질" 또는 "Cas14a1 융합 단백질"로 지칭된다. 상기 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질은 야생형 Cas12f1 단백질 또는 Cas12f1 돌연변이의 N 말단, C 말단 및/또는 아미노산 서열 내에 부가될 수 있다. 상기 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질은 야생형 Cas12f1 단백질과 동일하거나 다른 기능을 가지는 도메인, 펩타이드 또는 단백질일 수 있다. 예를 들어, 상기 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인, 펩타이드 또는 단백질 일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 단백질일 수 있으나, 이에 제한되지 않는다. 또는, 상기 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질은 역전사 효소(reverse transcriptase) 또는 디아미네이즈(deaminase)일 수 있다.
3-4) Cas12f1(Cas14a1) variant - 기타
상기 Cas12f1 단백질은 Cas12f1 변이체일 수 있다. 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질, Cas12f1 돌연변이 또는 Cas12f1 융합 단백질에 선택적으로 NLS(Nuclear Localization Sequence) 또는 NES(Nuclear Export Sequence)가 더 포함된 것일 수 있다. 상기 NLS 및 NES는 세포 내 또는 외에서 Cas12f1 단백질의 위치 결정을 위한 시그널 펩타이드로, 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다. 예를 들어, 상기 NLS는 아미노산 서열 PKKKRKV (SEQ ID NO: 130)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK (SEQ ID NO: 131)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD (SEQ ID NO: 132) 또는 RQRRNELKRSP (SEQ ID NO: 133)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: 134)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부 터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO: 135); 마이오마(myoma) T 단백질의 서열 VSRKRPRP (SEQ ID NO: 136) 및 PPKKARED (SEQ ID NO: 137); 인간 p53의 서열 PQPKKKPL (SEQ ID NO: 138); 마우스 c-abl IV의 서열 SALIKKKKKMAP (SEQ ID NO: 139); 인플루엔자 바이러스 NS1의 서열 DRLRR (SEQ ID NO: 140) 및 PKQKKRK (SEQ ID NO: 141); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL (SEQ ID NO: 142); 마우스 Mx1 단백질의 서열 REKKKFLKRR (SEQ ID NO: 143); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: 144); 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK (SEQ ID NO: 145)로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다.
또한, 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질, Cas12f1 돌연변이 또는 Cas12f1 융합 단백질에 선택적으로 태그가 더 포함된 것일 수 있다. 상기 태그는 Cas12f1 단백질의 분리 정제 및/또는 추적을 위한 기능적 도메인, 펩타이드 또는 단백질로, 상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루 티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등의 태그 단백질; 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 청록색 형광 단백질(CFP), 청색 형광 단백질(BFP), HcRED, DsRed 등의 형광 단백질; 및 글루타티온-S-트랜스 퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타 -글루쿠로니다제, 루시퍼라제 등의 리포터 단백질(효소)를 포함하나, 이에 제한되는 것은 아니다.
4.
guide RNA-Cas12f1(Cas14a1) protein(s) complex (CRISPR/Cas12f1 complex or CRISPR complex)
LCA10 질환 치료를 위한 CRISPR/Cas12f1 시스템은 guide RNA-Cas12f1(Cas14a1) protein(s) complex (CRISPR/Cas12f1 complex 또는 CRISPR complex) 형태로 작동할 수 있다. 상기 CRISPR complex는 guide RNA 및 Cas12f1 단백질을 포함한다. 이때, 상기 CRISPR complex는 guide RNA 및 두 개의 Cas12f1 단백질을 포함한다(Satoru N. Takeda et al., Molecular Cell, 81, 1-13, (2021)). 상기 CRISPR complex는 guide RNA와 Cas12f1 단백질 사이의 상호작용에 의해 형성된 ribonucleoprotein (RNP)일 수 있다. 이때, 상기 CRISPR complex는 guide RNA와 하나의 Cas12f1 단백질 사이의 상호작용에 의해 형성된 ribonucleoprotein (RNP) 또는 guide RNA와 두 개의 Cas12f1 단백질 사이의 상호작용에 의해 형성된 RNP일 수 있다(Satoru N. Takeda et al., Molecular Cell, 81, 1-13, (2021)). 상기 CRISPR complex는 "guide RNA-Cas12f1(Cas14a1) 단백질 복합체", "CRISPR/Cas12f1 복합체" 또는 "CRISPR/Cas14a1 복합체"로 지칭되며, 상기 용어는 본 명세서에서 혼용되어 사용된다. 이하의 예시에 포함된 구성요소의 구체적인 설명은 앞서 해당 구성요소에 대해 기재한 바와 같다. 이하의 예시는 단순 예시로, 이에 제한되지 않는다.
일 구현예로서, 상기 CRISPR complex는 야생형 Cas12f1 단백질 및 guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 CRISPR complex는 두 개의 야생형 Cas12f1 단백질 및 guide RNA을 포함할 수 있다. 이때, 상기 야생형 Cas12f1 단백질은 SEQ ID NO: 129 아미노산 서열일 수 있다. 이때, 상기 guide RNA은 앞서 기재한 "2-4) 가이드 RNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다.
다른 일 구현예로서, 상기 CRISPR complex는 Cas12f1 변이체 및 guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 CRISPR complex는 두 개의 Cas12f1 변이체 및 guide RNA을 포함할 수 있다. 이때, 상기 Cas12f1 변이체는 Cas12f1 돌연변이 또는 Cas12f1 융합 단백질일 수 있다. 이때, 상기 guide RNA은 앞서 기재한 "2-4) 가이드 RNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다.
또 다른 일 구현예로서, 상기 CRISPR complex는 야생형 Cas12f1 단백질, Cas12f1 변이체 및 guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 야생형 Cas12f1 단백질은 SEQ ID NO: 129 아미노산 서열일 수 있다. 이때, 상기 Cas12f1 변이체는 Cas12f1 돌연변이 또는 Cas12f1 융합 단백질일 수 있다. 이때, 상기 guide RNA은 앞서 기재한 "2-4) 가이드 RNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다.
<LCA10 질환 치료를 위한 조성물>
본 명세서에 의해 개시되는 일 태양은 LCA10 질환 치료를 위한 조성물에 관한 것이다. 상기 조성물은 CRISPR/Cas12f1 시스템을 포함한다. 상기 CRISPR/Cas12f1 시스템은 앞서 설명한 "<LCA10 질환 치료를 위한 CRISPR/Cas12f1 시스템>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 상기 CRISPR/Cas12f1 시스템은 128 염기쌍의 cryptic exon의 전체 또는 일부의 결실 또는 역위를 유도하기 위해 이용된다. 따라서, 상기 조성물은 LCA10 질환의 원인이 되는 cryptic exon의 전체 또는 일부를 효과적으로 결실 또는 역위 시킴으로써 LCA10 질환을 위한 효과적인 치료제로 이용될 수 있다.
보다 구체적으로, 상기 조성물은
CEP290 유전자를 표적하는 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산; 및
Cas12f1 단백질 또는 이를 암호화하는 핵산
을 포함할 수 있다.
이때, 상기 CEP290 유전자를 표적하는 하나 이상의 가이드 RNA는 상기 CEP290 유전자 내에 존재하는 표적 서열과 상보적으로 결합할 수 있다.
이때, 상기 가이드 RNA를 암호화하는 핵산은 가이드 RNA를 전사하기 위해 가이드 RNA를 암호화하는 DNA일 수 있다.
이때, 상기 Cas12f1 단백질을 암호화하는 핵산은 야생형 Cas12f1 단백질을 암호화하는 핵산 또는 Cas12f1 변이체를 암호화하는 핵산일 수 있다. 상기 Cas12f1 단백질을 암호화하는 핵산은 Cas12f1 단백질을 도입하고자 하는 대상에 맞추어 코돈 최적화(codon optimization)된 것일 수 있다. “코돈 최적화"는 고유 서열의 적어도 하나의 코돈을 대상 세포의 유전자에 더욱 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하면서, 고유 아미노산 서열을 유지함으로써 관심 대상 세포에서의 발현의 증진을 위해 핵산서열을 변형시키는 과정을 의미한다. 다양한 종은 특정 아미노산의 특정 코돈에 대한 특정 편향을 가지며, 코돈 편향(유기체 간의 코돈 사용의 차이)은 종종 mRNA의 번역의 효율과 상호관련 되며, 이는 번역되는 코돈의 특성 및 특정 tRNA 분자의 이용가능성에 의해 좌우되는 것으로 여겨진다. 세포에서 선택된 tRNA의 우세는 일반적으로 펩타이드 합성에 가장 빈번하게 사용되는 코돈을 반영한 것이다. 따라서, 유전자는 코돈 최적화에 기초하여 주어진 유기체에서 최적의 유전자 발현을 위해 맞춤화될 수 있다. 일 구현예로서, 상기 Cas12f1 단백질을 암호화하는 핵산은 인간 코돈 최적화된 Cas12f1 단백질을 암호화하는 핵산일 수 있다. 예를 들어, 상기 인간 코돈 최적화된 Cas12f1 단백질을 암호화하는 핵산은 SEQ ID NO: 146 서열일 수 있다.
Name | Sequence |
인간 코돈 최적화된 Cas12f1 단백질을 암호화하는 핵산 | ATGGCCAAGAACACAATTACAAAGACACTGAAGCTGAGGATCGTGAGACCATACAACAGCGCTGAGGTCGAGAAGATTGTGGCTGATGAAAAGAACAACAGGGAAAAGATCGCCCTCGAGAAGAACAAGGATAAGGTGAAGGAGGCCTGCTCTAAGCACCTGAAAGTGGCCGCCTACTGCACCACACAGGTGGAGAGGAACGCCTGTCTGTTTTGTAAAGCTCGGAAGCTGGATGATAAGTTTTACCAGAAGCTGCGGGGCCAGTTCCCCGATGCCGTCTTTTGGCAGGAGATTAGCGAGATCTTCAGACAGCTGCAGAAGCAGGCCGCCGAGATCTACAACCAGAGCCTGATCGAGCTCTACTACGAGATCTTCATCAAGGGCAAGGGCATTGCCAACGCCTCCTCCGTGGAGCACTACCTGAGCGACGTGTGCTACACAAGAGCCGCCGAGCTCTTTAAGAACGCCGCTATCGCTTCCGGGCTGAGGAGCAAGATTAAGAGTAACTTCCGGCTCAAGGAGCTGAAGAACATGAAGAGCGGCCTGCCCACTACAAAGAGCGACAACTTCCCAATTCCACTGGTGAAGCAGAAGGGGGGCCAGTACACAGGGTTCGAGATTTCCAACCACAACAGCGACTTTATTATTAAGATCCCCTTTGGCAGGTGGCAGGTCAAGAAGGAGATTGACAAGTACAGGCCCTGGGAGAAGTTTGATTTCGAGCAGGTGCAGAAGAGCCCCAAGCCTATTTCCCTGCTGCTGTCCACACAGCGGCGGAAGAGGAACAAGGGGTGGTCTAAGGATGAGGGGACCGAGGCCGAGATTAAGAAAGTGATGAACGGCGACTACCAGACAAGCTACATCGAGGTCAAGCGGGGCAGTAAGATTGGCGAGAAGAGCGCCTGGATGCTGAACCTGAGCATTGACGTGCCAAAGATTGATAAGGGCGTGGATCCCAGCATCATCGGAGGGATCGATGTGGGGGTCAAGAGCCCCCTCGTGTGCGCCATCAACAACGCCTTCAGCAGGTACAGCATCTCCGATAACGACCTGTTCCACTTTAACAAGAAGATGTTCGCCCGGCGGAGGATTTTGCTCAAGAAGAACCGGCACAAGCGGGCCGGACACGGGGCCAAGAACAAGCTCAAGCCCATCACTATCCTGACCGAGAAGAGCGAGAGGTTCAGGAAGAAGCTCATCGAGAGATGGGCCTGCGAGATCGCCGATTTCTTTATTAAGAACAAGGTCGGAACAGTGCAGATGGAGAACCTCGAGAGCATGAAGAGGAAGGAGGATTCCTACTTCAACATTCGGCTGAGGGGGTTCTGGCCCTACGCTGAGATGCAGAACAAGATTGAGTTTAAGCTGAAGCAGTACGGGATTGAGATCCGGAAGGTGGCCCCCAACAACACCAGCAAGACCTGCAGCAAGTGCGGGCACCTCAACAACTACTTCAACTTCGAGTACCGGAAGAAGAACAAGTTCCCACACTTCAAGTGCGAGAAGTGCAACTTTAAGGAGAACGCCGATTACAACGCCGCCCTGAACATCAGCAACCCTAAGCTGAAGAGCACTAAGGAGGAGCCC (SEQ ID NO: 146) |
이때, 상기 조성물은 선택적으로 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산을 더 포함할 수 있다. 이 경우, 상기 조성물은 다수의 가이드 RNA를 포함할 수 있고, 다수의 가이드 RNA는 각각 서로 다른 표적 서열을 인식할 수 있다.
이때, 상기 조성물은 선택적으로 하나 이상의 Cas12f1 단백질 또는 이를 암호화하는 핵산을 더 포함할 수 있다. 이 경우, 상기 조성물은 서로 다른 아미노산 서열을 가지는 둘 이상의 Cas12f1 단백질을 포함할 수 있다. 이때, 상기 서로 다른 아미노산 서열을 가지는 둘 이상의 Cas12f1 단백질은 야생형 Cas12f1 단백질 및 Cas14a1 변이체일 수 있다.
상기 가이드 RNA는 앞서 설명한 "2. 가이드 RNA" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 Cas12f1 단백질은 앞서 설명한 "3. Cas12f1(Cas14a1) 단백질" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 조성물은 핵산 형태일 수 있다. 또는 상기 조성물은 핵산 및 단백질이 혼합된 형태일 수 있다. 이하에서 조성물의 형태에 대해 자세히 설명한다.
1. 핵산 형태
상기 조성물은 핵산 형태일 수 있다. 상기 핵산 형태는 DNA, RNA 또는 이의 혼합 형태일 수 있다. 상기 핵산 형태는 벡터 형태일 수 있다. 이때, 상기 벡터는 바이러스 벡터 또는 비바이러스 벡터일 수 있다.
또한, 상기 핵산의 형태는 원형 또는 선형일 수 있다.
또한, 상기 핵산의 형태는 이중 가닥 또는 단일 가닥일 수 있다.
1-1) Viral vector
상기 조성물은 바이러스 벡터 형태일 수 있다. 예를 들어, 상기 바이러스 벡터는 레트로바이러스 벡터(retroviral(retrovirus) vector), 렌티바이러스 벡터(lentiviral(lentivirus) vector), 아데노바이러스 벡터(adenoviral(adenovirus vector), 아데노-연관 바이러스 벡터(adeno-associated viral (adeno-associated virus; AAV) vector), 백시니아바이러스 벡터(vaccinia viral(vaccinia virus) vector), 폭스바이러스 벡터(poxviral(poxvirus) vector) 및 단순포진 바이러스 벡터(herpes simplex viral(herpes simplex virus) vector)로 구성된 군에서 선택되는 하나 이상의 바이러스 벡터일 수 있다.
일 구현예로서, 상기 조성물은 바이러스 벡터 형태일 수 있다. 즉, 상기 조성물은 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 바이러스 벡터 형태로 포함할 수 있다. 이때, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 제1 바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 바이러스 벡터를 포함할 수 있다. 또는 상기 조성물은 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 아데노-연관 바이러스 벡터를 포함할 수 있다.
다른 구현예로서, 상기 조성물이 다수개의 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 경우, 상기 조성물은 다수개의 가이드 RNA를 암호화하는 핵산을 모두 포함하는 제1 바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 바이러스 벡터를 포함할 수 있다. 또는, 상기 조성물은 다수개의 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 바이러스 벡터 형태일 수 있다. 또는, 상기 조성물은 하나의 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 바이러스 벡터가 다수 개(가이드 RNA의 수만큼)로 포함될 수 있다.
또 다른 구현예로서, 상기 조성물이 가이드 RNA를 암호화하는 핵산 및 둘 이상의 Cas12f1 단백질(예를 들어, 제1 Cas12f1 단백질 및 제2 Cas12f1 단백질)을 암호화하는 핵산을 포함하는 경우, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 제1 바이러스 벡터, 제1 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 바이러스 벡터 및 제2 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제3 바이러스 벡터를 포함할 수 있다. 또는, 상기 조성물은 가이드 RNA를 암호화하는 핵산 및 둘 이상의 Cas12f1 단백질(예를 들어, 제1 Cas12f1 단백질 및 제2 Cas12f1 단백질)을 암호화하는 핵산을 모두 포함하는 하나의 바이러스 벡터 형태일 수 있다. 또는, 상기 조성물은 가이드 RNA를 암호화하는 핵산 및 제1 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제1 바이러스 벡터 및 제2 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 바이러스 벡터를 포함할 수 있다.
1-2) Non-viral vector
상기 조성물은 비바이러스 벡터 형태일 수 있다. 이 경우, 상기 조성물의 가이드 RNA는 RNA 형태 또는 이를 암호화하는 핵산 형태일 수 있다.
상기 비바이러스 벡터는 플라스미드, 파지, 네이키드 DNA, DNA 복합체, mRNA(전사물) 또는 PCR 앰플리콘(amplicon)일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 상기 플라스미드는 pcDNA 시리즈, pSC101, pGV1106, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈, 및 pUC19으로 이뤄진 군에서 선택된 것일 수 있다. 예를 들어, 상기 파지는 λgt4λB, λ-Charon, λΔz1, 및 M13으로 이뤄진 군에서 선택된 것일 수 있다.
일 구현예로서, 상기 조성물은 비바이러스 벡터 형태일 수 있다. 즉, 상기 조성물은 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 비바이러스 벡터 형태로 포함할 수 있다. 이때, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 제1 비바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 비바이러스 벡터를 포함할 수 있다. 또는 상기 조성물은 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 비바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 플라스미드를 포함할 수 있다. 다른 일 구체예로서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 mRNA를 포함할 수 있다. 또 다른 구체예로서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 네이키드 DNA를 포함할 수 있다.
다른 구현예로서, 상기 조성물은 비바이러스 벡터 형태일 수 있다. 즉, 상기 조성물은 가이드 RNA 및 Cas12f1 단백질을 암호화하는 핵산을 비바이러스 벡터 형태로 포함할 수 있다. 일 구체예로서, 상기 조성물은 가이드 RNA, 및 Cas12f1 단백질을 암호화하는 mRNA를 포함할 수 있다. 다른 일 구체예로서, 상기 조성물은 가이드 RNA, 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 플라스미드를 포함할 수 있다.
1-3) 바이러스 벡터 및 비바이러스 벡터 혼합
상기 조성물은 바이러스 벡터 및 비바이러스 벡터 혼합 형태일 수 있다. 상기 바이러스 벡터 및 비바이러스 벡터에 관한 설명은 앞서 기재한 바와 같다. 이 경우, 상기 조성물의 가이드 RNA는 RNA 형태 또는 이를 암호화하는 핵산 형태일 수 있다.
일 구현예로서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 비바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 아데노-연관 바이러스 벡터 및 Cas12f1 단백질을 암호화하는 mRNA를 포함할 수 있다. 다른 일 구체예로서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 렌티바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 플라스미드를 포함할 수 있다.
다른 일 구현예로서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 비바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 아데노-연관 바이러스 벡터를 포함할 수 있다. 다른 일구체예로서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 플라스미드 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 렌티바이러스 벡터를 포함할 수 있다.
또 다른 일 구현예로서, 상기 조성물은 가이드 RNA, 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 가이드 RNA, 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 아데노-연관 바이러스 벡터를 포함할 수 있다.
다른 일 구현예로서, 상기 조성물은 가이드 RNA, 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 비바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 가이드 RNA, 및 Cas12f1 단백질을 암호화하는 mRNA를 포함할 수 있다. 다른 구체예로서, 상기 조성물은 가이드 RNA, 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 플라스미드를 포함할 수 있다.
1-4) 기타 - 벡터의 추가 구성
앞서 설명한 벡터는 선택적으로 조절/제어 구성요소, 프로모터 및/또는 부가 발현 요소를 추가로 포함할 수 있다.
조절/제어 구성요소
상기 벡터는 선택적으로 조절/제어 구성요소를 포함할 수 있다. 이때, 상기 조절/제어 구성요소는 벡터에 포함된 각 구성요소를 암호화하는 서열(즉, 가이드 RNA를 암호화하는 핵산 및/또는 Cas12f1 단백질을 암호화하는 핵산)에 작동 가능하게 연결될 수 있다. 상기 조절/제어 구성요소는 인핸서, 인트론, 종결 신호, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(IRES, Internal Ribosome Entry Site), 스플라이스 억셉터, 2A 서열 및/또는 복제원점(replication origin)일 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 복제원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점, 및/또는 BBV 복제원점일 수 있으나, 이에 제한되는 것은 아니다.
프로모터
상기 벡터는 선택적으로 프로모터를 포함할 수 있다. 이때, 상기 프로모터는 벡터에 포함된 각 구성요소를 암호화하는 서열(즉, 가이드 RNA를 암호화하는 핵산 및/또는 Cas12f1 단백질을 암호화하는 핵산)에 작동 가능하게 연결될 수 있다. 상기 프로모터는 벡터에 포함된 각 구성요소를 암호화하는 서열(즉, 가이드 RNA를 암호화하는 핵산 및/또는 Cas12f1 단백질을 암호화하는 핵산)을 적절히 발현시킬 수 있는 것이라면 제한되지 않는다. 일 구현예로서, 상기 프로모터 서열은 RNA 중합효소(예를 들어, pol I, pol II, 또는 pol III)의 전사를 촉진시키는 프로모터일 수 있다. 예를 들어, 상기 프로모터는 SV40 초기 프로모터, mouse mammary tumor virus long terminal repeat(LTR) 프로모터, adenovirus major late 프로모터 (Ad MLP), herpes simplex virus (HSV) 프로모터, CMV immediate early promoter region (CMVIE)와 같은 cytomegalovirus (CMV) 프로모터, Chicken b-actin (CBA) 프로모터, rous sarcoma virus (RSV) 프로모터, human U6 small nuclear 프로모터 (U6) (Miyagishi et al., Nature Biotechnology 20, 497 - 500 (2002)), enhanced U6 프로모터 (e.g., Xia et al., Nucleic Acids Res. 2003 Sep 1;31(17)), human H1 프로모터 (H1) 및 7SK 프로모터 (7SK) 중 하나 수 있으나, 이에 제한되는 것은 아니다.
부가 발현 요소
상기 벡터는 선택적으로 부가 발현 요소를 포함할 수 있다. 상기 벡터는 가이드 RNA를 암호화하는 핵산 및/또는 Cas12f1 단백질을 암호화하는 핵산 외에 통상의 기술자가 필요에 의해 발현시키고자 하는 부가 발현 요소를 암호화하는 핵산 서열을 포함하고 있을 수 있다. 예를 들어, 상기 부가 발현 요소는, 앞서 기재한 용어 정의 중 "태그" 섹션에서 설명된 태그 중 하나일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 상기 부가 발현 요소는, 글리포세이트(glyphosate), 글루포시네이트암모늄 (glufosinate ammonium) 또는 포스피노트리신(phosphinothricin)과 같은 제초제 저항성 유전자; 또는 암피실린(ampicillin), 카나마이신(kanamycin), G418, 블레오마이신 (Bleomycin), 하이그로마이신(hygromycin) 또는 클로람페니콜(chloramphenicol)과 같은 항생제 내성 유전자일 수 있으나, 이에 제한되는 것은 아니다.
2. 핵산 및 단백질의 혼합 형태
상기 조성물은 핵산 및 단백질 혼합 형태일 수 있다. 이때, 상기 핵산은 앞서 기재한 "1. 핵산 형태"에 기재한 바와 같다. 이 경우, 상기 조성물은 Cas12f1 단백질을 포함한다. 이때, 상기 조성물은 두 개의 Cas12f1 단백질을 포함할 수 있으며, 상기 두 개의 Cas12f1 단백질은 동일한 아미노산 서열을 가지는 Cas12f1 단백질 또는 서로 다른 아미노산 서열을 가지는 Cas12f1 단백질일 수 있다.
일 구현예로서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 바이러스 벡터 및 Cas12f1 단백질을 포함할 수 있다. 일 구체예로서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 아데노-연관 바이러스 벡터 및 Cas12f1 단백질을 포함할 수 있다. 다른 일 구체예로서, 상기 조성물은 다수개의 가이드 RNA를 암호화하는 핵산을 포함하는 아데노-연관 바이러스 벡터 및 Cas12f1 단백질을 포함할 수 있다.
다른 일 구현예로서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 비바이러스 벡터 및 Cas12f1 단백질을 포함할 수 있다. 일 구체예로서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 플라스미드 및 Cas12f1 단백질을 포함할 수 있다. 다른 일 구체예로서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 포함할 수 있다. 또 다른 일 구체예로서, 상기 조성물은 다수개의 가이드 RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 포함할 수 있다.
또 다른 일 구현예로서, 상기 조성물은 가이드 RNA 및 Cas12f1 단백질을 포함할 수 있다. 이 경우, 상기 조성물은 CRISPR/Cas12f1 복합체 형태인 RNP 형태일 수 있다. 만약 다수의 가이드 RNA 및 Cas12f1 단백질을 포함하는 조성물의 경우, 상기 조성물은 다수개의 CRISPR/Cas12f1 복합체를 포함할 수 있으며, 다수개의 CRISPR/Cas12f1 복합체는 각각 서로 다른 표적 서열을 인지할 수 있다.
3. 조성물의 예시(1)
일 구현예로서, 상기 조성물은
CEP290 유전자를 표적하는 둘 이상의 가이드 RNA 또는 이를 암호화하는 핵산; 및
Cas12f1 단백질 또는 이를 암호화하는 핵산
을 포함할 수 있다.
이때, 상기 가이드 RNA는 상기 CEP290 유전자 내에 존재하는 표적 서열과 상보적으로 결합할 수 있다.
상기 둘 이상의 가이드 RNA는 제1 가이드 RNA 및 제2 가이드 RNA를 포함할 수 있다. 이때, 상기 둘 이상의 가이드 RNA를 암호화하는 핵산은 제1 가이드 RNA를 암호화하는 핵산 및 제2 가이드 RNA를 암호화하는 핵산을 포함할 수 있다.
이때, 상기 제1 가이드 RNA와 상기 제2 가이드 RNA는 상기 CEP 유전자에 존재하는 서로 다른 표적 서열을 표적할 수 있다.
이때, 상기 제1 가이드 RNA는 상기 CEP 유전자의 인트론 26 영역 중 IVS26 돌연변이(c.2991 + 1655A> G)를 기준으로 상류 영역(upstream region)을 표적할 수 있다. 또는 상기 제1 가이드 RNA는 상기 CEP290 유전자의 엑손 26의 3'말단과 상기 IVS26 돌연변이(c.2991 + 1655A> G) 사이의 영역을 표적할 수 있다.
이때, 상기 제2 가이드 RNA는 상기 CEP 유전자의 인트론 26 영역 중 상기 IVS26 돌연변이(c.2991 + 1655A> G)를 기준으로 하류 영역(downstream region)을 표적할 수 있다. 또는 상기 제2 가이드 RNA는 상기 IVS26 돌연변이(c.2991 + 1655A> G)와 상기 CEP290 유전자의 엑손 27의 5' 말단 사이의 영역을 표적할 수 있다.
이때, 상기 제1 가이드 RNA는 제1 가이드 영역 및 제1 스캐폴드 영역을 포함할 수 있다. 이때, 상기 제1 가이드 영역은 제1 가이드 서열을 가질 수 있다. 이때, 상기 제1 가이드 서열은 상기 CEP 유전자의 인트론 26 영역 중 IVS26 돌연변이(c.2991 + 1655A> G)를 기준으로 상류 영역에 존재하는 표적 서열과 상보적인 결합을 형성할 수 있는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 제1 가이드 서열은 상기 CEP290 유전자의 엑손 26의 3'말단과 상기 IVS26 돌연변이(c.2991 + 1655A> G) 사이의 영역에 표적 서열과 상보적인 결합을 형성할 수 있는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 상보적인 결합은 선택적으로 0 내지 5개의 미스매칭 결합을 포함할 수 있다. 일 예로, 상기 제1 가이드 서열은 상기 표 3에 기재된 가이드 서열들 중 선택된 하나의 서열일 수 있다. 이때, 상기 제1 스캐폴드 영역은 crRNA 스캐폴드 서열 및 tracrRNA 스캐폴드 서열을 포함할 수 있다. 상기 제1 스캐폴드 영역은 선택적으로 링커를 더 포함할 수 있으며, 상기 링커는 상기 tracrRNA 스캐폴드 서열과 상기 crRNA 스캐폴드 서열 사이에 위치할 수 있다. 이때, 상기 crRNA 스캐폴드 서열은 야생형 crRNA 스캐폴드 서열 또는 engineered crRNA 스캐폴드 서열일 수 있다. 일 예로, 상기 야생형 crRNA 스캐폴드 서열은 SEQ ID NO: 101 서열일 수 있다. 다른 일 예로, 상기 engineered crRNA 스캐폴드 서열은 SEQ ID NO: 101 서열을 인위적을 변형한 것으로, 앞선 "ii) crRNA 스캐폴드 서열" 섹션에 기재된 예시 중 선택된 하나일 수 있다. 이때, 상기 tracrRNA 스캐폴드 서열은 야생형 tracrRNA 스캐폴드 서열 또는 engineered tracrRNA 스캐폴드 서열일 수 있다. 일 예로, 상기 야생형 tracrRNA 스캐폴드 서열은 SEQ ID NO: 110 서열일 수 있다. 다른 일 예로, 상기 engineered crRNA 스캐폴드 서열은 SEQ ID NO: 110 서열을 인위적을 변형한 것으로, 앞선 "iii) tracrRNA 스캐폴드 서열" 섹션에 기재된 예시 중 선택된 하나일 수 있다. 일 예로, 상기 제1 스캐폴드 영역은 앞선 "iv) 스캐폴드 영역의 예시" 섹션에 기재된 예시 중 선택된 하나일 수 있다.
이때, 상기 제1 가이드 RNA는 선택적으로 U-rich tail 서열을 더 포함할 수 있다. 상기 U-rich tail 서열은 상기 제1 가이드 영역의 3' 말단에 위치할 수 있다. 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 1 내지 10의 정수일 수 있다. 일 예로, 상기 U-rich tail 서열은 앞선 "2-3) U-rich tail 서열" 섹션에 기재된 예시 중 선택된 하나일 수 있다.
이때, 상기 제2 가이드 RNA는 제2 가이드 영역 및 제2 스캐폴드 영역을 포함할 수 있다. 이때, 상기 제2 가이드 영역은 제2 가이드 서열을 가질 수 있다. 이때, 상기 제2 가이드 서열은 상기 CEP 유전자의 인트론 26 영역 중 IVS26 돌연변이(c.2991 + 1655A> G)를 기준으로 하류 영역에 존재하는 표적 서열과 상보적인 결합을 형성할 수 있는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 제2 가이드 서열은 상기 IVS26 돌연변이(c.2991 + 1655A> G)와 상기 CEP290 유전자의 엑손 27의 5' 말단 사이의 영역에 표적 서열과 상보적인 결합을 형성할 수 있는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 상보적인 결합은 선택적으로 0 내지 5개의 미스매칭 결합을 포함할 수 있다. 일 예로, 상기 제2 가이드 서열은 상기 표 4에 기재된 가이드 서열들 중 선택된 하나의 서열일 수 있다. 이때, 상기 제2 스캐폴드 영역은 crRNA 스캐폴드 서열 및 tracrRNA 스캐폴드 서열을 포함할 수 있다. 상기 제2 스캐폴드 영역은 선택적으로 링커를 더 포함할 수 있으며, 상기 링커는 상기 tracrRNA 스캐폴드 서열과 상기 crRNA 스캐폴드 서열 사이에 위치할 수 있다. 이때, 상기 crRNA 스캐폴드 서열은 야생형 crRNA 스캐폴드 서열 또는 engineered crRNA 스캐폴드 서열일 수 있다. 일 예로, 상기 야생형 crRNA 스캐폴드 서열은 SEQ ID NO: 101 서열일 수 있다. 다른 일 예로, 상기 engineered crRNA 스캐폴드 서열은 SEQ ID NO: 101 서열을 인위적을 변형한 것으로, 앞선 "ii) crRNA 스캐폴드 서열" 섹션에 기재된 예시 중 선택된 하나일 수 있다. 이때, 상기 tracrRNA 스캐폴드 서열은 야생형 tracrRNA 스캐폴드 서열 또는 engineered tracrRNA 스캐폴드 서열일 수 있다. 일 예로, 상기 야생형 tracrRNA 스캐폴드 서열은 SEQ ID NO: 110 서열일 수 있다. 다른 일 예로, 상기 engineered crRNA 스캐폴드 서열은 SEQ ID NO: 110 서열을 인위적을 변형한 것으로, 앞선 "iii) tracrRNA 스캐폴드 서열" 섹션에 기재된 예시 중 선택된 하나일 수 있다. 일 예로, 상기 제2 스캐폴드 영역은 앞선 "iv) 스캐폴드 영역의 예시" 섹션에 기재된 예시 중 선택된 하나일 수 있다.
이때, 상기 제2 가이드 RNA는 선택적으로 U-rich tail 서열을 더 포함할 수 있다. 상기 U-rich tail 서열은 상기 제2 가이드 영역의 3' 말단에 위치할 수 있다. 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 1 내지 10의 정수일 수 있다. 일 예로, 상기 U-rich tail 서열은 앞선 "2-3) U-rich tail 서열" 섹션에 기재된 예시 중 선택된 하나일 수 있다.
상기 Cas12f1 단백질은 야생형 Cas12f1 단백질 또는 Cas12f1 변이체일 수 있다. 이때, 상기 Cas12f1 단백질은 앞서 설명한 "3. Cas12f1(Cas14a1) 단백질" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 조성물은 선택적으로 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산을 더 포함할 수 있다. 이 경우, 더 포함되는 가이드 RNA는 상기 제1 가이드 RNA 및 상기 제2 가이드 RNA와 다른 표적 서열을 인식할 수 있다.
상기 조성물은 선택적으로 하나 이상의 Cas12f1(Cas14a1) 단백질 또는 이를 암호화하는 핵산을 더 포함할 수 있다. 이 경우, 상기 조성물은 서로 다른 아미노산 서열을 가지는 둘 이상의 Cas12f1(Cas14a1) 단백질을 포함할 수 있다. 이때, 상기 서로 다른 아미노산 서열을 가지는 둘 이상의 Cas12f1(Cas14a1) 단백질은 야생형 Cas12f1(Cas14a1) 단백질 및 Cas12f1 변이체일 수 있다.
상기 조성물은 핵산 형태일 수 있다. 이때, 상기 조성물은 CEP290 유전자를 표적하는 둘 이상의 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 하나의 벡터에 포함할 수 있다. 또는 상기 조성물은 CEP290 유전자를 표적하는 둘 이상의 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 각각의 벡터에 포함할 수 있다. 이때, 상기 벡터는 플라스미드, mRNA(전사물), PCR 엠플리콘 또는 바이러스 벡터일 수 있다. 이때, 상기 바이러스 벡터는 레트로바이러스 벡터(retroviral(retrovirus) vector), 렌티바이러스 벡터(lentiviral(lentivirus) vector), 아데노바이러스 벡터(adenoviral(adenovirus vector), 아데노-연관 바이러스 벡터(adeno-associated viral (adeno-associated virus; AAV) vector), 백시니아바이러스 벡터(vaccinia viral(vaccinia virus) vector), 폭스바이러스 벡터(poxviral(poxvirus) vector) 및 단순포진 바이러스 벡터(herpes simplex viral(herpes simplex virus) vector)로 구성된 군에서 선택되는 적어도 하나일 수 있다. 이때, 상기 벡터는 상기 가이드 RNA를 암호화하는 핵산을 위한 프로모터 및 상기 Cas12f1 단백질을 암호화하는 핵산을 위한 프로모터를 더 포함할 수 있다. 이때, 상기 프로모터는 U6 프로모터, H1 프로모터, 7SK 프로모터, CMV 프로모터, CBA 프로모터, LTR 프로모터, Ad MLP 프로모터, HSV 프로모터, SV40 프로모터 또는 RSV 프로모터일 수 있다. 일 예로, 상기 조성물은 상기 제1 가이드 RNA를 암호화하는 핵산 및 상기 제2 가이드 RNA를 암호화하는 핵산을 포함하는 제1 벡터 및 상기 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 벡터를 포함할 수 있다. 이때, 상기 제1 벡터 및 제2 벡터는 각각 바이러스 벡터일 수 있다. 이때, 상기 바이러스 벡터는 아데노-연관 바이러스(AAV) 벡터일 수 있다. 이때, 상기 제1 벡터는 상기 제1 가이드 RNA 암호화하는 핵산 및 상기 제2 가이드 RNA를 암호화하는 핵산 각각을 위한 프로모터를 포함할 수 있으며, 상기 각각의 프로모터는 U6 프로모터, H1 프로모터 또는 7SK 프로모터 일 수 있다. 이때, 상기 제2 벡터는 상기 Cas12f1 단백질을 암호화하는 핵산을 위한 프로모터를 포함할 수 있으며, 상기 프로모터는 CMV 프로모터, CBA 프로모터, LTR 프로모터, Ad MLP 프로모터, HSV 프로모터, SV40 프로모터 또는 RSV 프로모터일 수 있다. 다른 일 예로, 상기 조성물은 상기 제1 가이드 RNA를 암호화하는 핵산, 상기 제2 가이드 RNA를 암호화하는 핵산 및 상기 Cas12f1 단백질을 암호화하는 핵산을 포함하는 벡터를 포함할 수 있다. 이때, 상기 벡터는 바이러스 벡터일 수 있다. 이때, 상기 바이러스 벡터는 아데노-연관 바이러스(AAV) 벡터일 수 있다. 이때, 상기 벡터는 상기 제1 가이드 RNA 암호화하는 핵산, 상기 제2 가이드 RNA를 암호화하는 핵산 및 상기 Cas12f1 단백질을 암호화하는 핵산 각각을 위한 프로모터를 포함할 수 있다. 이때, 상기 각각의 프로모터는 U6 프로모터, H1 프로모터, 7SK 프로모터, CMV 프로모터, CBA 프로모터, LTR 프로모터, Ad MLP 프로모터, HSV 프로모터, SV40 프로모터 또는 RSV 프로모터일 수 있다.
상기 조성물은 핵산 및 단백질 혼합 형태일 수 있다. 이때, 상기 조성물은 가이드 RNA 및 Cas12f1 단백질이 결합된 CRISPR/Cas12f1 복합체를 포함할 수 있다. 일 예로, 상기 조성물은 상기 제1 가이드 RNA와 Cas12f1 단백질이 결합된 제1 CRISPR/Cas12f1 복합체 및 상기 제2 가이드 RNA와 Cas12f1 단백질이 결합된 제2 CRISPR/Cas12f1 복합체를 포함할 수 있다.
4. 조성물의 예시(2)
일 구현예로서, 상기 조성물은
CEP290 유전자를 표적하는 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산; 및
Cas12f1 단백질 또는 이를 암호화하는 핵산
을 포함할 수 있다.
이때, 상기 가이드 RNA는 상기 CEP290 유전자 내에 존재하는 표적 서열과 상보적으로 결합할 수 있다.
이때, 상기 가이드 RNA는 상기 CEP 유전자의 IVS26 돌연변이(c.2991 + 1655A> G)를 포함하는 인트론 26 영역의 일부 영역을 표적할 수 있다.
이때, 상기 가이드 RNA는 가이드 영역 및 스캐폴드 영역을 포함할 수 있다. 이때, 상기 가이드 영역은 가이드 서열을 가질 수 있다. 이때, 상기 가이드 서열은 상기 CEP 유전자의 IVS26 돌연변이(c.2991 + 1655A> G)를 포함하는 인트론 26 영역의 일부 영역에 존재하는 표적 서열과 상보적인 결합을 형성할 수 있는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 상보적인 결합은 선택적으로 0 내지 5개의 미스매칭 결합을 포함할 수 있다. 일 예로, 상기 가이드 서열은 상기 표 3 및 표 4에 기재된 가이드 서열들 중 선택된 하나의 서열일 수 있다. 이때, 상기 스캐폴드 영역은 crRNA 스캐폴드 서열 및 tracrRNA 스캐폴드 서열을 포함할 수 있다. 상기 스캐폴드 영역은 선택적으로 링커를 더 포함할 수 있으며, 상기 링커는 상기 tracrRNA 스캐폴드 서열과 상기 crRNA 스캐폴드 서열 사이에 위치할 수 있다. 이때, 상기 crRNA 스캐폴드 서열은 야생형 crRNA 스캐폴드 서열 또는 engineered crRNA 스캐폴드 서열일 수 있다. 일 예로, 상기 야생형 crRNA 스캐폴드 서열은 SEQ ID NO: 101 서열일 수 있다. 다른 일 예로, 상기 engineered crRNA 스캐폴드 서열은 SEQ ID NO: 101 서열을 인위적을 변형한 것으로, 앞선 "ii) crRNA 스캐폴드 서열" 섹션에 기재된 예시 중 선택된 하나일 수 있다. 이때, 상기 tracrRNA 스캐폴드 서열은 야생형 tracrRNA 스캐폴드 서열 또는 engineered tracrRNA 스캐폴드 서열일 수 있다. 일 예로, 상기 야생형 tracrRNA 스캐폴드 서열은 SEQ ID NO: 110 서열일 수 있다. 다른 일 예로, 상기 engineered crRNA 스캐폴드 서열은 SEQ ID NO: 110 서열을 인위적을 변형한 것으로, 앞선 "iii) tracrRNA 스캐폴드 서열" 섹션에 기재된 예시 중 선택된 하나일 수 있다. 일 예로, 상기 제1 스캐폴드 영역은 앞선 "iv) 스캐폴드 영역의 예시" 섹션에 기재된 예시 중 선택된 하나일 수 있다.
이때, 상기 가이드 RNA는 선택적으로 U-rich tail 서열을 더 포함할 수 있다. 상기 U-rich tail 서열은 상기 가이드 영역의 3' 말단에 위치할 수 있다. 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 1 내지 10의 정수일 수 있다. 일 예로, 상기 U-rich tail 서열은 앞선 "2-3) U-rich tail 서열" 섹션에 기재된 예시 중 선택된 하나일 수 있다.
상기 Cas12f1 단백질은 야생형 Cas12f1 단백질 또는 Cas12f1 변이체일 수 있다. 이때, 상기 Cas12f1 단백질은 앞서 설명한 "3. Cas12f1(Cas14a1) 단백질" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 조성물은 선택적으로 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산을 더 포함할 수 있다. 이 경우, 더 포함되는 가이드 RNA는 상기 가이드 RNA와 다른 표적 서열을 인식할 수 있다.
상기 조성물은 선택적으로 하나 이상의 Cas12f1(Cas14a1) 단백질 또는 이를 암호화하는 핵산을 더 포함할 수 있다. 이 경우, 상기 조성물은 서로 다른 아미노산 서열을 가지는 둘 이상의 Cas12f1(Cas14a1) 단백질을 포함할 수 있다. 이때, 상기 서로 다른 아미노산 서열을 가지는 둘 이상의 Cas12f1(Cas14a1) 단백질은 야생형 Cas12f1(Cas14a1) 단백질 및 Cas12f1 변이체일 수 있다.
상기 조성물은 핵산 형태일 수 있다. 이때, 상기 조성물은 CEP290 유전자를 표적하는 하나 이상의 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 하나의 벡터에 포함할 수 있다. 또는 상기 조성물은 CEP290 유전자를 표적하는 하나 이상의 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 각각의 벡터에 포함할 수 있다. 이때, 상기 벡터는 플라스미드, mRNA(전사물), PCR 엠플리콘 또는 바이러스 벡터일 수 있다. 이때, 상기 바이러스 벡터는 레트로바이러스 벡터(retroviral(retrovirus) vector), 렌티바이러스 벡터(lentiviral(lentivirus) vector), 아데노바이러스 벡터(adenoviral(adenovirus vector), 아데노-연관 바이러스 벡터(adeno-associated viral (adeno-associated virus; AAV) vector), 백시니아바이러스 벡터(vaccinia viral(vaccinia virus) vector), 폭스바이러스 벡터(poxviral(poxvirus) vector) 및 단순포진 바이러스 벡터(herpes simplex viral(herpes simplex virus) vector)로 구성된 군에서 선택되는 적어도 하나일 수 있다. 이때, 상기 벡터는 상기 가이드 RNA를 암호화하는 핵산을 위한 프로모터 및 상기 Cas12f1 단백질을 암호화하는 핵산을 위한 프로모터를 더 포함할 수 있다. 이때, 상기 프로모터는 U6 프로모터, H1 프로모터, 7SK 프로모터, CMV 프로모터, CBA 프로모터, LTR 프로모터, Ad MLP 프로모터, HSV 프로모터, SV40 프로모터 또는 RSV 프로모터일 수 있다.
상기 조성물은 핵산 및 단백질 혼합 형태일 수 있다. 이때, 상기 조성물은 가이드 RNA 및 Cas12f1 단백질이 결합된 CRISPR/Cas12f1 복합체를 포함할 수 있다.
<LCA10 질환 치료 방법>
본 명세서에 의해 개시되는 일 태양은 LCA10 질환 치료 방법에 관한 것이다. 상기 LCA10 질환 치료 방법은 CRISPR/Cas12f1 시스템을 이용한다. 보다 구체적으로, 상기 방법은 CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물을 대상체 및/또는 대상 세포에 도입(또는 전달)하여 대상체 및/또는 대상 세포 내에 존재하는 표적 유전자인 CEP290 유전자를 변형시키는 방법에 관한 것이다. 이때, 대상체는 동물 또는 이의 일부 조직이며, 상기 동물은 인간 또는 비인간 동물일 수 있다. 이때, 대상 세포는 비인간 동물 세포 또는 인간 세포일 수 있다. 상기 방법은 in vitro, ex vivo 또는 생체 내(in vivo)에서 수행될 수 있다. 이때, 상기 생체 내는 인간 생체 내 또는 비인간 동물 생체 내일 수 있다.
상기 방법은 CRISPR/Cas12f1(Cas14a1) system을 대상체 및/또는 대상 세포에 도입(또는 전달, 처리, 주입, 투여)하는 것을 포함하는 방법일 수 있다. 상기 CRISPR/Cas12f1 시스템은 앞서 설명한 "<LCA10 질환 치료를 위한 CRISPR/Cas12f1 시스템>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 방법은 상기 CRISPR/Cas12f1 시스템을 이용해 상기 CEP290 유전자의 인트론 26 영역 중 일부 핵산 서열의 제거 또는 역위를 유도한다. 이때, 상기 일부 핵산 서열은 IVS26 돌연변이(c.2991 + 1655A> G)를 포함한다. 이를 통해 상기 CEP290 유전자에 의해 전사되는 128 염기쌍의 cryptic exon의 전체 또는 일부의 제거할 수 있다. 따라서, 상기 방법은 LCA10 질환의 원인이 되는 상기 cryptic exon의 전체 또는 일부를 효과적으로 제거시킴으로써 LCA10 질환을 위한 효과적인 치료 방법으로 이용될 수 있다.
이하에서, 상기 방법의 구현예를 이용해 자세히 설명한다.
1. Method 예시
1-1) Method 예시(1)
일 구현예로서, 상기 방법은 세포에서 CEP290 유전자를 인위적으로 변형시키는 방법일 수 있다. 이때, 상기 방법은 세포에 조성물을 처리 또는 도입하는 것으로 포함할 수 있다.
이때, 상기 조성물은
CEP290 유전자를 표적하는 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산; 및
Cas12f1 단백질 또는 이를 암호화하는 핵산
을 포함할 수 있다.
또는 상기 조성물은
CEP290 유전자를 표적하는 둘 이상의 가이드 RNA 또는 이를 암호화하는 핵산; 및
Cas12f1 단백질 또는 이를 암호화하는 핵산
을 포함할 수 있다. 이때, 상기 둘 이상의 가이드 RNA는 각각 상기 CEP290 유전자에 존재하는 서로 다른 표적 서열을 표적할 수 있다.
상기 조성물은 앞서 설명한 "<LCA10 질환 치료를 위한 조성물>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 가이드 RNA는 앞서 설명한 <LCA10 질환 치료를 위한 CRISPR/Cas12f1 시스템> 중 "2. 가이드 RNA" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 Cas12f1 단백질은 <LCA10 질환 치료를 위한 CRISPR/Cas12f1 시스템> 중 "3. Cas12f1(Cas14a1) 단백질" 섹션에 기재된 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 조성물은 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태일 수 있다. 또는 상기 조성물은 핵산 및 단백질 혼합 형태일 수 있다. 상기 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태는 앞서 설명한 <LCA10 질환 치료를 위한 조성물> 중 "1. 핵산 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 핵산 및 단백질 혼합 형태는 앞서 설명한 <LCA10 질환 치료를 위한 조성물> 중 "2. 핵산 및 단백질의 혼합 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
일 구체예에서, 상기 조성물은 둘 이상의 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 바이러스 벡터 형태일 수 있다. 이때, 상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택되는 하나 이상일 수 있다. 이때, 상기 조성물은 둘 이상의 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 바이러스 벡터를 포함할 수 있다. 또는 상기 조성물은 둘 이상의 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 각각 포함하는 두 개의 바이러스 벡터를 포함할 수 있다.
다른 일 구체예에서, 상기 조성물은 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 비바이러스 벡터 형태일 수 있다. 이때, 상기 비바이러스 벡터는 플라스미드일 수 있다. 이때, 상기 조성물은 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 플라스미드를 포함할 수 있다. 또는 상기 조성물은 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 각각 포함하는 두 개의 플라스미드를 포함할 수 있다.
또 다른 일 구체예에서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 mRNA을 포함할 수 있다.
또 다른 일 구체예에서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 포함할 수 있다. 또는 상기 조성물은 가이드 RNA 및 Cas12f1 단백질이 결합한 CRISPR/Cas12f1(Cas14a1) 복합체를 포함할 수 있다.
상기 세포는 CEP290 유전자를 포함하는 세포일 수 있다. 상기 세포는 비인간 동물 세포 또는 인간 세포일 수 있다.
상기 세포는 LCA10 질환을 가진 대상체로부터 수득한 세포일 수 있다. 이때, 상기 대상체는 인간 또는 비인간 동물일 수 있다. 이때, 상기 비인간 동물은 LCA10 질환이 걸릴 수 있는 비인간 동물일 수 있다.
상기 세포에 조성물을 처리 또는 도입하는 것은 세포로 CRISPR/Cas12f1(Cas14a1) system이 도입되기 위한 것일 수 있다. 또는 상기 세포에 조성물을 처리 또는 도입하는 것은 세포에 존재하는 CEP290 유전자에 CRISPR/Cas12f1(Cas14a1) system이 접촉되기 위한 것일 수 있다. 상기 세포에 조성물을 처리하는 것은 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 나노파티클 방법 및/또는 일시적인 세포 압축 또는 스퀴징 방법을 이용한 것일 수 있다. 또는 상기 진핵 세포에 조성물을 처리하는 것은 양이온성 리포좀법, 초산 리튬-DMSO, 지질-매개 형질감염(transfection), 인산칼슘 침전법(precipitation), lipofection, PEI(Polyethyleneimine)-매개 형질감염, DEAE-dextran 매개 형질감염, 및/또는 나노파티클-매개 핵산 전달(Panyam et al., Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조)을 이용한 것일 수 있으나, 이에 제한되는 것은 아니다.
상기 세포에 조성물을 처리 또는 도입한 결과, 상기 CEP290 유전자의 인트론 26 영역 중 일부 핵산 서열의 제거 또는 역위를 유도할 수 있다. 이때, 상기 일부 핵산 서열은 IVS26 돌연변이(c.2991 + 1655A> G)를 포함할 수 있다. 이를 통해 상기 CEP290 유전자에 의해 전사되는 128 염기쌍의 cryptic exon의 전체 또는 일부가 제거 또는 역위될 수 있다. 또는 상기 세포에 조성물을 처리 또는 도입한 결과, 상기 CEP290 유전자의 인트론 26 영역 중 일부 핵산 서열 내에 비-상동성 말단-결합 (Non-homologous end joining, NHEJ)에 의한 변형이 발생할 수 있다. 이때, 상기 일부 핵산 서열은 IVS26 돌연변이(c.2991 + 1655A> G)를 포함할 수 있다. 이때, 상기 NHEJ에 의한 변형은 하나 이상의 뉴클레오타이드의 결실(deletion), 삽입(insertion) 또는 인델(insertion and deletion, indel)일 수 있다.
2-2) Method 예시(2)
다른 일 구현예로서, 상기 방법은 LCA10 질환 치료 방법으로, 대상체에 조성물을 도입 또는 투여하는 것을 포함할 수 있다.
이때, 상기 조성물은
CEP290 유전자를 표적하는 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산; 및
Cas12f1 단백질 또는 이를 암호화하는 핵산
을 포함할 수 있다.
또는 상기 조성물은
CEP290 유전자를 표적하는 둘 이상의 가이드 RNA 또는 이를 암호화하는 핵산; 및
Cas12f1 단백질 또는 이를 암호화하는 핵산
을 포함할 수 있다. 이때, 상기 둘 이상의 가이드 RNA는 각각 상기 CEP 유전자에 존재하는 서로 다른 표적 서열을 표적할 수 있다.
상기 조성물은 앞서 설명한 "<LCA10 질환 치료를 위한 조성물>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 가이드 RNA는 앞서 설명한 <LCA10 질환 치료를 위한 CRISPR/Cas12f1 시스템> 중 "2. 가이드 RNA" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 Cas12f1 단백질은 <LCA10 질환 치료를 위한 CRISPR/Cas12f1 시스템> 중 "3. Cas12f1(Cas14a1) 단백질" 섹션에 기재된 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 조성물은 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태일 수 있다. 또는 상기 조성물은 핵산 및 단백질 혼합 형태일 수 있다. 상기 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태는 앞서 설명한 <LCA10 질환 치료를 위한 조성물> 중 "1. 핵산 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 핵산 및 단백질 혼합 형태는 앞서 설명한 <LCA10 질환 치료를 위한 조성물> 중 "2. 핵산 및 단백질의 혼합 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
일 구체예에서, 상기 조성물은 둘 이상의 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 바이러스 벡터 형태일 수 있다. 이때, 상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택되는 하나 이상일 수 있다. 이때, 상기 조성물은 둘 이상의 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 바이러스 벡터를 포함할 수 있다. 또는 상기 조성물은 둘 이상의 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 각각 포함하는 두 개의 바이러스 벡터를 포함할 수 있다.
다른 일 구체예에서, 상기 조성물은 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 비바이러스 벡터 형태일 수 있다. 이때, 상기 비바이러스 벡터는 플라스미드일 수 있다. 이때, 상기 조성물은 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 플라스미드를 포함할 수 있다. 또는 상기 조성물은 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 각각 포함하는 두 개의 플라스미드를 포함할 수 있다.
또 다른 일 구체예에서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 mRNA을 포함할 수 있다.
또 다른 일 구체예에서, 상기 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 포함할 수 있다. 또는 상기 조성물은 가이드 RNA 및 Cas12f1 단백질이 결합한 CRISPR/Cas12f1(Cas14a1) 복합체를 포함할 수 있다.
상기 대상체는 LCA10 질환을 가진 인간 또는 비인간 동물일 수 있다. 또는 상기 대상체는 cryptic exon을 포함하는 CEP290 유전자를 가지는 인간 또는 비인간 동물일 수 있다.
상기 대상체에 조성물을 도입 또는 투여하는 것은 상기 대상체에 존재하는 하나이상의 세포로 CRISPR/Cas12f1(Cas14a1) system을 도입시키기 위한 것일 수 있다. 또는 상기 대상체에 조성물을 도입 또는 투여하는 것은 상기 대상체에 존재하는 하나 이상의 세포에 존재하는 CEP290 유전자에 CRISPR/Cas12f1(Cas14a1) system이 접촉되기 위한 것일 수 있다. 상기 대상체에 조성물을 도입 또는 투여하는 것은 미세주입(microinjection), 양이온성 리포좀법, 초산 리튬-DMSO, 지질-매개 형질감염(transfection), 인산칼슘 침전법(precipitation), lipofection, PEI(Polyethyleneimine)-매개 형질감염, DEAE-dextran 매개 형질감염, 및/또는 나노파티클-매개 핵산 전달(Panyam et al., Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조)을 이용한 것일 수 있으나, 이에 제한되는 것은 아니다. 또는 상기 대상체에 조성물을 투여하는 것은 주사(injection), 수혈(transfusion), 삽입(implantation) 또는 이식(transplantation)으로 수행될 수 있다. 이때, 상기 대상체에 조성물을 투여하는 것은 망막하(subretinal), 피하(subcutaneously), 피내(intradermaliy), 안구내(intraocularly), 유리체내(intravitreally) 종양내(intratumorally), 절내(intranodally), 골수내(intramedullary), 근육내(intramuscularly), 정맥내(intravenous), 림프액내(intralymphatic) 또는 복막내(intraperitoneally)에서 선택된 투여 경로로 수행될 수 있다.
상기 조성물의 1회 투여량(소정의 소망하는 효과를 얻기 위한 약학적 유효량)은 투여 대상의 연령, 건강 및 체중, 동시에 받는 치료의 종류, 만약 있다면 치료의 빈도, 원하는 효과의 특성 등을 고려하여 적절히 처방될 수 있다.
상기 대상체에 조성물을 도입 또는 투여한 결과, 상기 대상체에 존재하는 하나 이상의 세포에서 CEP290 유전자의 인트론 26 영역 중 일부 핵산 서열의 제거 또는 역위를 유도할 수 있다. 이때, 상기 일부 핵산 서열은 IVS26 돌연변이(c.2991 + 1655A> G)를 포함할 수 있다. 이를 통해 상기 CEP290 유전자에 의해 전사되는 128 염기쌍의 cryptic exon의 전체 또는 일부가 제거 또는 역위될 수 있다. 또는 상기 대상체에 조성물을 도입 또는 투여한 결과, 상기 대상체에 존재하는 하나 이상의 세포에서 CEP290 유전자의 인트론 26 영역 중 일부 핵산 서열 내에 비-상동성 말단-결합 (Non-homologous end joining, NHEJ)에 의한 변형이 발생할 수 있다. 이때, 상기 일부 핵산 서열은 IVS26 돌연변이(c.2991 + 1655A> G)를 포함할 수 있다. 이때, 상기 NHEJ에 의한 변형은 하나 이상의 뉴클레오타이드의 결실(deletion), 삽입(insertion) 또는 인델(insertion and deletion, indel)일 수 있다.
따라서, 상기 방법은 LCA10 질환의 원인이 되는 상기 cryptic exon의 전체 또는 일부를 효과적으로 결실 또는 역위 시킴으로써 LCA10 질환을 위한 효과적인 치료 방법으로 이용될 수 있다.
2. 치료 효과 - 표적 유전자의 변형
본 명세서에서 개시하는 조성물 및 방법을 통해 CEP290 유전자는 변형될 수 있다. 보다 구체적으로, CEP290 유전자는 CRISPR/Cas12f1 시스템에 의해 변형될 수 있다. 이때, 상기 변형은 i) CRISPR/Cas12f1(Cas14a1) system에 의한 CEP290 유전자의 절단 또는 손상 및 ii) 절단된(또는 손상된) CEP290 유전자의 수선 또는 수복을 모두 포함할 수 있다. 이때, 상기 변형은 CEP290 유전자에 존재하는 인트론 26의 일부 핵산 서열의 역위일 수 있고, 이로 인해 CEP290 유전자에 의해 전사되어 생성된 cryptic exon의 전체 또는 일부가 역위될 수 있다. 또는 상기 변형은 CEP290 유전자에 존재하는 인트론 26의 일부 핵산 서열의 결실(deletion)일 수 있고, 이로 인해 CEP290 유전자에 의해 전사되어 생성되는 cryptic exon 내에 일부 핵산 서열이 결실(deletion)될 수 있다. 또는 상기 변형은 CEP290 유전자에 존재하는 인트론 26 내에 추가적인 핵산 서열의 삽입(insertion)일 수 있고, 이로 인해 CEP290 유전자에 의해 전사되어 생성된 cryptic exon 내에 추가적인 핵산 서열이 삽입(insertion)될 수 있다. 또는 상기 변형은 CEP290 유전자에 존재하는 인트론 26의 일부 핵산 서열이 결실되고 추가 서열이 삽입되는 인델(insertion and deletion; indel)일 수 있고, 이로 인해 CEP290 유전자에 의해 전사되어 생성된 cryptic exon 내에 일부 서열이 삭제되고 추가 서열이 삽입될 수 있다. 또는, 상기 변형은 CEP290 유전자에 존재하는 인트론 26에 존재하는 적어도 하나 이상의 핵산 서열이 치환(substitution)될 수 있고, 이로 인해 CEP290 유전자에 의해 전사되는 mRNA의 서열이 변형될 수 있다. 이때, 상기 인트론 26의 일부 핵산 서열은 IVS26 돌연변이(c.2991 + 1655A> G)를 포함할 수 있다. 이때, 상기 인트론 26에 존재하는 적어도 하나 이상의 핵산 서열은 IVS26 돌연변이(c.2991 + 1655A> G) 서열을 포함할 수 있다. 이하에서 상기 변형에 대해 자세히 설명한다.
2-1)
결실 (Deletion)
본 명세서에서 제공하는 방법의 수행 결과로, 변형은 CEP290 유전자에 존재하는 인트론 26의 전부 또는 일부 핵산 서열이 제거(또는 결실)될 수 있다. 상기 변형은 CEP290 유전자에 존재하는 인트론 26의 일부 염기 서열을 제거하는 것을 의미할 수 있다. 일 구현예로, 상기 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산, 제1 engineered guide RNA 또는 이를 암호화하는 핵산, 및 제2 engineered guide RNA 또는 이를 암호화하는 핵산을 CEP290 유전자를 포함하는 세포 또는 상기 세포를 가지는 대상체에 도입하는 것을 포함한다. 이로 인해, 상기 CEP290 유전자에 존재하는 인트론 26 내에 특정 서열 부분의 제거가 일어난다. 이때, 상기 특정 서열은 IVS26 돌연변이(c.2991 + 1655A> G)를 포함하는 핵산 서열일 수 있다.
2-2) 역위 (Inversion)
본 명세서에서 제공하는 방법의 수행 결과로, 변형은 CEP290 유전자에 존재하는 인트론 26의 전부 또는 일부가 역위될 수 있다. 상기 역위는 CEP290 유전자에 존재하는 인트론 26의 전부 또는 일부 영역의 전사 방향이 변경되는 것일 수 있다. 즉, 상기 역위는 CEP290 유전자에 존재하는 인트론 26의 전부 또는 일부 영역이 재조합되어 뒤집히는 것으로, 인트론 26의 전부 또는 일부 영역이 한쪽 말단에서 다른 쪽 말단으로 반전되는 것일 수 있다. 일 구현예로, 상기 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산, 제1 engineered guide RNA 또는 이를 암호화하는 핵산, 및 제2 engineered guide RNA 또는 이를 암호화하는 핵산을 CEP290 유전자를 포함하는 세포 또는 상기 세포를 가지는 대상체에 도입하는 것을 포함한다. 이로 인해, 상기 CEP290 유전자에 존재하는 인트론 26의 전부 또는 일부 영역의 역위가 일어난다. 이때, 상기 일부 영역은 IVS26 돌연변이(c.2991 + 1655A> G)를 포함하는 영역일 수 있다.
2-3) 삽입 및 결실 (또는 인델, Insertion and deletion (Indel))
본 명세서에서 제공하는 방법의 수행 결과로, CEP290 유전자에 존재하는 인트론 26 내에 인델(deletion and insertion; indel)이 발생할 수 있다. 상기 인델은 비-상동성 말단-결합 (Non-homologous end joining, NHEJ)에 의해 발생할 수 있다. 일반적으로, NHEJ는 이중 가닥의 파손(예를 들어, 절단)에 의해 형성된 2 개의 적합성 말단이 빈번한 접촉을 반복하여 DNA 내 이중 가닥 파손을 수복 또는 수선하는 방법이다. NHEJ를 이용한 손상된 유전자 또는 핵산의 수복은 NHEJ 수선 부위에 핵산 서열의 일부 삽입 및/또는 결실(삽입결실)을 초래한다. 이러한 삽입 및/또는 결실은 리딩 프레임을 변경시키고, 프레임쉬프트 된 전사체 mRNA를 만들어내고, 결과적으로 넌센스-매개 붕괴(nonsense mediated decay)를 겪거나 정상적인 단백질을 합성하는데 실패함으로써 본래의 기능을 상실하게 된다. 따라서, CEP290 유전자에 존재하는 인트론 26 내에 인델이 일어나면, CEP290 유전자에 의해 전사되어 생성되는 cryptic exon이 불활성화될 수 있다. 일 구현예로, 상기 방법의 수행 결과, CEP290 유전자에 존재하는 인트론 26 내에 하나 이상의 염기가 결실 및/또는 추가될 수 있다.
2-4) 치환 (Substitution) 또는 염기 편집 (Base editing)
본 명세서에서 제공하는 방법의 수행 결과로, CEP290 유전자의 점 돌연변이(c.2991 + 1655A> G)를 포함하는 인트론 26 영역 내에서 베이스 에디팅이 일어날 수 있다. 상기 베이스 에디팅은 표적 유전자 또는 표적 핵산 내 임의의 뉴클레오타이드가 결실 및/또는 삽입되는 인델과는 달리, 핵산 내 하나 이상의 특정 염기를 의도한 대로 변경하는 것을 의미한다. 달리 표현하면, 표적 유전자 또는 표적 핵산 내 특정 위치에서, 미리 의도한 점 돌연변이(point mutation)를 일으키는 것이다. 일 구현예로, 상기 방법의 수행 결과, CEP290 유전자의 점 돌연변이(c.2991 + 1655A> G)는 다시 A로 치환될 수 있다.
2-5) 삽입 (Insertion)
본 명세서에서 제공하는 방법의 수행 결과로, CEP290 유전자 내에 녹인(knockin)이 발생할 수 있다. 상기 녹인은 CEP290 유전자 내에 추가적인 핵산 서열을 삽입하는 것을 의미한다. 상기 녹인이 일어나려면, CRISPR/Cas12f1(Cas14a1) system 외에 상기 추가적인 핵산 서열을 포함하는 도너가 더 필요하다. 세포 내에서 CRISPR/Cas12f1(Cas14a1) system이 CEP290 유전자를 절단하는 경우, 상기 절단된 CEP290 유전자의 수복이 일어나게 된다. 이 경우, 상동 재조합 수리(homology directed repairing, HDR)을 이용하여 수복할 수 있으며, 이때, 상기 도너가 상기 수복 과정에 관여하여 상기 추가적인 핵산 서열을 CEP290 유전자 내에 삽입된다. 일 구현예로, 상기 방법은 세포 내로 도너를 전달하는 것을 추가적으로 포함할 수 있다. 이때, 상기 도너는 추가 대상 핵산을 포함하며, 상기 도너에 의해 상기 CEP290 유전자 내 상기 추가 대상 핵산의 삽입이 유도된다. 이때, 상기 도너를 세포 내로 전달할 때, 전술한 CRISPR/Cas12f1(Cas14a1) system을 처리하는 방법 중 하나의 방법이 사용될 수 있다.
2-6) 표적 유전자의 변형에 의한 표현형 (Phenotype by modification of target)
CEP290 유전자의 변형은 녹아웃(knockout), 녹다운(knockdown), 녹인(knockin)의 효과를 초래할 수 있다. "녹아웃(knockout)"은 CEP290 유전자를 불활성화 시키는 것을 의미하며, "CEP290 유전자의 불활성화"는 CEP290 유전자의 전사 및/또는 번역이 되지 못하는 상태를 의미한다. 녹아웃을 통해 질병을 유발하는 유전자 또는 비정상적 기능을 가지는 유전자의 전사 및 번역을 억제하여 단백질의 발현을 막을 수 있다. "녹다운(knockdown)"은 CEP290 유전자의 전사 및/또는 번역을 감소시키거나 CEP290 단백질의 발현이 감소하는 것을 의미한다. 녹다운을 통해 과발현 되는 유전자 또는 단백질의 발현을 조절하여 질병의 발생을 막거나 질병을 치료할 수 있다. "녹인(knockin)"은 CEP290 유전자에 특정 핵산 또는 유전자를 삽입하는 것을 의미하며, 이때, "특정 핵산 또는 유전자"는 삽입하고자 하는 또는 발현시키기 원하는 유전자 또는 핵산을 의미한다. 녹인을 통해 질병을 유발하는 돌연변이 유전자를 올바르게 교정하거나, 정상 유전자를 삽입하여 정상 유전자의 발현을 유도하여 질병 치료에 이용할 수 있다.
일 구현예로서, 상기 방법에 의해 CEP290 유전자가 변형되면, 상기 세포는 IVS26 돌연변이(c.2991 + 1655A> G)를 포함하는 CEP290 유전자의 전사 및/또는 번역이 억제 또는 감소될 수 있다. 또는 상기 세포는 정상 CEP290 유전자의 전사 및/또는 번역이 증가될 수 있다.
다른 일 구현예로서, 상기 방법에 의해 CEP290 유전자가 변형되면, 상기 대상체는 IVS26 돌연변이(c.2991 + 1655A> G)를 포함하는 CEP290 유전자의 전사 및/또는 번역이 억제 또는 감소될 수 있다. 또는 상기 대상체는 정상 CEP290 유전자의 전사 및/또는 번역이 증가될 수 있다.
<비-상동성 말단-결합(Non-homologous end joining DNA repair pathway; NHEJ) 활성 감소 인자>
본 명세서에서 제공하는 LCA10 질환 치료를 위한 조성물은 비-상동성 말단-결합(Non-homologous end joining DNA repair pathway; NHEJ) 활성을 감소시킬 수 있는 인자를 추가적으로 포함할 수 있다. 또한, 본 명세서에서 제공하는 LCA10 질환 치료 방법은 CRISPR/Cas12f1 시스템 및 상기 NHEJ 활성 감소 인자를 같이 사용하여 수행될 수 있다.
상기 NHEJ 활성 감소 인자는 세포 내에서 작용하여, 이중가닥 DNA의 절단에 대하여 비-상동성 말단-결합 활성을 감소시키는 역할을 한다.
상기 비-상동성 말단-결합 활성은, 예를 들어, Canonical NHEJ pathway (Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22:886-897,), 또는 Alternative NHEJ pathway일 수 있다. 구체적으로, 상기 NHEJ 활성은 MRE11, RAD50, NBS1, DNA-PK, CtIP, Ku70, Ku80, 아르테미스(DCLRE1C), 리가제 IV (Lig4), PNKP, XRCC4, XLF(XRCC4-like factor), ATM(ATM Serine/Threonine Kinase), CHK1/CHK2, CLF(CURLY LEAF), 및/또는 Pol Mu(POLM)의 발현 또는 활성에 의한 Canonical NHEJ pathway이거나, XRCC1, PARP (예를 들면, PARP1), Lig1, 및/또는 Lig3의 발현 또는 활성에 의한 Alternative NHEJ pathway일 수 있다.
상기 NHEJ 활성 감소 인자는, 예를 들면 작은 분자 또는 억제성 핵산 예컨대 짧은 간섭 핵산 (예를 들면, 짧은 간섭 RNA (siRNA), 이중-가닥 RNA (dsRNA), 마이크로-RNA (miRNA), 및 유전자 전사체에 특이적인 짧은 헤어핀 RNA (shRNA)) 또는 안티센스 올리고뉴클레오타이드일 수 있다. 상기 NHEJ 활성 감소 인자는, 전술한 Canonical NHEJ pathway에 관여하는 인자 및/또는 Alternative NHEJ pathway에 관여하는 인자의 발현 및/또는 활성을 감소 또는 억제하는 기능을 한다.
이러한 NHEJ 활성 감소 인자를 LCA10 질환 치료를 위한 조성물과 같이 사용하는 경우, 세포 내 비-상동성 말단-결합 활성을 감소시킴으로써 상기 LCA10 질환 치료를 위한 조성물이 CEP290 유전자를 변형시키는 효율을 높일 수 있다.
발명의 가능한 실시예 (ASPECTS)
Cas12f1 단백질
실시예 1, Cas12f1 단백질
Cas14 패밀리에 속하는 Cas12f1 단백질.
실시예 2, Cas14a1 단백질
실시예 1에 있어서, 상기 Cas12f1 단백질은 Cas14a1 단백질임.
실시예 3, 야생형 단백질
실시예 1 내지 실시예 2 중 어느 하나에 있어서, 상기 Cas12f1 단백질은 자연계에 존재하는 야생형의 단백질임.
실시예 4, 야생형 Cas14 패밀리 단백질
실시예 3에 있어서, 상기 Cas12f1 단백질은 Cas14 패밀리(Harrington et al., Science 5, 839-842 (2018); US 2020/0172886 A1)에서 유래한 것을 특징으로 함.
실시예 5, 야생형 Cas14 패밀리 단백질, 서열한정
실시예 3에 있어서, 상기 Cas12f1 단백질은 다음 서열로 표현됨:
mAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP (SEQ ID NO: 129).
실시예 6, Cas12f1 단백질 변이체
실시예 1 내지 실시예 2 중 어느 하나에 있어서, 상기 Cas12f1 단백질은 야생형 Cas12f1 단백질의 변이체임.
실시예 7, Cas12f1 단백질 변이체, 기능 관점
실시예 6에 있어서, 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질과 동일한 기능을 가지는 변이체, 기능 일부가 변형된 변이체, 및/또는 추가적인 기능이 부가된 변이체임.
실시예 8, N말단/C말단에 폴리펩타이드 추가
실시예 7에 있어서, 상기 Cas12f1 단백질의 변이체는 야생형 Cas12f1 단백질과 동일한 기능을 가지고, 야생형의 Cas12f1 단백질의 N말단 및/또는 C말단에 50개 이하의 아미노산 서열을 가지는 폴리펩타이드가 연결된 Cas12f1 단백질의 변이체임.
실시예 9, Cas12f1 단백질 변이체 예시
실시예 8에 있어서, 상기 Cas12f1 단백질의 변이체는 다음 중 선택된 아미노산 서열로 표현됨:
MGEKSSRRRRNGKSGAWTAAITSCVGGKMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP (SEQ ID NO: 288);
MEKRINKIRKKLSADNATKPVSRSGPMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP (SEQ ID NO: 289);
MAGGPGAGSAAPVSSTSSLPLAALNMRVMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP (SEQ ID NO:290); 및
MAGGPGAGSAAPVSSTSSLPLAALNMMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP (SEQ ID NO: 291).
실시예 10, 추가 활성 도메인 포함
실시예 7에 있어서, 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질에 추가적인 기능이 부가된 변이체로, 다음 중 선택된 하나 이상의 활성을 가지는 도메인, 펩타이드, 또는 단백질을 포함함:
메틸라아제(methylase) 활성; 디메틸라아제(demethylase) 활성; 전사촉진(transcription activation) 활성; 전사 저해(transcription repression) 활성; 전사 방출 인자(transcription release factor) 활성; 히스톤 변형(histone modification) 활성; RNA 절단(cleavage) 활성; 및 핵산 결합(nucleic acid binding) 활성.
실시예 11, 추가 기능을 가진 도메인 포함
실시예 7에 있어서, 상기 Cas12f1 변이체는 역전사 효소(reverse transcriptase) 및/또는 디아미네이즈(deaminase)를 추가로 포함함.
실시예 12, NLS/NES 포함
실시예 1 내지 11 중 어느 하나에 있어서, 상기 Cas12f1 단백질은 다음 중 선택된 하나 이상의 펩타이드를 추가적으로 포함함:
아미노산 서열 PKKKRKV (SEQ ID NO: 130)를 갖는 SV40 바이러스 대형 T-항원의 NLS; NLS(예를 들어, 서열 KRPAATKKAGQAKKKK (SEQ ID NO: 131)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD (SEQ ID NO: 132) 또는 RQRRNELKRSP (SEQ ID NO: 133)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: 134)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부 터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO: 135); 마이오마(myoma) T 단백질의 서열 VSRKRPRP (SEQ ID NO: 136) 및 PPKKARED (SEQ ID NO: 137); 인간 p53의 서열 PQPKKKPL (SEQ ID NO: 138); 마우스 c-abl IV의 서열 SALIKKKKKMAP (SEQ ID NO: 139); 인플루엔자 바이러스 NS1의 서열 DRLRR (SEQ ID NO: 140) 및 PKQKKRK (SEQ ID NO: 141); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL (SEQ ID NO: 142); 마우스 Mx1 단백질의 서열 REKKKFLKRR (SEQ ID NO: 143); 인간 폴리 (ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: 144); 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK (SEQ ID NO: 145)로부터 유래된 NLS 서열.
실시예 13, 태그 포함
실시예 1 내지 13 중 어느 하나에 있어서, 상기 Cas12f1 단백질은 다음 중 선택된 하나 이상의 기능적 도메인, 펩타이드, 또는 단백질을 추가적으로 포함함:
히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루 티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등의 태그 단백질; 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 청록색 형광 단백질(CFP), 청색 형광 단백질(BFP), HcRED, DsRed 등의 형광 단백질; 및 글루타티온-S-트랜스 퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타 -글루쿠로니다제, 루시퍼라제 등의 리포터 단백질(효소).
실시예 14, PAM 서열
실시예 1 내지 13 중 어느 하나에 있어서, 상기 Cas12f1 단백질이 인식할 수 있는 Protospacer Adjacent Motif(PAM) 서열은 5'-TTTR-3'이고, 여기서, 상기 R은 A 또는 G임.
실시예 15, 유사한 서열 포함
실시예 1 내지 14 중 선택된 어느 하나의 Cas12f1 단백질의 아미노산 서열과 70% 이상, 71% 이상, 72% 이상, 73% 이상, 74% 이상, 75% 이상, 76% 이상, 77% 이상, 79% 이상, 79% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상 동일한 아미노산 서열로 표현되는 Cas12f1 단백질.
tracrRNA 스캐폴드
실시예 16, 야생형 tracrRNA 스캐폴드
다음 중 선택된 서열로 표현되는 야생형 tracrRNA 스캐폴드:
5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO: 110); 및
5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(SEQ ID NO: 292).
실시예 17, WT 기준, 엔지니어링 된 tracrRNA 스캐폴드
다음 서열로 표현되는, 엔지니어링 된 tracrRNA 스캐폴드:
5'-[제1서열]-[제2서열]-[제3서열]-[제4서열]-[제5서열]-3',
여기서, 상기 제1서열은 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 293), 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACA-3' (SEQ ID NO: 294), 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCAC-3' (SEQ ID NO: 295), 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 296), 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGC-3' (SEQ ID NO: 297), 5'-CAAAUUCANNNCNCCUCUCCAAUUCUG-3' (SEQ ID NO: 298), 5'-CAAAUUCANNNCNCCUCUCCAAUUCU-3' (SEQ ID NO: 299), 5'-CAAAUUCANNNCNCCUCUCCAAUUC-3' (SEQ ID NO: 300), 5'-CAAAUUCANNNCNCCUCUCCAAUU-3' (SEQ ID NO: 4), 5'-CAAAUUCANNNCNCCUCUCCAAU-3' (SEQ ID NO: 5), 5'-CAAAUUCANNNCNCCUCUCCAA-3' (SEQ ID NO: 303), 5'-CAAAUUCANNNCNCCUCUCCA-3' (SEQ ID NO: 304), 5'-CAAAUUCANNNCNCCUCUCC-3' (SEQ ID NO: 305), 5'-CAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 306), 5'-CAAAUUCANNNCNCCUCU-3' (SEQ ID NO: 307), 5'-CAAAUUCANNNCNCCUC-3' (SEQ ID NO: 308), 5'-CAAAUUCANNNCNCCU-3' (SEQ ID NO: 309), 5'-CAAAUUCANNNCNCC-3' (SEQ ID NO: 310), 5'-CAAAUUCANNNCNC-3' (SEQ ID NO: 4), 및 5'-CAAAUUCANNNCN-3' (SEQ ID NO: 5) 중 선택된 서열이고,
상기 제2서열은 5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO: 313)이고,
상기 제3서열은 5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO: 314)이고,
상기 제4서열은 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 315), 5'-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 316), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 317), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 318), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 319), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 320), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 4), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 5), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 323), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUG-3' (SEQ ID NO: 324), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUG-3' (SEQ ID NO: 325), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUG-3' (SEQ ID NO: 326), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUG-3' (SEQ ID NO: 327), 5'-CCGCUUCACCUUAGGAGUGAAGGUG-3' (SEQ ID NO: 328), 5'-CCGCUUCACUUAGAGUGAAGGUG-3' (SEQ ID NO: 329), 5'-CCGCUUCACUUAGGUGAAGGUG-3' (SEQ ID NO: 330), 5'-CCGCUUCAUUAGUGAAGGUG-3' (SEQ ID NO: 4), 5'-CCGCUUCUUAGGAAGGUG-3' (SEQ ID NO: 5), 5'-CCGCUUUUAGAAGGUG-3' (SEQ ID NO: 333), 5'-CCGCUUUAGAGGUG-3' (SEQ ID NO: 334), 5'-CCGCUUAGGGUG-3' (SEQ ID NO: 335), 5'-CCGUUAGGUG-3' (SEQ ID NO: 336), 5'-CCUUAGGUG-3', 5'-CUUAGUG-3', 5'-CUUAGG-3' 및 5'-UUAG-3' 중 선택된 서열,
상기 제5서열은 5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 337), 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3' (SEQ ID NO: 338), 5'-AAAGUGGAGAA-3' (SEQ ID NO: 339), 5'-UAAAGUGGAGAA-3' (SEQ ID NO: 340), 5'-AUAAAGUGGAGAA-3' (SEQ ID NO: 4), 5'-GAUAAAGUGGAGAA-3' (SEQ ID NO: 5), 5'-UGAUAAAGUGGAGAA-3' (SEQ ID NO: 343), 5'-CUGAUAAAGUGGAGAA-3' (SEQ ID NO: 344), 5'-ACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 345), 5'-CACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 346), 5'-UCACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 347) 및 5'-UUCACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 348) 중 선택된 서열이고,
여기서, 상기 각각의 N은 독립적으로 A, C, G 또는 U이며,
상기 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO: 110) 및 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO: 110)과 상이한 것을 특징으로 함.
실시예 18, 링커 서열 치환
실시예 17에 있어서, 상기 제4서열 내에 포함된 5'-UUAG-3' 서열이 5'-GAAA-3' 서열로 치환된 서열인 tracrRNA 스캐폴드 서열.
실시예 19, MF 기준, 엔지니어링 된 tracrRNA 스캐폴드
다음 서열로 표현되는, 엔지니어링 된 tracrRNA 스캐폴드:
5'-[제1영역]-[제2영역]-[제3영역]-[제4영역]-3',
여기서, 상기 제1영역은 부존재하거나, 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(SEQ ID NO: 349), 5'-AAAGUGGAGAA-3'(SEQ ID NO: 350), 5'-UAAAGUGGAGAA-3'(SEQ ID NO: 4), 5'-AUAAAGUGGAGAA-3'(SEQ ID NO: 5), 5'-GAUAAAGUGGAGAA-3'(SEQ ID NO: 353), 5'-UGAUAAAGUGGAGAA-3'(SEQ ID NO: 354), 5'-CUGAUAAAGUGGAGAA-3'(SEQ ID NO: 355), 5'-ACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 356), 5'-CACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 357), 5'-UCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 358), 5'-UUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 359), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 360)로 이뤄진 군에서 선택된 서열이고,
상기 제2영역은 부존재하거나, 5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(SEQ ID NO: 4), 5'-CCGUUAGGUGG-3'(SEQ ID NO: 5), 5'-CCGCUUAGGGUGG-3'(SEQ ID NO: 363), 5'-CCGCUUUAGAGGUGG-3'(SEQ ID NO: 364), 5'-CCGCUUUUAGAAGGUGG-3'(SEQ ID NO: 365), 5'-CCGCUUCUUAGGAAGGUGG-3'(SEQ ID NO: 366), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(SEQ ID NO: 367), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(SEQ ID NO: 368), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(SEQ ID NO: 369), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(SEQ ID NO: 370), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(SEQ ID NO: 4), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(SEQ ID NO: 5), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(SEQ ID NO: 373), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(SEQ ID NO: 374), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(SEQ ID NO: 375), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(SEQ ID NO: 376), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(SEQ ID NO: 377), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(SEQ ID NO: 378), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(SEQ ID NO: 379), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(SEQ ID NO: 380), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(SEQ ID NO: 4), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(SEQ ID NO: 5)로 이뤄진 군에서 선택된 서열이고,
상기 제3영역은 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(SEQ ID NO: 383), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(SEQ ID NO: 384), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(SEQ ID NO: 385), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(SEQ ID NO: 386), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(SEQ ID NO: 387), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(SEQ ID NO: 388), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(SEQ ID NO: 389), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(SEQ ID NO: 390), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(SEQ ID NO: 4), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(SEQ ID NO: 5), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(SEQ ID NO: 393), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(SEQ ID NO: 394), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(SEQ ID NO: 395), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(SEQ ID NO: 396), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(SEQ ID NO: 397)로 이뤄진 군에서 선택된 서열이고,
상기 제4영역은 5'-AACAAA-3'(SEQ ID NO: 398), 5'-AACAAAU-3'(SEQ ID NO: 399), 5'-AACAAAUU-3'(SEQ ID NO: 400), 5'-AACAAAUUC-3'(SEQ ID NO: 401), 5'-AACAAAUUCA-3'(SEQ ID NO: 402), 5'-AACAAAUUCAU-3'(SEQ ID NO: 403), 5'-AACAAAUUCAUU-3'(SEQ ID NO: 404), 및 5'-AACAAAUUCAUUU-3'(SEQ ID NO: 405)에서 선택된 서열이며,
상기 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(SEQ ID NO: 292)과는 상이한 것을 특징으로 함.
실시예 20, 유사한 서열 포함
실시예 16 내지 19 중 어느 하나의 tracrRNA 스캐폴드 서열과 70% 이상, 71% 이상, 72% 이상, 73% 이상, 74% 이상, 75% 이상, 76% 이상, 77% 이상, 79% 이상, 79% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상 동일한 서열로 표현되는 tracrRNA 스캐폴드.
crRNA 스캐폴드
실시예 21, 야생형 crRNA 스캐폴드
다음 중 선택된 서열로 표현되는 crRNA 스캐폴드:
5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 101); 및
5'-GAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 406).
실시예 22, WT 기준, 엔지니어링 된 crRNA 스캐폴드
다음 서열로 표현되는, 엔지니어링 된 crRNA 스캐폴드:
5'-[제6서열]-[제7서열]-3',
여기서, 제6서열은 5'-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 407), 5'-GUUGCAGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 408), 5'-UUGCAGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 409), 5'-UGCAGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 410), 5'-GCAGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 411), 5'-CAGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 412), 5'-AGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 413), 5'-GAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 414), 5'-AACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 415), 5'-ACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 416), 5'-CCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 417), 5'-CCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 418), 5'-CGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 419), 5'-GAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 420), 5'-AAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 421), 5'-AUAGNGNNNUGAAGGA-3' (SEQ ID NO: 422), 5'-UAGNGNNNUGAAGGA-3' (SEQ ID NO: 423), 5'-AGNGNNNUGAAGGA-3' (SEQ ID NO: 424) 및 5'-NGNNNUGAAGGA-3' (SEQ ID NO: 425) 중 선택된 서열이고,
제7서열은 5'-AUGCAAC-3'이며,
여기서, 상기 각각의 N은 독립적으로 A, C, G 또는 U임.
실시예 23, MF 기준, 엔지니어링 된 crRNA 스캐폴드
다음 서열로 표현되는, 엔지니어링 된 crRNA 스캐폴드:
5'-[제5영역]-[제6영역]-3'
여기서, 상기 제5영역은 5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 5'-AAUGAAGGA-3', 5'-GAAUGAAGGA-3'(SEQ ID NO: 426), 5'-CGAAUGAAGGA-3'(SEQ ID NO: 427), 5'-ACGAAUGAAGGA-3'(SEQ ID NO: 428), 5'-GACGAAUGAAGGA-3'(SEQ ID NO: 429), 5'-AGACGAAUGAAGGA-3'(SEQ ID NO: 430), 5'-UAGACGAAUGAAGGA-3'(SEQ ID NO: 431), 5'-AUAGACGAAUGAAGGA-3'(SEQ ID NO: 432), 5'-AAUAGACGAAUGAAGGA-3'(SEQ ID NO: 433), 5'-GAAUAGACGAAUGAAGGA-3'(SEQ ID NO: 434), 5'-CGAAUAGACGAAUGAAGGA-3'(SEQ ID NO: 435), 5'-CCGAAUAGACGAAUGAAGGA-3'(SEQ ID NO: 436), 5'-CCCGAAUAGACGAAUGAAGGA-3'(SEQ ID NO: 437), 5'-ACCCGAAUAGACGAAUGAAGGA-3'(SEQ ID NO: 438), 5'-AACCCGAAUAGACGAAUGAAGGA-3'(SEQ ID NO: 439), 5'-GAACCCGAAUAGACGAAUGAAGGA-3'(SEQ ID NO: 440), 5'-AGAACCCGAAUAGACGAAUGAAGGA-3'(SEQ ID NO: 441), 5'-CAGAACCCGAAUAGACGAAUGAAGGA-3'(SEQ ID NO: 442), 5'-GCAGAACCCGAAUAGACGAAUGAAGGA-3'(SEQ ID NO: 443), 5'-UGCAGAACCCGAAUAGACGAAUGAAGGA-3'(SEQ ID NO: 444), 및 5'-UUGCAGAACCCGAAUAGACGAAUGAAGGA-3'(SEQ ID NO: 445)로 이뤄진 군에서 선택된 것이고,
상기 제6영역은 5'-AUGCAAC-3'이고,
상기 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 101) 및 5'-GAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 406)과 상이한 것을 특징으로 함.
실시예 24, 유사한 서열 포함
실시예 21 내지 23 중 어느 하나의 crRNA 스캐폴드 서열과 70% 이상, 71% 이상, 72% 이상, 73% 이상, 74% 이상, 75% 이상, 76% 이상, 77% 이상, 79% 이상, 79% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상 동일한 서열로 표현되는 crRNA 스캐폴드.
가이드 영역
실시예 25, 가이드 영역(스페이서 영역)
CEP290 유전자를 인식(recognizing), 결합(binding), 또는 타겟할 수 있는 가이드 영역(스페이서 영역).
실시예 26, 인트론 26 영역, 표적 서열
실시예 25에 있어서, CEP290 유전자의 IVS26 돌연변이(c.2991 + 1655A>G)를 포함하는 인트론 26 영역의 일부 영역에 존재하는 표적 서열과 상보적으로 결합할 수 있는 가이드 서열을 가지는 가이드 영역.
실시예 27, 인트론 26 영역, 프로토스페이서 서열
실시예 25에 있어서, CEP290 유전자의 IVS26 돌연변이(c.2991 + 1655A>G)를 포함하는 인트론 26 영역의 일부 영역에 존재하는 프로토스페이서 서열과 동일하거나 동등한(equivalent) 염기서열의 가이드 서열을 가지는 가이드 영역, 여기서, 상기 가이드 서열은 상기 프로토스페이서 서열의 염기서열 중 T를 U로 대체한 것임.
실시예 28, PAM 서열 인접
실시예 27에 있어서, 상기 프로토스페이서 서열은 실시예 1 내지 실시예 15 중 어느 하나의 Cas12f1 단백질이 인식하는 PAM 서열의 5'말단 및/또는 3'말단에 위치함.
실시예 29, PAM 서열 한정
실시예 28에 있어서, 상기 PAM 서열은 5'-TTTR-3'이고, 여기서, 상기 R은 A 또는 G임.
실시예 30, IVS26 Upstream
실시예 26에 있어서, 상기 인트론 26 영역의 일부 영역은 상기 CEP290 유전자의 엑손 26의 3'말단과 상기 CEP290 유전자의 상기 IVS26 돌연변이(c.2991 + 1655A>G) 사이의 영역임.
실시예 31, Upstream 1654bp
실시예 30에 있어서, 상기 인트론 26 영역의 일부 영역은 상기 IVS26 돌연변이(c.2991 + 1655A>G)를 기준으로, 상기 IVS26 돌연변이로부터 5'말단 방향으로 1bp 내지 1654bp 거리 범위 내의 뉴클레오타이드를 포함하는 영역(Upstream 1654bp 영역)임.
실시예 32, IVS26 Downstream
실시예 26에 있어서, 상기 인트론 26 영역의 일부 영역은 상기 CEP290 유전자의 상기 IVS26 돌연변이(c.2991 + 1655A>G)와 상기 CEP290 유전자의 엑손 27의 5'말단 사이의 영역임.
실시예 33, Downstream 2000bp
실시예 32에 있어서, 상기 인트론 26 영역의 일부 영역은 상기 IVS26 돌연변이(c.2991 + 1655A>G)를 기준으로, 상기 IVS26 돌연변이로부터 3'말단 방향으로 1bp 내지 2000bp 거리 범위 내의 뉴클레오타이드를 포함하는 영역(Downstream 2000bp 영역)임.
실시예 34, 표적 서열 한정
실시예 26에 있어서, 상기 표적 서열은 다음 중 선택된 뉴클레오타이드 서열임:
5'-TAAATAGGCATAATTTTCTA-3'(SEQ ID NO: 1); 5'-TTGCTTTCTGCTGCTTTTGC-3'(SEQ ID NO: 2); 5'-GTAGCTTTCAGGATTCCTAC-3'(SEQ ID NO: 3); 5'-GGAGCTTGTTCTGTCCTCAG-3'(SEQ ID NO: 4); 5'-GTTTAACGTTATCATTTTCC-3'(SEQ ID NO: 5); 5'-GCTCATAGAGACACATTCAG-3'(SEQ ID NO: 6); 5'-TTTCTGATGAGGAAGATGAA-3'(SEQ ID NO: 7); 5'-GATCTTAGATAAGAATAATC-3'(SEQ ID NO: 8); 5'-TTACTTCTAAATAATATTGA-3'(SEQ ID NO: 9); 5'-TGGACCATGGATGCACTCTG-3'(SEQ ID NO: 10); 5'-GCTACATCCATTCCAAGGAA-3'(SEQ ID NO: 11); 5'-TTTTCTCTTAGATGTCTGGT-3'(SEQ ID NO: 12); 5'-TGTAGAATTTTAATGTAGAA-3'(SEQ ID NO: 13); 5'-TCTTACCCCTGTACCCAGAA-3'(SEQ ID NO: 14); 5'-CTTGCATGATTTAGCTGAAT-3'(SEQ ID NO: 15); 5'-CAGAAGTCATTCAGCCACTA-3'(SEQ ID NO: 16); 5'-GTGTGTGTGTTATGTGGGAA-3'(SEQ ID NO: 17); 5'-TTATTCATTCAGTTTAGTTA-3'(SEQ ID NO: 18); 5'-GGGATTTGGCAGATTTTAAT-3'(SEQ ID NO: 19); 5'-CTGCCAAATCCCCCCAAACA-3'(SEQ ID NO: 20); 5'-CACAAGGTTCAAGAATCACA-3'(SEQ ID NO: 21); 5'-CATCATTTTTTATTGTAGAA-3'(SEQ ID NO: 22); 5'-GAATGTGTCTCTATGAGCCAG-3'(SEQ ID NO: 23); 5'-TAAGATCTAATTCTATTAGCT-3'(SEQ ID NO: 24); 5'-TCTCATGAACCTTTACCTCT-3'(SEQ ID NO: 25); 5'-TATTAGCTTGAACTCTGTGC-3'(SEQ ID NO: 26); 5'-CATTAAGGAAGACAGATATG-3'(SEQ ID NO: 27); 5'-CAGGAGTGACTTTGTTCCAT-3'(SEQ ID NO: 28); 5'-GCTACCGGTTACCTGAAGGG-3'(SEQ ID NO: 29); 5'-TGCCACAAGAATGATCATTC-3'(SEQ ID NO: 30); 5'-TCCCATGTGACTCCCCGCCT-3'(SEQ ID NO: 31); 5'-TATTGTTGCTTTTTGAGAGG-3'(SEQ ID NO: 32); 5'-GTGAATTTCTATTCCTGTTT-3'(SEQ ID NO: 33); 5'-GCATACTTTTTTTAATGGAA-3'(SEQ ID NO: 34); 5'-CTCAACACACAGAAACAAAT-3'(SEQ ID NO: 35); 5'-GAATAGATAATAAGGAAATA-3'(SEQ ID NO: 36); 5'-TTTCTTTTTTCTTCTACTAT-3'(SEQ ID NO: 37); 5'-CCTGTGTTTCAAGGGGATCT-3'(SEQ ID NO: 38); 5'-CCCTTGAAACACAGGAATTG-3'(SEQ ID NO: 39); 5'-TAAGCAATGGATTTCAGTGA-3'(SEQ ID NO: 40); 5'-CAATGGATTTCAGTGATAAA-3'(SEQ ID NO: 41); 5'-TATTTTCCAGGTACTCCACT-3'(SEQ ID NO: 42); 5'-TACAAACAGGGTAATGAGAC-3'(SEQ ID NO: 43); 5'-TCCTGTGTATTCATAGTATA-3'(SEQ ID NO: 44); 5'-GATAATCCTATTGTTTGTTA-3'(SEQ ID NO: 45); 5'-CACTCTCTCCCTAGTAACTC-3'(SEQ ID NO: 46); 5'-GAAACTTCACTGGTCTCCTT-3'(SEQ ID NO: 47); 5'-CTGGCGGATTACCTGAGATC-3'(SEQ ID NO: 48); 5'-CTATAATTATGTACTTTACT-3'(SEQ ID NO: 49); 및 5'-CATGTTGGCCGGGCTGGTCT-3'(SEQ ID NO: 50)
실시예 35, 가이드 서열 길이
실시예 26 내지 실시예 34 중 어느 하나에 있어서, 상기 가이드 서열의 길이는 15nt, 16nt, 17nt, 18nt, 19nt, 20nt, 21nt, 22nt, 23nt, 24nt, 25nt, 26nt, 27nt, 28nt, 29nt, 30nt, 31nt, 32nt, 33nt, 34nt, 35nt, 36nt, 37nt, 38nt, 39nt, 40nt, 또는 전술한 두 개의 수치범위 내의 길이를 가지는 가이드 영역.
실시예 36, 표적 서열 미스매치
실시예 26 내지 실시예 34 중 어느 하나에 있어서, 상기 가이드 서열은 상기 표적 서열에 대해 0개, 1개, 2개, 3개, 4개, 5개, 또는 전술한 두 개의 수치범위 내의 미스매치된(mismatched) 뉴클레오타이드 서열을 포함하는 가이드 영역.
실시예 37, 가이드 서열 예시
실시예 26에 있어서, 상기 가이드 서열은 다음 중 선택된 뉴클레오타이드 서열임:
5'-UAGAAAAUUAUGCCUAUUUA-3'(SEQ ID NO: 51); 5'-GCAAAAGCAGCAGAAAGCAA-3'(SEQ ID NO: 52); 5'-GUAGGAAUCCUGAAAGCUAC-3'(SEQ ID NO: 53); 5'-CUGAGGACAGAACAAGCUCC-3'(SEQ ID NO: 54); 5'-GGAAAAUGAUAACGUUAAAC-3'(SEQ ID NO: 55); 5'-CUGAAUGUGUCUCUAUGAGC-3'(SEQ ID NO: 56); 5'-UUCAUCUUCCUCAUCAGAAA-3'(SEQ ID NO: 57); 5'-GAUUAUUCUUAUCUAAGAUC-3'(SEQ ID NO: 58); 5'-UCAAUAUUAUUUAGAAGUAA-3'(SEQ ID NO: 59); 5'-CAGAGUGCAUCCAUGGUCCA-3'(SEQ ID NO: 60); 5'-UUCCUUGGAAUGGAUGUAGC-3'(SEQ ID NO: 61); 5'-ACCAGACAUCUAAGAGAAAA-3'(SEQ ID NO: 62); 5'-UUCUACAUUAAAAUUCUACA-3'(SEQ ID NO: 63); 5'-UUCUGGGUACAGGGGUAAGA-3'(SEQ ID NO: 64); 5'-AUUCAGCUAAAUCAUGCAAG-3'(SEQ ID NO: 65); 5'-UAGUGGCUGAAUGACUUCUG-3'(SEQ ID NO: 66); 5'-UUCCCACAUAACACACACAC-3'(SEQ ID NO: 67); 5'-UAACUAAACUGAAUGAAUAA-3'(SEQ ID NO: 68); 5'-AUUAAAAUCUGCCAAAUCCC-3'(SEQ ID NO: 69); 5'-UGUUUGGGGGGAUUUGGCAG-3'(SEQ ID NO: 70); 5'-UGUGAUUCUUGAACCUUGUG-3'(SEQ ID NO: 71); 5'-UUCUACAAUAAAAAAUGAUG-3'(SEQ ID NO: 72); 5'-CUGGCUCAUAGAGACACAUUC-3'(SEQ ID NO: 73); 5'-AGCUAAUAGAAUUAGAUCUUA-3'(SEQ ID NO: 74); 5'-AGAGGUAAAGGUUCAUGAGA-3'(SEQ ID NO: 75); 5'-GCACAGAGUUCAAGCUAAUA-3'(SEQ ID NO: 76); 5'-CAUAUCUGUCUUCCUUAAUG-3'(SEQ ID NO: 77); 5'-AUGGAACAAAGUCACUCCUG-3'(SEQ ID NO: 79); 5'-CCCUUCAGGUAACCGGUAGC-3'(SEQ ID NO: 79); 5'-GAAUGAUCAUUCUUGUGGCA-3'(SEQ ID NO: 80); 5'-AGGCGGGGAGUCACAUGGGA-3'(SEQ ID NO: 81); 5'-CCUCUCAAAAAGCAACAAUA-3'(SEQ ID NO: 82); 5'-AAACAGGAAUAGAAAUUCAC-3'(SEQ ID NO: 83); 5'-UUCCAUUAAAAAAAGUAUGC-3'(SEQ ID NO: 84); 5'-AUUUGUUUCUGUGUGUUGAG-3'(SEQ ID NO: 85); 5'-UAUUUCCUUAUUAUCUAUUC-3'(SEQ ID NO: 86); 5'-AUAGUAGAAGAAAAAAGAAA-3'(SEQ ID NO: 87); 5'-AGAUCCCCUUGAAACACAGG-3'(SEQ ID NO: 88); 5'-CAAUUCCUGUGUUUCAAGGG-3'(SEQ ID NO: 89); 5'-UCACUGAAAUCCAUUGCUUA-3'(SEQ ID NO: 90); 5'-UUUAUCACUGAAAUCCAUUG-3'(SEQ ID NO: 91); 5'-AGUGGAGUACCUGGAAAAUA-3'(SEQ ID NO: 92); 5'-GUCUCAUUACCCUGUUUGUA-3'(SEQ ID NO: 93); 5'-UAUACUAUGAAUACACAGGA-3'(SEQ ID NO: 94); 5'-UAACAAACAAUAGGAUUAUC-3'(SEQ ID NO: 95); 5'-GAGUUACUAGGGAGAGAGUG-3'(SEQ ID NO: 96); 5'-AAGGAGACCAGUGAAGUUUC-3'(SEQ ID NO: 97); 5'-GAUCUCAGGUAAUCCGCCAG-3’(SEQ ID NO: 98); 5'-AGUAAAGUACAUAAUUAUAG-3'(SEQ ID NO: 99); 5'-AGACCAGCCCGGCCAACAUG-3'(SEQ ID NO: 101); 5'-CAGAGUGCAUCCAUGGUCC-3'(SEQ ID NO: 245); 5'-CAGAGUGCAUCCAUGGUCCAG-3'(SEQ ID NO: 246); 5'-CAGAGUGCAUCCAUGGUCCAGG-3'(SEQ ID NO: 247); 5'-CAGAGUGCAUCCAUGGUCCAGGA-3'(SEQ ID NO: 248); 5'-CAGAGUGCAUCCAUGGUCCAGGAA-3'(SEQ ID NO: 249); 5'-CAGAGUGCAUCCAUGGUCCAGGAAG-3'(SEQ ID NO: 250); 5'-UUCUGGGUACAGGGGUAAG-3'(SEQ ID NO: 251); 5'-UUCUGGGUACAGGGGUAAGAG-3'(SEQ ID NO: 252); 5'-UUCUGGGUACAGGGGUAAGAGA-3'(SEQ ID NO: 253); 5'-UUCUGGGUACAGGGGUAAGAGAA-3'(SEQ ID NO: 254); 5'-UUCUGGGUACAGGGGUAAGAGAAA-3'(SEQ ID NO: 255); 5'-UUCUGGGUACAGGGGUAAGAGAAAG-3'(SEQ ID NO: 256); 5'-CCCUUCAGGUAACCGGUAG-3'(SEQ ID NO: 257); 5'-CCCUUCAGGUAACCGGUAGCUUUUG-3'(SEQ ID NO: 258); 5'-AGGCGGGGAGUCACAUGGG-3'(SEQ ID NO: 259); 5'-AGGCGGGGAGUCACAUGGGAG-3'(SEQ ID NO: 260); 5'-AGGCGGGGAGUCACAUGGGAGUC-3'(SEQ ID NO: 261); 5'-AGGCGGGGAGUCACAUGGGAGUCA-3'(SEQ ID NO: 262); 5'-AGGCGGGGAGUCACAUGGGAGUCAC-3'(SEQ ID NO: 263); 5'-AGUGGAGUACCUGGAAAAUAA-3'(SEQ ID NO: 264); 5'-AGUGGAGUACCUGGAAAAUAAG-3'(SEQ ID NO: 265); 5'-AGUGGAGUACCUGGAAAAUAAGC-3'(SEQ ID NO: 266); 5'-AGUGGAGUACCUGGAAAAUAAGCC-3'(SEQ ID NO: 267); 5'-AGUGGAGUACCUGGAAAAUAAGCCA-3'(SEQ ID NO: 268); 5'-GAGUUACUAGGGAGAGAGUGA-3'(SEQ ID NO: 269); 5'-GAGUUACUAGGGAGAGAGUGAUG-3'(SEQ ID NO: 270); 5'-GAGUUACUAGGGAGAGAGUGAUGA-3'(SEQ ID NO: 271); 및 5'-GAGUUACUAGGGAGAGAGUGAUGAA-3'(SEQ ID NO: 272).
실시예 38, 유사한 서열 포함
실시예 25 내지 37 중 어느 하나의 가이드 서열과 70% 이상, 71% 이상, 72% 이상, 73% 이상, 74% 이상, 75% 이상, 76% 이상, 77% 이상, 79% 이상, 79% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상 동일한 뉴클레오타이드 서열을 가지는 가이드 서열을 포함하는 가이드 영역.
U-rich tail
실시예 39, U-rich tail 서열 예시
다음 중 선택된 서열로 표현되는 U-rich tail:
5'-(UaN)dUe-3';
5'-UaVUaVUe-3'; 및
5'-UaVUaVUaVUe-3',
여기서, 상기 N은 A, C, G 또는 U이고, 상기 각각의 V는 각각 독립적으로 A, C 또는 G이며,
상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 1 내지 10의 정수임.
가이드 RNA
실시예 40, 듀얼 가이드 RNA
다음을 포함하는 가이드 RNA:
crRNA 스캐폴드 및 tracrRNA 스캐폴드를 포함하는 스캐폴드 영역;
가이드 영역; 및
선택적으로, U-rich tail,
여기서, 상기 스캐폴드 영역은 Cas12f1 단백질과 상호작용할 수 있는 영역이고,
상기 스캐폴드 영역은 상기 가이드 영역의 5' 말단에 위치하고,
상기 가이드 영역은 CEP290 유전자에 존재하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 가지고,
상기 가이드 RNA가 U-rich tail을 포함하는 경우, 상기 U-rich tail은 상기 가이드 RNA의 3' 말단에 위치함.
실시예 41, 싱글 가이드 RNA
실시예 40에 있어서, 상기 가이드 RNA의 스캐폴드 영역은 링커를 추가로 더 포함하며, 상기 스캐폴드 영역의 5'말단에서 3'말단 방향으로, tracrRNA 스캐폴드, 링커, 및 crRNA 스캐폴드가 차례대로 연결된 가이드 RNA.
실시예 42, crRNA 스캐폴드 예시
실시예 40 내지 실시예 41 중 어느 하나에 있어서, 상기 crRNA 스캐폴드는 실시예 21 내지 실시예 24 중 어느 하나의 crRNA 스캐폴드임.
실시예 43, tracrRNA 스캐폴드 예시
실시예 40 내지 실시예 42 중 어느 하나에 있어서, 상기 tracrRNA 스캐폴드는 실시예 16 내지 실시예 20 중 어느 하나의 tracrRNA 스캐폴드임.
실시예 44, 가이드 영역 예시
실시예 40 내지 실시예 43 중 어느 하나에 있어서, 상기 가이드 영역은 실시예 25 내지 실시예 38 중 어느 하나의 가이드 영역임.
실시예 45, U-rich tail 예시
실시예 40 내지 실시예 44 중 어느 하나에 있어서, 상기 U-rich tail은 실시예 39의 U-rich tail임.
실시예 46, 가이드 RNA, 가이드 RNA 구조식
다음 서열로 표현되는 가이드 RNA:
5'-[tracrRNA 스캐폴드 서열]-[링커 서열]-[crRNA 스캐폴드 서열]-[가이드 서열]-[U-rich tail 서열]-3',
여기서, 상기 tracrRNA 스캐폴드 서열은 실시예 16 내지 실시예 20 중 어느 하나의 tracrRNA 스캐폴드의 서열이고,
상기 링커 서열은 부존재할 수 있고,
상기 crRNA 스캐폴드 서열은 실시예 21 내지 실시예 24 중 어느 하나의 crRNA 스캐폴드의 서열이고,
상기 가이드 서열은 실시예 26 내지 실시예 38 중 어느 하나의 가이드 영역의 가이드 서열이고,
상기 U-rich tail 서열은 부존재하거나, 실시예 39의 U-rich tail의 서열이며,
이때, 상기 링커 서열이 부존재하는 경우 상기 가이드 RNA는 두 분자의 듀얼 가이드 RNA이고,
상기 링커 서열이 존재하는 경우 상기 가이드 RNA는 한 분자의 싱글 가이드 RNA임.
실시예 47, 링커 한정
실시예 46에 있어서, 상기 링커는 5'-GAAA-3'임.
실시예 48, 유사한 서열 포함
실시예 40 내지 48 중 어느 하나의 가이드 RNA와 70% 이상, 71% 이상, 72% 이상, 73% 이상, 74% 이상, 75% 이상, 76% 이상, 77% 이상, 79% 이상, 79% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상 동일한 뉴클레오타이드 서열을 가지는 가이드 RNA.
실시예 49, 가이드 RNA를 암호화하는 DNA
실시예 40 내지 48 중 어느 하나에서 선택된 가이드 RNA를 암호화하는 DNA.
추가 구성요소
실시예 50, 비-상동성 말단-결합 활성 감소 인자
비-상동성 말단-결합(Non-homologous end joining DNA repair pathway; NHEJ) 활성 감소 인자.
실시예 51, 활성 감소 표적
실시예 50에 있어서, 상기 NHEJ 활성 감소 인자는 MRE11, RAD50, NBS1, DNA-PK, CtIP, Ku70, Ku80, 아르테미스(DCLRE1C), 리가제 IV (Lig4), PNKP, XRCC4, XLF(XRCC4-like factor), ATM(ATM Serine/Threonine Kinase), CHK1/CHK2, CLF(CURLY LEAF), Pol Mu(POLM), ATM1, XRCC4, XLF, XRCC6, LIG4 및 DCLRE1C 중 선택된 하나 이상의 유전자의 발현 또는 활성을 감소 또는 제거할 수 있는 것임.
실시예 52, interference nucleic acid
실시예 51에 있어서, 상기 NHEJ 활성 감소 인자는 짧은 간섭 RNA(siRNA), 이중가닥 RNA(dsRNA), 마이크로 RNA(miRNA), 유전자 전사체에 특이적인 짧은 헤어핀 RNA(shRNA), 및 안티센스 뉴클레오타이드 중 선택된 것임.
실시예 53, shRNA 서열
실시예 50 내지 52 중 어느 하나에 있어서, 상기 NHEJ 활성 감소 인자는 다음 중 선택된 서열로 표현되는 shRNA임:
5'-GGAGCCAGAUAGUUUGUAUUUCAAGAGAAUACAAACUAUCUGGCUCC-3'(SEQ ID NO: 446); 5'-GCAAGCAGCUGAAACAAAUUUCAAGAGAAUUUGUUUCAGCUGCUUGC-3'(SEQ ID NO: 447); 5'-GGAGCUGAUUGUAGCAACAUUCAAGAGAUGUUGCUACAAUCAGCUCC-3'(SEQ ID NO: 448); 5'-GCACAGAAGUGCCUCCAAUUUCAAGAGAAUUGGAGGCACUUCUGUGC-3'(SEQ ID NO: 449); 5'-GGACAUAGUUUCUGGGAGAUUCAAGAGAUCUCCCAGAAACUAUGUCC-3'(SEQ ID NO: 450); 5'-GGAUGACACUGGCACAUUAUUCAAGAGAUAAUGUGCCAGUGUCAUCC-3'(SEQ ID NO: 451); 5'-GGAGAGUACUGAUGAGGAAUUCAAGAGAUUCCUCAUCAGUACUCUCC-3'(SEQ ID NO: 452); 5'-GAAUCCACCUUGUUUCUGAUUCAAGAGAUCAGAAACAAGGUGGAUUC-3'(SEQ ID NO: 453); 5'-GUACAAGUAUCUUGGGAGAUUCAAGAGAUCUCCCAAGAUACUUGUAC-3'(SEQ ID NO: 454); 5'-GAAUGCAGCUCAAGAACGAUUCAAGAGAUCGUUCUUGAGCUGCAUUC-3'(SEQ ID NO: 455); 5'-GCAUGAGUCUGGCAUUACAUUCAAGAGAUGUAAUGCCAGACUCAUGC-3'(SEQ ID NO: 456); 5'-GAAAGCCCUUUGUCAUGAAUUCAAGAGAUUCAUGACAAAGGGCUUUC-3'(SEQ ID NO: 457); 5'-GAACAGUGCUUCCCUGCAAUUCAAGAGAUUGCAGGGAAGCACUGUUC-3'(SEQ ID NO: 458); 5'-GGAAAGACCUAGAGAUCCAUUCAAGAGAUGGAUCUCUAGGUCUUUCC-3'(SEQ ID NO: 459); 5'-GUAUGGCAGUCACCACACAUUCAAGAGAUGUGUGGUGACUGCCAUAC-3'(SEQ ID NO: 460); 5'-GCAGCAUUGUGCAGAUACAUUCAAGAGAUGUAUCUGCACAAUGCUGC-3'(SEQ ID NO: 461); 5'-GCAGGAACAUCCCUCCUUAUUCAAGAGAUAAGGAGGGAUGUUCCUGC-3'(SEQ ID NO: 462); 5'-GCAGUGCUCUGCUCAUCAAUUCAAGAGAUUGAUGAGCAGAGCACUGC-3'(SEQ ID NO: 463); 5'-GGAUCAUGCUGUUCACCAAUUCAAGAGAUUGGUGAACAGCAUGAUCC-3'(SEQ ID NO: 464); 5'-GGAUCUGACUACUCACUCAUUCAAGAGAUGAGUGAGUAGUCAGAUCC-3'(SEQ ID NO: 465); 5'-GCACAAAGAUGGAGAUGUAUUCAAGAGAUACAUCUCCAUCUUUGUGC-3'(SEQ ID NO: 466); 5'-GCAGACACGUACUGUGUAAUUCAAGAGAUUACACAGUACGUGUCUGC-3'(SEQ ID NO: 467); 5'-GGAGCAGACUCCUGAAGAAUUCAAGAGAUUCUUCAGGAGUCUGCUCC-3'(SEQ ID NO: 468); 5'-GGAGGAUUCUGAUCUGCAAUUCAAGAGAUUGCAGAUCAGAAUCCUCC-3'(SEQ ID NO: 469); 5'-GCAUGAUCCUUCUGUAGGAUUCAAGAGAUCCUACAGAAGGAUCAUGC-3'(SEQ ID NO: 470); 5'-GGAGACUCCUACCCAGAUAUUCAAGAGAUAUCUGGGUAGGAGUCUCC-3'(SEQ ID NO: 471); 5'-GGACAAAGCUGACUACAGAUUCAAGAGAUCUGUAGUCAGCUUUGUCC-3'(SEQ ID NO: 472); 5'-GCAGAGCUCUCGUUUCACAUUCAAGAGAUGUGAAACGAGAGCUCUGC-3'(SEQ ID NO: 473); 5'-GGACUCUGAUGGAGAAUCAUUCAAGAGAUGAUUCUCCAUCAGAGUCC-3'(SEQ ID NO: 474); 및 5'-GCAGAAUUCUUCCCAGUCAUUCAAGAGAUGACUGGGAAGAAUUCUGC-3'(SEQ ID NO: 475).
가이드 RNA-Cas12f1 단백질 복합체
실시예 54, 수 한정 없음
다음을 포함하는 가이드 RNA-Cas12f1 단백질 복합체:
실시예 1 내지 실시예 15 중 어느 하나의 Cas12f1 단백질; 및
실시예 40 내지 실시예 48 중 어느 하나의 가이드 RNA.
실시예 55, 이량체 형태
다음을 포함하는 가이드 RNA-Cas12f1 단백질 복합체:
제1 Cas12f1 단백질;
제2 Cas12f1 단백질; 및
실시예 40 내지 실시예 48 중 어느 하나의 가이드 RNA,
여기서, 상기 제1 Cas12f1 단백질 및 제2 Cas12f1 단백질은 각각 독립적으로, 실시예 1 내지 실시예 15 중 선택된 어느 하나이고,
상기 제1 Cas12f1 단백질 및 상기 제2 Cas12f1 단백질이 이량체를 형성하는 특징을 가짐.
CRISPR/Cas12f1 시스템 벡터
실시예 56, 하나 이상의 가이드 RNA
다음을 포함하는 벡터:
실시예 1 내지 실시예 15 중 선택된 어느 하나의 Cas12f1 단백질을 암호화하는 핵산;
실시예 40 내지 실시예 48 중 선택된 하나 이상의 가이드 RNA를 암호화하는 핵산.
실시예 57, 2개의 가이드 RNA
다음을 포함하는 벡터:
실시예 1 내지 실시예 15 중 선택된 어느 하나의 Cas12f1 단백질을 암호화하는 핵산;
제1 가이드 RNA를 암호화하는 핵산;
제2 가이드 RNA를 암호화하는 핵산,
여기서, 상기 제1 가이드 RNA 및 상기 제2 가이드 RNA는 각각 독립적으로 실시예 40 내지 실시예 48 중 어느 하나에서 선택된 가이드 RNA임.
실시예 58, 각각의 가이드 RNA 표적 영역 한정
실시예 57에 있어서,
상기 제1 가이드 RNA의 가이드 영역은 CEP290 유전자의 엑손 26의 3'말단과 상기 CEP290 유전자의 상기 IVS26 돌연변이(c.2991 + 1655A>G) 사이의 영역을 인식, 결합, 또는 타겟할 수 있는 것이고,
상기 제2 가이드 RNA의 가이드 영역은 상기 CEP290 유전자의 상기 IVS26 돌연변이(c.2991 + 1655A>G)와 상기 CEP290 유전자의 엑손 27의 5'말단 사이의 영역을 인식, 결합, 또는 타겟할 수 있는 것이고,
이로 인해, 상기 CEP290 유전자의 인트론 26 영역 중 상기 IVS26 돌연변이(c.2991 + 1655A>G)를 포함하는 일부 핵산 서열의 제거 또는 역위가 유도될 수 있음.
실시예 59, 각각의 가이드 RNA 표적 서열 한정
실시예 58에 있어서,
상기 제1 가이드 RNA의 가이드 영역은 서열번호 51 내지 서열번호 74, 및 서열번호 245 내지 서열번호 256 중 선택된 서열로 표현되고,
상기 제2 가이드 RNA의 가이드 영역은 서열번호 75 내지 서열번호 101, 및 서열번호 257 내지 서열번호 272 중 선택된 서열로 표현됨.
실시예 60, 추가 구성 포함
실시예 56 내지 실시예 59 중 어느 하나에 있어서, 상기 벡터는 하나 이상의 NHEJ 활성 감소 인자를 암호화하는 핵산을 추가로 포함하고, 상기 하나 이상의 NHEJ 활성 감소 인자는 각각 독립적으로 실시예 50 내지 실시예 53 중 어느 하나에서 선택됨.
실시예 61, 추가 구성, 개수 표현 한정
실시예 56 내지 실시예 57 중 어느 하나에 있어서, 상기 벡터는 다음을 추가로 포함함:
제1 NHEJ 활성 감소 인자를 암호화하는 핵산;
선택적으로, 제2 NHEJ 활성 감소 인자를 암호화하는 핵산;
선택적으로, 제3 NHEJ 활성 감소 인자를 암호화하는 핵산;
선택적으로, 제4 NHEJ 활성 감소 인자를 암호화하는 핵산; 및
선택적으로, 제5 NHEJ 활성 감소 인자를 암호화하는 핵산,
여기서, 상기 제1 NHEJ 활성 감소 인자, 상기 제2 NHEJ 활성 감소 인자, 상기 제3 NHEJ 활성 감소 인자, 상기 제4 NHEJ 활성 감소 인자, 및 상기 제5 NHEJ 활성 감소 인자는 각각 독립적으로 실시예 50 내지 실시예 53 중 어느 하나에서 선택됨.
실시예 62, 프로모터 포함
실시예 56 내지 실시예 61 중 어느 하나에 있어서, 상기 벡터는 다음을 추가로 포함함:
상기 Cas12f1 단백질을 암호화하는 핵산을 위한 프로모터;
상기 가이드 RNA를 암호화하는 핵산을 위한 프로모터,
여기서, 상기 가이드 RNA를 암호화하는 핵산이 복수개인 경우, 각각의 가이드 RNA를 암호화하는 핵산을 위한 프로모터를 포함함; 및
상기 벡터가 하나 이상의 NHEJ 활성 감소 인자를 암호화하는 핵산을 포함하는 경우, 상기 NHEJ 활성 감소 인자를 암호화하는 핵산을 위한 프로모터,
여기서, 상기 NHEJ 활성 감소 인자를 암호화하는 핵산이 복수개인 경우, 각각의 NHEJ 활성 감소 인자를 암호화하는 핵산을 위한 프로모터를 포함함.
실시예 63, 프로모터 예시
실시예 62에 있어서, 상기 프로모터는 각각 독립적으로, U6 프로모터, H1 프로모터, 7SK 프로모터, CMV 프로모터,LTR 프로모터, Ad MLP 프로모터, HSV 프로모터, SV40 프로모터, CBA 프로모터, 및 RSV 프로모터 중 선택됨.
실시예 64, 벡터 종류 한정
실시예 56 내지 실시예 63 중 어느 하나에 있어서, 상기 벡터는 플라스미드, mRNA(전사물), PCR 엠플리콘 및 바이러스 벡터 중 선택됨.
실시예 65, 바이러스 벡터 종류 한정
실시예 64에 있어서, 상기 벡터는 레트로바이러스 벡터(retroviral(retrovirus) vector), 렌티바이러스 벡터(lentiviral(lentivirus) vector), 아데노바이러스 벡터(adenoviral(adenovirus vector), 아데노-연관 바이러스 벡터(adeno-associated viral (adeno-associated virus; AAV) vector), 백시니아바이러스 벡터(vaccinia viral(vaccinia virus) vector), 폭스바이러스 벡터(poxviral(poxvirus) vector), 및 단순포진 바이러스 벡터(herpes simplex viral(herpes simplex virus) vector) 중 선택되는 바이러스 벡터임.
실시예 66, 단일 벡터 한정
실시예 56 내지 65 중 어느 하나에 있어서, 상기 벡터는 단일 벡터(single vector)임.
실시예 67, 복수의 벡터
실시예 56 내지 65 중 어느 하나에 있어서, 상기 벡터는 두개 이상의 벡터를 포함함.
CRISPR/Cas12f1 조성물
실시예 68, CRISPR/Cas12f1 조성물, 하나 이상의 가이드 RNA
다음을 포함하는 CRISPR/Cas12f1 조성물:
실시예 1 내지 실시예 15 중 선택된 어느 하나의 Cas12f1 단백질, 또는 상기 Cas12f1 단백질을 암호화하는 핵산; 및
실시예 40 내지 실시예 48 중 선택된 하나 이상의 가이드 RNA, 또는 상기 가이드 RNA를 암호화하는 핵산,
여기서, 상기 가이드 RNA는 CEP290 유전자를 인식하거나, 상기 CEP290 유전자에 결합하거나, 및/또는 상기 CEP290 유전자를 타겟할 수 있음.
실시예 69, CRISPR/Cas12f1 조성물, 2개의 가이드 RNA
다음을 포함하는 CRISPR/Cas12f1 조성물:
실시예 1 내지 실시예 15 중 선택된 어느 하나의 Cas12f1 단백질, 또는 상기 Cas12f1 단백질을 암호화하는 핵산;
제1 가이드 RNA 또는 상기 제1 가이드 RNA를 암호화하는 핵산; 및
제2 가이드 RNA 또는 상기 제2 가이드 RNA를 암호화하는 핵산,
여기서, 상기 제1 가이드 RNA 및 상기 제2 가이드 RNA는 각각 독립적으로 실시예 40 내지 실시예 48 중 선택된 어느 하나의 가이드 RNA이고,
여기서, 상기 제1 가이드 RNA 및 상기 제2 가이드 RNA는 각각 독립적으로 CEP290 유전자를 인식하거나, 상기 CEP290 유전자에 결합하거나, 및/또는 상기 CEP290 유전자를 타겟할 수 있음.
실시예 70, 표적 영역 한정
실시예 69에 있어서,
상기 제1 가이드 RNA의 가이드 영역은 CEP290 유전자의 엑손 26의 3'말단과 상기 CEP290 유전자의 상기 IVS26 돌연변이(c.2991 + 1655A>G) 사이의 영역을 인식, 결합, 또는 타겟할 수 있는 것이고,
상기 제2 가이드 RNA의 가이드 영역은 상기 CEP290 유전자의 상기 IVS26 돌연변이(c.2991 + 1655A>G)와 상기 CEP290 유전자의 엑손 27의 5'말단 사이의 영역을 인식, 결합, 또는 타겟할 수 있는 것이고,
이로 인해, 상기 CEP290 유전자의 인트론 26 영역 중 상기 IVS26 돌연변이(c.2991 + 1655A>G)를 포함하는 일부 핵산 서열의 제거 또는 역위가 유도될 수 있음.
실시예 71, 표적 서열 한정
실시예 69에 있어서,
상기 제1 가이드 RNA의 가이드 영역은 서열번호 51 내지 서열번호 74, 및 서열번호 245 내지 서열번호 256 중 선택된 서열로 표현되고,
상기 제2 가이드 RNA의 가이드 영역은 서열번호 75 내지 서열번호 101, 및 서열번호 257 내지 서열번호 272 중 선택된 서열로 표현됨.
실시예 72, RNP, 가이드 RNA 1종류
실시예 68에 있어서, 상기 CRISPR/Cas12f1 조성물은 상기 Cas12f1 단백질 및 상기 가이드 RNA를 포함하고, 여기서, 상기 Cas12f1 단백질 및 상기 가이드 RNA는 리보뉴클레오프로틴(ribonucleoprotein; RNP)을 형성하고 있음.
실시예 73, RNP 실시예 한정
실시예 72에 있어서, 상기 리보뉴클레오프로틴은 실시예 54 내지 실시예 55 중 어느 하나에서 선택된 가이드 RNA-Cas12f1 단백질 복합체임.
실시예 74, 벡터, 가이드 RNA 1종류
실시예 68에 있어서, 상기 CRISPR/Cas12f1 조성물은 상기 Cas12f1 단백질을 암호화하는 핵산 및 상기 가이드 RNA를 암호화하는 핵산을 포함함.
실시예 75, 벡터 실시예 한정
실시예 73에 있어서, 상기 Cas12f1 단백질을 암호화하는 핵산 및 상기 가이드 RNA를 암호화하는 핵산은 실시예 56 내지 실시예 67 중 어느 하나에서 선택된 벡터를 포함함.
실시예 76, RNP 2종류
실시예 69 내지 실시예 71 중 어느 하나에 있어서, 상기 CRISPR/Cas12f1 조성물은 상기 Cas12f1 단백질 및 상기 제1 가이드 RNA가 결합한 제1 리보뉴클레오프로틴(ribonucleoprotein; RNP) 및 상기 Cas12f1 단백질 및 상기 제2 가이드 RNA가 결합한 제2 리보뉴클레오프로틴(ribonucleoprotein; RNP)을 포함함.
실시예 77, RNP 실시예 한정
실시예 76에 있어서, 상기 제1 리보뉴클레오프로틴 및 상기 제2 리보뉴클레오프로틴은 각각 독립적으로 실시예 54 내지 실시예 55 중 어느 하나의 가이드 RNA-Cas12f1 단백질 복합체임.
실시예 78, 벡터, 가이드 RNA 2종류
실시예 69 내지 실시예 71 중 어느 하나에 있어서, 상기 CRISPR/Cas12f1 조성물은 상기 Cas12f1 단백질을 암호화하는 핵산, 상기 제1 가이드 RNA를 암호화하는 핵산, 및 상기 제2 가이드 RNA를 암호화하는 핵산을 포함함.
실시예 79, 벡터 실시예 한정
실시예 68에 있어서, 상기 CRISPR/Cas12f1 조성물은 실시예 56 내지 실시예 66 중 어느 하나에서 선택된 벡터를 포함함.
실시예 80, 추가 구성 포함, 하나 이상
실시예 68 내지 79 중 어느 하나에 있어서, 상기 CRISPR/Cas12f1 조성물은 추가적으로 다음을 포함함:
하나 이상의 NHEJ 활성 감소 인자, 또는 상기 NHEJ 활성 감소 인자를 암호화하는 핵산.
상기 NHEJ 활성 감소 인자 각각 독립적으로 실시예 50 내지 실시예 53 중 선택된 것임.
실시예 81, 추가 구성 포함, 개수 표현 한정
실시예 68 내지 79 중 어느 하나에 있어서, 상기 CRISPR/Cas12f1 조성물은 추가적으로 다음을 포함함:
제1 NHEJ 활성 감소 인자, 또는 상기 제1 NHEJ 활성 감소 인자를 암호화하는 핵산;
선택적으로, 제2 NHEJ 활성 감소 인자 또는 상기 제2 NHEJ 활성 감소 인자를 암호화하는 핵산;
선택적으로, 제3 NHEJ 활성 감소 인자 또는 상기 제3 NHEJ 활성 감소 인자를 암호화하는 핵산;
선택적으로, 제4 NHEJ 활성 감소 인자 또는 상기 제4 NHEJ 활성 감소 인자를 암호화하는 핵산; 및
선택적으로, 제5 NHEJ 활성 감소 인자 또는 상기 제5 NHEJ 활성 감소 인자를 암호화하는 핵산,
여기서, 상기 제1 NHEJ 활성 감소 인자, 상기 제2 NHEJ 활성 감소 인자, 상기 제3 NHEJ 활성 감소 인자, 상기 제4 NHEJ 활성 감소 인자, 및 상기 제5 NHEJ 활성 감소 인자는 각각 독립적으로 실시예 50 내지 실시예 53 중 어느 하나에서 선택된 것임.
LCA10 질환 치료용 약학적 조성물
실시예 82, 약학적 조성물
다음을 포함하는, LCA10 질환 치료용 약학적 조성물:
실시예 68 내지 실시예 81 중 어느 하나의 CRISPR/Cas12f1 조성물; 및
선택적으로, 약학적으로 허용되는 담체.
실시예 83, 약학적으로 허용되는 담체 예시
실시예 82에 있어서, 상기 약학적으로 허용되는 담체는 다음에서 선택된 하나 이상임:
물, 식염수, 에탄올, 글리세롤, 락토오스, 수크로오스, 인산칼슘, 젤라틴, 덱스트란, 한천, 펙틴, 땅콩유, 참기름 등의 담체; 락토오스, 사카로오스, 솔비톨, 만니톨, 전분, 아밀로펙틴, 셀룰로오스 또는 젤라틴 등과 같은 결합제; 디칼슘 포스페이트 등과 같은 부형제; 옥수수 전분 또는 고구마 전분 등과 같은 붕해제; 스테아르산 마그네슘, 스테아르산 칼슘, 스테아릴 푸마르산 나트륨 또는 폴리에틸렌 글리콜 왁스 등과 같은 윤활유; 감미제; 방향제; 시럽제; 지방유와 같은 액체 담체; 멸균된 수용액; 프로필렌글리콜; 폴리에틸렌글리콜; 에틸올레이트와 같은 주사 가능한 에스테르; 현탁제; 유제; 동결 건조 제제; 외용제; 안정제; 완충제; 동물성 유; 식물성 유; 왁스; 파라핀; 전분; 트라칸트; 셀룰로오스 유도체; 폴리에틸렌 글리콜; 실리콘; 벤토나이트; 실리카; 탈크; 산화 아연.
LCA10 질환 치료방법
실시예 84, LCA10 질환 치료방법
다음을 포함하는 LCA10 질환 치료방법:
실시예 82 내지 실시예 83의 약학적 조성물을 대상체에 투여하는 것,
여기서, 상기 약학적 조성물에 포함된 CRISPR/Cas12f1 조성물은 상기 CEP290 유전자의 엑손 26의 3'말단과 상기 CEP290 유전자의 상기 IVS26 돌연변이(c.2991 + 1655A>G) 사이의 영역을 인식, 결합, 또는 타겟할 수 있는 가이드 영역을 가지는 제1 가이드 RNA, 및
상기 CEP290 유전자의 상기 IVS26 돌연변이(c.2991 + 1655A>G)와 상기 CEP290 유전자의 엑손 27의 5'말단 사이의 영역을 인식, 결합, 또는 타겟할 수 있는 가이드 영역을 가지는 제2 가이드 RNA를 포함함.
실시예 85, 표적서열 한정
실시예 84에 있어서,
상기 CRISPR/Cas12f1 조성물의 상기 제1 가이드 RNA의 가이드 영역은 서열번호 51 내지 서열번호 74, 및 서열번호 245 내지 서열번호 256 중 선택된 서열로 표현되고,
상기 CRISPR/Cas12f1 조성물의 상기 제2 가이드 RNA의 가이드 영역은 서열번호 75 내지 서열번호 101, 및 서열번호 257 내지 서열번호 272 중 선택된 서열로 표현됨.
실시예 86, 대상체 한정
실시예 84 내지 실시예 85 중 어느 하나에 있어서, 상기 대상체는 다음 중 선택됨:
인간; CEP290 유전자를 가지는 비인간 동물; LCA10 질환을 가지는 인간; LCA10 질환을 가지는 비인간 동물; 인간 세포; CEP290 유전자를 가지는 비인간 동물 세포; LCA10 질환을 가지는 인간에서 수득한 세포; 및 LCA10 질환을 가지는 비인간 동물에서 수득한 세포.
실시예 87, 투여 방법 한정 1
실시예 84 내지 실시예 86 중 어느 하나에 있어서, 상기 투여는 다음 중 선택된 하나 이상의 방법으로 수행됨:
미세주입(microinjection); 양이온성 리포좀법; 초산 리튬-DMSO; 지질-매 개 형질감염(transfection); 인산칼슘 침전법(precipitation); lipofection; PEI(Polyethyleneimine)-매개 형질감염; DEAE-dextran 매개 형질감염; 및 나노파티클-매개 핵산 전달(Panyam et al., Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조).
실시예 88, 투여 방법 한정 2
실시예 84 내지 실시예 86 중 어느 하나에 있어서, 상기 투여는 다음 중 선택된 하나 이상의 방법으로 수행됨:
주사(injection); 수혈(transfusion); 삽입(implantation); 및 이식 (transplantation).
실시예 89, 투여 방법 한정 3
실시예 84 내지 실시예 86 중 어느 하나에 있어서, 상기 투여는 다음 중 선택된 하나 이상의 투여 경로로 수행됨:
망막하(subretinal); 피하(subcutaneously); 피내(intradermaliy); 안구내 (intraocularly); 유리체내(intravitreally); 종양내(intratumorally); 절내 (intranodally); 골수내(intramedullary); 근육내(intramuscularly); 정맥내 (intravenous); 림프액내(intralymphatic); 및 복막내(intraperitoneally).
CEP290 유전자 변형 방법
실시예 90, IVS26 돌연변이를 포함하는 CEP290 유전자 변형 방법
다음을 포함하는, IVS26 돌연변이(c.2991 + 1655A>G)를 포함하는 CEP290 유전자를 인위적으로 변형시키는 방법:
실시예 68 내지 실시예 81 중 어느 하나의 CRISPR/Cas12f1 조성물을 대상 세포에 도입하는 것,
여기서, 상기 CRISPR/Cas12f1 조성물은 상기 CEP290 유전자의 엑손 26의 3'말단과 상기 CEP290 유전자의 상기 IVS26 돌연변이(c.2991 + 1655A>G) 사이의 영역을 인식, 결합, 또는 타겟할 수 있는 가이드 영역을 가지는 제1 가이드 RNA, 및
상기 CEP290 유전자의 상기 IVS26 돌연변이(c.2991 + 1655A>G)와 상기 CEP290 유전자의 엑손 27의 5'말단 사이의 영역을 인식, 결합, 또는 타겟할 수 있는 가이드 영역을 가지는 제2 가이드 RNA를 포함하고,
이로 인해, 상기 CEP290 유전자의 인트론 26 영역 중 상기 IVS26 돌연변이(c.2991 + 1655A>G)를 포함하는 일부 핵산 서열의 제거 또는 역위가 유도되며,
상기 CEP290 유전자 내의 IVS26 돌연변이(c.2991 + 1655A>G)에 의해 생성된 128 염기쌍의 cryptic exon의 전체 또는 일부가 제거되고,
결과적으로, 상기 대상 세포 내에서 IVS26 돌연변이(c.2991 + 1655A> G)를 포함하는 CEP290 유전자의 전사 및/또는 번역이 억제 또는 감소되고, 및/또는 정상 CEP290 유전자의 전사 및/또는 번역이 증가됨.
실시예 91, 표적 서열 한정
실시예 90에 있어서,
상기 제1 가이드 RNA의 가이드 영역은 서열번호 51 내지 서열번호 74, 및 서열번호 245 내지 서열번호 256 중 선택된 서열로 표현되고,
상기 제2 가이드 RNA의 가이드 영역은 서열번호 75 내지 서열번호 101, 및 서열번호 257 내지 서열번호 272 중 선택된 서열로 표현됨.
실시예 92, 대상 세포 한정 1
실시예 90에 있어서, 상기 대상 세포는 CEP290 유전자를 포함하는 인간 세포, 또는 비인간 동물 세포임.
실시예 93, 대상 세포 한정 2
실시예 90에 있어서, 상기 대상 세포는 LCA10 질환을 가진 인간 또는 LCA10 질환을 가진 비인간 동물로부터 수득한 세포임.
실시예 94, 도입 방법 한정
실시예 90 내지 93 중 어느 하나에 있어서, 상기 도입은 다음 중 선택된 하나 이상의 방법으로 수행됨:
전기천공법; 유전자총; 초음파천공법; 자기주입법 (magnetofection); 나노파티클 방법; 일시적인 세포 압축 또는 스퀴징 방법; 양이온성 리포좀법; 초산 리튬-DMSO; 지질-매개 형질감염(transfection); 인산칼슘 침전법 (precipitation); lipofection; PEI(Polyethyleneimine)-매개 형질감염; DEAE- dextran 매개 형질감염; 및 나노파티클-매개 핵산 전달(Panyam et al.; Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조).
실시예 95, in vivo 변형방법
다음을 포함하는, 대상체 내에서 IVS26 돌연변이(c.2991 + 1655A>G)를 포함하는 CEP290 유전자를 인위적으로 변형시키는 방법:
실시예 68 내지 실시예 81 중 어느 하나의 CRISPR/Cas12f1 조성물을 대상체에 도입하는 것,
여기서, 상기 CRISPR/Cas12f1 조성물은 상기 CEP290 유전자의 엑손 26의 3'말단과 상기 CEP290 유전자의 상기 IVS26 돌연변이(c.2991 + 1655A>G) 사이의 영역을 인식, 결합, 또는 타겟할 수 있는 가이드 영역을 가지는 제1 가이드 RNA, 및
상기 CEP290 유전자의 상기 IVS26 돌연변이(c.2991 + 1655A>G)와 상기 CEP290 유전자의 엑손 27의 5'말단 사이의 영역을 인식, 결합, 또는 타겟할 수 있는 가이드 영역을 가지는 제2 가이드 RNA를 포함하고,
이로 인해, 상기 CEP290 유전자의 인트론 26 영역 중 상기 IVS26 돌연변이(c.2991 + 1655A>G)를 포함하는 일부 핵산 서열의 제거 또는 역위가 유도되며,
상기 CEP290 유전자 내의 IVS26 돌연변이(c.2991 + 1655A>G)에 의해 생성된 128 염기쌍의 cryptic exon의 전체 또는 일부가 제거되고,
결과적으로, 대상체 내에서 IVS26 돌연변이(c.2991 + 1655A> G)를 포함하는 CEP290 유전자의 전사 및/또는 번역이 억제 또는 감소되고, 및/또는 정상 CEP290 유전자의 전사 및/또는 번역이 증가됨.
실시예 96, 대상체 한정
실시예 95에 있어서, 상기 대상체는 다음 중 선택됨:
인간; CEP290 유전자를 가지는 비인간 동물; LCA10 질환을 가지는 인간; 및 LCA10 질환을 가지는 비인간 동물.
LCA10 질환 치료용 약학적 조성물의 용도
실시예 97, 조성물의 용도, Swiss-type claim
실시예 82 내지 실시예 83 중 어느 하나에서 선택된 약학적 조성물의, LCA10 질환을 가진 대상체를 치료하기 위한 치료제 제조용도.
실시예 98, 조성물의 치료용도
실시예 82 내지 실시예 83 중 어느 하나에서 선택된 약학적 조성물의, LCA10 질환을 가진 대상체 치료용도.
실시예 99, 치료 용도 구체화
실시예 98에 있어서, 상기 치료용도는 실시예 84 내지 실시예 89 중 어느 하나에서 선택된 LCA10 질환 치료방법에 사용하기 위한 용도임.
실시예 100, 조성물의 CEP290 유전자 편집 용도
실시예 82 내지 실시예 83 중 어느 하나에서 선택된 약학적 조성물의, 대상체의 CEP290 유전자 편집용도.
실시예 101, 조성물의 CEP290 유전자 편집 용도 구체화
실시예 101에 있어서, 상기 유전자 편집용도는 실시예 90 내지 실시예 96 중 어느 하나에서 선택된 CEP290 유전자 변형 방법에 사용하기 위한 용도임.
실시예 102, 코돈-최적화된 Cas12f1 단백질을 암호화하는 핵산 포함 벡터
실시예 56 내지 실시예 67 중 어느 하나에 있어서, 상기 Cas12f1 단백질을 암호화하는 핵산은 서열번호 480 내지 서열번호 482로 표현되는 것임.
실시예 103, 코돈-최적화된 Cas12f1 단백질을 암호화하는 핵산을 포함하는 조성물
실시예 68 내지 실시예 81 중 어느 하나에 있어서, 상기 Cas12f1 단백질을 암호화하는 핵산은 서열번호 480 내지 서열번호 482로 표현되는 것임.
이하 실시예를 통해 본 발명을 상세히 설명하고자 한다.
이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 범위가 이들의 실시예에 의해 제한되지 않는다는 것은 본 발명이 속한 기술분야에서 통상의 지식을 가진 자에서 있어 자명할 것이다.
실시예
실험방법
1. gDNA 추출
Genomic DNA Prep Kit (GCBL200, Nanohelix)의 Kit을 사용하여 gDNA Prep을 실시하였다. 24well에 transfection된 세포를 Media를 제거하고 Trypsin 200 ㎕로 바닥에서 뗀 뒤 1.5 ml tube에 넣었다. 300 X g로 5분간 원심분리를 실시하고 상층액을 제거하였다. NGD1 buffer 300 ㎕와 RNase A(50 mg/ml) 2 ㎕를 넣고 1분간 vortexing 하고, 8 ㎕의 Proteinase K (10 mg/ml)을 넣은 뒤 60℃에서 10분간 반응시킨다. 그리고 ice에서 5분 간 식혔다. NPS buffer 300 ㎕를 넣어 주고 잘 섞어준 뒤, Ice에서 5분 간 반응시키고 12,000 rpm, 5분 간 원심분리를 실시하였다. Column을 Sample의 수에 맞게 준비하고 MaxBinder Solution 100 ㎕를 넣은 뒤 12,000 rpm, 30초 간 원심분리를 실시하였다. 상층액을 전부 따서 Column에 넣고 12,000 rpm에서 1분 간 원심분리 후, 걸러진 용액을 버렸다. 80% EtOH 500 ㎕를 Column에 넣고 10,000 rpm, 30초 원심분리를 하고 걸러진 용액을 버렸다. 2회 반복 후 13,000 rpm에서 3분간 원심분리 하였다. Column을 새 1.5 ml tube에 바꿔 끼운 뒤 30 ㎕의 EB solution을 중앙에 떨어뜨린 후 1분 동안 반응시킨 뒤 12,000 rpm, 2분 동안 원심분리를 하였다. Elution 된 gDNA들은 정량하고 4℃에서 보관하였다.
2. PCR & Gel Purification
해당 실험은 GEL & PCR Purification System (GP104-200, Biofact) 제품을 이용하여 수행하였다. PCR Product volume 3배에 해당하는 UB buffer를 PCR Product에 넣어준 뒤 잘 섞어주고, PCR Product volume의 2배에 해당하는 Isopropanol을 넣고 잘 섞어주었다. Gel의 경우 해당 band의 Gel을 잘라서 무게를 잰 뒤 Gel 무게의 3배에 해당하는 UB buffer를 넣고 65℃에서 10분 간 반응시켜 Gel을 녹인 뒤, Isopropanol을 Gel volume의 1배에 해당하는 양을 넣어 잘 섞어주었다. Column을 준비하고 HelpB Buffer 200 ㎕를 Column에 넣은 뒤 13,000 rpm, 30초 간 원심분리를 한 뒤 걸러진 용액을 버렸다. 반응액을 column에 넣고 7,000 rpm, 1분간 원심분리를 한 뒤 걸러진 용액을 버렸다. 80% EtOH 750 ㎕를 넣고 13,000 rpm, 30초간 원심분리를 실시한 뒤 걸러진 용액을 버렸다. 2회 반복 후 13,000 rpm, 3분 간 원심분리를 실시하였다. 원심분리가 끝난 Column을 1.5 ml tube에 넣은 후 30 ㎕의 EB buffer를 가운데 떨어뜨린 뒤 1분간 상온에서 반응시켰다. 13,000 rpm 1분간 원심분리를 실시하였다. 1.5 ml tube에 모인 DNA들을 정량 후 4℃에서 보관하였다.
3. 플라스미드 벡터 수집
DH5a에 Transformation된 vector들을 transfection을 위해 사용하거나 Sanger sequencing을 위하여 생산하기 위해 실시하였다. Plasmid Mini prep kit (PM105-200, Biofact)를 사용하였고 제조사의 매뉴얼대로 진행하였다. Vector가 형질전환 된 DH5a 배양액을 1.5 ml tube에 넣은 다음 13,000 rpm, 5분 간 원심분리를 실시하였다. 원심분리 후 상층액을 따라버린 다음 pellet을 vortexing하여 충분히 풀어주었다. B1 buffer 350 ㎕를 넣은 다음 tube를 흔들어 충분히 반응시켰다. RNase A가 포함된 A1 buffer 350 ㎕을 넣고 파란색이 사라질 때까지 tube를 invert하여 반응시켰다. 그리고 13,000 rpm, 5분간 원심분리를 실시하였다. Column을 준비하고 HelpB buffer를 200 ㎕씩 넣은 다음 13,000 rpm, 30초 간 원심분리 후 걸러진 용액을 제거하였다. 상층액 750 ㎕를 column에 넣고 7,000 rpm, 1분간 원심분리 시키고 걸러진 용액을 버렸다. 80% EtOH 750 ㎕를 넣고 13,000 rpm, 30초간 원심분리를 실시한 뒤 걸러진 용액을 버렸다. (2회 반복), 2회 반복 후 13,000 rpm, 3분 간 원심분리를 실시하였다. 원심분리가 끝난 Column을 1.5 ml tube에 넣은 후 30 ㎕의 EB buffer를 가운데 떨어뜨린 뒤 1분간 상온에서 반응시켰다. 13,000 rpm 1분간 원심분리를 실시하였다. 1.5 ml tube에 모인 Plasmid vector들을 정량 후 -20℃에서 보관하였다.
4. Cassette DNA 제작
Cas14a1의 Spacer인 Target들의 indel efficiency를 확인하기 위하여, U6 Promoter와 스캐폴드 서열, 가이드 서열 및 U-rich tail 서열(T4AT6)이 포함된 Cassette를 PCR로 증폭하여 사용하였다. 해당 과정은 다음과 같은 방법으로 진행하였다.
1) Spacer 선정 및 Oligo 주문
Spacer들은 PAM인 TTTR 뒤쪽의 20mer 서열을 선택하였고 T로 끝나는 Spacer들은 제외하였다. 그리고 Off-target을 줄이기 위하여 Mismatch 2개 이하로 Sorting하여 Spacer를 CRISPR RGEN TOOL에서 디자인하였다. 그리고 Direct Repeat과 U-rich sequence가 포함된 Reverse complement 서열을 R Primer로 사용하기 위하여 주문하였다.
2) PCR
PCR은 다음의 조성과 조건으로 실시되었다.
조성 | PCR 조건 | ||
2X pfu PCR Master mix | 205 ㎕ | Pre-denaturation | 95℃, 5 min |
hU6 F primer (10 P) | 2.05 ㎕ | Denaturation | 95℃, 30 sec |
Target oligo (10 P) | 2.05 ㎕ | Annealing | 60℃, 30 sec |
Template | 1 ㎕ (200 ng) | Extension | 72℃, 2 min |
DW | 199.9 ㎕ | D-E cycle | 30 cycles |
Total | 410 ㎕ | Final extension | 72℃, 3 min |
50 ㎕씩 나누어 8개의 PCR tube에서 진행 | Storage | 4℃, ∞ |
Mixture 400 ㎕를 PCR tube에 50ul씩 넣어서 8개 tube를 이용하여 1개의 Sample을 증폭하였다.
3) Gel Analysis
1% agarose Gel에 전기영동하여 증폭사이즈를 확인하였다.
4) PCR Purification & 정량
5. Cell culture
실험에 사용된 HEK-293T세포와 ARPE-19/HPV-16 cell은 다음의 조성과 조건으로 배양하였다: HEK-293T cell media - DMEM, 10% FBS, 1% Penicillin-Streptomycin; 및 AREP-19/HPV-16 cell media - DEME/F12, 10% FBS, 1% Penicillin-Streptomycin. 동결된 세포를 37℃에서 빠르게 녹인 뒤, 미리 데워진 Cell media 5 ml에 넣어 잘 풀어주었다. 그리고 1,500 rpm, 3분간 원심분리를 하였다. 원심분리 후 동결액이 남아있는 상층액을 빠르게 제거하고 cell media로 pellet을 잘 풀어준 뒤, 10 ml의 media가 포함된 90 mm Dish 2개에 나눠서 배양하였다. 다음 날 Cell media를 새로 갈아주고 계속 배양하며, confluency 80%가 되면 각각의 비율로 계대배양을 하였다. (HEK-293T - 1/15, AREP-19/HPV-16 - 1/4의 비율로 실시하였다.)
6. Transfection (HEK-293T, ARPE19-HPV)
Transfection 하루 전날에 세포(80% Confluency)를 100 mm Dish에서 trypsin처리를 통해 바닥에서 분리하였다. 분리된 세포는 미리 warming된 media 50 ml(HEK-293T - DMEM, 10% FBS, 1% p/s, ARPE19-HPV - DMEM/F12, 10% FBS, 1% p/s)에 넣어 파이펫으로 천천히 풀어주었다. 샘플과 반복 수에 맞춰서 24well plate를 준비하고 well 1개당 1번의 세포가 풀어진 media를 500 ㎕씩 넣어주었다. (1/100 dilution, 0.5 ml/50 ml) 이후 transfection 전까지 37℃ CO2 배양기에서 밤새도록 배양시켰다. Confluency 70~80% 정도 일 때 transfection을 실시하였다. Well당 500 ㎕의 media 중에서 200 ㎕를 제거하고 배양기에 넣어두었다. 1.5 ml tube를 Sample 수에 맞게 준비하고 각각 tube에 Opti-MEM 200 ㎕씩 넣었다. Opti-MEM이 포함된 tube에 DNA를 해당 양만큼 넣고 5초간 vortexing 하였다 (DNA - Cas14a1 1.5 ㎍ + gRNA 0.5 ㎍). 이후 FuGENE HD를 DNA : Reagent = 1:3의 비율로 FuGENE HD를 넣었다 (DNA 2 ㎍일 때 FuGENE HD는 6 ㎕). 20분간 상온에서 반응시켰다. 24well plate를 배양기에서 꺼내고, 8번의 반응액 200 ㎕를 well 벽면을 통해 흘려 넣었다. S모양으로 plate를 충분히 흔들어준 뒤 72시간까지 37℃ CO2 배양기에서 배양하였다. 72시간 이후 cell을 수확하여 gDNA 추출하였다.
7. NGS Sample PCR
Target들의 Indel efficiency를 확인하기 위한 NGS Sample 준비는 1~3차 PCR을 실시 후, PCR Product purification을 통해 준비하였다.
1) PCR 조성과 조건 (1차 PCR)
F : CEP290-F-F#10, LCA10-2nd-9-R (1323 bp), R : CEP290-R-F#1, CEP290-R-R#8 (1879 bp)
조성 | PCR 조건 | ||
KAPA HiFi 2X PCR mix | 5 ㎕ | Pre-denaturation | 95℃, 3 min |
Forward primer (10 P) | 0.5 ㎕ | Denaturation | 98℃, 20 sec |
Reverse primer (10 P) | 0.5 ㎕ | Annealing | 60℃, 15 sec |
Template (gDNA) | 1 ㎕ | Extension | 72℃, 2 min |
DW | 3 ㎕ | D-E cycle | 30 cycles |
Total | 10 ㎕ | Final extension | 72℃, 3 min |
Storage | 4℃, ∞ |
2) PCR 조성과 조건 (2차 PCR)
Primer set | Forward primer | Reverse primer | Protospacer sequence | |||
S1 | LCA10-2nd-1-F | LCA10-2nd-1-R | F21 | |||
S2 | LCA10-2nd-2-F | LCA10-2nd-2-R | F17 | F18 | F19 | F20 |
S3 | LCA10-2nd-3-F | CEP-F-R#11-miseq-R | F12 | F15 | F16 | |
S4 | LCA10-2nd-4-F | LCA10-2nd-4-R | F11 | F14 | ||
S5 | CEP-F-F#9-miseq-F | CEP-F-R#8-miseq-R | F10 | F13 | F22 | |
S6 | LCA10-2nd-6-F | LCA10-2nd-6-R | F04 | F07 | F08 | |
S7 | CEP-F-F#11-miseq-F | CEP-F-R#10-miseq-R | F03 | F05 | F23 | F24 |
S8 | CEP-F-F#3-miseq-F | CEP-F-R#3-miseq-R | F01 | F02 | F09 | |
S9 | LCA10-2nd-9-F | CEP-F-R#5-miseq-R | F05 | |||
S10 | LCA10-2nd-10-F | LCA10-2nd-10-R | R05 | R06 | R07 | |
S11 | LCA10-2nd-11-F | LCA10-2nd-11-R | R04 | R09 | R10 | |
S12 | CEP-R-F#5-miseq-F | CEP-R-R#4-miseq-R | R03 | R11 | ||
S13 | LCA10-2nd-13-F | LCA10-2nd-13-R | R01 | R02 | R08 | |
S14 | LCA10-2nd-14-F | LCA10-2nd-14-R | R12 | R13 | ||
S15 | LCA10-2nd-15-F | LCA10-2nd-15-R | R24 | R26 | ||
S16 | LCA10-2nd-16-F | LCA10-2nd-16-R | R22 | R23 | ||
S17 | LCA10-2nd-17-F | LCA10-2nd-17-R | R21 | |||
S18 | LCA10-2nd-18-F | LCA10-2nd-18-R | R20 | R25 | ||
S19 | LCA10-2nd-19-F | LCA10-2nd-19-R | R19 | |||
S20 | LCA10-2nd-20-F | LCA10-2nd-20-R | R16 | R17 | R18 | |
S21 | LCA10-2nd-21-F | LCA10-2nd-21-R | R14 | R15 |
조성 | PCR 조건 | ||
KAPA HiFi 2X PCR mix | 5 ㎕ | Pre-denaturation | 95℃, 3 min |
Forward primer (10 P) | 0.5 ㎕ | Denaturation | 98℃, 20 sec |
Reverse primer (10 P) | 0.5 ㎕ | Annealing | 60℃, 15 sec |
Template (PCR product) | 0.5 ㎕ | Extension | 72℃, 30 sec |
DW | 3.5 ㎕ | D-E cycle | 30 cycles |
Total | 10 ㎕ | Final extension | 72℃, 3 min |
Storage | 4℃, ∞ |
R01, R02, R08, S13 NT sample은 Annealing 57℃, R20, R25, S18 NT, R19, S19 NT sample은 Annealing 53℃에서 진행함.
3) PCR 조성과 조건 (3차 PCR)
조성 | PCR 조건 | ||
KAPA HiFi 2X PCR mix | 5 ㎕ | Pre-denaturation | 95℃, 3 min |
Forward primer (10 P) | 0.5 ㎕ | Denaturation | 98℃, 20 sec |
Reverse primer (10 P) | 0.5 ㎕ | Annealing | 60℃, 15 sec |
Template (PCR product) | 0.5 ㎕ | Extension | 72℃, 30 sec |
DW | 3.5 ㎕ | D-E cycle | 30 cycles |
Total | 10 ㎕ | Final extension | 72℃, 3 min |
Storage | 4℃, ∞ |
R01, R02, R08, S13 NT, R20, R25, S18 NT, R19, S19 NT sample은 Annealing 57℃, F10, F13, F22, S5 NT, R12, R13, S14 NT, R24, R26, S15 NT, R16, R17, R18, S20NT sample은 Annealing 63℃에서 진행함.
4) PCR Primer 정리
Use | Target region* | No. | Name | Direction | Sequence | Length (nt) |
1st PCR용 | F region* | 1 | CEP290-F-F#10 | F | TGAACTGACTGCTAAGTACAGGGACA (SEQ ID NO: 147) | 26 |
2 | LCA10-2nd-9-R | R | AAGCGTTAAGCCGAGATCGT (SEQ ID NO: 148) | 20 | ||
R region* | 3 | CEP290-R-F#1 | F | TGTGGCAGCCATTATTCCTGTCTCTA (SEQ ID NO: 149) | 26 | |
4 | CEP290-R-R#8 | R | TCTGCCTTGACTAGCTGGTTAGGTAA (SEQ ID NO: 150) | 26 | ||
2nd PCR용 | F region* | 1 | LCA10-2nd-1-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTGAACTGACTGCTAAGTACAGGGAC (SEQ ID NO: 151) | 56 |
2 | LCA10-2nd-1-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCAGGCAAACTTTAATTAAAATCTGCC (SEQ ID NO: 152) | 61 | ||
3 | LCA10-2nd-2-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTGGAACACCTGGAGGTAAGTTTG (SEQ ID NO: 153) | 54 | ||
4 | LCA10-2nd-2-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCATTCAGAAGTCATTCAGCCACT (SEQ ID NO: 154) | 57 | ||
5 | LCA10-2nd-3-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTTTGTTCCCACATAACACACACA (SEQ ID NO: 155) | 54 | ||
6 | CEP-F-R#11-miseq-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTTCTGGGTACAGGGGTAAGAGAAAGG (SEQ ID NO: 156) | 60 | ||
7 | LCA10-2nd-4-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTTGTAATCAAAGGAGGGAAGCA (SEQ ID NO: 157) | 53 | ||
8 | LCA10-2nd-4-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGATGAGAATTTACAGAGTGCATCC (SEQ ID NO: 158) | 58 | ||
9 | CEP-F-F#9-miseq-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTACCCAGAACAAACTATTCTCCCATGG (SEQ ID NO: 159) | 58 | ||
10 | CEP-F-R#8-miseq-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGGTCTGGTCCATATTCACAGATTGT (SEQ ID NO: 160) | 60 | ||
11 | LCA10-2nd-6-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTTGGACCAGACCCTTTGTAGTT (SEQ ID NO: 161) | 53 | ||
12 | LCA10-2nd-6-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTGTCTCTATGAGCCAGCAAAAG (SEQ ID NO: 162) | 56 | ||
13 | CEP-F-F#11-miseq-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTTCATCTTCCTCATCAGAAATAGAGGCTT (SEQ ID NO: 163) | 60 | ||
14 | CEP-F-R#10-miseq-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCAAAAGCAGCAGAAAGCAAACTGAT (SEQ ID NO: 164) | 60 | ||
15 | CEP-F-F#3-miseq-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTTGCTGGCTCATAGAGACACATTCAGT (SEQ ID NO: 165) | 58 | ||
16 | CEP-F-R#3-miseq-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTGCTGGAGAGGATAGGACAGAGGA (SEQ ID NO: 166) | 58 | ||
17 | LCA10-2nd-9-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTTTCCATTCTCCATGTCCTCTG (SEQ ID NO: 167) | 53 | ||
18 | CEP-F-R#5-miseq-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGGTGACAGAATGAAACTCCATCTCA (SEQ ID NO: 168) | 60 | ||
R region* | 1 | LCA10-2nd-10-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTGTGGCAGCCATTATTCCTGT (SEQ ID NO: 169) | 52 | |
2 | LCA10-2nd-10-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAACACTGTGGTCAGAAAACTCA (SEQ ID NO: 170) | 57 | ||
3 | LCA10-2nd-11-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTATGTATGTTCTTTTGTACGTGCTCTT (SEQ ID NO: 171) | 58 | ||
4 | LCA10-2nd-11-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAAGACAGATATGTAAACACATATAATTTGA (SEQ ID NO: 172) | 64 | ||
5 | CEP-R-F#5-miseq-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTGTCACTCCTGTCTACACTAGTTCTGC (SEQ ID NO: 173) | 58 | ||
6 | CEP-R-R#4-miseq-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTACCATATTTGACACCACATGCACTGT (SEQ ID NO: 174) | 60 | ||
7 | LCA10-2nd-13-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTTTCCTTAATGGAATATAAGTCTTTTGA (SEQ ID NO: 175) | 59 | ||
8 | LCA10-2nd-13-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCTTATTATCTATTCCATTCTTCACACA (SEQ ID NO: 176) | 62 | ||
9 | LCA10-2nd-14-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTGGTTCATGAGACTAGAGGTCACG (SEQ ID NO: 177) | 55 | ||
10 | LCA10-2nd-14-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTGGGCAACACAGTGAGACT (SEQ ID NO: 178) | 54 | ||
11 | LCA10-2nd-15-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTGGTTCAAGCGATTCTTCTGC (SEQ ID NO: 179) | 52 | ||
12 | LCA10-2nd-15-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCTGAAACTTCACTGGTCTCC (SEQ ID NO: 180) | 55 | ||
13 | LCA10-2nd-16-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTAGCCTCAACTTCCCAAAGTG (SEQ ID NO: 181) | 52 | ||
14 | LCA10-2nd-16-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTCTTTTTCTCCCACCTACCC (SEQ ID NO: 182) | 54 | ||
15 | LCA10-2nd-17-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTTTTAGAGTTACTAGGGAGAGAGTGATGA (SEQ ID NO: 183) | 60 | ||
16 | LCA10-2nd-17-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTACACAGGAGGGAAAACAGGA (SEQ ID NO: 184) | 54 | ||
17 | LCA10-2nd-18-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTTCCTGTGAAAAAGGATGAAAGG (SEQ ID NO: 185) | 54 | ||
18 | LCA10-2nd-18-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTGAAGAATAATACAAACAGGGTAATGA (SEQ ID NO: 186) | 61 | ||
19 | LCA10-2nd-19-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTCTCCTGTTTTCCCTCCTGTG (SEQ ID NO: 187) | 52 | ||
20 | LCA10-2nd-19-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTTTGAGTGGAGTACCTGGAAA (SEQ ID NO: 188) | 55 | ||
21 | LCA10-2nd-20-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTTGTCCTCTTTTTAGTCTCATTACCC (SEQ ID NO: 189) | 57 | ||
22 | LCA10-2nd-20-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGAAAAAGGCTGGCGATATAA (SEQ ID NO: 190) | 55 | ||
23 | LCA10-2nd-21-F | F | CACTCTTTCCCTACACGACGCTCTTCCGATCTATATCGCCAGCCTTTTTCCT (SEQ ID NO: 191) | 52 | ||
24 | LCA10-2nd-21-R | R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCCTTGACTAGCTGGTTAGGTA (SEQ ID NO: 192) | 56 |
*타겟 영역은 c.2991+1655A>G 유전자 돌연변이를 기준으로 Upstream 1654bp, downstream 2000bp 부분을 각각 Forward 영역(F 영역)과 Reverse 영역(R 영역)으로 나눠서 구분함.
8. T-blunt end cloning
Target Cassette 또는 PCR Product를 T-vector에 Cloning하여 Cassette의 vector화 또는 PCR Product의 시퀀스를 확인할 때 진행하였다. 제품은 All in one PCR cloning kit (VT202-020, Biofact)의 제품을 사용하였다. DNA의 길이가 2 kb가 넘지 않도록 디자인된 Product 또는 Cassette DNA를 이용하여 Cloning을 진행하였다. 다음의 조성으로 Mixture를 만들고 Ligation 반응시켰다.
Component | Volume | 상온에서 30분간 반응 |
6X All in one buffer | 1 ㎕ | |
All in one vector | 1 ㎕ | |
PCR Product or Cassette | 4 ㎕ | |
Total | 6 ㎕ |
30분간 반응 후 E.coli C.P. cell에 transformation을 실시였다. LB Plate에서 배양이 끝난 뒤 Colony PCR을 통하여 Positive colony를 확인하고 3 ml LB 배지에 배양하여 Miniprep 후 시퀀싱을 통하여 최종적으로 sequence가 일치하는 지 확인하였다.
9. Vector Construction
Cas14a1 Ver. 4.0 Dual gRNA vector (한국특허 출원번호 제10-2021-0050093호 및 제10-2021-0051552호)를 이용하여 다음과 같이 진행하였다. Cloning할 vector의 Restriction enzyme 말단을 확인하고 Dual gRNA Oligo를 디자인하여 주문하였다. 주문 생산된 Oligo를 100 pmol이 되게 희석하고 Forward, Reverse Primer를 각 4.5 ㎕씩 따서 PCR tube에 넣은 뒤 10X Annealing buffer 1 ㎕로 10 ㎕를 맞춰준 뒤 Annealing을 실시하였다 (Annealing은 95℃, 5분, 95℃~4℃까지 -1℃/분의 조건으로 실시하였다). Cas14a1 Ver. 4.0 Dual gRNA vector를 준비하고 다음의 조성과 조건으로 Digestion 하였다.
Reagent | Volume | 37℃, 500 rpm에서 2시간 동안 반응시킨다. |
NEB 10X 2.1 buffer | 5 ㎕ | |
Vector | 10 ㎍ | |
Bbs I | 10 ㎕ | |
DW | Up to 50 ㎕ | |
Total | 50 ㎕ |
Digestion이 끝난 뒤 전기 영동 및 Gel elution을 통해 Digestion된 vector를 획득하였다. Digestion된 vector와 Annealing 된 Oligo를 사용하여 Ligation을 진행하였다.
Reagent | Volume | 상온에서 5분간 반응 |
DNA ligation mix (TAKARA) | 2 ㎕ | |
Annealed Oligo | 1.5 ㎕ | |
BbsI cut vector | 0.5 ㎕ | |
Total | 4 ㎕ |
Ligation이 끝난 뒤 DH5a transformation을 실시하였다. LB Plate에서 배양이 끝난 뒤 Colony PCR을 통하여 Positive colony를 확인하고 3 ml LB 배지에 배양하여 Miniprep 후 시퀀싱을 통하여 최종적으로 sequence가 일치하는 지 확인하였다.
10. DH5α Transformation
앞서 생산한 vector를 E.coli에 형질전환하여 vector를 생산하였다. DH5a Competent cell을 꺼내 Ice에서 녹였다. Ligation된 Vector를 DH5a 양의 최대 1/10 만큼 넣어준 다음 Ice에서 30분간 반응시켰다. 42℃에서 30초간 Heat shock을 준 뒤, Ice에서 2분간 식혀주었다. LB 배지나 S.O.C 배지 100 ㎕를 사용하여 37℃에서 1시간 동안 배양하였다. 상온의 온도로 Warming 된 LB plate (Vector에 맞게 Ampicillin 또는 Kanamycin이 포함)에 도말하여 37℃에서 14 ~ 16시간 동안 배양하였다.
11. ARPE19/HPV16-LCA10 cell line 제작
Transfection 전 날 100mm Dish에 ARPE19/HPV16 cell을 seeding 하였다 (Transfection 당일 confluency가 70%가 되게 seeding 하였다). 다음 날 confluency를 확인하고 Cell을 전부 Dish에서 Trypsin을 이용하여 떼어내고 PBS로 2회 Washing 하고 상층액을 제거하였다. NEON Transfection R buffer 100㎕와 DNA(vector 6㎍, Donor 6㎍)를 혼합한 뒤 앞서 수득한 Cell pellet과 잘 섞었다. 1350V, 30ms, 2 pulse의 조건으로 transfection을 실시하였다. 그 후 준비된 Cell media가 담긴 100mm Dish에 넣고 잘 흔들어준 뒤 24시간 동안 배양하였다. 24시간 배양 뒤 Puromycin (8㎍/ml)으로 Selection을 실시하였다. 2주간 Puromycin으로 selection한 후 clone을 96well로 옮긴 후 genotyping 실시하였다. Genotyping 후 선별된 Cell들은 24well로 sub-culture를 진행하고 세포가 일정양이상 자라면 RT-PCR을 통해 분석하였다.
12. ARPE19/HPV16-LCA10 Cell screening
Puromycin(8㎍/ml)에 의해 2주간 selection된 clone를 Direct PCR과 Sanger sequencing을 통하여 유전자 삽입을 확인하였다. PCR과정은 다음과 같이 진행하였으며, 2회에 걸쳐 Direct PCR 후 PCR Product 정제과정을 거쳐서 Macrogen에 시퀀스 분석을 의뢰하였다. 분석 후 c.2991+1655A>G가 포함되어 있는 Cell들을 확인하였고 해당 mutation이 포함되어 있는 세포는 다음의 명명법에 의하여 세포 이름을 붙였다: A~Z, A~H, 1~12 숫자 (A ~ Z: 실험 횟수 1회차 A, 2회차 B, 3회차 C 순으로 Z까지; A ~ H: 96well의 행 문자 (위에서부터 A행 ~ H행까지); 1 ~ 12 숫자: 각 행의 열에 해당하는 숫자, ex) AC7: 1회차 실험의 96well C행, 7번째 열의 clone). 시퀀스 분석결과 LCA10-AC7 clone에서 c.2991+1655A>G 확인되었다.
1st PCR | PCR Condition | |||
2X KOD One | 5 ㎕ | 1 X | 95℃ | 5min |
F (10pmol) | 0.5 ㎕ | 0.5 μM | 98℃ | 10sec |
R (10pmol) | 0.5 ㎕ | 0.5 μM | 59℃ | 5sec |
Tween20 | 0.2 | 68℃ | 10sec | |
Cell lysate | 3.8 ㎕ | 68℃ | 2min | |
Total | 10 ㎕ | Cycle | 33 |
2nd PCR | PCR Condition | |||
2X KOD One | 5 ㎕ | 1 X | 95℃ | 5min |
F (10pmol) | 0.5 ㎕ | 1 μM | 98℃ | 10sec |
R (10pmol) | 0.5 ㎕ | 1 μM | 59℃ | 5sec |
DW | 2 ㎕ | 68℃ | 10sec | |
1st PCR product | 2 ㎕ | 68℃ | 2min | |
Total | 10 ㎕ | Cycle | 33 |
Target | Primer set | Product size | |
c.2991+1655A>G site | Forward primer | Cttggctcactgcaagctccac (SEQ ID NO: 193) | 397 bp |
Reverse primer | ACAGGGTAGGATTCATGTTTAGAATGATCA (SEQ ID NO: 194) |
실시예 1. 프로토스페이서 서열 및 가이드 서열 후보 선정
CEP290 유전자의 c.2991+1655A>G 유전자 돌연변이에 의한 cryptic exon X의 발현을 줄이기 위하여, 표적 영역은 c.2991+1655A>G 유전자 돌연변이를 기준으로 Upstream 1654bp, downstream 2000bp 부분을 각각 Forward 영역(F 영역)과 Reverse 영역(R 영역)으로 나눠서 구분하였고, 각각 영역에 해당하는 프로토스페이서 서열들을 선정하였다. Cas14a1의 특성상 TTTR의 PAM을 사용하기 때문에 기존의 Cas12a1의 표적 서열 중 TTTC를 제외한 TTTR을 PAM으로 하여 우선적으로 프로토스페이서 서열로 선정하였다. 선정된 프로토스페이서 서열은 아래에 표 19에 정리하였다. 각 서열을 쉽게 구분하기 위해 F 영역에 존재하는 서열은 F로 구분하여 넘버링하고, R 영역에 존재하는 서열은 R로 구분하여 넘버링하여 표 19에 정리하였다.
Target region | Name | PAM (TTTR) | Protospacer sequence (20nt) | SEQ ID NO |
F region | PS-F01 | TTTA | TAGAAAATTATGCCTATTTA | 195 |
PS-F02 | TTTG | GCAAAAGCAGCAGAAAGCAA | 196 | |
PS-F03 | TTTA | GTAGGAATCCTGAAAGCTAC | 197 | |
PS-F04 | TTTA | CTGAGGACAGAACAAGCTCC | 198 | |
PS-F05 | TTTG | GGAAAATGATAACGTTAAAC | 199 | |
PS-F06 | TTTA | CTGAATGTGTCTCTATGAGC | 200 | |
PS-F07 | TTTG | TTCATCTTCCTCATCAGAAA | 201 | |
PS-F08 | TTTG | GATTATTCTTATCTAAGATC | 202 | |
PS-F09 | TTTA | TCAATATTATTTAGAAGTAA | 203 | |
PS-F10 | TTTA | CAGAGTGCATCCATGGTCCA | 204 | |
PS-F11 | TTTG | TTCCTTGGAATGGATGTAGC | 205 | |
PS-F12 | TTTA | ACCAGACATCTAAGAGAAAA | 206 | |
PS-F13 | TTTA | TTCTACATTAAAATTCTACA | 207 | |
PS-F14 | TTTG | TTCTGGGTACAGGGGTAAGA | 208 | |
PS-F15 | TTTG | ATTCAGCTAAATCATGCAAG | 209 | |
PS-F16 | TTTA | TAGTGGCTGAATGACTTCTG | 210 | |
PS-F17 | TTTG | TTCCCACATAACACACACAC | 211 | |
PS-F18 | TTTA | TAACTAAACTGAATGAATAA | 212 | |
PS-F19 | TTTA | ATTAAAATCTGCCAAATCCC | 213 | |
PS-F20 | TTTG | TGTTTGGGGGGATTTGGCAG | 214 | |
PS-F21 | TTTG | TGTGATTCTTGAACCTTGTG | 215 | |
PS-F22 | TTTA | TTCTACAATAAAAAATGATG | 216 | |
PS-F23 | TTTG | CTGGCTCATAGAGACACATTC | 217 | |
PS-F24 | TTTG | AGCTAATAGAATTAGATCTTA | 218 | |
R region | PS-R01 | TTTG | AGAGGTAAAGGTTCATGAGA | 219 |
PS-R02 | TTTG | GCACAGAGTTCAAGCTAATA | 220 | |
PS-R03 | TTTA | CATATCTGTCTTCCTTAATG | 221 | |
PS-R04 | TTTA | ATGGAACAAAGTCACTCCTG | 222 | |
PS-R05 | TTTA | CCCTTCAGGTAACCGGTAGC | 223 | |
PS-R06 | TTTA | GAATGATCATTCTTGTGGCA | 224 | |
PS-R07 | TTTA | AGGCGGGGAGTCACATGGGA | 225 | |
PS-R08 | TTTA | CCTCTCAAAAAGCAACAATA | 226 | |
PS-R09 | TTTG | AAACAGGAATAGAAATTCAC | 227 | |
PS-R10 | TTTG | TTCCATTAAAAAAAGTATGC | 228 | |
PS-R11 | TTTA | ATTTGTTTCTGTGTGTTGAG | 229 | |
PS-R12 | TTTG | TATTTCCTTATTATCTATTC | 230 | |
PS-R13 | TTTG | ATAGTAGAAGAAAAAAGAAA | 231 | |
PS-R14 | TTTG | AGATCCCCTTGAAACACAGG | 232 | |
PS-R15 | TTTA | CAATTCCTGTGTTTCAAGGG | 233 | |
PS-R16 | TTTA | TCACTGAAATCCATTGCTTA | 234 | |
PS-R17 | TTTA | TTTATCACTGAAATCCATTG | 235 | |
PS-R18 | TTTG | AGTGGAGTACCTGGAAAATA | 236 | |
PS-R19 | TTTA | GTCTCATTACCCTGTTTGTA | 237 | |
PS-R20 | TTTA | TATACTATGAATACACAGGA | 238 | |
PS-R21 | TTTG | TAACAAACAATAGGATTATC | 239 | |
PS-R22 | TTTA | GAGTTACTAGGGAGAGAGTG | 240 | |
PS-R23 | TTTA | AAGGAGACCAGTGAAGTTTC | 241 | |
PS-R24 | TTTG | GATCTCAGGTAATCCGCCAG | 242 | |
PS-R25 | TTTA | AGTAAAGTACATAATTATAG | 243 | |
PS-R26 | TTTG | AGACCAGCCCGGCCAACATG | 244 |
선정된 프로토스페이서 서열을 기초로 가이드 RNA를 설계하였다. 가이드 RNA는 표적 서열에 상보적으로 결합하는 가이드 서열을 가진다. 이러한 가이드 서열은 프로토스페이서 서열을 이용해 설계할 수 있다. 상기 프로토스페이서 서열은 표적 서열과 상보적인 결합을 하는 서열로, 프로토스페이서 서열과 표적 서열 간의 상관관계는 표적 서열과 가이드 서열 간의 상관관계와 유사하다. 이러한 특징에 의해, 일반적으로 가이드 서열 설계시 프로토스페이서 서열을 이용하여 설계할 수 있다. 즉, 표적 서열에 상보적으로 결합하는 가이드 서열을 설계시, 가이드 서열은 프로토스페이서 서열과 동일한 염기서열을 가지는 뉴클레오타이드 서열로 설계할 수 있다. 이때, 프로토스페이서 서열의 염기서열 중 T는 U로 대체하여 가이드 서열을 설계한다. 따라서, 상기 선정된 프로토스페이서 서열을 이용해 가이드 서열을 설계하였고, 이는 앞서 기재한 표 3 및 4에 정리하였다.
실시예 2. 가이드 서열 선정
선정된 프로토스페이서 서열을 기초로 설계된 가이드 RNA를 암호화하는 핵산 서열을 cassette로 제작하여 HEK-293T cell에 Cas14a1 vector와 함께 FuGENE HD를 이용하여 Transfection하였다. 이때, 상기 가이드 RNA의 가이드 서열은 앞서 기재한 표 3 및 4와 같고, 상기 가이드 RNA의 스캐폴드 서열은 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 126) 서열을 이용하였다. 더불어, 상기 가이드 RNA는 3' 말단에 U-rich tail 서열인 5'-U4AU4-3' 서열을 포함하도록 설계하였다. Transfection 후 60 ~ 72시간 된 cell의 gDNA를 이용하여 NGS로 indel efficiency를 확인하였다. 분석결과, 가이드 서열로 각각 F14, F16, F17 및 R22를 가지는 가이드 RNA의 경우 높은 인델 효율을 보였다(도 2).
Target region | Name | Guide sequence (20nt) | SEQ ID NO | NGS | %Indel |
F region | Guide-F14 | UUCUGGGUACAGGGGUAAGA | 64 | O | 34.40 |
Guide-F16 | UAGUGGCUGAAUGACUUCUG | 66 | O | 17.07 | |
Guide-F17 | UUCCCACAUAACACACACAC | 67 | O | 26.60 | |
R region | Guide-R22 | GAGUUACUAGGGAGAGAGUG | 96 | O | 26.73 |
Guide-R23 | AAGGAGACCAGUGAAGUUUC | 97 | O | 0.16 | |
Guide-R24 | GAUCUCAGGUAAUCCGCCAG | 98 | O | 0.21 |
이러한 결과를 기초로, F 영역을 표적하는 가이드 서열인 F14, F16 또는 F17를 가지는 가이드 RNA와 R 영역을 표적하는 가이드 서열인 R22을 가지는 가이드 RNA를 조합하여 세트를 구성하고, 각 세트의 CEP290 유전자의 일부 영역의 deletion 효율을 비교해 보았다. 그 결과, 아무것도 처리하지 않은 대조군인 NT는 3672 bp의 band가 나오지만, F14 X R22 세트(즉, 가이드 서열로 F14를 가지는 가이드 RNA와 가이드 서열로 R22를 가지는 가이드 RNA)에서는 약 2500 bp가 deletion되어 약 1170 bp의 band가 나타났고, F16 X R22 세트(즉, 가이드 서열로 F16를 가지는 가이드 RNA와 가이드 서열로 R22를 가지는 가이드 RNA)에서는 약 2700 bp가 deletion되어 1000 bp의 band가 나타났다. 또한, F17 X R22 세트(즉, 가이드 서열로 F17를 가지는 가이드 RNA와 가이드 서열로 R22를 가지는 가이드 RNA)에서는 약 2750 bp가 deletion되어 950 bp의 band가 나타났다. Deletion band의 intensity를 비교해본 결과, NGS결과와 마찬가지로 F14 X R22 세트가 가장 좋은 효율을 나타내는 것을 확인하였다(도 3).
실시예 2-1. CEP290 유전자의 일부 영역 결실(deletion) 확인
앞서 높은 인델 효율을 보이는 가이드 RNA 세트, 즉, F14 X R22 세트(즉, 가이드 서열로 F14를 가지는 가이드 RNA와 가이드 서열로 R22를 가지는 가이드 RNA)를 암호화하는 핵산을 T-Blunt end cloning을 통해 Cassette를 vector화하여 CEP290 유전자의 일부 영역의 deletion을 추가 확인하였다. 효율 비교를 위해 대조군으로 EDIT101(Morgan L. Maeder et al., Nature Medicine, 25, 229-233 (2019))을 이용하였다.
HEK-293T에 transfection하여 deletion을 확인해 본 결과, 실험군과 대조군의deletion band의 size 차이가 커서 intensity로 효율을 판단하기는 어려웠으나, 아무것도 처리하지 않은 음성 대조군인 NT의 band와 동일한 사이즈의 band(즉, CRISPR/Cas system에 의해 잘리지 않은 부분)에 대한 intensity를 비교한 결과, Cas14a1 및 F14 X R22의 band intensity가 EDIT101보다 낮은 것을 확인하였다. 이러한 결과로 Cas14a1 및 F14 X R22에 의해 더 높은 deletion 효율을 보임을 예측할 수 있었다(도 4).
또한, ARPE19-HPV에 transfection하여 deletion을 확인해 본 결과, transfection 효율이 좋지 않지만, deletion band의 intensity로 가늠하였을 때 Cas14a1 및 F14 X R22의 deletion band의 size가 더 작음에도 불구하고 intensity가 더 높아 EDIT101보다 더 높은 효율임을 확인하였다(도 5).
실시예 3. 가이드 서열 선정
선정된 프로토스페이서 서열을 기초로 설계된 가이드 RNA를 암호화하는 핵산 서열을 cassette(PCR amplicon)로 제작하여 HEK-293T cell에 Cas14a1 vector와 함께 FuGENE HD를 이용하여 Transfection하였다. 이때, 상기 가이드 RNA의 가이드 서열은 앞서 기재한 표 3 및 4와 같고, 상기 가이드 RNA의 스캐폴드 서열은 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3' (SEQ ID NO: 125) 서열을 이용하였다. 더불어, 상기 가이드 RNA는 3' 말단에 U-rich tail 서열인 5'-U4AU4-3' 서열을 포함하도록 설계하였다. Transfection 후 60 ~ 72시간 된 cell의 gDNA를 이용하여 NGS로 indel efficiency를 확인하였다. 분석결과, 가이드 서열로 각각 F10, F14, F16, F17, R05, R07, R18, R20, R22 및 R26을 가지는 가이드 RNA의 경우 높은 인델 효율을 보였다.
Target region | Name | Guide sequence (20nt) | SEQ ID NO | NGS | %Indel |
F region | Guide-F01 | UAGAAAAUUAUGCCUAUUUA | 51 | O | 0.01 |
Guide-F02 | GCAAAAGCAGCAGAAAGCAA | 52 | O | 0 | |
Guide-F03 | GUAGGAAUCCUGAAAGCUAC | 53 | O | 0.01 | |
Guide-F04 | CUGAGGACAGAACAAGCUCC | 54 | O | 0.14 | |
Guide-F05 | GGAAAAUGAUAACGUUAAAC | 55 | O | 0.01 | |
Guide-F06 | CUGAAUGUGUCUCUAUGAGC | 56 | O | 0.05 | |
Guide-F07 | UUCAUCUUCCUCAUCAGAAA | 57 | O | 0 | |
Guide-F08 | GAUUAUUCUUAUCUAAGAUC | 58 | O | 0.01 | |
Guide-F09 | UCAAUAUUAUUUAGAAGUAA | 59 | O | 0 | |
Guide-F10 | CAGAGUGCAUCCAUGGUCCA | 60 | O | 34.1 | |
Guide-F11 | UUCCUUGGAAUGGAUGUAGC | 61 | O | 1.44 | |
Guide-F12 | ACCAGACAUCUAAGAGAAAA | 62 | O | 0.42 | |
Guide-F13 | UUCUACAUUAAAAUUCUACA | 63 | O | 0.01 | |
Guide-F14 | UUCUGGGUACAGGGGUAAGA | 64 | O | 43.12 | |
Guide-F15 | AUUCAGCUAAAUCAUGCAAG | 65 | O | 2.82 | |
Guide-F16 | UAGUGGCUGAAUGACUUCUG | 66 | O | 26.74 | |
Guide-F17 | UUCCCACAUAACACACACAC | 67 | O | 26.33 | |
Guide-F18 | UAACUAAACUGAAUGAAUAA | 68 | O | 0.42 | |
Guide-F19 | AUUAAAAUCUGCCAAAUCCC | 69 | O | 0.31 | |
Guide-F20 | UGUUUGGGGGGAUUUGGCAG | 70 | O | 0.25 | |
Guide-F21 | UGUGAUUCUUGAACCUUGUG | 71 | O | 0.02 | |
Guide-F22 | UUCUACAAUAAAAAAUGAUG | 72 | O | 0 | |
Guide-F23 | CUGGCUCAUAGAGACACAUUC | 73 | O | 0.97 | |
Guide-F24 | AGCUAAUAGAAUUAGAUCUUA | 74 | O | 0.75 | |
R region | Guide-R01 | AGAGGUAAAGGUUCAUGAGA | 75 | O | 1.39 |
Guide-R02 | GCACAGAGUUCAAGCUAAUA | 76 | O | 0.04 | |
Guide-R03 | CAUAUCUGUCUUCCUUAAUG | 77 | O | 1.47 | |
Guide-R04 | AUGGAACAAAGUCACUCCUG | 78 | O | 1.53 | |
Guide-R05 | CCCUUCAGGUAACCGGUAGC | 79 | O | 10.12 | |
Guide-R06 | GAAUGAUCAUUCUUGUGGCA | 80 | O | 0.01 | |
Guide-R07 | AGGCGGGGAGUCACAUGGGA | 81 | O | 15.85 | |
Guide-R08 | CCUCUCAAAAAGCAACAAUA | 82 | O | 0.13 | |
Guide-R09 | AAACAGGAAUAGAAAUUCAC | 83 | O | 0.01 | |
Guide-R10 | UUCCAUUAAAAAAAGUAUGC | 84 | O | 0.03 | |
Guide-R11 | AUUUGUUUCUGUGUGUUGAG | 85 | O | 0 | |
Guide-R12 | UAUUUCCUUAUUAUCUAUUC | 86 | O | 0 | |
Guide-R13 | AUAGUAGAAGAAAAAAGAAA | 87 | O | 0 | |
Guide-R14 | AGAUCCCCUUGAAACACAGG | 88 | O | 0 | |
Guide-R15 | CAAUUCCUGUGUUUCAAGGG | 89 | O | 0.02 | |
Guide-R16 | UCACUGAAAUCCAUUGCUUA | 90 | O | 0.04 | |
Guide-R17 | UUUAUCACUGAAAUCCAUUG | 91 | O | 0.02 | |
Guide-R18 | AGUGGAGUACCUGGAAAAUA | 92 | O | 26.76 | |
Guide-R19 | GUCUCAUUACCCUGUUUGUA | 93 | X | - | |
Guide-R20 | UAUACUAUGAAUACACAGGA | 94 | O | 17.61 | |
Guide-R21 | UAACAAACAAUAGGAUUAUC | 95 | O | 0.02 | |
Guide-R22 | GAGUUACUAGGGAGAGAGUG | 96 | O | 32.09 | |
Guide-R23 | AAGGAGACCAGUGAAGUUUC | 97 | O | 0.24 | |
Guide-R24 | GAUCUCAGGUAAUCCGCCAG | 98 | O | 0 | |
Guide-R25 | AGUAAAGUACAUAAUUAUAG | 99 | O | 0.51 | |
Guide-R26 | AGACCAGCCCGGCCAACAUG | 100 | O | 7.9 |
선정된 10개의 가이드 RNA를 암호화하는 핵산을 T-Blunt end cloning을 통해 Cassette를 vector화하여 indel 효율을 NGS로 확인하였다. Vector화 후, indel 효율이 높아진 것을 확인하였다. 이 중, c.2991+1655A>G 유전자 돌연변이부위와의 위치와 indel 효율을 고려하여 가이드 서열로 각각 F10, F14, R05, R07, R18 및 R22를 가지는 가이드 RNA를 선정하였다.
Target region | Name | Guide sequence (20nt) | SEQ ID NO | NGS | %Indel |
F region | Guide-F10 | CAGAGUGCAUCCAUGGUCCA | 60 | O | 62.12 |
Guide-F14 | UUCUGGGUACAGGGGUAAGA | 64 | O | 60.66 | |
Guide-F16 | UAGUGGCUGAAUGACUUCUG | 66 | O | 53.90 | |
Guide-F17 | UUCCCACAUAACACACACAC | 67 | O | 51.60 | |
R region | Guide-R05 | CCCUUCAGGUAACCGGUAGC | 79 | O | 10.87 |
Guide-R07 | AGGCGGGGAGUCACAUGGGA | 81 | O | 19.88 | |
Guide-R18 | AGUGGAGUACCUGGAAAAUA | 92 | O | 61.41 | |
Guide-R20 | UAUACUAUGAAUACACAGGA | 94 | O | 49.58 | |
Guide-R22 | GAGUUACUAGGGAGAGAGUG | 96 | O | 58.81 | |
Guide-R26 | AGACCAGCCCGGCCAACAUG | 100 | O | 18.44 |
실시예 3-1. 가이드 서열 최적화
각 표적들의 PAM을 기준으로 19 - 25mer의 프로토스페이서 서열들을 이용해 가이드 서열의 길이를 조절하였다. 다양한 길이의 가이드 서열을 암호화하는 핵산이 포함된 Cas14a1 ver.4.0 dual vector를 제작하여 가이드 서열의 길이에 따른 indel 효율을 확인하였다(표 23).
Target region | Name | Guide sequence | SEQ ID NO | %Indel |
F region | Guide-F10-19nt | CAGAGUGCAUCCAUGGUCC | 245 | 29.89 |
Guide-F10-20nt | CAGAGUGCAUCCAUGGUCCA | 60 | 25.98 | |
Guide-F10-21nt | CAGAGUGCAUCCAUGGUCCAG | 246 | 30.23 | |
Guide-F10-22nt | CAGAGUGCAUCCAUGGUCCAGG | 247 | 34.55 | |
Guide-F10-23nt | CAGAGUGCAUCCAUGGUCCAGGA | 248 | 29.69 | |
Guide-F10-24nt | CAGAGUGCAUCCAUGGUCCAGGAA | 249 | 28.23 | |
Guide-F10-25nt | CAGAGUGCAUCCAUGGUCCAGGAAG | 250 | 17.80 | |
Guide-F14-19nt | UUCUGGGUACAGGGGUAAG | 251 | 30.98 | |
Guide-F14-20nt | UUCUGGGUACAGGGGUAAGA | 64 | 45.89 | |
Guide-F14-21nt | UUCUGGGUACAGGGGUAAGAG | 252 | 33.98 | |
Guide-F14-22nt | UUCUGGGUACAGGGGUAAGAGA | 253 | 36.91 | |
Guide-F14-23nt | UUCUGGGUACAGGGGUAAGAGAA | 254 | 30.22 | |
Guide-F14-24nt | UUCUGGGUACAGGGGUAAGAGAAA | 255 | 35.21 | |
Guide-F14-25nt | UUCUGGGUACAGGGGUAAGAGAAAG | 256 | 25.35 | |
R region | Guide-R05-19nt | CCCUUCAGGUAACCGGUAG | 257 | 3.86 |
Guide-R05-20nt | CCCUUCAGGUAACCGGUAGC | 79 | 8.51 | |
Guide-R05-25nt | CCCUUCAGGUAACCGGUAGCUUUUG | 258 | 5.19 | |
Guide-R07-19nt | AGGCGGGGAGUCACAUGGG | 259 | 13.47 | |
Guide-R07-20nt | AGGCGGGGAGUCACAUGGGA | 81 | 15.18 | |
Guide-R07-21nt | AGGCGGGGAGUCACAUGGGAG | 260 | 16.17 | |
Guide-R07-23nt | AGGCGGGGAGUCACAUGGGAGUC | 261 | 16.27 | |
Guide-R07-24nt | AGGCGGGGAGUCACAUGGGAGUCA | 262 | 14.55 | |
Guide-R07-25nt | AGGCGGGGAGUCACAUGGGAGUCAC | 263 | 14.02 | |
Guide-R18-20nt | AGUGGAGUACCUGGAAAAUA | 92 | 33.95 | |
Guide-R18-21nt | AGUGGAGUACCUGGAAAAUAA | 264 | 37.51 | |
Guide-R18-22nt | AGUGGAGUACCUGGAAAAUAAG | 265 | 35.78 | |
Guide-R18-23nt | AGUGGAGUACCUGGAAAAUAAGC | 266 | 34.25 | |
Guide-R18-24nt | AGUGGAGUACCUGGAAAAUAAGCC | 267 | 27.90 | |
Guide-R18-25nt | AGUGGAGUACCUGGAAAAUAAGCCA | 268 | 21.53 | |
Guide-R22-20nt | GAGUUACUAGGGAGAGAGUG | 96 | 37.03 | |
Guide-R22-21nt | GAGUUACUAGGGAGAGAGUGA | 269 | 33.96 | |
Guide-R22-23nt | GAGUUACUAGGGAGAGAGUGAUG | 270 | 34.37 | |
Guide-R22-24nt | GAGUUACUAGGGAGAGAGUGAUGA | 271 | 35.54 | |
Guide-R22-25nt | GAGUUACUAGGGAGAGAGUGAUGAA | 272 | 38.90 |
실시예 4. ARPE19/HPV16-LCA10 cell line 제작
앞서 스크리닝을 통해 선별된 가이드 RAN를 이용해 IVS26 돌연변이를 가지는 CEP290 유전자의 인위적 조작 효과를 확인하기 위해, IVS26 돌연변이를 가지는 CEP290 유전자를 포함하는 ARPE19/HPV16-LCA10 cell line 제작하였다. ARPE19/HPV16-LCA10 cell line 제작 전략을 간단히 설명하면, CRIPSR/Cas9 system 및 single-strand oligonucleotide(ssODN)을 이용하여 CEP290 유전자좌의 인트론 26에 점 돌연변이(c.2991+1655A>G)를 도입하도록 실험을 설계하였다(도 6). 이를 위해, CRIPSR/Cas9 system을 위한 표적 서열은 5'-ATCCCTATTGGCAGTGTCTT-3'(SEQ ID NO: 273) 서열이며, 도너 서열, 즉, ssODN은 5'- GAGCCACCGCACCTGGCCCCAGTTGTAATTGTGAGTATCTCATAGATATCCCTATTGGCAGTGTCTTAGTTTTATTTTTTATTATCTTTATTGTGGCAGC-3' (SEQ ID NO: 274) 서열을 이용하였다. 이때, 상기 도너 서열 중 밑줄 친 서열이 점 돌연변이이다. 실험에 이용한 CRISPR/Cas9 system 발현을 위한 벡터에 puromycin 저항성 유전자를 함께 넣어 selection을 쉽게 하였다. CRISPR/Cas9 system 발현 벡터 및 ssODN를 함께 ARPE19 세포에 transfection하여 CRISPR/Cas9 system에 이해 표적 서열이 절단되고 ssODN을 이용해 HDR에 의해 수복되면서 목적하는 CEP290 유전자좌의 인트론 26에 점 돌연변이(c.2991+1655A>G)를 도입하였다.
이렇게 제작된 ARPE19/HPV16-LCA10 cell은 앞서 기재한 표 18의 프라이머 세트를 이용하여 PCR을 이용해 1차 확인하였다. 그 결과, A2, A3, A7, C1, C2, C5~7, E8~12, F1~F12 후보 cell에서 397bp의 band를 확인하였다(도 7). 해당 후보 cell들의 PCR Product를 정제하여 Macrogen에 시퀀싱 분석을 의뢰하였고, 시퀀싱 분석한 결과, C7 세포(AC7 세포)에서 c.2991+1655A>G Mutation 확인하였다. 나머지 세포에서는 Cas9의 타겟 부분인 CCT 뒤쪽으로 deletion 및 insertion이 확인되었다(도 8).
실시예 4-1. LCA10-AC7 clone expression analysis
앞서 수득한 AC7 세포(이하, LCA10-AC7 세포)의 clone과 ARPE19/HPV16 (WT)의 cell에서 RNA를 추출하여 cDNA를 합성하였다 (RNA extraction: Rneasy kit, Qiagen; cDNA 합성: TOPscript RT DryMIX, enzynomics). RNA 추출과정과 cDNA 합성과정은 제조사의 매뉴얼을 따라 진행하였다. 획득한 cDNA를 10ng 동량으로 아래의 Primer를 이용하여 qRT-PCR 및 RT-PCR(1.5% Agarose gel, 100v, 20분간 전기영동 실시)을 진행하였다.
Target | Primer set | Product size | |
Wt cDNA (exon 26) |
CEP290 WT F#01 | CCATTTTCAAGATTGCAGCTCTCCAA (SEQ ID NO: 275) |
166 bp |
CEP290 WT R#01 | TCCAGGTGTTCCAAGTTACTTGTTCT (SEQ ID NO: 276) |
||
Mutation cDNA (exon 26~28) |
CEP290 Mu F#02 | TGACTGCTAAGTACAGGGACATCTTG (SEQ ID NO: 277) |
173 bp |
CEP290 Mu R#02 | Atctgtaatcccagcactttaggagg (SEQ ID NO: 278) |
Target | Primer set | Product size | |
26-X-27 (26-27) |
CEP290 WT F#02 | AGGAAATGGCCATTTTCAAGATTGCA (SEQ ID NO: 279) |
340 bp (212 bp) |
CEP290 cDNA Screening R#02 | AGACTCCACTTGTTCTTTTAAGGAG (SEQ ID NO: 280) |
qRT-PCR 결과는 2^-ddCt 방식을 통하여 WT과 상대적 정량을 실시하였다. ARPE-19/HPV16 CEP290 WT와 LCA10-AC07 CEP290 WT mRNA를 비교하였고(도 9), ARPE-19/HPV16 CEP290 mutation mRNA (X-27)과 LCA10-AC07 CEP290 mutation mRNA(X-27) 비교하였다(도 10). 그 결과, C.2991+1655A>G mutation의 발생으로 인하여 WT mRNA와 mutation mRNA의 발현이 WT인 ARPE-19/HPV16과 다른 경향성을 보이는 것을 확인하였다. C.2991+1655A>G mutation이 발생하여 Cryptic exon X가 발현된 경우, 전체 CEP290 mRNA 중 WT의 비율이 감소하였고 mutation mRNA의 비율이 증가하였다. 따라서, 유전자가위로 해당 부분을 교정하면 다시 WT의 비율이 증가하고 mutation mRNA의 비율이 감소한다(Morgan L. Maeder et al., Nature Medicine, 25, 229-233 (2019)).
또한, RT-PCR 결과, 26-27 band (212bp)는 WT 및 LCA10-AC7 세포에서 모두 검출되었고, 26-X-27 band (340bp)는 LCA10-AC7 세포에서만 검출되어 LCA10-AC7 세포의 CEP290 유전자좌의 인트론 26에 점 돌연변이(c.2991+1655A>G)에 의해 cryptic exon X이 생성됨을 확인하였다(도 11).
실시예 4-2. ARPE19/HPV16-LCA10 cell line 추가 제작
앞서 수득한 LCA10-AC7 세포만을 대상으로 in vitro assay의 정확도를 확인하기 어려우므로, 추가적인 ARPE19/HPV16-LCA10 세포의 확보하고자 추가 제작하였다. 제작 방법은 앞서 제작한 방법과 동일하다. 추가로 제작한 결과, LCA10-BC8 cell, LCA10-BD5 cell에서 CEP290 유전자좌의 인트론 26에 점 돌연변이(c.2991+1655A>G)가 확인되었다(도 12).
수득한 LCA10-AC7 cell, LCA10-BC8 cell, LCA10-BD5 cell의 각각의 clone과 ARPE19/HPV16 (WT)의 cell에서 RNA를 추출하여 cDNA를 합성하였다 (RNA extraction: Rneasy kit, Qiagen; cDNA 합성: TOPscript RT DryMIX, enzynomics). RNA 추출과정과 cDNA 합성과정은 제조사의 매뉴얼을 따라 진행하였다. 획득한 cDNA를 10ng 동량으로 아래의 Primer를 이용하여 qRT-PCR 및 RT-PCR(1.5% Agarose gel, 100v, 20분간 전기영동 실시)을 진행하였다. RT-PCR 관련 프라이머 정보는 앞서 기재한 표 24의 프라이머 정보와 동일하다.
Target | Primer set | Product size | |
Mutation cDNA (exon 26~28) |
CEP290 Mu F#03 | tagagatggggtttcaccttgttagc (SEQ ID NO: 281) |
164 bp |
CEP290 cDNA Screening R#02 | AGACTCCACTTGTTCTTTTAAGGAG (SEQ ID NO: 282) |
RT-PCR 결과, 26-27 band (212bp)는 WT 및 LCA10-AC7 cell, LCA10-BC8 cell, LCA10-BD5 cell에서 모두 검출되었고, 26-X-27 band (340bp)는 LCA10-AC7 cell, LCA10-BC8 cell, LCA10-BD5 cell에서만 검출되었고, 또한, X-27 band (164bp)도 LCA10-AC7 cell, LCA10-BC8 cell, LCA10-BD5 cell에서 검출되었다. 이를 통해 LCA10-AC7 cell, LCA10-BC8 cell, LCA10-BD5 cell에서 CEP290 유전자좌의 인트론 26에 점 돌연변이(c.2991+1655A>G)에 의해 cryptic exon X이 생성됨을 확인하였다(도 13).
또한, LCA10-BC8 cell, LCA10-BD5 cell에서 cryptic exon X의 발현양을 확인하였다. 이때, 먼저 제작된 LCA10-AC7 cell의 cryptic exon X mRNA의 발현을 기준으로 각각의 발현양을 비교하였다. 그 결과, LCA10-BC8 cell의 cryptic exon X의 발현이 LCA10-AC7 cell보다 약간 더 증가한 것을 확인한 반면, LCA10-BD5 cell의 경우, cryptic exon X의 발현이 LCA10-AC7 cell에 비해 약 30% 정도 낮은 것으로 확인되었다(도 14).
실시예 5. LCA10 Cas12f1 치료제 efficiency 확인
앞서 제작한 LCA10-AC7 cell, LCA10-BC8 cell, LCA10-BD5 cell을 사용하여 Dual gRNA vector와 One vector의 효율을 비교 분석한 결과, BC8 clone에서 가장 유의미한 결과를 얻었다. 이러한 결과를 토대로 Cas12f1 기반 LCA10 치료제의 효율을 확인하기 위하여 LCA10-BC8 cell을 이용하여 효율 평가를 실시하였다. 이때, 실험에 이용된 가이드 RNA는 앞서 스크리닝을 통해 선별한 F14를 가이드 서열로 가지는 가이드 RNA와 R22를 가이드 서열로 가지는 가이드 RNA를 이용하였다. 상기 두 개의 가이드 RNA를 이용해 CEP290 유전자좌의 인트론 26에 존재하는 점 돌연변이(c.2991+1655A>G)를 제거하여 cryptic exon X의 생성을 저해하고자 하였다.
LCA10 Cas12f1 치료제 efficiency 확인을 위해, Transfection 하루 전에 LCA10-BC8 cell를 다음 날 70% confluency가 되도록 seeding 하였다. 다음 날 Cas12f1_LCA10_F14_vector (1 ㎍) + Cas12f1_LCA10_R22_vector (1 ㎍) + FuGENE HD 6 ㎍을 혼합하고 상온에서 20분 반응 후 transfection을 실시하였다. 72시간 후 transfection된 LCA10-BC8 cell과 ARPE19/HPV16 (WT) Cell의 RNA를 추출하여 cDNA를 합성하였다 (RNA extraction: Rneasy kit, Qiagen; cDNA 합성: TOPscript RT DryMIX, enzynomics). RNA 추출과정과 cDNA 합성과정은 제조사의 매뉴얼을 따라 진행하였다. 획득한 cDNA를 10ng 동량으로 아래의 Primer를 이용하여 qRT-PCR 및 RT-PCR을 진행하였다. RT-PCR 관련 프라이머 정보는 앞서 기재한 표 24의 프라이머 정보와 동일하며, qRT-PCR 관련 프라이머 정보는 앞서 기재한 표 25의 프라이머 정보와 동일하다. qRT-PCR 결과는 2^-ddCt 방식을 통하여 WT과 상대적 비교정량을 실시하였다. RT-PCR 결과는 2% Agarose gel(Etbr), 135V, 15분간 전기영동을 실시하였다. cDNA를 sequencing하여 cryptic exon의 시그널을 확인하였다.
그 결과, F14를 가이드 서열로 가지는 가이드 RNA와 R22를 가이드 서열로 가지는 가이드 RNA에 의해 CEP290 유전자의 X-27의 발현이 감소하는 것을 확인하였다(도 15). 더불어, RT-PCR에서도 상기 두개의 가이드 RNA에 의해 26-X-27 band의 양이 감소하는 것을 확인하였다(도 16). 또한, 상기 두개의 가이드 RNA에 의해 타겟하는 영역이deletion 되는 것도 확인하였다. 이때, 비교군으로 EDIT101을 이용하였다.
실시예 6. 661W mouse LCA10 질환모델 Cell line 제작 및 선별
실시예 6-1. 661W mouse LCA10 질환모델 Cell line 제작
661W mouse LCA10 질환모델 Cell line을 제작하였다. 《실시예 4. ARPE19/HPV16-LCA10 cell line 제작》 단락에 기재된 방법과 유사하게 진행하되, ARPE19/HPV16 cell 대신 661W mouse cell을 사용하였다. 또한, 661W 마우스 세포는 ARPE19 세포와는 달리 점 돌연변이를 도입하는 대신, IVS26 돌연변이를 포함하는 인간 엑손 26 내지 엑손 27 부위의 서열 전체를 Homology-directed repair(HDR) 방법을 이용하여 삽입하였다.
구체적으로, Mouse CEP290 유전자의 엑손 25 및 엑손 26을 표적으로 하여 해당 서열을 deletion 시키고, 서열번호 476의 도너 서열을 사용하여 IVS26 돌연변이를 포함하는 인간 엑손 26 내지 엑손 27 부위의 서열 전체를 Homology-directed repair(HDR)방법을 통하여 삽입하였다. 또한, 실시예 4에서 사용한 puromycin 저항성 유전자 대신, 상기 도너 서열의 Right Homology Arm에 Neomycin 저항성 유전자를 함께 삽입하여 selection이 가능하도록 하였다.
상기 661W/LCA10 cell 제작 모식도를 도 17에 나타내었다.
실시예 6-2. 661W/LCA10 Cell screening
《12. ARPE19/HPV16-LCA10 Cell screening》 단락에 기재된 방법과 유사한 방법으로 661W/LCA10 Cell screening을 진행하였다.
이때, Puromycin 대신 Neomycin(600μg/ml)에 의해 Selection을 진행하였다.
selection 된 clone의 DNA를 추출하고, 1) Inner Primer F(5'-TGTGGCAGCCATTATTCCTGTCTCTA-3'(SEQ ID NO:487)) 및 Inner Primer R(5'-GCAACACAGTGAGACTCTGTTTCAAA-3'(SEQ ID NO:488)), 2) Left Arm Primer F(5'-TCTTCTGTGGCTATCATGAGAGCGTC-3'(SEQ ID NO:491)) 및 Left Arm Primer R(5'-TGGGTACAGGGGTAAGAGAAAGGGAT-3'(SEQ ID NO:492)), 및 3) Right Arm Primer F(5'-GGAACTATGATTCAAGATGAGATTTGGGTA-3'(SEQ ID NO:489)) 및 Right Arm Primer R(5'-TTGGACACTTCAACTTTGAGCTCC-3'(SEQ ID NO:490))을 각각 사용한 PCR을 통하여 insertion 된 서열이 잘 들어갔는 지 확인하였다.
그 후, Sanger sequencing을 통하여 전체 서열이 정확하게 들어갔는 지 확인하였다.
해당 muatation이 포함되어 있는 세포는 다음 명명법에 의하여 세포 이름을 붙였다: A~H, 1~12 숫자 (A ~ H: 96well의 행 문자; 1 ~ 12 숫자: 각 행의 열에 해당하는 숫자, 예를 들어, E08: 96well E행, 8번째 열의 clone).
이후, 각각의 Clone에 대해 26-X-27의 발현 (X는 Cryptic exon X를 의미함)을 RT-PCR을 통하여 확인하였다 (도 18). 사용한 Primer set은 아래 [표 27]과 같다.
Primer set | ||||
Target | PCR product | Primer name | Sequence | Product size |
Human CEP290 exon 26-27 |
26-X-27 | CEP290 WT F#02 | AGGAAATGGCCATTTTCAAGATTGCA | 212 bp (340 bp) |
Screening R#02 | AGACTCCACTTGTTCTTTTAAGGAG |
이후, Mouse cell line에서는 cryptic exon X 외, Y, Z의 발현이 나타나기 때문에, cryptix exon X의 발현이 높은 cell line을 선별하기 위해, X-27의 발현을 RT-PCR을 통하여 확인하고, 최적의 Clone을 선별하였다. 사용한 Primer set은 아래 [표 28]과 같다.
Primer set | ||||
Target | PCR product | Primer name | Sequence | Product size |
Human CEP290 cryptic exon X |
X-27 | CEP290 Mu F#3 | tagagatggggtttcaccttgttagc | 164 bp |
CEP290 cDNA Screening R#02 | AGACTCCACTTGTTCTTTTAAGGAG |
실험 결과, X-27의 발현율이 가장 높은 661W/LCA10-E08 clone을 선별하여 실험에 사용하였다 (도 19 및 도 20).
실시예 7. 661W/LCA10 cell line에 대한 CEP290 유전자의 일부 영역 결실(deletion) 확인
실시예 6에서 제작된 661W/LCA10-E08 cell line에 대해, LCA10 Cas12f1 치료제의 CEP290 유전자의 일부 영역 결실(deletion) 확인을 진행하였다.
구체적으로, 《실시예 2-1. CEP290 유전자의 일부 영역 결실(deletion) 확인》 단락의 기재내용과 유사한 방법으로 진행하되, 1) 단일 벡터에서 Cas12f1 (Cas14a1) 단백질, F region을 표적하는 가이드 RNA, 및 R region을 표적하는 가이드 RNA를 모두 발현할 수 있는 One-vector system을 사용하였고, 2) HEK-293T 세포 대신 실시예 6에서 제조한 661W/LCA10-E08 세포를 사용하였으며, 3) F14 X R18 및 F14 X R22 가이드 서열을 사용하여 결실 여부를 확인하였다.
RT-PCR에 사용한 Primer set은 다음 [표 29]와 같다.
Primer set | |||
Target | Primer name | Sequence | Product size |
Human CEP290 | CEP290 qPCR F#1 | TGGACCAGACCCTTTGTAGTTATCTT | 197 bp |
CEP290 qPCR R#1 | TGAGCCAGCAAAAGCTTTTGAGCT | ||
CEP290 64 qPCR F#01 | CTTACATCCTCCTTACTGCCACAAGA | 195 bp | |
CEP290 64 qPCR R#01 | actgtggtcagaaaactcagctagtt |
실험결과, 아무것도 처리하지 않은 음성 대조군인 WT의 밴드와 동일한 사이즈의 밴드에 대한 신호 강도(intensity)를 비교한 결과, Cas12f1 F14+R18, 및 Cas12f1 F14+R22의 밴드 신호 강도가 EDIT101보다 낮은 것을 확인하였다 (도 21). 또한, q-PCR을 통해 deletion 여부를 확인한 결과, Cas12f1 F14+R18 및 Cas12f1 F14+R22의 deletion 효율이 EDIT101보다 높은 것을 확인할 수 있었다 (도 22).
실시예 8. Cas12f1 변이체에 대한 Target screening
실시예 8-1. Cas12f1 변이체에 대한 Target screening 1
서열번호 288의 Cas12f1 변이체 (Candidatus Woesearchaeota archaeon 유래의 Transposon-associated transposase B; TnpB로도 알려져 있음)에 대한 효율적인 표적 서열을 스크리닝하기 위해, 《실시예 2. 가이드 서열 선정》 단락에 기재된 실험방법과 유사한 실험을 진행하였다.
이때, 1) 가이드 RNA의 스캐폴드 서열은 5'-ACCGCTTCACCAAAAGCTGTCCCTTAGGGGATTAGAACTTGAGTGAAGGTGGGCTGCTTGCATCAGCCTAATGTCGAGAAGTGCTTTCTTCGGAAAGTAACCCTCGAAACAAAGAAAGGAATGCAAC-3' (SEQ ID NO: 477)이고, 2) U-rich tail 서열로 5'-UUUUAUUUU-3'을 사용하였으며, 2) 가이드 서열은 표 3 및 표 4 중 F10, F11, F12, F14, F15, F16, F17, F18, F23, F24, R01, R03, R04, R05, R07, R18, R20, R22, R23, 및 R26에 대해 각각 진행하였다.
실험 결과, F24를 제외한 대부분의 표적에서 인델 효율이 나타났으며, 특히 F10, F14, F16, F17, R18, 및 R22에서 높은 인델 효율이 나타났다 (도 23 및 도 24).
실시예 8-2. Cas12f1 변이체에 대한 Target screening 2
실시예 8-1에서 높은 인델 효율을 보인 F14, R18, 및 R22 표적에 대해, 각기 다른 가이드 서열의 효율을 비교하였다.
구체적으로, 《실시예 2. 가이드 서열 선정》 단락에 기재된 실험방법과 유사한 실험을 진행하되, 1) 가이드 RNA의 스캐폴드 서열로 5'-ACCGCTTCACCAAAAGCTGTCCCTTAGGGGATTAGAACTTGAGTGAAGGTGGGCTGCTTGCATCAGCCTAATGTCGAGAAGTGCTTTCTTCGGAAAGTAACCCTCGAAACAAAGAAAGGAATGCAAC-3' (SEQ ID NO: 477) (ver 4.0으로 표기), 및 5'-ACCGCUUCACCGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAgaaaGGAAUGCAAC-3' (SEQ ID NO: 478) (ver 4.1로 표기)를 각각 사용하였으며, 2) U-rich tail 서열로 5'-UUUUAUUUU-3'을 사용하였으며, 2) 가이드 서열은 표 3 및 표 4 중 F14, F18, 및 R22를 각각 사용하였다.
또한, 서열번호 288의 Cas12f1 변이체 및 가이드 RNA를 발현하는 One vector system을 제조하여 transfection에 사용하였으며, 구체적으로, px458-TnpB-GE vector (TnpB, gRNA scaffold Bbsl cloning)을 사용하고, Bbsl enzyme을 사용하여 가이드 서열을 클로닝하여 사용하였다 (도 26 및 도 27).
실험 결과, 서열번호 477 (Ver4.0) 및 서열번호 478 (Ver.4.1)의 가이드 RNA 스캐폴드 모두에 대해 유의미한 인델 효율이 나타났으며, 전반적으로 서열번호 477의 가이드 RNA 스캐폴드를 사용한 결과가 조금 더 높은 인델 효율을 보이는 것으로 나타났다 (도 25).
실시예 8-3. Cas12f1 변이체에 대한 Target screening 3
가이드 서열의 길이를 최적화하기 위해, 《실시예 3-1. 가이드 서열 최적화》 단락에 기재된 실험방법과 유사한 실험을 진행하였다.
구체적으로, 1) 서열번호 288의 Cas12f1 변이체, 서열번호 477의 가이드 RNA 스캐폴드 서열, 및 5'-UUUUAUUUU-3'의 U-rich tail을 암호화하는 핵산을 포함하고, 2) 다양한 길이의 가이드 서열을 암호화하는 핵산이 포함된 px458-TnpB-GE vector (TnpB, gRNA scaffold Bbsl cloning)을 사용하고, Bbsl enzyme을 사용하여 가이드 서열을 클로닝하였고, 2) [표 23]에 기재된 가이드서열 중 Guide-F14-19nt 내지 Guide-F14-25nt, Guide-R18-20nt 내지 Guide-R18-25nt, 및 Guide-R22-20nt 내지 Guide-R22-25nt의 가이드 서열을 각각 사용하여 실험을 진행하였다.
실험 결과, 다양한 스페이서 길이에 대해 모두 높은 활성을 보였다 (도 28 내지 도 30).
실시예 9. LCA10 Cas12f1 변이체 치료제 efficiency 확인
실시예 8의 결과를 토대로 Cas12f1 변이체 기반 LCA10 치료제의 효율을 확인하기 위하여, ARPE19/LCA10-BC08 Cell line 및 661W/LCA10-E08 Cell line을 이용한 효율 평가를 실시하였다.
구체적으로, 《실시예 5. LCA10 Cas12f1 치료제 efficiency 확인》 단락에 기재된 실험과 유사한 실험을 진행하되, 1) ARPE19/LCA10-BC08 cell 및 661W/LCA10-E08 cell을 사용하였고, 2) 서열번호 288의 Cas12f1 변이체를 암호화하는 핵산, 및 2개의 가이드 RNA를 암호화하는 핵산이 포함된 px458-TnpB-GE vector (TnpB, gRNA scaffold Bbsl cloning)를 사용하고, 3) 각각의 가이드 RNA는 서열번호 477의 가이드 RNA 스캐폴드 서열, 및 5'-UUUUAUUUU-3'의 U-rich tail을 구성으로 가진 것이며, 4) 사용한 2개의 가이드 RNA의 조합은 (F14 및 F18), (F14 및 R22)를 사용하였다.
이때, ARPE19/LCA10-BC08 cell line에 대해 X-27의 발현량을 확인한 방법은 《실시예 5. LCA10 Cas12f1 치료제 efficiency 확인》에 기재된 것과 동일하였고, 661W/LCA10-E08에 대해 X-27의 발현량을 확인한 방법은 《실시예 6-2. 661W/LCA10 Cell screening》에 기재된 것과 동일한 방법을 사용하였다.
실험결과, 본 발명의 LCA10 Cas12f1 변이체 치료제는 ARPE19/LCA10-BC08 Cell line 및 661W/LCA10-E08 Cell line 모두에서 X-27의 발현량을 눈에 띄게 감소시켰고, 비교군인 EDIT101보다 효과가 뛰어난 것을 확인할 수 있었다 (도 31 및 도 32).
실시예 10. NHEJ 활성 감소 인자의 deletion 효율 향상 효과 확인
LCA10 Cas12f1 치료제 및 LCA10 Cas12f1 변이체 치료제에 비-상동성 말단 결합(Non-homologous end joining DNA repair pathway; NHEJ) 활성 감소 인자를 추가로 사용하여 deletion 효율 향상 효과를 확인하고자 하였다.
HEK293T 세포에 《실시예 2-1. CEP290 유전자의 일부 영역 결실(deletion) 확인》 단락에 기재된 실험과 유사한 실험을 진행하였다.
이때, 1) Cas12f1 단백질, F14를 표적하는 가이드 RNA, R22를 표적하는 가이드 RNA, 및 NHEJ 활성 감소 인자를 암호화하는 핵산을 포함하는 One vector system, 2) 서열번호 288의 Cas12f1 단백질 변이체, F14를 표적하는 가이드 RNA, R22를 표적하는 가이드 RNA, 및 NHEJ 활성 감소 인자를 암호화하는 핵산을 포함하는 One vectore system을 각각 사용하였다.
상기 가이드 RNA는 각각 서열번호 477의 가이드 RNA 스캐폴드 영역, 5'-UUUUAUUUU-3'의 U-rich tail을 포함하였다.
또한, 사용한 NHEJ 활성 감소 인자는 서열번호 473의 shDCLRE1C-3를 암호화하는 핵산 한 단위, 또는 두 단위를 벡터에 포함시켜 실험하였고, 비교군으로는 shscramble을 사용하였다.
실험 결과, NHEJ 활성 감소 인자를 LCA10 Cas12f1 치료제, 또는 LCA10 Cas12f1 변이체 치료제와 함께 사용하는 경우 deletion 효율이 더 높아지는 결과를 확인할 수 있었다 (도 33).
<110> Genkore
Korea Research Institute of Bioscience and Biotechnology
<120> Composition and method for treating LCA10 using RNA-guided
Nuclease
<130> P220015WO
<150> KR 10-2021-0063023
<151> 2021-05-14
<160> 492
<170> KoPatentIn 3.0
<210> 1
<211> 20
<212> DNA
<213> Homo sapiens
<400> 1
taaataggca taattttcta 20
<210> 2
<211> 20
<212> DNA
<213> Homo sapiens
<400> 2
ttgctttctg ctgcttttgc 20
<210> 3
<211> 20
<212> DNA
<213> Homo sapiens
<400> 3
gtagctttca ggattcctac 20
<210> 4
<211> 20
<212> DNA
<213> Homo sapiens
<400> 4
ggagcttgtt ctgtcctcag 20
<210> 5
<211> 20
<212> DNA
<213> Homo sapiens
<400> 5
gtttaacgtt atcattttcc 20
<210> 6
<211> 20
<212> DNA
<213> Homo sapiens
<400> 6
gctcatagag acacattcag 20
<210> 7
<211> 20
<212> DNA
<213> Homo sapiens
<400> 7
tttctgatga ggaagatgaa 20
<210> 8
<211> 20
<212> DNA
<213> Homo sapiens
<400> 8
gatcttagat aagaataatc 20
<210> 9
<211> 20
<212> DNA
<213> Homo sapiens
<400> 9
ttacttctaa ataatattga 20
<210> 10
<211> 20
<212> DNA
<213> Homo sapiens
<400> 10
tggaccatgg atgcactctg 20
<210> 11
<211> 20
<212> DNA
<213> Homo sapiens
<400> 11
gctacatcca ttccaaggaa 20
<210> 12
<211> 20
<212> DNA
<213> Homo sapiens
<400> 12
ttttctctta gatgtctggt 20
<210> 13
<211> 20
<212> DNA
<213> Homo sapiens
<400> 13
tgtagaattt taatgtagaa 20
<210> 14
<211> 20
<212> DNA
<213> Homo sapiens
<400> 14
tcttacccct gtacccagaa 20
<210> 15
<211> 20
<212> DNA
<213> Homo sapiens
<400> 15
cttgcatgat ttagctgaat 20
<210> 16
<211> 20
<212> DNA
<213> Homo sapiens
<400> 16
cagaagtcat tcagccacta 20
<210> 17
<211> 20
<212> DNA
<213> Homo sapiens
<400> 17
gtgtgtgtgt tatgtgggaa 20
<210> 18
<211> 20
<212> DNA
<213> Homo sapiens
<400> 18
ttattcattc agtttagtta 20
<210> 19
<211> 20
<212> DNA
<213> Homo sapiens
<400> 19
gggatttggc agattttaat 20
<210> 20
<211> 20
<212> DNA
<213> Homo sapiens
<400> 20
ctgccaaatc cccccaaaca 20
<210> 21
<211> 20
<212> DNA
<213> Homo sapiens
<400> 21
cacaaggttc aagaatcaca 20
<210> 22
<211> 20
<212> DNA
<213> Homo sapiens
<400> 22
catcattttt tattgtagaa 20
<210> 23
<211> 21
<212> DNA
<213> Homo sapiens
<400> 23
gaatgtgtct ctatgagcca g 21
<210> 24
<211> 21
<212> DNA
<213> Homo sapiens
<400> 24
taagatctaa ttctattagc t 21
<210> 25
<211> 20
<212> DNA
<213> Homo sapiens
<400> 25
tctcatgaac ctttacctct 20
<210> 26
<211> 20
<212> DNA
<213> Homo sapiens
<400> 26
tattagcttg aactctgtgc 20
<210> 27
<211> 20
<212> DNA
<213> Homo sapiens
<400> 27
cattaaggaa gacagatatg 20
<210> 28
<211> 20
<212> DNA
<213> Homo sapiens
<400> 28
caggagtgac tttgttccat 20
<210> 29
<211> 20
<212> DNA
<213> Homo sapiens
<400> 29
gctaccggtt acctgaaggg 20
<210> 30
<211> 20
<212> DNA
<213> Homo sapiens
<400> 30
tgccacaaga atgatcattc 20
<210> 31
<211> 20
<212> DNA
<213> Homo sapiens
<400> 31
tcccatgtga ctccccgcct 20
<210> 32
<211> 20
<212> DNA
<213> Homo sapiens
<400> 32
tattgttgct ttttgagagg 20
<210> 33
<211> 20
<212> DNA
<213> Homo sapiens
<400> 33
gtgaatttct attcctgttt 20
<210> 34
<211> 20
<212> DNA
<213> Homo sapiens
<400> 34
gcatactttt tttaatggaa 20
<210> 35
<211> 20
<212> DNA
<213> Homo sapiens
<400> 35
ctcaacacac agaaacaaat 20
<210> 36
<211> 20
<212> DNA
<213> Homo sapiens
<400> 36
gaatagataa taaggaaata 20
<210> 37
<211> 20
<212> DNA
<213> Homo sapiens
<400> 37
tttctttttt cttctactat 20
<210> 38
<211> 20
<212> DNA
<213> Homo sapiens
<400> 38
cctgtgtttc aaggggatct 20
<210> 39
<211> 20
<212> DNA
<213> Homo sapiens
<400> 39
cccttgaaac acaggaattg 20
<210> 40
<211> 20
<212> DNA
<213> Homo sapiens
<400> 40
taagcaatgg atttcagtga 20
<210> 41
<211> 20
<212> DNA
<213> Homo sapiens
<400> 41
caatggattt cagtgataaa 20
<210> 42
<211> 20
<212> DNA
<213> Homo sapiens
<400> 42
tattttccag gtactccact 20
<210> 43
<211> 20
<212> DNA
<213> Homo sapiens
<400> 43
tacaaacagg gtaatgagac 20
<210> 44
<211> 20
<212> DNA
<213> Homo sapiens
<400> 44
tcctgtgtat tcatagtata 20
<210> 45
<211> 20
<212> DNA
<213> Homo sapiens
<400> 45
gataatccta ttgtttgtta 20
<210> 46
<211> 20
<212> DNA
<213> Homo sapiens
<400> 46
cactctctcc ctagtaactc 20
<210> 47
<211> 20
<212> DNA
<213> Homo sapiens
<400> 47
gaaacttcac tggtctcctt 20
<210> 48
<211> 20
<212> DNA
<213> Homo sapiens
<400> 48
ctggcggatt acctgagatc 20
<210> 49
<211> 20
<212> DNA
<213> Homo sapiens
<400> 49
ctataattat gtactttact 20
<210> 50
<211> 20
<212> DNA
<213> Homo sapiens
<400> 50
catgttggcc gggctggtct 20
<210> 51
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 51
uagaaaauua ugccuauuua 20
<210> 52
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 52
gcaaaagcag cagaaagcaa 20
<210> 53
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 53
guaggaaucc ugaaagcuac 20
<210> 54
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 54
cugaggacag aacaagcucc 20
<210> 55
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 55
ggaaaaugau aacguuaaac 20
<210> 56
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 56
cugaaugugu cucuaugagc 20
<210> 57
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 57
uucaucuucc ucaucagaaa 20
<210> 58
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 58
gauuauucuu aucuaagauc 20
<210> 59
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 59
ucaauauuau uuagaaguaa 20
<210> 60
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 60
cagagugcau ccauggucca 20
<210> 61
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 61
uuccuuggaa uggauguagc 20
<210> 62
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 62
accagacauc uaagagaaaa 20
<210> 63
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 63
uucuacauua aaauucuaca 20
<210> 64
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 64
uucuggguac agggguaaga 20
<210> 65
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 65
auucagcuaa aucaugcaag 20
<210> 66
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 66
uaguggcuga augacuucug 20
<210> 67
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 67
uucccacaua acacacacac 20
<210> 68
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 68
uaacuaaacu gaaugaauaa 20
<210> 69
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 69
auuaaaaucu gccaaauccc 20
<210> 70
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 70
uguuuggggg gauuuggcag 20
<210> 71
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 71
ugugauucuu gaaccuugug 20
<210> 72
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 72
uucuacaaua aaaaaugaug 20
<210> 73
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 73
cuggcucaua gagacacauu c 21
<210> 74
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 74
agcuaauaga auuagaucuu a 21
<210> 75
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 75
agagguaaag guucaugaga 20
<210> 76
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 76
gcacagaguu caagcuaaua 20
<210> 77
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 77
cauaucuguc uuccuuaaug 20
<210> 78
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 78
auggaacaaa gucacuccug 20
<210> 79
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 79
cccuucaggu aaccgguagc 20
<210> 80
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 80
gaaugaucau ucuuguggca 20
<210> 81
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 81
aggcggggag ucacauggga 20
<210> 82
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 82
ccucucaaaa agcaacaaua 20
<210> 83
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 83
aaacaggaau agaaauucac 20
<210> 84
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 84
uuccauuaaa aaaaguaugc 20
<210> 85
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 85
auuuguuucu guguguugag 20
<210> 86
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 86
uauuuccuua uuaucuauuc 20
<210> 87
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 87
auaguagaag aaaaaagaaa 20
<210> 88
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 88
agauccccuu gaaacacagg 20
<210> 89
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 89
caauuccugu guuucaaggg 20
<210> 90
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 90
ucacugaaau ccauugcuua 20
<210> 91
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 91
uuuaucacug aaauccauug 20
<210> 92
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 92
aguggaguac cuggaaaaua 20
<210> 93
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 93
gucucauuac ccuguuugua 20
<210> 94
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 94
uauacuauga auacacagga 20
<210> 95
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 95
uaacaaacaa uaggauuauc 20
<210> 96
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 96
gaguuacuag ggagagagug 20
<210> 97
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 97
aaggagacca gugaaguuuc 20
<210> 98
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 98
gaucucaggu aauccgccag 20
<210> 99
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 99
aguaaaguac auaauuauag 20
<210> 100
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 100
agaccagccc ggccaacaug 20
<210> 101
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of wildtype crRNA for CRISPR/Cas12f1 system
<400> 101
guugcagaac ccgaauagac gaaugaagga augcaac 37
<210> 102
<211> 35
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered crRNA for CRISPR/Cas12f1 system
<400> 102
ugcagaaccc gaauagacga augaaggaau gcaac 35
<210> 103
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered crRNA for CRISPR/Cas12f1 system
<400> 103
cagaacccga auagacgaau gaaggaaugc aac 33
<210> 104
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered crRNA for CRISPR/Cas12f1 system
<400> 104
gaauagacga augaaggaau gcaac 25
<210> 105
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered crRNA for CRISPR/Cas12f1 system
<400> 105
acgaaugaag gaaugcaac 19
<210> 106
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered crRNA for CRISPR/Cas12f1 system
<400> 106
ggaaugcaac 10
<210> 107
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered crRNA for CRISPR/Cas12f1 system
<400> 107
guugcagaac ccgaauagag caaugaagga augcaac 37
<210> 108
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered crRNA for CRISPR/Cas12f1 system
<400> 108
gaauagagca augaaggaau gcaac 25
<210> 109
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered crRNA for CRISPR/Cas12f1 system
<400> 109
agcaaugaag gaaugcaac 19
<210> 110
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of wildtype tracrRNA for CRISPR/Cas12f1 system
<400> 110
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca a 161
<210> 111
<211> 141
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered tracrRNA for CRISPR/Cas12f1
system
<400> 111
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 120
uuccucucca auucugcaca a 141
<210> 112
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered tracrRNA for CRISPR/Cas12f1
system
<400> 112
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu 140
<210> 113
<211> 120
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered tracrRNA for CRISPR/Cas12f1
system
<400> 113
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 120
120
<210> 114
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered tracrRNA for CRISPR/Cas12f1
system
<400> 114
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaa 113
<210> 115
<211> 95
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered tracrRNA for CRISPR/Cas12f1
system
<400> 115
accgcuucac cuuaggagug aaggugggcu gcuugcauca gccuaauguc gagaagugcu 60
uucuucggaa aguaacccuc gaaacaaauu cauuu 95
<210> 116
<211> 86
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered tracrRNA for CRISPR/Cas12f1
system
<400> 116
accgcuucac uuagagugaa ggugggcugc uugcaucagc cuaaugucga gaagugcuuu 60
cuucggaaag uaacccucga aacaaa 86
<210> 117
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered tracrRNA for CRISPR/Cas12f1
system
<400> 117
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagug cuccucucca auucugcaca a 161
<210> 118
<211> 141
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered tracrRNA for CRISPR/Cas12f1
system
<400> 118
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auucugcaca a 141
<210> 119
<211> 120
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered tracrRNA for CRISPR/Cas12f1
system
<400> 119
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuccaa uucugcacaa 120
120
<210> 120
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered tracrRNA for CRISPR/Cas12f1
system
<400> 120
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuc 107
<210> 121
<211> 101
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold sequence of engineered tracrRNA for CRISPR/Cas12f1
system
<400> 121
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc u 101
<210> 122
<211> 202
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold region for CRISPR/Cas12f1 system
<400> 122
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca ac 202
<210> 123
<211> 202
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold region for CRISPR/Cas12f1 system
<400> 123
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagug cuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca ac 202
<210> 124
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold region for CRISPR/Cas12f1 system
<400> 124
accgcuucac uuagagugaa ggugggcugc uugcaucagc cuaaugucga gaagugcuuu 60
cuucggaaag uaacccucga aacaaagaaa ggaaugcaac 100
<210> 125
<211> 127
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold region for CRISPR/Cas12f1 system
<400> 125
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaagaaagga 120
augcaac 127
<210> 126
<211> 182
<212> RNA
<213> Artificial Sequence
<220>
<223> Scaffold region for CRISPR/Cas12f1 system
<400> 126
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120
cuccucucca auucugcaca agaaaguugc agaacccgaa uagagcaaug aaggaaugca 180
ac 182
<210> 127
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 127
uuucuauuuu 10
<210> 128
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> U-rich tail sequence
<400> 128
uuauguuuuu 10
<210> 129
<211> 529
<212> PRT
<213> Unknown
<220>
<223> Cas12f1 protein derived from Uncultured archaeon
<400> 129
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro
<210> 130
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 130
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 131
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 131
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 132
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 132
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 133
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 133
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 134
<211> 38
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 134
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 135
<211> 42
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 135
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 136
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 136
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 137
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 137
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 138
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 138
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 139
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 139
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 140
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 140
Asp Arg Leu Arg Arg
1 5
<210> 141
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 141
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 142
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 142
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 143
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 143
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 144
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 144
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 145
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Sequence
<400> 145
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 146
<211> 1587
<212> DNA
<213> Artificial Sequence
<220>
<223> Human codon optimized nucleic acid encoding Cas12f1 protein
<400> 146
atggccaaga acacaattac aaagacactg aagctgagga tcgtgagacc atacaacagc 60
gctgaggtcg agaagattgt ggctgatgaa aagaacaaca gggaaaagat cgccctcgag 120
aagaacaagg ataaggtgaa ggaggcctgc tctaagcacc tgaaagtggc cgcctactgc 180
accacacagg tggagaggaa cgcctgtctg ttttgtaaag ctcggaagct ggatgataag 240
ttttaccaga agctgcgggg ccagttcccc gatgccgtct tttggcagga gattagcgag 300
atcttcagac agctgcagaa gcaggccgcc gagatctaca accagagcct gatcgagctc 360
tactacgaga tcttcatcaa gggcaagggc attgccaacg cctcctccgt ggagcactac 420
ctgagcgacg tgtgctacac aagagccgcc gagctcttta agaacgccgc tatcgcttcc 480
gggctgagga gcaagattaa gagtaacttc cggctcaagg agctgaagaa catgaagagc 540
ggcctgccca ctacaaagag cgacaacttc ccaattccac tggtgaagca gaaggggggc 600
cagtacacag ggttcgagat ttccaaccac aacagcgact ttattattaa gatccccttt 660
ggcaggtggc aggtcaagaa ggagattgac aagtacaggc cctgggagaa gtttgatttc 720
gagcaggtgc agaagagccc caagcctatt tccctgctgc tgtccacaca gcggcggaag 780
aggaacaagg ggtggtctaa ggatgagggg accgaggccg agattaagaa agtgatgaac 840
ggcgactacc agacaagcta catcgaggtc aagcggggca gtaagattgg cgagaagagc 900
gcctggatgc tgaacctgag cattgacgtg ccaaagattg ataagggcgt ggatcccagc 960
atcatcggag ggatcgatgt gggggtcaag agccccctcg tgtgcgccat caacaacgcc 1020
ttcagcaggt acagcatctc cgataacgac ctgttccact ttaacaagaa gatgttcgcc 1080
cggcggagga ttttgctcaa gaagaaccgg cacaagcggg ccggacacgg ggccaagaac 1140
aagctcaagc ccatcactat cctgaccgag aagagcgaga ggttcaggaa gaagctcatc 1200
gagagatggg cctgcgagat cgccgatttc tttattaaga acaaggtcgg aacagtgcag 1260
atggagaacc tcgagagcat gaagaggaag gaggattcct acttcaacat tcggctgagg 1320
gggttctggc cctacgctga gatgcagaac aagattgagt ttaagctgaa gcagtacggg 1380
attgagatcc ggaaggtggc ccccaacaac accagcaaga cctgcagcaa gtgcgggcac 1440
ctcaacaact acttcaactt cgagtaccgg aagaagaaca agttcccaca cttcaagtgc 1500
gagaagtgca actttaagga gaacgccgat tacaacgccg ccctgaacat cagcaaccct 1560
aagctgaaga gcactaagga ggagccc 1587
<210> 147
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 147
tgaactgact gctaagtaca gggaca 26
<210> 148
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 148
aagcgttaag ccgagatcgt 20
<210> 149
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 149
tgtggcagcc attattcctg tctcta 26
<210> 150
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 150
tctgccttga ctagctggtt aggtaa 26
<210> 151
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 151
cactctttcc ctacacgacg ctcttccgat ctgaactgac tgctaagtac agggac 56
<210> 152
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 152
gtgactggag ttcagacgtg tgctcttccg atctgcaggc aaactttaat taaaatctgc 60
c 61
<210> 153
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 153
cactctttcc ctacacgacg ctcttccgat ctggaacacc tggaggtaag tttg 54
<210> 154
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 154
gtgactggag ttcagacgtg tgctcttccg atctcattca gaagtcattc agccact 57
<210> 155
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 155
cactctttcc ctacacgacg ctcttccgat ctttgttccc acataacaca caca 54
<210> 156
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 156
gtgactggag ttcagacgtg tgctcttccg atctttctgg gtacaggggt aagagaaagg 60
60
<210> 157
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 157
cactctttcc ctacacgacg ctcttccgat cttgtaatca aaggagggaa gca 53
<210> 158
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 158
gtgactggag ttcagacgtg tgctcttccg atctgatgag aatttacaga gtgcatcc 58
<210> 159
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 159
cactctttcc ctacacgacg ctcttccgat ctacccagaa caaactattc tcccatgg 58
<210> 160
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 160
gtgactggag ttcagacgtg tgctcttccg atctgggtct ggtccatatt cacagattgt 60
60
<210> 161
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 161
cactctttcc ctacacgacg ctcttccgat cttggaccag accctttgta gtt 53
<210> 162
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 162
gtgactggag ttcagacgtg tgctcttccg atcttgtctc tatgagccag caaaag 56
<210> 163
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 163
cactctttcc ctacacgacg ctcttccgat cttcatcttc ctcatcagaa atagaggctt 60
60
<210> 164
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 164
gtgactggag ttcagacgtg tgctcttccg atctgcaaaa gcagcagaaa gcaaactgat 60
60
<210> 165
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 165
cactctttcc ctacacgacg ctcttccgat cttgctggct catagagaca cattcagt 58
<210> 166
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 166
gtgactggag ttcagacgtg tgctcttccg atcttgctgg agaggatagg acagagga 58
<210> 167
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 167
cactctttcc ctacacgacg ctcttccgat ctttccattc tccatgtcct ctg 53
<210> 168
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 168
gtgactggag ttcagacgtg tgctcttccg atctgggtga cagaatgaaa ctccatctca 60
60
<210> 169
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 169
cactctttcc ctacacgacg ctcttccgat ctgtggcagc cattattcct gt 52
<210> 170
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 170
gtgactggag ttcagacgtg tgctcttccg atctgaacac tgtggtcaga aaactca 57
<210> 171
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 171
cactctttcc ctacacgacg ctcttccgat ctatgtatgt tcttttgtac gtgctctt 58
<210> 172
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 172
gtgactggag ttcagacgtg tgctcttccg atctaagaca gatatgtaaa cacatataat 60
ttga 64
<210> 173
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 173
cactctttcc ctacacgacg ctcttccgat ctgtcactcc tgtctacact agttctgc 58
<210> 174
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 174
gtgactggag ttcagacgtg tgctcttccg atctaccata tttgacacca catgcactgt 60
60
<210> 175
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 175
cactctttcc ctacacgacg ctcttccgat ctttccttaa tggaatataa gtcttttga 59
<210> 176
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 176
gtgactggag ttcagacgtg tgctcttccg atctccttat tatctattcc attcttcaca 60
ca 62
<210> 177
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 177
cactctttcc ctacacgacg ctcttccgat ctggttcatg agactagagg tcacg 55
<210> 178
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 178
gtgactggag ttcagacgtg tgctcttccg atctctgggc aacacagtga gact 54
<210> 179
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 179
cactctttcc ctacacgacg ctcttccgat ctggttcaag cgattcttct gc 52
<210> 180
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 180
gtgactggag ttcagacgtg tgctcttccg atctcctgaa acttcactgg tctcc 55
<210> 181
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 181
cactctttcc ctacacgacg ctcttccgat ctagcctcaa cttcccaaag tg 52
<210> 182
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 182
gtgactggag ttcagacgtg tgctcttccg atcttctttt tctcccacct accc 54
<210> 183
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 183
cactctttcc ctacacgacg ctcttccgat cttttagagt tactagggag agagtgatga 60
60
<210> 184
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 184
gtgactggag ttcagacgtg tgctcttccg atctacacag gagggaaaac agga 54
<210> 185
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 185
cactctttcc ctacacgacg ctcttccgat cttcctgtga aaaaggatga aagg 54
<210> 186
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 186
gtgactggag ttcagacgtg tgctcttccg atcttgaaga ataatacaaa cagggtaatg 60
a 61
<210> 187
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 187
cactctttcc ctacacgacg ctcttccgat ctctcctgtt ttccctcctg tg 52
<210> 188
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 188
gtgactggag ttcagacgtg tgctcttccg atcttttgag tggagtacct ggaaa 55
<210> 189
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 189
cactctttcc ctacacgacg ctcttccgat cttgtcctct ttttagtctc attaccc 57
<210> 190
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 190
gtgactggag ttcagacgtg tgctcttccg atctggaaaa aggctggcga tataa 55
<210> 191
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 191
cactctttcc ctacacgacg ctcttccgat ctatatcgcc agcctttttc ct 52
<210> 192
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 192
gtgactggag ttcagacgtg tgctcttccg atctgccttg actagctggt taggta 56
<210> 193
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 193
cttggctcac tgcaagctcc ac 22
<210> 194
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 194
acagggtagg attcatgttt agaatgatca 30
<210> 195
<211> 20
<212> DNA
<213> Homo sapiens
<400> 195
tagaaaatta tgcctattta 20
<210> 196
<211> 20
<212> DNA
<213> Homo sapiens
<400> 196
gcaaaagcag cagaaagcaa 20
<210> 197
<211> 20
<212> DNA
<213> Homo sapiens
<400> 197
gtaggaatcc tgaaagctac 20
<210> 198
<211> 20
<212> DNA
<213> Homo sapiens
<400> 198
ctgaggacag aacaagctcc 20
<210> 199
<211> 20
<212> DNA
<213> Homo sapiens
<400> 199
ggaaaatgat aacgttaaac 20
<210> 200
<211> 20
<212> DNA
<213> Homo sapiens
<400> 200
ctgaatgtgt ctctatgagc 20
<210> 201
<211> 20
<212> DNA
<213> Homo sapiens
<400> 201
ttcatcttcc tcatcagaaa 20
<210> 202
<211> 20
<212> DNA
<213> Homo sapiens
<400> 202
gattattctt atctaagatc 20
<210> 203
<211> 20
<212> DNA
<213> Homo sapiens
<400> 203
tcaatattat ttagaagtaa 20
<210> 204
<211> 20
<212> DNA
<213> Homo sapiens
<400> 204
cagagtgcat ccatggtcca 20
<210> 205
<211> 20
<212> DNA
<213> Homo sapiens
<400> 205
ttccttggaa tggatgtagc 20
<210> 206
<211> 20
<212> DNA
<213> Homo sapiens
<400> 206
accagacatc taagagaaaa 20
<210> 207
<211> 20
<212> DNA
<213> Homo sapiens
<400> 207
ttctacatta aaattctaca 20
<210> 208
<211> 20
<212> DNA
<213> Homo sapiens
<400> 208
ttctgggtac aggggtaaga 20
<210> 209
<211> 20
<212> DNA
<213> Homo sapiens
<400> 209
attcagctaa atcatgcaag 20
<210> 210
<211> 20
<212> DNA
<213> Homo sapiens
<400> 210
tagtggctga atgacttctg 20
<210> 211
<211> 20
<212> DNA
<213> Homo sapiens
<400> 211
ttcccacata acacacacac 20
<210> 212
<211> 20
<212> DNA
<213> Homo sapiens
<400> 212
taactaaact gaatgaataa 20
<210> 213
<211> 20
<212> DNA
<213> Homo sapiens
<400> 213
attaaaatct gccaaatccc 20
<210> 214
<211> 20
<212> DNA
<213> Homo sapiens
<400> 214
tgtttggggg gatttggcag 20
<210> 215
<211> 20
<212> DNA
<213> Homo sapiens
<400> 215
tgtgattctt gaaccttgtg 20
<210> 216
<211> 20
<212> DNA
<213> Homo sapiens
<400> 216
ttctacaata aaaaatgatg 20
<210> 217
<211> 21
<212> DNA
<213> Homo sapiens
<400> 217
ctggctcata gagacacatt c 21
<210> 218
<211> 21
<212> DNA
<213> Homo sapiens
<400> 218
agctaataga attagatctt a 21
<210> 219
<211> 20
<212> DNA
<213> Homo sapiens
<400> 219
agaggtaaag gttcatgaga 20
<210> 220
<211> 20
<212> DNA
<213> Homo sapiens
<400> 220
gcacagagtt caagctaata 20
<210> 221
<211> 20
<212> DNA
<213> Homo sapiens
<400> 221
catatctgtc ttccttaatg 20
<210> 222
<211> 20
<212> DNA
<213> Homo sapiens
<400> 222
atggaacaaa gtcactcctg 20
<210> 223
<211> 20
<212> DNA
<213> Homo sapiens
<400> 223
cccttcaggt aaccggtagc 20
<210> 224
<211> 20
<212> DNA
<213> Homo sapiens
<400> 224
gaatgatcat tcttgtggca 20
<210> 225
<211> 20
<212> DNA
<213> Homo sapiens
<400> 225
aggcggggag tcacatggga 20
<210> 226
<211> 20
<212> DNA
<213> Homo sapiens
<400> 226
cctctcaaaa agcaacaata 20
<210> 227
<211> 20
<212> DNA
<213> Homo sapiens
<400> 227
aaacaggaat agaaattcac 20
<210> 228
<211> 20
<212> DNA
<213> Homo sapiens
<400> 228
ttccattaaa aaaagtatgc 20
<210> 229
<211> 20
<212> DNA
<213> Homo sapiens
<400> 229
atttgtttct gtgtgttgag 20
<210> 230
<211> 20
<212> DNA
<213> Homo sapiens
<400> 230
tatttcctta ttatctattc 20
<210> 231
<211> 20
<212> DNA
<213> Homo sapiens
<400> 231
atagtagaag aaaaaagaaa 20
<210> 232
<211> 20
<212> DNA
<213> Homo sapiens
<400> 232
agatcccctt gaaacacagg 20
<210> 233
<211> 20
<212> DNA
<213> Homo sapiens
<400> 233
caattcctgt gtttcaaggg 20
<210> 234
<211> 20
<212> DNA
<213> Homo sapiens
<400> 234
tcactgaaat ccattgctta 20
<210> 235
<211> 20
<212> DNA
<213> Homo sapiens
<400> 235
tttatcactg aaatccattg 20
<210> 236
<211> 20
<212> DNA
<213> Homo sapiens
<400> 236
agtggagtac ctggaaaata 20
<210> 237
<211> 20
<212> DNA
<213> Homo sapiens
<400> 237
gtctcattac cctgtttgta 20
<210> 238
<211> 20
<212> DNA
<213> Homo sapiens
<400> 238
tatactatga atacacagga 20
<210> 239
<211> 20
<212> DNA
<213> Homo sapiens
<400> 239
taacaaacaa taggattatc 20
<210> 240
<211> 20
<212> DNA
<213> Homo sapiens
<400> 240
gagttactag ggagagagtg 20
<210> 241
<211> 20
<212> DNA
<213> Homo sapiens
<400> 241
aaggagacca gtgaagtttc 20
<210> 242
<211> 20
<212> DNA
<213> Homo sapiens
<400> 242
gatctcaggt aatccgccag 20
<210> 243
<211> 20
<212> DNA
<213> Homo sapiens
<400> 243
agtaaagtac ataattatag 20
<210> 244
<211> 20
<212> DNA
<213> Homo sapiens
<400> 244
agaccagccc ggccaacatg 20
<210> 245
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 245
cagagugcau ccauggucc 19
<210> 246
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 246
cagagugcau ccauggucca g 21
<210> 247
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 247
cagagugcau ccauggucca gg 22
<210> 248
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 248
cagagugcau ccauggucca gga 23
<210> 249
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 249
cagagugcau ccauggucca ggaa 24
<210> 250
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 250
cagagugcau ccauggucca ggaag 25
<210> 251
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 251
uucuggguac agggguaag 19
<210> 252
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 252
uucuggguac agggguaaga g 21
<210> 253
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 253
uucuggguac agggguaaga ga 22
<210> 254
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 254
uucuggguac agggguaaga gaa 23
<210> 255
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 255
uucuggguac agggguaaga gaaa 24
<210> 256
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 256
uucuggguac agggguaaga gaaag 25
<210> 257
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 257
cccuucaggu aaccgguag 19
<210> 258
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 258
cccuucaggu aaccgguagc uuuug 25
<210> 259
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 259
aggcggggag ucacauggg 19
<210> 260
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 260
aggcggggag ucacauggga g 21
<210> 261
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 261
aggcggggag ucacauggga guc 23
<210> 262
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 262
aggcggggag ucacauggga guca 24
<210> 263
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 263
aggcggggag ucacauggga gucac 25
<210> 264
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 264
aguggaguac cuggaaaaua a 21
<210> 265
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 265
aguggaguac cuggaaaaua ag 22
<210> 266
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 266
aguggaguac cuggaaaaua agc 23
<210> 267
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 267
aguggaguac cuggaaaaua agcc 24
<210> 268
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 268
aguggaguac cuggaaaaua agcca 25
<210> 269
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 269
gaguuacuag ggagagagug a 21
<210> 270
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 270
gaguuacuag ggagagagug aug 23
<210> 271
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 271
gaguuacuag ggagagagug auga 24
<210> 272
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> Guide sequence for CRISPR/Cas12f1 system
<400> 272
gaguuacuag ggagagagug augaa 25
<210> 273
<211> 20
<212> DNA
<213> Homo sapiens
<400> 273
atccctattg gcagtgtctt 20
<210> 274
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Donor sequence for introducing a mutation using CRISPR/Cas9
system
<400> 274
gagccaccgc acctggcccc agttgtaatt gtgagtatct catagatatc cctattggca 60
gtgtcttagt tttatttttt attatcttta ttgtggcagc 100
<210> 275
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 275
ccattttcaa gattgcagct ctccaa 26
<210> 276
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 276
tccaggtgtt ccaagttact tgttct 26
<210> 277
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 277
tgactgctaa gtacagggac atcttg 26
<210> 278
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 278
atctgtaatc ccagcacttt aggagg 26
<210> 279
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 279
aggaaatggc cattttcaag attgca 26
<210> 280
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 280
agactccact tgttctttta aggag 25
<210> 281
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 281
tagagatggg gtttcacctt gttagc 26
<210> 282
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 282
agactccact tgttctttta aggag 25
<210> 283
<211> 32
<212> DNA
<213> Homo sapiens
<400> 283
cctggcccca gttgtaattg tgaatatctc at 32
<210> 284
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Mutation sequence
<400> 284
cctggcccca gttgtaattg tgagtatctc at 32
<210> 285
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Mutation sequence
<400> 285
cctggcccca attgtaattg tgaatatctc at 32
<210> 286
<211> 69
<212> DNA
<213> Homo sapiens
<400> 286
ctcctaaagt gctgggatta cagatgtgag ccaccgcacc tggccccagt tgtaattgtg 60
aatatctca 69
<210> 287
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Mutation sequence
<400> 287
ctcctaaagt gctgggatta cagatgtgag ccaccgcacc tggccccagt tgtaattgtg 60
agtatctca 69
<210> 288
<211> 557
<212> PRT
<213> Artificial Sequence
<220>
<223> TnpB
<400> 288
Met Gly Glu Lys Ser Ser Arg Arg Arg Arg Asn Gly Lys Ser Gly Ala
1 5 10 15
Trp Thr Ala Ala Ile Thr Ser Cys Val Gly Gly Lys Met Ala Lys Asn
20 25 30
Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser
35 40 45
Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys
50 55 60
Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys
65 70 75 80
His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala
85 90 95
Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys
100 105 110
Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu
115 120 125
Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser
130 135 140
Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala
145 150 155 160
Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg
165 170 175
Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser
180 185 190
Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser
195 200 205
Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys
210 215 220
Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser
225 230 235 240
Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu
245 250 255
Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln
260 265 270
Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys
275 280 285
Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys
290 295 300
Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg
305 310 315 320
Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile
325 330 335
Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly
340 345 350
Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala
355 360 365
Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys
370 375 380
Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys
385 390 395 400
Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu
405 410 415
Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala
420 425 430
Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln
435 440 445
Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn
450 455 460
Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile
465 470 475 480
Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro
485 490 495
Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr
500 505 510
Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys
515 520 525
Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn
530 535 540
Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro
545 550 555
<210> 289
<211> 555
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas12f1 + CasX 26aa
<400> 289
Met Glu Lys Arg Ile Asn Lys Ile Arg Lys Lys Leu Ser Ala Asp Asn
1 5 10 15
Ala Thr Lys Pro Val Ser Arg Ser Gly Pro Met Ala Lys Asn Thr Ile
20 25 30
Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala Glu
35 40 45
Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile Ala
50 55 60
Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His Leu
65 70 75 80
Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys Leu
85 90 95
Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu Arg
100 105 110
Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile Phe
115 120 125
Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu Ile
130 135 140
Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn Ala
145 150 155 160
Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala Ala
165 170 175
Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys Ile
180 185 190
Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly Leu
195 200 205
Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln Lys
210 215 220
Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp Phe
225 230 235 240
Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile Asp
245 250 255
Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys Ser
260 265 270
Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg Asn
275 280 285
Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys Val
290 295 300
Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly Ser
305 310 315 320
Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp Val
325 330 335
Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile Asp
340 345 350
Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe Ser
355 360 365
Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys Met
370 375 380
Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg Ala
385 390 395 400
Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr Glu
405 410 415
Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys Glu
420 425 430
Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met Glu
435 440 445
Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile Arg
450 455 460
Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu Phe
465 470 475 480
Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn Asn
485 490 495
Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe Asn
500 505 510
Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu Lys
515 520 525
Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile Ser
530 535 540
Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro
545 550 555
<210> 290
<211> 557
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas12f1 + random 28aa
<400> 290
Met Ala Gly Gly Pro Gly Ala Gly Ser Ala Ala Pro Val Ser Ser Thr
1 5 10 15
Ser Ser Leu Pro Leu Ala Ala Leu Asn Met Arg Val Met Ala Lys Asn
20 25 30
Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser
35 40 45
Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys
50 55 60
Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys
65 70 75 80
His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala
85 90 95
Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys
100 105 110
Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu
115 120 125
Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser
130 135 140
Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala
145 150 155 160
Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg
165 170 175
Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser
180 185 190
Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser
195 200 205
Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys
210 215 220
Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser
225 230 235 240
Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu
245 250 255
Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln
260 265 270
Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys
275 280 285
Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys
290 295 300
Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg
305 310 315 320
Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile
325 330 335
Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly
340 345 350
Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala
355 360 365
Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys
370 375 380
Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys
385 390 395 400
Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu
405 410 415
Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala
420 425 430
Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln
435 440 445
Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn
450 455 460
Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile
465 470 475 480
Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro
485 490 495
Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr
500 505 510
Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys
515 520 525
Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn
530 535 540
Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro
545 550 555
<210> 291
<211> 555
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas12f1 + random 26aa
<400> 291
Met Ala Gly Gly Pro Gly Ala Gly Ser Ala Ala Pro Val Ser Ser Thr
1 5 10 15
Ser Ser Leu Pro Leu Ala Ala Leu Asn Met Met Ala Lys Asn Thr Ile
20 25 30
Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala Glu
35 40 45
Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile Ala
50 55 60
Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His Leu
65 70 75 80
Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys Leu
85 90 95
Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu Arg
100 105 110
Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile Phe
115 120 125
Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu Ile
130 135 140
Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn Ala
145 150 155 160
Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala Ala
165 170 175
Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys Ile
180 185 190
Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly Leu
195 200 205
Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln Lys
210 215 220
Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp Phe
225 230 235 240
Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile Asp
245 250 255
Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys Ser
260 265 270
Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg Asn
275 280 285
Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys Val
290 295 300
Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly Ser
305 310 315 320
Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp Val
325 330 335
Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile Asp
340 345 350
Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe Ser
355 360 365
Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys Met
370 375 380
Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg Ala
385 390 395 400
Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr Glu
405 410 415
Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys Glu
420 425 430
Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met Glu
435 440 445
Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile Arg
450 455 460
Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu Phe
465 470 475 480
Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn Asn
485 490 495
Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe Asn
500 505 510
Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu Lys
515 520 525
Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile Ser
530 535 540
Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro
545 550 555
<210> 292
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<223> tracrRNA scaffold of Cas12f1, MF
<400> 292
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu 140
<210> 293
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 293
caaauucann ncnccucucc aauucugcac aa 32
<210> 294
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 294
caaauucann ncnccucucc aauucugcac a 31
<210> 295
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 295
caaauucann ncnccucucc aauucugcac 30
<210> 296
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 296
caaauucann ncnccucucc aauucugca 29
<210> 297
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 297
caaauucann ncnccucucc aauucugc 28
<210> 298
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 298
caaauucann ncnccucucc aauucug 27
<210> 299
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 299
caaauucann ncnccucucc aauucu 26
<210> 300
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 300
caaauucann ncnccucucc aauuc 25
<210> 301
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 301
caaauucann ncnccucucc aauu 24
<210> 302
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 302
caaauucann ncnccucucc aau 23
<210> 303
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 303
caaauucann ncnccucucc aa 22
<210> 304
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 304
caaauucann ncnccucucc a 21
<210> 305
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 305
caaauucann ncnccucucc 20
<210> 306
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 306
caaauucann ncnccucuc 19
<210> 307
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 307
caaauucann ncnccucu 18
<210> 308
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 308
caaauucann ncnccuc 17
<210> 309
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 309
caaauucann ncnccu 16
<210> 310
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 310
caaauucann ncncc 15
<210> 311
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 311
caaauucann ncnc 14
<210> 312
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st Fragment of engineered tracrRNA scaffold
<400> 312
caaauucann ncn 13
<210> 313
<211> 39
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd Fragment of engineered tracrRNA scaffold
<400> 313
augucgagaa gugcuuucuu cggaaaguaa cccucgaaa 39
<210> 314
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd Fragment of engineered tracrRNA scaffold
<400> 314
ggcugcuugc aucagccua 19
<210> 315
<211> 50
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 315
ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug 50
<210> 316
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 316
ccgcuucacc aaaagcuguc cuuagggauu agaacuugag ugaaggug 48
<210> 317
<211> 46
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 317
ccgcuucacc aaaagcuguc uuaggauuag aacuugagug aaggug 46
<210> 318
<211> 44
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 318
ccgcuucacc aaaagcuguu uagauuagaa cuugagugaa ggug 44
<210> 319
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 319
ccgcuucacc aaaagcuguu aguuagaacu ugagugaagg ug 42
<210> 320
<211> 41
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 320
ccgcuucacc aaaagcuguu aguagaacuu gagugaaggu g 41
<210> 321
<211> 39
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 321
ccgcuucacc aaaagcuuua gagaacuuga gugaaggug 39
<210> 322
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 322
ccgcuucacc aaaagcuuag gaacuugagu gaaggug 37
<210> 323
<211> 35
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 323
ccgcuucacc aaaaguuaga acuugaguga aggug 35
<210> 324
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 324
ccgcuucacc aaaauuagac uugagugaag gug 33
<210> 325
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 325
ccgcuucacc aaauuagcuu gagugaaggu g 31
<210> 326
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 326
ccgcuucacc aauuaguuga gugaaggug 29
<210> 327
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 327
ccgcuucacc auuagugagu gaaggug 27
<210> 328
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 328
ccgcuucacc uuaggaguga aggug 25
<210> 329
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 329
ccgcuucacu uagagugaag gug 23
<210> 330
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 330
ccgcuucacu uaggugaagg ug 22
<210> 331
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 331
ccgcuucauu agugaaggug 20
<210> 332
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 332
ccgcuucuua ggaaggug 18
<210> 333
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 333
ccgcuuuuag aaggug 16
<210> 334
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 334
ccgcuuuaga ggug 14
<210> 335
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 335
ccgcuuaggg ug 12
<210> 336
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th Fragment of engineered tracrRNA scaffold
<400> 336
ccguuaggug 10
<210> 337
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th Fragment of engineered tracrRNA scaffold
<400> 337
cuucacugau aaaguggaga a 21
<210> 338
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th Fragment of engineered tracrRNA scaffold
<400> 338
aaguggagaa 10
<210> 339
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th Fragment of engineered tracrRNA scaffold
<400> 339
aaaguggaga a 11
<210> 340
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th Fragment of engineered tracrRNA scaffold
<400> 340
uaaaguggag aa 12
<210> 341
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th Fragment of engineered tracrRNA scaffold
<400> 341
auaaagugga gaa 13
<210> 342
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th Fragment of engineered tracrRNA scaffold
<400> 342
gauaaagugg agaa 14
<210> 343
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th Fragment of engineered tracrRNA scaffold
<400> 343
ugauaaagug gagaa 15
<210> 344
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th Fragment of engineered tracrRNA scaffold
<400> 344
cugauaaagu ggagaa 16
<210> 345
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th Fragment of engineered tracrRNA scaffold
<400> 345
acugauaaag uggagaa 17
<210> 346
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th Fragment of engineered tracrRNA scaffold
<400> 346
cacugauaaa guggagaa 18
<210> 347
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th Fragment of engineered tracrRNA scaffold
<400> 347
ucacugauaa aguggagaa 19
<210> 348
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th Fragment of engineered tracrRNA scaffold
<400> 348
uucacugaua aaguggagaa 20
<210> 349
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st region of engineered tracrRNA scaffold, MF
<400> 349
aaguggagaa 10
<210> 350
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st region of engineered tracrRNA scaffold, MF
<400> 350
aaaguggaga a 11
<210> 351
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st region of engineered tracrRNA scaffold, MF
<400> 351
uaaaguggag aa 12
<210> 352
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st region of engineered tracrRNA scaffold, MF
<400> 352
auaaagugga gaa 13
<210> 353
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st region of engineered tracrRNA scaffold, MF
<400> 353
gauaaagugg agaa 14
<210> 354
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st region of engineered tracrRNA scaffold, MF
<400> 354
ugauaaagug gagaa 15
<210> 355
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st region of engineered tracrRNA scaffold, MF
<400> 355
cugauaaagu ggagaa 16
<210> 356
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st region of engineered tracrRNA scaffold, MF
<400> 356
acugauaaag uggagaa 17
<210> 357
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st region of engineered tracrRNA scaffold, MF
<400> 357
cacugauaaa guggagaa 18
<210> 358
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st region of engineered tracrRNA scaffold, MF
<400> 358
ucacugauaa aguggagaa 19
<210> 359
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st region of engineered tracrRNA scaffold, MF
<400> 359
uucacugaua aaguggagaa 20
<210> 360
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> 1st region of engineered tracrRNA scaffold, MF
<400> 360
cuucacugau aaaguggaga a 21
<210> 361
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 361
ccuuaggugg 10
<210> 362
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 362
ccguuaggug g 11
<210> 363
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 363
ccgcuuaggg ugg 13
<210> 364
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 364
ccgcuuuaga ggugg 15
<210> 365
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 365
ccgcuuuuag aaggugg 17
<210> 366
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 366
ccgcuucuua ggaaggugg 19
<210> 367
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 367
ccgcuucauu agugaaggug g 21
<210> 368
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 368
ccgcuucacu uaggugaagg ugg 23
<210> 369
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 369
ccgcuucacu uagagugaag gugg 24
<210> 370
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 370
ccgcuucacc uuaggaguga aggugg 26
<210> 371
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 371
ccgcuucacc auuagugagu gaaggugg 28
<210> 372
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 372
ccgcuucacc aauuaguuga gugaaggugg 30
<210> 373
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 373
ccgcuucacc aaauuagcuu gagugaaggu gg 32
<210> 374
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 374
ccgcuucacc aaaauuagac uugagugaag gugg 34
<210> 375
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 375
ccgcuucacc aaaaguuaga acuugaguga aggugg 36
<210> 376
<211> 38
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 376
ccgcuucacc aaaagcuuag gaacuugagu gaaggugg 38
<210> 377
<211> 40
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 377
ccgcuucacc aaaagcuuua gagaacuuga gugaaggugg 40
<210> 378
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 378
ccgcuucacc aaaagcuguu aguagaacuu gagugaaggu gg 42
<210> 379
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 379
ccgcuucacc aaaagcuguu aguuagaacu ugagugaagg ugg 43
<210> 380
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 380
ccgcuucacc aaaagcuguu uagauuagaa cuugagugaa ggugg 45
<210> 381
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 381
ccgcuucacc aaaagcuguc uuaggauuag aacuugagug aaggugg 47
<210> 382
<211> 51
<212> RNA
<213> Artificial Sequence
<220>
<223> 2nd region of engineered tracrRNA scaffold, MF
<400> 382
ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug g 51
<210> 383
<211> 55
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of engineered tracrRNA scaffold, MF
<400> 383
gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc cucga 55
<210> 384
<211> 53
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of engineered tracrRNA scaffold, MF
<400> 384
gcugcuugca ucagccuaau gucgagaagu gcuuuuucga aaguaacccu cga 53
<210> 385
<211> 51
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of engineered tracrRNA scaffold, MF
<400> 385
gcugcuugca ucagccuaau gucgagaagu gcuuuucgaa guaacccucg a 51
<210> 386
<211> 51
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of engineered tracrRNA scaffold, MF
<400> 386
gcugcuugca ucagccuaau gucgagaagu gcucuucgga guaacccucg a 51
<210> 387
<211> 49
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of engineered tracrRNA scaffold, MF
<400> 387
gcugcuugca ucagccuaau gucgagaagu gcuuucgagu aacccucga 49
<210> 388
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of engineered tracrRNA scaffold, MF
<400> 388
gcugcuugca ucagccuaau gucgagaagu gcuucgguaa cccucga 47
<210> 389
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of engineered tracrRNA scaffold, MF
<400> 389
gcugcuugca ucagccuaau gucgagaagu guucguaacc cucga 45
<210> 390
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of engineered tracrRNA scaffold, MF
<400> 390
gcugcuugca ucagccuaau gucgagaagu uucgaacccu cga 43
<210> 391
<211> 41
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of engineered tracrRNA scaffold, MF
<400> 391
gcugcuugca ucagccuaau gucgagaagu ucgacccucg a 41
<210> 392
<211> 40
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of engineered tracrRNA scaffold, MF
<400> 392
gcugcuugca ucagccuaau gucgagaagu ucgcccucga 40
<210> 393
<211> 39
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of engineered tracrRNA scaffold, MF
<400> 393
gcugcuugca ucagccuaau gucgagaauu cgcccucga 39
<210> 394
<211> 38
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of engineered tracrRNA scaffold, MF
<400> 394
gcugcuugca ucagccuaau gucgagaauu cgccucga 38
<210> 395
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of engineered tracrRNA scaffold, MF
<400> 395
gcugcuugca ucagccuaau gucgagauuc gccucga 37
<210> 396
<211> 35
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of engineered tracrRNA scaffold, MF
<400> 396
gcugcuugca ucagccuaau gucgaguucg cucga 35
<210> 397
<211> 55
<212> RNA
<213> Artificial Sequence
<220>
<223> 3rd region of engineered tracrRNA scaffold, MF
<400> 397
gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc cucga 55
<210> 398
<211> 6
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th region of engineered tracrRNA scaffold, MF
<400> 398
aacaaa 6
<210> 399
<211> 7
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th region of engineered tracrRNA scaffold, MF
<400> 399
aacaaau 7
<210> 400
<211> 8
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th region of engineered tracrRNA scaffold, MF
<400> 400
aacaaauu 8
<210> 401
<211> 9
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th region of engineered tracrRNA scaffold, MF
<400> 401
aacaaauuc 9
<210> 402
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th region of engineered tracrRNA scaffold, MF
<400> 402
aacaaauuca 10
<210> 403
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th region of engineered tracrRNA scaffold, MF
<400> 403
aacaaauuca u 11
<210> 404
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th region of engineered tracrRNA scaffold, MF
<400> 404
aacaaauuca uu 12
<210> 405
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> 4th region of engineered tracrRNA scaffold, MF
<400> 405
aacaaauuca uuu 13
<210> 406
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> crRNA scaffold of Cas12f1, MF
<400> 406
gaaugaagga augcaac 17
<210> 407
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 407
guugcagaac ccgaauagnb nnnugaagga 30
<210> 408
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 408
guugcagaac ccgaauagng nnnugaagga 30
<210> 409
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 409
uugcagaacc cgaauagngn nnugaagga 29
<210> 410
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 410
ugcagaaccc gaauagngnn nugaagga 28
<210> 411
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 411
gcagaacccg aauagngnnn ugaagga 27
<210> 412
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 412
cagaacccga auagngnnnu gaagga 26
<210> 413
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 413
agaacccgaa uagngnnnug aagga 25
<210> 414
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 414
gaacccgaau agngnnnuga agga 24
<210> 415
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 415
aacccgaaua gngnnnugaa gga 23
<210> 416
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 416
acccgaauag ngnnnugaag ga 22
<210> 417
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 417
cccgaauagn gnnnugaagg a 21
<210> 418
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 418
ccgaauagng nnnugaagga 20
<210> 419
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 419
cgaauagngn nnugaagga 19
<210> 420
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 420
gaauagngnn nugaagga 18
<210> 421
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 421
aauagngnnn ugaagga 17
<210> 422
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 422
auagngnnnu gaagga 16
<210> 423
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 423
uagngnnnug aagga 15
<210> 424
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 424
agngnnnuga agga 14
<210> 425
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> 6th fragment of engineered crRNA scaffold, WT
<400> 425
ngnnnugaag ga 12
<210> 426
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 426
gaaugaagga 10
<210> 427
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 427
cgaaugaagg a 11
<210> 428
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 428
acgaaugaag ga 12
<210> 429
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 429
gacgaaugaa gga 13
<210> 430
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 430
agacgaauga agga 14
<210> 431
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 431
uagacgaaug aagga 15
<210> 432
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 432
auagacgaau gaagga 16
<210> 433
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 433
aauagacgaa ugaagga 17
<210> 434
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 434
gaauagacga augaagga 18
<210> 435
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 435
cgaauagacg aaugaagga 19
<210> 436
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 436
ccgaauagac gaaugaagga 20
<210> 437
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 437
cccgaauaga cgaaugaagg a 21
<210> 438
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 438
acccgaauag acgaaugaag ga 22
<210> 439
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 439
aacccgaaua gacgaaugaa gga 23
<210> 440
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 440
gaacccgaau agacgaauga agga 24
<210> 441
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 441
agaacccgaa uagacgaaug aagga 25
<210> 442
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 442
cagaacccga auagacgaau gaagga 26
<210> 443
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 443
gcagaacccg aauagacgaa ugaagga 27
<210> 444
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 444
ugcagaaccc gaauagacga augaagga 28
<210> 445
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> 5th region of engineered crRNA scaffold, MF
<400> 445
uugcagaacc cgaauagacg aaugaagga 29
<210> 446
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting ATM1
<400> 446
ggagccagau aguuuguauu ucaagagaau acaaacuauc uggcucc 47
<210> 447
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting ATM1
<400> 447
gcaagcagcu gaaacaaauu ucaagagaau uuguuucagc ugcuugc 47
<210> 448
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting ATM1
<400> 448
ggagcugauu guagcaacau ucaagagaug uugcuacaau cagcucc 47
<210> 449
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting ATM1
<400> 449
gcacagaagu gccuccaauu ucaagagaau uggaggcacu ucugugc 47
<210> 450
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting ATM1
<400> 450
ggacauaguu ucugggagau ucaagagauc ucccagaaac uaugucc 47
<210> 451
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting XRCC4
<400> 451
ggaugacacu ggcacauuau ucaagagaua augugccagu gucaucc 47
<210> 452
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting XRCC4
<400> 452
ggagaguacu gaugaggaau ucaagagauu ccucaucagu acucucc 47
<210> 453
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting XRCC4
<400> 453
gaauccaccu uguuucugau ucaagagauc agaaacaagg uggauuc 47
<210> 454
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting XRCC4
<400> 454
guacaaguau cuugggagau ucaagagauc ucccaagaua cuuguac 47
<210> 455
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting XRCC4
<400> 455
gaaugcagcu caagaacgau ucaagagauc guucuugagc ugcauuc 47
<210> 456
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting XLF-1
<400> 456
gcaugagucu ggcauuacau ucaagagaug uaaugccaga cucaugc 47
<210> 457
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting XLF-1
<400> 457
gaaagcccuu ugucaugaau ucaagagauu caugacaaag ggcuuuc 47
<210> 458
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting XLF-1
<400> 458
gaacagugcu ucccugcaau ucaagagauu gcagggaagc acuguuc 47
<210> 459
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting XLF-1
<400> 459
ggaaagaccu agagauccau ucaagagaug gaucucuagg ucuuucc 47
<210> 460
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting XLF-1
<400> 460
guauggcagu caccacacau ucaagagaug uguggugacu gccauac 47
<210> 461
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting XRCC6
<400> 461
gcagcauugu gcagauacau ucaagagaug uaucugcaca augcugc 47
<210> 462
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting XRCC6
<400> 462
gcaggaacau cccuccuuau ucaagagaua aggagggaug uuccugc 47
<210> 463
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting XRCC6
<400> 463
gcagugcucu gcucaucaau ucaagagauu gaugagcaga gcacugc 47
<210> 464
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting XRCC6
<400> 464
ggaucaugcu guucaccaau ucaagagauu ggugaacagc augaucc 47
<210> 465
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting XRCC6
<400> 465
ggaucugacu acucacucau ucaagagaug agugaguagu cagaucc 47
<210> 466
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting LIG4
<400> 466
gcacaaagau ggagauguau ucaagagaua caucuccauc uuugugc 47
<210> 467
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting LIG4
<400> 467
gcagacacgu acuguguaau ucaagagauu acacaguacg ugucugc 47
<210> 468
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting LIG4
<400> 468
ggagcagacu ccugaagaau ucaagagauu cuucaggagu cugcucc 47
<210> 469
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting LIG4
<400> 469
ggaggauucu gaucugcaau ucaagagauu gcagaucaga auccucc 47
<210> 470
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting LIG4
<400> 470
gcaugauccu ucuguaggau ucaagagauc cuacagaagg aucaugc 47
<210> 471
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting DCLRE1C
<400> 471
ggagacuccu acccagauau ucaagagaua ucuggguagg agucucc 47
<210> 472
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting DCLRE1C
<400> 472
ggacaaagcu gacuacagau ucaagagauc uguagucagc uuugucc 47
<210> 473
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting DCLRE1C
<400> 473
gcagagcucu cguuucacau ucaagagaug ugaaacgaga gcucugc 47
<210> 474
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting DCLRE1C
<400> 474
ggacucugau ggagaaucau ucaagagaug auucuccauc agagucc 47
<210> 475
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> shRNA sequence targeting DCLRE1C
<400> 475
gcagaauucu ucccagucau ucaagagaug acugggaaga auucugc 47
<210> 476
<211> 8192
<212> RNA
<213> Artificial Sequence
<220>
<223> 661W/LCA10 cell line doner sequence
<400> 476
tctagaccta acatacatac tacttctgct cggttataaa gtaatctaat tccttaagga 60
gccctatttc tttgtagaga tgaaaatatt tccatgccca gaacttatta caccatgtct 120
gtcattgctt tgagaatatt attgctgctt ctctctttcc ttggacaaca tgtaatgtat 180
atctttagaa tgtgaattca tatttaactt tgtagtttta tgttcttcac tattttacat 240
acagctgaga gattaaagta tttatatcat atattaattt aaaataataa cagctgtaat 300
acttcttaat atatcctaaa accgctttaa agttcttatg ttccttggaa tctatctcct 360
gaacatacat tggcaaaaat aacatattct agtaatttga aatgatactt tttgctttca 420
atattaggat tttttttttg agctgaaatg aactatataa aacatttgta ttttcaaaag 480
attcagtgtg aagtgtctag ctgctgcccc tgccctgcta ccctgataac agaatatcct 540
ccaggtagct cttctgcaac agaagcagtc acgtgcatct ggactgtcac gtgagagctg 600
gctctctcag atgaggaagt tttgagactt acaaatgttc ttgtttttat tattgtggct 660
tttaaaacat attggacttt tctgaagttt tgccagtaca gagagtatga aatatacgag 720
ctggaggttt ctgccatcct ccttctttct tgtttcttca accacagttt ttagggttcg 780
tgattttttt cttttttata gaaaataaga aaagaggata ttttaacgga aacaagacat 840
aattcatgtc ttttaaccag ccttcactgc aaaatgaaac cagatgcctc taaggtagaa 900
tagtatatgc tcatttacat gaggggaagc tgtttgaatt agacagaaag ttcactacac 960
tcaggagtga attagaacta taagagcctc atctcccctt cagtggtttg gttctttgtt 1020
gctcccatga tctcactgta ctttcttatc atggagcatt tcactgggaa gaactggaaa 1080
gagtcccggc tccttgttgg tgttcatcaa accacctcct gccattcatg aatgcctttt 1140
cagagctatc ggagaatatt gcgttaccct cttcccagga ctctaccgaa tacctcagat 1200
tattaaactt agaaacagaa aaaggttgtt ttggttcagc tacttgaagg tttgggacta 1260
tgacctcatt acctttggac tgtggtaact cgtatacatc atagtaagag ggcgggtaat 1320
agggaccttg tcacttcata gccaattata atgaaaagaa aaagagggca ccaagacaaa 1380
ggtcccacgg tcctctttga aagcacaact aaagtgatct tagagttcac accagcacca 1440
gtcttagctg gtgccacttc cggattgcac cgtgccggag aagactgtag catgtgtctt 1500
tgggggaatg ttctatatta aactatagca aacatgaaat aagtcaatta aatccttatt 1560
gttactattt aggtatttta atcagtcgat aacaagaacc aaaccttgcg tttgtgtcac 1620
ttgaagaaag cagacataga cagcatacat taattctgtc acttaaactg ccagatgctt 1680
agtggatttt aatcttctat gacttagaga aggtatccaa agatatcttc tgcttactat 1740
actttctcaa attcattgta cttccttttt ctctgataac ttgtaaaagg actcacttaa 1800
atccttaatt aaaactttcc aaataattgt tttctacgag aaagaataac aggaaatatt 1860
acacattttt caaatggctt tcaactattt tgctttcaat tgaattttct ttttaaaaag 1920
tgactaaggc tttgccagaa aaaaatatgc aaagttaact tggtatatcc tttttttttt 1980
tttttttttt tatttttcag gaaatggcca ttttcaagat tgcagctctc caaaaagttg 2040
tagataatag tgtttctttg tctgaactag aactggctaa taaacagtac aatgaactga 2100
ctgctaagta cagggacatc ttgcaaaaag ataatatgct tgttcaaaga acaagtaact 2160
tggaacacct ggaggtaagt ttgtgtgatt cttgaacctt gtgaaattag ccatttttct 2220
tcaatatttt tgtgtttggg gggatttggc agattttaat taaagtttgc ctgcatttat 2280
ataaatttaa cagagatata attatccata ttattcattc agtttagtta taaatatttt 2340
gttcccacat aacacacaca cacacacaca atatattatc tatttatagt ggctgaatga 2400
cttctgaatg attatctaga tcattctcct taggtcactt gcatgattta gctgaatcaa 2460
acctctttta accagacatc taagagaaaa aggagcatga aacaggtaga atattgtaat 2520
caaaggaggg aagcactcat taagtgccca tccctttctc ttacccctgt acccagaaca 2580
aactattctc ccatggtccc tggcttttgt tccttggaat ggatgtagcc aacagtagct 2640
gaaatattaa gggctcttcc tggaccatgg atgcactctg taaattctca tcatttttta 2700
ttgtagaata aatgtagaat tttaatgtag aataaattta tttaatgtag aataaaaaat 2760
aaaaaaacta gagtagaata tcataagtta caatctgtga atatggacca gaccctttgt 2820
agttatctta cagccacttg aactctatac cttttactga ggacagaaca agctcctgat 2880
tttttcatct tcctcatcag aaatagaggc ttatggattt tggattattc ttatctaaga 2940
tcctttcaca ggagtagaat aagatctaat tctattagct caaaagcttt tgctggctca 3000
tagagacaca ttcagtaaat gaaaacgttg ttctgagtag ctttcaggat tcctactaaa 3060
ttatgagtca tgtttatcaa tattatttag aagtaatcat aatcagtttg ctttctgctg 3120
cttttgccaa agagaggtga ttatgttact ttttatagaa aattatgcct atttagtgtg 3180
gtgataattt atttttttcc attctccatg tcctctgtcc tatcctctcc agcattagaa 3240
agtcctaggc aagagacatc ttgtggataa tgtatcaatg agtgatgttt aacgttatca 3300
ttttcccaaa gagtattttt catctttcct aaagattttt tttttttttg agatggagtt 3360
tcattctgtc acccaggctg agtgcagtgg cacgatctcg gcttaacgct tactgcatcc 3420
tctgcctccc agattcaagc agttctcctg cctcagcctc tgagtagctg ggattacagg 3480
tgtgcaccac cacagcagct aatttttttt tttttttttt tttttttgag gcagagtctc 3540
gctctgtcac ccaggctgga gtgcagtggc gccatcttgg ctcactgcaa gctccacctc 3600
ccgggttcag gccgttctcc tgcctcagcc tcctgagtag ctggtaccac aggcacccac 3660
catcatgccc ggctaatttt ttgtattttt agtagagatg gggtttcacc ttgttagcca 3720
ggatggtgtc gatctcctga actcgtgatc cacccgcctc ggcctcctaa agtgctggga 3780
ttacagatgt gagccaccgc acctggcccc agttgtaatt gtgagtatct catacctatc 3840
cctattggca gtgtcttagt tttatttttt attatcttta ttgtggcagc cattattcct 3900
gtctctatct ccagtcttac atcctcctta ctgccacaag aatgatcatt ctaaacatga 3960
atcctaccct gtgactccca tgtgactccc cgccttaaaa actgtcaaaa gctaccggtt 4020
acctgaaggg taaaagtcaa gtcccctact tacctcatgt catctaaagc aagagatgaa 4080
ctagctgagt tttctgacca cagtgttctt tcttatgtat gttcttttgt acgtgctctt 4140
ttctatatat agggaaccat ttctctcttc cagttgtttt gctcagtgaa tttctattcc 4200
tgtttcaaaa cttgttcagg cattaccttt tttttcttaa gcatactttt tttaatggaa 4260
caaagtcact cctgtctaca ctagttctgc atcttataca taggttttgt acatagtaca 4320
tatttatatc acatcaaatt atatgtgttt acatatctgt cttccttaat ggaatataag 4380
tcttttgata taaggaacta tttaatttgt ttctgtgtgt tgagtatctc ctgtttggca 4440
cagagttcaa gctaatacat gagagtgatt agtggtggag agccacagtg catgtggtgt 4500
caaatatggt gcttaggaaa ttattgttgc tttttgagag gtaaaggttc atgagactag 4560
aggtcacgaa aatcagattt catgtgtgaa gaatggaata gataataagg aaatacaaaa 4620
actggatggg taataaagca aaagaaaaac ttgaaatttg atagtagaag aaaaaagaaa 4680
tagatgtaga ttgaggtaga atcaagaaga ggattctttt tttgttgttt ttttttttga 4740
aacagagtct cactgtgttg cccaggctgg agtgcagtgg agtgatcttg gcttactgca 4800
acctctgcct cccaggttca agcgattctt ctgcttcagt ctcccgagta gctggaatta 4860
caggtgccca ccagcacggc cggctaattt agtagagaca gggttttgcc atgttggccg 4920
ggctggtctc aaactttgga tctcaggtaa tccgccagcc tcaacttccc aaagtgctgg 4980
gattacaggc atgagccact gtgcccagcc tgtttttttt ttttaaagga gaccagtgaa 5040
gtttcaggag gagggaaaga aaatttagag ttactaggga gagagtgatg aagataagag 5100
atgaaagtgg taataaggga aatagcaaaa tatcagggta ggtgggagaa aaagagattt 5160
gtaacaaaca ataggattat cctgtgaaaa aggatgaaag gaagaaaaaa atggatagaa 5220
agatatttaa aacaccctca gcctcctgtt ttccctcctg tgtattcata gtatataaaa 5280
ctataattat gtactttact taaaaaatat attattatta ccttatcgtg cttatttaat 5340
catagcatgt cctcttttta gtctcattac cctgtttgta ttattcttca taacacttaa 5400
tacctgacat tgtattatat attggcttat tttccaggta ctccactcaa atataagttc 5460
taggatataa tttatttatc actgaaatcc attgcttaga gtacctggca tgtagtaaat 5520
aggcattctg ttttttcaaa taaaaaataa aggaacttaa gatatatatt tatgttatat 5580
cgccagcctt tttcctcaca gctctattct gttgtacaga attacctact ttacaattcc 5640
tgtgtttcaa ggggatctca aatttaacgt gtccacaatg aactcctgat ttctgtttct 5700
ctcctagtca ttcttatttc aatatatgtt cagttaccta accagctagt caaggcagat 5760
actttagagt tattctgtag tcattctttt tccctaccat ttttgttttc caaatgtaat 5820
ttatgtgtgt cttcttcatc ctcgcagctc taacccttgt ccaaaccagc atcatcactc 5880
atctggagtt ccacaatgtc tttctggcta gtttccctga tttctctatt gaccccttta 5940
ttctccacag tgcagccaga atgattgttt aaaacttcct ccttaaaatc tttaaattgt 6000
tttcttttat acgttaagtt aaattccagt tccttgtctt ggcatgccat gccctgcctg 6060
gtgtggcccc tgatggtctc tccaacttca tgttttacta ctattgactc ttatttttgc 6120
ttactctgct tgggtgctcc agtcctccaa atcatttcct gctccaatca tttcaatcat 6180
tttttcctct cagatcttat agtattccaa atgctttctt cctttggagc atctgggttt 6240
actaataaat acttcgtacc tcacagttca gcttaaatat caattatttg gtggttaaga 6300
catccttcaa ccgctctatc taaatgttcc tttctattat tcactggctc agtactctgt 6360
ttttattttc tttctaaatg tcaacttttt tttttttgag tcagggtctc actgttgccc 6420
aggctcgagt gcagttgcac aatcatagct cattgcagcc ttgccctcct gggatcaagt 6480
aattctccca cctcagcctc caaaatagct gggattacag gtatgcatca ccatgctcag 6540
ctaatttttt gtgttttttt gtagagatga ggtctcactt tgttgcccag gctggtctca 6600
aactcctgga ctcaagtgat tctcccacct cagcctccca aagtgctggg gttacaggtg 6660
tgagccactg cacctggtcg atactgactt tttttttttt gagatggagt tttgctctgt 6720
tgcccaggct agagcgcagt ggtgtgatct cagctcactg caacctccac ctcccaggtt 6780
aaagggattc ttctgcctca gtctcctgag tagctgggat tacaggcaag tgccatcatg 6840
actggctaat ttttgtattt ttagcactat gtttagtact gtgttggcca ggcttgtctc 6900
gaactcctga cctcaagtga tccacccacc tcagcctccc aaagtgctgg gattacaggt 6960
gtgagccacc gtaatcggcc aacattgaca tttttagtag actttttgtt tgtttacttg 7020
cttattatct gctgccttcc acactctggc gaaatcctgc cacccaccca cacacacata 7080
ggcactgaat gggcagaact ctgaaggcca gaattttata tttcttttca ctataaacat 7140
catcatctgt cactgatggc acactaggat gctcagcaac tgtgtgcatg aaggaagtaa 7200
gcactagttt gtgaaggctg caaaactctt gagtattcta agagttttgg ccaaaatgaa 7260
tgtacagctt tagtggcaga agctaatact cagaaattga ggccgtatat tggataacac 7320
aggatttgga tgattatttt aaaataatat tttacattgt atatatgtgt gtgtgtgtgt 7380
gtgtgtgtgt gtgtatgtgt gtgtgtgtgt atatatatat gtatgtatgt gtattagtcc 7440
gttctcatgc tgctatgaag aaatacctga gactgggtaa tttataaagg aaagaggttt 7500
aattgactca cagttccaca gagctgggga ggcctcagaa aacttaacag ttatggcaga 7560
aggggaagca aacacatttt tcttcacatg gtggccggaa ttagaagaat gtgagccgag 7620
caaaggggaa agccccttat aaaaccatca gacatcgtga gaacttacta ttatgagaat 7680
agcgtggggg aaaccacccc cacgattcaa ttacctccca ccaaatccct cccatgacat 7740
atgaggatta tgggaactat gattcaagat gagatttggg tagggacaca gccaaaccat 7800
atcagtatgt atatgtatac aagtattata tatatatgta tgtgtttgta tgcatacatg 7860
tattatatat ggaggaaatt ctaattttgt aaaaaactgg attgtgagtt ttaagataac 7920
ttcgtatagc atacattata cgaagttata attaaggagc gtgatgcggt tttggcagta 7980
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 8040
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 8100
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 8160
agctggatga ggatcgtttc gcatgattga ac 8192
<210> 477
<211> 127
<212> RNA
<213> Artificial Sequence
<220>
<223> guide RNA scaffold sequence (V4.0)
<400> 477
accgcttcac caaaagctgt cccttagggg attagaactt gagtgaaggt gggctgcttg 60
catcagccta atgtcgagaa gtgctttctt cggaaagtaa ccctcgaaac aaagaaagga 120
atgcaac 127
<210> 478
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> guide RNA scaffold sequence (V4.1)
<400> 478
accgcuucac cgagugaagg ugggcugcuu gcaucagccu aaugucgaga agugcuuucu 60
ucggaaagua acccucgaaa caaagaaagg aaugcaac 98
<210> 479
<211> 1719
<212> DNA
<213> Artificial Sequence
<220>
<223> TnpB Encoding DNA
<400> 479
atgggggaga aaagttcccg ccgccgacgg aatggaaaaa gcggtgcgtg gactgctgct 60
ataacaagct gtgttggggg taagatggcc aagaacacaa ttacaaagac actgaagctg 120
aggatcgtga gaccatacaa cagcgctgag gtcgagaaga ttgtggctga tgaaaagaac 180
aacagggaaa agatcgccct cgagaagaac aaggataagg tgaaggaggc ctgctctaag 240
cacctgaaag tggccgccta ctgcaccaca caggtggaga ggaacgcctg tctgttttgt 300
aaagctcgga agctggatga taagttttac cagaagctgc ggggccagtt ccccgatgcc 360
gtcttttggc aggagattag cgagatcttc agacagctgc agaagcaggc cgccgagatc 420
tacaaccaga gcctgatcga gctctactac gagatcttca tcaagggcaa gggcattgcc 480
aacgcctcct ccgtggagca ctacctgagc gacgtgtgct acacaagagc cgccgagctc 540
tttaagaacg ccgctatcgc ttccgggctg aggagcaaga ttaagagtaa cttccggctc 600
aaggagctga agaacatgaa gagcggcctg cccactacaa agagcgacaa cttcccaatt 660
ccactggtga agcagaaggg gggccagtac acagggttcg agatttccaa ccacaacagc 720
gactttatta ttaagatccc ctttggcagg tggcaggtca agaaggagat tgacaagtac 780
aggccctggg agaagtttga tttcgagcag gtgcagaaga gccccaagcc tatttccctg 840
ctgctgtcca cacagcggcg gaagaggaac aaggggtggt ctaaggatga ggggaccgag 900
gccgagatta agaaagtgat gaacggcgac taccagacaa gctacatcga ggtcaagcgg 960
ggcagtaaga ttggcgagaa gagcgcctgg atgctgaacc tgagcattga cgtgccaaag 1020
attgataagg gcgtggatcc cagcatcatc ggagggatcg atgtgggggt caagagcccc 1080
ctcgtgtgcg ccatcaacaa cgccttcagc aggtacagca tctccgataa cgacctgttc 1140
cactttaaca agaagatgtt cgcccggcgg aggattttgc tcaagaagaa ccggcacaag 1200
cgggccggac acggggccaa gaacaagctc aagcccatca ctatcctgac cgagaagagc 1260
gagaggttca ggaagaagct catcgagaga tgggcctgcg agatcgccga tttctttatt 1320
aagaacaagg tcggaacagt gcagatggag aacctcgaga gcatgaagag gaaggaggat 1380
tcctacttca acattcggct gagggggttc tggccctacg ctgagatgca gaacaagatt 1440
gagtttaagc tgaagcagta cgggattgag atccggaagg tggcccccaa caacaccagc 1500
aagacctgca gcaagtgcgg gcacctcaac aactacttca acttcgagta ccggaagaag 1560
aacaagttcc cacacttcaa gtgcgagaag tgcaacttta aggagaacgc cgattacaac 1620
gccgccctga acatcagcaa ccctaagctg aagagcacta aggaggagcc caaaaggccg 1680
gcggccacga aaaaggccgg ccaggcaaaa aagaaaaag 1719
<210> 480
<211> 1665
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas12f1 + CasX 28aa Encoding DNA
<400> 480
atggaaaaga gaatcaacaa gatcaggaag aagctgagcg ccgacaacgc caccaagcct 60
gtgtcaggag tggcccccat ggccaagaac acaattacaa agacactgaa gctgaggatc 120
gtgagaccat acaacagcgc tgaggtcgag aagattgtgg ctgatgaaaa gaacaacagg 180
gaaaagatcg ccctcgagaa gaacaaggat aaggtgaagg aggcctgctc taagcacctg 240
aaagtggccg cctactgcac cacacaggtg gagaggaacg cctgtctgtt ttgtaaagct 300
cggaagctgg atgataagtt ttaccagaag ctgcggggcc agttccccga tgccgtcttt 360
tggcaggaga ttagcgagat cttcagacag ctgcagaagc aggccgccga gatctacaac 420
cagagcctga tcgagctcta ctacgagatc ttcatcaagg gcaagggcat tgccaacgcc 480
tcctccgtgg agcactacct gagcgacgtg tgctacacaa gagccgccga gctctttaag 540
aacgccgcta tcgcttccgg gctgaggagc aagattaaga gtaacttccg gctcaaggag 600
ctgaagaaca tgaagagcgg cctgcccact acaaagagcg acaacttccc aattccactg 660
gtgaagcaga aggggggcca gtacacaggg ttcgagattt ccaaccacaa cagcgacttt 720
attattaaga tcccctttgg caggtggcag gtcaagaagg agattgacaa gtacaggccc 780
tgggagaagt ttgatttcga gcaggtgcag aagagcccca agcctatttc cctgctgctg 840
tccacacagc ggcggaagag gaacaagggg tggtctaagg atgaggggac cgaggccgag 900
attaagaaag tgatgaacgg cgactaccag acaagctaca tcgaggtcaa gcggggcagt 960
aagattggcg agaagagcgc ctggatgctg aacctgagca ttgacgtgcc aaagattgat 1020
aagggcgtgg atcccagcat catcggaggg atcgatgtgg gggtcaagag ccccctcgtg 1080
tgcgccatca acaacgcctt cagcaggtac agcatctccg ataacgacct gttccacttt 1140
aacaagaaga tgttcgcccg gcggaggatt ttgctcaaga agaaccggca caagcgggcc 1200
ggacacgggg ccaagaacaa gctcaagccc atcactatcc tgaccgagaa gagcgagagg 1260
ttcaggaaga agctcatcga gagatgggcc tgcgagatcg ccgatttctt tattaagaac 1320
aaggtcggaa cagtgcagat ggagaacctc gagagcatga agaggaagga ggattcctac 1380
ttcaacattc ggctgagggg gttctggccc tacgctgaga tgcagaacaa gattgagttt 1440
aagctgaagc agtacgggat tgagatccgg aaggtggccc ccaacaacac cagcaagacc 1500
tgcagcaagt gcgggcacct caacaactac ttcaacttcg agtaccggaa gaagaacaag 1560
ttcccacact tcaagtgcga gaagtgcaac tttaaggaga acgccgatta caacgccgcc 1620
ctgaacatca gcaaccctaa gctgaagagc actaaggagg agccc 1665
<210> 481
<211> 1671
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas12f1 + random 28aa Encoding DNA
<400> 481
atggctggcg gaccaggcgc aggtagtgct gcgccagttt cttcaacttc ctccctgccc 60
ctggctgcgc ttaacatgcg cgtgatggcc aagaacacaa ttacaaagac actgaagctg 120
aggatcgtga gaccatacaa cagcgctgag gtcgagaaga ttgtggctga tgaaaagaac 180
aacagggaaa agatcgccct cgagaagaac aaggataagg tgaaggaggc ctgctctaag 240
cacctgaaag tggccgccta ctgcaccaca caggtggaga ggaacgcctg tctgttttgt 300
aaagctcgga agctggatga taagttttac cagaagctgc ggggccagtt ccccgatgcc 360
gtcttttggc aggagattag cgagatcttc agacagctgc agaagcaggc cgccgagatc 420
tacaaccaga gcctgatcga gctctactac gagatcttca tcaagggcaa gggcattgcc 480
aacgcctcct ccgtggagca ctacctgagc gacgtgtgct acacaagagc cgccgagctc 540
tttaagaacg ccgctatcgc ttccgggctg aggagcaaga ttaagagtaa cttccggctc 600
aaggagctga agaacatgaa gagcggcctg cccactacaa agagcgacaa cttcccaatt 660
ccactggtga agcagaaggg gggccagtac acagggttcg agatttccaa ccacaacagc 720
gactttatta ttaagatccc ctttggcagg tggcaggtca agaaggagat tgacaagtac 780
aggccctggg agaagtttga tttcgagcag gtgcagaaga gccccaagcc tatttccctg 840
ctgctgtcca cacagcggcg gaagaggaac aaggggtggt ctaaggatga ggggaccgag 900
gccgagatta agaaagtgat gaacggcgac taccagacaa gctacatcga ggtcaagcgg 960
ggcagtaaga ttggcgagaa gagcgcctgg atgctgaacc tgagcattga cgtgccaaag 1020
attgataagg gcgtggatcc cagcatcatc ggagggatcg atgtgggggt caagagcccc 1080
ctcgtgtgcg ccatcaacaa cgccttcagc aggtacagca tctccgataa cgacctgttc 1140
cactttaaca agaagatgtt cgcccggcgg aggattttgc tcaagaagaa ccggcacaag 1200
cgggccggac acggggccaa gaacaagctc aagcccatca ctatcctgac cgagaagagc 1260
gagaggttca ggaagaagct catcgagaga tgggcctgcg agatcgccga tttctttatt 1320
aagaacaagg tcggaacagt gcagatggag aacctcgaga gcatgaagag gaaggaggat 1380
tcctacttca acattcggct gagggggttc tggccctacg ctgagatgca gaacaagatt 1440
gagtttaagc tgaagcagta cgggattgag atccggaagg tggcccccaa caacaccagc 1500
aagacctgca gcaagtgcgg gcacctcaac aactacttca acttcgagta ccggaagaag 1560
aacaagttcc cacacttcaa gtgcgagaag tgcaacttta aggagaacgc cgattacaac 1620
gccgccctga acatcagcaa ccctaagctg aagagcacta aggaggagcc c 1671
<210> 482
<211> 1665
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas12f1 + random 26aa Encoding DNA
<400> 482
atggctggcg gaccaggcgc aggtagtgct gcgccagttt cttcaacttc ctccctgccc 60
ctggctgcgc ttaacatgat ggccaagaac acaattacaa agacactgaa gctgaggatc 120
gtgagaccat acaacagcgc tgaggtcgag aagattgtgg ctgatgaaaa gaacaacagg 180
gaaaagatcg ccctcgagaa gaacaaggat aaggtgaagg aggcctgctc taagcacctg 240
aaagtggccg cctactgcac cacacaggtg gagaggaacg cctgtctgtt ttgtaaagct 300
cggaagctgg atgataagtt ttaccagaag ctgcggggcc agttccccga tgccgtcttt 360
tggcaggaga ttagcgagat cttcagacag ctgcagaagc aggccgccga gatctacaac 420
cagagcctga tcgagctcta ctacgagatc ttcatcaagg gcaagggcat tgccaacgcc 480
tcctccgtgg agcactacct gagcgacgtg tgctacacaa gagccgccga gctctttaag 540
aacgccgcta tcgcttccgg gctgaggagc aagattaaga gtaacttccg gctcaaggag 600
ctgaagaaca tgaagagcgg cctgcccact acaaagagcg acaacttccc aattccactg 660
gtgaagcaga aggggggcca gtacacaggg ttcgagattt ccaaccacaa cagcgacttt 720
attattaaga tcccctttgg caggtggcag gtcaagaagg agattgacaa gtacaggccc 780
tgggagaagt ttgatttcga gcaggtgcag aagagcccca agcctatttc cctgctgctg 840
tccacacagc ggcggaagag gaacaagggg tggtctaagg atgaggggac cgaggccgag 900
attaagaaag tgatgaacgg cgactaccag acaagctaca tcgaggtcaa gcggggcagt 960
aagattggcg agaagagcgc ctggatgctg aacctgagca ttgacgtgcc aaagattgat 1020
aagggcgtgg atcccagcat catcggaggg atcgatgtgg gggtcaagag ccccctcgtg 1080
tgcgccatca acaacgcctt cagcaggtac agcatctccg ataacgacct gttccacttt 1140
aacaagaaga tgttcgcccg gcggaggatt ttgctcaaga agaaccggca caagcgggcc 1200
ggacacgggg ccaagaacaa gctcaagccc atcactatcc tgaccgagaa gagcgagagg 1260
ttcaggaaga agctcatcga gagatgggcc tgcgagatcg ccgatttctt tattaagaac 1320
aaggtcggaa cagtgcagat ggagaacctc gagagcatga agaggaagga ggattcctac 1380
ttcaacattc ggctgagggg gttctggccc tacgctgaga tgcagaacaa gattgagttt 1440
aagctgaagc agtacgggat tgagatccgg aaggtggccc ccaacaacac cagcaagacc 1500
tgcagcaagt gcgggcacct caacaactac ttcaacttcg agtaccggaa gaagaacaag 1560
ttcccacact tcaagtgcga gaagtgcaac tttaaggaga acgccgatta caacgccgcc 1620
ctgaacatca gcaaccctaa gctgaagagc actaaggagg agccc 1665
<210> 483
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> CEP290 qPCR F#1
<400> 483
tggaccagac cctttgtagt tatctt 26
<210> 484
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> CEP290 qPCR R#1
<400> 484
tgagccagca aaagcttttg agct 24
<210> 485
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> CEP290 64 qPCR F#01
<400> 485
cttacatcct ccttactgcc acaaga 26
<210> 486
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> CEP290 64 qPCR R#01
<400> 486
actgtggtca gaaaactcag ctagtt 26
<210> 487
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> inner F
<400> 487
tgtggcagcc attattcctg tctcta 26
<210> 488
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> inner R
<400> 488
gcaacacagt gagactctgt ttcaaa 26
<210> 489
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> right arm F
<400> 489
ggaactatga ttcaagatga gatttgggta 30
<210> 490
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> right arm R
<400> 490
ttggacactt caactttgag ctcc 24
<210> 491
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> left arm F
<400> 491
tcttctgtgg ctatcatgag agcgtc 26
<210> 492
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> left arm R
<400> 492
tgggtacagg ggtaagagaa agggat 26
Claims (26)
- 다음을 포함하는 CRISPR/Cas12f1 시스템에 대한 가이드 RNA:
서열번호 125, 서열번호 126, 서열번호 477, 및 서열번호 478 중 선택된 뉴클레오타이드 서열로 표현되는 스캐폴드 영역;
서열번호 51 내지 서열번호 101 및 서열번호 245 내지 서열번호 272 중 선택된 뉴클레오타이드 서열을 가이드 서열로 포함하는 스페이서 영역; 및 U-rich tail,
여기서, 상기 가이드 RNA는 5'말단에서 3'말단 방향으로 스캐폴드 영역, 가이드 영역, 및 U-rich tail이 순차적으로 연결되어 있으며,
상기 스캐폴드 영역은 Cas12f1 단백질과 상호작용할 수 있는 영역이고,
상기 가이드 영역은 CEP290 유전자에 존재하는 표적 서열과 상보적인 결합을 형성할 수 있으며,
상기 U-rich tail은 5'-(UaN)dUe-3', 5'-UaVUaVUe-3', 및 5'-UaVUaVUaVUe-3' 중 선택된 서열로 표현되고, 상기 N은 A, C, G 또는 U이고, 상기 각각의 V는 각각 독립적으로 A, C 또는 G이며, 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 1 내지 10의 정수임. - 제1항의 가이드 RNA를 암호화하는 DNA.
- 다음을 포함하는 가이드 RNA-Cas12f1 단백질 복합체:
서열번호 129 또는 서열번호 288 중 선택된 아미노산 서열로 표현되는 제1 Cas12f1 단백질;
상기 제1 Cas12f1 단백질과 동일한 아미노산 서열을 가지는 제2 Cas12f1 단백질; 및
5'말단에서 3'말단 방향으로,
서열번호 125, 서열번호 126, 서열번호 477, 및 서열번호 478 중 선택된 뉴클레오타이드 서열로 표현되는 스캐폴드 영역,
서열번호 51 내지 서열번호 101 및 서열번호 245 내지 서열번호 272 중 선택된 뉴클레오타이드 서열을 가이드 서열로 포함하는 스페이서 영역, 및 U-rich tail이 순차적으로 연결된 가이드 RNA,
여기서, 상기 제1 Cas12f1 단백질 및 상기 제2 Cas12f1 단백질은 이량체를 형성하는 특징을 가지고,
상기 가이드 RNA의 스캐폴드 영역 및 상기 Cas12f1 단백질의 이량체가 상호작용하여 복합체를 형성하고,
상기 U-rich tail은 5'-(UaN)dUe-3', 5'-UaVUaVUe-3', 및 5'-UaVUaVUaVUe-3' 중 선택된 서열로 표현되고, 상기 N은 A, C, G 또는 U이고, 상기 각각의 V는 각각 독립적으로 A, C 또는 G이며, 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 1 내지 10의 정수이고,
상기 가이드 영역은 CEP290 유전자에 존재하는 표적 서열과 상보적인 결합을 형성할 수 있음. - 다음을 포함하는 벡터:
서열번호 129 또는 서열번호 288 중 선택된 아미노산 서열로 표현되는 Cas12f1 단백질을 암호화하는 핵산; 및
서열번호 125, 서열번호 126, 서열번호 477, 및 서열번호 478 중 선택된 뉴클레오타이드 서열로 표현되는 스캐폴드 영역, 서열번호 51 내지 서열번호 101 및 서열번호 245 내지 서열번호 272 중 선택된 뉴클레오타이드 서열을 스페이서 서열로 포함하는 가이드 영역, 및 U-rich tail이 순차적으로 연결된 가이드 RNA를 암호화하는 핵산, 여기서, 상기 U-rich tail은 5'-(UaN)dUe-3', 5'-UaVUaVUe-3', 및 5'-UaVUaVUaVUe-3' 중 선택된 서열로 표현되고, 상기 N은 A, C, G 또는 U이고, 상기 각각의 V는 각각 독립적으로 A, C 또는 G이며, 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 1 내지 10의 정수임. - 다음을 포함하는 벡터:
서열번호 129 또는 서열번호 288 중 선택된 아미노산 서열로 표현되는 Cas12f1 단백질을 암호화하는 핵산; 및
서열번호 125, 서열번호 126, 서열번호 477, 및 서열번호 478 중 선택된 뉴클레오타이드 서열로 표현되는 제1 스캐폴드 영역, 서열번호 51 내지 서열번호 74 및 서열번호 245 내지 서열번호 256 중 선택된 뉴클레오타이드 서열을 가이드 서열로 포함하는 제1 스페이서 영역, 및 제1 U-rich tail이 순차적으로 연결된 제1 가이드 RNA를 암호화하는 핵산; 및
서열번호 125, 서열번호 126, 서열번호 477, 및 서열번호 478 중 선택된 뉴클레오타이드 서열로 표현되는 제2 스캐폴드 영역, 서열번호 75 내지 서열번호 101 및 서열번호 257 내지 서열번호 272 중 선택된 뉴클레오타이드 서열을 가이드 서열로 포함하는 제2 스페이서 영역, 및 제2 U-rich tail이 순차적으로 연결된 제2 가이드 RNA를 암호화하는 핵산, 여기서, 상기 제1 U-rich tail 및 상기 제2 U-rich tail은 각각 독립적으로, 5'-(UaN)dUe-3', 5'-UaVUaVUe-3', 및 5'-UaVUaVUaVUe-3' 중 선택된 서열로 표현되고, 상기 N은 A, C, G 또는 U이고, 상기 각각의 V는 각각 독립적으로 A, C 또는 G이며, 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 1 내지 10의 정수임. - 제4항 또는 제5항에 있어서, 상기 벡터는 ATM1, XRCC4, XLF-1, XRCC6, LIG4, 및 DCLRE1C 중 선택된 하나 이상의 유전자의 활성을 감소시키는 shRNA, 또는 상기 shRNA를 암호화하는 핵산을 한 단위 이상 추가로 포함하는 벡터.
- 제4항 내지 제6항 중 어느 한 항에 있어서, 상기 벡터는 다음 중 선택된 하나 이상인 것을 특징으로 하는 벡터:
플라스미드; mRNA(전사물); PCR 엠플리콘; 레트로바이러스 벡터(retroviral(retrovirus) vector); 렌티바이러스 벡터(lentiviral(lentivirus) vector); 아데노바이러스 벡터(adenoviral(adenovirus) vector); 아데노-연관 바이러스 벡터(adeno-associated viral (adeno-associated virus; AAV) vector); 백시니아바이러스 벡터(vaccinia viral(vaccinia virus) vector); 폭스바이러스 벡터(poxviral(poxvirus) vector); 및 단순포진 바이러스 벡터(herpes simplex viral(herpes simplex virus) vector). - 제4항 내지 제6항 중 어느 한 항에 있어서, 상기 벡터는 단일 벡터(single vector)인 것을 특징으로 하는 벡터.
- 제6항에 있어서,
상기 제1 가이드 RNA의 제1 스페이서 영역은 서열번호 64의 뉴클레오타이드 서열을 가이드 서열로 포함하고,
상기 제2 가이드 RNA의 제2 스페이서 영역은 서열번호 92 또는 서열번호 96의 뉴클레오타이드 서열을 가이드 서열로 포함하며,
상기 벡터는 상기 shRNA를 암호화하는 핵산을 두 단위 포함하며,
상기 벡터는 아데노-연관 바이러스 벡터로, 단일 벡터인 것을 특징으로 하는 벡터. - 다음을 포함하는 CRISPR/Cas12f1 조성물:
서열번호 129 또는 서열번호 288 중 선택된 아미노산 서열로 표현되는 Cas12f1 단백질, 또는 상기 Cas12f1 단백질을 암호화하는 핵산; 및
서열번호 125, 서열번호 126, 서열번호 477, 및 서열번호 478 중 선택된 뉴클레오타이드 서열로 표현되는 스캐폴드 영역, 서열번호 51 내지 서열번호 101 및 서열번호 245 내지 서열번호 272 중 선택된 뉴클레오타이드 서열을 가이드 서열로 포함하는 스페이서 영역, 및 U-rich tail이 순차적으로 연결된 가이드 RNA, 또는 상기 가이드 RNA를 암호화하는 핵산,
여기서, 상기 Cas12f1 단백질 및 상기 가이드 RNA의 스캐폴드 영역은 서로 상호작용하여 복합체를 형성할 수 있으며,
상기 가이드 RNA의 상기 스페이서 영역은 CEP290 유전자에 존재하는 표적 서열과 상보적인 결합을 형성할 수 있고,
상기 U-rich tail은 5'-(UaN)dUe-3', 5'-UaVUaVUe-3', 및 5'-UaVUaVUaVUe-3' 중 선택된 서열로 표현되고, 상기 N은 A, C, G 또는 U이고, 상기 각각의 V는 각각 독립적으로 A, C 또는 G이며, 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 1 내지 10의 정수임. - 다음을 포함하는 CRISPR/Cas12f1 조성물:
서열번호 129 또는 서열번호 288 중 선택된 아미노산 서열로 표현되는 Cas12f1 단백질, 또는 상기 Cas12f1 단백질을 암호화하는 핵산; 및
서열번호 125, 서열번호 126, 서열번호 477, 및 서열번호 478 중 선택된 뉴클레오타이드 서열로 표현되는 제1 스캐폴드 영역, 서열번호 51 내지 서열번호 74 및 서열번호 245 내지 서열번호 256 중 선택된 뉴클레오타이드 서열을 가이드 서열로 포함하는 제1 스페이서 영역, 및 제1 U-rich tail이 순차적으로 연결된 제1 가이드 RNA, 또는 상기 제1 가이드 RNA를 암호화하는 핵산; 및
서열번호 125, 서열번호 126, 서열번호 477, 및 서열번호 478 중 선택된 뉴클레오타이드 서열로 표현되는 제2 스캐폴드 영역, 서열번호 75 내지 서열번호 101 및 서열번호 257 내지 서열번호 272 중 선택된 뉴클레오타이드 서열을 가이드 서열로 포함하는 제2 스페이서 영역, 및제2 U-rich tail이 순차적으로 연결된 제2 가이드 RNA, 또는 상기 제2 가이드 RNA를 암호화하는 핵산,
여기서, 상기 Cas12f1 단백질 및 상기 제1 스캐폴드 영역은 서로 상호작용하여 복합체를 형성할 수 있고,
상기 Cas12f1 단백질 및 상기 제2 스캐폴드 영역은 서로 상호작용하여 복합체를 형성할 수 있으며,
상기 제1 스페이서 영역 및 상기 제2 스페이서 영역은 각각 독립적으로, CEP290 유전자에 존재하는 표적 서열과 상보적인 결합을 형성할 수 있고,
상기 제1 U-rich tail 및 제2 U-rich tail은 각각 독립적으로, 5'-(UaN)dUe-3', 5'-UaVUaVUe-3', 및 5'-UaVUaVUaVUe-3' 중 선택된 서열로 표현되고, 상기 N은 A, C, G 또는 U이고, 상기 각각의 V는 각각 독립적으로 A, C 또는 G이며, 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 1 내지 10의 정수임. - 제10항 또는 제11항에 있어서, 상기 CRISPR/Cas12f1 조성물은 ATM1, XRCC4, XLF-1, XRCC6, LIG4, 및 DCLRE1C 중 선택된 하나 이상의 유전자의 활성을 감소시키는 shRNA, 또는 상기 shRNA를 암호화하는 핵산을 한 단위 이상 추가로 포함하는 CRISPR/Cas12f1 조성물.
- 제12항에 있어서,
상기 CRISPR/Cas12f1 조성물은 제1 가이드 RNA 및 제2 가이드 RNA를 포함하고,
상기 제1 가이드 RNA의 제1 스페이서 영역은 서열번호 64의 뉴클레오타이드 서열을 가이드 서열로 포함하고,
상기 제2 가이드 RNA의 제2 스페이서 영역은 서열번호 92 또는 서열번호 96의 뉴클레오타이드 서열을 가이드 서열로 포함하며,
상기 shRNA 또는 상기 shRNA를 암호화하는 핵산을 두 단위 포함하는 CRISPR/Cas12f1 조성물. - 다음을 포함하는 LCA10 치료용 약학적 조성물:
제11항의 CRISPR/Cas12f1 조성물; 및
약학적으로 허용되는 담체. - 제14항에 있어서, 상기 LCA10 치료용 약학적 조성물은 ATM1, XRCC4, XLF-1, XRCC6, LIG4, 및 DCLRE1C 중 선택된 하나 이상의 유전자의 활성을 감소시키는 shRNA, 또는 상기 shRNA를 암호화하는 핵산을 추가로 포함하는 약학적 조성물.
- 다음을 포함하는 IVS26 돌연변이(c.2991 + 1655A>G)를 포함하는 CEP290 유전자 편집 방법:
CRISPR/Cas12f1 조성물을 대상에 도입하는 것,
상기 CRISPR/Cas12f1 조성물은 다음을 포함함:
서열번호 129 또는 서열번호 288 중 선택된 아미노산 서열로 표현되는 Cas12f1 단백질, 또는 상기 Cas12f1 단백질을 암호화하는 핵산; 및
서열번호 125, 서열번호 126, 서열번호 477, 및 서열번호 478 중 선택된 뉴클레오타이드 서열로 표현되는 제1 스캐폴드 영역, 서열번호 51 내지 서열번호 74 및 서열번호 245 내지 서열번호 256 중 선택된 뉴클레오타이드 서열을 가이드 서열로 포함하는 제1 스페이서 영역, 및 제1 U-rich tail이 순차적으로 연결된 제1 가이드 RNA, 또는 상기 제1 가이드 RNA를 암호화하는 핵산; 및
서열번호 125, 서열번호 126, 서열번호 477, 및 서열번호 478 중 선택된 뉴클레오타이드 서열로 표현되는 제2 스캐폴드 영역, 서열번호 75 내지 서열번호 101 및 서열번호 257 내지 서열번호 272 중 선택된 뉴클레오타이드 서열을 가이드 서열로 포함하는 제2 스페이서 영역, 및 제2 U-rich tail이 순차적으로 연결된 제2 가이드 RNA, 또는 상기 제2 가이드 RNA를 암호화하는 핵산,
여기서, 상기 Cas12f1 단백질 및 상기 제1 스캐폴드 영역은 서로 상호작용하여 복합체를 형성할 수 있고,
상기 Cas12f1 단백질 및 상기 제2 스캐폴드 영역은 서로 상호작용하여 복합체를 형성할 수 있으며,
상기 CRISPR/Cas12f1 조성물의 제1 가이드 RNA의 제1 스페이서 영역은 상기 CEP290 유전자의 엑손 26의 3'말단과 상기 CEP290 유전자의 상기 IVS26 돌연변이(c.2991 + 1655A>G) 사이의 영역을 타겟하는 것이고,
여기서, 상기 CRISPR/Cas12f1 조성물의 제2 가이드 RNA의 제2 스페이서 영역은 상기 CEP290 유전자의 상기 IVS26 돌연변이(c.2991 + 1655A>G)와 상기 CEP290 유전자의 엑손 27의 5'말단 사이의 영역을 타겟하는 것이며,
상기 제1 U-rich tail 및 제2 U-rich tail은 각각 독립적으로, 5'-(UaN)dUe-3', 5'-UaVUaVUe-3', 및 5'-UaVUaVUaVUe-3' 중 선택된 서열로 표현되고, 상기 N은 A, C, G 또는 U이고, 상기 각각의 V는 각각 독립적으로 A, C 또는 G이며, 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 1 내지 10의 정수이고,
상기 CRISPR/Cas12f1 조성물을 상기 대상체에 투여한 결과, 상기 CEP290 유전자의 인트론 26 영역 중 상기 IVS26 돌연변이(c.2991 + 1655A>G)를 포함하는 일부 핵산 서열의 제거가 유도됨. - 제16항에 있어서, 상기 CRISPR/Cas12f1 조성물을 대상에 도입하는 것은 상기 CRISPR/Cas12f1 조성물을 인간, 또는 CEP290 유전자를 가지는 비인간 동물에 투여하는 것인 방법.
- 제16항에 있어서, 상기 CRISPR/Cas12f1 조성물을 대상에 도입하는 것은 상기 CRISPR/Cas12f1 조성물을 인간 세포, CEP290 유전자를 가지는 비인간 동물 세포, LCA10 질환을 가진 인간에서 수득한 세포, 또는 LCA10 질환을 가진 비인간 동물에서 수득한 세포에 도입하는 것인 방법.
- 제16항에 있어서, 상기 CRISPR/CAs12f1 조성물은 ATM1, XRCC4, XLF-1, XRCC6, LIG4, 및 DCLRE1C 중 선택된 하나 이상의 유전자의 활성을 감소시키는 shRNA, 또는 상기 shRNA를 암호화하는 핵산을 한 단위 이상 추가로 포함하는 방법.
- 제19항에 있어서,
상기 CRISPR/Cas12f1 조성물의 상기 제1 가이드 RNA의 상기 제1 스페이서 영역은 서열번호 64의 뉴클레오타이드 서열을 가이드 서열로 포함하고,
상기 CRISPR/Cas12f1 조성물의 상기 제2 가이드 RNA의 상기 제2 스페이서 영역은 서열번호 92 또는 서열번호 96의 뉴클레오타이드 서열을 가이드 서열로 포함하며,
상기 CRISPR/Cas12f1 조성물은 상기 shRNA 또는 상기 shRNA를 암호화하는 핵산을 두 단위 추가로 포함하는 방법. - 다음을 포함하는 LCA10 질환 치료방법:
제12항 또는 제13항의 약학적 조성물을 LCA10 질환을 가지는 대상체에 투여하는 것. - 제21항에 있어서, 상기 대상체는 LCA10 질환을 가지는 인간, 또는 LCA10 질환을 가지는 비인간 동물인 치료방법.
- 제21항에 있어서,
상기 약학적 조성물의 CRISPR/Cas12f1 조성물의 상기 제1 가이드 RNA의 상기 제1 스페이서 영역은 서열번호 64의 뉴클레오타이드 서열을 가이드 서열로 포함하고,
상기 약학적 조성물의 CRISPR/Cas12f1 조성물의 상기 제2 가이드 RNA의 상기 제2 스페이서 영역은 서열번호 92 또는 서열번호 96의 뉴클레오타이드 서열을 가이드 서열로 포함하며,
상기 약학적 조성물은 상기 shRNA 또는 상기 shRNA를 암호화하는 핵산을 두 단위 추가로 포함하는 치료방법. - 제11항의 CRISPR/Cas12f1 조성물의 LCA10 질환 치료제 제조용도.
- 제11항의 CRISPR/Cas12f1 조성물의 LCA10 질환 치료용도.
- 제11항의 CRISPR/Cas12f1 조성물의 IVS26 돌연변이(c.2991 + 1655A>G)를 포함하는 CEP290 유전자 편집 용도.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20210063023 | 2021-05-14 | ||
KR1020210063023 | 2021-05-14 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220155553A true KR20220155553A (ko) | 2022-11-23 |
Family
ID=84028770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220059167A KR20220155553A (ko) | 2021-05-14 | 2022-05-13 | RNA-guided Nuclease를 이용한 LCA10 치료용 조성물 및 치료방법 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP4342986A1 (ko) |
KR (1) | KR20220155553A (ko) |
CA (1) | CA3220294A1 (ko) |
WO (1) | WO2022240262A1 (ko) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019089820A1 (en) | 2017-11-01 | 2019-05-09 | The Regents Of The University Of California | Casz compositions and methods of use |
CN111836894B (zh) * | 2017-11-21 | 2023-11-10 | 基恩科雷有限责任公司 | 用于使用CRISPR/Cpf1系统进行基因组编辑的组合物及其用途 |
KR20210044152A (ko) | 2019-10-14 | 2021-04-22 | 삼성전자주식회사 | 다중 연결을 지원하는 이동통신 시스템에서 단말의 발열 관련 정보를 제공하는 방법 및 장치 |
KR20210050093A (ko) | 2019-10-28 | 2021-05-07 | 한국광기술원 | 미세 led 및 그의 제조방법 |
KR102455623B1 (ko) * | 2019-10-29 | 2022-10-18 | 주식회사 진코어 | CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도 |
KR20210051552A (ko) | 2019-10-30 | 2021-05-10 | 황경준 | 지능형 대중교통 승하차 |
CN111363763B (zh) * | 2020-03-31 | 2023-03-14 | 海南大学 | 一种RNA激活Cas14a酶附带切割效应的方法 |
-
2022
- 2022-05-13 KR KR1020220059167A patent/KR20220155553A/ko unknown
- 2022-05-13 WO PCT/KR2022/006940 patent/WO2022240262A1/ko active Application Filing
- 2022-05-13 CA CA3220294A patent/CA3220294A1/en active Pending
- 2022-05-13 EP EP22807909.1A patent/EP4342986A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4342986A1 (en) | 2024-03-27 |
WO2022240262A1 (ko) | 2022-11-17 |
CA3220294A1 (en) | 2022-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220135970A1 (en) | Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa | |
US20240076698A1 (en) | Methods and compositions for modulating a genome | |
AU2017305404A1 (en) | Compositions and methods for treating CEP290 associated disease | |
JP5823969B2 (ja) | 心臓特異的核酸調節因子ならびにこの方法および使用 | |
KR20220090512A (ko) | 액체암의 치료를 위한 조성물 및 방법 | |
KR20210058806A (ko) | Rna 표적화 융합 단백질 조성물 및 사용 방법 | |
Hillman et al. | Fragile XE-associated familial mental retardation protein 2 (FMR2) acts as a potent transcription activator | |
US10940215B2 (en) | Adipocyte-targeting non-viral gene delivery complex comprising dual plasmid vector | |
WO2021007529A1 (en) | Rna-targeting knockdown and replacement compositions and methods for use | |
MX2011000227A (es) | Composiciones y metodos para inhibir la expresion de genes del receptor de factor de crecimiento por transformacion-beta. | |
JP2020533967A (ja) | 改良されたトランスポザーゼポリペプチドおよびその使用 | |
KR20210018222A (ko) | 트랜스-스플라이싱 분자 | |
CN112639108A (zh) | 治疗非综合征性感觉神经性听力损失的方法 | |
KR20230003511A (ko) | 안면견갑상완 근이영양증에 대한 crispr-억제 | |
US20230383275A1 (en) | Sgrna targeting aqp1 rna, and vector and use thereof | |
JP2022510673A (ja) | アンチセンスオリゴヌクレオチドは、abca4の異常スプライシングをレスキューする | |
CN109219659A (zh) | 用于治疗眼咽型肌营养不良(opmd)的试剂及其用途 | |
KR20220155553A (ko) | RNA-guided Nuclease를 이용한 LCA10 치료용 조성물 및 치료방법 | |
US20070167388A1 (en) | Nucleotide sequences promoting the trans-membrane transport of nucleic acids | |
CN113227375A (zh) | 合成的微小rna模拟物 | |
JP2002519059A (ja) | ミオスタチン遺伝子の新規なプロモーター配列 | |
US20240150764A1 (en) | Therapeutic splice-switching oligonucleotides for cancer | |
US12031162B2 (en) | Methods and compositions for modulating a genome | |
WO2024041653A1 (zh) | 一种CRISPR-Cas13系统及其应用 | |
KR20230134097A (ko) | Nhej 복구 경로 조절을 통해 핵산 세그먼트의 결실 효율을 증가시키기 위한 조성물 및 방법 |