KR20220045013A - Lama1 유전자를 표적으로 하는 근이영양증의 치료 방법 - Google Patents
Lama1 유전자를 표적으로 하는 근이영양증의 치료 방법 Download PDFInfo
- Publication number
- KR20220045013A KR20220045013A KR1020227007882A KR20227007882A KR20220045013A KR 20220045013 A KR20220045013 A KR 20220045013A KR 1020227007882 A KR1020227007882 A KR 1020227007882A KR 20227007882 A KR20227007882 A KR 20227007882A KR 20220045013 A KR20220045013 A KR 20220045013A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- lys
- glu
- asp
- ile
- Prior art date
Links
- 230000008685 targeting Effects 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims description 47
- 238000011282 treatment Methods 0.000 title claims description 15
- 201000006938 muscular dystrophy Diseases 0.000 title abstract description 11
- 101100127661 Homo sapiens LAMA1 gene Proteins 0.000 title description 24
- 101150027218 LAMA1 gene Proteins 0.000 title description 24
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 95
- 239000002773 nucleotide Substances 0.000 claims abstract description 90
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 90
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 85
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 85
- 239000002157 polynucleotide Substances 0.000 claims abstract description 85
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 85
- 108091033409 CRISPR Proteins 0.000 claims abstract description 72
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 69
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract description 60
- 239000012636 effector Substances 0.000 claims abstract description 54
- 108020001507 fusion proteins Proteins 0.000 claims abstract description 50
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 50
- 108091006106 transcriptional activators Proteins 0.000 claims abstract description 39
- 101710163270 Nuclease Proteins 0.000 claims abstract description 33
- 230000002950 deficient Effects 0.000 claims abstract description 32
- 201000006948 congenital merosin-deficient muscular dystrophy 1A Diseases 0.000 claims abstract description 8
- 208000037161 Laminin subunit alpha 2-related congenital muscular dystrophy Diseases 0.000 claims abstract 7
- 230000014509 gene expression Effects 0.000 claims description 104
- 108010042502 laminin A Proteins 0.000 claims description 66
- 239000013598 vector Substances 0.000 claims description 44
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 claims description 14
- 239000003814 drug Substances 0.000 claims description 12
- 210000003205 muscle Anatomy 0.000 claims description 12
- 239000013603 viral vector Substances 0.000 claims description 12
- 239000013607 AAV vector Substances 0.000 claims description 11
- 239000013600 plasmid vector Substances 0.000 claims description 10
- 241000191967 Staphylococcus aureus Species 0.000 claims description 8
- 230000003827 upregulation Effects 0.000 claims description 8
- 238000011321 prophylaxis Methods 0.000 claims description 7
- 108010059343 MM Form Creatine Kinase Proteins 0.000 claims description 6
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 6
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 6
- 108010089612 myosin-heavy-chain kinase Proteins 0.000 claims description 6
- 239000008194 pharmaceutical composition Substances 0.000 claims description 6
- 238000013518 transcription Methods 0.000 claims description 6
- 230000035897 transcription Effects 0.000 claims description 6
- 241000702421 Dependoparvovirus Species 0.000 claims description 4
- 238000002360 preparation method Methods 0.000 claims description 4
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims description 3
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 3
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 3
- 241001164823 Adeno-associated virus - 7 Species 0.000 claims description 3
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 3
- 101100365087 Arabidopsis thaliana SCRA gene Proteins 0.000 claims description 3
- 101100365680 Arabidopsis thaliana SGT1B gene Proteins 0.000 claims description 3
- 101100417900 Clostridium acetobutylicum (strain ATCC 824 / DSM 792 / JCM 1419 / LMG 5710 / VKM B-1787) rbr3A gene Proteins 0.000 claims description 3
- 101150034686 PDC gene Proteins 0.000 claims description 3
- 101150105073 SCR1 gene Proteins 0.000 claims description 3
- 101100134054 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) NTG1 gene Proteins 0.000 claims description 3
- 101150023087 UNC45B gene Proteins 0.000 claims description 3
- 101150068906 snr-6 gene Proteins 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 239000012190 activator Substances 0.000 claims 1
- 241000282414 Homo sapiens Species 0.000 abstract description 203
- 108091028043 Nucleic acid sequence Proteins 0.000 abstract description 13
- 238000013459 approach Methods 0.000 abstract description 3
- 230000001225 therapeutic effect Effects 0.000 abstract description 3
- 108020004414 DNA Proteins 0.000 description 208
- 210000004027 cell Anatomy 0.000 description 58
- 108010050848 glycylleucine Proteins 0.000 description 26
- 108010054155 lysyllysine Proteins 0.000 description 26
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 22
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 21
- 241000880493 Leptailurus serval Species 0.000 description 19
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 18
- 108010068265 aspartyltyrosine Proteins 0.000 description 18
- 150000001413 amino acids Chemical class 0.000 description 17
- 108010068380 arginylarginine Proteins 0.000 description 17
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 16
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 14
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 14
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 14
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 14
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 14
- 108010003700 lysyl aspartic acid Proteins 0.000 description 14
- 239000013612 plasmid Substances 0.000 description 14
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 13
- 108010061238 threonyl-glycine Proteins 0.000 description 13
- 108010073969 valyllysine Proteins 0.000 description 13
- GHBSKQGCIYSCNS-NAKRPEOUSA-N Ala-Leu-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GHBSKQGCIYSCNS-NAKRPEOUSA-N 0.000 description 12
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 12
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 12
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 12
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 12
- 108010034529 leucyl-lysine Proteins 0.000 description 12
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 12
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 11
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 11
- 108091028113 Trans-activating crRNA Proteins 0.000 description 11
- 125000000539 amino acid group Chemical group 0.000 description 11
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 11
- RGAOLBZBLOJUTP-GRLWGSQLSA-N Gln-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N RGAOLBZBLOJUTP-GRLWGSQLSA-N 0.000 description 10
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 10
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 10
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 10
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 10
- 108090000765 processed proteins & peptides Proteins 0.000 description 10
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 9
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 9
- 108091027544 Subgenomic mRNA Proteins 0.000 description 9
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 238000011156 evaluation Methods 0.000 description 9
- 108010053037 kyotorphin Proteins 0.000 description 9
- 239000000523 sample Substances 0.000 description 9
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 8
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 8
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 8
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 8
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 8
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 8
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 8
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 8
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 8
- 108010005233 alanylglutamic acid Proteins 0.000 description 8
- 108010087924 alanylproline Proteins 0.000 description 8
- 108010049041 glutamylalanine Proteins 0.000 description 8
- 108010077515 glycylproline Proteins 0.000 description 8
- 108010028295 histidylhistidine Proteins 0.000 description 8
- 108010017391 lysylvaline Proteins 0.000 description 8
- 108010051242 phenylalanylserine Proteins 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- 108010003137 tyrosyltyrosine Proteins 0.000 description 8
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 7
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 7
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 7
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 7
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 7
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 7
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 7
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 7
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 7
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 7
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 7
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 7
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 7
- 108010047495 alanylglycine Proteins 0.000 description 7
- 230000002708 enhancing effect Effects 0.000 description 7
- 108010037850 glycylvaline Proteins 0.000 description 7
- 108010009298 lysylglutamic acid Proteins 0.000 description 7
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 6
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 6
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 6
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 6
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 6
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 6
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 6
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 6
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 6
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 6
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 6
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 6
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 6
- YBIAYFFIVAZXPK-AVGNSLFASA-N Arg-His-Arg Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YBIAYFFIVAZXPK-AVGNSLFASA-N 0.000 description 6
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 6
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 6
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 6
- OGZBJJLRKQZRHL-KJEVXHAQSA-N Arg-Thr-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OGZBJJLRKQZRHL-KJEVXHAQSA-N 0.000 description 6
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 6
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 6
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 6
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 6
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 6
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 6
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 6
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 6
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 6
- PMEHKVHZQKJACS-PEFMBERDSA-N Asp-Gln-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PMEHKVHZQKJACS-PEFMBERDSA-N 0.000 description 6
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 6
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 6
- DRXOWZZHCSBUOI-YJRXYDGGSA-N Cys-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CS)N)O DRXOWZZHCSBUOI-YJRXYDGGSA-N 0.000 description 6
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 6
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 6
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 6
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 6
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 6
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 6
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 6
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 6
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 6
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 6
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 6
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 6
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 6
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 6
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 6
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 6
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 6
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 6
- CGWHAXBNGYQBBK-JBACZVJFSA-N Glu-Trp-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CCC(O)=O)N)C(O)=O)C1=CC=C(O)C=C1 CGWHAXBNGYQBBK-JBACZVJFSA-N 0.000 description 6
- LSYFGBRDBIQYAQ-FHWLQOOXSA-N Glu-Tyr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LSYFGBRDBIQYAQ-FHWLQOOXSA-N 0.000 description 6
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 6
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 6
- RHRLHXQWHCNJKR-PMVVWTBXSA-N Gly-Thr-His Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RHRLHXQWHCNJKR-PMVVWTBXSA-N 0.000 description 6
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 6
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 6
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 6
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 6
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 6
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 6
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 6
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 6
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 6
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 6
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 6
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 6
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 6
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 6
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 6
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 6
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 6
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 6
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 6
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 6
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 6
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 6
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 6
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 6
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 6
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 6
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 6
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 6
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 6
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 6
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 6
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 6
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 6
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 6
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 6
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 6
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 6
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 6
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 6
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 6
- XKJUFUPCHARJKX-UWVGGRQHSA-N Met-Gly-His Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 XKJUFUPCHARJKX-UWVGGRQHSA-N 0.000 description 6
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 6
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 6
- OVJMCXAPGFDGMG-HKUYNNGSSA-N Phe-Gly-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OVJMCXAPGFDGMG-HKUYNNGSSA-N 0.000 description 6
- SMCHPSMKAFIERP-FXQIFTODSA-N Pro-Asn-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 SMCHPSMKAFIERP-FXQIFTODSA-N 0.000 description 6
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 6
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 6
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 6
- 108010079005 RDV peptide Proteins 0.000 description 6
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 6
- VMVNCJDKFOQOHM-GUBZILKMSA-N Ser-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N VMVNCJDKFOQOHM-GUBZILKMSA-N 0.000 description 6
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 6
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 6
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 6
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 6
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 6
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 6
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 6
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 6
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 6
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 6
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 6
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 6
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 6
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 6
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 6
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 6
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 6
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 6
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 6
- UOUIMEGEPSBZIV-ULQDDVLXSA-N Val-Lys-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOUIMEGEPSBZIV-ULQDDVLXSA-N 0.000 description 6
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 6
- 108010013835 arginine glutamate Proteins 0.000 description 6
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 6
- 239000001963 growth medium Substances 0.000 description 6
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- 108010056582 methionylglutamic acid Proteins 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 6
- 108010005652 splenotritin Proteins 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 6
- 238000010361 transduction Methods 0.000 description 6
- 230000026683 transduction Effects 0.000 description 6
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 5
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 5
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 5
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 5
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 5
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 5
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 5
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 5
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 5
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 5
- ZJSMFRTVYSLKQU-DJFWLOJKSA-N His-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZJSMFRTVYSLKQU-DJFWLOJKSA-N 0.000 description 5
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 5
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 5
- 102100022745 Laminin subunit alpha-2 Human genes 0.000 description 5
- 241000713666 Lentivirus Species 0.000 description 5
- URJUVJDTPXCQFL-IHPCNDPISA-N Leu-Trp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N URJUVJDTPXCQFL-IHPCNDPISA-N 0.000 description 5
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 5
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 5
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 5
- FPQMQEOVSKMVMA-ACRUOGEOSA-N Lys-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCCCN)N)O FPQMQEOVSKMVMA-ACRUOGEOSA-N 0.000 description 5
- YNOVBMBQSQTLFM-DCAQKATOSA-N Met-Asn-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O YNOVBMBQSQTLFM-DCAQKATOSA-N 0.000 description 5
- 108010003201 RGH 0205 Proteins 0.000 description 5
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 5
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 5
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 5
- 230000009471 action Effects 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 5
- 210000003917 human chromosome Anatomy 0.000 description 5
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 5
- 210000004379 membrane Anatomy 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 210000002027 skeletal muscle Anatomy 0.000 description 5
- 108010068794 tyrosyl-tyrosyl-glutamyl-glutamic acid Proteins 0.000 description 5
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 4
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 4
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 4
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 4
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 4
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 4
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 4
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 4
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 4
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 4
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 4
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 4
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 4
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 4
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 4
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 4
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 4
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 4
- LRCIOEVFVGXZKB-BZSNNMDCSA-N Asn-Tyr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LRCIOEVFVGXZKB-BZSNNMDCSA-N 0.000 description 4
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 4
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 4
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 4
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 4
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 4
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 4
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 4
- UXXIVIQGOODKQC-NUMRIWBASA-N Gln-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UXXIVIQGOODKQC-NUMRIWBASA-N 0.000 description 4
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 4
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 4
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 4
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 4
- XNOWYPDMSLSRKP-GUBZILKMSA-N Glu-Met-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O XNOWYPDMSLSRKP-GUBZILKMSA-N 0.000 description 4
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 4
- YOTHMZZSJKKEHZ-SZMVWBNQSA-N Glu-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCC(O)=O)=CNC2=C1 YOTHMZZSJKKEHZ-SZMVWBNQSA-N 0.000 description 4
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 4
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 4
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 4
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 4
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 4
- VLIJYPMATZSOLL-YUMQZZPRSA-N Gly-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VLIJYPMATZSOLL-YUMQZZPRSA-N 0.000 description 4
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 4
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 4
- AFPFGFUGETYOSY-HGNGGELXSA-N His-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AFPFGFUGETYOSY-HGNGGELXSA-N 0.000 description 4
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 4
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 4
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 4
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 4
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 4
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 4
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 4
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 4
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 4
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 4
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 4
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 4
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 4
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 4
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 4
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 4
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 4
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 4
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 4
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 4
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 4
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 4
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 4
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 4
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 4
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 4
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 4
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 4
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 4
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 4
- FWTBMGAKKPSTBT-GUBZILKMSA-N Met-Gln-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FWTBMGAKKPSTBT-GUBZILKMSA-N 0.000 description 4
- DJBCKVNHEIJLQA-GMOBBJLQSA-N Met-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCSC)N DJBCKVNHEIJLQA-GMOBBJLQSA-N 0.000 description 4
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 4
- TWEWRDAAIYBJTO-ULQDDVLXSA-N Met-Tyr-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N TWEWRDAAIYBJTO-ULQDDVLXSA-N 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- LXVFHIBXOWJTKZ-BZSNNMDCSA-N Phe-Asn-Tyr Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O LXVFHIBXOWJTKZ-BZSNNMDCSA-N 0.000 description 4
- ABQFNJAFONNUTH-FHWLQOOXSA-N Phe-Gln-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N ABQFNJAFONNUTH-FHWLQOOXSA-N 0.000 description 4
- WKTSCAXSYITIJJ-PCBIJLKTSA-N Phe-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O WKTSCAXSYITIJJ-PCBIJLKTSA-N 0.000 description 4
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 4
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 4
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 4
- QBUWQRKEHJXTOP-DCAQKATOSA-N Ser-His-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QBUWQRKEHJXTOP-DCAQKATOSA-N 0.000 description 4
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 4
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 4
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 4
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 4
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 4
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 4
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 4
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 4
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 4
- KAJRRNHOVMZYBL-IRIUXVKKSA-N Thr-Tyr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAJRRNHOVMZYBL-IRIUXVKKSA-N 0.000 description 4
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 4
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 4
- MXFPBNFKVBHIRW-BZSNNMDCSA-N Tyr-Lys-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O MXFPBNFKVBHIRW-BZSNNMDCSA-N 0.000 description 4
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 4
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 4
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 4
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 4
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 4
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 201000006815 congenital muscular dystrophy Diseases 0.000 description 4
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 4
- 108010091871 leucylmethionine Proteins 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 108010070643 prolylglutamic acid Proteins 0.000 description 4
- 108010048818 seryl-histidine Proteins 0.000 description 4
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 4
- 108010026333 seryl-proline Proteins 0.000 description 4
- JAYIQMNQDMOBFY-KKUMJFAQSA-N Arg-Glu-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JAYIQMNQDMOBFY-KKUMJFAQSA-N 0.000 description 3
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 3
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 3
- KSBHCUSPLWRVEK-ZLUOBGJFSA-N Asn-Asn-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KSBHCUSPLWRVEK-ZLUOBGJFSA-N 0.000 description 3
- XQQVCUIBGYFKDC-OLHMAJIHSA-N Asn-Asp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XQQVCUIBGYFKDC-OLHMAJIHSA-N 0.000 description 3
- UEONJSPBTSWKOI-CIUDSAMLSA-N Asn-Gln-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O UEONJSPBTSWKOI-CIUDSAMLSA-N 0.000 description 3
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 3
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 3
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 3
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 3
- 241000701022 Cytomegalovirus Species 0.000 description 3
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 3
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 3
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 3
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 3
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 3
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 3
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 3
- MLZVJIREOKTDAR-SIGLWIIPSA-N His-Ile-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MLZVJIREOKTDAR-SIGLWIIPSA-N 0.000 description 3
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 3
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 3
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 3
- 108010065920 Insulin Lispro Proteins 0.000 description 3
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 3
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 3
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 3
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 3
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 3
- DZQYZKPINJLLEN-KKUMJFAQSA-N Lys-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O DZQYZKPINJLLEN-KKUMJFAQSA-N 0.000 description 3
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 3
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 3
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 3
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 3
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 3
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 3
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 3
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 3
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 3
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 3
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 3
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 3
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 3
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 3
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 3
- IGXLNVIYDYONFB-UFYCRDLUSA-N Tyr-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 IGXLNVIYDYONFB-UFYCRDLUSA-N 0.000 description 3
- PYJKETPLFITNKS-IHRRRGAJSA-N Tyr-Pro-Asn Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O PYJKETPLFITNKS-IHRRRGAJSA-N 0.000 description 3
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 239000004480 active ingredient Substances 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 108010008097 laminin alpha 2 Proteins 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 108010068488 methionylphenylalanine Proteins 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 229950010131 puromycin Drugs 0.000 description 3
- 239000006152 selective media Substances 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 108010051110 tyrosyl-lysine Proteins 0.000 description 3
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 2
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 2
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 2
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 2
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 2
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 2
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- NXVGBGZQQFDUTM-XVYDVKMFSA-N Asn-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N NXVGBGZQQFDUTM-XVYDVKMFSA-N 0.000 description 2
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 2
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 2
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 2
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 2
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 2
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 2
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 2
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 2
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 2
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 2
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 2
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 2
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 2
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 2
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 2
- VHUKCUHLFMRHOD-MELADBBJSA-N Asp-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O VHUKCUHLFMRHOD-MELADBBJSA-N 0.000 description 2
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 2
- 108090000565 Capsid Proteins Proteins 0.000 description 2
- 102100023321 Ceruloplasmin Human genes 0.000 description 2
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 2
- 108010069091 Dystrophin Proteins 0.000 description 2
- 102000001039 Dystrophin Human genes 0.000 description 2
- 241000589601 Francisella Species 0.000 description 2
- SWDSRANUCKNBLA-AVGNSLFASA-N Gln-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SWDSRANUCKNBLA-AVGNSLFASA-N 0.000 description 2
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 2
- LJLPOZGRPLORTF-CIUDSAMLSA-N Glu-Asn-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LJLPOZGRPLORTF-CIUDSAMLSA-N 0.000 description 2
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 2
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 2
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 2
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 2
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 2
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 2
- KXRORHJIRAOQPG-SOUVJXGZSA-N Glu-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KXRORHJIRAOQPG-SOUVJXGZSA-N 0.000 description 2
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 2
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 2
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 2
- YZPVGIVFMZLQMM-YUMQZZPRSA-N Gly-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN YZPVGIVFMZLQMM-YUMQZZPRSA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- LMMPTUVWHCFTOT-GARJFASQSA-N His-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O LMMPTUVWHCFTOT-GARJFASQSA-N 0.000 description 2
- ORERHHPZDDEMSC-VGDYDELISA-N His-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ORERHHPZDDEMSC-VGDYDELISA-N 0.000 description 2
- XJFITURPHAKKAI-SRVKXCTJSA-N His-Pro-Gln Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CN=CN1 XJFITURPHAKKAI-SRVKXCTJSA-N 0.000 description 2
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101100127663 Homo sapiens LAMA2 gene Proteins 0.000 description 2
- 101001023043 Homo sapiens Myoblast determination protein 1 Proteins 0.000 description 2
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 2
- HZMLFETXHFHGBB-UGYAYLCHSA-N Ile-Asn-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZMLFETXHFHGBB-UGYAYLCHSA-N 0.000 description 2
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 2
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 2
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 2
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 2
- XDUVMJCBYUKNFJ-MXAVVETBSA-N Ile-Lys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N XDUVMJCBYUKNFJ-MXAVVETBSA-N 0.000 description 2
- FFJQAEYLAQMGDL-MGHWNKPDSA-N Ile-Lys-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FFJQAEYLAQMGDL-MGHWNKPDSA-N 0.000 description 2
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 2
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 2
- 101150089565 LAMA2 gene Proteins 0.000 description 2
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 2
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 2
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 2
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 2
- PPQRKXHCLYCBSP-IHRRRGAJSA-N Leu-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N PPQRKXHCLYCBSP-IHRRRGAJSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- 108010063860 Leu-Ser-Glu-Ala-Leu Proteins 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 2
- PRCHKVGXZVTALR-KKUMJFAQSA-N Lys-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N PRCHKVGXZVTALR-KKUMJFAQSA-N 0.000 description 2
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 2
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 2
- MIROMRNASYKZNL-ULQDDVLXSA-N Lys-Pro-Tyr Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MIROMRNASYKZNL-ULQDDVLXSA-N 0.000 description 2
- LBNFTWKGISQVEE-AVGNSLFASA-N Met-Leu-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCSC LBNFTWKGISQVEE-AVGNSLFASA-N 0.000 description 2
- VYDLZDRMOFYOGV-TUAOUCFPSA-N Met-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N VYDLZDRMOFYOGV-TUAOUCFPSA-N 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 102100035077 Myoblast determination protein 1 Human genes 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 2
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 2
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 2
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 2
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 2
- GRIRJQGZZJVANI-CYDGBPFRSA-N Pro-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 GRIRJQGZZJVANI-CYDGBPFRSA-N 0.000 description 2
- VPVHXWGPALPDGP-GUBZILKMSA-N Pro-Asn-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPVHXWGPALPDGP-GUBZILKMSA-N 0.000 description 2
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 2
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 2
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 2
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 2
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 2
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 2
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 2
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 108091081021 Sense strand Proteins 0.000 description 2
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 2
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 2
- JLPMFVAIQHCBDC-CIUDSAMLSA-N Ser-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N JLPMFVAIQHCBDC-CIUDSAMLSA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 2
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 2
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 2
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 2
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 2
- UUIYFDAWNBSWPG-IHPCNDPISA-N Trp-Lys-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N UUIYFDAWNBSWPG-IHPCNDPISA-N 0.000 description 2
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 2
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 2
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 2
- UNUZEBFXGWVAOP-DZKIICNBSA-N Tyr-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UNUZEBFXGWVAOP-DZKIICNBSA-N 0.000 description 2
- LFCQXIXJQXWZJI-BZSNNMDCSA-N Tyr-His-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N)O LFCQXIXJQXWZJI-BZSNNMDCSA-N 0.000 description 2
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 2
- CWVHKVVKAQIJKY-ACRUOGEOSA-N Tyr-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N CWVHKVVKAQIJKY-ACRUOGEOSA-N 0.000 description 2
- JQOMHZMWQHXALX-FHWLQOOXSA-N Tyr-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JQOMHZMWQHXALX-FHWLQOOXSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 2
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 2
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 2
- 101150063416 add gene Proteins 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000027455 binding Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010195 expression analysis Methods 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 210000003098 myoblast Anatomy 0.000 description 2
- 210000004165 myocardium Anatomy 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 230000001124 posttranscriptional effect Effects 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 210000002363 skeletal muscle cell Anatomy 0.000 description 2
- DAEPDZWVDSPTHF-UHFFFAOYSA-M sodium pyruvate Chemical compound [Na+].CC(=O)C([O-])=O DAEPDZWVDSPTHF-UHFFFAOYSA-M 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- XJFPXLWGZWAWRQ-UHFFFAOYSA-N 2-[[2-[[2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O XJFPXLWGZWAWRQ-UHFFFAOYSA-N 0.000 description 1
- BGDLEQXJCCFSCU-UHFFFAOYSA-N 4-[[2-[(2-acetamido-4-methylpentanoyl)amino]-3-hydroxypropanoyl]amino]-5-[[1-[(1-amino-4-methyl-1-oxopentan-2-yl)amino]-1-oxopropan-2-yl]amino]-5-oxopentanoic acid;2,2,2-trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F.CC(C)CC(C(N)=O)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(CO)NC(=O)C(CC(C)C)NC(C)=O BGDLEQXJCCFSCU-UHFFFAOYSA-N 0.000 description 1
- 241000093740 Acidaminococcus sp. Species 0.000 description 1
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 1
- 241000649045 Adeno-associated virus 10 Species 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- FOWHQTWRLFTELJ-FXQIFTODSA-N Ala-Asp-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N FOWHQTWRLFTELJ-FXQIFTODSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- RUQBGIMJQUWXPP-CYDGBPFRSA-N Ala-Leu-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O RUQBGIMJQUWXPP-CYDGBPFRSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- VGMNWQOPSFBBBG-XUXIUFHCSA-N Ala-Leu-Leu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VGMNWQOPSFBBBG-XUXIUFHCSA-N 0.000 description 1
- ZKEHTYWGPMMGBC-XUXIUFHCSA-N Ala-Leu-Leu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O ZKEHTYWGPMMGBC-XUXIUFHCSA-N 0.000 description 1
- MAEQBGQTDWDSJQ-LSJOCFKGSA-N Ala-Met-His Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MAEQBGQTDWDSJQ-LSJOCFKGSA-N 0.000 description 1
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 102400000310 Alpha-dystroglycan Human genes 0.000 description 1
- MCYJBCKCAPERSE-FXQIFTODSA-N Arg-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N MCYJBCKCAPERSE-FXQIFTODSA-N 0.000 description 1
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- DJAIOAKQIOGULM-DCAQKATOSA-N Arg-Glu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O DJAIOAKQIOGULM-DCAQKATOSA-N 0.000 description 1
- QKSAZKCRVQYYGS-UWVGGRQHSA-N Arg-Gly-His Chemical compound N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QKSAZKCRVQYYGS-UWVGGRQHSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 1
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 1
- JJGRJMKUOYXZRA-LPEHRKFASA-N Asn-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O JJGRJMKUOYXZRA-LPEHRKFASA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- KNENKKKUYGEZIO-FXQIFTODSA-N Asn-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N KNENKKKUYGEZIO-FXQIFTODSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- ATYWBXGNXZYZGI-ACZMJKKPSA-N Asp-Asn-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ATYWBXGNXZYZGI-ACZMJKKPSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- JGDBHIVECJGXJA-FXQIFTODSA-N Asp-Asp-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JGDBHIVECJGXJA-FXQIFTODSA-N 0.000 description 1
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 1
- RATOMFTUDRYMKX-ACZMJKKPSA-N Asp-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N RATOMFTUDRYMKX-ACZMJKKPSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 1
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- IOXWDLNHXZOXQP-FXQIFTODSA-N Asp-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N IOXWDLNHXZOXQP-FXQIFTODSA-N 0.000 description 1
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 1
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 1
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 1
- JGLWFWXGOINXEA-YDHLFZDLSA-N Asp-Val-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JGLWFWXGOINXEA-YDHLFZDLSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108091092236 Chimeric RNA Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 1
- OEDPLIBVQGRKGZ-AVGNSLFASA-N Cys-Tyr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O OEDPLIBVQGRKGZ-AVGNSLFASA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 108020001019 DNA Primers Proteins 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 108010071885 Dystroglycans Proteins 0.000 description 1
- 102100031726 Endoplasmic reticulum junction formation protein lunapark Human genes 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- XOKGKOQWADCLFQ-GARJFASQSA-N Gln-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XOKGKOQWADCLFQ-GARJFASQSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 1
- XBWGJWXGUNSZAT-CIUDSAMLSA-N Gln-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XBWGJWXGUNSZAT-CIUDSAMLSA-N 0.000 description 1
- DFRYZTUPVZNRLG-KKUMJFAQSA-N Gln-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DFRYZTUPVZNRLG-KKUMJFAQSA-N 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 1
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 1
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- GUOWMVFLAJNPDY-CIUDSAMLSA-N Glu-Ser-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GUOWMVFLAJNPDY-CIUDSAMLSA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 1
- KCCNSVHJSMMGFS-NRPADANISA-N Glu-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KCCNSVHJSMMGFS-NRPADANISA-N 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 1
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 102100032606 Heat shock factor protein 1 Human genes 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- MBSSHYPAEHPSGY-LSJOCFKGSA-N His-Ala-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O MBSSHYPAEHPSGY-LSJOCFKGSA-N 0.000 description 1
- JBJNKUOMNZGQIM-PYJNHQTQSA-N His-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JBJNKUOMNZGQIM-PYJNHQTQSA-N 0.000 description 1
- TTZAWSKKNCEINZ-AVGNSLFASA-N His-Arg-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O TTZAWSKKNCEINZ-AVGNSLFASA-N 0.000 description 1
- NNBWMLHQXBTIIT-HVTMNAMFSA-N His-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N NNBWMLHQXBTIIT-HVTMNAMFSA-N 0.000 description 1
- OSZUPUINVNPCOE-SDDRHHMPSA-N His-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OSZUPUINVNPCOE-SDDRHHMPSA-N 0.000 description 1
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 1
- ILUVWFTXAUYOBW-CUJWVEQBSA-N His-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N)O ILUVWFTXAUYOBW-CUJWVEQBSA-N 0.000 description 1
- FBVHRDXSCYELMI-PBCZWWQYSA-N His-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O FBVHRDXSCYELMI-PBCZWWQYSA-N 0.000 description 1
- CSTDQOOBZBAJKE-BWAGICSOSA-N His-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N)O CSTDQOOBZBAJKE-BWAGICSOSA-N 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000941029 Homo sapiens Endoplasmic reticulum junction formation protein lunapark Proteins 0.000 description 1
- 101000867525 Homo sapiens Heat shock factor protein 1 Proteins 0.000 description 1
- 101000972491 Homo sapiens Laminin subunit alpha-2 Proteins 0.000 description 1
- 101000573526 Homo sapiens Membrane protein MLC1 Proteins 0.000 description 1
- 101000635885 Homo sapiens Myosin light chain 1/3, skeletal muscle isoform Proteins 0.000 description 1
- 101000991410 Homo sapiens Nucleolar and spindle-associated protein 1 Proteins 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 238000009015 Human TaqMan MicroRNA Assay kit Methods 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 1
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 1
- PFTFEWHJSAXGED-ZKWXMUAHSA-N Ile-Cys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N PFTFEWHJSAXGED-ZKWXMUAHSA-N 0.000 description 1
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- UQXADIGYEYBJEI-DJFWLOJKSA-N Ile-His-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N UQXADIGYEYBJEI-DJFWLOJKSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- ZUPJCJINYQISSN-XUXIUFHCSA-N Ile-Met-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUPJCJINYQISSN-XUXIUFHCSA-N 0.000 description 1
- IIWQTXMUALXGOV-PCBIJLKTSA-N Ile-Phe-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IIWQTXMUALXGOV-PCBIJLKTSA-N 0.000 description 1
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 1
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- XMYURPUVJSKTMC-KBIXCLLPSA-N Ile-Ser-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XMYURPUVJSKTMC-KBIXCLLPSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 241001112693 Lachnospiraceae Species 0.000 description 1
- 108010085895 Laminin Proteins 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- 108090000362 Lymphotoxin-beta Proteins 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 1
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 1
- MYTOTTSMVMWVJN-STQMWFEESA-N Lys-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MYTOTTSMVMWVJN-STQMWFEESA-N 0.000 description 1
- 101150094019 MYOG gene Proteins 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- 102100026290 Membrane protein MLC1 Human genes 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- 208000036626 Mental retardation Diseases 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- IVCPHARVJUYDPA-FXQIFTODSA-N Met-Asn-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IVCPHARVJUYDPA-FXQIFTODSA-N 0.000 description 1
- XOMXAVJBLRROMC-IHRRRGAJSA-N Met-Asp-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOMXAVJBLRROMC-IHRRRGAJSA-N 0.000 description 1
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 1
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 1
- OIFHHODAXVWKJN-ULQDDVLXSA-N Met-Phe-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 OIFHHODAXVWKJN-ULQDDVLXSA-N 0.000 description 1
- BQHLZUMZOXUWNU-DCAQKATOSA-N Met-Pro-Glu Chemical compound CSCC[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BQHLZUMZOXUWNU-DCAQKATOSA-N 0.000 description 1
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 1
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 1
- 108700011325 Modifier Genes Proteins 0.000 description 1
- 241000711408 Murine respirovirus Species 0.000 description 1
- 101100351033 Mus musculus Pax7 gene Proteins 0.000 description 1
- 206010028289 Muscle atrophy Diseases 0.000 description 1
- 102100038380 Myogenic factor 5 Human genes 0.000 description 1
- 101710099061 Myogenic factor 5 Proteins 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- 206010033799 Paralysis Diseases 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- IILUKIJNFMUBNF-IHRRRGAJSA-N Phe-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O IILUKIJNFMUBNF-IHRRRGAJSA-N 0.000 description 1
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 1
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 1
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 1
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 1
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 1
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 1
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 1
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 1
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 1
- LANQLYHLMYDWJP-SRVKXCTJSA-N Pro-Gln-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O LANQLYHLMYDWJP-SRVKXCTJSA-N 0.000 description 1
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- SSWJYJHXQOYTSP-SRVKXCTJSA-N Pro-His-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O SSWJYJHXQOYTSP-SRVKXCTJSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 1
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 1
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 1
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 1
- GXWRTSIVLSQACD-RCWTZXSCSA-N Pro-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1)O GXWRTSIVLSQACD-RCWTZXSCSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- NBDHWLZEMKSVHH-UVBJJODRSA-N Pro-Trp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 NBDHWLZEMKSVHH-UVBJJODRSA-N 0.000 description 1
- IALSFJSONJZBKB-HRCADAONSA-N Pro-Tyr-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N3CCC[C@@H]3C(=O)O IALSFJSONJZBKB-HRCADAONSA-N 0.000 description 1
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- CJINPXGSKSZQNE-KBIXCLLPSA-N Ser-Ile-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O CJINPXGSKSZQNE-KBIXCLLPSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 1
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- QUGRFWPMPVIAPW-IHRRRGAJSA-N Ser-Pro-Phe Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QUGRFWPMPVIAPW-IHRRRGAJSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 1
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 1
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 239000007984 Tris EDTA buffer Substances 0.000 description 1
- 102000013534 Troponin C Human genes 0.000 description 1
- GRSCONMARGNYHA-PMVMPFDFSA-N Trp-Lys-Phe Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GRSCONMARGNYHA-PMVMPFDFSA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 1
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 1
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 1
- BCOBSVIZMQXKFY-KKUMJFAQSA-N Tyr-Ser-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O BCOBSVIZMQXKFY-KKUMJFAQSA-N 0.000 description 1
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 1
- NWDOPHYLSORNEX-QXEWZRGKSA-N Val-Asn-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N NWDOPHYLSORNEX-QXEWZRGKSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 108010066829 alanyl-glutamyl-aspartylprolyine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010021908 aspartyl-aspartyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 208000025341 autosomal recessive disease Diseases 0.000 description 1
- 210000002469 basement membrane Anatomy 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 210000004292 cytoskeleton Anatomy 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000002298 density-gradient ultracentrifugation Methods 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000010842 high-capacity cDNA reverse transcription kit Methods 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 108010051779 histone H3 trimethyl Lys4 Proteins 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 230000020763 muscle atrophy Effects 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 201000000585 muscular atrophy Diseases 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 108010015840 seryl-prolyl-lysyl-lysine Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 230000004096 skeletal muscle tissue growth Effects 0.000 description 1
- 229940054269 sodium pyruvate Drugs 0.000 description 1
- 230000037436 splice-site mutation Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 238000012385 systemic delivery Methods 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 108700004896 tripeptide FEG Proteins 0.000 description 1
- PIEPQKCYPFFYMG-UHFFFAOYSA-N tris acetate Chemical compound CC(O)=O.OCC(N)(CO)CO PIEPQKCYPFFYMG-UHFFFAOYSA-N 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000012418 validation experiment Methods 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/465—Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/713—Double-stranded nucleic acids or oligonucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/1703—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- A61K38/1709—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/39—Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin, cold insoluble globulin [CIG]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0058—Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
- C07K14/4705—Regulators; Modulating activity stimulating, promoting or activating activity
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/78—Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
- C07K2319/71—Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/10—Applications; Uses in screening processes
- C12N2320/11—Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/15011—Lentivirus, not HIV, e.g. FIV, SIV
- C12N2740/15041—Use of virus, viral particle or viral elements as a vector
- C12N2740/15043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/15011—Lentivirus, not HIV, e.g. FIV, SIV
- C12N2740/15071—Demonstrated in vivo effect
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Epidemiology (AREA)
- Toxicology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Virology (AREA)
- Immunology (AREA)
- Neurology (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Physical Education & Sports Medicine (AREA)
- Ophthalmology & Optometry (AREA)
- Marine Sciences & Fisheries (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 인간 근이영양증(특히 MDC1A)에 대한 신규한 치료적 접근법을 제공하는 것을 목적으로 한다. 본 발명은 이하의 염기 서열: (a) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열, 및 (b) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역을 표적으로 하는 가이드 RNA, (ii) 서열번호: 124에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA를 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드를 제공한다.
Description
본 발명은 라미닌-α1 쇄(Laminin-α1 chain; LAMA1) 유전자 등을 표적으로 하는 근이영양증(muscular dystrophy), 특히 메로신-결핍 선천성 근이영양증(Merosin-Deficient Congenital Muscular Dystrophy; MDC1A)의 치료 방법에 관한 것이다. 보다 구체적으로, 본 발명은 근이영양증을 치료 또는 예방하는 방법으로서, 인간 LAMA1 유전자의 특정 서열을 표적으로 하는 가이드 RNA, 전사 활성화 인자와 CRISPR 이펙터 단백질의 융합 단백질, 및 근이영양증을 치료 또는 예방하기 위한 약제 등을 이용하는 것에 의해 근육 조직에 본질적으로 발현되지 않는 인간 LAMA1 유전자의 발현을 상향 조절함으로써 돌연변이에 의해 결실된 LAMA2 또는 그 기능을 보완하는 것을 포함하는 방법에 관한 것이다.
근이영양증은 진행성 근위축과 근력 손실을 동반하는 유전성 질환의 총칭이다. 현재, 근이영양증에 효과적인 근본적인 치료약은 없고, 대증 요법만이 행해지고 있다. 근이영양증의 한 유형으로서, 상염색체 열성 질환인 메로신-결핍 선천성 근이영양증(MDC1A)이 알려져 있다.
MDC1A는 정신 지체를 수반하지 않는 서구형 선천성 근이영양증으로, 골격근 기저막 성분에서 메로신의 결핍에 의해 발생한다. 메로신은 라미닌 쇄로 구성된 헤테로삼량체이며, 당 쇄 구조를 통해 α-디스트로글리칸(α-dystroglycan)에 결합된다. 메로신이 고갈되면 디스트로핀 당단백질 복합체(dystrophin glycoprotein complex)를 통한 세포 골격과 세포외 기질 사이의 연결이 끊어진다. 이는 유럽과 미국에서 가장 흔한 선천성 근이영양증이다(약 50%). 이는 라미닌 α2 쇄 유전자(LAMA2 유전자)의 6q22.33에서의 돌연변이로 인해 발생한다.
Cohn 등은 MDC1A dy2J/dy2J 마우스 모델에서 CRISPR/Cas9 게놈 편집 구성 요소와 함께 아데노 연관 바이러스(adeno-associated virus; AAV)의 전신 전달을 통해 LAMA2 유전자의 돌연변이를 유발하는 스플라이스 부위 돌연변이(splice site mutation)를 교정하는 방법을 보고하였다. 치료 후 dy2J/dy2J 마우스는 마비의 징후 없이 근육 조직병리학(histopathology) 및 기능에서 상당한 개선을 나타내었다(비특허문헌 1).
더욱이, Bassi는 LAMA1 유전자가 MDC1A에 대한 질병 변형 유전자일 수 있음을 보여주었다. LAMA1 유전자는 라미닌 α2 쇄와 구조적으로 유사한 라미닌 α1 쇄 단백질을 코딩한다. 구체적으로, 마우스를 사용한 실험에서 황색포도상구균(S. aureus)의 CRISPR/Cas9 시스템이 LAMA1 발현을 상향 조절하고, 라미닌 α2 쇄의 결핍을 보상하는 데 사용될 수 있다는 가능성을 보여주었다(비특허문헌 2 및 3).
Kemaladewi, D. U., Maino, E., Hyatt, E., Hou, H., Ding, M., Place, K. M., Zhu, X., Bassi, P., Baghestani, Z., Deshwar, A. G., Merico, D., Xiong, H. Y., Frey, B. J., Wilson, M. D., Ivakine, E. A., Cohn, R. D. Nat Medicine. 23:8. 2017.
Prabhpreet Singh Bassi, A thesis submitted in conformity with the requirements for the degree of Master of Science, Department of Molecular Genetics, University of Toronto. 2017: Assessing the Therapeutic Potential of CRISPR/Cas9-Mediated Gene Modulation in Merosin-Deficient Congenital Muscular Dystrophy Type 1A
Dwi U. Kemaladewi, Prabhpreet S. Bassi, Steven erwood, Dhekra Al-Basha, Kinga I. Gawlik, Kyle Lindsay, elzbieta Hyatt, rebekah Kember, Kara M. Place, ryan M. Marks, Madeleine Durbeej, Steven A. Prescott, evgueni A. Ivakine & ronald D. Cohn, Nature 572, p125, 2019: A mutation-independent approach for muscular dystrophy via upregulation of a modifier gene
본 발명은 인간 근이영양증(특히 MDC1A)에 대한 신규한 치료적 접근법을 제공하는 것을 목적으로 한다.
본 발명자들은 상술한 문제에 대해 집중적인 연구를 수행하여 인간 LAMA1 유전자(Gene ID: 284217)의 특정 서열을 표적으로 하는 가이드 RNA, 및 전사 활성화 인자와 뉴클레아제 활성이 없는 CRISPR 이펙터 단백질의 융합 단백질을 이용하여 근세포에서 인간 LAMA1 유전자의 발현이 상향 조절될 수 있음을 발견하였다. 본 발명자들은 이러한 지견에 기초하여 본 발명을 완성하였다.
본 발명은 이하의 발명을 포함할 수 있다.
[1] 이하의 염기 서열을 포함하는 폴리뉴클레오타이드:
(a) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열, 및
(b) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역을 표적으로 하는 가이드 RNA, (ii) 서열번호: 124에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA를 코딩하는 염기 서열.
[2] 가이드 RNA를 코딩하는 염기 서열이
(i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 염기 서열,
(ii) 서열번호: 124에 기재된 염기 서열,
(iii) 서열번호: 178, 193, 또는 195에 기재된 염기 서열,
또는 여기서 1 내지 3개의 염기가 결실, 치환, 삽입 및/또는 부가된 염기 서열을 포함하는, 상기 [1]의 폴리뉴클레오타이드.
[3] 전사 활성화 인자가 VP64, VP160, VPH, VPR, VP64-miniRTA(miniVR) 및 microVR, 및 전사 활성화 능력을 갖는 그의 변이체로 이루어진 군에서 선택되는, 상기 [1] 또는 [2]의 폴리뉴클레오타이드.
[4] 전사 활성화 인자가 miniVR인, 상기 [3]의 폴리뉴클레오타이드.
[5] 뉴클레아제-결핍 CRISPR 이펙터 단백질이 dCas9인, 상기 [1] 내지 [4] 중 어느 하나의 폴리뉴클레오타이드.
[6] dCas9가 황색포도상구균(Staphylococcus aureus)에서 유래하는, 상기 [5]의 폴리뉴클레오타이드.
[7] 가이드 RNA를 코딩하는 염기 서열에 대한 프로모터 서열 및/또는 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열에 대한 프로모터 서열을 더 포함하는, 상기 [1] 내지 [6] 중 어느 하나의 폴리뉴클레오타이드.
[8] 가이드 RNA를 코딩하는 염기 서열에 대한 프로모터 서열이 U6 프로모터, SNR6 프로모터, SNR52 프로모터, SCR1 프로모터, RPR1 프로모터, U3 프로모터, 및 H1 프로모터로 이루어진 군에서 선택되는, 상기 [7]의 폴리뉴클레오타이드.
[9] 가이드 RNA를 코딩하는 염기 서열에 대한 프로모터 서열이 U6 프로모터인, 상기 [8]의 폴리뉴클레오타이드.
[10] 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열에 대한 프로모터 서열이 유비쿼터스 프로모터(ubiquitous promoter) 또는 근육 특이적 프로모터인, 상기 [7] 내지 [9] 중 어느 하나의 폴리뉴클레오타이드.
[11] 유비쿼터스 프로모터가 EFS 프로모터, CMV 프로모터 및 CAG 프로모터로 이루어진 군에서 선택되는, 상기 [10]의 폴리뉴클레오타이드.
[12] 근육 특이적 프로모터가 CK8 프로모터, 마이오신 중쇄 키나아제(myosin heavy chain kinase; MHCK) 프로모터, 근육 크레아틴 키나아제(muscle creatine kinase; MCK) 프로모터, 합성 C5-12(Syn) 프로모터 및 unc45b 프로모터로 이루어진 군에서 선택되는, 상기 [10]의 폴리뉴클레오타이드.
[13] 상기 [1] 내지 [12] 중 어느 하나의 폴리뉴클레오타이드를 포함하는 벡터.
[14] 벡터가 플라스미드 벡터 또는 바이러스성 벡터인, 상기 [13]의 벡터.
[15] 바이러스성 벡터가 아데노 연관 바이러스(AAV) 벡터, 아데노바이러스 벡터, 및 렌티바이러스 벡터로 이루어진 군에서 선택되는, 상기 [14]의 벡터.
[16] AAV 벡터가 AAV1, AAV2, AAV6, AAV7, AAV8, AAV9, 및 그들의 변이체로 이루어진 군에서 선택되는, 상기 [15]의 벡터.
[17] 상기 [1] 내지 [12] 중 어느 하나의 폴리뉴클레오타이드 또는 상기 [13] 내지 [16] 중 어느 하나의 벡터를 포함하는, MDC1A를 치료 또는 예방하기 위한 약제.
[18] 상기 [1] 내지 [12] 중 어느 하나의 폴리뉴클레오타이드 또는 상기 [13] 내지 [16] 중 어느 하나의 벡터를 이를 필요로 하는 대상에 투여하는 것을 포함하는, MDC1A를 치료 또는 예방하는 방법.
[19] MDC1A를 치료 또는 예방하기 위한, 상기 [1] 내지 [12] 중 어느 하나의 폴리뉴클레오타이드 또는 상기 [13] 내지 [16] 중 어느 하나의 벡터의 사용.
[20] MDC1A의 치료 또는 예방용 약학 조성물의 제조에 있어서 상기 [1] 내지 [12] 중 어느 하나의 폴리뉴클레오타이드 또는 상기 [13] 내지 [16] 중 어느 하나의 벡터의 사용.
[21] 세포에서 인간 LAMA1 유전자의 발현을 상향 조절하는 방법으로서,
(c) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 및
(d) 인간 LAMA1의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA를 상기 세포에서 발현하는 것을 포함하는 방법.
[22] 이하를 포함하는 리보핵단백질(ribonucleoprotein):
(c) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질 및
(d) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA.
[23] 이하를 포함하는, 인간 LAMA1 유전자 발현의 상향 조절용 키트:
(e) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 또는 융합 단백질을 코딩하는 폴리뉴클레오타이드, 및
(f) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 가이드 RNA를 코딩하는 폴리뉴클레오타이드.
[24] 이하의 (e) 및 (f)를 투여하는 것을 포함하는, MDC1A를 치료 또는 예방하는 방법:
(e) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 또는 융합 단백질을 코딩하는 폴리뉴클레오타이드, 및
(f) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 가이드 RNA를 코딩하는 폴리뉴클레오타이드.
[25] MDC1A의 치료 또는 예방용 약학 조성물의 제조에 있어서, 이하의 (e) 및 (f)의 사용:
(e) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 또는 융합 단백질을 코딩하는 폴리뉴클레오타이드, 및
(f) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 가이드 RNA를 코딩하는 폴리뉴클레오타이드.
본 발명에 따르면, 인간 LAMA1 유전자의 발현을 상향 조절할 수 있으며, 그 결과 본 발명이 MDC1A를 치료할 수 있을 것으로 기대된다.
[도 1] 도 1은 인간 LAMA1 유전자에서 표적 게놈 영역의 위치(location)를 나타낸다.
[도 2] 도 2는 서열번호: 1 내지 16에 나타낸 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA 및 mini-VR을 사용한, 공여자 #3에서 유래된 1차 골격근 근아세포(skeletal muscle myoblast)(HSMM 세포) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA를 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 3] 도 3은 서열번호: 1 내지 16에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA 및 mini-VR을 사용한, 공여자 #5에서 유래된 1차 HSMM 세포 중의 인간 LAMA1 유전자에 대한 발현 증진 효과의 평가 결과를 나타낸다. 가로축은 각 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA를 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 4] 도 4는 서열번호: 10, 11, 15, 17-61에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA 및 mini-VR을 사용한, 공여자 #3에서 유래된 1차 HSMM 세포 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA를 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 5] 도 5는 R1 또는 R2 영역에 위치한 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA 및 mini-VR을 사용한, 공여자 #3에서 유래된 1차 HSMM 세포 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA를 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 6] 도 6은 서열번호: 130 내지 221에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA 및 mini-VR을 사용한, 1차 HSMM 세포(공여자 #3, #121, #368, #617에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA를 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 7a] 도 7a는 서열번호: 178, 193, 또는 195에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA(sgLAMA1-155, sgLAMA1-170, sgLAMA-172) 및 mini-VR을 사용한, 1차 HSMM 세포(공여자 #3, #121에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 조건을 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다. 실험을 3회 반복하여 평균값과 SD값을 나타내었다.
[도 7b] 도 7b는 서열번호: 178, 193 또는 195에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA(sgLAMA1-155, sgLAMA1-170, sgLAMA-172) 및 mini-VR을 사용한, 1차 HSMM 세포(공여자 #368, #617에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 조건을 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다. 실험을 3회 반복하여 평균값과 SD값을 나타내었다.
[도 8] 도 8은 1차 HSMM 세포(공여자 #3, #121, #368, #617에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 수준을 평가한 결과이며, 가로축은 공여자 번호, 세로축은 HPRT 대조군을 사용하였을 때의 발현 수준을 나타낸다.
[도 9] 도 9는 서열번호: 178, 193, 또는 195에 나타낸 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA(sgLAMA1-155, sgLAMA1-170, sgLAMA-172) 및 다양한 활성화 모이어티(moiety)를 사용한, 1차 HSMM 세포(공여자 #3에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸 것이다. 가로축은 각 조건을 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 10] 도 10은 단백질 수준에 있어서, 서열번호 178, 193, 또는 195에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA 및 microVR을 사용한, 1차 HSMM 세포(공여자 #3, #617에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다.
[도 2] 도 2는 서열번호: 1 내지 16에 나타낸 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA 및 mini-VR을 사용한, 공여자 #3에서 유래된 1차 골격근 근아세포(skeletal muscle myoblast)(HSMM 세포) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA를 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 3] 도 3은 서열번호: 1 내지 16에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA 및 mini-VR을 사용한, 공여자 #5에서 유래된 1차 HSMM 세포 중의 인간 LAMA1 유전자에 대한 발현 증진 효과의 평가 결과를 나타낸다. 가로축은 각 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA를 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 4] 도 4는 서열번호: 10, 11, 15, 17-61에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA 및 mini-VR을 사용한, 공여자 #3에서 유래된 1차 HSMM 세포 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA를 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 5] 도 5는 R1 또는 R2 영역에 위치한 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA 및 mini-VR을 사용한, 공여자 #3에서 유래된 1차 HSMM 세포 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA를 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 6] 도 6은 서열번호: 130 내지 221에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA 및 mini-VR을 사용한, 1차 HSMM 세포(공여자 #3, #121, #368, #617에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA를 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 7a] 도 7a는 서열번호: 178, 193, 또는 195에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA(sgLAMA1-155, sgLAMA1-170, sgLAMA-172) 및 mini-VR을 사용한, 1차 HSMM 세포(공여자 #3, #121에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 조건을 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다. 실험을 3회 반복하여 평균값과 SD값을 나타내었다.
[도 7b] 도 7b는 서열번호: 178, 193 또는 195에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA(sgLAMA1-155, sgLAMA1-170, sgLAMA-172) 및 mini-VR을 사용한, 1차 HSMM 세포(공여자 #368, #617에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 조건을 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다. 실험을 3회 반복하여 평균값과 SD값을 나타내었다.
[도 8] 도 8은 1차 HSMM 세포(공여자 #3, #121, #368, #617에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 수준을 평가한 결과이며, 가로축은 공여자 번호, 세로축은 HPRT 대조군을 사용하였을 때의 발현 수준을 나타낸다.
[도 9] 도 9는 서열번호: 178, 193, 또는 195에 나타낸 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA(sgLAMA1-155, sgLAMA1-170, sgLAMA-172) 및 다양한 활성화 모이어티(moiety)를 사용한, 1차 HSMM 세포(공여자 #3에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸 것이다. 가로축은 각 조건을 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 10] 도 10은 단백질 수준에 있어서, 서열번호 178, 193, 또는 195에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA 및 microVR을 사용한, 1차 HSMM 세포(공여자 #3, #617에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다.
이하, 본 발명의 실시태양을 상세히 설명한다.
1. 폴리뉴클레오타이드
본 발명은 이하의 염기 서열을 포함하는 폴리뉴클레오타이드(이하, "본 발명의 폴리뉴클레오타이드"라고 지칭하는 경우도 있음)를 제공한다:
(a) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열, 및
(b) 인간 LAMA1 유전자의 발현 조절 영역에 있어서,
(i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역을 표적으로 하는 가이드 RNA,
(ii) 서열번호: 124에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는
(iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA를 코딩하는 염기 서열.
본 발명의 폴리뉴클레오타이드를 원하는 세포에 도입하고 전사하여, 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 및 인간 LAMA1 유전자의 발현 조절 영역의 특정 영역을 표적으로 하는 가이드 RNA를 생산한다. 이러한 융합 단백질 및 가이드 RNA는 복합체(이하, 복합체를 "리보핵단백질; RNP"라고 지칭하는 경우도 있음)를 형성하고, 상술한 특정 영역에 협력적으로 작용하여, 인간 LAMA1 유전자의 전사를 활성화시킨다.
(1) 정의
본원에 있어서, "인간 라미닌-α1 쇄(LAMA1) 유전자의 발현 조절 영역"은 그 영역에 RNP가 결합함으로써 인간 LAMA1 유전자의 발현이 활성화될 수 있는 임의의 영역을 의미한다. 즉, 인간 LAMA1 유전자의 발현 조절 영역은 인간 LAMA1 유전자의 발현이 RNP의 결합에 의해 활성화되는 한, 인간 LAMA1 유전자의 프로모터 영역, 인핸서 영역, 인트론 및 엑손과 같은 임의의 영역에 존재할 수 있다. 본원에서 발현 조절 영역이 특정 서열로 표시되는 경우, 발현 조절 영역은 개념적으로 센스 가닥(sense strand) 서열 및 안티센스 가닥(antisense strand) 서열을 모두 포함한다.
본 발명에 있어서, 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질은 가이드 RNA에 의해 인간 LAMA1 유전자의 발현 조절 영역의 특정 영역으로 모집(recruit)된다. 본원에 있어서, "…를 표적으로 하는 가이드 RNA"는 "융합 단백질을 …로 모집하는 가이드 RNA"를 의미한다.
본원에 있어서, "가이드 RNA(이하 'gRNA'로도 지칭함)"는 게놈 특이적 CRISPR-RNA(이하 "crRNA"로 지칭함)를 포함하는 RNA이다. crRNA는 표적 서열의 상보적 서열(후술함)에 결합하는 RNA이다. Cpf1이 CRISPR 이펙터 단백질로 사용되는 경우, "가이드 RNA"는 crRNA로 이루어지는 RNA 및 그의 5'-말단에 부착된 특정 서열을 포함하는 RNA(예를 들어, FnCpf1의 경우 서열번호: 65에 기재된 RNA 서열)를 지칭한다. Cas9가 CRISPR 이펙터 단백질로 사용되는 경우, "가이드 RNA"는 crRNA 및 그의 3'-말단에 부착된 트랜스-활성화 crRNA(이하 "tracrRNA"로 지칭함)를 포함하는 키메라 RNA(이하 "싱글 가이드 RNA(sgRNA)"로 지칭함)를 말한다(예를 들어, 그 전문이 본원에 참조에 의해 원용(incorporated)되는 Zhang F. et al., Hum Mol Genet. 2014 Sep 15; 23(R1):R40-6 및 Zetsche B. et al., Cell. 2015 Oct 22; 163(3): 759-71 참조).
본원에 있어서, 인간 LAMA1 유전자의 발현 조절 영역 중의 crRNA가 결합된 서열의 상보적 서열을 "표적 서열"이라 한다. 즉, 본원에 있어서, "표적 서열"은 인간 LAMA1 유전자의 발현 조절 영역에 존재하고 PAM(protospacer adjacent motif)에 인접한 DNA 서열이다. Cpf1이 CRISPR 이펙터 단백질로 사용되는 경우, PAM은 표적 서열의 5'측에 인접한다. Cas9가 CRISPR 이펙터 단백질로 사용되는 경우, PAM은 표적 서열의 3'측에 인접한다. 표적 서열은 인간 LAMA1 유전자의 발현 조절 영역의 센스 가닥 서열측 또는 안티센스 가닥 서열측에 존재할 수 있다(예를 들어, 그 전문이 본원에 참조에 의해 원용되는, 상술한 Zhang F. et al., Hum Mol Genet. 2014 Sep 15; 23(R1):R40-6 and Zetsche B. et al., Cell. 2015 Oct 22; 163(3): 759-71 참조).
(2) 뉴클레아제-결핍 CRISPR 이펙터 단백질
본 발명에 있어서, 뉴클레아제-결핍 CRISPR 이펙터 단백질을 사용하여, 이에 융합된 전사 활성화 인자를 인간 LAMA1 유전자의 발현 조절 영역에 모집한다. 본 발명에서 사용되는 뉴클레아제-결핍 CRISPR 이펙터 단백질(이하, 간단히 "CRISPR 이펙터 단백질"로 지칭함)은 gRNA와 복합체를 형성하고, 인간 LAMA1 유전자의 발현 조절 영역에 모집되는 한 특별히 제한되지 않는다. 예를 들어, 뉴클레아제-결핍 Cas9(이하, "dCas9"라고 지칭하는 경우도 있음) 또는 뉴클레아제-결핍 Cpf1(이하, "dCpf1"이라고 지칭하는 경우도 있음)이 포함될 수 있다.
상술한 dCas9의 예시로는, 화농성 연쇄상구균(Streptococcus pyogenes) 유래 Cas9(SpCas9; PAM 서열: NGG(N은 A, G, T 또는 C임. 이하 동일)), 스트렙토코커스 써모필러스(Streptococcus thermophilus) 유래 Cas9(StCas9; PAM 서열: NNAGAAW(W는 A 또는 T. 이하 동일)), 수막구균(Neisseria meningitidis) 유래 Cas9(NmCas9; PAM 서열: NNNNGATT), 또는 황색포도상구균 유래 Cas9(SaCas9; PAM 서열: NNGRRT(R은 A 또는 G. 이하 동일)) 등의 뉴클레아제-결핍 변이체를 포함하나, 이에 제한되지 않는다(예를 들어, 그 전문이 본원에 참조에 의해 원용되는 Nishimasu et al., Cell. 2014 Feb 27; 156(5): 935-49, Esvelt KM et al., Nat Methods. 2013 Nov; 10(11):1116-21, Zhang Y. Mol Cell. 2015 Oct 15; 60(2):242-55, 및 Friedland AE et al., Genome Biol. 2015 Nov 24; 16:257 참조). 예를 들어 SpCas9의 경우, 10번째 Asp 잔기가 Ala 잔기로 변환되고, 840번째 His 잔기가 Ala 잔기로 변환된 이중 돌연변이체(이하, "dSpCas9"로 지칭하는 경우가 있음)가 사용될 수 있다(예를 들어, 상술한 Nishimasu et al., Cell. 2014 참조). 대안적으로 SaCas9의 경우, 10번째 Asp 잔기가 Ala 잔기로 변환되고, 580번째 Asn 잔기가 Ala 잔기로 변환된 이중 돌연변이체(서열번호: 66), 또는 10번째 Asp 잔기가 Ala 잔기로 변환되고, 557번째 His 잔기가 Ala 잔기로 변환된 이중 돌연변이체(서열번호: 67)(이하, 이들 이중 돌연변이체 중 임의의 것을 "dSaCas9"라고 지칭하는 경우가 있음)가 사용될 수 있다(예를 들어, 그 전문이 본원에 참조에 의해 원용되는, 상술한 Friedland AE et al., Genome Biol. 2015 참조).
더욱이 본 발명의 일 실시태양에 있어서, dCas9로서, gRNA와 복합체를 형성하고 인간 LAMA1 유전자의 발현 조절 영역에 모집되는, 상술한 dCas9의 아미노산의 일부를 변형시켜 얻은 변이체를 사용할 수도 있다. 이러한 변이체의 예시로는, 부분적으로 결실된 아미노산 서열을 갖는 절단된(truncated) 변이체를 포함한다. 본 발명의 일 실시태양에 있어서, 그 전문이 본원에 참조에 의해 원용되는 미국 가출원 특허번호: 62/682,244 및 62/749,855에 개시된 변이체가 dCas9로서 사용될 수 있다. 구체적으로, 10번째 Asp 잔기가 Ala 잔기로, 580번째 Asn 잔기가 Ala 잔기로 변환된 이중 돌연변이체(서열번호: 68)인 dSaCas9에서 721번째 내지 745번째 아미노산이 결실된 dSaCas9, 또는 결실된 부분이 펩타이드 링커로 치환된 dSaCas9(예컨대, 결실된 부분이 GGSGGS 링커(서열번호: 69)로 치환된 것은 서열번호: 70에 기재되어 있음), 또는 상술한 이중 돌연변이체인 dSaCas9에서 482번째 내지 648번째 아미노산이 결실된 dSaCas9(서열번호 71), 또는 결실된 부분이 펩타이드 링커로 치환된 dSaCas9(결실된 부분이 GGSGGS 링커로 치환된 것은 서열번호: 72에 기재되어 있음)를 사용할 수 있다.
상술한 dCpf1의 예시로는, 프란시셀라 노비시다(Francisella novicida) 유래 Cpf1(FnCpf1; PAM 서열: NTT), 아시다미노코커스종(Acidaminococcus sp.) 유래 Cpf1(AsCpf1; PAM 서열: NTTT), 또는 라크노스피로세(Lachnospiraceae) 박테리아 유래 Cpf1(LbCpf1; PAM 서열: NTTT) 등의 뉴클레아제-결핍 변이체가 포함되나, 이에 제한되지 않는다(예를 들어, 그 전문이 본원에 참조에 의해 원용되는 Zetsche B. et al., Cell. 2015 Oct 22; 163(3):759-71, Yamano T et al., Cell. 2016 May 5; 165(4):949-62, 및 Yamano T et al., Mol Cell. 2017 Aug 17; 67(4):633-45 참조). 예를 들어, FnCpf1의 경우, 917번째 Asp 잔기가 Ala 잔기로 변환되고, 1006번째 Glu 잔기가 Ala 잔기로 변환된 이중 돌연변이체를 사용할 수 있다(예를 들어, 그 전문이 본원에 참조에 의해 원용되는, 상술한 Zetsche B et al., Cell. 2015 참조). 본원의 일 실시태양에 있어서, dCpf1로서, gRNA와 복합체를 형성하고 인간 LAMA1 유전자의 발현 조절 영역에 모집되는, 상술한 dCpf1의 아미노산 일부를 변형시켜 얻은 변이체를 사용할 수도 있다.
본 발명의 일 실시태양에 있어서, dCas9는 CRISPR 이펙터 단백질로서 사용되고, 특정의 실시태양에 있어서 dSaCas9가 사용된다.
CRISPR 이펙터 단백질을 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드는, 예를 들어, 그의 cDNA 서열 정보에 기초하여 단백질의 원하는 부분을 코딩하는 영역을 커버하는 올리고 DNA 프라이머의 합성, 및 단백질을 생산하는 세포로부터 제조된 총 RNA(total RNA) 또는 mRNA 분획을 주형으로 이용하는 PCR 방법에 의한 폴리뉴클레오타이드의 증폭에 의해 클로닝될 수 있다. 또한, CRISPR 이펙터 단백질을 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드는, 클로닝된 CRISPR 이펙터 단백질을 코딩하는 뉴클레오타이드 서열에 공지된 부위-특이적 돌연변이(site-directed mutagenesis) 방법에 의해 돌연변이를 도입하여, DNA 절단 활성에 중요한 위치의 아미노산 잔기(예컨대, SaCas9의 경우 10번째 Asp 잔기, 557번째 His 잔기, 및 580번째 Asn 잔기; FnCpf1의 경우 917번째 Asp 잔기 및 1006번째 Glu 잔기 등이 포함될 수 있으나, 이에 제한되지 않음)를 다른 아미노산으로 변환함으로써 얻을 수 있다.
대안적으로, CRISPR 이펙터 단백질을 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드는 그의 cDNA 서열 정보에 기초하여 화학적 합성, 또는 화학적 합성과 PCR 방법 또는 깁슨조립(Gibson Assembly) 방법의 조합에 의해 얻어질 수 있고, 또한 코돈 최적화(codon optimization)를 거친 염기 서열로 추가 구성되어 인간에서의 발현에 적합한 코돈을 제공할 수 있다.
(3) 전사 활성화 인자
본 발명에 있어서, 인간 LAMA1 유전자의 발현은 CRISPR 이펙터 단백질과 융합된 전사 활성화 인자의 작용에 의해 활성화된다. 본원에 있어서, "전사 활성화 인자"는 인간 LAMA1 유전자의 유전자 전사를 활성화시키는 능력을 갖는 단백질 또는 그 기능을 보유하는 펩타이드 단편(fragment)을 의미한다. 본 발명에서 사용되는 전사 활성화 인자는 인간 LAMA1 유전자의 발현을 활성화시킬 수 있는 것이라면 특별히 제한되지 않는다. 예를 들어, VP64, VP160, VPH, VPR, miniVR, 및 microVR, 전사 활성화 능력을 갖는 그들의 변이체 등이 포함된다. VP64는 서열번호: 73에 기재된 50개 아미노산으로 이루어지는 펩타이드로 예시된다. VP160은 서열번호: 84에 기재된 131개의 아미노산으로 이루어지는 펩타이드로 예시된다. VPH는 VP64, p65 및 HSF1의 융합 단백질, 구체적으로 서열번호: 74에 기재된 376개의 아미노산으로 이루어지는 펩타이드로 예시된다. VPR은 VP64, p65 및 엡스타인-바 바이러스(Epstein-Barr virus; RTA)의 복제 및 전사 활성화 인자의 융합 단백질이며, 구체적으로 서열번호: 75에 기재된 523개 아미노산으로 이루어지는 펩타이드로 예시된다. VP64, VPH, 및 VPR은 공지되어 있고, 예를 들어 그 전문이 본원에 참조에 의해 원용되는 Chavez A. et al., Nat Methods. 2016 Jul; 13(7):563-7 및 Chavez A. et al., Nat Methods. 2015 Apr; 12(4):326-8에 개시되어 있다. MiniVR 및 microVR은 VP64 및 RTA의 전사 활성화 도메인을 포함하는 펩타이드이다. RTA의 전사 활성화 도메인은 공지되어 있으며, 예를 들어 그 전문이 본원에 참조에 의해 원용되는 J Virol. 1992 Sep;66(9):5500-8에 개시되어 있다. 구체적으로, miniVR은 서열번호: 76에 기재된 167개의 아미노산으로 이루어지는 펩타이드로 예시되고, microVR은 서열번호: 77에 기재된 140개의 아미노산으로 이루어지는 펩타이드로 예시된다. 서열번호: 76에 기재된 아미노산 서열은 RTA의 493번째 내지 605번째 아미노산 잔기와 VP64가 G-S-G-S 링커(서열번호: 78)로 연결되어 있는 아미노산 서열로 구성된다. 서열번호: 77에 기재된 아미노산 서열은 RTA의 520번째 내지 605번째 아미노산 잔기와 VP64가 G-S-G-S 링커로 연결되어 있는 아미노산 서열로 구성된다. miniVR 및 microVR에 대한 세부 사항은 미국 가출원 특허번호: 62/715,432에 설명되어 있으며, 그 전문이 본원에 참조에 의해 원용된다. 상술한 전사 활성화 인자 중 임의의 것은 그의 전사 활성화 능력을 유지하는 한, 임의로 변형 및/또는 변경될 수 있다.
전사 활성화 인자를 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드는 화학적 합성, 또는 화학적 합성과 PCR 방법 또는 깁슨조립 방법의 조합에 의해 구축(construct)될 수 있다. 뿐만 아니라, 전사 활성화 인자를 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드를 코돈 최적화된 DNA 서열로 인간에서의 발현에 적합한 코돈이 되도록 구축할 수 있다.
전사 활성화 인자와 CRISPR 이펙터 단백질의 융합 단백질을 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드는 CRISPR 이펙터 단백질을 코딩하는 염기 서열에 직접, 또는 링커, NLS(nuclear localization signal)(핵 위치 신호) 및/또는 태그를 코딩하는 염기 서열을 부가한 후 결찰(ligating)시킴으로써 제조될 수 있다. 본 발명에 있어서, 전사 활성화 인자는 N 말단 또는 C 말단과 융합될 수 있다. 링커로서, 아미노산 수가 약 2 내지 50인 링커를 사용할 수 있으며, 그의 구체적인 예시로는 글라이신(G) 및 세린(S)이 번갈아 연결된 G-S-G-S 링커 등을 포함할 수 있으나, 이에 제한되지 않는다.
(4) 가이드 RNA
본 발명에 있어서, CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질은 가이드 RNA에 의해 인간 LAMA1 유전자의 발현 조절 영역으로 모집될 수 있다. 상술한 "(1) 정의"에서 설명한 바와 같이, 가이드 RNA는 crRNA를 포함하고, crRNA는 표적 서열의 상보적 서열에 결합한다. crRNA는 가이드 RNA가 융합 단백질을 표적 영역으로 모집할 수 있는 한, 표적 서열의 상보적 서열에 완전히 상보적이지 않을 수 있으며, 적어도 1 내지 3개의 염기가 결실, 치환, 삽입 및/또는 부가된 서열일 수 있다.
dCas9가 CRISPR 이펙터 단백질로 사용되는 경우, 예를 들어, 표적 서열은 공개된 gRNA 설계 웹사이트(CRISPR Design Tool, CRISPR direct 등)를 사용하여 결정될 수 있다. 구체적으로, 대상 유전자(즉, 인간 LAMA1 유전자)의 서열로부터, PAM(예컨대, SaCas9의 경우 NNGRRT)이 그의 3'측에 인접한 약 20 뉴클레오타이드의 길이인 후보 표적 서열을 리스트화하고, 이러한 후보 표적 서열 중에서 인간 게놈의 오프 타겟 부위(off-target sites)가 적은 것을 표적 서열로 사용할 수 있다. 표적 서열의 염기 길이는 18 내지 24 뉴클레오타이드 길이, 바람직하게는 20 내지 23 뉴클레오타이드 길이, 더욱 바람직하게는 21 내지 23 뉴클레오타이드 길이이다. 오프 타겟 부위 수의 예측을 위한 1차 스크리닝으로서, 다수의 바이오인포매틱 툴이 공지되어 있고 공개적으로 입수 가능하며, 오프 타겟 효과가 가장 낮은 표적 서열을 예측하는 데 사용할 수 있다. 그 예시로는 Benchling(https://benchling.com) 및 COSMID(CRISPR Off-target Sites with Mismatches, Insertions and Deletions)(인터넷상 https://crispr.bme.gatech.edu에서 입수 가능)와 같은 바이오인포매틱 툴이 있다. 이들을 이용하여 gRNA가 표적으로 하는 염기 서열과의 유사성을 요약할 수 있다. 사용하고자 하는 gRNA 설계 소프트웨어에 표적 게놈의 오프 타겟 부위를 검색하는 기능이 없는 경우, 예를 들어 오프 타겟 부위는 후보 표적 서열의 3'측의 8 내지 12 뉴클레오타이드(표적 뉴클레오타이드 서열의 높은 식별(discrimination) 능력을 갖는 시드 서열)에 관하여, 표적 게놈을 대상으로 블라스트(Blast) 검색을 실시함으로써 검색할 수 있다.
본 발명의 일 실시태양에 있어서, 인간 18번 염색체(Chr 18)의 GRCh38.p13 위치에 존재하는 영역에서, 이하의 영역은 인간 LAMA1 유전자의 발현 조절 영역일 수 있다. 이 영역은 히스톤 변형 패턴(histone modification patterns)에 의해 발현 조절 영역으로 강력하게 제안되고 있다. 따라서, 본 발명의 일 실시태양에 있어서, 표적 서열은 인간 18번 염색체(Chr 18)의 GRCh38.p13 위치에 존재하는 이하의 영역 중 적어도 하나의 영역에서 18 내지 24 뉴클레오타이드 길이, 바람직하게는 20 내지 23 뉴클레오타이드 길이, 보다 바람직하게는 21 내지 23 뉴클레오타이드 길이일 수 있다:
(1) 7,115,000-7,118,000.
본 발명의 일 실시태양에 있어서, 표적 서열은 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 염기 서열일 수 있다.
본 발명의 일 실시태양에 있어서, 표적 서열은 인간 18번 염색체(Chr 18)의 GRCh38.p13 위치에 존재하는 이하의 영역 중 적어도 하나의 영역에서 18 내지 24 뉴클레오타이드 길이, 바람직하게는 20 내지 23 뉴클레오타이드 길이, 보다 바람직하게는 21 내지 23 뉴클레오타이드 길이일 수 있다:
(2) 7,036,000-7,042,000.
(3) 7,083,000-7,087,000
본 발명의 일 실시태양에 있어서, 표적 서열은 서열번호: 124에 기재된 염기 서열일 수 있다.
본 발명의 일 실시태양에 있어서, 표적 서열은 인간 18번 염색체(Chr 18)의 GRCh38.p13 위치에 존재하는 이하의 영역 중 적어도 하나의 영역에서 18 내지 24 뉴클레오타이드 길이, 바람직하게는 20 내지 23 뉴클레오타이드 길이, 보다 바람직하게는 21 내지 23 뉴클레오타이드 길이일 수 있다:
(4) 7,118,000-7,133,000.
본 발명의 일 실시태양에 있어서, 표적 서열은 서열번호: 178, 193, 또는 195에 기재된 염기 서열일 수 있다. 본 발명의 일 실시태양에 있어서, crRNA를 코딩하는 염기 서열은 표적 서열과 동일한 염기 서열일 수 있다. 예를 들어, 서열번호: 15에 기재된 표적 서열(TCTCGCCTCCGCCGCCACTCG)이 crRNA를 코딩하는 염기 서열로서 세포 내로 도입되면, 그 서열에서 전사된 crRNA는 UCUCGCCUCCGCCGCCACUCG(서열번호 79)이고 CGAGTGGCGGCGGAGGCGAGA(서열번호: 80)에 결합되며, 이는 서열번호: 15에 기재된 염기 서열의 상보적 서열로서 인간 LAMA1 유전자의 발현 조절 영역에 존재하는 것이다. 또 다른 실시태양에 있어서, 가이드 RNA가 융합 단백질을 표적 영역에 모집할 수 있는 한, 적어도 1 내지 3개의 염기가 결실, 치환, 삽입 및/또는 부가된 표적 서열인 염기 서열은 crRNA를 코딩하는 염기 서열로 사용될 수 있다. 따라서, 본 발명의 일 실시태양에 있어서, crRNA를 코딩하는 염기 서열로서, 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 염기 서열, 또는 그 서열에서 1 내지 3개의 염기가 결실, 치환, 삽입 및/또는 부가된 것이 사용될 수 있다. 본 발명의 또 다른 실시태양에 있어서, crRNA를 코딩하는 염기 서열로서, 서열번호: 124에 기재된 염기 서열, 또는 그 서열에서 1 내지 3개의 염기가 결실, 치환, 삽입 및/또는 부가된 것이 사용될 수 있다. 본 발명의 추가의 실시태양에 있어서, crRNA를 코딩하는 염기 서열로서, 서열번호: 178, 193, 또는 195에 기재된 염기 서열, 또는 그 서열에서 1 내지 3개의 염기가 결실, 치환, 삽입 및/또는 부가된 것이 사용될 수 있다.
dCpf1이 CRISPR 이펙터 단백질로 사용될 경우, gRNA를 코딩하는 염기 서열은 5'-말단에 특정 RNA가 부착된 crRNA를 코딩하는 DNA 서열로 설계될 수 있다. crRNA의 5'-말단에 부착된 RNA 및 상기 RNA를 코딩하는 DNA 서열은 사용되는 dCpf1에 따라 통상의 기술자가 적절히 선택할 수 있다. 예를 들어, dFnCpf1이 사용되는 경우, gRNA를 코딩하는 염기 서열로서, 서열번호: 81; AATTTCTACTGTTGTAGAT가 표적 서열의 5'측에 부착된 염기 서열을 사용할 수 있다(RNA로 전사될 경우, 밑줄친 부분의 서열은 염기 쌍을 형성하여 스템-루프 구조(stem-loop structure)를 형성한다. 5'-말단에 부가되는 서열은, gRNA가 융합 단백질을 전사 후 발현 조절 영역에 모집할 수 있는 한, 적어도 1 내지 6개의 염기가 결실, 치환, 삽입 및/또는 부가된 다양한 Cpf1 단백질에 일반적으로 사용되는 서열일 수 있다.
dCas9이 CRISPR 이펙터 단백질로 사용될 경우, gRNA를 코딩하는 염기 서열은 공지된 tracrRNA를 코딩하는 DNA 서열이 crRNA를 코딩하는 DNA 서열의 3'-말단에 연결된 DNA 서열로서 설계될 수 있다. 이러한 tracrRNA 및 tracrRNA를 코딩하는 DNA 서열은 사용되는 dCas9에 따라 통상의 기술자가 적절히 선택할 수 있다. 예를 들어, dSaCas9가 사용되는 경우, tracrRNA를 코딩하는 DNA 서열로서 서열번호: 82에 기재된 염기 서열이 사용된다. tracrRNA를 코딩하는 DNA 서열은 gRNA가 전사 후 발현 조절 영역에 융합 단백질을 모집할 수 있는 한, 적어도 1 내지 6개의 염기가 결실, 치환, 삽입 및/또는 부가된 다양한 Cas9 단백질에 일반적으로 사용되는 tracrRNA를 코딩하는 염기 서열일 수 있다.
이러한 방법으로 설계된 gRNA를 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드는 공지된 DNA 합성법을 이용하여 화학적으로 합성될 수 있다.
본 발명의 또 다른 실시태양에 있어서, 본 발명의 폴리뉴클레오타이드는 crRNA가 상이한 2종 이상의 gRNA를 포함할 수 있다.
(5) 프로모터 서열
본 발명의 일 실시태양에 있어서, 프로모터 서열은 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열 및/또는 gRNA를 코딩하는 염기 서열 각각의 상단부(upstream)에서 작동 가능하게 연결될 수 있다. 연결될 가능성이 있는 프로모터는, 표적 세포에서 프로모터 활성을 나타내는 한 특별히 제한되지 않는다. 융합 단백질을 코딩하는 염기 서열의 상단부에 연결될 가능성이 있는 프로모터 서열의 예시로는, EFS 프로모터, CMV(사이토메갈로바이러스) 프로모터, CK8 프로모터, MHC 프로모터, MYOD 프로모터, hTERT 프로모터, SRα 프로모터, SV40 프로모터, LTR 프로모터, CAG 프로모터, RSV(라우스 육종 바이러스) 프로모터 등을 포함하나, 이에 제한되지 않는다. gRNA를 코딩하는 염기 서열의 상단부에 연결될 가능성이 있는 프로모터 서열의 예시로는, pol III 프로모터인, U6 프로모터, SNR6 프로모터, SNR52 프로모터, SCR1 프로모터, RPR1 프로모터, U3 프로모터, H1 프로모터, 및 tRNA 프로모터 등을 포함하나, 이에 제한되지 않는다. 본 발명의 일 실시태양에 있어서, 근육 특이적 프로모터는 상술한 융합 단백질을 코딩하는 염기 서열의 상단부에 연결된 프로모터 서열로 사용될 수 있다. 근육 특이적 프로모터의 예시로는, CK8 프로모터, CK6 프로모터, CK1 프로모터, CK7 프로모터, CK9 프로모터, 심근 트로포닌 C(cardiac muscle troponin C) 프로모터, α액틴 프로모터, 마이오신 중쇄 키나아제(MHCK) 프로모터, 마이오신 경쇄 2A 프로모터, 디스트로핀 프로모터, 근육 크레아틴 키나아제 프로모터, dMCK 프로모터, tMCK 프로모터, enh348 MCK 프로모터, 합성 C5-12(Syn) 프로모터, unc45b 프로모터, Myf5 프로모터, MLC1/3f 프로모터, MYOD 프로모터, Myog 프로모터, Pax7 프로모터 등을 포함하나, 이에 제한되지 않는다(근육 특이적 프로모터의 상세한 내용은, 예를 들어, 그 전문이 본원에 참조에 의해 원용되는 US2011/0212529A, McCarthy JJ et al., Skeletal Muscle. 2012 May; 2(1):8, Wang B. et al., Gene Ther. 2008 Nov; 15(22):1489-99 등 참조).
(6) 기타 염기 서열
더욱이, 본 발명의 폴리뉴클레오타이드는 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열의 전사에 의해 생성된 mRNA의 번역 효율을 향상시키기 위한 목적으로, 상기 언급된 것 외에 폴리아데닐화(Polyadenylation) 신호, 코작 컨센서스 서열(Kozak consensus sequence) 등과 같은 공지의 서열을 더 포함할 수 있다. 또한, 본 발명의 폴리뉴클레오타이드는 링커 서열을 코딩하는 염기 서열, NLS를 코딩하는 염기 서열 및/또는 태그를 코딩하는 염기 서열을 포함할 수 있다.
2. 벡터
본 발명은 본 발명의 폴리뉴클레오타이드를 포함하는 벡터(이하, "본 발명의 벡터"로 지칭하는 경우가 있음)를 제공한다. 본 발명의 벡터는 플라스미드 벡터 또는 바이러스성 벡터일 수 있다.
본 발명의 벡터가 플라스미드 벡터인 경우, 사용되는 플라스미드 벡터는 특별히 제한되지 않으며, 클로닝 플라스미드 벡터, 발현 플라스미드 벡터 등의 플라스미드 벡터일 수 있다. 플라스미드 벡터는 공지된 방법으로 플라스미드 벡터에 본 발명의 폴리뉴클레오타이드를 삽입함으로써 제조된다.
본 발명의 벡터가 바이러스성 벡터인 경우, 사용되는 바이러스성 벡터는 특별히 제한되지 않으며, 그 예로는 아데노바이러스 벡터, 아데노 연관 바이러스(AAV) 벡터, 렌티바이러스 벡터, 레트로바이러스 벡터, 센다이바이러스(Sendaivirus) 벡터 등을 포함하나, 이에 제한되지 않는다. 본원에 있어서, "바이러스 벡터" 또는 "바이러스성 벡터"는 그들의 유도체 또한 포함한다. 유전자 요법에서의 사용을 고려할 때, AAV 벡터는 이식유전자(transgene)를 장기간 발현할 수 있고, 비병원성 바이러스 유래로 안전성이 높다는 점에서 바람직하게 사용된다.
본 발명의 폴리뉴클레오타이드를 포함하는 바이러스성 벡터는 공지된 방법에 의해 제조될 수 있다. 요약하면, 본 발명의 폴리뉴클레오타이드가 삽입된 바이러스 발현용 플라스미드 벡터를 제조하고, 그 벡터를 적절한 숙주 세포에 형질감염(transfect)시켜, 본 발명의 폴리뉴클레오타이드를 포함하는 바이러스성 벡터의 일시적 생산을 가능하게 하고, 그 바이러스성 벡터를 수집한다.
본 발명의 일 실시태양에 있어서, AAV 벡터가 사용되는 경우, AAV 벡터의 혈청형(serotype)은 표적에서 인간 LAMA1 유전자의 발현이 활성화될 수 있는 한 특별히 제한되지 않으며, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 및 그들의 변이체 등 중 임의의 것이 사용될 수 있다(AAV의 다양한 혈청형에 대해서는, 예를 들어, 그 전문이 본원에 참조에 의해 원용되는 WO 2005/033321 참조). AAV의 변이체의 예시로는, 변형된 캡시드를 갖는 새로운 혈청형(예컨대, 그 전문이 본원에 참조에 의해 원용되는 WO 2012/057363) 등을 포함하나, 이에 제한되지 않는다.
AAV 벡터를 제조하는 하나의 예시에 있어서, 먼저, 야생형 AAV 게놈 서열의 양 말단에 역 말단 반복서열(inverted terminal repeat; ITR)과, Rep 단백질 및 캡시드 단백질을 코딩하는 DNA를 대체하여 삽입된 본 발명의 폴리뉴클레오타이드를 포함하는 벡터 플라스미드를 제조한다. 한편, 바이러스 입자 형성에 필수적인 Rep 단백질 및 캡시드 단백질을 코딩하는 DNA를 다른 플라스미드에 삽입한다. 또한, AAV의 증식에 필수적인 아데노바이러스의 헬퍼 작용을 담당하는 유전자(E1A, E1B, E2A, VA 및 E4orf6)를 포함하는 플라스미드를 아데노바이러스 헬퍼 플라스미드로서 제조한다. 이러한 세 종류의 플라스미드를 숙주 세포에 동시에 형질감염시키면 세포에서 재조합 AAV(즉, AAV 벡터)가 생성된다. 숙주 세포로서, 상술한 헬퍼 작용을 담당하는 유전자의 유전자 산물(단백질)의 일부를 공급할 수 있는 세포(예컨대, 293 세포 등)를 사용하는 것이 바람직하다. 이러한 세포를 사용하는 경우, 숙주 세포로부터 공급될 수 있는 단백질을 코딩하는 유전자를 상술한 아데노바이러스성 헬퍼 플라스미드에 운반할 필요는 없다. 생성된 AAV 벡터는 핵에 존재한다. 따라서, 동결-해동으로 숙주 세포를 파괴하고, 바이러스를 수집한 후, 바이러스 분획을 염화세슘을 이용한 밀도 구배 초원심분리법, 컬럼법 등으로 분리 및 정제하여 원하는 AAV 벡터를 제조한다.
AAV 벡터는 안전성, 유전자 형질도입(transduction) 효율 등의 면에서 큰 장점이 있으므로, 유전자 요법에 이용되고 있다. 그러나 패키지될 수 있는 폴리뉴클레오타이드의 크기에는 한계가 있는 것으로 알려져 있다. 예를 들어, 본 발명의 일 실시태양인, dSaCas9와 miniVR 또는 microVR의 융합 단백질을 코딩하는 염기 서열, 인간 LAMA1 유전자의 발현 조절 영역을 표적으로 하는 gRNA를 코딩하는 염기 서열, 및 프로모터 서열로서의 EFS 프로모터 서열 및 U6 프로모터 서열을 포함하는 폴리뉴클레오타이드의 염기 길이와 ITR 부분을 포함하는 전체 길이는 약 4.85kb이며, 이들은 단일 AAV 벡터에 패키지될 수 있다.
3. MDC1A를 치료 또는 예방하기 위한 약제
본 발명은 또한 본 발명의 폴리뉴클레오타이드 또는 본 발명의 벡터를 포함하는 MDC1A를 치료 또는 예방하기 위한 약제(이하, "본 발명의 약제"로 지칭하는 경우가 있음)를 제공한다.
본 발명의 약제는 본 발명의 폴리뉴클레오타이드 또는 본 발명의 벡터를 유효성분으로 포함하고, 이러한 유효성분(즉, 본 발명의 폴리뉴클레오타이드 또는 본 발명의 벡터) 및, 일반적으로, 약학적으로 허용되는 담체를 포함하는 제제로서 제조될 수 있다.
본 발명의 약제는 비경구 투여되며, 국소 투여 또는 전신 투여가 가능하다. 본 발명의 약제는 예를 들어, 정맥 내 투여, 동맥 내 투여, 피하 투여, 복강 내 투여 또는 근육 내 투여에 의해 투여될 수 있지만, 이에 제한되지 않는다.
본 발명의 약제의 대상에 대한 투여량은 치료 및/또는 예방을 위한 유효량이라면 특별히 제한되지 않는다. 이는 유효성분, 제형, 대상의 연령 및 체중, 투여 스케쥴, 투여 방법 등에 따라 적절하게 최적화될 수 있다.
본 발명의 일 실시태양에 있어서, 본 발명의 약제는 MDC1A로 이환한 대상에 투여될 뿐만 아니라, 유전적 배경 분석 등에 기초하여 장래에 MDC1A를 발병할 수 있는 대상에 예방적으로 투여될 수 있다. 본원에 있어서, 용어 "치료"는 질병의 치유뿐만 아니라, 질병의 관해(remission)도 포함한다. 또한, 용어 "예방"은 질병의 발증을 예방하는 것뿐만 아니라, 질병의 발증을 지연시키는 것도 포함할 수 있다. 본 발명의 약제는 또한 "본 발명의 약학 조성물" 등으로 지칭될 수 있다.
4. MDC1A를 치료 또는 예방하는 방법
본 발명은 또한 본 발명의 폴리뉴클레오타이드 또는 본 발명의 벡터를 이를 필요로 하는 대상에게 투여하는 것을 포함하는, MDC1A를 치료 또는 예방하는 방법을 제공한다(이하, "본 발명의 방법"으로 지칭하는 경우가 있음). 또한, 본 발명은 MDC1A의 치료 또는 예방에 사용하기 위한 본 발명의 폴리뉴클레오타이드 또는 본 발명의 벡터를 포함한다. 나아가, 본 발명은 MDC1A의 치료 또는 예방용 약학 조성물의 제조에 있어서, 본 발명의 폴리뉴클레오타이드 또는 본 발명의 벡터의 사용을 포함한다.
본 발명의 방법은 본 발명의 상술한 약제를 MDC1A로 이환한 대상에게 투여함으로써 실시할 수 있으며, 용량, 투여 경로, 대상 등은 상술한 바와 같다.
증상의 측정은 치료에 대한 대상의 반응을 결정하기 위해, 본 발명의 방법을 사용한 치료의 시작 전 수행될 수 있고, 치료 후 임의의 시점에 수행될 수 있다.
본 발명의 방법은 대상의 골격근 및/또는 심근의 기능을 개선시킬 수 있다. 그 기능이 개선되는 근육은 특별히 제한되지 않고, 임의의 근육 및 근육 그룹이 예시된다.
5. 리보핵단백질
본 발명은 이하를 포함하는 리보핵단백질(이하, "본 발명의 RNP"로 지칭하는 경우가 있음)을 제공한다:
(c) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 및
(d) 인간 LAMA1 유전자의 발현 조절 영역 중의
(i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역,
(ii) 서열번호: 124에 기재된 연속 영역; 또는
(iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역
을 표적으로 하는 가이드 RNA.
본 발명의 RNP에 포함되는 CRISPR 이펙터 단백질, 전사 활성화 인자 및 가이드 RNA로서, 상기 "1. 폴리뉴클레오타이드" 섹션에서 상세히 설명한 CRISPR 이펙터 단백질, 전사 활성화 인자 및 가이드 RNA를 사용할 수 있다. 본 발명의 RNP에 포함되는 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질은, 예를 들어, 융합 단백질을 코딩하는 폴리뉴클레오타이드를 세포, 박테리아 또는 기타 유기체에 도입하여 발현되도록 하거나, 또는 폴리뉴클레오타이드를 이용한 시험관 내 번역 시스템에 의해 생산될 수 있다. 또한, 본 발명의 RNP에 포함되는 가이드 RNA는, 예를 들면, 화학적 합성에 의해, 또는 가이드 RNA를 코딩하는 폴리뉴클레오타이드를 이용한 시험관 내 전사 시스템에 의해 생산될 수 있다. 이렇게 제조된 CRISPR 이펙터 단백질과 가이드 RNA를 혼합하여 본 발명의 RNP를 제조한다. 필요한 경우, 금 입자와 같은 다른 물질이 혼합될 수 있다. 본 발명의 RNP는 표적 세포, 조직 등에 직접 전달하기 위해, 공지된 방법에 의해 RNP를 지질 나노입자(lipid nanoparticle; LNP)에 캡슐화(encapsulated)할 수 있다. 본 발명의 RNP는 공지된 방법에 의해 표적 세포, 조직 등에 도입될 수 있다. 예를 들어, 그 전문이 본원에 참조에 의해 원용되는 Lee K., et al., Nat Biomed Eng. 2017; 1:889-901, WO 2016/153012 등이 LNP의 캡슐화 및 도입 방법에 있어서 참조될 수 있다.
본 발명의 일 실시태양에 있어서, 본 발명의 RNP에 포함된 가이드 RNA는 인간 18번 염색체(Chr 18)의 GRCh38.p13 위치에 존재하는 이하의 영역 중 적어도 하나의 영역에서 연속적인 18 내지 24 뉴클레오타이드 길이, 바람직하게는 20 내지 23 뉴클레오타이드 길이, 보다 바람직하게는 21 내지 23 뉴클레오타이드 길이를 표적으로 한다:
(1) 7,115,000-7,118,000.
일 실시태양에 있어서, 가이드 RNA는 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 서열의 전부 또는 일부를 포함하는 영역을 표적으로 한다.
(2) 7,036,000-7,042,000.
(3) 7,083,000-7,087,000
일 실시태양에 있어서, 가이드 RNA는 서열번호: 124에 기재된 서열의 전부 또는 일부를 포함하는 영역을 표적으로 한다.
(4) 7,118,000-7,133,000.
일 실시태양에 있어서, 가이드 RNA는 서열번호: 178, 193, 또는 195에 기재된 서열의 전부 또는 일부를 포함하는 영역을 표적으로 한다.
6. 기타
본 발명은 또한 인간 LAMA1 유전자 발현의 활성화를 위해, 이하를 포함하는 조성물 또는 키트를 제공한다:
(e) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 또는 융합 단백질을 코딩하는 폴리뉴클레오타이드, 및
(f) 인간 LAMA1 유전자의 발현 조절 영역 중의
(i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역;
(ii) 서열번호: 124에 기재된 연속 영역; 또는
(iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역
을 표적으로 하는 가이드 RNA, 또는 가이드 RNA를 코딩하는 폴리뉴클레오타이드.
본 발명은 또한 이하의 (e) 및 (f)를 투여하는 것을 포함하는, MDC1A를 치료 또는 예방하는 방법을 제공한다:
(e) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 또는 융합 단백질을 코딩하는 폴리뉴클레오타이드, 및
(f) 인간 LAMA1 유전자의 발현 조절 영역 중의
(i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역,
(ii) 서열번호: 124에 기재된 연속 영역, 또는
(iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역
을 표적으로 하는 가이드 RNA, 또는 가이드 RNA를 코딩하는 폴리뉴클레오타이드.
이들 발명에서 CRISPR 이펙터 단백질, 전사 활성화 인자, 가이드 RNA, 뿐만 아니라 그들을 코딩하는 폴리뉴클레오타이드 및 그들이 운반되는 벡터로서, 상기 "1. 폴리뉴클레오타이드", "2. 벡터" 및 "5. 리보핵단백질" 섹션에서 상세히 설명한 것들이 사용될 수 있다. 상술한 (e) 및 (f)의 용량, 투여 경로, 대상, 제제 등은 "3. MDC1A를 치료 또는 예방하기 위한 약제"의 섹션에서 설명한 것과 동일하다.
본 발명의 다른 특징들은 본 발명의 실증을 위해 제공되고, 본 발명을 제한하는 것을 의도하지 않는 예시적인 실시태양에 관한 이하의 설명 과정에서 명백해질 것이다.
실시예
실험 방법
LAMA1 표적 서열의 선택
인간 골격근 세포에서 게놈의 H3K4me3, H3K27Ac 패턴에 기초하여, 인간 LAMA1 유전자의 2개의 추가적인 추정 유전자 조절 영역(R1 및 R2)을, 촉매-비활성 SaCas9(D10A 및 N580A 돌연변이체; gRNA와 복합된 dSaCas9)의 표적이 될 수 있는 서열(본원에서 표적 서열로 정의됨)에 대해 스캔하였다. LAMA1 유전자에 대한 표적 게놈 영역의 위치는 도 1에 도시되어 있고, 그들의 좌표는 이하에 기재되어 있다:
1. Chr18: GRCh38/hg38; 7,036,000-7,042,000 -> ~6kb (R1)
2. Chr18: GRCh38/hg38; 7,083,000-7,087,000 -> ~4kb (R2)
표적 서열을 NNGRRT 서열을 갖는 프로토스페이서 인접 모티프(PAM)에 인접한 21 뉴클레오타이드 세그먼트에 의해 특정하였다(5'-21nt 표적 서열-NNGRRT-3')(표 1).
또한, 우리는 인간 LAMA1 TSS 부위의 거의 15kb 영역 상단부를 스캔하고, 게잡이원숭이(Macaca fascicularis) 게놈의 해당 영역과 완벽하게 매치하는 표적 서열 및 PAM 서열만을 선택하였다. LAMA1 유전자에 대한 표적 게놈 영역의 위치는 도 1에 도시되어 있으며, 그 좌표는 다음과 같다:
Chr18: GRCh38/hg38; 7,118,000-7,133,000 -> ~15kb (cyno-매치)
[표 1]
LAMA1 유전자의 발현 조절 영역을 스크리닝하는 데 사용되는 표적 서열
[표 1-1]
[표 1-2]
[표 1-3]
[표 1-4]
[표 1-5]
[표 1-6]
[표 1-7]
[표 1-8]
표 1에서, "위치"는 SaCas9가 사용될 때, 나타낸 모든 gRNA에 대한 잠재적인 SaCas9 절단 부위를 가리킨다.
서열번호: 1 내지 61은 TSS 영역에 위치하고, 서열번호: 85 내지 113은 R1 영역에 위치하고, 서열번호: 114 내지 129는 R2 영역에 위치하며, 서열번호: 130 내지 221은 cyno-매치 영역에 위치한다(도 1).
렌티바이러스성 전달 플라스미드의 구축(pED176 및 파생 플라스미드(derivative plasmid))
pLentiCRISPR v2는 Genscript(https://www.genscript.com)에서 구입하였고, 다음과 같이 변형하였다:
SpCas9 gRNA 스캐폴드(scaffold) 서열을 SaCas9 gRNA 스캐폴드 서열로 대체하고; SpCas9-FLAG를 코돈 최적화된 VP64-miniRTA(mini-VR로도 지칭함)에 융합된 dSaCas9로 대체하였다. VP64-miniRTA 전사 활성화 도메인은 전사 활성화에 의해 프로모터에 국소화될 때 유전자 발현을 활성화할 수 있다. VP64-miniRTA는 dSaCas9(D10A 및 N580A 돌연변이체)의 C-말단에 테더링되었고, 이는 이하 dSaCas9-VR로 지칭하고, 표적 서열에 의해 지시된(directed) 인간 LAMA1 유전자 조절 영역을 표적으로 하였다(표 1, 도 1). 생성된 백본 플라스미드는 pED176으로 명명되었다. 우리는 또한 mini-VR을 VP64-EBNA2, VP160, VP64-nanoRTA, VP64-microRTA와 같은 다른 활성화 도메인으로 대체하여 파생 플라스미드를 생성하였다.
gRNA 클로닝
3개의 대조군 비표적 표적 서열 및 164개의 표적 서열(표 1)을 pED176에 클로닝하였다. 정방향 및 역방향 올리고를 Integrated DNA Technologies에 의해 이하의 형식으로 합성하였다: 정방향; 5' CACC(G)-20개 염기 쌍의 표적 서열 - 3', 및 역방향: 5' AAAC - 19-21개의 염기 쌍의 역방향 상보적(reverse complement) 표적 서열- (C) - 3', 여기서 표적이 G로 시작되지 않는 경우 괄호 안의 염기를 부가하였다. 올리고를 100μM에서 Tris-EDTA 완충액(pH8.0)에 재현탁하였다. 각 상보적 올리고 1μl를 NE 완충액 3.1(NEB 카탈로그 번호: B7203S)에서 10μl 반응물로 조합하였다. 반응은 열순환기(thermocycler)에서 95℃로 가열 및 25℃로 냉각함으로써, pED176에 대한 클로닝과 상용성인 접착성 말단(sticky end) 돌출부가 있는 올리고를 어닐링하였다. 어닐링된 올리고를 BsmBI로 소화하고 겔 정제된 렌티바이러스성 전달 플라스미드 pED176과 조합하였고, 제조사의 프로토콜에 따라 T4 DNA 리가아제(NEB 카탈로그 번호: M0202S)로 결찰하였다. 2μl의 결찰 반응물은 제조사의 프로토콜에 따라 10μl의 NEB Stable Competent 세포(NEB 카탈로그 번호: C3040I)로 형질전환하였다. 생성된 구축물은 U6 프로모터에 의해, tracrRNA에 융합된 개별 표적 서열(서열번호: 83)에 의해 코딩된 crRNA를 포함하는 sgRNA의 발현을 유도한다.
렌티바이러스의 생성
HEK293TA 세포를 2ml 성장 배지(10% FBS 및 2mM 신선한 L-글루타민, 1mM 피루브산나트륨 및 비필수 아미노산이 보충된 DMEM 배지)에서 6웰 세포 배양 접시(VWR 카탈로그 번호: 10062-892)에 0.75x106세포/웰로 시딩하고, 37℃/5% CO2 조건에서 24시간 동안 배양하였다. 다음날, 1.5μg 패키지 플라스미드 믹스[1μg 패키지 플라스미드(pCMV delta R8.2 참조; addgene #12263) 및 0.5μg 외피(envelope) 발현 플라스미드(pCMV-VSV-G 참조; addgene #8454)]와, dSaCas9-VR 및 지시된 sgRNA를 코딩하는 서열을 함유하는 1μg의 전달 플라스미드를 사용하여, TransIT-VirusGEN 형질감염 반응을 제조사의 프로토콜에 따라 설정하였다. 렌티바이러스는 0.45μM PES 필터(VWR 카탈로그 번호: 10218-488)를 통해 배지 상층액을 통과시켜 형질감염 후 48시간에 회수하였다. 사용할 준비가 될 때까지, 정제 및 분취된(aliquoted) 렌티바이러스를 -80℃ 냉동고에 보관하였다.
HSMM 세포의 형질도입
0 내지 26세의 다양한 연령의 인간 공여자 5명(각각 공여자 #3, 공여자 #5, 공여자 #121, 공여자 #368, 공여자 #617)의 1차 골격근 근아세포(HSMM)를 Lonza Inc.로부터 입수하였다. 세포를 1차 골격근 세포 성장 배지[SkGM-2 골격근 성장 BulletKit 배지(Lonza #CC-3244 & CC-3246)]에서 배양하였다. 형질도입을 위해, 세포를 성장 배지를 함유하는 6웰 세포 배양 접시(VWR 카탈로그 번호: 10062-894)에 0.125-0.33x106세포/웰로 시딩하고, 37℃/5% CO2 조건에서 24시간 동안 배양하였다. 다음날, 8μg/ml 폴리브렌(Sigma 카탈로그 번호: TR-1003-G), 및 개별 표적 서열(표 1)에 의해 코딩된 crRNA 및 tracrRNA를 포함하는 각 sgRNA에 상응하는 1.0ml 렌티바이러스 상등액(상기 참조)으로 보충된 1.5ml 성장 배지를 각 웰에 첨가하였다. 세포를 렌티바이러스와 함께 6시간 동안 배양한 후, 바이러스성 배지를 제거하고 신선한 성장 배지로 교체하였다. 형질도입 72시간 후, 세포에 선택 배지[0.5μg/ml 퓨로마이신이 보충된 성장 배지(Sigma Aldrich 카탈로그 번호: P8833)]를 공급하였다. 세포에 2-3일마다 신선한 선택 배지를 제공하였다. 세포가 선택 배지에 있는 7-10일 후, 세포를 회수하고 제조사의 프로토콜에 따라 RNeasy 96 키트(Qiagen 카탈로그 번호: 74182)로 RNA를 추출하였다.
유전자 발현 분석
유전자 발현 분석을 위해, 10μl 부피에서 High-Capacity cDNA Reverse Transcription Kit(Applied Biosystems; ThermoFisher 카탈로그 번호: 4368813) 프로토콜에 따라 ~0.5-0.8μg의 총 RNA로부터 cDNA를 생성하였다. cDNA를 10배 희석하고 제조사의 프로토콜에 따라 Taqman Fast Advanced Master Mix를 사용하여 분석하였다. Taqman 프로브(LAMA1: Assay ID Hs01074489_m1 FAM; HPRT: Assay ID Hs99999909_m1 VIC_PL)는 Life Technologies에서 입수하였다. Taqman 프로브 기반 리얼-타임 PCR 반응물을 Taqman Fast Advanced Master Mix 프로토콜에서의 지시에 따라 QuantStudio 5 리얼-타임 PCR 시스템에 의해 처리 및 분석하였다.
퓨로마이신 선택 7일 후, 제조사의 프로토콜에 따라 QIAGEN Allprep Protein/RNA 키트(Qiagen #80404)를 사용하여 형질도입된 HSMM 세포의 총 단백질을 추출한 후 정량화하고, 1μg/μL의 최종 농도로 정규화하였다. 20μg의 각 단백질 용액을 NuPAGE Tris-Acetate 3-8% 미니 겔(FisherSci EA0375BOX)에서 분리한 다음, 4C에서 70분 동안 35V에서 PVDF 막(Bio-Rad)으로 옮겼다. 이것을 연속적으로 SuperBlock T20(PBS) 블로킹 완충액(LifeTech 37516)에서 실온에 1시간 동안 배양하여, 비특이적인 상호작용 부위를 블로킹하였다. 그 후, 막을 항-LAMA1 항체(1:100)(Santa Cruz Bio sc-74417) 또는 항-b-액틴 항체(1:10000)(LifeTech MA1-140)와 함께 4℃에서 밤새 배양하였다. 막을 세척 용액(1X TBS 및 0.05%의 Tween 20)에서 진탕(agitation)하면서 10분 동안 3회 세척하여, 비특이적인 결합 후 과하거나 느슨하게 결합된 항체를 제거하였다. 블로킹 용액 중 1:10,000으로 희석한 호스래디쉬 퍼옥시다아제(horseradish peroxidase)(HRP; LifeTech)와 결합된 염소 면역글로불린 항-마우스를 실온에서 교반(stirring)하면서 1시간 동안 막상에서 배양하였다. 세 번 더 세척한 후, SuperSignal West Femto Maximum Sensitivity Substrate(LifeTech 34094)에 막을 1분 동안 담궜다. 그 결과를 Azure C400으로 시각화하였다.
데이터 분석
각 샘플 및 3개의 대조군에 대해, LAMA1 프로브의 3가지 기술 복제물에서의 평균 Ct 값으로부터 HPRT 프로브의 그 값을 빼서 deltaCt 값을 산출하였다(평균 Ct LAMA1 - 평균 Ct HPRT). 식 2-(deltaCt)를 이용하여 각 샘플에 대한 발현 값을 결정하였다. 샘플 발현 값을 각 실험에 대한 3개의 대조군 발현 값의 평균으로 정규화하고, 각 샘플에 대한 상대적인 LAMA1 발현을 결정하였다.
결과
dSaCas9-VR:sgRNA에 의한 LAMA1 유전자 발현의 활성화
각 표적 서열에 대한 VP64-miniRTA 및 sgRNA를 위한 발현 카세트를 1차 HSMM 세포에 전달하는 렌티바이러스를 생산하였다. 형질도입된 세포를 퓨로마이신 내성으로 선택하고, Taqman Assay를 사용하여 LAMA1 발현을 정량화하였다. 각 샘플의 발현 값을 대조군 sgRNA로 형질도입된 세포에서 평균 LAMA1 발현으로 정규화하였다.
도 2에 나타낸 바와 같이, 16개의 테스트된 서열 중 3개의 표적 서열은 HSMM 공여자 #3 세포에서 LAMA1 mRNA 발현에 있어 ~5-7배의 상향 조절을 나타내었고(도 2), 동일한 3개의 서열은 HSMM 공여자 #5 세포에서 LAMA1 mRNA 발현에 있어 ~11-16배의 상향 조절을 나타내었다(도 3).
16개의 sgRNA(서열번호: 1-16)를 사용한 첫 번째 스크리닝에서 유망한 상향 조절 결과를 확인한 후, 우리는 동일한 영역에서 추가로 45개의 sgRNA(서열번호: 17-61)를 설계하고 스크리닝하여, sgRNA 25 및 sgRNA 50과 같이, sgRNA 15보다 거의 두 배 더 강력한 새로운 sgRNA를 확인하였다(도 4).
도 5에 나타낸 바와 같이, R1 및 R2에서 테스트된 40개 서열 중 gRNA#101만이 HSMM 공여자 #3 세포에서 LAMA1 mRNA 발현이 3배 이상 상향 조절된 것을 나타내었다.
도 6에 나타낸 바와 같이, LAMA1 TSS의 상단부에 위치한 92개의 테스트된 가이드 서열 중 소수가 LAMA1 발현 수준을 2배 이상으로 상향 조절할 수 있었다. 3개의 가장 강력한 가이드 서열, 즉 gRNA#155, gRNA#170 및 gRNA#172가, 4가지 상이한 기원을 갖는 1차 HSMM 세포로 테스트된 이하의 밸리데이션 실험에 포함되었으며, 각 처리 조건에 대해 3개의 생물학적 복제물이 포함되었다: 1. 비바이러스성 형질도입; 2. sgRNA가 형질도입되지 않은 dSaCas9-VR; 3. 비표적 sgRNA가 형질도입된 dSaCas9-VR; 4. gRNA#155가 형질도입된 dSaCas9-VR; 5. gRNA#170이 형질도입된 dSaCas9-VR; 6. gRNA#172가 형질도입된 dSaCas9-VR. 도 7에 나타낸 바와 같이, 3개의 sgRNA 모두는 4개의 상이한 기원을 갖는 모든 1차 HSMM 세포에 걸쳐서 LAMA1 발현 수준을 더 높은 수준(적어도 3.5배)으로 일관되게 상향 조절할 수 있었다. 그리고 우리는 상이한 HSMM 기원들 사이에서 다양한 상향 조절 효능을 관찰하였고(예컨대, 공여자 #368에서 >35배와 비교하여, 공여자 #121에서 ~3.5배), 이는 LAMA1의 기본 발현 수준이 상이하기 때문일 수 있다(도 8).
다음으로, 우리는 이러한 sgRNA들이 상이한 활성화 모이어티로 LAMA1 수준을 상향 조절할 수 있는지를 테스트하였다. 도 9에서 나타낸 바와 같이, VP160, nanoVR, microVR 및 miniVR은 모두 LAMA1 발현을 3배 이상으로 상향 조절할 수 있었고, VP64-MyoD는 LAMA1 발현을 약 2배 상향 조절할 수 있었다. 한편, LAMA1 mRNA 수준의 상향 조절이 단백질 수준의 상승으로 바뀌는지 확인하기 위해, 우리는 microVR로 샘플에서 전체 단백질을 추출하고 웨스턴 블롯 분석을 수행하였다. 도 10에 나타낸 바와 같이, 2개의 별개의 HSMM 세포 기원에 있어서, 3개의 sgRNA 모두는 LAMA1 단백질 수준을 1.7배 이상 증가시킬 수 있었다.
위에서 언급한 모든 특허 및 기타 참고 문헌은 상세하게 기재된 바와 마찬가지로, 그 전문이 본원에 참조에 의해 원용된다.
본 발명에 따르면, MDC1A 환자 유래의 근육 세포에서 LAMA1 유전자의 발현이 상향 조절될 수 있다. 따라서, 본 발명은 MDC1A의 치료 및/또는 예방에 매우 유용할 것으로 기대된다.
본 출원은 미국 가출원 특허번호 62/887,863(출원일: 2019년 8월 16일) 및 미국 가출원 특허번호 63/008,059(출원일: 2020년 4월 10일)에 기초한 것으로, 그 내용은 전문이 본원에 원용된다.
SEQUENCE LISTING
<110> Modalis Therapeutics Corporation
<120> METHOD FOR TREATING MUSCULAR DYSTROPHY BY TARGETING LAMA1 GENE
<130> 093060
<150> US62/887,863
<151> 2019-08-16
<150> US63/008,059
<151> 2020-04-10
<160> 221
<170> PatentIn version 3.5
<210> 1
<211> 21
<212> DNA
<213> Homo sapiens
<400> 1
actagcaggt gatttgcagg t 21
<210> 2
<211> 21
<212> DNA
<213> Homo sapiens
<400> 2
aggtgggctg atcacgaggt c 21
<210> 3
<211> 21
<212> DNA
<213> Homo sapiens
<400> 3
tctccgggct gcaggcagga g 21
<210> 4
<211> 21
<212> DNA
<213> Homo sapiens
<400> 4
cggaaggcaa aaaggcaaac a 21
<210> 5
<211> 21
<212> DNA
<213> Homo sapiens
<400> 5
tgaacaagtc ccggtttccc a 21
<210> 6
<211> 21
<212> DNA
<213> Homo sapiens
<400> 6
tggggaggga gaggagcctt a 21
<210> 7
<211> 21
<212> DNA
<213> Homo sapiens
<400> 7
cagtgcttcc atcatgaatg c 21
<210> 8
<211> 21
<212> DNA
<213> Homo sapiens
<400> 8
catgacaatg ggcgtattcc c 21
<210> 9
<211> 21
<212> DNA
<213> Homo sapiens
<400> 9
gggttgtccc ccaaaaggga a 21
<210> 10
<211> 21
<212> DNA
<213> Homo sapiens
<400> 10
gcccacggtc aatcccgcgc a 21
<210> 11
<211> 21
<212> DNA
<213> Homo sapiens
<400> 11
tcagtgccct ggacgccgcc t 21
<210> 12
<211> 21
<212> DNA
<213> Homo sapiens
<400> 12
cggggctgtt ggccgggcgc g 21
<210> 13
<211> 21
<212> DNA
<213> Homo sapiens
<400> 13
ggctttaacc tcctcgggct t 21
<210> 14
<211> 21
<212> DNA
<213> Homo sapiens
<400> 14
ggcgcgcatc ctgatccacc t 21
<210> 15
<211> 21
<212> DNA
<213> Homo sapiens
<400> 15
tctcgcctcc gccgccactc g 21
<210> 16
<211> 21
<212> DNA
<213> Homo sapiens
<400> 16
ctgccctggc cccgccgctc c 21
<210> 17
<211> 21
<212> DNA
<213> Homo sapiens
<400> 17
tgacagggaa cgtctaacaa t 21
<210> 18
<211> 21
<212> DNA
<213> Homo sapiens
<400> 18
tgcagtctcc gggctgcagg c 21
<210> 19
<211> 21
<212> DNA
<213> Homo sapiens
<400> 19
tgctcaagga ggctagttag g 21
<210> 20
<211> 21
<212> DNA
<213> Homo sapiens
<400> 20
gttaggaagg gtgagggttg g 21
<210> 21
<211> 21
<212> DNA
<213> Homo sapiens
<400> 21
tcggcacttg gcctggcggt t 21
<210> 22
<211> 21
<212> DNA
<213> Homo sapiens
<400> 22
accttcagca gcctgataga c 21
<210> 23
<211> 21
<212> DNA
<213> Homo sapiens
<400> 23
cgcagagcca ggctgggaag a 21
<210> 24
<211> 21
<212> DNA
<213> Homo sapiens
<400> 24
gaaacgcagc attgaatagc t 21
<210> 25
<211> 21
<212> DNA
<213> Homo sapiens
<400> 25
accggagctg gaaacgcagc a 21
<210> 26
<211> 21
<212> DNA
<213> Homo sapiens
<400> 26
ctccggtcca gtgcttccat c 21
<210> 27
<211> 21
<212> DNA
<213> Homo sapiens
<400> 27
gcttccatca tgaatgcttg a 21
<210> 28
<211> 21
<212> DNA
<213> Homo sapiens
<400> 28
aacgtgtgtt tgggcattgt g 21
<210> 29
<211> 21
<212> DNA
<213> Homo sapiens
<400> 29
attcgagtca aaagtagtgg g 21
<210> 30
<211> 21
<212> DNA
<213> Homo sapiens
<400> 30
tttaatgaag tttatattcg t 21
<210> 31
<211> 21
<212> DNA
<213> Homo sapiens
<400> 31
ccacgctgcg aagacagctc t 21
<210> 32
<211> 21
<212> DNA
<213> Homo sapiens
<400> 32
gaagacagct ctaggggtgg c 21
<210> 33
<211> 21
<212> DNA
<213> Homo sapiens
<400> 33
tctaggggtg gcgtgggtga c 21
<210> 34
<211> 21
<212> DNA
<213> Homo sapiens
<400> 34
gattgagaag agaaactcag a 21
<210> 35
<211> 21
<212> DNA
<213> Homo sapiens
<400> 35
agcaccttgc atgcgcgttg c 21
<210> 36
<211> 21
<212> DNA
<213> Homo sapiens
<400> 36
caaacccgct cattcactgc g 21
<210> 37
<211> 21
<212> DNA
<213> Homo sapiens
<400> 37
tcaatcccgc gcagtgaatg a 21
<210> 38
<211> 21
<212> DNA
<213> Homo sapiens
<400> 38
ttcgcctatt gcacaaaaag c 21
<210> 39
<211> 21
<212> DNA
<213> Homo sapiens
<400> 39
gcttggctgc caggggcccc g 21
<210> 40
<211> 21
<212> DNA
<213> Homo sapiens
<400> 40
ggtcgcggcg gccgggaaag g 21
<210> 41
<211> 21
<212> DNA
<213> Homo sapiens
<400> 41
ctcattgtcc ggctgcgcaa g 21
<210> 42
<211> 21
<212> DNA
<213> Homo sapiens
<400> 42
atgaatggag aaagagctct c 21
<210> 43
<211> 21
<212> DNA
<213> Homo sapiens
<400> 43
tagtgccccg gctgcgcggg c 21
<210> 44
<211> 21
<212> DNA
<213> Homo sapiens
<400> 44
gggcgcccgg agcggggcgc c 21
<210> 45
<211> 21
<212> DNA
<213> Homo sapiens
<400> 45
gccatctacg cgagcagtgc t 21
<210> 46
<211> 21
<212> DNA
<213> Homo sapiens
<400> 46
ctgctcgcgt agatggcgct c 21
<210> 47
<211> 21
<212> DNA
<213> Homo sapiens
<400> 47
tcccgcgctt gccggggagg g 21
<210> 48
<211> 21
<212> DNA
<213> Homo sapiens
<400> 48
cggagtgggt gtctcggcca c 21
<210> 49
<211> 21
<212> DNA
<213> Homo sapiens
<400> 49
ggccgagaca cccactccga g 21
<210> 50
<211> 21
<212> DNA
<213> Homo sapiens
<400> 50
cgcatcctga tccacctcgg a 21
<210> 51
<211> 21
<212> DNA
<213> Homo sapiens
<400> 51
gacacccact ccgaggtgga t 21
<210> 52
<211> 21
<212> DNA
<213> Homo sapiens
<400> 52
agcccgtcgc gttggggctg c 21
<210> 53
<211> 21
<212> DNA
<213> Homo sapiens
<400> 53
aggtgagccc ggcccgggtc c 21
<210> 54
<211> 21
<212> DNA
<213> Homo sapiens
<400> 54
cggcagagag gtgagcccgg c 21
<210> 55
<211> 21
<212> DNA
<213> Homo sapiens
<400> 55
gcggctttct ccccagaccc a 21
<210> 56
<211> 21
<212> DNA
<213> Homo sapiens
<400> 56
gcctggaacg ctccacggga c 21
<210> 57
<211> 21
<212> DNA
<213> Homo sapiens
<400> 57
gggcggggcg gggcgcagcc g 21
<210> 58
<211> 21
<212> DNA
<213> Homo sapiens
<400> 58
gggcgccccc gggggagggg t 21
<210> 59
<211> 21
<212> DNA
<213> Homo sapiens
<400> 59
caagctgggc gcccccgggg g 21
<210> 60
<211> 21
<212> DNA
<213> Homo sapiens
<400> 60
cgggggcgcc cagcttggcc t 21
<210> 61
<211> 21
<212> DNA
<213> Homo sapiens
<400> 61
gtcagcccgg cctccccgac t 21
<210> 62
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> control non-targeting targeting sequence
<400> 62
acggaggcta agcgtcgcaa 20
<210> 63
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> control non-targeting targeting sequence
<400> 63
cgcttccgcg gcccgttcaa 20
<210> 64
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> control non-targeting targeting sequence
<400> 64
gtaggcgcgc cgctctctac 20
<210> 65
<211> 19
<212> RNA
<213> Francisella novicid
<220>
<221> misc_structure
<222> (1)..(19)
<223> 5'-handle of crRNA
<400> 65
aauuucuacu guuguagau
<210> 66
<211> 1053
<212> PRT
<213> Staphylococcus aureus
<220>
<221> VARIANT
<222> (10)..(10)
<223> conversion of Asp residue into Ala residue
<220>
<221> VARIANT
<222> (580)..(580)
<223> conversion of Asn residue into Ala residue
<400> 66
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 67
<211> 1053
<212> PRT
<213> Staphylococcus aureus
<220>
<221> VARIANT
<222> (10)..(10)
<223> conversion of Asp residue into Ala residue
<220>
<221> VARIANT
<222> (557)..(557)
<223> conversion of His residue into Ala residue
<400> 67
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 68
<211> 1028
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid residues (721st to 745th amino acid residues of
dSaCas9) deletion mutant
<220>
<221> VARIANT
<222> (10)..(10)
<223> conversion of Asp residue into Ala residue
<220>
<221> VARIANT
<222> (580)..(580)
<223> conversion of Asn residue into Ala residue
<400> 68
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys
725 730 735
His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys
740 745 750
Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys
755 760 765
Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr
770 775 780
Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu
785 790 795 800
Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys
805 810 815
Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr
820 825 830
Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn
835 840 845
Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
850 855 860
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val Val
865 870 875 880
Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp Asn Gly
885 890 895
Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile Lys Lys Glu
900 905 910
Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu Ala Lys Lys Leu
915 920 925
Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser Phe Tyr Asn Asn
930 935 940
Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val Ile Gly Val Asn
945 950 955 960
Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile Asp Ile Thr Tyr
965 970 975
Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg Pro Pro Arg Ile Ile
980 985 990
Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp
995 1000 1005
Ile Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln
1010 1015 1020
Ile Ile Lys Lys Gly
1025
<210> 69
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> GGSGGS linker
<400> 69
Gly Gly Ser Gly Gly Ser
1 5
<210> 70
<211> 1034
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid residues (721st to 745th amino acid residues of
dSaCas9) deletion mutant with GGSGGS linker
<220>
<221> VARIANT
<222> (10)..(10)
<223> conversion of Asp residue into Ala residue
<220>
<221> VARIANT
<222> (580)..(580)
<223> conversion of Asn residue into Ala residue
<220>
<221> MISC_FEATURE
<222> (721)..(726)
<223> GGSGGS linker
<400> 70
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Gly Gly Ser Gly Gly Ser Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile
725 730 735
Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr
740 745 750
Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr
755 760 765
Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn
770 775 780
Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu
785 790 795 800
Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln
805 810 815
Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys
820 825 830
Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys
835 840 845
Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr
850 855 860
Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn
865 870 875 880
Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp
885 890 895
Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu
900 905 910
Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr
915 920 925
Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile
930 935 940
Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
945 950 955 960
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn
965 970 975
Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys
980 985 990
Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile
995 1000 1005
Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys
1010 1015 1020
Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1025 1030
<210> 71
<211> 886
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid residues (482nd to 648th amino acid residues of
dSaCas9) deletion mutant
<220>
<221> VARIANT
<222> (10)..(10)
<223> conversion of Asp residue into Ala residue
<400> 71
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Thr Arg Tyr Ala Thr Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr
485 490 495
Phe Arg Val Asn Asn Leu Asp Val Lys Val Lys Ser Ile Asn Gly Gly
500 505 510
Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn
515 520 525
Lys Gly Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala
530 535 540
Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala Lys Lys Val
545 550 555 560
Met Glu Asn Gln Met Phe Glu Glu Lys Gln Ala Glu Ser Met Pro Glu
565 570 575
Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro His Gln
580 585 590
Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His Arg Val
595 600 605
Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr
610 615 620
Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu Asn Gly
625 630 635 640
Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser
645 650 655
Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr Gln Lys
660 665 670
Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr
675 680 685
Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys
690 695 700
Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu
705 710 715 720
Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys
725 730 735
Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
740 745 750
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile Lys
755 760 765
Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu Ala Lys
770 775 780
Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser Phe Tyr
785 790 795 800
Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val Ile Gly
805 810 815
Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile Asp Ile
820 825 830
Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg Pro Pro Arg
835 840 845
Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser
850 855 860
Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro
865 870 875 880
Gln Ile Ile Lys Lys Gly
885
<210> 72
<211> 892
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid residues (482nd to 648th amino acid residues of
dSaCas9) deletion mutant with GGSGGS linker
<220>
<221> VARIANT
<222> (10)..(10)
<223> conversion of Asp residue into Ala residue
<220>
<221> MISC_FEATURE
<222> (482)..(487)
<223> GGSGGS linker
<400> 72
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Gly Gly Ser Gly Gly Ser Thr Arg Tyr Ala Thr Arg Gly Leu Met
485 490 495
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
500 505 510
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
515 520 525
Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala
530 535 540
Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu
545 550 555 560
Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln
565 570 575
Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile
580 585 590
Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr
595 600 605
Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn
610 615 620
Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
625 630 635 640
Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
645 650 655
Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
660 665 670
Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
675 680 685
Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
690 695 700
Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
705 710 715 720
Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
725 730 735
Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
740 745 750
Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
755 760 765
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
770 775 780
Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
785 790 795 800
Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu
805 810 815
Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
820 825 830
Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
835 840 845
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln
850 855 860
Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val
865 870 875 880
Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
885 890
<210> 73
<211> 50
<212> PRT
<213> Artificial Sequence
<220>
<223> VP64
<400> 73
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu
50
<210> 74
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> VPH
<400> 74
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu Ser Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ser Pro
50 55 60
Ser Gly Gln Ile Ser Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser Ala
65 70 75 80
Pro Val Leu Ala Gln Thr Met Val Pro Ser Ser Ala Met Val Pro Leu
85 90 95
Ala Gln Pro Pro Ala Pro Ala Pro Val Leu Thr Pro Gly Pro Pro Gln
100 105 110
Ser Leu Ser Ala Pro Val Pro Lys Ser Thr Gln Ala Gly Glu Gly Thr
115 120 125
Leu Ser Glu Ala Leu Leu His Leu Gln Phe Asp Ala Asp Glu Asp Leu
130 135 140
Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Gly Val Phe Thr Asp Leu
145 150 155 160
Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Val
165 170 175
Ser Met Ser His Ser Thr Ala Glu Pro Met Leu Met Glu Tyr Pro Glu
180 185 190
Ala Ile Thr Arg Leu Val Thr Gly Ser Gln Arg Pro Pro Asp Pro Ala
195 200 205
Pro Thr Pro Leu Gly Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly Asp
210 215 220
Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser
225 230 235 240
Gln Ile Ser Ser Ser Gly Gln Gly Gly Gly Gly Ser Gly Phe Ser Val
245 250 255
Asp Thr Ser Ala Leu Leu Asp Leu Phe Ser Pro Ser Val Thr Val Pro
260 265 270
Asp Met Ser Leu Pro Asp Leu Asp Ser Ser Leu Ala Ser Ile Gln Glu
275 280 285
Leu Leu Ser Pro Gln Glu Pro Pro Arg Pro Pro Glu Ala Glu Asn Ser
290 295 300
Ser Pro Asp Ser Gly Lys Gln Leu Val His Tyr Thr Ala Gln Pro Leu
305 310 315 320
Phe Leu Leu Asp Pro Gly Ser Val Asp Thr Gly Ser Asn Asp Leu Pro
325 330 335
Val Leu Phe Glu Leu Gly Glu Gly Ser Tyr Phe Ser Glu Gly Asp Gly
340 345 350
Phe Ala Glu Asp Pro Thr Ile Ser Leu Leu Thr Gly Ser Glu Pro Pro
355 360 365
Lys Ala Lys Asp Pro Thr Val Ser
370 375
<210> 75
<211> 523
<212> PRT
<213> Artificial Sequence
<220>
<223> VPR
<400> 75
Glu Ala Ser Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu
1 5 10 15
Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
20 25 30
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp
35 40 45
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser
50 55 60
Gly Ser Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu
65 70 75 80
Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys
85 90 95
Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile
100 105 110
Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln
115 120 125
Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe
130 135 140
Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu
145 150 155 160
Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro
165 170 175
Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro
180 185 190
Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys
195 200 205
Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu
210 215 220
Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp
225 230 235 240
Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln
245 250 255
Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro
260 265 270
Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala
275 280 285
Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu
290 295 300
Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp
305 310 315 320
Met Asp Phe Ser Ala Leu Leu Gly Ser Gly Ser Gly Ser Arg Asp Ser
325 330 335
Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala Ile Ser
340 345 350
Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile Arg Pro
355 360 365
Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro Ala Ser
370 375 380
Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly Ser Leu
385 390 395 400
Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala Val Thr
405 410 415
Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln
420 425 430
Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys
435 440 445
Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro
450 455 460
Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu
465 470 475 480
Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu
485 490 495
Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser
500 505 510
Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe
515 520
<210> 76
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> MiniVR
<400> 76
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu Gly Ser Gly Ser Pro Ala Pro Ala Val Thr Pro Glu Ala Ser
50 55 60
His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln Ala Val Lys Ala
65 70 75 80
Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys Glu Glu Ala Ala
85 90 95
Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro Arg Gly His Leu
100 105 110
Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu
115 120 125
Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu
130 135 140
Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser Thr Gly Leu Ser
145 150 155 160
Ile Phe Asp Thr Ser Leu Phe
165
<210> 77
<211> 140
<212> PRT
<213> Artificial Sequence
<220>
<223> MicroVR
<400> 77
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu Gly Ser Gly Ser Arg Glu Met Ala Asp Thr Val Ile Pro Gln
50 55 60
Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro
65 70 75 80
Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr
85 90 95
Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile
100 105 110
Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile
115 120 125
Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe
130 135 140
<210> 78
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> GSGS linker
<400> 78
Gly Ser Gly Ser
<210> 79
<211> 21
<212> RNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (1)..(21)
<223> crRNA corresponding to the target sequence (SEQ ID NO:15)
<400> 79
ucucgccucc gccgccacuc g 21
<210> 80
<211> 21
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (1)..(21)
<223> sequence complementary to the target sequence (SEQ ID NO:15)
<400> 80
cgagtggcgg cggaggcgag a 21
<210> 81
<211> 19
<212> DNA
<213> Francisella novicid
<220>
<221> misc_structure
<222> (1)..(19)
<223> 5'-handle of crRNA
<400> 81
aatttctact gttgtagat
<210> 82
<211> 83
<212> DNA
<213> Staphylococcus aureus
<220>
<221> misc_feature
<222> (1)..(83)
<223> sequence encoding tracrRNA
<400> 82
gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60
caacttgttg gcgagatttt ttt 83
<210> 83
<211> 82
<212> RNA
<213> Staphylococcus aureus
<220>
<221> misc_feature
<222> (1)..(82)
<223> tracrRNA
<400> 83
guuuuaguac ucuggaaaca gaaucuacua aaacaaggca aaaugccgug uuuaucucgu 60
caacuuguug gcgagauuuu uu 82
<210> 84
<211> 131
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic peptide
<400> 84
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly
50 55 60
Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
65 70 75 80
Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp
85 90 95
Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu
100 105 110
Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
115 120 125
Tyr Ile Asp
130
<210> 85
<211> 21
<212> DNA
<213> Homo sapiens
<400> 85
aaaattaaga ttttctttct g 21
<210> 86
<211> 21
<212> DNA
<213> Homo sapiens
<400> 86
aacttgtttt gtatattttt a 21
<210> 87
<211> 21
<212> DNA
<213> Homo sapiens
<400> 87
taataattga gatgcattct c 21
<210> 88
<211> 21
<212> DNA
<213> Homo sapiens
<400> 88
aagctcacat ttaggaacag a 21
<210> 89
<211> 21
<212> DNA
<213> Homo sapiens
<400> 89
ctatggcaaa ctaaacaaag c 21
<210> 90
<211> 21
<212> DNA
<213> Homo sapiens
<400> 90
cagaagagca gaagttctta t 21
<210> 91
<211> 21
<212> DNA
<213> Homo sapiens
<400> 91
catctgagac atcgctacct g 21
<210> 92
<211> 21
<212> DNA
<213> Homo sapiens
<400> 92
gtttacctta aaaacaaatt c 21
<210> 93
<211> 21
<212> DNA
<213> Homo sapiens
<400> 93
ctcctggtcc tttacaagtg g 21
<210> 94
<211> 21
<212> DNA
<213> Homo sapiens
<400> 94
agcagggggc aacgaagaag a 21
<210> 95
<211> 21
<212> DNA
<213> Homo sapiens
<400> 95
ttctggggtg atgggttcaa c 21
<210> 96
<211> 21
<212> DNA
<213> Homo sapiens
<400> 96
cccagagggc cgtggggcca t 21
<210> 97
<211> 21
<212> DNA
<213> Homo sapiens
<400> 97
tttccataga gaaatgtgtg t 21
<210> 98
<211> 21
<212> DNA
<213> Homo sapiens
<400> 98
tgggaggcgc catctgcgcg g 21
<210> 99
<211> 21
<212> DNA
<213> Homo sapiens
<400> 99
cctcaacgtt ttcctgtaag t 21
<210> 100
<211> 21
<212> DNA
<213> Homo sapiens
<400> 100
ctaagatctc cagccttgtt c 21
<210> 101
<211> 21
<212> DNA
<213> Homo sapiens
<400> 101
tgtgcctaag actgcacagg t 21
<210> 102
<211> 21
<212> DNA
<213> Homo sapiens
<400> 102
attaaacgca gatatgctat t 21
<210> 103
<211> 21
<212> DNA
<213> Homo sapiens
<400> 103
tcatagaaaa tacataagca a 21
<210> 104
<211> 21
<212> DNA
<213> Homo sapiens
<400> 104
aagaagtcac agaaatgcct c 21
<210> 105
<211> 21
<212> DNA
<213> Homo sapiens
<400> 105
ggcttggaga gaaggggcaa g 21
<210> 106
<211> 21
<212> DNA
<213> Homo sapiens
<400> 106
gctcatcact ggcactgccc a 21
<210> 107
<211> 21
<212> DNA
<213> Homo sapiens
<400> 107
taaacctctt ttgccttcat g 21
<210> 108
<211> 21
<212> DNA
<213> Homo sapiens
<400> 108
ttcttatgaa taaagtttta t 21
<210> 109
<211> 21
<212> DNA
<213> Homo sapiens
<400> 109
cttcttcaaa atgttaagtt a 21
<210> 110
<211> 21
<212> DNA
<213> Homo sapiens
<400> 110
caaatgttca tcaactgatg a 21
<210> 111
<211> 21
<212> DNA
<213> Homo sapiens
<400> 111
atatggttcc atttctaagt t 21
<210> 112
<211> 21
<212> DNA
<213> Homo sapiens
<400> 112
ttgcaccaat acaccaaaac a 21
<210> 113
<211> 21
<212> DNA
<213> Homo sapiens
<400> 113
actgctctga gctacagcaa a 21
<210> 114
<211> 21
<212> DNA
<213> Homo sapiens
<400> 114
tttttgtaat tttagtagag a 21
<210> 115
<211> 21
<212> DNA
<213> Homo sapiens
<400> 115
actgcactcc agcctgggca a 21
<210> 116
<211> 21
<212> DNA
<213> Homo sapiens
<400> 116
ctttttgccc agactggtaa a 21
<210> 117
<211> 21
<212> DNA
<213> Homo sapiens
<400> 117
ttggttttac acataaaaat c 21
<210> 118
<211> 21
<212> DNA
<213> Homo sapiens
<400> 118
tcttccactc aggacacaca a 21
<210> 119
<211> 21
<212> DNA
<213> Homo sapiens
<400> 119
tttttcacct aatgtttata a 21
<210> 120
<211> 21
<212> DNA
<213> Homo sapiens
<400> 120
ggtttttgga tttcttccca g 21
<210> 121
<211> 21
<212> DNA
<213> Homo sapiens
<400> 121
aacatcacct tgattttgag t 21
<210> 122
<211> 21
<212> DNA
<213> Homo sapiens
<400> 122
atcagggtgg cttctggtgt t 21
<210> 123
<211> 21
<212> DNA
<213> Homo sapiens
<400> 123
aaagaagaag aagaagaaaa a 21
<210> 124
<211> 21
<212> DNA
<213> Homo sapiens
<400> 124
aaaaattagc cgggcttggt g 21
<210> 125
<211> 21
<212> DNA
<213> Homo sapiens
<400> 125
aaattataga tgttcacttg g 21
<210> 126
<211> 21
<212> DNA
<213> Homo sapiens
<400> 126
aataccttga tattattatc c 21
<210> 127
<211> 21
<212> DNA
<213> Homo sapiens
<400> 127
tatgcgtcag aaaaagcggc t 21
<210> 128
<211> 21
<212> DNA
<213> Homo sapiens
<400> 128
gagaagcttc ttctcaccga t 21
<210> 129
<211> 21
<212> DNA
<213> Homo sapiens
<400> 129
ggaaggatga atagggcgtg a 21
<210> 130
<211> 21
<212> DNA
<213> Homo sapiens
<400> 130
cgcctcggcc tcccaaagtg c 21
<210> 131
<211> 21
<212> DNA
<213> Homo sapiens
<400> 131
ccagcacttt gggaggccga g 21
<210> 132
<211> 21
<212> DNA
<213> Homo sapiens
<400> 132
cactttggga ggccgaggcg g 21
<210> 133
<211> 21
<212> DNA
<213> Homo sapiens
<400> 133
gcgggtggat cacttgaggt c 21
<210> 134
<211> 21
<212> DNA
<213> Homo sapiens
<400> 134
ctacttggga ggctgaggca g 21
<210> 135
<211> 21
<212> DNA
<213> Homo sapiens
<400> 135
agataatttc ctctcacttg t 21
<210> 136
<211> 21
<212> DNA
<213> Homo sapiens
<400> 136
cctcagaaaa acaggaattg a 21
<210> 137
<211> 21
<212> DNA
<213> Homo sapiens
<400> 137
aaaaggatgc aatatagttc a 21
<210> 138
<211> 21
<212> DNA
<213> Homo sapiens
<400> 138
cattttaaat ttagtactgt a 21
<210> 139
<211> 21
<212> DNA
<213> Homo sapiens
<400> 139
aggcacatag ctattaaaat g 21
<210> 140
<211> 21
<212> DNA
<213> Homo sapiens
<400> 140
agatcccaaa agataatcta t 21
<210> 141
<211> 21
<212> DNA
<213> Homo sapiens
<400> 141
gcattcatat agattatctt t 21
<210> 142
<211> 21
<212> DNA
<213> Homo sapiens
<400> 142
cgcctcggcc tcccaaagtg c 21
<210> 143
<211> 21
<212> DNA
<213> Homo sapiens
<400> 143
ccagcacttt gggaggccga g 21
<210> 144
<211> 21
<212> DNA
<213> Homo sapiens
<400> 144
cactttggga ggccgaggcg g 21
<210> 145
<211> 21
<212> DNA
<213> Homo sapiens
<400> 145
tttttgtatt tttagtggag a 21
<210> 146
<211> 21
<212> DNA
<213> Homo sapiens
<400> 146
gctcactgca agctccgcct c 21
<210> 147
<211> 21
<212> DNA
<213> Homo sapiens
<400> 147
gtcttgctct gtcgcccagg c 21
<210> 148
<211> 21
<212> DNA
<213> Homo sapiens
<400> 148
cacaaggggt gtccccatat t 21
<210> 149
<211> 21
<212> DNA
<213> Homo sapiens
<400> 149
ccttatcttt gaactgcaag c 21
<210> 150
<211> 21
<212> DNA
<213> Homo sapiens
<400> 150
gcagggtttt tagaagatgt g 21
<210> 151
<211> 21
<212> DNA
<213> Homo sapiens
<400> 151
aatcagaatg tctatgttat t 21
<210> 152
<211> 21
<212> DNA
<213> Homo sapiens
<400> 152
cgcctcagcc tcccaaagtg c 21
<210> 153
<211> 21
<212> DNA
<213> Homo sapiens
<400> 153
ccagcacttt gggaggctga g 21
<210> 154
<211> 21
<212> DNA
<213> Homo sapiens
<400> 154
cactttggga ggctgaggcg g 21
<210> 155
<211> 21
<212> DNA
<213> Homo sapiens
<400> 155
tttttgtatt tttagtagag a 21
<210> 156
<211> 21
<212> DNA
<213> Homo sapiens
<400> 156
ccattctcct gcctcagcct c 21
<210> 157
<211> 21
<212> DNA
<213> Homo sapiens
<400> 157
ctactcagga ggctgaggca g 21
<210> 158
<211> 21
<212> DNA
<213> Homo sapiens
<400> 158
gctcactgca agctccgcct c 21
<210> 159
<211> 21
<212> DNA
<213> Homo sapiens
<400> 159
gtgggcagat cacttgagct c 21
<210> 160
<211> 21
<212> DNA
<213> Homo sapiens
<400> 160
cacctcagcc tcccaaagtg c 21
<210> 161
<211> 21
<212> DNA
<213> Homo sapiens
<400> 161
agcctcccaa agtgctggaa t 21
<210> 162
<211> 21
<212> DNA
<213> Homo sapiens
<400> 162
ggatttcaac aggatcaccc a 21
<210> 163
<211> 21
<212> DNA
<213> Homo sapiens
<400> 163
gaactagaat ctggatttca a 21
<210> 164
<211> 21
<212> DNA
<213> Homo sapiens
<400> 164
cagggatcca gccacggtgc c 21
<210> 165
<211> 21
<212> DNA
<213> Homo sapiens
<400> 165
tactagaatt ggttatggtg t 21
<210> 166
<211> 21
<212> DNA
<213> Homo sapiens
<400> 166
actttgcaga tgtgattaaa t 21
<210> 167
<211> 21
<212> DNA
<213> Homo sapiens
<400> 167
agagccagct gtaaggacac c 21
<210> 168
<211> 21
<212> DNA
<213> Homo sapiens
<400> 168
ggtgaaaccc attttggact t 21
<210> 169
<211> 21
<212> DNA
<213> Homo sapiens
<400> 169
tgtattgtta tcttatagtt c 21
<210> 170
<211> 21
<212> DNA
<213> Homo sapiens
<400> 170
aatactggaa aaaagagaag g 21
<210> 171
<211> 21
<212> DNA
<213> Homo sapiens
<400> 171
gaaggaagaa tagaggtctc a 21
<210> 172
<211> 21
<212> DNA
<213> Homo sapiens
17288
gaagagagcc ctcaccagaa a 21
<210> 173
<211> 21
<212> DNA
<213> Homo sapiens
<400> 173
cttacaagaa cacaaatcct a 21
<210> 174
<211> 21
<212> DNA
<213> Homo sapiens
<400> 174
aagaatgggg ctctgatcca a 21
<210> 175
<211> 21
<212> DNA
<213> Homo sapiens
<400> 175
tagtatttta catttacata g 21
<210> 176
<211> 21
<212> DNA
<213> Homo sapiens
<400> 176
atggggatat tttatagtaa a 21
<210> 177
<211> 21
<212> DNA
<213> Homo sapiens
<400> 177
gcatctccct aaagccaagg a 21
<210> 178
<211> 21
<212> DNA
<213> Homo sapiens
<400> 178
aggaagagga agccaaattg g 21
<210> 179
<211> 21
<212> DNA
<213> Homo sapiens
<400> 179
ccagcaggca gggatgtcct g 21
<210> 180
<211> 21
<212> DNA
<213> Homo sapiens
<400> 180
tctgcaggac atccctgcct g 21
<210> 181
<211> 21
<212> DNA
<213> Homo sapiens
<400> 181
ctactcggga ggctgaggca g 21
<210> 182
<211> 21
<212> DNA
<213> Homo sapiens
<400> 182
tgattctcct gcctcagcct c 21
<210> 183
<211> 21
<212> DNA
<213> Homo sapiens
<400> 183
gctcactgca agctctgcct c 21
<210> 184
<211> 21
<212> DNA
<213> Homo sapiens
<400> 184
ctactcggga ggctgaggca g 21
<210> 185
<211> 21
<212> DNA
<213> Homo sapiens
<400> 185
ccattctcct gcctcagcct c 21
<210> 186
<211> 21
<212> DNA
<213> Homo sapiens
<400> 186
tttttgtatt tttagtagag a 21
<210> 187
<211> 21
<212> DNA
<213> Homo sapiens
<400> 187
tactaaaaat acaaaaatta g 21
<210> 188
<211> 21
<212> DNA
<213> Homo sapiens
<400> 188
cactttggga ggccgaggtg g 21
<210> 189
<211> 21
<212> DNA
<213> Homo sapiens
<400> 189
cacctcggcc tcccaaagtg c 21
<210> 190
<211> 21
<212> DNA
<213> Homo sapiens
<400> 190
aacctaaagt gtaaaatatt g 21
<210> 191
<211> 21
<212> DNA
<213> Homo sapiens
<400> 191
cactaagcca atgccaggtt t 21
<210> 192
<211> 21
<212> DNA
<213> Homo sapiens
<400> 192
gctcactgca acctctgcct c 21
<210> 193
<211> 21
<212> DNA
<213> Homo sapiens
<400> 193
gtgggcagga gttgaaatga g 21
<210> 194
<211> 21
<212> DNA
<213> Homo sapiens
<400> 194
ggaaacgcag ctgagctctg a 21
<210> 195
<211> 21
<212> DNA
<213> Homo sapiens
<400> 195
ccacaaggga gcaagtggtt g 21
<210> 196
<211> 21
<212> DNA
<213> Homo sapiens
<400> 196
aaacaaaggc aagttaatca g 21
<210> 197
<211> 21
<212> DNA
<213> Homo sapiens
<400> 197
cagcagggag aatggggatc a 21
<210> 198
<211> 21
<212> DNA
<213> Homo sapiens
<400> 198
ggcttggaaa acaggaacca a 21
<210> 199
<211> 21
<212> DNA
<213> Homo sapiens
<400> 199
acatttgaag gtcagacagc t 21
<210> 200
<211> 21
<212> DNA
<213> Homo sapiens
<400> 200
ggacaggaag agctccacga a 21
<210> 201
<211> 21
<212> DNA
<213> Homo sapiens
<400> 201
ggtcagttta ctccccatgg g 21
<210> 202
<211> 21
<212> DNA
<213> Homo sapiens
<400> 202
tctcactaat tgctccatgc a 21
<210> 203
<211> 21
<212> DNA
<213> Homo sapiens
<400> 203
gtcttgctct gtcacccagg c 21
<210> 204
<211> 21
<212> DNA
<213> Homo sapiens
<400> 204
ctacttggga ggctgaggca g 21
<210> 205
<211> 21
<212> DNA
<213> Homo sapiens
<400> 205
tttttgtatt tttagtagag a 21
<210> 206
<211> 21
<212> DNA
<213> Homo sapiens
<400> 206
cactttggga ggctgaggca g 21
<210> 207
<211> 21
<212> DNA
<213> Homo sapiens
<400> 207
gaaacatgac ttagtgacta a 21
<210> 208
<211> 21
<212> DNA
<213> Homo sapiens
<400> 208
cagccacaat ctccatctgt c 21
<210> 209
<211> 21
<212> DNA
<213> Homo sapiens
<400> 209
gctcactgca acctctgctt c 21
<210> 210
<211> 21
<212> DNA
<213> Homo sapiens
<400> 210
ctacttggga ggctgaggca g 21
<210> 211
<211> 21
<212> DNA
<213> Homo sapiens
<400> 211
tgcctcagcc tcccaagtag c 21
<210> 212
<211> 21
<212> DNA
<213> Homo sapiens
<400> 212
caagcaggtt agccagcctc t 21
<210> 213
<211> 21
<212> DNA
<213> Homo sapiens
<400> 213
cacagaggct ggctaacctg c 21
<210> 214
<211> 21
<212> DNA
<213> Homo sapiens
<400> 214
gtcaaaggaa gctgatagat c 21
<210> 215
<211> 21
<212> DNA
<213> Homo sapiens
<400> 215
attagaaatt taaaacaaaa t 21
<210> 216
<211> 21
<212> DNA
<213> Homo sapiens
<400> 216
aatcaagatg aatccaggca g 21
<210> 217
<211> 21
<212> DNA
<213> Homo sapiens
<400> 217
aagcttatta ttggagcagc t 21
<210> 218
<211> 21
<212> DNA
<213> Homo sapiens
<400> 218
aaagaacctc cccatcctag c 21
<210> 219
<211> 21
<212> DNA
<213> Homo sapiens
<400> 219
gtaaagttct cattccacac c 21
<210> 220
<211> 21
<212> DNA
<213> Homo sapiens
<400> 220
aaggttaata tgagaatctg t 21
<210> 221
<211> 21
<212> DNA
<213> Homo sapiens
<400> 221
tctttaggtc ctagatacct t 21
Claims (25)
- 이하의 염기 서열을 포함하는 폴리뉴클레오타이드:
(a) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자(transcription activator)의 융합 단백질을 코딩하는 염기 서열, 및
(b) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역을 표적으로 하는 가이드 RNA, (ii) 서열번호: 124에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA를 코딩하는 염기 서열. - 제 1 항에 있어서,
가이드 RNA를 코딩하는 염기 서열이
(i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 염기 서열,
(ii) 서열번호: 124에 기재된 염기 서열,
(iii) 서열번호: 178, 193, 또는 195에 기재된 염기 서열,
또는 여기서 1 내지 3개의 염기가 결실, 치환, 삽입 및/또는 부가된 염기 서열을 포함하는, 폴리뉴클레오타이드. - 제 1 항 또는 제 2 항에 있어서,
전사 활성화 인자가 VP64, VP160, VPH, VPR, VP64-miniRTA(miniVR) 및 microVR, 및 전사 활성화 능력을 갖는 그의 변이체로 이루어진 군에서 선택되는, 폴리뉴클레오타이드. - 제 3 항에 있어서,
전사 활성화 인자가 miniVR인, 폴리뉴클레오타이드. - 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
뉴클레아제-결핍 CRISPR 이펙터 단백질이 dCas9인, 폴리뉴클레오타이드. - 제 5 항에 있어서,
dCas9가 황색포도상구균(Staphylococcus aureus)에서 유래하는, 폴리뉴클레오타이드. - 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
가이드 RNA를 코딩하는 염기 서열에 대한 프로모터 서열 및/또는 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열에 대한 프로모터 서열을 더 포함하는, 폴리뉴클레오타이드. - 제 7 항에 있어서,
가이드 RNA를 코딩하는 염기 서열에 대한 프로모터 서열이 U6 프로모터, SNR6 프로모터, SNR52 프로모터, SCR1 프로모터, RPR1 프로모터, U3 프로모터, 및 H1 프로모터로 이루어진 군에서 선택되는, 폴리뉴클레오타이드. - 제 8 항에 있어서,
가이드 RNA를 코딩하는 염기 서열에 대한 프로모터 서열이 U6 프로모터인, 폴리뉴클레오타이드. - 제 7 항 내지 제 9 항 중 어느 한 항에 있어서,
뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열에 대한 프로모터 서열이 유비쿼터스 프로모터(ubiquitous promoter) 또는 근육 특이적 프로모터인, 폴리뉴클레오타이드. - 제 10 항에 있어서,
유비쿼터스 프로모터가 EFS 프로모터, CMV 프로모터 및 CAG 프로모터로 이루어진 군에서 선택되는, 폴리뉴클레오타이드. - 제 10 항에 있어서,
근육 특이적 프로모터가 CK8 프로모터, 마이오신 중쇄 키나아제(MHCK) 프로모터, 근육 크레아틴 키나아제(MCK) 프로모터, 합성 C5-12(Syn) 프로모터 및 unc45b 프로모터로 이루어진 군에서 선택되는, 폴리뉴클레오타이드. - 제 1 항 내지 제 12 항 중 어느 한 항의 폴리뉴클레오타이드를 포함하는 벡터.
- 제 13 항에 있어서,
벡터가 플라스미드 벡터 또는 바이러스성 벡터인, 벡터. - 제 14 항에 있어서,
바이러스성 벡터가 아데노 연관 바이러스(adeno-associated virus; AAV) 벡터, 아데노바이러스 벡터, 및 렌티바이러스 벡터로 이루어진 군에서 선택되는, 벡터. - 제 15 항에 있어서,
AAV 벡터가 AAV1, AAV2, AAV6, AAV7, AAV8, AAV9, 및 그들의 변이체로 이루어진 군에서 선택되는, 벡터. - 제 1 항 내지 제 12 항 중 어느 한 항의 폴리뉴클레오타이드 또는 제 13 항 내지 제 16 항 중 어느 한 항의 벡터를 포함하는, MDC1A를 치료 또는 예방하기 위한 약제.
- 제 1 항 내지 제 12 항 중 어느 한 항의 폴리뉴클레오타이드 또는 제 13 항 내지 제 16 항 중 어느 한 항의 벡터를 이를 필요로 하는 대상에 투여하는 것을 포함하는, MDC1A를 치료 또는 예방하는 방법.
- MDC1A를 치료 또는 예방하기 위한, 제 1 항 내지 제 12 항 중 어느 한 항의 폴리뉴클레오타이드 또는 제 13 항 내지 제 16 항 중 어느 한 항의 벡터의 사용.
- MDC1A의 치료 또는 예방용 약학 조성물의 제조에 있어서 제 1 항 내지 제 12 항 중 어느 한 항의 폴리뉴클레오타이드 또는 제 13 항 내지 제 16 항 중 어느 한 항의 벡터의 사용.
- 세포에서 인간 LAMA1 유전자의 발현을 상향 조절하는 방법으로서,
(c) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 및
(d) 인간 LAMA1의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA를 상기 세포에서 발현하는 것을 포함하는 방법. - 이하를 포함하는 리보핵단백질:
(c) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 및
(d) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA. - 이하를 포함하는, 인간 LAMA1 유전자 발현의 상향 조절용 키트:
(e) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 또는 융합 단백질을 코딩하는 폴리뉴클레오타이드, 및
(f) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 가이드 RNA를 코딩하는 폴리뉴클레오타이드. - 이하의 (e) 및 (f)를 투여하는 것을 포함하는, MDC1A를 치료 또는 예방하는 방법:
(e) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 또는 융합 단백질을 코딩하는 폴리뉴클레오타이드, 및
(f) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 가이드 RNA를 코딩하는 폴리뉴클레오타이드. - MDC1A의 치료 또는 예방용 약학 조성물의 제조에 있어서, 이하의 (e) 및 (f)의 사용:
(e) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 또는 융합 단백질을 코딩하는 폴리뉴클레오타이드, 및
(f) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 가이드 RNA를 코딩하는 폴리뉴클레오타이드.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962887863P | 2019-08-16 | 2019-08-16 | |
US62/887,863 | 2019-08-16 | ||
US202063008059P | 2020-04-10 | 2020-04-10 | |
US63/008,059 | 2020-04-10 | ||
PCT/JP2020/030864 WO2021033635A1 (en) | 2019-08-16 | 2020-08-14 | Method for treating muscular dystrophy by targeting lama1 gene |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220045013A true KR20220045013A (ko) | 2022-04-12 |
Family
ID=72292600
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227007882A KR20220045013A (ko) | 2019-08-16 | 2020-08-14 | Lama1 유전자를 표적으로 하는 근이영양증의 치료 방법 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20230173036A1 (ko) |
EP (1) | EP4013874A1 (ko) |
JP (1) | JP2022544320A (ko) |
KR (1) | KR20220045013A (ko) |
CN (1) | CN114364802A (ko) |
AU (1) | AU2020334462A1 (ko) |
BR (1) | BR112022002889A2 (ko) |
CA (1) | CA3146751A1 (ko) |
IL (1) | IL290249A (ko) |
MX (1) | MX2022001859A (ko) |
TW (1) | TW202112797A (ko) |
WO (1) | WO2021033635A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022176859A1 (en) * | 2021-02-16 | 2022-08-25 | Modalis Therapeutics Corporation | Method for treating muscular dystrophy by targeting lama1 gene |
WO2023129940A1 (en) * | 2021-12-30 | 2023-07-06 | Regel Therapeutics, Inc. | Compositions for modulating expression of sodium voltage-gated channel alpha subunit 1 and uses thereof |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1390490B1 (en) | 2001-05-24 | 2009-04-15 | Genzyme Corporation | Muscle-specific expression vectors |
EP2298926A1 (en) | 2003-09-30 | 2011-03-23 | The Trustees of The University of Pennsylvania | Adeno-associated virus (AAV) clades, sequences, vectors containing same, and uses thereof |
CN107828820B (zh) | 2010-10-27 | 2022-06-07 | 学校法人自治医科大学 | 用于向神经系统细胞导入基因的腺相关病毒粒子 |
US9015089B2 (en) * | 2012-04-17 | 2015-04-21 | The Mitre Corporation | Identifying and forecasting shifts in the mood of social media users |
TW201642837A (zh) | 2015-03-24 | 2016-12-16 | Kyowa Hakko Kirin Co Ltd | 含有核酸之脂質奈米粒子 |
JP6926825B2 (ja) * | 2017-08-25 | 2021-08-25 | 沖電気工業株式会社 | 通信装置、プログラムおよびオペレータ選択方法 |
-
2020
- 2020-08-14 WO PCT/JP2020/030864 patent/WO2021033635A1/en active Application Filing
- 2020-08-14 AU AU2020334462A patent/AU2020334462A1/en active Pending
- 2020-08-14 MX MX2022001859A patent/MX2022001859A/es unknown
- 2020-08-14 CA CA3146751A patent/CA3146751A1/en active Pending
- 2020-08-14 BR BR112022002889A patent/BR112022002889A2/pt not_active Application Discontinuation
- 2020-08-14 US US17/635,608 patent/US20230173036A1/en active Pending
- 2020-08-14 CN CN202080057334.6A patent/CN114364802A/zh active Pending
- 2020-08-14 EP EP20764801.5A patent/EP4013874A1/en active Pending
- 2020-08-14 TW TW109127809A patent/TW202112797A/zh unknown
- 2020-08-14 KR KR1020227007882A patent/KR20220045013A/ko unknown
- 2020-08-14 JP JP2022509664A patent/JP2022544320A/ja active Pending
-
2022
- 2022-01-31 IL IL290249A patent/IL290249A/en unknown
Non-Patent Citations (3)
Title |
---|
Dwi U. Kemaladewi, Prabhpreet S. Bassi, Steven erwood, Dhekra Al-Basha, Kinga I. Gawlik, Kyle Lindsay, elzbieta Hyatt, rebekah Kember, Kara M. Place, ryan M. Marks, Madeleine Durbeej, Steven A. Prescott, evgueni A. Ivakine & ronald D. Cohn, Nature 572, p125, 2019: A mutation-independent approach for muscular dystrophy via upregulation of a modifier gene |
Kemaladewi, D. U., Maino, E., Hyatt, E., Hou, H., Ding, M., Place, K. M., Zhu, X., Bassi, P., Baghestani, Z., Deshwar, A. G., Merico, D., Xiong, H. Y., Frey, B. J., Wilson, M. D., Ivakine, E. A., Cohn, R. D. Nat Medicine. 23:8. 2017. |
Prabhpreet Singh Bassi, A thesis submitted in conformity with the requirements for the degree of Master of Science, Department of Molecular Genetics, University of Toronto. 2017: Assessing the Therapeutic Potential of CRISPR/Cas9-Mediated Gene Modulation in Merosin-Deficient Congenital Muscular Dystrophy Type 1A |
Also Published As
Publication number | Publication date |
---|---|
IL290249A (en) | 2022-04-01 |
EP4013874A1 (en) | 2022-06-22 |
JP2022544320A (ja) | 2022-10-17 |
CN114364802A (zh) | 2022-04-15 |
BR112022002889A2 (pt) | 2022-05-17 |
TW202112797A (zh) | 2021-04-01 |
WO2021033635A1 (en) | 2021-02-25 |
MX2022001859A (es) | 2022-03-11 |
CA3146751A1 (en) | 2021-02-25 |
AU2020334462A1 (en) | 2022-02-24 |
US20230173036A1 (en) | 2023-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11473071B2 (en) | Method for treating muscular dystrophy by targeting utrophin gene | |
JPH10507928A (ja) | ハイブリッドアデノウイルス−aavウイルスおよびその使用方法 | |
CN116194154A (zh) | 使用aav载体的plakophilin-2(pkp2)基因疗法 | |
CN112368390A (zh) | Cns变性的基因疗法 | |
US20210340508A1 (en) | Genome Editing by Directed Non-Homologous DNA Insertion Using a Retroviral Integrase-Cas9 Fusion Protein | |
CN114929735A (zh) | 因子viii构建体 | |
KR20220045013A (ko) | Lama1 유전자를 표적으로 하는 근이영양증의 치료 방법 | |
EP3262065B1 (en) | Methods and compositions for treating dystroglycanopathy disorders | |
WO2021230385A1 (en) | Method for treating muscular dystrophy by targeting utrophin gene | |
CN116685329A (zh) | 核酸构建体及其用于治疗脊髓性肌肉萎缩症的用途 | |
JP2023539631A (ja) | Dux4遺伝子を標的とした顔面肩甲上腕型筋ジストロフィーの治療方法 | |
WO2022176859A1 (en) | Method for treating muscular dystrophy by targeting lama1 gene | |
WO2023190935A1 (en) | Method for treating myopathies by targeting titin gene | |
TW202129002A (zh) | 用於myh7關聯之心肌病之基因療法組合物及治療 | |
US7122348B2 (en) | AAV2 Rep protein fusions | |
US20240181084A1 (en) | Genome Editing by Directed Non-Homologous DNA Insertion Using a Retroviral Integrase-Cas Fusion Protein and Methods of Treatment | |
KR20230037586A (ko) | Mapt 유전자를 표적으로 하는 알츠하이머병의 치료 방법 | |
Daya | Characterization of adeno-associated virus 2 site-specific integration |