KR20230003554A - 낮은 전사 활성을 갖는 프로모터를 사용하여 뉴클레아제 발현 및 표적-외 활성을 감소시키기 위한 조성물 및 방법 - Google Patents
낮은 전사 활성을 갖는 프로모터를 사용하여 뉴클레아제 발현 및 표적-외 활성을 감소시키기 위한 조성물 및 방법 Download PDFInfo
- Publication number
- KR20230003554A KR20230003554A KR1020227040655A KR20227040655A KR20230003554A KR 20230003554 A KR20230003554 A KR 20230003554A KR 1020227040655 A KR1020227040655 A KR 1020227040655A KR 20227040655 A KR20227040655 A KR 20227040655A KR 20230003554 A KR20230003554 A KR 20230003554A
- Authority
- KR
- South Korea
- Prior art keywords
- gly
- leu
- ser
- pro
- asn
- Prior art date
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 146
- 101710163270 Nuclease Proteins 0.000 title claims abstract description 119
- 238000000034 method Methods 0.000 title claims abstract description 90
- 239000000203 mixture Substances 0.000 title claims abstract description 47
- 230000009437 off-target effect Effects 0.000 title claims description 27
- 230000002103 transcriptional effect Effects 0.000 title claims description 17
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 105
- 239000013598 vector Substances 0.000 claims abstract description 94
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 54
- 108091026890 Coding region Proteins 0.000 claims abstract description 30
- 230000001105 regulatory effect Effects 0.000 claims abstract description 25
- 238000010362 genome editing Methods 0.000 claims abstract description 19
- 108090000623 proteins and genes Proteins 0.000 claims description 146
- 210000000234 capsid Anatomy 0.000 claims description 74
- 239000013603 viral vector Substances 0.000 claims description 42
- 230000003612 virological effect Effects 0.000 claims description 32
- 102100023700 C-C motif chemokine 16 Human genes 0.000 claims description 24
- 101000978375 Homo sapiens C-C motif chemokine 16 Proteins 0.000 claims description 24
- 102000012211 Retinoic Acid 4-Hydroxylase Human genes 0.000 claims description 24
- 108010022037 Retinoic Acid 4-Hydroxylase Proteins 0.000 claims description 24
- 210000004185 liver Anatomy 0.000 claims description 17
- 108091033409 CRISPR Proteins 0.000 claims description 12
- 108010017070 Zinc Finger Nucleases Proteins 0.000 claims description 10
- 239000002105 nanoparticle Substances 0.000 claims description 10
- 239000008194 pharmaceutical composition Substances 0.000 claims description 9
- 238000010354 CRISPR gene editing Methods 0.000 claims description 7
- 150000002632 lipids Chemical class 0.000 claims description 7
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 7
- 239000003085 diluting agent Substances 0.000 claims description 3
- 238000010363 gene targeting Methods 0.000 claims description 3
- 239000000375 suspending agent Substances 0.000 claims description 3
- 238000010459 TALEN Methods 0.000 claims description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims description 2
- 239000013604 expression vector Substances 0.000 claims description 2
- 235000018102 proteins Nutrition 0.000 description 75
- 102000004169 proteins and genes Human genes 0.000 description 75
- 210000004027 cell Anatomy 0.000 description 54
- 235000001014 amino acid Nutrition 0.000 description 50
- 229940024606 amino acid Drugs 0.000 description 48
- 150000001413 amino acids Chemical class 0.000 description 47
- 108020004414 DNA Proteins 0.000 description 44
- 102000039446 nucleic acids Human genes 0.000 description 38
- 108020004707 nucleic acids Proteins 0.000 description 38
- 239000002773 nucleotide Substances 0.000 description 32
- 125000003729 nucleotide group Chemical group 0.000 description 32
- -1 human Chemical compound 0.000 description 29
- 241000702421 Dependoparvovirus Species 0.000 description 25
- 125000003275 alpha amino acid group Chemical group 0.000 description 25
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 24
- 108700019146 Transgenes Proteins 0.000 description 24
- 108010077245 asparaginyl-proline Proteins 0.000 description 24
- 238000011282 treatment Methods 0.000 description 24
- 108091006740 SLC22A9 Proteins 0.000 description 23
- 102100035246 Solute carrier family 22 member 9 Human genes 0.000 description 23
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 22
- 108010061238 threonyl-glycine Proteins 0.000 description 22
- 239000002245 particle Substances 0.000 description 21
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 20
- 102000002248 Thyroxine-Binding Globulin Human genes 0.000 description 18
- 108010000259 Thyroxine-Binding Globulin Proteins 0.000 description 18
- 230000006240 deamidation Effects 0.000 description 18
- 108010078144 glutaminyl-glycine Proteins 0.000 description 18
- XUIIKFGFIJCVMT-UHFFFAOYSA-N thyroxine-binding globulin Natural products IC1=CC(CC([NH3+])C([O-])=O)=CC(I)=C1OC1=CC(I)=C(O)C(I)=C1 XUIIKFGFIJCVMT-UHFFFAOYSA-N 0.000 description 18
- 102000004190 Enzymes Human genes 0.000 description 17
- 108090000790 Enzymes Proteins 0.000 description 17
- 241000282414 Homo sapiens Species 0.000 description 17
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 16
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 16
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 16
- 108010093581 aspartyl-proline Proteins 0.000 description 16
- 230000000694 effects Effects 0.000 description 16
- 108090000565 Capsid Proteins Proteins 0.000 description 15
- 102100023321 Ceruloplasmin Human genes 0.000 description 15
- 241000880493 Leptailurus serval Species 0.000 description 15
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 14
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 14
- 238000001415 gene therapy Methods 0.000 description 14
- 108010050848 glycylleucine Proteins 0.000 description 14
- 239000013612 plasmid Substances 0.000 description 14
- 241000282326 Felis catus Species 0.000 description 13
- 108010006025 bovine growth hormone Proteins 0.000 description 13
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 12
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 12
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 12
- 230000001404 mediated effect Effects 0.000 description 12
- 239000013607 AAV vector Substances 0.000 description 11
- 108010009298 lysylglutamic acid Proteins 0.000 description 11
- 238000004519 manufacturing process Methods 0.000 description 11
- 238000004806 packaging method and process Methods 0.000 description 11
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 10
- 239000004471 Glycine Substances 0.000 description 10
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 10
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 10
- 108010079364 N-glycylalanine Proteins 0.000 description 10
- 108010071690 Prealbumin Proteins 0.000 description 10
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 10
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 10
- 102000009190 Transthyretin Human genes 0.000 description 10
- 108010047857 aspartylglycine Proteins 0.000 description 10
- 108010092854 aspartyllysine Proteins 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 108010031719 prolyl-serine Proteins 0.000 description 10
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 9
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 9
- 101000941029 Homo sapiens Endoplasmic reticulum junction formation protein lunapark Proteins 0.000 description 9
- 101000991410 Homo sapiens Nucleolar and spindle-associated protein 1 Proteins 0.000 description 9
- 241000699670 Mus sp. Species 0.000 description 9
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 9
- 102100030991 Nucleolar and spindle-associated protein 1 Human genes 0.000 description 9
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 9
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 9
- 208000035475 disorder Diseases 0.000 description 9
- 239000012634 fragment Substances 0.000 description 9
- 238000007481 next generation sequencing Methods 0.000 description 9
- 239000000523 sample Substances 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 8
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 8
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 8
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 8
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 8
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 8
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 8
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 8
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 8
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 8
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 8
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 8
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 8
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 8
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 8
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 8
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 8
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 8
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 8
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 8
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 8
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 8
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 8
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 8
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 8
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 8
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 8
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 8
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 8
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 8
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 8
- JPSODRNUDXONAS-XIRDDKMYSA-N Asn-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CC(=O)N)N JPSODRNUDXONAS-XIRDDKMYSA-N 0.000 description 8
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 8
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 8
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 8
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 8
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 8
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 8
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 8
- LLRJPYJQNBMOOO-QEJZJMRPSA-N Asp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N LLRJPYJQNBMOOO-QEJZJMRPSA-N 0.000 description 8
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 8
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 description 8
- XIZWKXATMJODQW-KKUMJFAQSA-N Cys-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N XIZWKXATMJODQW-KKUMJFAQSA-N 0.000 description 8
- XLLSMEFANRROJE-GUBZILKMSA-N Cys-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XLLSMEFANRROJE-GUBZILKMSA-N 0.000 description 8
- 108010042407 Endonucleases Proteins 0.000 description 8
- 102000004533 Endonucleases Human genes 0.000 description 8
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 8
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 8
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 8
- ULXXDWZMMSQBDC-ACZMJKKPSA-N Gln-Asp-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ULXXDWZMMSQBDC-ACZMJKKPSA-N 0.000 description 8
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 8
- HVQCEQTUSWWFOS-WDSKDSINSA-N Gln-Gly-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N HVQCEQTUSWWFOS-WDSKDSINSA-N 0.000 description 8
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 8
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 8
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 8
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 8
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 8
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 8
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 8
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 8
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 8
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 8
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 8
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 8
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 8
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 8
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 8
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 8
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 8
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 8
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 8
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 8
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 8
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 8
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 8
- HTDRTKMNJRRYOJ-SIUGBPQLSA-N Ile-Gln-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HTDRTKMNJRRYOJ-SIUGBPQLSA-N 0.000 description 8
- LEHPJMKVGFPSSP-ZQINRCPSSA-N Ile-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 LEHPJMKVGFPSSP-ZQINRCPSSA-N 0.000 description 8
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 8
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 8
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 8
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 8
- 108010065920 Insulin Lispro Proteins 0.000 description 8
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 8
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 8
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 8
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 8
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 8
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 8
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 8
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 8
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 8
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 8
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 8
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 8
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 8
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 8
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 8
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 8
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 8
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 8
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 8
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 8
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 8
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 8
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 8
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 8
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 8
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 8
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 8
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 8
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 8
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 8
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 8
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 8
- 108010047562 NGR peptide Proteins 0.000 description 8
- NEHSHYOUIWBYSA-DCPHZVHLSA-N Phe-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NEHSHYOUIWBYSA-DCPHZVHLSA-N 0.000 description 8
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 8
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 8
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 8
- WFHRXJOZEXUKLV-IRXDYDNUSA-N Phe-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 WFHRXJOZEXUKLV-IRXDYDNUSA-N 0.000 description 8
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 8
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 8
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 8
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 8
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 8
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 8
- YKQNVTOIYFQMLW-IHRRRGAJSA-N Pro-Cys-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 YKQNVTOIYFQMLW-IHRRRGAJSA-N 0.000 description 8
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 8
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 8
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 8
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 8
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 8
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 8
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 8
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 8
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 8
- 108010079005 RDV peptide Proteins 0.000 description 8
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 8
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 8
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 8
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 8
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 8
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 8
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 8
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 8
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 8
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 8
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 8
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 8
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 8
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 8
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 8
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 8
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 8
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 8
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 8
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 8
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 8
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 8
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 8
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 8
- SSNGFWKILJLTQM-QEJZJMRPSA-N Trp-Gln-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SSNGFWKILJLTQM-QEJZJMRPSA-N 0.000 description 8
- WVHUFSCKCBQKJW-HKUYNNGSSA-N Trp-Gly-Tyr Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 WVHUFSCKCBQKJW-HKUYNNGSSA-N 0.000 description 8
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 8
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 8
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 8
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 8
- QSFJHIRIHOJRKS-ULQDDVLXSA-N Tyr-Leu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QSFJHIRIHOJRKS-ULQDDVLXSA-N 0.000 description 8
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 8
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 8
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 8
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 8
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 8
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 8
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 8
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 8
- ZEBRMWPTJNHXAJ-JYJNAYRXSA-N Val-Phe-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N ZEBRMWPTJNHXAJ-JYJNAYRXSA-N 0.000 description 8
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 8
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 8
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 8
- 108010070944 alanylhistidine Proteins 0.000 description 8
- 108010060035 arginylproline Proteins 0.000 description 8
- 108010050663 endodeoxyribonuclease CreI Proteins 0.000 description 8
- 238000009472 formulation Methods 0.000 description 8
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 8
- 108010010147 glycylglutamine Proteins 0.000 description 8
- 108010081551 glycylphenylalanine Proteins 0.000 description 8
- 108010077515 glycylproline Proteins 0.000 description 8
- 108010040030 histidinoalanine Proteins 0.000 description 8
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 8
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 8
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 8
- 108010057821 leucylproline Proteins 0.000 description 8
- 108010064235 lysylglycine Proteins 0.000 description 8
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 8
- 108010077112 prolyl-proline Proteins 0.000 description 8
- 108010053725 prolylvaline Proteins 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 108010026333 seryl-proline Proteins 0.000 description 8
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 8
- 108010038745 tryptophylglycine Proteins 0.000 description 8
- 108010045269 tryptophyltryptophan Proteins 0.000 description 8
- 108010003137 tyrosyltyrosine Proteins 0.000 description 8
- 108010073969 valyllysine Proteins 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 7
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 7
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 7
- 102000007330 LDL Lipoproteins Human genes 0.000 description 7
- 108010007622 LDL Lipoproteins Proteins 0.000 description 7
- 102100028200 Ornithine transcarbamylase, mitochondrial Human genes 0.000 description 7
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 7
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 7
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 7
- 108010047495 alanylglycine Proteins 0.000 description 7
- 108010062796 arginyllysine Proteins 0.000 description 7
- 230000027455 binding Effects 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 238000004113 cell culture Methods 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 108010004914 prolylarginine Proteins 0.000 description 7
- 230000010076 replication Effects 0.000 description 7
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 6
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 6
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 6
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 6
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 6
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 6
- 108010067770 Endopeptidase K Proteins 0.000 description 6
- 102000003951 Erythropoietin Human genes 0.000 description 6
- 108090000394 Erythropoietin Proteins 0.000 description 6
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 6
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 6
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 6
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 6
- BXDLTKLPPKBVEL-FJXKBIBVSA-N Gly-Thr-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O BXDLTKLPPKBVEL-FJXKBIBVSA-N 0.000 description 6
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 6
- QEYUCKCWTMIERU-SRVKXCTJSA-N His-Lys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QEYUCKCWTMIERU-SRVKXCTJSA-N 0.000 description 6
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 6
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 6
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 6
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 6
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 6
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 6
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 6
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 6
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 6
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 6
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 6
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 6
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 6
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 6
- 235000009582 asparagine Nutrition 0.000 description 6
- 108010068265 aspartyltyrosine Proteins 0.000 description 6
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 6
- 230000007812 deficiency Effects 0.000 description 6
- 229940105423 erythropoietin Drugs 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 238000001727 in vivo Methods 0.000 description 6
- 239000000543 intermediate Substances 0.000 description 6
- YGPSJZOEDVAXAB-UHFFFAOYSA-N kynurenine Chemical compound OC(=O)C(N)CC(=O)C1=CC=CC=C1N YGPSJZOEDVAXAB-UHFFFAOYSA-N 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 238000012317 liver biopsy Methods 0.000 description 6
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 6
- 239000004094 surface-active agent Substances 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 5
- 102000004157 Hydrolases Human genes 0.000 description 5
- 108090000604 Hydrolases Proteins 0.000 description 5
- 108010001831 LDL receptors Proteins 0.000 description 5
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 5
- 241000282560 Macaca mulatta Species 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 238000003306 harvesting Methods 0.000 description 5
- 238000004949 mass spectrometry Methods 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 102000005962 receptors Human genes 0.000 description 5
- 108020003175 receptors Proteins 0.000 description 5
- 230000001225 therapeutic effect Effects 0.000 description 5
- JYEBJTDTPNKQJG-FXQIFTODSA-N Ala-Asn-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N JYEBJTDTPNKQJG-FXQIFTODSA-N 0.000 description 4
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 4
- 108010056301 Apolipoprotein C-III Proteins 0.000 description 4
- 102000030169 Apolipoprotein C-III Human genes 0.000 description 4
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 4
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 4
- 102100034746 Cyclin-dependent kinase-like 5 Human genes 0.000 description 4
- 102000001690 Factor VIII Human genes 0.000 description 4
- 108010054218 Factor VIII Proteins 0.000 description 4
- 102100033295 Glial cell line-derived neurotrophic factor Human genes 0.000 description 4
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 4
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 4
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 4
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 4
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 4
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 4
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 4
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 4
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 4
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 4
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 4
- 108060003951 Immunoglobulin Proteins 0.000 description 4
- 108090001061 Insulin Proteins 0.000 description 4
- 102000004877 Insulin Human genes 0.000 description 4
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 4
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 4
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 4
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 4
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 4
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 4
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 4
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 4
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 4
- 108010011964 Phosphatidylcholine-sterol O-acyltransferase Proteins 0.000 description 4
- 102000014190 Phosphatidylcholine-sterol O-acyltransferase Human genes 0.000 description 4
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 4
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 4
- 108010061312 Sphingomyelin Phosphodiesterase Proteins 0.000 description 4
- 102000011971 Sphingomyelin Phosphodiesterase Human genes 0.000 description 4
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 4
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 4
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 4
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 4
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 4
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 150000001508 asparagines Chemical class 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 230000002950 deficient Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 229960000301 factor viii Drugs 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 102000018358 immunoglobulin Human genes 0.000 description 4
- 229940072221 immunoglobulins Drugs 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 229940125396 insulin Drugs 0.000 description 4
- 239000002502 liposome Substances 0.000 description 4
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 229920001983 poloxamer Polymers 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 4
- 108010015796 prolylisoleucine Proteins 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 210000002966 serum Anatomy 0.000 description 4
- 238000002560 therapeutic procedure Methods 0.000 description 4
- 108010046716 3-Methyl-2-Oxobutanoate Dehydrogenase (Lipoamide) Proteins 0.000 description 3
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 3
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 3
- 102000009027 Albumins Human genes 0.000 description 3
- 108010088751 Albumins Proteins 0.000 description 3
- 102000004452 Arginase Human genes 0.000 description 3
- 108700024123 Arginases Proteins 0.000 description 3
- 206010058298 Argininosuccinate synthetase deficiency Diseases 0.000 description 3
- KDZOASGQNOPSCU-WDSKDSINSA-N Argininosuccinic acid Chemical compound OC(=O)[C@@H](N)CCC\N=C(/N)N[C@H](C(O)=O)CC(O)=O KDZOASGQNOPSCU-WDSKDSINSA-N 0.000 description 3
- 102000007370 Ataxin2 Human genes 0.000 description 3
- 108010032951 Ataxin2 Proteins 0.000 description 3
- 238000010453 CRISPR/Cas method Methods 0.000 description 3
- 201000011297 Citrullinemia Diseases 0.000 description 3
- 102100022641 Coagulation factor IX Human genes 0.000 description 3
- 102000004127 Cytokines Human genes 0.000 description 3
- 108090000695 Cytokines Proteins 0.000 description 3
- 230000004568 DNA-binding Effects 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 3
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 3
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- 208000000563 Hyperlipoproteinemia Type II Diseases 0.000 description 3
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 3
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 3
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 3
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 3
- 102000015696 Interleukins Human genes 0.000 description 3
- 108010063738 Interleukins Proteins 0.000 description 3
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 3
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 3
- 102000004317 Lyases Human genes 0.000 description 3
- 108090000856 Lyases Proteins 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 208000030162 Maple syrup disease Diseases 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 108010025020 Nerve Growth Factor Proteins 0.000 description 3
- RVGRUAULSDPKGF-UHFFFAOYSA-N Poloxamer Chemical compound C1CO1.CC1CO1 RVGRUAULSDPKGF-UHFFFAOYSA-N 0.000 description 3
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 3
- 239000002202 Polyethylene glycol Substances 0.000 description 3
- 208000004777 Primary Hyperoxaluria Diseases 0.000 description 3
- 238000011529 RT qPCR Methods 0.000 description 3
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 3
- 241001068295 Replication defective viruses Species 0.000 description 3
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 3
- 108090000631 Trypsin Proteins 0.000 description 3
- 102000004142 Trypsin Human genes 0.000 description 3
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 description 3
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 3
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 3
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 3
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 3
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 3
- 102000013529 alpha-Fetoproteins Human genes 0.000 description 3
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 235000012000 cholesterol Nutrition 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000011304 droplet digital PCR Methods 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 201000001386 familial hypercholesterolemia Diseases 0.000 description 3
- 238000003197 gene knockdown Methods 0.000 description 3
- 102000034356 gene-regulatory proteins Human genes 0.000 description 3
- 108091006104 gene-regulatory proteins Proteins 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010087823 glycyltyrosine Proteins 0.000 description 3
- 239000003102 growth factor Substances 0.000 description 3
- 229940088597 hormone Drugs 0.000 description 3
- 239000005556 hormone Substances 0.000 description 3
- 210000000987 immune system Anatomy 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000001990 intravenous administration Methods 0.000 description 3
- 208000024393 maple syrup urine disease Diseases 0.000 description 3
- 201000003694 methylmalonic acidemia Diseases 0.000 description 3
- 239000003094 microcapsule Substances 0.000 description 3
- 238000012235 off-target genome editing Methods 0.000 description 3
- 230000003647 oxidation Effects 0.000 description 3
- 238000007254 oxidation reaction Methods 0.000 description 3
- 229960000502 poloxamer Drugs 0.000 description 3
- 229920001993 poloxamer 188 Polymers 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 101150066583 rep gene Proteins 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- 210000002845 virion Anatomy 0.000 description 3
- 102100038837 2-Hydroxyacid oxidase 1 Human genes 0.000 description 2
- 208000005452 Acute intermittent porphyria Diseases 0.000 description 2
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 2
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 2
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 2
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 2
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 2
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 2
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 2
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 2
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 2
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 2
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 2
- 102000007610 Amino-acid N-acetyltransferase Human genes 0.000 description 2
- 108010032178 Amino-acid N-acetyltransferase Proteins 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 2
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 2
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 2
- 102100022146 Arylsulfatase A Human genes 0.000 description 2
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 2
- DXZNJWFECGJCQR-FXQIFTODSA-N Asn-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N DXZNJWFECGJCQR-FXQIFTODSA-N 0.000 description 2
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 2
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 2
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 102100026189 Beta-galactosidase Human genes 0.000 description 2
- 102000007350 Bone Morphogenetic Proteins Human genes 0.000 description 2
- 108010007726 Bone Morphogenetic Proteins Proteins 0.000 description 2
- 102100037597 Brain-derived neurotrophic factor Human genes 0.000 description 2
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 2
- 102100031168 CCN family member 2 Human genes 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 101150044789 Cap gene Proteins 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 108010036867 Cerebroside-Sulfatase Proteins 0.000 description 2
- 102000011022 Chorionic Gonadotropin Human genes 0.000 description 2
- 108010062540 Chorionic Gonadotropin Proteins 0.000 description 2
- 108010005939 Ciliary Neurotrophic Factor Proteins 0.000 description 2
- 102100031614 Ciliary neurotrophic factor Human genes 0.000 description 2
- 108010039419 Connective Tissue Growth Factor Proteins 0.000 description 2
- 101710178912 Cyclin-dependent kinase-like 5 Proteins 0.000 description 2
- FANFRJOFTYCNRG-JYBASQMISA-N Cys-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CS)N)O FANFRJOFTYCNRG-JYBASQMISA-N 0.000 description 2
- 201000003883 Cystic fibrosis Diseases 0.000 description 2
- 108010071840 Cytosol nonspecific dipeptidase Proteins 0.000 description 2
- 238000010442 DNA editing Methods 0.000 description 2
- 206010012289 Dementia Diseases 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 108010069091 Dystrophin Proteins 0.000 description 2
- 101150090149 E1 ALPHA gene Proteins 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 238000012286 ELISA Assay Methods 0.000 description 2
- CTKXFMQHOOWWEB-UHFFFAOYSA-N Ethylene oxide/propylene oxide copolymer Chemical compound CCCOC(C)COCCO CTKXFMQHOOWWEB-UHFFFAOYSA-N 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- 108010076282 Factor IX Proteins 0.000 description 2
- 206010016202 Familial Amyloidosis Diseases 0.000 description 2
- 241000282324 Felis Species 0.000 description 2
- 102000003971 Fibroblast Growth Factor 1 Human genes 0.000 description 2
- 108090000386 Fibroblast Growth Factor 1 Proteins 0.000 description 2
- 102000003974 Fibroblast growth factor 2 Human genes 0.000 description 2
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 2
- 102000012673 Follicle Stimulating Hormone Human genes 0.000 description 2
- 108010079345 Follicle Stimulating Hormone Proteins 0.000 description 2
- 201000011240 Frontotemporal dementia Diseases 0.000 description 2
- 102100028496 Galactocerebrosidase Human genes 0.000 description 2
- 108091010837 Glial cell line-derived neurotrophic factor Proteins 0.000 description 2
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 2
- DRNMNLKUUKKPIA-HTUGSXCWSA-N Gln-Phe-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)CCC(N)=O)C(O)=O DRNMNLKUUKKPIA-HTUGSXCWSA-N 0.000 description 2
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 2
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 2
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 2
- 102000006395 Globulins Human genes 0.000 description 2
- 108010044091 Globulins Proteins 0.000 description 2
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 2
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 2
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 2
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 2
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 2
- 108010086800 Glucose-6-Phosphatase Proteins 0.000 description 2
- 102000003638 Glucose-6-Phosphatase Human genes 0.000 description 2
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 2
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 2
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 2
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 2
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 2
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 2
- 108010051696 Growth Hormone Proteins 0.000 description 2
- 239000000095 Growth Hormone-Releasing Hormone Substances 0.000 description 2
- 102000015779 HDL Lipoproteins Human genes 0.000 description 2
- 108010010234 HDL Lipoproteins Proteins 0.000 description 2
- 108090000100 Hepatocyte Growth Factor Proteins 0.000 description 2
- 102100021866 Hepatocyte growth factor Human genes 0.000 description 2
- 101000945692 Homo sapiens Cyclin-dependent kinase-like 5 Proteins 0.000 description 2
- 101100135844 Homo sapiens PCSK9 gene Proteins 0.000 description 2
- 101000629622 Homo sapiens Serine-pyruvate aminotransferase Proteins 0.000 description 2
- 101000841498 Homo sapiens UDP-glucuronosyltransferase 1A1 Proteins 0.000 description 2
- 108010000521 Human Growth Hormone Proteins 0.000 description 2
- 102000002265 Human Growth Hormone Human genes 0.000 description 2
- 239000000854 Human Growth Hormone Substances 0.000 description 2
- 108010056651 Hydroxymethylbilane synthase Proteins 0.000 description 2
- FCWFBHMAJZGWRY-XUXIUFHCSA-N Ile-Leu-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N FCWFBHMAJZGWRY-XUXIUFHCSA-N 0.000 description 2
- 108010002352 Interleukin-1 Proteins 0.000 description 2
- 102000000589 Interleukin-1 Human genes 0.000 description 2
- 108010002386 Interleukin-3 Proteins 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 2
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 2
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 2
- UCNNZELZXFXXJQ-BZSNNMDCSA-N Leu-Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCNNZELZXFXXJQ-BZSNNMDCSA-N 0.000 description 2
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 2
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 108010013563 Lipoprotein Lipase Proteins 0.000 description 2
- 102100022119 Lipoprotein lipase Human genes 0.000 description 2
- 108010074338 Lymphokines Proteins 0.000 description 2
- 102000008072 Lymphokines Human genes 0.000 description 2
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 2
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 2
- HDNOQCZWJGGHSS-VEVYYDQMSA-N Met-Asn-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HDNOQCZWJGGHSS-VEVYYDQMSA-N 0.000 description 2
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 2
- 102100039124 Methyl-CpG-binding protein 2 Human genes 0.000 description 2
- 102000019010 Methylmalonyl-CoA Mutase Human genes 0.000 description 2
- 108010051862 Methylmalonyl-CoA mutase Proteins 0.000 description 2
- 101710081079 Minor spike protein H Proteins 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 102000007072 Nerve Growth Factors Human genes 0.000 description 2
- 102400000058 Neuregulin-1 Human genes 0.000 description 2
- 201000000788 Niemann-Pick disease type C1 Diseases 0.000 description 2
- 108091005461 Nucleic proteins Proteins 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 101150094724 PCSK9 gene Proteins 0.000 description 2
- 102000003982 Parathyroid hormone Human genes 0.000 description 2
- 108090000445 Parathyroid hormone Proteins 0.000 description 2
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 2
- ZIQQNOXKEFDPBE-BZSNNMDCSA-N Phe-Lys-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N ZIQQNOXKEFDPBE-BZSNNMDCSA-N 0.000 description 2
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 2
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Natural products OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 2
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 2
- 102100034391 Porphobilinogen deaminase Human genes 0.000 description 2
- 206010036182 Porphyria acute Diseases 0.000 description 2
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 2
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 2
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 2
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 2
- 208000035977 Rare disease Diseases 0.000 description 2
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 2
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 2
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 2
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 2
- 102100026842 Serine-pyruvate aminotransferase Human genes 0.000 description 2
- 102000004446 Serum Response Factor Human genes 0.000 description 2
- 108010042291 Serum Response Factor Proteins 0.000 description 2
- 102100022831 Somatoliberin Human genes 0.000 description 2
- 101710142969 Somatoliberin Proteins 0.000 description 2
- 102100038803 Somatotropin Human genes 0.000 description 2
- 208000009415 Spinocerebellar Ataxias Diseases 0.000 description 2
- 201000003622 Spinocerebellar ataxia type 2 Diseases 0.000 description 2
- 108091008874 T cell receptors Proteins 0.000 description 2
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 2
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 2
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 2
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 2
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 2
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 2
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 2
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 2
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 2
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 2
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 2
- 102100029152 UDP-glucuronosyltransferase 1A1 Human genes 0.000 description 2
- 102100030434 Ubiquitin-protein ligase E3A Human genes 0.000 description 2
- 101710188886 Ubiquitin-protein ligase E3A Proteins 0.000 description 2
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 2
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 2
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 2
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 2
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 2
- 239000004480 active ingredient Substances 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 238000009098 adjuvant therapy Methods 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 2
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 2
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 229940112869 bone morphogenetic protein Drugs 0.000 description 2
- 229940077737 brain-derived neurotrophic factor Drugs 0.000 description 2
- 229940009550 c1 esterase inhibitor Drugs 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- YCIMNLLNPGFGHC-UHFFFAOYSA-N catechol Chemical compound OC1=CC=CC=C1O YCIMNLLNPGFGHC-UHFFFAOYSA-N 0.000 description 2
- 238000011072 cell harvest Methods 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 229920001577 copolymer Polymers 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003114 enzyme-linked immunosorbent spot assay Methods 0.000 description 2
- 229960004222 factor ix Drugs 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 229940028334 follicle stimulating hormone Drugs 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 239000000122 growth hormone Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 208000017105 hereditary amyloidosis Diseases 0.000 description 2
- 229940084986 human chorionic gonadotropin Drugs 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000006317 isomerization reaction Methods 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 2
- 239000006194 liquid suspension Substances 0.000 description 2
- RLSSMJSEOOYNOY-UHFFFAOYSA-N m-cresol Chemical compound CC1=CC=CC(O)=C1 RLSSMJSEOOYNOY-UHFFFAOYSA-N 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 230000034217 membrane fusion Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000004530 micro-emulsion Substances 0.000 description 2
- 239000004005 microsphere Substances 0.000 description 2
- 201000000585 muscular atrophy Diseases 0.000 description 2
- 201000006938 muscular dystrophy Diseases 0.000 description 2
- 239000002088 nanocapsule Substances 0.000 description 2
- 229940053128 nerve growth factor Drugs 0.000 description 2
- 230000003472 neutralizing effect Effects 0.000 description 2
- 239000002736 nonionic surfactant Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 239000000199 parathyroid hormone Substances 0.000 description 2
- 229960001319 parathyroid hormone Drugs 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- AQIXEPGDORPWBJ-UHFFFAOYSA-N pentan-3-ol Chemical compound CCC(O)CC AQIXEPGDORPWBJ-UHFFFAOYSA-N 0.000 description 2
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 108010084572 phenylalanyl-valine Proteins 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 229940044519 poloxamer 188 Drugs 0.000 description 2
- 229920001451 polypropylene glycol Polymers 0.000 description 2
- 229920000136 polysorbate Polymers 0.000 description 2
- 239000003755 preservative agent Substances 0.000 description 2
- 201000004012 propionic acidemia Diseases 0.000 description 2
- QELSKZZBTMNZEB-UHFFFAOYSA-N propylparaben Chemical compound CCCOC(=O)C1=CC=C(O)C=C1 QELSKZZBTMNZEB-UHFFFAOYSA-N 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 239000013608 rAAV vector Substances 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- GHMLBKRAJCXXBS-UHFFFAOYSA-N resorcinol Chemical compound OC1=CC=CC(O)=C1 GHMLBKRAJCXXBS-UHFFFAOYSA-N 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 208000002320 spinal muscular atrophy Diseases 0.000 description 2
- 238000012289 standard assay Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 231100000041 toxicology testing Toxicity 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 230000003442 weekly effect Effects 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- MFCVASZUOWEOHT-LURJTMIESA-N (2s)-2-amino-4-propylsulfanylbutanoic acid Chemical compound CCCSCC[C@H](N)C(O)=O MFCVASZUOWEOHT-LURJTMIESA-N 0.000 description 1
- FFJCNSLCJOQHKM-CLFAGFIQSA-N (z)-1-[(z)-octadec-9-enoxy]octadec-9-ene Chemical compound CCCCCCCC\C=C/CCCCCCCCOCCCCCCCC\C=C/CCCCCCCC FFJCNSLCJOQHKM-CLFAGFIQSA-N 0.000 description 1
- MBQMFCDFSXXNTI-UHFFFAOYSA-N 1-(2-chloropropan-2-yl)-2-octadecylbenzene Chemical compound CCCCCCCCCCCCCCCCCCC1=CC=CC=C1C(C)(C)Cl MBQMFCDFSXXNTI-UHFFFAOYSA-N 0.000 description 1
- JVKUCNQGESRUCL-UHFFFAOYSA-N 2-Hydroxyethyl 12-hydroxyoctadecanoate Chemical compound CCCCCCC(O)CCCCCCCCCCC(=O)OCCO JVKUCNQGESRUCL-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 1
- 101150079978 AGRN gene Proteins 0.000 description 1
- 102100020973 ATP-binding cassette sub-family D member 3 Human genes 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 102000005606 Activins Human genes 0.000 description 1
- 108010059616 Activins Proteins 0.000 description 1
- 102000002735 Acyl-CoA Dehydrogenase Human genes 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000958487 Adeno-associated virus 3B Species 0.000 description 1
- 102100036664 Adenosine deaminase Human genes 0.000 description 1
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 102100040026 Agrin Human genes 0.000 description 1
- 108700019743 Agrin Proteins 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- BLTRAARCJYVJKV-QEJZJMRPSA-N Ala-Lys-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](Cc1ccccc1)C(O)=O BLTRAARCJYVJKV-QEJZJMRPSA-N 0.000 description 1
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 1
- 108010033918 Alanine-glyoxylate transaminase Proteins 0.000 description 1
- 108010080691 Alcohol O-acetyltransferase Proteins 0.000 description 1
- 102000003966 Alpha-1-microglobulin Human genes 0.000 description 1
- 101800001761 Alpha-1-microglobulin Proteins 0.000 description 1
- 102100026277 Alpha-galactosidase A Human genes 0.000 description 1
- 108010048154 Angiopoietin-1 Proteins 0.000 description 1
- 102000009088 Angiopoietin-1 Human genes 0.000 description 1
- 102000009840 Angiopoietins Human genes 0.000 description 1
- 108010009906 Angiopoietins Proteins 0.000 description 1
- 102400000068 Angiostatin Human genes 0.000 description 1
- 108010079709 Angiostatins Proteins 0.000 description 1
- 108010024284 Apolipoprotein C-II Proteins 0.000 description 1
- 102100039998 Apolipoprotein C-II Human genes 0.000 description 1
- 108010027070 Apolipoproteins C Proteins 0.000 description 1
- 102000018655 Apolipoproteins C Human genes 0.000 description 1
- 102000013918 Apolipoproteins E Human genes 0.000 description 1
- 108010025628 Apolipoproteins E Proteins 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- JTKLCCFLSLCCST-SZMVWBNQSA-N Arg-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JTKLCCFLSLCCST-SZMVWBNQSA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- LOVIQNMIPQVIGT-BVSLBCMMSA-N Arg-Trp-Phe Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)C1=CC=CC=C1 LOVIQNMIPQVIGT-BVSLBCMMSA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 102000053640 Argininosuccinate synthases Human genes 0.000 description 1
- 108700024106 Argininosuccinate synthases Proteins 0.000 description 1
- 208000002109 Argyria Diseases 0.000 description 1
- 240000003291 Armoracia rusticana Species 0.000 description 1
- 235000011330 Armoracia rusticana Nutrition 0.000 description 1
- 102000003823 Aromatic-L-amino-acid decarboxylases Human genes 0.000 description 1
- 108090000121 Aromatic-L-amino-acid decarboxylases Proteins 0.000 description 1
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- PMEHKVHZQKJACS-PEFMBERDSA-N Asp-Gln-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PMEHKVHZQKJACS-PEFMBERDSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 1
- 108010023546 Aspartylglucosylaminase Proteins 0.000 description 1
- 201000001320 Atherosclerosis Diseases 0.000 description 1
- 102100026031 Beta-glucuronidase Human genes 0.000 description 1
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 1
- 102000004506 Blood Proteins Human genes 0.000 description 1
- 108010017384 Blood Proteins Proteins 0.000 description 1
- 241000124740 Bocaparvovirus Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 102000002110 C2 domains Human genes 0.000 description 1
- 108050009459 C2 domains Proteins 0.000 description 1
- 101710186200 CCAAT/enhancer-binding protein Proteins 0.000 description 1
- 102100022002 CD59 glycoprotein Human genes 0.000 description 1
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 1
- 101100074846 Caenorhabditis elegans lin-2 gene Proteins 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 102000004031 Carboxy-Lyases Human genes 0.000 description 1
- 108090000489 Carboxy-Lyases Proteins 0.000 description 1
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 1
- 108090000751 Ceramidases Proteins 0.000 description 1
- 102000004201 Ceramidases Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010053684 Cerebrohepatorenal syndrome Diseases 0.000 description 1
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 101100278103 Chlorobium chlorochromatii (strain CaD3) dnaK gene Proteins 0.000 description 1
- 208000025809 Citrullinemia type II Diseases 0.000 description 1
- 102100026735 Coagulation factor VIII Human genes 0.000 description 1
- 102000055157 Complement C1 Inhibitor Human genes 0.000 description 1
- 102100030886 Complement receptor type 1 Human genes 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 241000723368 Conium Species 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 102100027591 Copper-transporting ATPase 2 Human genes 0.000 description 1
- 108010045171 Cyclic AMP Response Element-Binding Protein Proteins 0.000 description 1
- 102000005636 Cyclic AMP Response Element-Binding Protein Human genes 0.000 description 1
- 102100023580 Cyclic AMP-dependent transcription factor ATF-4 Human genes 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- NBSCHQHZLSJFNQ-QTVWNMPRSA-N D-Mannose-6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@@H]1O NBSCHQHZLSJFNQ-QTVWNMPRSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- 102000001039 Dystrophin Human genes 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 208000005189 Embolism Diseases 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 206010014561 Emphysema Diseases 0.000 description 1
- 208000025127 Erdheim-Chester disease Diseases 0.000 description 1
- 241001481760 Erethizon dorsatum Species 0.000 description 1
- 201000003542 Factor VIII deficiency Diseases 0.000 description 1
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 1
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 1
- 208000024412 Friedreich ataxia Diseases 0.000 description 1
- 102100029115 Fumarylacetoacetase Human genes 0.000 description 1
- 101710198884 GATA-type zinc finger protein 1 Proteins 0.000 description 1
- 201000008892 GM1 Gangliosidosis Diseases 0.000 description 1
- 208000001905 GM2 Gangliosidoses Diseases 0.000 description 1
- 201000008905 GM2 gangliosidosis Diseases 0.000 description 1
- 241001123946 Gaga Species 0.000 description 1
- 208000027472 Galactosemias Diseases 0.000 description 1
- 108010042681 Galactosylceramidase Proteins 0.000 description 1
- 101001066288 Gallus gallus GATA-binding factor 3 Proteins 0.000 description 1
- 208000015872 Gaucher disease Diseases 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 1
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- MQJDLNRXBOELJW-KKUMJFAQSA-N Gln-Pro-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O MQJDLNRXBOELJW-KKUMJFAQSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- KCCNSVHJSMMGFS-NRPADANISA-N Glu-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KCCNSVHJSMMGFS-NRPADANISA-N 0.000 description 1
- 102000051325 Glucagon Human genes 0.000 description 1
- 108060003199 Glucagon Proteins 0.000 description 1
- 102400000322 Glucagon-like peptide 1 Human genes 0.000 description 1
- DTHNMHAUYICORS-KTKZVXAJSA-N Glucagon-like peptide 1 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 DTHNMHAUYICORS-KTKZVXAJSA-N 0.000 description 1
- 108090000079 Glucocorticoid Receptors Proteins 0.000 description 1
- 102100033417 Glucocorticoid receptor Human genes 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 102000004547 Glucosylceramidase Human genes 0.000 description 1
- 108010017544 Glucosylceramidase Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 108010015451 Glutaryl-CoA Dehydrogenase Proteins 0.000 description 1
- 102100028603 Glutaryl-CoA dehydrogenase, mitochondrial Human genes 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 1
- 102000004327 Glycine dehydrogenase (decarboxylating) Human genes 0.000 description 1
- 108090000826 Glycine dehydrogenase (decarboxylating) Proteins 0.000 description 1
- 108010001483 Glycogen Synthase Proteins 0.000 description 1
- 208000032007 Glycogen storage disease due to acid maltase deficiency Diseases 0.000 description 1
- 206010053185 Glycogen storage disease type II Diseases 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- XJQDHFMUUBRCGA-KKUMJFAQSA-N His-Asn-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XJQDHFMUUBRCGA-KKUMJFAQSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 1
- 101150068639 Hnf4a gene Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101001031589 Homo sapiens 2-Hydroxyacid oxidase 1 Proteins 0.000 description 1
- 101100323490 Homo sapiens APOC3 gene Proteins 0.000 description 1
- 101000783770 Homo sapiens ATP-binding cassette sub-family D member 3 Proteins 0.000 description 1
- 101000765010 Homo sapiens Beta-galactosidase Proteins 0.000 description 1
- 101000933465 Homo sapiens Beta-glucuronidase Proteins 0.000 description 1
- 101001045440 Homo sapiens Beta-hexosaminidase subunit alpha Proteins 0.000 description 1
- 101000897400 Homo sapiens CD59 glycoprotein Proteins 0.000 description 1
- 101000721661 Homo sapiens Cellular tumor antigen p53 Proteins 0.000 description 1
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 1
- 101000727061 Homo sapiens Complement receptor type 1 Proteins 0.000 description 1
- 101000936280 Homo sapiens Copper-transporting ATPase 2 Proteins 0.000 description 1
- 101000974934 Homo sapiens Cyclic AMP-dependent transcription factor ATF-2 Proteins 0.000 description 1
- 101000905743 Homo sapiens Cyclic AMP-dependent transcription factor ATF-4 Proteins 0.000 description 1
- 101000860395 Homo sapiens Galactocerebrosidase Proteins 0.000 description 1
- 101000997829 Homo sapiens Glial cell line-derived neurotrophic factor Proteins 0.000 description 1
- 101001122174 Homo sapiens Lipoamide acyltransferase component of branched-chain alpha-keto acid dehydrogenase complex, mitochondrial Proteins 0.000 description 1
- 101000986595 Homo sapiens Ornithine transcarbamylase, mitochondrial Proteins 0.000 description 1
- 101001098868 Homo sapiens Proprotein convertase subtilisin/kexin type 9 Proteins 0.000 description 1
- 101100154772 Homo sapiens TTR gene Proteins 0.000 description 1
- 101000837639 Homo sapiens Thyroxine-binding globulin Proteins 0.000 description 1
- 101000837845 Homo sapiens Transcription factor E3 Proteins 0.000 description 1
- 101000837829 Homo sapiens Transcription factor IIIA Proteins 0.000 description 1
- 101000807820 Homo sapiens V-type proton ATPase subunit S1 Proteins 0.000 description 1
- 238000009015 Human TaqMan MicroRNA Assay kit Methods 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- SHBUUTHKGIVMJT-UHFFFAOYSA-N Hydroxystearate Chemical compound CCCCCCCCCCCCCCCCCC(=O)OO SHBUUTHKGIVMJT-UHFFFAOYSA-N 0.000 description 1
- 208000035150 Hypercholesterolemia Diseases 0.000 description 1
- 208000001021 Hyperlipoproteinemia Type I Diseases 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 1
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical class C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 208000028547 Inborn Urea Cycle disease Diseases 0.000 description 1
- 208000035343 Infantile neurovisceral acid sphingomyelinase deficiency Diseases 0.000 description 1
- 102000002746 Inhibins Human genes 0.000 description 1
- 108010004250 Inhibins Proteins 0.000 description 1
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 1
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 1
- 102000048143 Insulin-Like Growth Factor II Human genes 0.000 description 1
- 108090001117 Insulin-Like Growth Factor II Proteins 0.000 description 1
- 238000012695 Interfacial polymerization Methods 0.000 description 1
- 102000006992 Interferon-alpha Human genes 0.000 description 1
- 108010047761 Interferon-alpha Proteins 0.000 description 1
- 102000003996 Interferon-beta Human genes 0.000 description 1
- 108090000467 Interferon-beta Proteins 0.000 description 1
- 102000008070 Interferon-gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000003815 Interleukin-11 Human genes 0.000 description 1
- 108090000177 Interleukin-11 Proteins 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 102000004889 Interleukin-6 Human genes 0.000 description 1
- 108090001007 Interleukin-8 Proteins 0.000 description 1
- 102000004890 Interleukin-8 Human genes 0.000 description 1
- 108010013792 Isovaleryl-CoA Dehydrogenase Proteins 0.000 description 1
- 102100025392 Isovaleryl-CoA dehydrogenase, mitochondrial Human genes 0.000 description 1
- 101710172072 Kexin Proteins 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- JUWJEAPUNARGCF-DCAQKATOSA-N Leu-Arg-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JUWJEAPUNARGCF-DCAQKATOSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- 102100027064 Lipoamide acyltransferase component of branched-chain alpha-keto acid dehydrogenase complex, mitochondrial Human genes 0.000 description 1
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 1
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- KKFVKBWCXXLKIK-AVGNSLFASA-N Lys-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCCN)N KKFVKBWCXXLKIK-AVGNSLFASA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 1
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- PELXPRPDQRFBGQ-KKUMJFAQSA-N Lys-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O PELXPRPDQRFBGQ-KKUMJFAQSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 208000015439 Lysosomal storage disease Diseases 0.000 description 1
- 101150078498 MYB gene Proteins 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 108030000845 Medium-chain acyl-CoA dehydrogenases Proteins 0.000 description 1
- 101000859568 Methanobrevibacter smithii (strain ATCC 35061 / DSM 861 / OCM 144 / PS) Carbamoyl-phosphate synthase Proteins 0.000 description 1
- 101710169105 Minor spike protein Proteins 0.000 description 1
- 108010064136 Monocyte Chemoattractant Proteins Proteins 0.000 description 1
- 102000014962 Monocyte Chemoattractant Proteins Human genes 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100497386 Mus musculus Cask gene Proteins 0.000 description 1
- 101100335081 Mus musculus Flt3 gene Proteins 0.000 description 1
- 206010028289 Muscle atrophy Diseases 0.000 description 1
- 108010056785 Myogenin Proteins 0.000 description 1
- 102100032970 Myogenin Human genes 0.000 description 1
- 102100030626 Myosin-binding protein H Human genes 0.000 description 1
- 101710139548 Myosin-binding protein H Proteins 0.000 description 1
- 102100021003 N(4)-(beta-N-acetylglucosaminyl)-L-asparaginase Human genes 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- 238000011887 Necropsy Methods 0.000 description 1
- 102000015336 Nerve Growth Factor Human genes 0.000 description 1
- 102000009065 Netrin-1 Human genes 0.000 description 1
- 108010074223 Netrin-1 Proteins 0.000 description 1
- 102000014413 Neuregulin Human genes 0.000 description 1
- 108050003475 Neuregulin Proteins 0.000 description 1
- 108090000556 Neuregulin-1 Proteins 0.000 description 1
- 102100029268 Neurotrophin-3 Human genes 0.000 description 1
- 102100033857 Neurotrophin-4 Human genes 0.000 description 1
- 208000014060 Niemann-Pick disease Diseases 0.000 description 1
- 201000000794 Niemann-Pick disease type A Diseases 0.000 description 1
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- 208000000599 Ornithine Carbamoyltransferase Deficiency Disease Diseases 0.000 description 1
- 206010052450 Ornithine transcarbamoylase deficiency Diseases 0.000 description 1
- 208000035903 Ornithine transcarbamylase deficiency Diseases 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- JVTMTFMMMHAPCR-UBHSHLNASA-N Phe-Ala-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JVTMTFMMMHAPCR-UBHSHLNASA-N 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 1
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 1
- 201000011252 Phenylketonuria Diseases 0.000 description 1
- 208000005746 Phosphoenolpyruvate carboxykinase deficiency Diseases 0.000 description 1
- 102000014750 Phosphorylase Kinase Human genes 0.000 description 1
- 108010064071 Phosphorylase Kinase Proteins 0.000 description 1
- 102000009097 Phosphorylases Human genes 0.000 description 1
- 108010073135 Phosphorylases Proteins 0.000 description 1
- 241000364051 Pima Species 0.000 description 1
- 108050007539 Plasma protease C1 inhibitor Proteins 0.000 description 1
- 229920001214 Polysorbate 60 Polymers 0.000 description 1
- 108010035004 Prephenate Dehydrogenase Proteins 0.000 description 1
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 1
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- JXVXYRZQIUPYSA-NHCYSSNCSA-N Pro-Val-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JXVXYRZQIUPYSA-NHCYSSNCSA-N 0.000 description 1
- 108010044159 Proprotein Convertases Proteins 0.000 description 1
- 102000006437 Proprotein Convertases Human genes 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 102000002067 Protein Subunits Human genes 0.000 description 1
- 208000001647 Renal Insufficiency Diseases 0.000 description 1
- 208000006289 Rett Syndrome Diseases 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 208000021811 Sandhoff disease Diseases 0.000 description 1
- 102100027732 Sarcoplasmic/endoplasmic reticulum calcium ATPase 2 Human genes 0.000 description 1
- 101710109123 Sarcoplasmic/endoplasmic reticulum calcium ATPase 2 Proteins 0.000 description 1
- 101100368917 Schizosaccharomyces pombe (strain 972 / ATCC 24843) taz1 gene Proteins 0.000 description 1
- 241000555745 Sciuridae Species 0.000 description 1
- 102000014105 Semaphorin Human genes 0.000 description 1
- 108050003978 Semaphorin Proteins 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 1
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- WGDYNRCOQRERLZ-KKUMJFAQSA-N Ser-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N WGDYNRCOQRERLZ-KKUMJFAQSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 229920001304 Solutol HS 15 Polymers 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 101001062859 Sus scrofa Fatty acid-binding protein, adipocyte Proteins 0.000 description 1
- 102100040347 TAR DNA-binding protein 43 Human genes 0.000 description 1
- 101710150875 TAR DNA-binding protein 43 Proteins 0.000 description 1
- 208000002903 Thalassemia Diseases 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- JNKAYADBODLPMQ-HSHDSVGOSA-N Thr-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)=CNC2=C1 JNKAYADBODLPMQ-HSHDSVGOSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- 102100026966 Thrombomodulin Human genes 0.000 description 1
- 108010079274 Thrombomodulin Proteins 0.000 description 1
- 108010000499 Thromboplastin Proteins 0.000 description 1
- 102000002262 Thromboplastin Human genes 0.000 description 1
- 208000007536 Thrombosis Diseases 0.000 description 1
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 1
- 101001023030 Toxoplasma gondii Myosin-D Proteins 0.000 description 1
- 108010018242 Transcription Factor AP-1 Proteins 0.000 description 1
- 102100028507 Transcription factor E3 Human genes 0.000 description 1
- 102000006747 Transforming Growth Factor alpha Human genes 0.000 description 1
- 101800004564 Transforming growth factor alpha Proteins 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- PWPJLBWYRTVYQS-PMVMPFDFSA-N Trp-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PWPJLBWYRTVYQS-PMVMPFDFSA-N 0.000 description 1
- RKISDJMICOREEL-QRTARXTBSA-N Trp-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RKISDJMICOREEL-QRTARXTBSA-N 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 102100031988 Tumor necrosis factor ligand superfamily member 6 Human genes 0.000 description 1
- 108050002568 Tumor necrosis factor ligand superfamily member 6 Proteins 0.000 description 1
- 208000007824 Type A Niemann-Pick Disease Diseases 0.000 description 1
- NIHNMOSRSAYZIT-BPNCWPANSA-N Tyr-Ala-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NIHNMOSRSAYZIT-BPNCWPANSA-N 0.000 description 1
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 1
- JFDGVHXRCKEBAU-KKUMJFAQSA-N Tyr-Asp-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JFDGVHXRCKEBAU-KKUMJFAQSA-N 0.000 description 1
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 1
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 1
- YKBUNNNRNZZUID-UFYCRDLUSA-N Tyr-Val-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YKBUNNNRNZZUID-UFYCRDLUSA-N 0.000 description 1
- 108010058532 UTP-hexose-1-phosphate uridylyltransferase Proteins 0.000 description 1
- 102000006321 UTP-hexose-1-phosphate uridylyltransferase Human genes 0.000 description 1
- 102220555598 Urokinase plasminogen activator surface receptor_N57Q_mutation Human genes 0.000 description 1
- 102100037090 V-type proton ATPase subunit S1 Human genes 0.000 description 1
- IRLYZKKNBFPQBW-XGEHTFHBSA-N Val-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N)O IRLYZKKNBFPQBW-XGEHTFHBSA-N 0.000 description 1
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- DOBHJKVVACOQTN-DZKIICNBSA-N Val-Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 DOBHJKVVACOQTN-DZKIICNBSA-N 0.000 description 1
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 description 1
- 208000008383 Wilms tumor Diseases 0.000 description 1
- 201000004525 Zellweger Syndrome Diseases 0.000 description 1
- 208000036813 Zellweger spectrum disease Diseases 0.000 description 1
- ZVQOOHYFBIDMTQ-UHFFFAOYSA-N [methyl(oxido){1-[6-(trifluoromethyl)pyridin-3-yl]ethyl}-lambda(6)-sulfanylidene]cyanamide Chemical compound N#CN=S(C)(=O)C(C)C1=CC=C(C(F)(F)F)N=C1 ZVQOOHYFBIDMTQ-UHFFFAOYSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 239000003070 absorption delaying agent Substances 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 239000000488 activin Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 108060000200 adenylate cyclase Proteins 0.000 description 1
- 102000030621 adenylate cyclase Human genes 0.000 description 1
- 208000031045 adult-onset type II citrullinemia Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- 108010030291 alpha-Galactosidase Proteins 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 102000012086 alpha-L-Fucosidase Human genes 0.000 description 1
- 108010061314 alpha-L-Fucosidase Proteins 0.000 description 1
- 102000019199 alpha-Mannosidase Human genes 0.000 description 1
- 108010012864 alpha-Mannosidase Proteins 0.000 description 1
- 201000008333 alpha-mannosidosis Diseases 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 239000003957 anion exchange resin Substances 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 201000007201 aphasia Diseases 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 201000003554 argininosuccinic aciduria Diseases 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- FZCSTZYAHCUGEM-UHFFFAOYSA-N aspergillomarasmine B Natural products OC(=O)CNC(C(O)=O)CNC(C(O)=O)CC(O)=O FZCSTZYAHCUGEM-UHFFFAOYSA-N 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- UREZNYTWGJKWBI-UHFFFAOYSA-M benzethonium chloride Chemical compound [Cl-].C1=CC(C(C)(C)CC(C)(C)C)=CC=C1OCCOCC[N+](C)(C)CC1=CC=CC=C1 UREZNYTWGJKWBI-UHFFFAOYSA-M 0.000 description 1
- 229960001950 benzethonium chloride Drugs 0.000 description 1
- 102000012740 beta Adrenergic Receptors Human genes 0.000 description 1
- 108010079452 beta Adrenergic Receptors Proteins 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 108010047754 beta-Glucosidase Proteins 0.000 description 1
- 102000006995 beta-Glucosidase Human genes 0.000 description 1
- 108010085377 beta-N-Acetylhexosaminidases Proteins 0.000 description 1
- 102000007478 beta-N-Acetylhexosaminidases Human genes 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- HUTDDBSSHVOYJR-UHFFFAOYSA-H bis[(2-oxo-1,3,2$l^{5},4$l^{2}-dioxaphosphaplumbetan-2-yl)oxy]lead Chemical compound [Pb+2].[Pb+2].[Pb+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O HUTDDBSSHVOYJR-UHFFFAOYSA-H 0.000 description 1
- 229920001400 block copolymer Polymers 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- LRHPLDYGYMQRHN-UHFFFAOYSA-N butyl alcohol Substances CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 1
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 125000003917 carbamoyl group Chemical group [H]N([H])C(*)=O 0.000 description 1
- FFQKYPRQEYGKAF-UHFFFAOYSA-N carbamoyl phosphate Chemical compound NC(=O)OP(O)(O)=O FFQKYPRQEYGKAF-UHFFFAOYSA-N 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 201000004559 cerebral degeneration Diseases 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000002038 chemiluminescence detection Methods 0.000 description 1
- CRQQGFGUEAVUIL-UHFFFAOYSA-N chlorothalonil Chemical compound ClC1=C(Cl)C(C#N)=C(Cl)C(C#N)=C1Cl CRQQGFGUEAVUIL-UHFFFAOYSA-N 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000011260 co-administration Methods 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 235000008504 concentrate Nutrition 0.000 description 1
- 210000004246 corpus luteum Anatomy 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000009295 crossflow filtration Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- HPXRVTGHNJAIIH-UHFFFAOYSA-N cyclohexanol Chemical compound OC1CCCCC1 HPXRVTGHNJAIIH-UHFFFAOYSA-N 0.000 description 1
- ILRYLPWNYFXEMH-UHFFFAOYSA-N cystathionine Chemical compound OC(=O)C(N)CCSCC(N)C(O)=O ILRYLPWNYFXEMH-UHFFFAOYSA-N 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- 239000002612 dispersion medium Substances 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 239000006196 drop Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 229940126534 drug product Drugs 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 238000003366 endpoint assay Methods 0.000 description 1
- 238000002641 enzyme replacement therapy Methods 0.000 description 1
- 108060002566 ephrin Proteins 0.000 description 1
- 102000012803 ephrin Human genes 0.000 description 1
- 206010015037 epilepsy Diseases 0.000 description 1
- 102000015694 estrogen receptors Human genes 0.000 description 1
- 108010038795 estrogen receptors Proteins 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 210000001508 eye Anatomy 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 229940126864 fibroblast growth factor Drugs 0.000 description 1
- 239000013020 final formulation Substances 0.000 description 1
- 108700014844 flt3 ligand Proteins 0.000 description 1
- 201000008049 fucosidosis Diseases 0.000 description 1
- 108010022687 fumarylacetoacetase Proteins 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 1
- 229960004666 glucagon Drugs 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 208000007345 glycogen storage disease Diseases 0.000 description 1
- 201000004502 glycogen storage disease II Diseases 0.000 description 1
- 108010062584 glycollate oxidase Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 210000002149 gonad Anatomy 0.000 description 1
- 239000011544 gradient gel Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 208000009429 hemophilia B Diseases 0.000 description 1
- 210000002767 hepatic artery Anatomy 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 102000053786 human PCSK9 Human genes 0.000 description 1
- 102000048799 human SERPINA7 Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 229920001477 hydrophilic polymer Polymers 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 229940031574 hydroxymethyl cellulose Drugs 0.000 description 1
- 229920003063 hydroxymethyl cellulose Polymers 0.000 description 1
- 229940072106 hydroxystearate Drugs 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 208000026278 immune system disease Diseases 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 229910052738 indium Inorganic materials 0.000 description 1
- 208000027866 inflammatory disease Diseases 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 239000000893 inhibin Substances 0.000 description 1
- ZPNFWUPYTFPOJU-LPYSRVMUSA-N iniprol Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@H]2CSSC[C@H]3C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N[C@@H](CC=4C=CC=CC=4)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC=4C=CC=CC=4)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC2=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CC=2C=CC=CC=2)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H]2N(CCC2)C(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N2[C@@H](CCC2)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N2[C@@H](CCC2)C(=O)N3)C(=O)NCC(=O)NCC(=O)N[C@@H](C)C(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@H](C(=O)N1)C(C)C)[C@@H](C)O)[C@@H](C)CC)=O)[C@@H](C)CC)C1=CC=C(O)C=C1 ZPNFWUPYTFPOJU-LPYSRVMUSA-N 0.000 description 1
- 238000013101 initial test Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- NBQNWMBBSKPBAY-UHFFFAOYSA-N iodixanol Chemical compound IC=1C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C(I)C=1N(C(=O)C)CC(O)CN(C(C)=O)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I NBQNWMBBSKPBAY-UHFFFAOYSA-N 0.000 description 1
- 229960004359 iodixanol Drugs 0.000 description 1
- 208000023589 ischemic disease Diseases 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 150000004715 keto acids Chemical class 0.000 description 1
- 201000006370 kidney failure Diseases 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 208000036546 leukodystrophy Diseases 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 239000006193 liquid solution Substances 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Chemical class 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 235000010270 methyl p-hydroxybenzoate Nutrition 0.000 description 1
- 239000004292 methyl p-hydroxybenzoate Substances 0.000 description 1
- 229960002216 methylparaben Drugs 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 210000002161 motor neuron Anatomy 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000020763 muscle atrophy Effects 0.000 description 1
- 210000004165 myocardium Anatomy 0.000 description 1
- 239000002086 nanomaterial Substances 0.000 description 1
- 239000002077 nanosphere Substances 0.000 description 1
- 150000002790 naphthalenes Chemical class 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000004766 neurogenesis Effects 0.000 description 1
- 239000003900 neurotrophic factor Substances 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 108700007229 noggin Proteins 0.000 description 1
- 102000045246 noggin Human genes 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 108020004017 nuclear receptors Proteins 0.000 description 1
- 230000009438 off-target cleavage Effects 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 201000011278 ornithine carbamoyltransferase deficiency Diseases 0.000 description 1
- LXCFILQKKLGQFO-UHFFFAOYSA-N p-hydroxybenzoic acid methyl ester Natural products COC(=O)C1=CC=C(O)C=C1 LXCFILQKKLGQFO-UHFFFAOYSA-N 0.000 description 1
- 230000001314 paroxysmal effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 1
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 1
- 102000005681 phospholamban Human genes 0.000 description 1
- 108010059929 phospholamban Proteins 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920003229 poly(methyl methacrylate) Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920001515 polyalkylene glycol Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 239000004926 polymethyl methacrylate Substances 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- GCYXWQUSHADNBF-AAEALURTSA-N preproglucagon 78-108 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 GCYXWQUSHADNBF-AAEALURTSA-N 0.000 description 1
- 208000000891 primary hyperoxaluria type 1 Diseases 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 235000010232 propyl p-hydroxybenzoate Nutrition 0.000 description 1
- 239000004405 propyl p-hydroxybenzoate Substances 0.000 description 1
- 229960003415 propylparaben Drugs 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 102200104664 rs121908724 Human genes 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 102000014452 scavenger receptors Human genes 0.000 description 1
- 108010078070 scavenger receptors Proteins 0.000 description 1
- 108010060800 serine-pyruvate aminotransferase Proteins 0.000 description 1
- 239000012679 serum free medium Substances 0.000 description 1
- 208000002491 severe combined immunodeficiency Diseases 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000007447 staining method Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 239000012609 strong anion exchange resin Substances 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000005495 thyroid hormone Substances 0.000 description 1
- 229940036555 thyroid hormone Drugs 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 201000007905 transthyretin amyloidosis Diseases 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- PIEPQKCYPFFYMG-UHFFFAOYSA-N tris acetate Chemical compound CC(O)=O.OCC(N)(CO)CO PIEPQKCYPFFYMG-UHFFFAOYSA-N 0.000 description 1
- 102000003390 tumor necrosis factor Human genes 0.000 description 1
- 201000007972 tyrosinemia type I Diseases 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 208000030954 urea cycle disease Diseases 0.000 description 1
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 102000009310 vitamin D receptors Human genes 0.000 description 1
- 108050000156 vitamin D receptors Proteins 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/465—Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
- C12N15/861—Adenoviral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Cell Biology (AREA)
- Virology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Immunology (AREA)
- Pharmacology & Pharmacy (AREA)
- Gastroenterology & Hepatology (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
유전자 편집화 뉴클레아제 발현 카세트로서, 숙주 세포로의 전달 이후에 뉴클레아제의 발현을 안내하는 조절 서열에 작동가능하게 연결된 뉴클레아제 코딩 서열을 포함하는 핵산 서열을 포함하고, 조절 서열은 약한 프로모터를 포함하는, 뉴클레아제 발현 카세트가 제공된다. 유전자 편집화 뉴클레아제 발현 카세트를 포함하는 벡터가 제공된다. 또한, 이를 포함하는 조성물 및 사용 방법이 제공된다.
Description
기능부전 유전자를 편집하기 위한 조작된 뉴클레아제의 용도가 기술되어 왔다. 이러한 뉴클레아제의 AAV 매개된 전달도 역시 기술된 바 있었다. 그러나, 뉴클레아제의 AAV 매개된 전달은 반복된 재투여가 요구되지 않으면서도, 생성된 뉴클레아제는 벡터 형질도입 이후에 표적 조직에서 계속적으로 발현되고, 이것이 면역 반응 및 세포 독성을 유도할 수 있다.
또한, 시험관내 및 생체내 연구는 뉴클레아제가 전달 비히클과 상관없이, 게놈의 다른 영역에서 표적-외 활성을 나타내는 인델 (삽입 및 결실)을 생성하는 것을 확인하였다. 이러한 표적-외 활성은 바람직하지 않으며, 특히 임상 연구에서는 표적-내 효능을 유지하면서 이러한 표적-외 활성을 감소시키거나 제거하는 것이 필수적이다.
유전자 편집화를 위한 개선된 조성물 및 방법이 필요하다.
일 양태에서, 유전자 편집화 뉴클레아제 발현 카세트가 제공된다. 일 구현예에서, 발현 카세트는 뉴클레아제가 표적화되는 서열을 갖는 숙주 세포로의 전달 이후에 뉴클레아제의 발현을 안내하는 조절 서열에 작동가능하게 연결된 뉴클레아제 코딩 서열을 포함하는 핵산 서열을 포함하고, 조절 서열은 낮은 전사 활성을 갖는 프로모터를 포함한다. 일 구현예에서, 프로모터는 간-특이적 프로모터이다. 또 다른 구현예에서, 프로모터는 TBG-S1 프로모터 변이체이다. 또 다른 구현예에서, 프로모터는 TBG-S1-F64이다. 또 다른 구현예에서, 프로모터는 TBG-S1-F113이다. 또 다른 구현예에서, 프로모터는 TBG-S1-F140이다. 또 다른 구현예에서, 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 프로모터는 SCLC22A9 프로모터이다. 또 다른 구현예에서, 프로모터는 CYP26A1 프로모터이다. 또 다른 구현예에서, 뉴클레아제는 메가뉴클레아제, CRISPR/Cas 뉴클레아제, 아연 핑거 뉴클레아제 또는 TALEN이다.
또 다른 양태에서, 유전자 편집화에 유용한 재조합 AAV이 제공된다. rAAV는 AAV 캡시드 및 AAV 캡시드에 포장된 벡터 게놈을 포함하고, 벡터 게놈은 본원에 기술된 발현 카세트, 및 발현 카세트를 캡시드 내에 포장하는데 필요한 AAV 역전된 말단 반복서열을 포함한다.
또 다른 양태에서, 표적화된 유전자를 편집하는 방법이 제공된다. 방법은 본원에 기술된 뉴클레아제 발현 카세트, 조성물 또는 바이러스성 벡터를 대상체에게 전달하는 단계를 포함한다.
또 다른 양태에서, 유전자 표적화 뉴클레아제의 표적-외 활성을 감소시키는 방법이 제공된다. 방법은 본원에 기술된 뉴클레아제 발현 카세트, 조성물 또는 바이러스성 벡터를 대상체에게 전달하는 단계를 포함한다.
또 다른 양태에서, 신규한 "약한 프로모터"가 제공된다. 또 다른 구현예에서, 프로모터는 TBG-S1-F64이다. 또 다른 구현예에서, 프로모터는 TBG-S1-F113이다. 또 다른 구현예에서, 프로모터는 TBG-S1-F140이다. 또 다른 구현예에서, 프로모터는 서열번호 6의 서열을 포함한다, 또 다른 구현예에서, 프로모터는 서열번호 7의 서열을 포함한다, 또 다른 구현예에서, 프로모터는 서열번호 8의 서열을 포함한다,
또 다른 양태에서, 본원에 기술된 뉴클레아제 발현 카세트, 조성물 또는 바이러스성 벡터를 포함하는 약제학적 조성물이 제공된다. 조성물은 담체, 현탁제 및/또는 부형제 중 하나 이상을 포함한다.
본 발명의 다른 양태 및 장점은 하기 본 발명의 상세한 설명으로부터 자명해질 것이다.
도 1은 실시예 1에서 사용된 벡터에 대한 "약한 프로모터"를 포함하는 AAV 구조물의 모식적 예시를 나타낸다 (도 2 내지 도 5에 도시된 데이터). 프로모터: 인간 타이록신 결합 글로불린 (TBG) 유전자의 단축된 버전, 또는 간 농축된 유전자의 프로모터 서열로부터 유래됨: CCL16, CYP26A1 또는 SLC22A9 (인간 단백질 아틀라스 데이터베이스를 사용하여 확인됨). M2PCSK9: 인간 PCSK9 유전자의 22개 bp 서열을 표적하는 조작된 I-CreI 메가뉴클레아제 (ARCUS 메가뉴클레아제로 때로 지칭됨). 폴리 A: 소 성장호르몬 폴리아데닐화 신호.
도 2a는 차세대 시퀸싱 검정법에 의해 정량화된, ARCUS 메가뉴클레아제의 표적 서열에 상응하는 영역에서 AAV 처리후 7주째 인델 수준을 나타낸다. 선형 척도.
도 2b는 도 2a와 동일한 수준을 나타낸다. 로그 척도.
도 2c는 ELISA 검정법에 의해 결정되는, 처리군 당 혈청에서 재조합 PCSK9의 9주째 평균 수준을 나타낸다.
도 3은 ITR-Seq로 불리는 NGS 기반의 방법을 사용하여 결정된 바, 뉴클레아제 활성의 결과로서 게놈 DNA에서 표적-외 좌위의 수를 나타낸다.
도 4는 확인된 외부 표적에 해당하는 게놈 위치 세트에서 인델을 나타낸다. 각 외부 표적에 대한 인델 수준을 TBG 대조군의 인델 수준 (임의 값 1)과 비교하여 나타낸다.
도 5는 실시예 1에서 테스트된 벡터에서 처리 이후 7주째 hPCSK9 수준을 (기저선의 백분율로서) 나타낸다.
도 6 내지 도 10은 실시예 2에 기술된 NHP 파일럿 연구에 대한 데이터를 나타낸다. NHP에게 6 × 1012 GS/kg의 지시된 벡터를 주사하였다. 간 생검을 18일 및 128일째 수행하고, DNA/RNA 분석을 차세대 시퀸싱에 의한 표적-내 및 표적-외 게놈 편집화를 검출하도록 시행하였다. 도 7 내지 도 10에 나타낸 일부 데이터의 요약은 도 6에 나타낸다. 인델% (도 7) 및 외부 표적의 수 (도 8)를 AAV 처리후 18일째 간 생검으로부터의 DNA에서 결정하였다. PCSK9 수준 (기저성의 백분율로서)은 도 9에 나타낸다 (AAV 처리후 7주). LDL 수준 (기저성의 백분율로서)은 도 10에 나타낸다.
도 11은 실시예 3에 기술된 NHP 약제/독성 연구의 모식도를 나타낸다.
도 12는 본원에 기술된 TBG-S1 프로모터, 및 F64, F113 및 F140 프로모터의 서열 정렬을 나타낸다.
도 2a는 차세대 시퀸싱 검정법에 의해 정량화된, ARCUS 메가뉴클레아제의 표적 서열에 상응하는 영역에서 AAV 처리후 7주째 인델 수준을 나타낸다. 선형 척도.
도 2b는 도 2a와 동일한 수준을 나타낸다. 로그 척도.
도 2c는 ELISA 검정법에 의해 결정되는, 처리군 당 혈청에서 재조합 PCSK9의 9주째 평균 수준을 나타낸다.
도 3은 ITR-Seq로 불리는 NGS 기반의 방법을 사용하여 결정된 바, 뉴클레아제 활성의 결과로서 게놈 DNA에서 표적-외 좌위의 수를 나타낸다.
도 4는 확인된 외부 표적에 해당하는 게놈 위치 세트에서 인델을 나타낸다. 각 외부 표적에 대한 인델 수준을 TBG 대조군의 인델 수준 (임의 값 1)과 비교하여 나타낸다.
도 5는 실시예 1에서 테스트된 벡터에서 처리 이후 7주째 hPCSK9 수준을 (기저선의 백분율로서) 나타낸다.
도 6 내지 도 10은 실시예 2에 기술된 NHP 파일럿 연구에 대한 데이터를 나타낸다. NHP에게 6 × 1012 GS/kg의 지시된 벡터를 주사하였다. 간 생검을 18일 및 128일째 수행하고, DNA/RNA 분석을 차세대 시퀸싱에 의한 표적-내 및 표적-외 게놈 편집화를 검출하도록 시행하였다. 도 7 내지 도 10에 나타낸 일부 데이터의 요약은 도 6에 나타낸다. 인델% (도 7) 및 외부 표적의 수 (도 8)를 AAV 처리후 18일째 간 생검으로부터의 DNA에서 결정하였다. PCSK9 수준 (기저성의 백분율로서)은 도 9에 나타낸다 (AAV 처리후 7주). LDL 수준 (기저성의 백분율로서)은 도 10에 나타낸다.
도 11은 실시예 3에 기술된 NHP 약제/독성 연구의 모식도를 나타낸다.
도 12는 본원에 기술된 TBG-S1 프로모터, 및 F64, F113 및 F140 프로모터의 서열 정렬을 나타낸다.
본원에 제공된 조성물 및 방법은 지속적으로 발현된 효소의 (예로, 발현 카세트의 전달 이후에) 더 낮은 발현을 생성하거나 표적-외 활성을 최소화하고/거나, 발현 효소의 활성을 조정하도록 설계된다. 세포에 축적될 수 있는 분비되지 않는 효소 또는 분비되기 이전에 바람직한 수준 이상으로 높게 축적되는 효소를 갖는 이러한 조성물 및 방법의 사용이 바람직하다. 본 발명의 조성물 및 방법은 유전자 편집화 효소, 구체적으로 메가뉴클레아제를 사용하는데 잘 맞추어져 있다. 그러나, 당업자에게라면 다른 적용도 자명할 것이다.
낮은 전사 프로모터 ("약한" 프로모터)
일 양태에서, 낮은 전사 활성을 갖는 신규한 프로모터 또는 약한 프로모터가 제공된다. 본원에 사용된 용어 "낮은 전사 활성을 갖는 프로모터" 또는 "약한 프로모터"는 코딩 서열의 낮은 발현 수준을 생성하는 발현 조절 서열을 말한다. 일 구현예에서, 용어 "낮은 전사 활성"은 기준 "강한 프로모터"에 의해 유도된 수준보다 낮은 전사 수준을 말한다. 일 구현예에서, 기준 강한 프로모터는 타이록신 결합 글로불린 (TBG) 프로모터 또는 TBG-S1 프로모터이다. 다른 기준 "강한" 프로모터는 당해 기술분야에 공지되어 있다.
일 구현예에서, 프로모터는 간-특이적 타이록신 결합 글로불린 (TBG) 프로모터의 약화된 버전이다. 일 구현예에서, 약한 프로모터는 고유의 프로모터 또는 TBG-S1 서열의 5' 또는 3' 말단에서 절단된다. 일 구현예에서, 프로모터는 TBG-S1 프로모터로부터 3' 말단의 64개 뉴클레오티드만을 보유하고, F64로 명명된다 (TBG-S1-F64로도 불림)(서열번호 6). 또 다른 구현예에서, 프로모터는 TBG-S1 프로모터로부터 3' 말단의 113개 뉴클레오티드만을 보유하고, F113으로 명명된다 (TBG-S1-F113으로도 불림)(서열번호 7). 일 구현예에서, 프로모터는 TBG-S1 프로모터로부터 3' 말단의 140개 뉴클레오티드만을 보유하고, F140으로 명명된다 (TBG-S1-F140으로도 불림)(서열번호 8). TBG-S1, F64, F113 및 F140 서열의 정렬은 도 12에 나타낸다. 일 구현예에서, 프로모터는 서열번호 6과 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유한다. 일 구현예에서, 프로모터는 서열번호 7과 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유한다. 일 구현예에서, 프로모터는 서열번호 8과 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유한다.
다른 구현예에서, 본원에 유용한 약한 프로모터는 공지된 프로모터를 포함한다. 일 구현예에서, 약한 프로모터는 CCL16 프로모터 (서열번호 3)이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터 (서열번호 4)이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터 (서열번호 5)이다.
발현 카세트 및 벡터
또 다른 양태에서, 발현 카세트가 제공된다. 일 구현예에서, 발현 카세트는 본원에 기술된 바와 같이, 코딩 서열에 작동가능하게 연결된 약한 프로모터를 포함한다. 일 구현예에서, 발현 카세트는 본원에 기술된 바와 같이, 낮은 전사 활성을 갖는 프로모터를 포함하는 조절 서열의 제어 하에 뉴클레아제에 대한 코딩 서열을 포함한다. 또 다른 양태에서, 발현 카세트 (및 프로모터)를 포함하는 벡터가 제공된다.
본원의 실시예는 벡터 게놈에서 낮은 전사 활성을 갖는 프로모터 (약한 프로모터)를 포함하는 AAV 벡터의 사용을 설명하고 있다. 그러나, 약한 프로모터의 사용은 AAV 구조물에 한정되지 않으며, 다른 벡터에 사용될 수 있다. 특정 구현예에서, 벡터 게놈은 상이한 벡터 (예로, 재조합 보카바이러스) 내에 포장될 수 있다. 특정 구현예에서, 발현 카세트는 상이한 바이러스성 벡터 내에, 비-바이러스성 벡터 내에 및/또는 상이한 전달 시스템 내에 포장될 수 있다. 적합하게, 트랜스 유전자에 대한 코딩 서열은 효소에 대한 표적 부위를 포함하는 세포에서 약한 프로모터를 포함한 조절 요소에 작동가능하게 연결되도록 발현 카세트 내에 조작된다.
본원에 사용된 바, "발현 카세트"는 코딩 서열 (또는 트랜스 유전자) 및 프로모터를 포함하는 핵산 분자를 말하고, 다른 조절 서열을 포함할 수 있으며, 따라서 카세트는 유전 요소 내에 조작되고/거나 바이러스성 벡터의 캡시드 (예로, 바이러스 입자) 내에 포장될 수 있다. 전형적으로, 바이러스성 벡터를 생성하기 위한 이러한 발현 카세트는 본원에 기술된 바이러스 게놈의 포장 신호에 연접되는 서열 및 본원에 기술된 것과 같은 기타 발현 조절 서열을 포함한다. 트랜스 유전자는 트랜스 유전자에 연접된 벡터 서열에 이종유래 핵산 서열이고, 이는 관심있는 폴리펩티드, 단백질 또는 기타 산물을 인코딩한다. 핵산 코딩 서열은 표적 세포에서 트랜스 유전자의 전사, 번역 및/또는 발현을 허용하는 방식으로 조절 구성요소에 작동가능하게 연결된다. 이종유래 핵산 서열 (트랜스 유전자)은 임의의 유기체로부터 유래할 수 있다. AAV는 하나 이상의 트랜스 유전자를 포함할 수 있다. 본원에서는 유전자 편집화 뉴클레아제 (구체적으로, 메가뉴클레아제)와 조합한 본원에 기술된 약한 프로모터의 사용이 예시된다. 그러나, 약한 프로모터는 더 낮은 발현 및/또는 짧은 프로모터 서열이 바람직한 임의의 발현 카세트 내에 도입될 수 있다.
일 구현예에서, 코딩 서열은 메가뉴클레아제, 아연 핑거 뉴클레아제, 전사 활성인자 유사 (TAL) 효과기 뉴클레아제 (TALEN), 및 군집화된 규칙적 간격의 짧은 팰린드롬 반복서열 (CRISPR)/엔도뉴클레아제 (Cas9, Cpf1 등)으로부터 선택된 뉴클레아제를 인코딩한다. 적합한 메가뉴클레아제의 예는, 예로 미국 특허 제 US 8,445,251; 제 US 9,340,777호; 제 US 9,434,931호; 제 US 9,683,257호 및 국제특허출원 제 WO 2018/195449호에 기재되어 있다. 기타 적합한 효소로는 핵산 프로그램된 방식으로 RNA에 결합할 수 있는 뉴클레아제 불활성 S. 파이오제네스 CRISPR/Cas9 (Nelles et al., Programmable RNA Tracking in Live Cells with CRISPR/Cas9, Cell, 165(2): P488-96 (2016년 4월)), 및 염기 편집기 (예로, Levy et al.. Cytosine and adenine base editing of the brain, liver, retina, heart and skeletal muscle of mice via adeno-associated viruses, Nature Biomedical Engineering, 4: 97-110 (2020년 1월))를 포함한다. 특정 구현예에서, 뉴클레아제는 아연 핑거 뉴클레아제가 아니다. 특정 구현예에서, 뉴클레아제는 CRISPR 관련 뉴클레아제가 아니다. 특정 구현예에서, 뉴클레아제는 TALEN이 아니다. 일 구현예에서, 뉴클레아제는 메가뉴클레아제가 아니다.
특정 구현예에서, 뉴클레아제는 귀소 엔도뉴클레아제의 LAGLIDADG (서열번호 1) 패밀리의 구성원이다. 특정 구현예에서, 뉴클레아제는 22개 염기쌍 인식 서열, 서열번호 2 (CAAAACGTCGTGAGACAGTTTG)를 인식하여 절단하는 귀소 엔도뉴클레아제의 I-CreI 패밀리의 구성원이다. 예로, 국제특허출원 제 WO 2009/059195호 참조. 단일-LAGLIDADG 귀소 엔도뉴클레아제를 합리적으로 설계하는 방법은 기술되어 있으며, 이는 I-CreI 및 다른 귀소 엔도뉴클레아제를 광범위하게 재설계하여 포유동물, 효모, 식물, 세균 및 바이러스 게놈에 있는 부위를 포함한 매우 다양한 DNA 부위를 표적시킬 수 있다 (국제특허출원 제 WO 2007/047859호). 일 구현예에서, 뉴클레아제는 서열번호 15의 뉴클레오티드 1089번 내지 2183번에 나타낸 서열에 의해 인코딩되는 뉴클레아제가 아니다. 일 구현예에서, 뉴클레아제는 서열번호 16에 나타낸 단백질 서열이 아니다.
본 발명의 목적 중 하나는 뉴클레아제의 강한 표적-내 활성을 저하시키지 않고도 이의 표적-외 활성을 감소시키는 것이다. 형질도입된 세포에서 뉴클레아제의 높은 발현이 표적 DNA 서열의 편집화를 달성하는데 요구되지 않고, 표적-외 활성이 세포에서 뉴클레아제의 축적 상승으로부터 생성되는 것으로 가설을 세웠다. 뉴클레아제 발현을 감소시키기 위하여, 높게 발현하는 프로모터는 더 낮은 전사 활성을 갖는 프로모터로 대체되었다. 따라서, 발현 카세트는 발현 제어 서열 또는 조절 서열의 일부로서 프로모터 서열을 포함한다. 본원에 기술된 바, 프로모터는 더 낮은 전사 활성을 갖는 프로모터 또는 "약한 프로모터"이다.
일 구현예에서, 약한 프로모터는 CCL16 프로모터 (서열번호 3)이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터 (서열번호 4)이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터 (서열번호 5)이다.
또한, 또 다른 구현예에서, 프로모터는 조직 특이적 프로모터의 약화된 버전이다. 일 예에서, 조직 특이적 프로모터는 간-특이적 타이록신 결합 글로불린 (TBG) 프로모터이다. 일 구현예에서, 약한 프로모터는 고유의 프로모터 또는 TBG-S1 서열의 5' 또는 3' 말단에서 절단된다. 일 구현예에서, 프로모터는 TBG-S1 프로모터로부터 3' 말단의 64개 뉴클레오티드만을 보유하고, F64로 명명된다 (서열번호 6). 일 구현예에서, 프로모터는 TBG-S1 프로모터로부터 3' 말단의 113개 뉴클레오티드만을 보유하고, F113으로 명명된다 (서열번호 7). 일 구현예에서, 프로모터는 TBG-S1 프로모터로부터 3' 말단의 140개 뉴클레오티드만을 보유하고, F140으로 명명된다 (서열번호 8).
프로모터에 추가하여, 발현 카세트 및/또는 벡터는 하나 이상의 적절한 "조절 요소" 또는 "조절 서열"을 포함할 수 있으며, 이는 인핸서; 전사인자; 전사 종결인자; 스플라이싱 및 폴리아데닐화 신호 (폴리 A)와 같은 효율적인 RNA 가공 신호; 세포질 mRNA를 안정화하는 서열, 예를 들면 마못류 간염 바이러스 (WHP) 전사후 조절 요소 (WPRE); 번역 효율을 증진시키는 서열 (즉, 코작 공통 서열); 단백질 안정성을 증진시키는 서열; 및 바람직할 때 인코딩된 산물의 분비를 증진시키는 서열을 포함하나 이에 한정되지 않는다. 적합한 폴리 A 서열의 예로는, 예로 SV40, SV50, 소 성장호르몬 (bGH) 및 TK 폴리 A를 포함한다. 적합한 인핸서의 예로는 특히, 예로 알파 태아단백질 인핸서, TTR 최소 프로모터/인핸서, LSP (TH-결합 글로불린 프로모터/알파 1-마이크로글로불린/바이쿠닌 인핸서)를 포함한다. 이러한 제어 서열 또는 조절 서열은 뉴클레아제 코딩 서열에 작동가능하게 연결된다.
특정 구현예에서, 약한 프로모터, 이를 포함하는 구조물 및 본원에 기술된 방법은 간 안내된 요법을 표적하는데 유용하다. 따라서, 간 발현된 유전자, 뿐만 아니라 이들 유전자 또는 이들에 연접된 서열에 표적화된 뉴클레아제는 유용하다. 간 발현된 유전자는 이에 한정되지 않고도 전구단백질 전환효소 섭틸리신/제 9형 켁신 (PCSK9) (콜레스테롤 관련 장애), 트랜스타이레틴 (TTR) (트랜스타이레틴 아밀로이드증), HAO, 아포지단백질 C-Ⅲ (APOC3), 인자 Ⅷ, 인자 Ⅸ, 저밀도 지질단백질 수용체 (LDLr), 지질단백질 리파제 (LPL) (지질단백질 리파제 결핍), 레시틴-콜레스테롤 아실전이효소 (LCAT), 오르니틴 트랜스카바밀라제 (OTC), 카르노시나제 (CN1), 스핑고미엘린 포스포디에스테라제 (SMPD1) (니에만-픽 질환), 하이폭산틴-구아닌 포스포리보실전이효소 (HGPRT), 분지쇄 알파-케토산 탈수소효소 복합체 (BCKDC) (단풍시럽뇨병), 에리트로포이에틴 (EPO), 카바밀 포스페이트 합성효소 (CPS1), N-아세틸글루타메이트 합성효소 (NAGS), 아르기니노숙신산 합성효소 (시트룰린혈증), 아르기니노숙시네이트 분해효소 (ASL) (아르기니노숙신산 뇨증) 및 아르기나제 (AG)를 포함한다.
특정 구현예에서, rAAV가 유전자 편집화 시스템에 사용될 수 있고, 여기서 시스템은 하나의 rAAV 또는 다수의 rAAV 스톡의 공동-투여가 관여될 수 있다. 예를 들면, rAAV는 SpCas9, SaCas9, ARCUS, Cpf1 및 다른 적합한 유전자 편집화 구조물을 전달하도록 조작될 수 있다.
일 구현예에서, 약한 프로모터에 작동가능하게 연결된 PCSK9 메가뉴클레아제를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCl16이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1이다. 특정 구현예에서, 메가뉴클레아제는 국제특허출원 제 WO 2018/195449A1호에 기술된 메가뉴클레아제로부터 선택될 수 있다. 일 구현예에서, 핵산 분자는 서열번호 15 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 뉴클레오티드 1089번 내지 2183번의 PCSK9 메가뉴클레아제 코딩 서열에 작동가능하게 연결된 F113 프로모터를 포함한다. 일 구현예에서, 핵산 분자는 서열번호 16 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 PCSK9 메가뉴클레아제를 인코딩하는 서열에 작동가능하게 연결된 F113 프로모터를 포함한다.
또 다른 구현예에서, 핵산 분자는 서열번호 15 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 뉴클레오티드 1089번 내지 2183번의 PCSK9 메가뉴클레아제 코딩 서열에 작동가능하게 연결된 F64 프로모터를 포함한다. 일 구현예에서, 핵산 분자는 서열번호 16 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 PCSK9 메가뉴클레아제를 인코딩하는 서열에 작동가능하게 연결된 F64 프로모터를 포함한다.
또 다른 구현예에서, 핵산 분자는 서열번호 15 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 뉴클레오티드 1089번 내지 2183번의 PCSK9 메가뉴클레아제 코딩 서열에 작동가능하게 연결된 F140 프로모터를 포함한다. 일 구현예에서, 핵산 분자는 서열번호 16 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 PCSK9 메가뉴클레아제를 인코딩하는 서열에 작동가능하게 연결된 F140 프로모터를 포함한다.
또 다른 구현예에서, 핵산 분자는 서열번호 15 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 뉴클레오티드 1089번 내지 2183번의 PCSK9 메가뉴클레아제 코딩 서열에 작동가능하게 연결된 SLC22A9 프로모터를 포함한다. 일 구현예에서, 핵산 분자는 서열번호 16 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 PCSK9 메가뉴클레아제를 인코딩하는 서열에 작동가능하게 연결된 SLC22A9 프로모터를 포함한다.
또 다른 구현예에서, 핵산 분자는 서열번호 15 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 뉴클레오티드 1089번 내지 2183번의 PCSK9 메가뉴클레아제 코딩 서열에 작동가능하게 연결된 CCL16 프로모터를 포함한다. 일 구현예에서, 핵산 분자는 서열번호 16 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 PCSK9 메가뉴클레아제를 인코딩하는 서열에 작동가능하게 연결된 CCL16 프로모터를 포함한다.
또 다른 구현예에서, 핵산 분자는 서열번호 15 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 뉴클레오티드 1089번 내지 2183번의 PCSK9 메가뉴클레아제 코딩 서열에 작동가능하게 연결된 CYP26A1 프로모터를 포함한다. 일 구현예에서, 핵산 분자는 서열번호 16 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 PCSK9 메가뉴클레아제를 인코딩하는 서열에 작동가능하게 연결된 CYP26A1 프로모터를 포함한다.
일 구현예에서, 약한 프로모터에 작동가능하게 연결된 TTR 메가뉴클레아제를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다.
일 구현예에서, 약한 프로모터에 작동가능하게 연결된 HAO 메가뉴클레아제를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다.
일 구현예에서, 약한 프로모터에 작동가능하게 연결된 BCKDC 메가뉴클레아제를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다.
일 구현예에서, 약한 프로모터에 작동가능하게 연결된 APOC3 메가뉴클레아제를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다.
일 구현예에서, 약한 프로모터에 작동가능하게 연결된 CRISPR/Cas9 뉴클레아제를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 일 구현예에서, 본원에 기술된 프로모터, 카세트 및 rAAV는 본원에 참고문헌으로 통합되는 국제특허출원 제 WO 2016/176191호에 기술된 CRISPR/Cas9 이중 벡터 시스템에 유용하다.
또 다른 구현예에서, 트랜스 유전자는 유전자 교정 요법의 용도를 위해 선택된다. 이것은 외인성 DNA 공여체 기질과 조합한, 예로 아연 핑거 뉴클레아제 (ZFN) 유도된 DNA 이중가닥 파손을 사용하여 달성될 수 있다. 예로, 본원에 참고문헌으로 통합되는 Ellis et al., Gene Therapy (epub 2012년 1월) 20: 35-42 참조. 당업자라면 원하는 결과를 기초로 하여 트랜스 유전자를 쉽게 선택할 수 있다.
일 구현예에서, 약한 프로모터에 작동가능하게 연결된 아연 핑커 뉴클레아제를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다.
일 구현예에서, 약한 프로모터에 작동가능하게 연결된 전사 활성인자 유사 효과기 뉴클레아제 (TALEN)를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다.
트랜스 유전자에 의해 인코딩되는 다른 유용한 산물은 결함 또는 결핍 유전자를 대체하거나, 바람직하지 않게 높은 수준으로 발현하고 있는 유전자의 발현을 불활성화하거나, "녹아웃" 또는 "녹다운"시키거나, 감소시키거나, 바람직한 치료 효과를 갖는 유전자 산물을 전달하는 다양한 유전자 산물을 포함한다. 일부 구현예에서, 치료법은 "체세포 유전자 요법", 즉 정자 또는 난자를 생산하지 않는 신체의 세포 내로 유전자의 전달일 것이다. 특정 구현예에서, 트랜스 유전자는 고유의 인간 서열의 서열을 갖는 단백질을 발현한다. 그러나, 다른 구현예에서, 합성 단백질이 발현된다. 이러한 단백질은 인간의 치료를 목적으로 하거나, 다른 구현예에서, 개 또는 고양이 집단과 같은 반려 동물을 포함한 동물의 치료를 위해, 또는 인간 집단과 접촉하는 가축 또는 기타 동물의 치료를 위해 설계될 수 있다.
적합한 유전자 산물의 예는 가족성 고콜레스테롤혈증, 근육 위축증, 낭성 섬유증 및 드문 희귀 질환과 관련된 유전자 산물을 포함할 수 있다. 이러한 희귀 질환의 예는 특히 척수 근육 위축증 (SMA), 헌팅턴병, 레트 증후군 (예로, 메틸-CpG-결합 단백질 2 (MeCP2); 유니플로트 KB - P51608), 근위축 측삭 경화증 (ALS), 듀첸 유형 근육 위축증, 프리드리히 실조증 (예로, 프라탁신), 제 2형 척수소뇌 실조증 (SCA2)/ALS와 관련된 ATXN2, ALS와 관련된 TDP-43, 프로그래눌린 (PRGN) (전두측두엽 치매 (FTD), 진행성 어눌한 실어증 (PNFA) 및 언어 치매를 포함하는 비-알츠하이머성 뇌 퇴화와 관련됨)을 포함할 수 있다. 예로, www.orpha.net/consor/cgi-bin/Disease_Search_List.php 참조.
적합한 유전자의 예는, 예로 인슐린, 글루카곤, 글루카곤 유사 펩티드-1 (GLP1), 성장호르몬 (GH), 부갑상샘 호르몬 (PTH), 성장호르몬 방출인자 (GRF), 난포 자극호흐몬 (FSH), 황체형성 호르몬 (LH), 인간 융모 생식샘자극호르몬 (hCG), 혈관 내피 성장인자 (VEGF), 엔지오포이에틴, 엔지오스타틴, 과립구 콜로니 자극인자 (GCSF), 에리트로포이에틴 (EPO) (예로, 인간, 개 또는 고양이 에리트로포이에틴을 포함함), 연결조직 성장인자 (CTGF), 예로 염기성 섬유모세포 성장인자 (bFGF), 산성 섬유모세포 성장인자 (aFGF), 표피 성장인자 (EGF), 혈소판 유래 성장인자 (PDGF), 인슐린 성장인자 I 및 Ⅱ (IGF-I 및 IGF-Ⅱ)를 포함하는 신경영양 인자, TGFα, 액티빈, 인히빈 또는 임의의 골 형태생성 단백질 (BMP) BMP 1 내지 15를 포함한 형질전환 성장인자 α 슈퍼패밀리 중 어느 하나, 성장인자의 헤레굴린/신경레굴린/ARIA/신경분화인자 (NDF) 패밀리 중 어느 하나, 신경 성장인자 (NGF), 뇌 유래 신경영양 인자 (BDNF), 뉴로트로핀 NT-3 및 NT-4/5, 섬모 신경영양 인자 (CNTF), 교아세포주 유래 신경영양 인자 (GDNF), 뉴트린, 아그린, 세마포린/콜랩신 패밀리 중 어느 하나, 네트린-1 및 네트린-2, 간세포 성장인자 (HGF), 에프린, 노긴, 음파 호저 및 타이로신 가수분해효소를 포함하나 이에 한정되지 않는, 호르몬, 및 성장 및 분화 인자를 포함할 수 있다.
다른 유용한 트랜스 유전자 산물은 프롬보포이에틴 (TPO), 인터류킨 (IL) IL-1 내지 IL-36 (예로, 인간 인터류킨 IL-1, IL-1α IL-1β, IL-2, IL-3, IL-4, IL-6, IL-8, IL-12, IL-11, IL-12, IL-13, IL-18, IL-31, IL-35를 포함함), 단핵구 화학유인제 단백질, 백혈병 억제인자, 과립구-대식구 콜로니 자극인자, Fas 리간드, 종양 괴사인자 α 및 β, 인터페론 α, β 및 γ, 줄기세포 인자, flk-2/flt3 리간드과 같은 사이토카인 및 림포카인을 포함하나 이에 한정되지 않는 면역게를 조절하는 단백질을 포함한다. 또한, 면역계에 의해 생산되는 유전자 산물도 본 발명에서 유용하다. 이들은 면역글로불린 IgG, IgM, IgA, IgD 및 IgE, 키메라 면역글로불린, 인간화 항체, 단일사슬 항체, T 세포 수용체, 키메라 T 세포 수용체, 단일사슬 T 세포 수용체, 클래스 I 및 클래스 Ⅱ MHC 분자, 뿐만 아니라 조작된 면역글로불린 및 MHC 분자를 포함하나 이에 한정되지 않는다. 예를 들면, 특정 구현예에서, rAAV 항체는 예로 항-IgE, 항-IL-31, 항-IL-33, 항-CD20, 항-NGF, 항-GnRH와 같은 개 또는 고양이 항체를 전달하도록 설계될 수 있다. 또한, 유용한 유전자 산물은 보체 조절 단백질, 단백질 보조인자 단백질 (MCP), 붕괴 가속화인자 (DAF), CR1, CF2, CD59 및 C1 에스테라제 저해제 (C1-INH)와 같은 보체 조절 단백질을 포함한다.
또 다른 유용한 유전자 산물은 호르몬, 성장인자, 사이토카인, 림포카인, 조절 단백질 및 면역계 단백질에 대한 수용체 중 어느 하나를 포함한다. 본 발명은 저밀도 지질단백질 (LDL) 수용체, 고밀도 지질단백질 (HDL) 수용체, 높은 저밀도 지질단백질 (VLDL) 수용체 및 스캐빈저 수용체를 포함하는, 콜레스테롤 조절 및/또는 지질 조절을 위한 수용체를 포괄한다. 또한, 본 발명은 글루코코르티코이드 수용체 및 에스트로겐 수용체를 포함한 스테로이드 호르몬 수용체 슈퍼패밀리의 구성원, 비타민 D 수용체 및 기타 핵 수용체와 같은 유전자 산물을 포괄한다. 또한, 유용한 유전자 산물은 jun, fos, 맥스, 매드, 혈청 반응인자 (SRF), AP-1, AP2, myb, MyoD 및 미오제닌과 같은 전사인자, ETS 박스를 포함하는 단백질, TFE3, E2F, ATF1, ATF2, ATF3, ATF4, ZF5, NFAT, CREB, HNF-4, C/EBP, SP1, CCAAT 박스를 포함하는 단백질, 인터페론 조절인자 (IRF-1), 윌름 종양 단백질, ETS 결합 단백질, STAT, GATA 박스 결합 단백질, 예로 GATA-3, 및 날개형 헬릭스 단백질의 포크헤드 패밀리를 포함한다.
다른 유용한 유전자 산물은 히드록시메틸바일란 합성효소 (HMBS), 카바모일 합성효소 I, 오르니틴 트랜스카바밀라제 (OTC), 아르기노숙시네이트 합성효소, 아르기노숙시네이트 분해효소 결핍의 치료를 위한 아르기노숙시네이트 분해효소 (ASL), 아르기나제, 퓨마릴아세테이트 가수분해효소, 페닐알라닌 가수분해효소, 알파-1 안티트립신, 레서스원숭이 알파 태아단백질 (AFP), 레서스원숭이 융모 생식샘자극호르몬 (CG), 포도당-6-포스파타제, 포르포빌리노겐 탈아미나제, 시스타치온 베타-합성효소, 분지쇄 케토산 탈카르복실라제, 알부민, 이소발레릴-CoA 탈수소효소, 프로피오닌 CoA 카르복실라제, 메틸 말로닐 CoA 뮤타제, 글루타릴 CoA 탈수소효소, 인슐린, 베타-글루코시다제, 피루베이트 카르복실레이트, 간 포스포릴라제, 포스포스릴라제 키나제, 글리신 탈카르복실라제, H-단백질, T-단백질, 낭성 섬유증 막통과 조절인자 (CFTR) 서열 및 디스트로핀 유전자 산물 (예로, 미니- 또는 마이크로-디스트로핀)을 포함한다. 또 다른 유용한 유전자 산물은 효소 대체 요법에 유용할 수 있는 것과 같은 효소를 포함하고, 이는 효소의 활성 결핍으로부터 생성된 다양한 병태에 유용하다. 예를 들면, 만노스-6-포스페이트를 포함하는 효소는 리소좀 저장 질환에 대한 요법에 사용될 수 있다 (예로, 적합한 유전자는 β-글루쿠로니다제 (GUSB)를 인코딩하는 것을 포함함). 또 다른 예에서, 유전자 산물은 유비퀴틴 단백질 리가제 E3A (UBE3A)이다. 또 다른 유용한 유전자 산물은 UDP 글루쿠로노실전이효소 패밀리 1의 구성원 A1 (UGT1A1)을 포함한다.
또 다른 유용한 유전자 산물은 혈우병 B (인자 Ⅸ를 포함함) 및 혈우병 A (인자 Ⅷ 및 이의 변이체, 예컨대 이종이량체의 경쇄 및 중쇄 및 B 결실된 도메인을 포함함; 미국 특허 제 US 6,200,560호 및 제 US 6,221,349호)를 포함한 혈우병의 치료에 사용되는 유전자 산물을 포함한다. 일부 구현예에서, 미니유전자는 10개의 아미노산 신호 서열뿐만 아니라 인간 성장호르몬 (hGH) 폴리아데닐화 서열을 인코딩하는 인자 Ⅷ 중쇄의 처음 57개 염기쌍을 포함하고, 대안의 구현예에서, 미니유전자는 A1 및 A2 도메인, 및 B 도메인의 N-말단으로부터의 5개 아미노산 및/또는 B 도메인의 C-말단의 85개 아미노산, 뿐만 아니라 A3, C1 및 C2 도메인을 추가로 포함한다. 또 다른 구현예에서, 인자 Ⅷ 중쇄 및 경쇄를 인코딩하는 핵산이 B 도메인의 14개 아미노산을 코딩하는 42개 핵산에 의해 분리된 단일한 미니유전자로 제공된다 (미국 특허 제 US 6,200,560호).
rAAV를 통해 전달될 수 있는 추가의 예시적인 유전자는 글리코겐 저장 질환 또는 결핍 제 1A형 (GSD1)과 관련된 포도당-6-포스파타제; PEPCK 결핍과 관련된 포스포에놀피루베이트 카르복시키나제 (PEPCK); 간질 및 중증 신경발생 손상과 관련된 세린/트레오닌 키나제 9 (STK9)으로도 알려진 사이클린 의존성 키나제 유사 5 (CDKL5); 갈락토스혈증과 관련된 갈락토스-1 포스페이트 우리딜 전이효소; 페닐케톤뇨증 (PKU)과 관련된 페닐알라닌 가수분해효소 (PAH); 히드록시산 옥시다제 1 (GO/HAO1) 및 AGXT를 포함하는 제 1형 일차 과다옥살뇨증과 관련된 유전자 산물; 단풍시럽뇨병과 관련된, BCKDH, BCKDH-E2, BAKDH-E1a 및 BAKDH-E1b를 포함하는 분지쇄 알파-케토산 탈수소효소; 제 1형 타이로신혈증과 관련된 퓨마릴아세토아세테이트 가수분해효소; 메틸말론산혈증과 관련된 메틸말로닐 CoA 뮤타제; 중간쇄 아세틸 CoA 결핍과 관련된 중간쇄 아실 CoA 탈수소효소; 오르니틴 트랜스카바밀라제 결핍과 관련된 오르니틴 트랜스카바밀라제 (OTC); 시트룰린혈증과 관련된 아르기니노숙신산 합성효소 (ASS1); 레시틴-콜레스테롤 아실전이효소 (LCAT) 결핍; 메틸말론산혈증 (MMA); 제 C1형 니에만-픽 질환과 관련된 NPC1; 프로피온산혈증 (PA); 트랜스타이레틴 (TTR) 관련 유전성 아밀로이드증과 관련된 TTR; 가족성 고콜레스테롤혈증 (FH)와 관련된 저밀도 지질단백질 수용체 (LDLR) 단백질, 국제특허출원 제 WO 2015/164778호에 기재된 것과 같은 LDLR 변이체; PCSK9; 치매와 관련된 ApoE 및 ApoC 단백질; 크리글러-나자르 질환과 관련된 UDP-글루코우로노실 전이효소; 중증 조합된 면역결힙 질환과 관련된 아데노신 탈아미나제; 구트 및 레쉬-나이안 증후군과 관련된 하이폭산틴 구아닌 포스포리보실 전이효소; 바이오티미다제 결핍과 관련된 바이오티미다제; 파브릴병과 관련된 알파-갈락토시다제 A (a-Gal A); GM1 갱글리오시드증과 관련된 베타-갈락토시다제 (GLB1); 윌름병과 관련된 ATP7B; 제 2형 및 제 3형 가우처병과 관련된 베타-글루코세레브로시다제; 젤웨거 증후군과 관련된 퍼옥시좀 막 단백질 70 kDa; 이염색 백질디스트로피와 관련된 아릴설파타제 A (ARSA); 크래브병과 관련된 갈락토세레브로시다제 (GALC) 효소; 폼페병과 관련된 알파글루코시다제 (GAA); 니에만 픽 질환 A형과 관련된 스핑고미엘리나제 (SMPD1) 유전자; 성인 발병 제 Ⅱ형 시트룰린혈증 (CTLN2)과 관련된 아르기니노숙시네이트 합성효소; 우레아 회로 장애와 관련된 카바모일-포스페이트 합성효소 (CPS1); 척수 근육 디스트로피와 관련된 생존 운동 뉴런 (SMN) 단백질; 파버 지질육아종증과 관련된 세라미다제; GM2 갱글리오시드증 및 데이삭스와 샌드호프병과 관련된 β-헥소사미니다제; 아스파틸-글루코사민뇨증과 관련된 아스파틸글루코사미니다제; 퓨코시드증과 관련된 α-퓨코시다제; 알파-만노시드증과 관련된 α-만노시다제; 급성 간헐 포르피린증 (AIP)와 관련된 포르포빌리노겐 탈아미나제; 알파-1 안티트립신 결핍 (폐기종)의 치료를 위한 알파-1 안티트립신; 지중해 빈혈 또는 신부전으로 인한 빈혈의 치료를 위한 에리트로포이에틴; 허혈성 질환의 치료를 위한 혈관 내피 성장인자, 안지오포이에틴-1 및 섬유모세포 성장인자; 예를 들면 죽상동맥경화증, 혈전증 또는 색전증에서 관찰되는 폐쇄된 혈관의 치료를 위한 트롬보모둘린 및 조직인자 경로 저해제; 파킨슨병의 치료를 위한 방향족 아미노산 탈카르복실라제 (AADC) 및 타이로신 가수분해효소 (TH); 포스포람반, 선천성 심부전의 치료를 위한 근육(내)세포질망 아데노신 트리포스파타제-2 (SERCA2) 및 심장 아데닐릴 사이클라제에 대한 안티센스 또는 이의 돌연변이 형태인 베타 아드레날린 수용체; 다양한 암의 치료를 위한 p53과 같은 종양 억제인자 유전자; 염증 및 면역 장애 및 암의 치료를 위한 다양한 인터류킨 중 하나와 같은 사이토카인; 근육 디스트로피의 치료를 위한 디스트로핀 또는 미니디스트로핀 및 유트로핀 또는 미니유트로핀; 및 당뇨병의 치료를 위한 인슐린 또는 GLP-1을 포함하나 이에 한정되지 않는다.
또 다른 구현예에서, 트랜스 유전자는 하나 이상의 트랜스 유전자를 포함한다. 이것은 둘 이상의 이종유래 서열을 보유하는 단일 벡터를 사용하거나, 각각 둘 이상의 이종유래 서열을 보유하는 둘 이상의 AAV를 사용하여 달성될 수 있다. 일 구현예에서, AAV는 유전자 억압 (또는 녹다운) 및 유전자 증강 보조요법에 사용된다. 녹다운/증강 보조요법에서, 관심있는 유전자의 결함성 사본은 침묵화되고, 돌연변이되지 않은 사본이 공급된다. 일 구현예에서,이것은 둘 이상의 공동-투여된 벡터를 사용하여 달성된다. 본원에 참고문헌으로 통합되는 Millington-Ward et al., Molecular Therapy, 2011년 4월, 19(4): 642-649 참조. 당업자라면 원하는 결과를 기초로 하여 트랜스 유전자를 쉽게 선택할 수 있다.
바이러스성 및 비-바이러스성 벡터
본원에 기술된 약한 프로모터 및 이종유래 코딩 서열을 포함하는 발현 카세트는 벡터와 같은 표적 세포로의 전달에 적합한 임의의 유전 요소 내로 조작될 수 있다. 본원에 사용된 "벡터"는 핵산 서열의 복제 또는 발현을 위해 적절한 숙주 세포 내로 도입될 수 있는 상기 핵산 서열을 포함하는 생물학적 또는 화학적 모이어티이다. 보편적인 벡터는 비-바이러스성 벡터 및 바이러스성 벡터를 포함한다. 본원에 사용된 바, 비-바이러스성 시스템은 나노입자, 전기천공 시스템 및 신규한 생체물질, 미가공 DNA, 파지, 트랜스포존, 플라스미드, 코스미드 (Phillip McClean, www.ndsu.edu/pubweb/~mcclean/-plsc731/cloning/cloning4.htm) 및 인공 염색체 (Gong, Shiaoching, et al., "A gene expression atlas of the central nervous system based on bacterial artificial chromosomes." Nature 425.6961 (2003): 917-925)로부터 선택될 수 있다.
본원에서 "플라스미드" 또는 "플라스미드 벡터"는 일반적으로 선행 소문자 p로 표기되고/거나, 이어서 벡터 명칭이 표기된다. 본 발명에 따라 사용될 수 있는 플라스미드, 다른 클로닝 및 발현 벡터, 이들의 성질 및 이들의 제작/조작 방법은 당업자에게는 바로 자명할 것이다. 일 구현예에서, 본원에 기술된 핵산 서열 또는 본원에 기술된 발현 카세트는 바이러스성 벡터를 생성하고/거나 숙주 세포로의 전달에 유용한 적합한 유전 요소 (벡터), 예로 미가공 DNA, 파지, 트랜스포존, 코스미드, 에피좀 등 내로 조작되고, 이는 이들에 보유된 뉴클레아제 서열을 전달한다. 선택된 벡터는 형질감염, 전기천공, 리포좀 전달, 막 융합 기법, 고속 DNA 코팅된 펠렛, 바이러스성 감염 및 원형질체 융합을 포함하는 임의의 적합한 방법에 의해 전달될 수 있다. 이러한 구조물을 제조하는데 사용된 방법은 핵산 조작 분야의 당업자에게 공지되어 있으며, 유전공학, 재조합 공학 및 합성 기법을 포함한다. 예로, Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY 참조.
특정 구현예에서, 발현 카세트는 바이러스 캡시드 내에 포장하기 위해 벡터 게놈에 위치한다. 예를 들면, AAV 벡터 게놈의 경우, 발현 카세트의 구성요소는 AAV 역전된 말단 반복서열 서열에 의해 가장 5' 말단 및 가장 3' 말단에서 연접된다. 예를 들면, 5' AAV ITR, 발현 카세트, 3' AAV ITR이다. 다른 구현예에서, 자가-상보적인 AAV가 선택될 수 있다. 다른 구현예에서, 레트로바이러스 시스템, 렌티바이러스 벡터 시스템 또는 아데노바이러스 시스템이 사용될 수 있다. 일 구현예에서, 벡터 게놈은 임의의 서열번호 9 내지 14로 나타낸다. 일 구현예에서, 벡터 게놈은 서열번호 9에 나타낸다. 일 구현예에서, 벡터 게놈은 서열번호 10에 나타낸다. 일 구현예에서, 벡터 게놈은 서열번호 11에 나타낸다. 일 구현예에서, 벡터 게놈은 서열번호 12에 나타낸다. 일 구현예에서, 벡터 게놈은 서열번호 13에 나타낸다. 일 구현예에서, 벡터 게놈은 서열번호 14에 나타낸다.
AAV 벡터
특정 구현예에서, 재조합 AAV가 제공된다. "재조합 AAV" 또는 "rAAV"는 2가지 요소, AAV 캡시드 및 AAV 캡시드 내에 포장되는 적어도 비-AAV 코딩 서열을 포함하는 벡터 게놈를 포함하는 DNAse 저항성 바이러스 입자이다. 달리 특정되지 않은 경우라면, 이러한 용어는 용어 "rAAV 벡터"와 상호교환적으로 사용될 수 있다. rAAV는 임의의 기능적 AAV rep 유전자 또는 기능적 AAV cap 유전자가 결여되어 자손을 생성할 수 없기 때문에, "복제 결함성 바이러스" 또는 "바이러스성 벡터"이다. 특정 구현예에서, 유일한 AAV 서열은 AAV 역전된 말단 반복서열 서열 (ITR) 사이에 위치한 유전자 및 조절 서열이 AAV 캡시드 내에 포장되도록 하기 위하여 벡터 게놈의 가장 5' 및 3' 말단에 전형적으로 위치하는 ITR이다.
AAV 캡시드의 출처는 자연 발생 및 사용가능한 아데노 관련 바이러스, 뿐만 아니라 조작된 AAV 집단 중 어느 하나일 수 있다. 아데노 관련 바이러스 (AAV) 바이러스성 벡터는 표적 세포로의 전달을 위한 핵산 서열이 내부에 포장되는 AAV 단백질 캡시드를 갖는 AAV DNase 저항성 입자이다. AAV 캡시드는 60개의 캡시드 (cap) 단백질 소단위체 VP1, VP2 및 VP3으로 구성되고, 이들은 선택된 AAV에 의존하여 정 20면체 대칭으로 대략 1 : 1 : 10 내지 1 : 1 : 20의 비율로 배열된다. 다양한 AAV는 상기 확인된 AAV 바이러스성 벡터의 캡시드의 출처로서 선택될 수 있다. 예로, 미국 특허출원 공개 제 US 2007-0036760-A1호; 미국 특허출원 공개 제 US 2009-0197338-A1호; 유럽 특허 EP 1310571 참조. 또한, 국제특허출원 제 WO 2003/042397호 (AAV7 및 기타 원숭이 AAV), 미국 특허 제 US 7790449호, 미국 특허 제 US 7282199호 (AAV8), 국제특허출원 제 WO 2005/033321호, 미국 특허 제 US 7,906,111호 (AAV9), 국제특허출원 제 WO 2006/110689호, 제 WO 2003/042397호 (rh.10) 및 제 WO 2018/160582호 (AAVhu.68) 참조. 이들 문서는 AAV를 생성하기 위해 선택될 수 있는 다른 AAV를 설명하고 있으며, 참고문헌으로 통합된다. 달리 특정되지 않은 경우라면, 본원에 기술된 AAV 캡시드, ITR 및 다른 AAV 구성요소는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV8, AAV7M8, AAVAnc80, AAVrh.10 및 AAVPHP.B로 보편적으로 동정되는 AAV를 포함하나 이에 한정되지 않는 임의의 AAV, 및 임의의 공지되거나 언급된 AAV 또는 아직 발견되지 않은 AAV, 또는 이들의 변이체 또는 혼합물로부터 쉽게 선택될 수 있다. 예로, 본원에 참고문헌으로 통합되는 국제특허출원 제 WO 2005/033321호 참조. 일 구현예에서, AAV 캡시드는 AAV1 캡시드 또는 이의 변이체, AAV8 캡시드 또는 이의 변이체, AAV9 캡시드 또는 이의 변이체, AAVrh.10 캡시드 또는 이의 변이체, AAVrh.64.R1 캡시드 또는 이의 변이체, AAVhu.37 캡시드 또는 이의 변이체, 또는 AAV3B 캡시드 또는 이의 변이체이다. 또한, 본원에 이들의 전문이 참고문헌으로 통합되는 국제특허출원 제 WO 2019/168961호 및 제 WO 2019/168961호 참조.
다른 구현예에서, AAV 캡시드는 AAVrh.79 캡시드 또는 이의 변이체이다. 다른 구현예에서, AAV 캡시드는 AAVrh.90 캡시드 또는 이의 변이체이다.
특정 구현예에서, rAAV은 AAVhu.37 캡시드이다. AAVhu.37 캡시드는 서열번호 22의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp1 단백질의 이종유래 집단, 서열번호 22의 적어도 약 138번 내지 738번 아미노산의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp2 단백질의 이종유래 집단, 및 서열번호 22의 적어도 아미노산 204번 내지 738번을 인코딩하는 핵산 서열의 산물인 vp3 단백질의 이종유래 집단을 포함하고, 상기 vp1, vp2 및 vp3 단백질은 서열번호 22에 있는 아스파라긴-글리신 쌍에서 적어도 2개의 높게 탈아미드화된 아스파라긴 (N)을 포함하는 아미노산 변형을 갖는 하위집단을 포함하며, 선택적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하고, 여기서 탈아미드화는 아미노산 변화를 생성한다. AAVhu.37은 AAVhu.37 VP1의 번호매김 (서열번호 22)을 기초로 하여, 예로 위치 N57, N263, N385 및/또는 N514에서 높게 탈아미드화된 잔기를 갖는 것을 특징으로 한다.
탈아미드화는 하기 표에 나타낸 다른 잔기에서, 및 예로 본원에 참고문헌으로 통합되는 2019년 9월 6일에 공개된 국제특허출원 제 WO 2019/168961호에서 관찰되었다. 특정 구현예에서, AAVhu.37 캡시드는 트립신 효소와 함께 질량 분광분석법을 사용하여 결정된 바, 하기 제공된 범위에 있는 하기 위치 중 하나 이상에서 변형된다. 특정 구현예에서, 하기 위치 중 하나 이상 또는 N에 이어진 글리신은 본원에 기술된 바와 같이 변형된다. 예를 들면, 특정 구현예에서, G는 예로 위치 58번, 264번, 386번 또는 515번에서 S 또는 A로 변형될 수 있다. 일 구현예에서, AAVhu.37 캡시드는 위치 N57/G58 내지 N57Q 또는 G58A에서 변형되어 이 위치에서 탈아미드화가 감소된 캡시드를 수득한다. 또 다른 구현예에서, N57/G58은 NS57/58 또는 NA57/58로 변경된다. 그러나, 특정 구현예에서, 탈아미드화의 증가는 NG가 NS 또는 NA로 변경될 때 관찰된다. 특정 구현예에서, NG 쌍의 N은 G를 유지하면서 Q로 변형된다. 특정 구현예에서, NG 쌍의 둘 다의 아미노산이 변형된다. 특정 구현예에서, N385Q는 해당 위치에서 탈아미드화의 유의한 감소를 생성한다. 특정 구현예에서, N499Q는 해당 위치에서 탈아미드화의 유의한 증가를 생성한다.
특정 구현예에서, AAVhu.37는 탈아미드화된 이들 또는 다른 잔기를, 예로 전형적으로 10% 미만으로 갖을 수 있고/거나, 메틸화 (예로, ~ R487) (주어진 잔기에서 전형적으로 5% 미만, 더욱 전형적으로 1% 미만), 이성질체화 (예로, D97) (주어진 잔기에서 전형적으로 5% 미만, 더욱 전형적으로 1% 미만), 인산화 (예로, 존재하는 곳에서 약 10% 내지 60% 또는 약 10% 내지 30% 또는 약 20% 내지 60%의 범위로) (예로, S149, ~ S153, ~ S474, ~ T570, ~ S665 중 하나 이상에서), 또는 산화 (예로, W248, W307, W307, M405, M437, M473, W480, W480, W505, M526, M544, M561, W621, M637 및/또는 W697 중 하나 이상에서)를 포함하는 다른 변형을 갖을 수 있다. 선택적으로, W는 카이누레닌으로 산화될 수 있다.
또 다른 위치가 이러한 이들 또는 다른 변형 (예로, 아세틸화 또는 추가의 탈아미드화)을 갖을 수 있다. 특정 구현예에서, AAVhu.37 vp1 캡시드 단백질을 인코딩하는 핵산 서열은 서열번호 21에 제공된다. 다른 구현예에서, 서열번호 21과 70% 내지 99.9% 일치도의 핵산 서열은 AAVhu.37 vp1 캡시드 단백질을 발현하도록 선택될 수 있다. 특정 다른 구현예에서, 핵산 서열은 서열번호 21과 적어도 약 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97% 또는 적어도 99% 일치한다. 그러나, 서열번호 22의 아미노산 서열을 인코딩하는 다른 핵산 서열은 rAAVhu.37 캡시드를 생산하는 용도를 위해 선택될 수 있다. 특정 구현예에서, 핵산 서열은 서열번호 21, 또는 서열번호 22를 인코딩하는 서열번호 21과 적어도 70% 내지 적어도 99% 일치하는, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97% 또는 적어도 99% 일치하는 서열의 핵산 서열을 갖는다. 특정 구현예에서, 핵산 서열은 서열번호 21, 또는 서열번호 22의 vp2 캡시드 단백질 (아미노산 약 138번 내지 738번)을 인코딩하는 서열번호 21의 뉴클레오티드 약 412번 내지 약 2214번과 적어도 70% 내지 99%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97% 또는 적어도 99% 일치하는 서열의 핵산 서열을 갖는다. 특정 구현예에서, 핵산 서열은 서열번호 21의 뉴클레오티드 약 610번 내지 약 2214번, 또는 서열번호 22의 vp3 캡시드 단백질 (아미노산 약 204번 내지 738번)을 인코딩하는 서열번호 21과 적어도 70% 내지 99%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97% 또는 적어도 99% 일치하는 서열의 핵산 서열을 갖는다. 유럽 특허 제 EP 2 345 731 B1호 및 본원의 서열번호 88 참조, 이들은 본원에 참고문헌으로 통합된다.
특정 구현예에서, rAAV는 AAV8 캡시드를 포함한다. AAV8 캡시드는 질량 분광분석법을 사용하여 결정된 바, 캡시드에 있는 VP 단백질의 총량을 기초로 하여 하기 표에 정의된 바와 같이 탈아미드화된 VP 이소형의 이종유래 집단을 포함한다. 적합한 변형은 탈아미드화의 조정이 표시된 상기 단락에 설명된 변형을 포함하고, 이는 본원에 통합된다. 특정 구현예에서, AAV 캡시드는 질량 분광분석법을 사용하여 결정된 바, 하기 제공된 범위에 있는 하기 위치 중 하나 이상에서 변형된다. 특정 구현예에서, 하기 위치 중 하나 이상, 또는 N에 이어진 글리신은 본원에 설명된 바와 같이 변형된다. 특정 구현예에서, 인공적 NG는 하기에 확인된 하나의 위치와 상이한 위치 내에 도입된다. 특정 구현예에서, 하기 위치 중 하나 이상, 또는 N에 이어진 글리신은 본원에 설명된 바와 같이 변형된다. 예를 들면, 특정 구현예에서, G는 예로 위치 58번, 67번, 95번, 216번, 264번, 386번, 411번, 460번, 500번, 515번 또는 541번에서 S 또는 A로 변형된다. 탈아미드화의 유의한 감소는 NG57/58이 NS57/58 또는 NA57/58로 변경될 때 관찰된다. 그러나, 특정 구현예에서, 탈아미드화의 유의한 증가는 NG가 NS 또는 NA로 변경될 때 관찰된다. 특정 구현예에서, NG 쌍의 N은 G를 유지하면서 Q로 변형된다. 특정 구현예에서, NG 쌍의 둘 다의 아미노산이 변형된다. 특정 구현예에서, N385Q는 해당 위치에서 탈아미드화의 유의한 감소를 생성한다. 특정 구현예에서, N499Q는 해당 위치에서 탈아미드화의 유의한 증가를 생성한다. 특정 구현예에서, NG 돌연변이는 N263에 위치한 쌍에서 만들어진다 (예로, N263A). 특정 구현예에서, NG 돌연변이는 N514에 위치한 쌍에서 만들어진다 (예로, N514A). 특정 구현예에서, NG 돌연변이는 N540에 위치한 쌍에서 만들어진다 (예로, N540A). 특정 구현예에서, 이들 위치에서 다수의 돌연변이 및 적어도 하나의 돌연변이를 포함하는 AAV 돌연변이체가 조작된다. 특정 구현예에서, 돌연변이체는 위치 N57에서 만들어지지 않는다. 특정 구현예에서, 돌연변이체는 위치 N94에서 만들어지지 않는다. 특정 구현예에서, 돌연변이체는 위치 N305에서 만들어지지 않는다. 특정 구현예에서, 돌연변이체는 위치 G386에서 만들어지지 않는다. 특정 구현예에서, 돌연변이체는 위치 Q467에서 만들어지지 않는다. 특정 구현예에서, 돌연변이체는 위치 N479에서 만들어지지 않는다. 특정 구현예에서, 돌연변이체는 위치 N653에서 만들어지지 않는다. 특정 구현예에서, 캡시드는 "NG" 쌍이 아닌 위치에서 "N" 또는 "Q"를 감소시키도록 변형된다. 잔기 번호는 서열번호 20에 기재된 공개된 AAV8 서열을 기초로 한다.
특정 구현예에서, rAAV는 본원에 참고문헌으로 통합되는 2019년 9월 6일에 공개된 국제특허출원 제 WO 2019/169004호에 기술된 AAVrh.79 캡시드를 포함한다. 일 구현예에서, AAVrh.79 캡시드는 AAVrh.79 vp1 단백질, AAVrh.79 vp2 단백질 및 AAVrh.79 vp3 단백질의 이종유래 집단을 포함한다. 일 구현예에서, AAVrh.79 캡시드는 서열번호 18의 예측된 아미노산 서열 1번 내지 738번을 인코딩하는 핵산 서열로부터의 발현에 의해 생산된다. 선택적으로, vp1 고유의 영역 (아미노산 약 1번 내지 137번) 또는 vp2 고유의 영역 (아미노산 약 1번 내지 203번)을 제외한 핵산으로부터의 vp3 단백질, 서열번호 17로부터 생산된 vp1 단백질, 또는 서열번호 17과 적어도 70% 일치하는 서열번호 18의 1번 내지 738번의 예측된 핵산 서열을 인코딩하는 핵산 서열로부터 생산된 vp1 단백질을 공동-발현하는 서열. 다른 구현예에서. 서열번호 18의 적어도 아미노산 약 138번 내지 738번의 예측된 아미노산 서열을 인코딩하는 핵산 서열로부터의 발현에 의해 생산된 AAVrh.79 vp2 단백질, 서열번호 17의 적어도 뉴클레오티드 412번 내지 2214번을 포함하는 서열로부터 생산된 vp2 단백질, 또는 서열번호 17의 적어도 뉴클레오티드 412번 내지 2214번과 적어도 70% 일치하는, 서열번호 18의 적어도 아미노산 약 138번 내지 738번의 예측된 아미노산 서열을 인코딩하는 핵산 서열로부터 생산된 vp2 단백질, 서열번호 18의 적어도 아미노산 약 204번 내지 738번의 예측된 아미노산 서열을 인코딩하는 핵산 서열로부터의 발현에 의해 생산된 AAVrh.79 vp3 단백질, 서열번호 17의 적어도 뉴클레오티드 610번 내지 2214번을 포함하는 서열로부터 생산된 vp3 단백질, 또는 서열번호 17의 적어도 뉴클레오티드 610번 내지 2214번과 적어도 70% 일치하는, 서열번호 18의 적어도 아미노산 약 204번 내지 738번의 예측된 아미노산 서열을 인코딩하는 핵산 서열로부터 생산된 vp3 단백질.
특정 구현예에서, AAVrh.79 캡시드는 서열번호 18의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp1 단백질의 이종유래 집단, 서열번호 18의 적어도 아미노산 약 138번 내지 738번의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp2 단백질의 이종유래 집단, 및 서열번호 18의 적어도 아미노산 204번 내지 738번의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp3 단백질의 이종유래 집단을 포함한다.
AAVrh.79 vp1, vp2 및 vp3 단백질은 서열번호 18에 있는 아스파라긴-글리신 쌍에서 적어도 2개의 높게 탈아미드화된 아스파라긴 (N)을 포함하는 아미노산 변형을 갖는 하위집단을 포함하고, 선택적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하며, 여기서 탈아미드화는 아미노산 변화를 생성한다. N-G 쌍, N57, N263, N385 및/또는 N514에서 서열번호 18의 수와 비교하여 높은 수준의 탈아미드화가 관찰된다. 탈아미드화는 하기 표 및 실시예에 나타낸 바와 같이 다른 잔기에서 관찰되었다. 특정 구현예에서, AAVrh.79는 탈아미드화된 다른 잔기를, 예로 전형적으로 10% 미만으로 갖을 수 있고/거나, 메틸화 (예로, ~ R487) (주어진 잔기에서 전형적으로 5% 미만, 더욱 전형적으로 1% 미만), 이성질체화 (예로, D97) (주어진 잔기에서 전형적으로 5% 미만, 더욱 전형적으로 1% 미만), 인산화 (예로, 존재하는 곳에서 약 10% 내지 약 60% 또는 약 10% 내지 약 30% 또는 약 20% 내지 약 60%의 범위로) (예로, S149, ~ S153, ~ S474, ~ T570, ~ S665 중 하나 이상), 또는 산화 (예로, W248, W307, W307, M405, M437, M473, W480, W480, W505, M526, M544, M561, W621, M637 및/또는 W697 중 하나 이상)를 포함하는 다른 변형을 갖을 수 있다. 선택적으로, W는 카이누레닌으로 산화할 수 있다.
특정 구현예에서, AAVrh.79 캡시드는 트립신 효소와 함께 질량 분광분석법을 사용하여 결정된 바, 하기 제공된 범위에 있는 상기 표에서 확인된 위치 중 하나 이상에서 변형된다. 특정 구현예에서, 하기 위치 중 하나 이상 또는 N에 이어진 글리신은 본원에 기술된 바와 같이 변형된다. 잔기 번호는 본원에 제공된 AAVrh.79 서열을 기초로 한다. 서열번호 18 참조.
특정 구현예에서, AAVrh.79 vp1 캡시드 단백질을 인코딩하는 핵산 서열은 서열번호 17에 제공된다. 다른 구현예에서, 서열번호 17과 70% 내지 99.9% 일치도의 핵산 서열은 AAVrh.79 vp1 캡시드 단백질을 발현하도록 선택될 수 있다. 특정 다른 구현예에서, 핵산 서열은 서열번호 17과 적어도 약 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 또는 적어도 99.9% 일치한다. 그러나, 서열번호 18의 아미노산 서열을 인코딩하는 다른 핵산 서열은 rAAV 캡시드를 생산하는 용도를 위해 선택될 수 있다. 특정 구현예에서, 핵산 서열은 서열번호 17, 또는 서열번호 18을 인코딩하는 서열번호 17과 적어도 70% 내지 99% 일치하는, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 또는 적어도 99.9% 일치하는 서열의 핵산 서열을 갖는다. 특정 구현예에서, 핵산 서열은 서열번호 17, 또는 서열번호 18의 vp2 캡시드 단백질 (아미노산 약 138번 내지 738번)을 인코딩하는 서열번호 17의 뉴클레오티드 약 412번 내지 약 2214번과 적어도 70% 내지 99%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 또는 적어도 99.9% 일치하는 서열의 핵산 서열을 갖는다. 특정 구현예에서, 핵산 서열은 서열번호 17의 뉴클레오티드 약 610번 내지 약 2214번, 또는 서열번호 18의 vp3 캡시드 단백질 (아미노산 약 204번 내지 738번)을 인코딩하는 서열번호 17과 적어도 70% 내지 99%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 또는 적어도 99.9% 일치하는 서열의 핵산 서열을 갖는다.
또한, 본 발명은 하나 이상의 잔기가 탈아미드화 또는 본원에서 확인된 다른 변형을 감소시키기 위해 변형되었던 돌연변이체 AAVrh.79를 인코딩하는 핵산 서열을 포괄한다. 이러한 핵산 서열은 돌연변이체 rAAVrh.79 캡시드의 생산에 사용될 수 있다.
특정 구현예에서, rAAV는 본원에 참고문헌으로 통합되는 2020년 11월 5일에 공개된 국제특허출원 제 WO 2020/223232호에 기술된 AAVrh.90 캡시드를 포함한다. 추가의 양태에서, 재조합 아데노 관련 바이러스 (rAAV)로서, (A)(1) 서열번호 24의 1번 내지 738번의 예측된 아미노산 서열을 인코딩하는 핵산 서열로부터의 발현에 의해 생산된 vp1 단백질, 서열번호 23으로부터 생산된 vp1 단백질, 또는 서열번호 24의 예측된 아미노산 서열의 1번 내지 738번을 인코딩하는 서열번호 23과 적어도 70% 일치하는 핵산 서열로부터 생산된 vp1 단백질로부터 선택된 AAVrh.90 vp1 단백질 이종유래 집단, 서열번호 24의 적어도 아미노산 약 138번 내지 738번의 예측된 아미노산 서열을 인코딩하는 핵산 서열로부터의 발현에 의해 생산된 vp2 단백질, 서열번호 23의 적어도 뉴클레오티드 412번 내지 2214번을 포함하는 서열로부터 생산된 vp2 단백질, 또는 서열번호 24의 적어도 아미노산 약 138번 내지 738번의 예측된 아미노산 서열을 인코딩하는 서열번호 23의 적어도 뉴클레오티드 412번 내지 2214번과 적어도 70% 일치하는 핵산 서열로부터 생산된 vp2 단백질로부터 선택된 AAVrh.90 vp2 단백질의 이종유래 집단, 서열번호 24의 적어도 아미노산 약 204번 내지 738번의 예측된 아미노산 서열을 인코딩하는 핵산 서열로부터의 발현에 의해 생산된 vp3 단백질, 서열번호 23의 적어도 뉴클레오티드 610번 내지 2214번을 포함하는 서열로부터 생산된 vp3 단백질, 또는 서열번호 24의 적어도 아미노산 약 204번 내지 738번의 예측된 아미노산 서열을 인코딩하는, 서열번호 23의 적어도 뉴클레오티드 610번 내지 2214번과 적어도 70% 일치하는 핵산 서열로부터 생산된 vp3 단백질로부터 선택된 AAVrh.90 vp3 단백질의 이종유래 집단을 포함하는 AAVrh.90 캡시드 단백질; 및/또는 (2) 서열번호 24의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp1 단백질의 이종유래 집단, 서열번호 24의 적어도 아미노산 약 138번 내지 738번의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp2 단백질의 이종유래 집단, 및 서열번호 24의 적어도 아미노산 204번 내지 738번의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp3 단백질의 이종유래 집단으로서, vp1, vp2 및 vp3 단백질은 서열번호 24에 있는 아스파라긴-글리신 쌍에서 적어도 2개의 높게 탈아미드화된 아스파라긴 (N)을 포함하는 아미노산 변형을 갖는 하위집단을 포함하고, 선택적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하며, 탈아미드화는 아미노산 변화를 생성하는, 이종유래 집단 중 하나 이상을 포함하는 AAVrh.90 캡시드; 및 (B) AAVrh.90 캡시드의 벡터 게놈, AAV 역전된 말단 반복서열 서열을 포함하는 핵산 분자를 포함하는 벡터 게놈, 및 숙주 세포에서 발현을 안내하는 서열에 작동가능하게 연결된 산물을 인코딩하는 비-AAV 핵산 서열을 포함하는, 재조합 아데노 관련 바이러스가 제공된다.
특정 구현예에서, AAVrh.90 vp1, vp2 및 vp3 단백질은 서열번호 24에 있는 아스파라긴-글리신 쌍에서 적어도 2개의 높게 탈아미드화된 아스파라긴 (N)을 포함하는 아미노산 변형을 갖는 하위집단을 포함하고, 선택적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하며, 여기서 탈아미드화는 아미노산 변화를 생성한다. N-G 쌍, N57, ~ N263, ~ N385 및/또는 ~ N514에서 서열번호 24의 수와 비교하여 높은 수준의 탈아미드화가 관찰된다. 탈아미드화는 하기 표에 나타낸 바와 같이 다른 잔기에서 관찰되었다. 특정 구현예에서, AAVrh.90은 탈아미드화된 다른 잔기를 (예로, ~ N305, ~ N499 및/또는 ~ N599, 전형적으로 20% 미만으로) 갖을 수 있고/거나, 인산화 (예로, 존재하는 곳에서 약 2% 내지 약 30% 또는 약 2% 내지 약 20% 또는 약 2% 내지 약 10%의 범위로) (예로, S149), 또는 산화 (예로, ~ W23, ~ M204, ~ M212, W248, W282, M405, M473, W480, W505, M526, ~ N544, M561 및/또는 ~ M607 중 하나 이상)를 포함하는 다른 변형을 갖을 수 있다. 선택적으로, W는 카이누레닌으로 산화할 수 있다.
특정 구현예에서, AAVhu.90 캡시드는 트립신 효소와 함께 질량 분광분석법을 사용하여 결정된 바, 제공된 범위에 있는 선행 표에서 확인된 하나 이상의 위치에서 변형된다. 특정 구현예에서, 하나 이상의 위치 또는 N에 이어진 글리신은 본원에 기술된 바와 같이 변형된다. 잔기 번호는 본원에 제공된 AAVrh.90 서열을 기초로 한다. 서열번호 24 참조.
특정 구현예에서, AAVrh.90 캡시드는 서열번호 24의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp1 단백질의 이종유래 집단, 서열번호 24의 적어도 아미노산 약 138번 내지 738번의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp2 단백질의 이종유래 집단, 및 서열번호 24의 적어도 아미노산 204번 내지 738번의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp3 단백질의 이종유래 집단을 포함한다.
본원에 사용된 바, "벡터 게놈"은 바이러스 입자를 형성하는 rAAV 캡시드 내부에 포장된 핵산 서열을 말한다. 이러한 핵산 서열은 AAV 역전된 말단 반복서열 서열 (ITR)을 포함한다. 본원의 실시예에서, 벡터 게놈은 5'부터 3' 말단으로 최소한의 AAV 5' ITR, 코딩 서열의 발현을 안내하는 조절 서열에 작동가능하게 연결된 트랜스 유전자 또는 코딩 서열(들)을 포함하는 발현 카세트 및 AAV 3' ITR을 포함한다. ITR은 벡터 생산 동안 게놈의 복제 및 포장을 책임지는 유전 요소이고, rAAV를 생성하는데 요구되는 유일한 바이러스성 시스 요소이다. 일 구현예에서, ITR은 캡시드를 공급하는 것과 상이한 AAV로부터 나온다. 바람직한 구현예에서, AAV로부터의 ITR 서열 또는 이의 결실된 버전 (△ITR)이 편의상 사용될 수 있다. 그러나, 다른 AAV 출처로부터 나온 ITR이 선택될 수 있다. ITR의 출처가 AAV2로부터 나오고, AAV 캡시드는 또 다른 AAV 출처로부터 나오는 경우에, 생성된 벡터는 슈도유형으로 명명될 수 있다. 전형적으로, AAV 벡터 게놈은 AAV 5' ITR, 유전자 산물(들) 및 임의의 조절 서열을 인코딩하는 핵산 서열 및 AAV 3' ITR을 포함한다. 그러나, 이들 요소의 다른 입체구조가 적합할 수 있다. 일 구현예에서, 자가-상보적인 AAV가 제공된다. D-서열 및 말단 분할 부위 (trs)가 결실되어 △ITR로 명명된 5' ITR의 단축된 버전이 기재되어 왔다. 특정 구현예에서, 벡터 게놈은 외부 "a" 요소가 결실된, 130개 염기쌍의 단축된 AAV2 ITR를 포함한다. 단축된 ITR은 내부 A 요소를 주형으로서 사용한 벡터 DNA의 증폭 동안 145개 염기쌍의 야생형 길이로 재역전된다. 다른 구현예에서, 전장의 AAV 5' 및 3' LTR이 사용된다. 다른 구현예에서, 전장의 또는 조작된 ITR이 선택될 수 있다. 또한, 벡터 게놈은 유전자 산물의 발현을 조정하는 (예로, 직접적으로 또는 간접적으로 전사 및/또는 번역을 조정함) 조절 서열을 포함한다. 벡터 게놈의 적합한 구성요소는 본원에서 더욱 자세하게 논의된다.
AAV 바이러스성 벡터 (예로, 재조합 (r)AAV)를 생성하는데 사용하기 위해, 발현 카세트는 포장하는 숙주 세포에 전달된 임의의 적합한 벡터, 예로 플라스미드 상에 운반될 수 있다. 본 발명에 유용한 플라스미드는 특히 원핵 세포, 곤충 세포, 포유동물 세포에서의 시험관내 복제 및 포장에 적합하도록 조작될 수 있다. 적합한 형질감염 기법 및 숙주 세포를 포장하는 것은 공지되고/거나, 당업자에 의해 쉽게 설계될 수 있다. 일 구현예에서, 서열번호 13에 나타낸 벡터 게놈은 AAVhu.37 캡시드 내에 포장된다.
벡터로서의 용도에 적합한 AAV를 생성하고 단리하는 방법은 당해 기술분야에 공지되어 있다. 일반적으로, 예로 본원에 각각의 전문이 참고문헌으로 통합되는, Grieger & Samulski, 2005, "Adeno-associated virus as a gene therapy vector: Vector development, production and clinical applications," Adv. Biochem. Engin/Biotechnol. 99: 119-145; Buning et al., 2008, "Recent developments in adeno-associated virus vector technology," J. Gene Med. 10: 717-733; 및 하기에 인용된 참고문헌 참조. 트랜스 유전자를 비리온 내에 포장하기 위해, ITR은 발현 카세트를 포함하는 핵산 분자와 동일한 구조물에서 시스 형태로 요구되는 유일한 AAV 구성요소이다. cap 및 rep 유전자는 트랜스 형태로 공급될 수 있다.
용어 "AAV 중간물" 또는 "AAV 벡터 중간물"은 내부에 포장되는 원하는 게놈 서열이 결여된 조립된 rAAV 캡시드를 말한다. 또한, 이들은 "빈" 캡시드로도 명명될 수 있다. 이러한 캡시드는 발현 카세트의 검출가능한 게놈 서열이 없거나, 유전자 산물의 발현을 달성하기에 불충분한 단지 부분적으로 포장된 게놈 서열만을 포함할 수 있다. 이러한 빈 캡시드는 관심있는 유전자를 숙주 세포로 전달하는 기능이 없다.
본원에 기술된 재조합 아데노 관련 바이러스 (AAV)는 공지되어 있는 기법을 사용하여 생성될 수 있다. 예로, 국제특허출원 제 WO 2003/042397호; 제 WO 2005/033321호; 제 WO 2006/110689호; 미국 특허 제 US 7588772 B2호 참조. 이러한 방법은 AAV 캡시드 단백질을 인코딩하는 핵산 서열; 기능적 rep 유전자; 최소한의 AAV 역전된 말단 반복서열 (ITR) 및 트랜스 유전자로 구성된 발현 카세트; 및 AAV 캡시드 단백질 내에 발현 카세트의 포장을 허용하는 충분한 헬퍼 기능을 포함하는 숙주 세포를 배양하는 것이 관여한다. 캡시드, 이에 따른 코딩 서열을 생성하는 방법, 및 rAAV 바이러스성 벡터의 생산 방법은 기술되어 왔다. 예로, Gao, et al., Proc. Natl. Acad. Sci. U.S.A. 100(10): 6081-6086 (2003) 및 미국 특허 제 US 2013/0045186A1호 참조.
일 구현예에서, 재조합 AAV를 생산하는데 유용한 생산 세포 배양물이 제공된다. 이러한 세포 배양물은 숙주 세포에서 AAV 캡시드 단백질을 발현하는 핵산; AAV 캡시드 내로의 포장에 적합한 핵산 분자, 예로 AAV ITR 및 숙주 세포에서 산물의 발현을 안내하는 서열에 작동가능하게 연결된 유전자 산물을 인코딩하는 비-AAV 핵산 서열을 포함하는 벡터 게놈; 및 재조합 AAV 캡시드 내에 핵산 분자의 포장을 허용하기에 충분한 AAV rep 기능 및 아데노바이러스 헬퍼 기능을 포함한다. 일 구현예에서, 세포 배양물은 포유동물 세포 (예로, 특히 인간 배아 신장 293 세포) 또는 곤충 세포 (예로, 배쿨로바이러스)로 구성된다.
선택적으로, rep 기능은 캡시드를 제공하는 AAV가 아닌 AAV에 의해 제공된다. 예를 들면, rep은 이에 한정되지는 않지만 AAV1 rep 단백질, AAV2 rep 단백질, AAV3 rep 단백질, AAV4 rep 단백질, AAV5 rep 단백질, AAV6 rep 단백질, AAV7 rep 단백질, AAV8 rep 단백질; 또는 rep 78, rep 68, rep 52, rep 40, rep 68/78 및 rep 40/52; 또는 이들의 단편; 또는 또 다른 출처일 수 있다. 선택적으로, rep 및 cap 서열은 세포 배양물에서 동일한 유전 요소 상에 있다. rep 유전자 및 cap 유전자 사이에 스페이서가 존재할 수 있다. 임의의 이러한 AAV 또는 돌연변이체 AAV 캡시드 서열은 숙주 세포에서 이들의 발현을 안내하는 외인성 조절 제어 서열의 통제 하에 있을 수 있다.
일 구현예에서, 세포는 적합한 세포 배양물 (예로, HEK 293) 세포로 제조된다. 본원에 기술된 유전자 요법 벡터를 제조하는 방법은 유전자 요법 벡터의 생산에 사용되는 플라스미드 DNA의 생성, 벡터의 생성 및 벡터의 정제와 같은 당해 기술분야에서 널리 공지된 방법을 포함한다. 일부 구현예에서, 유전자 요법 벡터는 AAV 벡터이고, 생성된 플라스미드는 AAV 게놈 및 관심있는 유전자를 인코딩하는 AAV 시스-플라스미드, AAV rep 및 cap 유전자를 포함하는 AAV 트랜스-플라스미드 및 아데노바이러스 헬퍼 플라스미드이다. 벡터 생성 공정은 세포 배양의 개시, 세포의 계대, 세포의 접종, 플라스미드 DNA를 사용한 세포의 형질감염, 무-혈청 배지로의 형질감염-후 배지 교환, 및 벡터를 포함하는 세포 및 배양 배지의 수확과 같은 방법 단계를 포함할 수 있다. 수확된 벡터를 포함하는 세포 및 배양 배지는 본원에서 미정제 세포 수확물로서 지칭된다. 또 다른 시스템에서, 유전자 요법 벡터는 배쿨로바이러스 기반의 벡터를 사용한 감염에 의해 곤충 세포 내에 도입된다. 이러한 생산 시스템에 관한 리뷰를 위해, 일반적으로 예로 본원에 이의 전문이 참고문헌으로 통합되는 Zang et al., 2009, "Adenovirus-adeno-associated virus hybrid for large-scale recombinant adeno-associated virus production," Human Gene Therapy 20: 922-929 참조. 또한, 이들 및 기타 AAV 생산 시스템을 제조하고 사용하는 방법도 하기 미국 특허 제 US 5,139,941호; 제 US 5,741,683호; 제 US 6,057,152호; 제 US 6,204,059호; 제 US 6,268,213호; 제 US 6,491,907호; 제 US 6,660,514호; 제 US 6,951,753호; 제 US 7,094,604호; 제 US 7,172,893호; 제 US 7,201,898호; 제 US 7,229,823호; 및 제 US 7,439,065호에 기재되어 있으며, 이들 각각의 전문이 본원에 참고문헌으로 통합된다.
미정제 세포 수확물은 이어서 벡터 수확물의 농축, 벡터 수확물의 투과여과, 벡터 수확물의 미세유동화, 벡터 수확물의 뉴클레아제 소화, 미세유동화된 중간물의 여과, 크로마토그래피에 의한 조 정제, 초원심분리에 의한 조 정제, 접면 유동 여과에 의한 완충액 교환, 및/또는 대량의 벡터를 준비하는 제형화 및 여과와 같은 방법이 시행될 수 있다.
높은 염 농도에서 두 단계 친화 크로마토그래피 정제에 이어진 음이온 교환 레진 크로마토그래피는 벡터 약물 산물을 정제하고, 빈 캡시드를 제거하는데 사용된다. 이러한 방법은 본원에 참고문헌으로 통합되는 국제특허출원 공개 제 WO 2017/160360호에 더욱 자세하게 설명된다. AAV8, 국제특허출원 공개 제 WO 2017/100676호; rh10, 국제특허출원 개 제 WO 및 AAV1, 국제특허출원 공개 제 WO 2017/100674호에 대한 정제 방법은 모두 본원에 참고문헌으로 통합된다.
비어있는 및 완전된 입자 내용물을 계산하기 위하여, 선택된 시료 (예로, 본원의 실시예에서, GC의 수 = 입자의 수인 이오딕산올 구배-정제된 제조물)에 대한 VP3 밴드 부피가 로딩된 GC 입자에 대응하여 좌표화된다. 결과로 나온 선형 방정식 (y = mx + c)이 테스트 항목 피크의 밴드 부피에서 입자의 수를 계산하는데 사용된다. 다음으로 로딩된 20 μL 당 입자의 수 (pt)에 50을 곱하여 입자 (pt)/mL을 수득한다. GC/mL로 나누기한 pt/mL은 입자 대 게놈 사본 (pt/GC) 비를 제공한다. Pt/mL - GC/mL은 비어있는 pt/mL를 수득한다. pt/mL로 나누기한 빈 pt/mL × 100은 비어있는 입자의 백분율을 제공한다.
일반적으로, 빈 캡시드 및 포장된 게놈을 갖는 AAV 벡터 입자를 검정하는 방법은 당해 기술분야에 공지되어 있다. 예로, Grimm et al., Gene Therapy (1999), 6: 1322-1330; Sommer et al., Molec. Ther. (2003), 7: 122-128 참조. 변성된 캡시드를 테스트하기 위해, 방법은 처리된 AAV 스톡을 3가지 캡시드 단백질을 분리할 수 있는 임의의 젤, 예를 들면 완충액 중 3% 내지 8% 트리스-아세테이트를 포함한 구배 젤로 구성되는 SDS-폴리아크릴아미드 젤 전기영동을 시행하고, 다음으로 시료 물질이 분리될 때까지 젤을 전개시키고, 나일론 또는 이트로셀룰로스 막, 바람직하게 나일론 상에 젤을 블럿팅하는 것을 포함한다. 다음으로 항-AAV 캡시드 항체가 변성된 캡시드 단백질에 결합하는 일차 항체, 바람직하게 항-AAV 캡시드 단일클론 항체, 가장 바람직하게 B1 항-AAV-2 단일클론 항체로서 사용된다 (Wobus et al., J. Virol. (2000), 74: 9281-9293). 다음으로 일차 항체에 결합하고 일차 항체와의 결합을 검출하기 위한 수단을 포함하는 이차 항체, 더욱 바람직하게는 일차 항체에 공유 결합하는 검출 분자를 포함하는 항-IgG 항체, 가장 바람직하게는 호스래디쉬 퍼옥시다제에 공유 결합된 양 항-마우스 IgG 항체를 포함하는 것이 사용된다. 결합을 검출하는 방법은 일차 및 이차 항체 사이의 결합을 반정량적으로 결정하는데 사용되고, 바람직하게 방사성 동위원소 방출, 전자기 방사선 조사 또는 비색측정 변화를 검출할 수 있는 검출 방법, 가장 바람직하게는 화학발광 검출 키트이다. 예를 들면, SDS-PAGE의 경우, 컬럼 분획으로부터의 시료는 수집되어 환원제 (예로, DTT)를 포함한 SDS-PAGE 로딩 완충액에서 가열될 수 있으며, 캡시드 단백질은 프리캐스트 구배 폴리아크릴아미드 젤 (예로, 노벡스사) 상에서 분리되었다. 은 염색이 제조사의 지침에 따른 실버엑스프레스 (인비트로겐사, CA), 또는 다른 적합한 염색 방법, 즉 SYPRO 루비 또는 쿠마시 염색을 사용하여 수행될 수 있다. 일 구현예에서, 컬럼 분획에서 AAV 벡터 게놈 (vg)의 농도는 정량적 실시간 PCR (Q-PCR)에 의해 측정될 수 있다. 시료는 외인성 DNA를 제거하도록 희석하여 DNase I (또는 또 다른 적합한 뉴클레아제)로 소화시킨다. 뉴클레아제의 불활성화 이후에, 시료는 추가로 희석되어 프라이머들 사이의 DNA 서열에 특이적인 TaqManTM 형광생성 프로브를 사용하여 증폭되었다. 정의된 수준의 형광에 도달하는데 필요한 주기의 횟수 (역치 주기, Ct)는 각 시료에 대해 어플라이드 바이오시스템 프리즘 7700 서열 검출 시스템 상에서 측정되었다. AAV 벡터에 포함된 서열과 동일한 서열을 포함하는 플라스미드 DNA는 Q-PCR 반응에서 표준 곡선을 생성하는데 채용되었다. 시료로부터 획득된 주기 역치 (Ct) 값은 벡터 게놈 역가를 플라스미드 표준 곡선의 Ct 값으로 정규화함으로써 이를 결정하는데 사용된다. 디지털 PCR을 기초로 한 종결점 검정법도 사용될 수 있다.
일 양태에서, 광범위 스펙트럼 세린 프로테아제, 예로 단백질분해효소 K (예컨대 퀴아젠사로부터 구입가능함)를 사용하는 최적화된 q-PCR 방법이 사용된다. 보다 구체적으로, 최적화된 q-PCR 게놈 역가 검정법은 DNAase I 소화 이후에 시료가 단백질분해효소 K 완충액으로 희석되어 단백질분해효소 K로 처리되고, 이어서 열 불활성화가 진행되는 점을 제외하고는 표준 검정법과 유사하다. 적합하게, 시료는 시료 크기와 동등한 양의 단백질분해효소 K 완충액으로 희석된다. 단백질분해효소 K 완충액은 2배 이상으로 농축될 수 있다. 전형적으로, 단백질분해효소 K 처리는 약 0.2 mg/mL이지만, 0.1 mg/mL 내지 약 1 mg/mL으로 변화될 수 있다. 처리 단계는 일반적으로 약 55℃에서 약 15분 동안 시행되지만, 더 낮은 온도 (예로, 약 37℃ 내지 약 50℃)에서 더 긴 시간 (예로, 약 20분 내지 약 30분) 동안, 또는 더 높은 온도 (예로, 최고 약 60℃)에서 더 짧은 시간 (예로, 약 5분 내지 10분) 동안 수행될 수 있다. 유사하게, 열 불활성화는 일반적으로 약 95℃에서 약 15분 동안이지만, 온도를 낮추고 (예로, 약 70℃ 내지 약 90℃) 시간을 연장할 수 있다 (예로, 약 20분 내지 30분). 다음으로 시료를 희석하고 (예로, 1,000배), 표준 검정법에서 설명된 바와 같이 TaqMan 분석을 시행한다.
추가적으로 또는 대안적으로, 비말 디지털 PCR (ddPCR)이 사용될 수 있다. 예를 들면, ddPCR에 의해 단일가닥 및 자가-상보적 AAV 벡터 게놈 역가를 결정하는 방법이 기재되어 있다. 예로, M. Lock et al., Hu Gene Therapy Methods, Hum Gene Ther Methods, 2014년 4월; 25(2): 115-25. doi: 10.1089/hgtb.2013.131. Epub 2014년 2월 14일 참조.
간략하게, 게놈 결함성 AAV 중간물로부터 포장된 게놈 서열을 갖는 rAAV 입자를 분리하는 방법은 재조합 AAV 바이러스 입자 및 AAV 캡시드 중간물을 포함하는 현탁액에 대해 신속 성능 액체 크로마토그래피를 시행하고, 여기서 AAV 바이러스 입자 및 AAV 중간물을 높은 pH에서 평형화된 강한 음이온 교환 레진에 결합시키고, 염 구배를 적용하면서 용리물을 약 260 nm 및 약 280 nm에서 자외선 흡광도에 대해 모니터링하는 단계가 관여한다. pH는 선택된 AAV에 의존하여 조절될 수 있다. 예로, 본원에 참고문헌으로 통합되어 있는, 국제특허출원 제 WO 2017/160360호 (AAV9), 제 WO 2017/100704호 (AAVrh10), 제 WO 2017/100676호 (AAV8) 및 제 WO 2017/100674호 (AAV1) 참조. 이러한 방법에서, AAV 완전한 캡시드는 A260/A280 비가 감염점에 도달할 때 용리되는 분획으로부터 수집된다. 일 예에서, 친화 크로마토그래피 단계의 경우, 투과여과된 산물은 AAV2 혈청형을 효율적으로 포획하는 캡처 셀렉트TM 포로스 - AAV2/9 친화 레진 (라이프 테크놀로지사)에 적용될 수 있다. 이들 이온 조건 하에, 유의한 백분율의 잔류 세포성 DNA 및 단백질은 컬럼을 통과하는 반면, AAV 입자는 효율적으로 포획된다.
약제학적 조성물
약제학적 조성물은 발현 카세트, 이를 포함하는 벡터 (바이러스성 또는 비-바이러스성) 또는 발현 카세트를 포함하는 또 다른 시스템 중 하나 이상 및 담체, 현탁제 및/또는 부형제 중 하나 이상을 포함한다.
특정 구현예에서, 조성물은 적어도 하나의 rAAV 스톡 (예로, 하나의 rAAV 스톡) 및 선택적인 담체, 부형제 및/또는 보존제를 포함한다. rAAV 스톡은 예로 농도 및 용량 단위를 논의하면서 하기에 기술된 양과 같이 동일한 다수의 rAAV 벡터를 말한다.
본원에 사용된 바, "담체"는 임의의 및 모든 용매, 분산 매질, 비히클, 코팅제, 희석제, 항균제 및 항진균제, 등장제 및 흡수 지연제, 완충액, 담체 용액, 현탁액 및 콜로이드 등을 포함한다. 약제학적 활성 물질의 위해 이러한 매질 및 제제의 사용은 당해 기술분야에 널리 공지되어 있다. 또한, 보조적 활성 성분이 조성물 내에 도입될 수 있다. 용어 "약제학적으로 허용가능한"은 숙주에게 투여될 때 알레르기 또는 유사한 유해한 반응을 생성하지 않는 분자적 실체 및 조성물을 말한다. 리포좀, 나노캡슐, 미세입자, 미세구, 액체 입자 및 소포 등과 같은 전달 비히클은 적합한 숙주 세포 내로 본 발명의 조성물의 도입에 사용될 수 있다. 구체적으로, rAAV 벡터 전달된 벡터 게놈은 액체 입자, 리포좀, 소포, 나노구 또는 나노입자 등에 피막화된 전달을 위해 제형화될 수 있다.
특정 구현예에서, 발현 카세트는 액체 나노입자를 통해 전달된다. 용어 "액체 나노입자"는 평균 직경 10 내지 1,000 나노미터, 예로, 75 nm 내지 750 nm, 100 nm 내지 350 nm, 또는 250 nm 내지 500 nm로의 전형적인 구형 구조를 갖는 액체 조성물을 말한다. 일부 제형물에서, 액체 나노입자는 적어도 하나의 비-양이온성 지질, 적어도 하나의 양이온성 지질 및 적어도 하나의 컨쥬게이션된 지질을 포함할 수 있다. 당해 기술분야에 공지된, mRNA와 같은 핵산을 피막화하는데 적합한 지질 나노입자가 사용될 수 있다. "평균 직경"은 친유성 상 및 친수성 상을 포함하는 나노입자의 집단의 평균 크기이다. 이러한 시스템의 평균 크기는 당업자에게 공지된 표준 방법에 의해 측정될 수 있다. 유전자 요법에 적합한 지질 나노입자의 예는 예로 본원에 이들의 전문이 참고문헌으로 통합되는 L. Battaglia and E. Ugazio, J. Nanomaterials, Vol 2019, 논문 ID 283441, pp. 1-22; 미국 특허 공개 제 US 2012/0183589A1호; 및 국제특허출원 제 WO 2012/170930호에 기재되어 있다.
일 구현예에서, 조성물은 대상체에게 전달에 적합한 최종 제형물을 포함하고, 예로 생리학적으로 적격한 pH 및 염 농도로 완충된 수성 액체 현탁액이다. 선택적으로, 하나 이상의 표면활성제가 제형물에 존재한다. 또 다른 구현예에서, 조성물은 대상체에게 투여를 위해 희석되는 농축물로서 운반될 수 있다. 다른 구현예에서, 조성물은 동결건조되고, 투여 시 재구성될 수 있다.
당해 기술분야에서 널리 공지된, 제형물을 제조하기 위한 방법 및 제제는 예를 들면 "Remington's Pharmaceutical Sciences," Mack Publishing Company, Easton, Pa.에 기술되어 있다. 예를 들면, 제형물은 멸균수, 식염수, 폴리에틸렌 글리콜과 같은 폴리알킬렌 글리콜, 식물 기원의 오일, 수소화된 나프탈렌, 보존제 (예컨대, 옥타데실디메틸벤질 염화물, 염화암모늄, 헥사메토늄 염화물, 벤즈알코늄 염화물, 벤제토늄 염화물, 페놀, 부틸 또는 벤질 알코올, 메틸 또는 프로필 파라벤과 같은 알킬 파라벤, 카테콜, 레소르시놀, 시클로헥산올, 3-펜탄올 및 m-크레졸), 저분자량 폴리펩티드, 혈청 알부민 젤라틴 또는 면역글로불린과 같은 단백질, 폴리비닐피롤리돈과 같은 친수성 중합체, 글리신, 글루타민, 아스파라긴, 히스티딘, 아르기닌 및 라이신과 같은 아미노산, 단당류, 이당류, 및 포도당, 만노스 및 덱스트린을 포함한 기타 탄수화물, EDTA와 같은 킬레이팅제, 슈크로스, 만니톨, 트레할로스 또는 소르비톨과 같은 당, 소듐과 같은 염 형성하는 반대이온, 금속 복합체 (예로, Zn-단백질 복합체) 및/또는 트윈TM, 플루로닉스TM 또는 폴리에틸렌 글리콜과 같은 비-이온성 표면활성제과 같은 부형제, 담체, 안정화제 또는 희석제를 포함할 수 있다.
또한, 활성 성분은 예를 들면 액적형성 기법 또는 경계면 중합화에 의해 제조된 미세캡슐, 예를 들면 각각 히드록시메틸셀룰로스 또는 젤라틴-미세캡슐 및 폴리(메틸메타크릴레이트) 미세캡슐에, 콜로이드 약물 전달 시스템 (예를 들면 리포좀, 알부민 미세구, 미세에멀전, 나노입자 및 나노캡슐)에, 또는 미세에멀전에 포집될 수 있다. 이러한 기법은 Remington's Pharmaceutical Sciences 제 4판, Osol, A. Ed. (1980)에 개시되어 있다.
적합한 표면활성제 또는 표면활성제의 조합은 비독성인 비-이온성 표면활성제부터 선택될 수 있다. 일 구현예에서, 일차 히드록시기로 종결되는 이중기능성 블록 공중합체 표면활성제가, 예로 중성 pH를 갖고 평균 분자량 8400을 갖는 폴록사머 188로도 알려져 있는 플루로닉® F68 [바스프사]와 같이 선택된다. 다른 표면활성제 및 다른 폴록사머, 즉 폴리옥시에틸렌 (폴리(에틸렌 옥사이드))의 2개 친수성 사슬에 의해 연접된 폴리옥시프로필렌 (폴리(프로필렌 옥사이드))의 중앙 친수성 사슬로 구성된 비-이온성 트리블록 공중합체, 솔루톨 HS 15 (마크로골-15 히드록시스테아레이트), 라브라졸 (폴리옥시 카프릴릭 글리세리드), 폴리옥시 10 올레일 에테르, 트윈 (폴리옥시에틸렌 소비탄 지방산 에스테르), 에탄올 및 폴리에틸렌 글리콜이 선택될 수 있다. 일 구현예에서, 제형물은 폴록사머를 포함한다. 이들 공중합체는 공통적으로 문자 "P" (폴록사머)에 이어진 3자리 수로 명명되고, 처음 2자리 수 × 100은 폴리옥시프로필렌 코아의 대략적인 분자량을 나타내고, 마지막 자리수 × 100은 폴리옥시에틸렌 함량의 백분율을 나타낸다. 일 구현예에서, 폴록사머 188이 선택된다. 표면활성제는 현탁액 중 최대 약 0.0005% 내지 약 0.001%의 양으로 존재할 수 있다.
벡터는 과도한 유해 효과가 없이 또는 의학적으로 허용가능한 생리학적 효과와 함께 치료적 유익을 제공하도록 세포를 형질감염시켜 충분한 수준의 유전자 전달 및 발현을 제공하기에 충분한 양으로 투여되고, 이는 의학 분야의 당업자에 의해 결정될 수 있다. 통상적인 및 약제학적으로 허용가능한 투여 경로는 원하는 장기 (예로, 간 (선택적으로 간 동맥을 통해)), 폐, 심장, 눈, 신장)에 대한 직접적 전달, 경구, 흡입, 비강내, 경막내, 기관내, 동맥내, 안구내, 정맥내, 근육내, 피하, 피부내 및 기타 비경구 투여 경로를 포함하나 이에 한정되지 않는다. 투여 경로는 바람직한 경우 조합될 수 있다.
바이러스성 벡터의 용량은 주로 치료되는 병태, 환자의 연령, 체중 및 건강과 같은 요인에 의존한다. 예를 들면, 바이러스성 벡터의 치료적으로 유효한 인간 용량은 일반적으로 약 1 × 109개 내지 1 × 1016개 게놈 바이러스 벡터의 농도를 포함하는 약 100 mL의 용액으로 약 25 μL 내지 약 1,000 μL 범위이다. 용량은 임의의 부작용에 대응한 치료적 이익을 계산하도록 조절되고, 이러한 용량은 재조합 벡터가 채용되는 치료적 적용에 따라 달라질 수 있다. 트랜스 유전자 산물의 발현 수준은 바이러스성 벡터, 바람직하게 미니유전자를 포함하는 AAV 벡터를 생성하는 용량의 빈도를 결정하도록 모니터링될 수 있다. 선택적으로, 치료적 목적으로 기술된 것과 유사한 용량 요법은 본 발명의 조성물을 사용한 면역화에 사용될 수 있다.
복제 결함성 바이러스 조성물은 (체중 70 kg의 평균 대상체를 치료하는데) 범위 내의 모든 정수 또는 분획 양을 포함하여 약 1 × 109개 GC 내지 약 1 × 1016개, 바람직하게 인간 환자의 경우 1 × 1012개 GC 내지 약 1 × 1014개 GC의 범위에 있는 복제 결함성 바이러스의 양을 포함하도록 용량 단위로 제형화될 수 있다. 일 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 109개, 2 × 109개, 3 × 109개, 4 × 109개, 5 × 109개, 6 × 109개, 7 × 109개, 8 × 109개 또는 9 × 109개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 1010개, 2 × 1010개, 3 × 1010개, 4 × 1010개, 5 × 1010개, 6 × 1010개, 7 × 1010개, 8 × 1010개 또는 9 × 1010개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 1011개, 2 × 1011개, 3 × 1011개, 4 × 1011개, 5 × 1011개, 6 × 1011개, 7 × 1011개, 8 × 1011개 또는 9 × 1011개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 1012개, 2 × 1012개, 3 × 1012개, 4 × 1012개, 5 × 1012개, 6 × 1012개, 7 × 1012개, 8 × 1012개 또는 9 × 1012개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 1013개, 2 × 1013개, 3 × 1013개, 4 × 1013개, 5 × 1013개, 6 × 1013개, 7 × 1013개, 8 × 1013개 또는 9 × 1013개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 1014개, 2 × 1014개, 3 × 1014개, 4 × 1014개, 5 × 1014개, 6 × 1014개, 7 × 1014개, 8 × 1014개 또는 9 × 1014개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 1015개, 2 × 1015개, 3 × 1015개, 4 × 1015개, 5 × 1015개, 6 × 1015개, 7 × 1015개, 8 × 1015개 또는 9 × 1015개의 GC를 포함하도록 제형화된다. 일 구현예에서, 인간 적용을 위해, 용량은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 1010개 내지 약 1 × 1012개 GC의 범위를 갖을 수 있다.
이러한 상기 용량은 치료될 영역의 크기, 사용된 바이러스 역가, 투여 경로 및 방법의 원하는 효과에 의존하여, 범위 내의 모든 숫자를 포함하는 약 25 μL 내지 약 1,000 μL 이상의 부피 범위를 갖는, 다양한 부피의 담체, 부형제 또는 완충액 제형물로 투여될 수 있다.
임의의 적합한 투여 경로가 선택될 수 있다. 따라서, 약제학적 조성물은 임의의 적절한 투여 경로를 위해, 예를 들면 액체 용액 또는 현탁액의 형태로 (예를 들면, 정맥내 투여, 경구 투여 등을 위해) 제형화될 수 있다. 대안적으로, 약제학적 조성물은 고체 형태로 (예로, 정제 또는 캡슐의 형태, 예를 들면 경구 투여를 위해)일 수 있다. 일부 구현예에서, 약제학적 조성물은 분말, 드로프스, 에어로졸 등의 형태로일 수 있다.
방법
본원에 제공된 조성물은 생체내 전달된 효소의 표적-외 활성을 감소시키는데 유용하다. 특정 구현예에서, 조성물은 본원에서 설명된 바와 같이 약한 프로모터의 조절 하에서 효소 코딩 서열을 포함하는 발현 카세트의 비-바이러스 매개된 전달 이후에 발현된 효소의 표적-외 활성을 감소시키는데 유용하다. 특정 구현예에서, 조성물은 벡터 게놈의 AAV 매개된 전달 이후에 발현된 효소의 표적-외 활성을 감소시키는데 유용하다.
일 구현예에서, 표적화된 유전자를 편집화하는 방법이 제공된다. 방법은 뉴클레아제가 표적화되는 서열을 갖는 숙주 세포로의 전달 이후에 뉴클레아제의 발현을 안내하는 조절 서열에 작동가능하게 연결된 뉴클레아제 코딩 서열을 포함하는 핵산 서열을 포함하는 뉴클레아제 발현 카세트를 전달하는 단계로서, 조절 서열은 낮은 전사 활성을 갖는 프로모터를 포함하는 , 단계를 포함한다. 이러한 프로모터는 본원에 기술되어 있다. 또 다른 구현예에서, 방법은 본원에 기술된 바와 같이, 발현 카세트를 포함하는 조성물, 바이러스성 벡터 또는 rAAV를 전달하는 단계를 포함한다.
또 다른 구현예에서, 유전자 표적화 뉴클레아제의 표적-외 활성을 감소시키는 방법이 제공된다. 방법은 뉴클레아제가 표적화되는 서열을 갖는 숙주 세포로의 전달 이후에 뉴클레아제의 발현을 안내하는 조절 서열에 작동가능하게 연결된 뉴클레아제 코딩 서열을 포함하는 핵산 서열을 포함하는 뉴클레아제 발현 카세트를 전달하는 단계로서, 조절 서열은 낮은 전사 활성을 갖는 프로모터를 포함하는 , 단계를 포함한다. 이러한 프로모터는 본원에 기술되어 있다. 또 다른 구현예에서, 방법은 본원에 기술된 바와 같이, 발현 카세트를 포함하는 조성물, 바이러스성 벡터 또는 rAAV를 전달하는 단계를 포함한다.
특정 구현예에서, 약한 프로모터의 효과는 시험관내에서 평가될 수 있다. 예를 들면, 뉴클레아제의 반감기는 세포가 단백질의 번역을 종결하도록 처리한 다음 (예로, 시클로헥시미드 (CHX)를 사용함) 처리-후 상이한 시점에 웨스턴 블럿을 수행함으로써 시험관내 (배양된 세포)에서 평가될 수 있다. 뉴클레아제의 표적-외 활성을 평가하는 다른 적합한 방법은 당업자에 의해 쉽게 결정할 수 있다.
표적외 뉴클레아제 활성의 감소는 문헌에 기술되어 있는 다양한 접근법을 사용하여 결정될 수 있다. 이러한 뉴클레아제 특이성을 결정하는 방법은 무-세포 방법, 예컨대 부위-시퀸싱 [Cameron, P., et al., (2017) Mapping the genomic landscape of CRISPR-Cas9 cleavage. Nat. Methods, 14: 600-606], 이중게놈-시퀸싱 [Kim, D., et al., (2015) Digenome-seq: genome-wide profiling of CRISPR-Cas9 off-target effects in human cells. Nat. Methods, 12: 237-243, p 243이 이어진 p231], 및 원형-시퀀싱 [Tsai, S.Q., et al., (2017) CIRCLE-seq: a highly sensitive in vitro screen for genome-wide CRISPR-Cas9 nuclease off-targets. Nat. Methods, 14: 607-614]; 및 시험관내 기반의 방법, 예컨대 GUIDE-Seq [Tsai (2017), Nat. Methods, 14: 607-614] 및 혼입-결함성 렌티바이러스성 벡터 포획 (IDLV) [Gabriel, R., et al. (2011) An unbiased genome-wide analysis of zinc-finger nuclease specificity. Nat. Biotechnol., 29: 816-823; Wang, X., et al., (2015) Unbiased detection of off-target cleavage by CRISPR-Cas9 and TALENs using integrase-defective lentiviral vectors. Nat. Biotechnol., 33: 175-178]을 포함한다.
일부 구현예에서, 표적-외 활성은 ITR-Seq에 의해 평가된다. 예로, 본원에 이의 전문이 참고문헌으로 통합되는 간행물 Breton et al., ITR-Seq, a next-generation sequencing assay, identifies genome-wide DNA editing sites in vivo following adeno-associated viral vector-mediated genome editing, BMC Genomics (2020), 21: 239 참조.
일 양태에서, 표적화된 유전자를 편집화하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 뉴클레아제 발현 카세트를 전달하는 단계를 포함하는, 방법이 제공된다.
일 양태에서, 표적화된 유전자를 편집화하는 방법으로서, 본원에 기술된 조성물을 전달하는 단계를 포함하는, 방법이 제공된다.
일 양태에서, 표적화된 유전자를 편집화하는 방법으로서, 본원에 기술된 바이러스성 또는 비-바이러스성 벡터를 전달하는 단계를 포함하는, 방법이 제공된다.
일 양태에서, 표적화된 유전자를 편집화하는 방법으로서, 본원에 기술된 rAAV를 전달하는 단계를 포함하는, 방법이 제공된다.
일 양태에서, 고콜레스테롤혈증과 같은 콜레스테롤 관련 장애(들)에 걸린 환자를 치료하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 인간 PCSK9 유전자 내의 부위를 인식하는 메가뉴클레아제를 포함하는 뉴클레아제 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다.
일 양태에서, 원발성 고옥살산뇨증과 같은 알라닌 글리옥시레이트 아미노전이효소 유전자에서 결함과 관련된 장애에 걸린 환자를 치료하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 인간 HAO 유전자 내의 부위를 인식하는 메가뉴클레아제를 포함하는 뉴클레아제 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다. 특정 구현예에서, 장애는 원발성 고옥살산뇨증 (PH1)이다.
일 양태에서, 트랜스타이레틴 (TTR) 유전자의 결함과 관련된 장애에 걸린 환자를 치료하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 인간 TTR 유전자 내의 부위를 인식하는 메가뉴클레아제를 포함하는 뉴클레아제 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다. 특정 구현예에서, 장애는 TTR 관련 유전성 아밀로이드증이다.
또 다른 양태에서, 아포지단백질 C-Ⅱ (APOC3) 유전자의 결함과 관련된 장애에 걸린 환자를 치료하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 인간 APOC3 유전자 내의 부위를 인식하는 메가뉴클레아제를 포함하는 뉴클레아제 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다.
일 양태에서, 분지쇄 α-케토산 탈수소효소 복합체 (BCKDC) E1α 유전자에서 결함과 관련된 장애에 걸린 환자를 치료하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 인간 BCKDC E1α 유전자 내의 부위를 인식하는 메가뉴클레아제를 포함하는 뉴클레아제 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다. 특정 구현예에서, 장애는 단풍시럽뇨병이다.
일 양태에서, CRISPR/Cas 관련 뉴클레아제를 사용하여 유전자를 편집하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 원하는 유전자 내의 부위를 인식하는 CRISPR/Cas 관련 뉴클레아제의 코딩 서열을 포함하는 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다.
일 양태에서, TALEN을 사용하여 유전자를 편집하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 원하는 유전자 내의 부위를 인식하는 TALEN 코딩 서열을 포함하는 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다.
일 양태에서, 아연 핑거 뉴클레아제를 사용하여 유전자를 편집하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 원하는 유전자 내의 부위를 인식하는 아연 핑거 뉴클레아제의 코딩 서열을 포함하는 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다.
일 양태에서, 메가뉴클레아제를 사용하여 유전자를 편집하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 원하는 유전자 내의 부위를 인식하는 메가뉴클레아제의 코딩 서열을 포함하는 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다.
특정 구현예에서, 임의의 상기 기술된 유전자를 표적하는 메가뉴클레아제가 아닌 뉴클레아제가 고려된다.
특정 구현예에서, 본원에 기술된 바와 같이 약제학적 조성물에서 뉴클레아제 발현 카세트, 비-바이러스성 벡터, 바이러스성 벡터 (예로, rAAV) 또는 이와 동일한 임의의 것은 환자에서 유전자 편집화를 위해 투여가능하다. 특정 구현예에서, 방법은 비-배아 유전자 편집화에 유용하다. 특정 구현예에서, 환자는 소아 (예로, 신생아 내지 약 9개월)이다. 특정 구현예에서, 환자는 소아보다 나이가 많은, 예로 12개월 이상이다.
본원에 사용된 바, "a", "an" 또는 "the"는 하나 이상을 의미할 수 있다. 예를 들면, "a" 세포는 단일 세포 또는 다수의 세포를 의미할 수 있다.
특정 구현예에서, 용어 "메가뉴클레아제"는 12개 이상의 염기쌍인 인식 서열에서 이중가닥 DNA에 결합하는 엔도뉴클레아제를 말한다. 바람직하게, 본 발명의 메가뉴클레아제의 인식 서열은 22개의 염기쌍이다. 메가뉴클레아제는 I-CreI으로부터 유래한 엔도뉴클레아제일 수 있으며, 고유의 I-CreI와 비교하여 예를 들면 DNA 결합 특이성, DNA 절단 활성, DNA 결합 친화도 또는 이중합 특성의 관점으로 변형되었던 I-CreI의 조작된 변이체를 말할 수 있다. 이러한 I-CreI의 변형된 변이체를 생산하는 방법은 당해 기술분야에 공지되어 있다. 예로, 국제특허출원 제 WO 2007/047859호 참조. 본원에 사용된 메가뉴클레아제는 이종이량체로서 이중가닥 DNA에 결합한다. 또한, 메가뉴클레아제는 DNA 결합 도메인의 쌍이 단일 폴리펩티드 내에 펩티드 링커를 사용하여 연결된 "단일사슬 메가뉴클레아제"일 수 있다. 용어 "귀소 엔도뉴클레아제"는 용어 "메가뉴클레아제"와 동의어이다. 본원에 이의 전문이 참고문헌으로 통합되는, 특정 PCSK9 메가뉴클레아제를 기술하는, 국제특허출원 제 WO 2018/195449호 참조. 일 구현예에서, 메가뉴클레아제는 본원에 기술된 ARCUS 메가뉴클레아제가 아니다.
본원에 기술된 용어 "특이성"은 인식 서열로 지칭되는 염기쌍의 특정한 서열에서만 또는 인식 서열의 특정한 세트에서만 이중가닥 DNA 분자를 인식하고 절단하는 메가뉴클레아제의 능력을 의미한다. 인식 서열의 세트는 특정 보존된 위치 또는 서열 모티브를 공유할 것이지만, 하나 이상의 위치에서 중복될 수 있다. 매우 특이적인 메가뉴클레아제는 하나 또는 매우 적은 인식 서열만을 절단할 수 있다. 특이성은 당해 기술분야에 공지된 임의의 방법에 의해 결정될 수 있다.
약어 "sc"는 자가-상보적임을 말한다. "자가-상보적인 AAV"는 재조합 AAV 핵산에 보유되는 코딩 영역이 분자내 이중가닥 DNA 주형을 형성하도록 설계되었던 구조물을 말한다. 감염 시, 세포 매개된 두 번째 가닥의 합성을 기다리기보다는, scAAV의 2개 상보적인 가닥이 결합하여 즉각적 복제 및 전사가 준비된 하나의 이중가닥 DNA (dsDNA) 단위를 형성할 것이다. 예로, D.M. McCarty et al, "Self-complementary recombinant adeno-associated virus (scAAV) vectors promote efficient transduction independently of DNA synthesis", Gene Therapy, (2001년 8월), Vol 8, No. 16, pp 1248-1254 참조. 자가-상보적인 AAV는 예로 미국 특허 제 US 6,596,535호; 제 US 7,125,717호; 및 제 US 7,456,683호에 기술되어 있으며, 이들 각각은 본원에 이의 전문이 참고문헌으로 통합된다.
본원에 사용된 용어 "작동가능하게 연결된"은 관심있는 유전자와 인접하는 발현 조절 서열, 및 관심있는 유전자를 조절하도록 트랜스로 또는 일정 거리에서 작동하는 발현 조절 서열 둘 다를 말한다.
핵산 서열 또는 단백질을 기술하는데 사용된 용어 "외인성"은 핵산 서열 또는 단백질이 염색체 또는 숙주 세포에서 이것이 존재하는 위치에서 자연 발생하지 않음을 의미한다. 또한, 외인성 핵산 서열은 외부로부터 유래하고 동일한 발현 카세트 또는 숙주 세포 내에 삽입되지만, 비-자연 상태로 예로 상이한 사본수 또는 상이한 조절 요소의 조절 하에 존재하는 서열을 말한다.
용어 "이종유래"는 단백질 또는 핵산과 관련하여 사용될 때 단백질 또는 핵산이 둘 이상의 서열 또는 자연에서 서로 동일한 동일한 관계로 발견되지 않는 서열을 포함함을 나타낸다. 예를 들면, 전형적으로 새로운 기능적 핵산을 만들도록 배열된 관련없는 유전자로부터의 둘 이상의 서열을 갖는 핵산은 재조합으로 생산된다. 예를 들면, 일 구현예에서, 핵산은 상이한 유전자로부터 코딩 서열의 발현을 안내하도록 배열된 하나의 유전자로부터 나온 프로모터를 갖는다.
본원에 사용된 용어 "숙주 세포"는 벡터 (예로, 재조합 AAV)가 생산 플라스미드로부터 생산되는 포장하는 세포주를 말할 수 있다. 대안으로, 용어 "숙주 세포"는 트랜스 유전자의 발현을 원하는 임의의 표적 세포를 말할 수 있다. 따라서, "숙주 세포"는 임의의 수단, 예로 전기천공, 칼슘 포스페이트 침전, 미세주사, 형질전환, 바이러스 감염, 형질감염, 리포좀 전달, 막 융합 기법, 고속 DNA 코팅된 펠렛 및 원형질체 융합에 의해 세포 내에 도입되었던 외인성 또는 이종유래 핵산 서열을 포함하는 원핵 또는 진핵 세포를 말한다. 본원의 특정 구현예에서, 용어 "숙주 세포"는 본원에 기술된 조성물의 시험관내 평가를 위한 다양한 포유동물 종의 세포 배양물을 말한다. 본원의 다른 구현예에서, 용어 "숙주 세포"는 바이러스성 벡터 또는 재조합 바이러스를 생성하고 포장하도록 채용된 세포를 말한다. 다른 구현예에서, 용어 "숙주 세포"는 본원에 기술된 질환 또는 병태에 대해 생체내에서 처리되고 있는 대상체의 표적 세포를 언급하도록 의도된다. 특정 구현예에서, 용어 "숙주 세포"는 간 세포 또는 간세포이다.
"복제 결함성 바이러스" 또는 "바이러스성 벡터"는 관심있는 유전자를 포함하는 발현 카세트가 바이러스 캡시드 또는 외피에 포장되는 합성 또는 인공 바이러스 입자로서, 바이러스 캡시드 또는 외피 내에 포장된 임의의 바이러스 게놈 서열도 복제 결함성인, 즉 이들이 자손 비리온을 생성할 수는 없지만 표적 세포를 감염시키는 능력은 보유하는, 바이러스 입자를 말한다. 일 구현예에서, 바이러스성 벡터의 게놈은 복제하는데 필요한 효소를 인코딩하는 유전자를 포함하지 않지만 (게놈이 인공 게놈의 증폭 및 포장에 필요한 신호가 연접된 관심있는 유전자만을 포함하는 "내용물이 없음"으로 조작될 수 있음), 이들 유전자가 생산 과정 동안 공급될 수 있다. 따라서, 이것은 자손 비리온에 의한 복제 및 감염이 복제에 필요한 바이러스 효소가 존재하지 않고는 발생할 수 없기 때문에 유전자 요법의 사용에 안전한 것으로 간주된다.
핵산 서열의 맥락에서 용어 "서열 일치도", "서열 일치도 백분율" 또는 "일치하는 백분율"은 2가지 서열에서 최대 상응성으로 정렬될 때 동일한 잔기를 말한다. 서열 일치도 비교의 길이는 바람직하게 게놈의 전장, 유전자 코딩 서열의 전장 또는 적어도 약 500개 내지 5,000개 뉴클레오티드의 단편에 걸쳐질 수 있다. 그러나, 더 작은 단편 중의 일치도, 예로 적어도 약 7개의 뉴클레오티드, 보통 적어도 약 20개 내지 24개의 뉴클레오티드, 적어도 약 28개 내지 32개의 뉴클레오티드, 적어도 약 36개 이상의 뉴클레오티드도 바람직할 수 있다. 유사하게, "서열 일치도 백분율"은 아미노산 서열에 대해 단백질의 전장 또는 이의 단편에 걸쳐 쉽게 결정될 수 있다. 적합하게, 단편은 적어도 약 8개 아미노산의 길이이고, 최대 약 700개의 아미노산일 수 있다. 적합한 단편의 예는 본원에 기술된다.
아미노산 또는 이들의 단편을 언급할 때, 용어 "실질적인 상동성" 또는 "실질적인 유사도"는 또 다른 아미노산 (또는 이의 상보적 가닥)을 사용한 적절한 아미노산 삽입 또는 결실과 최적으로 정렬될 때 정렬된 서열과 적어도 약 95% 내지 99%의 아미노산 서열 일치도가 존재함을 나타낸다. 바람직하게, 상동성은 전장의 서열, 또는 이의 단백질, 예로 cap 단백질, rep 단백질, 또는 적어도 8개의 아미노산, 더욱 바람직하게 적어도 15개 아미노산의 길이인 이들의 단편에 걸쳐질 수 있다. 적합한 단편의 예는 본원에 기술된다.
용어 "높게 보존된"은 적어도 80% 일치도, 바람직하게 적어도 90% 일치도, 더욱 바람직하게 97% 초과의 일치도를 의미한다. 일치도는 당업자라면 숙지하고 있는 알고리즘 및 컴퓨터 프로그램을 의지하여 당업자에 의해 쉽게 결정될 수 있다.
일반적으로, 2가지의 상이한 아데노 관련 바이러스 사이의 "일치도", "상동성" 또는 "유사도"를 언급할 때, "일치도", "상동성" 또는 "유사도"는 "정렬된" 서열을 기준으로 결정된다. "정렬된" 서열 또는 "정렬"은 기준 서열과 비교하여 염기 또는 아미노산을 결실하거나 첨가하는 교정을 종종 포함하는 다수의 핵산 서열 또는 단백질 (아미노산) 서열을 말한다. 실시예에서, AAV 정렬은 기준점으로서 공개된 AAV9 서열을 사용하여 수행된다. 정렬은 임의의 다양한 공개적으로 사용가능한 또는 구입가능한 다수의 서열 정렬 프로그램을 사용하여 수행된다. 이러한 프로그램의 예는 "크러스탈 오메가 (Clustal Omega)", "크러스탈 W", "CAP 서열 어셈블리", "MAP" 및 "MEME"를 포함하고, 이는 인터넷 상의 웹 서버를 통해 접근가능하다. 이러한 프로그램의 다른 출처는 당업자에게 공지되어 있다. 대안적으로, 벡터 NTI도 사용될 수 있다. 또한, 뉴클레오티드 서열 일치도를 측정하는데 사용될 수 있는, 상기에 설명된 프로그램에 포함된 것을 포함하여 당해 기술분야에 공지된 알고리즘이 많이 있다. 또 다른 예로서, 폴리뉴클레오티드 서열이 GCG 버전 6.1의 프로그램, FastaTM를 사용하여 비교될 수 있다. FastaTM은 질문 및 검색 서열 사이에 최고 중첩 영역의 정렬 및 서열 일치도 백분율을 제공한다. 예를 들면, 핵산 서열 사이의 서열 일치도 백분율은 본원에 참고문헌으로 통합되는 GCG 버전 6.1에 제공된 이의 디폴트 매개변수 (단어 크기 6 및 점수매김 매트릭스의 NOPAM 인자)로 FastaTM를 사용하여 결정될 수 있다. 또한, 다수의 서열 정렬 프로그램, 예로 "크러스탈 오메가", "크러스탈 X", "MAP", "PIMA", "MSA", "블록메이커", "MEME" 및 "매치-박스" 프로그램이 아미노산 서열에 사용가능하다. 일반적으로, 임의의 이들 프로그램은 당업자라면 필요한 경우 설정을 변경할 수 있지만, 디폴트 설정으로 사용된다. 대안적으로, 당업자라면 기준이 된 알고리즘 및 프로그램에 의해 제공된 수준과 적어도 같은 일치도 또는 정렬을 제공하는 또 다른 알고리즘 또는 컴퓨터 프로그램을 사용할 수 있다. 예로, J. D. Thomson et al., Nucl. Acids Res., "A comprehensive comparison of multiple sequence alignments", 27(13): 2682-2690 (1999) 참조.
본원에 사용된 용어 "약"은 기준 정수 및 이들 사이의 값으로부터 ± 10%dml 변화를 말한다. 예를 들면, "약" 40개의 염기쌍은 ± 4개를 포함한다 (즉, 정수 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개를 포함하는 36개 내지 44개). 다른 값의 경우, 구체적으로 백분율을 언급할 때 (예로, 90% 일치도, 약 10% 분산 또는 약 36% 미스매칭), 용어 "약"은 정수 및 분획 둘 다를 포함한 범위 내의 모든 값을 포함한다.
본 명세서 및 청구항 전체에 걸쳐 사용된 바, 용어 "포함하는 (comprising)", "포함하는 (containing)", "포함하는 (including)" 및 이들의 활용형은 다른 구성성분, 요소, 정수 및 단계 등을 포함한다. 역으로, 용어 "구성되는" 및 이의 활용형은 다른 다른 구성성분, 요소, 정수 및 단계 등을 배제시킨다.
본 명세서에서 달리 정의되지 않은 경우라면, 본원에 사용된 기술 및 과학 용어는 당업자에게 본 출원에 사용된 많은 용어에 대한 일반적인 내용을 제공하는 출판된 교과서를 참조하여 당업자라면 공통적으로 이해하는 바와 동일한 의미를 갖는다.
실시예
ARCUS 뉴클레아제 (프레시전 바이오사이언스사에 의해 추가로 조작된 I-CreI 엔도뉴클레아제)는 DNA에서 22개 bp 표적 서열을 인식하고 절단한다. 세포성 단백질은 DNAdptj 이들 파손을 인식하여 복구한다. 이러한 복구 기작의 결과는 편집된 좌위에서 뉴클레오티드의 삽입 또는 결실 (인델)이고, 이들 변형은 상응하는 유전자의 발현에 영향을 줄 수 있다.
본 발명자들 등은 마우스 및 레서스 머카크 둘 다의 연구에서 ARCUS 뉴클레아제의 아데노 관련 바이러스 (AAV) 벡터 매개된 전달 이후에 DNA 표적 영역에서 높은 편집화 백분율을 관찰하였다. 그러나, 표적-내 영역과 유사한 서열도 인델을 포함하는 것으로 관찰되고, ARCUS 뉴클레아제의 표적-외 활성을 시사하였다.
본 발명자들은 특정 수준의 M2PCSK9가 표적-내 편집화에 필요하고, 이러한 역치를 능가하는 뉴클레아제 발현의 증가가 표적-외 활성을 생성하는 것으로 가설을 세웠다. M2PCSK9 발현의 수준을 감소시키기 위하여, 우리는 AAV 구조물에서 부모 TBG 프로모터를 낮은 전사 활성을 갖는 프로모터로 대체하였다.
실시예 1 -
생체내
마우스 연구
본 발명자들 등은 마우스 및 레서스 머카크 둘 다의 연구에서 ARCUS 뉴클레아제의 아데노 관련 바이러스 (AAV) 벡터 매개된 전달 이후에 DNA 표적 영역에서 높은 편집화 백분율을 관찰하였다. 그러나, 표적-내 부위와 유사한 서열도 인델을 포함하는 것으로 관찰되고, ARCUS 뉴클레아제의 표적-외 활성을 시사하였다. 이러한 표적-외 활성은 바람직하지 않으며, 특히 임상 연구에서는 표적-내 효능을 유지하면서 이러한 표적-외 활성을 감소시키거나 제거하는 것이 필수적이다.
본 발명자들의 가설은 트랜스 유전자의 높은 발현이 바람직한 유전자 요법과는 대조적으로, 게놈 편집화가 트랜스 유전자의 더 낮은 발현을 요구할 수 있는 반면 더 높은 발현이 표적-외 편집화를 역시 촉진시킬 것이라는 점이다. 따라서, 본 발명의 목적은 트랜스 유전자의 전사를 감소시킴으로써 이의 발현을 감소시키는 것이다. 이것은 약한 전사 활성을 갖는 간-특이적 프로모터를 선택함으로써 달성될 수 있다.
후보 프로모터의 선별은 2가지 방법으로 시행되었다. 첫 번째 접근법에서, 본 발명자들은 RNA 발현이 낮은 간-특이적 인간 유전자를 확인하였다. 본 발명자들은 전사 활성의 매개변수로서 공통 전사물 발현 수준 (NX 수준)을 사용하여 인간 아틀라스 단백질 데이터베이스를 검색하였으며, 우리는 간에서 전사가 역시 강화되는 유전자를 선별하였다.
TBG (갑상샘 호르몬 결합 글로불린) 프로모터는 간 내로 트랜스 유전자의 AAV 매개된 전달에 유용한 것으로 확인되어 있다. 본 발명자들은 간에서 역시 농축되는 NX 수준이 감소되는 3가지 유전자를 선택하였다. 우리는 스위치기어 게노믹스 (칼스베드, CA)로부터 나온 이들 유전자에 대한 프로모터 영역을 획득하였다 (표 1).
우리의 두 번째 접근법의 경우, 본 발명자들은 TBG 프로모터의 더 작은 (176개 bp) 버전인 TBG-S1 프로모터의 전사 활성을 이의 서열의 단축에 의해 감소시키는 것을 목표로 하였다. 우리는 상류 영역으로부터 시작하여, 이러한 서열의 길이를 증가시키면서 제거하고, 결과로 생성된 프로모터 TBG-S1-F140 (F140), TBG-S1-F113 (F113) 및 TBG-S1-F64 (F64)는 각각 TBS-S1 프로모터의 140개, 113개 또는 64개 bp를 포함하였다.
PCSK9에 특이적인 ARCUS 뉴클레아제의 발현이 이들 6가지 약한 프로모터 중 하나에 의해 매개되는 AAV 혈청형 8 벡터를 생산하였다. 이러한 AAV 게놈의 모식적 예시는 도 1에 나타낸다. 다음과 같이 벡터를 생산하였다.
(a) AAV8.CCL16-1k.ARCUS2.bGH
(b) AAV8.CYP26A1-1k.ARCUS2.bGH
(c) AAV8.SLC22A9-1k.ARCUS2.bGH
(d) AAV8.TBG-S1-F64.ARCUS2.bGH
(e) AAV8.TBG-S1-F113.ARCUS2.bGH
(f) AAV8.TBG-S1-F140.ARCUS2.bGH
초기 테스트는 마우스에서 수행하였다. 간략하게, 마우스에게 인간 PCSK9 발현하는 AAV를 투여하고, 2주 후에 마우스에게 PCSK9 특이적 ARCUS 뉴클레아제를 상이한 약한 프로모터 하에 발현하는 AAV의 제 2 주사를 주었다. 양성 대조군으로서, 본 발명자들은 뉴클레아제 발현이 TBG 프로모터에 의해 매개되는 구조물을 사용하였다. 제 2 벡터의 투여 이후 7주째, 마우스를 마취시키고, 추가 분석을 위해 간을 수집하였다.
ARCUS 뉴클레아제의 표적 서열에 상응하는 영역에서 인델 수준은 차세대 시퀸싱 검정법에 의해 정량화하였다 (도 2a 및 도 2b). 결과는 2가지의 약한 프로모터 실험군 (TBG-S1-F113 및 TBG-S1-F140)에서 인델 백분율이 뉴클레아제 투여 이후 7주째 대략 40%임을 나타내어, 표적-내 활성이 유지됨을 시사하고 있다. 나머지 실험군에서, 표적-내 활성은 표적화가 60% 내지 70%인 TBG 대조군을 제외하고는 10% 이하이었다 (도 2a 및 도 2b (각각 선형 및 로그 척도)). 도 2c는 ELISA 검정법에 의해 결정되는, 처리군 당 혈청에서 재조합 PCSK9의 평균 수준을 나타낸다.
다음으로, 뉴클레아제 활성의 결과로서 게놈 DNA에서 표적-외 좌위의 수는 ITR-Seq로 불리는 NGS 기반의 방법을 사용하여 결정하였다. 간행물 Breton et al., ITR-Seq, a next-generation sequencing assay, identifies genome-wide DNA editing sites in vivo following adeno-associated viral vector-mediated genome editing, BMC Genomics (2020), 21: 239은 본원에 이의 전문이 참고문헌으로 통합된다. 약한 프로모터 실험군 모두의 경우 표적-외 좌위의 수에서 표적 외부의 수가 대략 160개인 TBG 대조군과 비교하여 감소가 있다 (도 3).
이들 벡터의 표적-외 활성을 측정하는 더욱 정량적인 접근법은 확인된 외부 표적의 하위집합에서 인델을 계산하는 것이다. 단지 TBG 대조군, TBG-S1-F113 및 TBG-S1-F140 실험군에서 이들이 가장 높은 인델%를 나타내기 때문에 분석을 수행하였다. 도 4는 확인된 외부 표적에 해당하는 게놈 위치 세트에서 인델을 나타낸다. 각 외부 표적에 대한 인델 수준을 TBG 대조군의 인델 수준 (임의 값 1)과 비교하여 나타낸다. 분석된 약한 프로모터 실험군에서 대략 20배의 인델 감소가 있었으며, 이들 프로모터의 사용이 뉴클레아제 표적-외 활성을 분명하게 감소시킴을 시사하고 있다.
주사를 맞은 마우스에서 hPCSK9 수준은 도 5에 나타낸다.
전반적으로, 이들 결과는 게놈 편집화 뉴클레아제의 발현을 매개하는데 약한 간-특이적 프로모터를 사용하는 것이 표적-내 활성을 유지하면서 이들의 표적-외 활성을 감소시키는 유망한 전략임을 나타낸다.
실시예 2 - NHP 파일럿 연구
외부 표적의 감소가 NHP에서 보존되는지 여부를 관찰하기 위하여, 레서스 머카크에게 6 × 1012개 GC/kg의 용량의 벡터를 처리하였다. 생검 데이터를 18일째 수집하였다 (최대 1년 추적될 것임). 벡터 투여 이후 28일 동안 매주 채혈, 다음으로 연구 종결 시까지 격주 채혈을 수행하였다. 테스트된 벡터는 AAV8.TBG.M2PCSK9 및 AAV8.TBG-S1-F113.M2PCSK9이었다. 다음의 연구를 수행하였다: AAV8 캡시드에 대한 항체 중화; CBC/화합물/응집/지질 패널; ELISA에 의한 PCSK9 발현의 혈청; IFN-g ELISPOT을 위해 8주마다 PBMC 분리; 18일 및 128일째 간 생검; 및 차세대 시퀸싱에 의한 표적-내 및 표적-외 게놈 편집화를 검출하는 DNA/RNA 분석.
도 7 내지 도 10에 나타낸 일부 테이터의 요약은 도 6에 나타낸다. 인델% (도 7) 및 외부 표적의 수 (도 8)는 AAV 처리-후 18일째 간 생검으로부터 나온 DNA에서 결정하였다. PCSK9 수준 (기저선 백분율로서)은 도 9에 나타낸다 (AAV 처리-후 7주째). LDL 수준 (기저선 백분율로서)은 도 10에 나타낸다.
본 발명자들은 처리된 NHP에서 PCSK9 및 LDL 수준의 유사한 감소를 관찰하였다. 약한 프로모터의 사용을 통해 ARCUS 뉴클레아제를 발현하는 것은 마우스 및 NHP에서 뉴클레아제 표적-외 활성을 PCSK9 유전자에 대한 이의 표적-내 활성을 유지하면서 감소시킨다.
실시예 3 - GLP 독성 연구
GLP 독성은 NHP (n = 27)에서 12일째 데이터 및 1년 동안의 추적으로 수행된다. 연구 설계는 도 11에 나타낸다. 서열번호 13에 나타낸 벡터 게놈을 포함하는 AAVhu37.TBG-S1-F113.M2PCSK9 벡터의 정맥 투여는 3회 용량, 1.2e12, 6.0e12, 3.0e13 중 1회에 제공하였다. 28일 동안 매주 채혈, 다음으로 연구 종결 시까지 격주 채혈을 수행하였다. 테스트된 벡터는 AAV8.TBG.M2PCSK9 및 AAV8.TBG-S1-F113.M2PCSK9이었다. 다음의 연구를 수행하였다: AAVhu.37 캡시드에 대한 항체 중화; CBC/화합물/응집/지질 패널; ELISA에 의한 PCSK9 발현의 혈청; IFN-g ELISPOT을 위해 8주마다 PBMC 분리; 모든 NHP에 대한 18일째 간 생검; 차세대 시퀸싱에 의한 표적-내 및 표적-외 게놈 편집화를 검출하는 DNA/RNA 분석; 실험군 당 3마리 NHP에 대한 28일째 부검 - 모든 주요 장기에 대한 조직병리학 및 생체분포; 및 실험군 당 마지막 3마리 NHP에 대한 180일 및 364일째 간 생검.
본 발명자들은 상기 설명된 연구와 같이 처리된 NHP에서 PCSK9 및 LDL 수준의 유사한 감소를 관찰할 것으로 예상한다. 본 발명자들은 약한 프로모터의 사용을 통해 ARCUS 뉴클레아제를 발현하는 것이 NHP에서 뉴클레아제 표적-외 활성을 PCSK9 유전자에 대한 이의 표적-내 활성을 유지하면서 감소시킬 것으로 예상한다.
본 명세서에서 인용된 모든 문서, 뿐만 아니라 Breton et al., Increasing the Specificity of AAV-Based Gene Editing through Self-Targeting and Short-Promoter Strategies, Mol. Ther. 2021년 3월, 3일, 29(3): 1047-1056. doi: 10.1016/j.ymthe.2020.12.028. Epub 2020년 12월 25일은 본원에 참고문헌으로 통합된다. 2020년 4월 27일에 제출된 미국 가특허출원 제 US 63/016,541호, 2020년 6월 2일에 제출된 미국 가특허출원 제 US 63/033,738호, 2020년 10월 9일에 제출된 미국 가특허출원 제 US 63/089,796호, 및 2020년 4월 27일에 제출된 미국 가특허출원 제 US 63/016,139호는 이들의 서열목록과 함께 이들의 전문이 본원에 참고문헌으로 통합된다. 본원과 함께 제출된 "20-9267PCT_Seq-Listing_ST25.txt"로 명명된 서열목록, 및 이의 서열 및 텍스트는 본원에 참고문헌으로 통합된다. 본 발명이 구체적인 구현예를 언급하면서 설명되었던 한편, 본 발명의 정신을 벗어나지 않고도 변형이 만들어질 수 있음을 이해할 것이다. 이러한 변형은 첨부된 청구항의 범위 내에 속하도록 의도된다.
SEQUENCE LISTING
<110> The Trustees of the University of Pennsylvania
<120> COMPOSITIONS AND METHODS FOR REDUCING NUCLEASE EXPRESSION AND
OFF-TARGET ACTIVITY USING A PROMOTER WITH LOW TRANSCRIPTIONAL
ACTIVITY
<130> UPN-20-9267PCT
<150> US 63/016,139
<151> 2020-04-27
<160> 25
<170> PatentIn version 3.5
<210> 1
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> CRE motif
<400> 1
Leu Ala Gly Leu Ile Asp Ala Asp Gly
1 5
<210> 2
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> CRE Recognition sequence
<400> 2
caaaacgtcg tgagacagtt tg 22
<210> 3
<211> 978
<212> DNA
<213> Homo sapiens
<400> 3
acctgaagag agaggaagct gtgggacagg tccagccaga gcccaggcca gaggggcaga 60
agctggagtc ctggagcaca gacgcaggtt gtcaggtgca cagagttgga gggtcccctg 120
ctggtcatgg ttggccatgg gggcacccag gagggatcag cgagctggct acacctaaaa 180
atcagtccaa agtccgaggt ccaaagagat aaataaaaac attgacaaat aagtcaaacg 240
gtccagcaac aaatggggac ccaaggatca ggcacattgt tttttttttt tttggagtat 300
tagcatacac tgtgacatga aagagtgtga gctcaatcat gtggccttgg actgggagag 360
ggcatttcct tctcagaggc aactaagccc tacctttgcc tcagtctggg ctctgtaatc 420
ctgctttgtg ctcatctccc caagactgat cacctggggg aagctggggt ggttcaaccc 480
tgcctgccct tccccaacat acagatggtg gcaggtaaca tggtgaaatc aaacagatct 540
ggtttttcat ccgcctatcc acccaggtga ccttggacaa tttatttagc ctctaggcct 600
cagtagtccc agggaagtaa taatcgctac ttcactattt taaggattat ataagatagg 660
gcatgtaagg tagctgacac acattcgccc atttcttcac gtgaattcag attctactga 720
attcagctct gcaccaagtc ccatcctctg ctgccctctg tttcagcaaa cactgaggcc 780
tgttgtttct cctcctctac cggctctgat gcggtcaagg tccagagagc tgagtagttg 840
gcaagcggac caccagcaac agacaacatc ttcattcggc tctccctgaa gctgtactgc 900
ctcgctgaga ggatgaaggt ctccgaggct gccctgtctc tccttgtcct catccttatc 960
attacttcgg cttctcgc 978
<210> 4
<211> 919
<212> DNA
<213> Homo sapiens
<400> 4
tttgcctcca attcttccac agcacatagt gcatctcaca taatatttat aatgttggag 60
tgcaattgtt tatgtactct ctcttactta ctcaactata agatccttga acttgtcaca 120
cacgttactt taggaactag catggaaaag gtcttcacaa atactatctg aaaaatcaat 180
aagccagtaa aagtaaacct ccatatgagc ttactcctct gcttttcatc accatctatt 240
ctgtccacat ttcaagcaat gtatttccag catgaatttg tggtgtgatt tgacatgaag 300
gagaacatca gtcaccaaaa tgaaaggatt gtaccacagt acccttattt tagtttaact 360
tcgacttttt tagattaact cttaatcaaa aattggtact taacaaggaa aaacttgcct 420
tctgttgttt tcagagaagt aaaaaaagca cctcaccttt gagtcgccaa aattatgctt 480
cctggaatga ccgcatacca tgtagcaggt ttattttagt ttgtttacag aaaagtgtag 540
accaaagtcc agtgctgact ttgggagcta ctaaagacat gaaaaagtag aattttaaac 600
acatttcatt gtaaacgact gggagtatct gagcaaatta tttcttacgt gactttagag 660
aaaacggcta cctatctgac cccaaaacga cttgaggaaa ctgtttccac ggtcctgctg 720
cagaggggaa gcacagtcgt caagaagaga gtggggtcag gatcaaaaca catttagtgt 780
gacttaggga aagaaaacat tttccctctt tgaacctctc tggatacagt cattttgcct 840
ctacttgagg atcaactgtt caacctcaat ggcctttcag gacctcctgg gtcacgctgg 900
tgacctgtgg agattccag 919
<210> 5
<211> 799
<212> DNA
<213> Homo sapiens
<400> 5
ttggatctca gagacgggca ccgactgccg agccccagac gaagtgcccc agggtcgggg 60
atcaggcttg tgcagggtag cacctgggga cctgagggac ctggaggcct tcttgtatcc 120
tgaagtagga ccttctaaga cttcatgagt cctggccccc ttgcaggggt tggggagctg 180
gggatcccag atctgcctat tgcgcccgat gccccgaggc tctctcttgg actctggccc 240
tgagttcttc tgcgcgatcc ttcggagacg tctggaggcc tgctttatgc atctctcttg 300
gacctcagtt tccccacacg tgggaggagg cagctggacg attcctgaaa ggactttccc 360
ttgcttcctc atcacgtgga agagagccca cccggcacct ggaaatggaa agccagtgaa 420
ggctgctttg ggccggggca gcgggtggga ccgggcggga gggattccaa agagaccgcc 480
gggaaggcta gagcttggaa ttccggctcc tcggagtcct ggccctcccc caccgccgcc 540
tcggagctca gcacaccttg gatgggggag gcaggcagct cctagccccg caccccagga 600
ggcgcgctcg gagggaagcc gccaccgcgc cgcctctgcc tcggcgcgga acaaacggtt 660
aaagattttg ggcagcgcct cgcgggggga ggagccaggg gcccaatccg caattaaaga 720
tgaactttgg gtgaactaat tgtctgacca aggtaacgtg ggcagcaacc tgggccgcct 780
ataaagcggc agcgccgtg 799
<210> 6
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 6
gagtgctcta gttttgcaat acaggacatg ctataaaaat ggaaagatgt tgctttctga 60
gaga 64
<210> 7
<211> 113
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 7
ctttgaaaat accatcccag ggttaatgct ggggttaatt tataactaag agtgctctag 60
ttttgcaata caggacatgc tataaaaatg gaaagatgtt gctttctgag aga 113
<210> 8
<211> 140
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 8
cctcttggcc ttggttttgt acatcagctt tgaaaatacc atcccagggt taatgctggg 60
gttaatttat aactaagagt gctctagttt tgcaatacag gacatgctat aaaaatggaa 120
agatgttgct ttctgagaga 140
<210> 9
<211> 2729
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<220>
<221> misc_feature
<222> (1)..(168)
<223> ITR
<220>
<221> misc_feature
<222> (206)..(1183)
<223> CCL16 promoter
<220>
<221> misc_feature
<222> (1193)..(2287)
<223> PCS7-8L.197 CDS
<220>
<221> misc_feature
<222> (2298)..(2512)
<223> PolyA
<220>
<221> misc_feature
<222> (2562)..(2729)
<223> ITR
<400> 9
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcgccc ttaagacctg aagagagagg aagctgtggg acaggtccag 240
ccagagccca ggccagaggg gcagaagctg gagtcctgga gcacagacgc aggttgtcag 300
gtgcacagag ttggagggtc ccctgctggt catggttggc catgggggca cccaggaggg 360
atcagcgagc tggctacacc taaaaatcag tccaaagtcc gaggtccaaa gagataaata 420
aaaacattga caaataagtc aaacggtcca gcaacaaatg gggacccaag gatcaggcac 480
attgtttttt ttttttttgg agtattagca tacactgtga catgaaagag tgtgagctca 540
atcatgtggc cttggactgg gagagggcat ttccttctca gaggcaacta agccctacct 600
ttgcctcagt ctgggctctg taatcctgct ttgtgctcat ctccccaaga ctgatcacct 660
gggggaagct ggggtggttc aaccctgcct gcccttcccc aacatacaga tggtggcagg 720
taacatggtg aaatcaaaca gatctggttt ttcatccgcc tatccaccca ggtgaccttg 780
gacaatttat ttagcctcta ggcctcagta gtcccaggga agtaataatc gctacttcac 840
tattttaagg attatataag atagggcatg taaggtagct gacacacatt cgcccatttc 900
ttcacgtgaa ttcagattct actgaattca gctctgcacc aagtcccatc ctctgctgcc 960
ctctgtttca gcaaacactg aggcctgttg tttctcctcc tctaccggct ctgatgcggt 1020
caaggtccag agagctgagt agttggcaag cggaccacca gcaacagaca acatcttcat 1080
tcggctctcc ctgaagctgt actgcctcgc tgagaggatg aaggtctccg aggctgccct 1140
gtctctcctt gtcctcatcc ttatcattac ttcggcttct cgcgcggccg ccatggcacc 1200
gaagaagaag cgcaaggtgc atatgaatac aaaatataat aaagagttct tactctactt 1260
agcagggttt gtagacggtg acggttccat ctttgccagg atcaagccta gtcaacgtag 1320
taagttcaag cacaagctgc atctcgtttt cgctgtctat cagaagacac agcgccgttg 1380
gttcctcgac aagctggtgg acgagatcgg tgtgggttac gtgctggact ctggcagcgt 1440
ctccttttac tcgctgtccg agatcaagcc tttgcataat tttttaacac aactacaacc 1500
ttttctaaaa ctaaaacaaa aacaagcaaa tttagtttta aaaattattg aacaacttcc 1560
gtcagcaaaa gaatccccgg acaaattctt agaagtttgt acatgggtgg atcaaattgc 1620
agctctgaat gattcgaaga cgcgtaaaac aacttctgaa accgttcgtg ctgtgctaga 1680
cagtttacca ggatccgtgg gaggtctatc gccatctcag gcatccagcg ccgcatcctc 1740
ggcttcctca agcccgggtt cagggatctc cgaagcactc agagctggag caggttccgg 1800
cactggatac aacaaggaat tcctgctcta cctggcgggc ttcgtcgacg gggacggctc 1860
catctatgcc cgtatcaagc cggttcagcg ggctaagttc aagcacgagc tggttctcgg 1920
gttcgatgtc actcagaaga cacagcgccg ttggttcctc gacaagctgg tggacgagat 1980
cggtgtgggt tacgtgtatg acaagggcag cgtctccgcg taccgtctgt cccagatcaa 2040
gcctctgcac aacttcctga cccagctcca gcccttcctg aagctcaagc agaagcaggc 2100
caacctcgtg ctgaagatca tcgagcagct gccctccgcc aaggaatccc cggacaagtt 2160
cctggaggtg tgcacctggg tggaccagat cgccgctctg aacgactcca agacccgcaa 2220
gaccacttcc gaaaccgtcc gcgccgttct agacagtctc tccgagaaga agaagtcgtc 2280
cccctaaggt acgatctgcc tcgactgtgc cttctagttg ccagccatct gttgtttgcc 2340
cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa 2400
atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg 2460
ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg gactcgagtt 2520
aagggcgaat tcccgataag gatcttccta gagcatggct acgtagataa gtagcatggc 2580
gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc ctctctgcgc 2640
gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg 2700
gcggcctcag tgagcgagcg agcgcgcag 2729
<210> 10
<211> 2669
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<220>
<221> misc_feature
<222> (1)..(168)
<223> ITR
<220>
<221> misc_feature
<222> (206)..(1124)
<223> SLC22A9 promoter
<220>
<221> misc_feature
<222> (1133)..(2227)
<223> PCS7-8L CDS
<220>
<221> misc_feature
<222> (2238)..(2452)
<223> BGH Poly A
<220>
<221> misc_feature
<222> (2502)..(2669)
<223> ITR
<400> 10
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcgccc ttaagtttgc ctccaattct tccacagcac atagtgcatc 240
tcacataata tttataatgt tggagtgcaa ttgtttatgt actctctctt acttactcaa 300
ctataagatc cttgaacttg tcacacacgt tactttagga actagcatgg aaaaggtctt 360
cacaaatact atctgaaaaa tcaataagcc agtaaaagta aacctccata tgagcttact 420
cctctgcttt tcatcaccat ctattctgtc cacatttcaa gcaatgtatt tccagcatga 480
atttgtggtg tgatttgaca tgaaggagaa catcagtcac caaaatgaaa ggattgtacc 540
acagtaccct tattttagtt taacttcgac ttttttagat taactcttaa tcaaaaattg 600
gtacttaaca aggaaaaact tgccttctgt tgttttcaga gaagtaaaaa aagcacctca 660
cctttgagtc gccaaaatta tgcttcctgg aatgaccgca taccatgtag caggtttatt 720
ttagtttgtt tacagaaaag tgtagaccaa agtccagtgc tgactttggg agctactaaa 780
gacatgaaaa agtagaattt taaacacatt tcattgtaaa cgactgggag tatctgagca 840
aattatttct tacgtgactt tagagaaaac ggctacctat ctgaccccaa aacgacttga 900
ggaaactgtt tccacggtcc tgctgcagag gggaagcaca gtcgtcaaga agagagtggg 960
gtcaggatca aaacacattt agtgtgactt agggaaagaa aacattttcc ctctttgaac 1020
ctctctggat acagtcattt tgcctctact tgaggatcaa ctgttcaacc tcaatggcct 1080
ttcaggacct cctgggtcac gctggtgacc tgtggagatt ccagcggccg ccatggcacc 1140
gaagaagaag cgcaaggtgc atatgaatac aaaatataat aaagagttct tactctactt 1200
agcagggttt gtagacggtg acggttccat ctttgccagg atcaagccta gtcaacgtag 1260
taagttcaag cacaagctgc atctcgtttt cgctgtctat cagaagacac agcgccgttg 1320
gttcctcgac aagctggtgg acgagatcgg tgtgggttac gtgctggact ctggcagcgt 1380
ctccttttac tcgctgtccg agatcaagcc tttgcataat tttttaacac aactacaacc 1440
ttttctaaaa ctaaaacaaa aacaagcaaa tttagtttta aaaattattg aacaacttcc 1500
gtcagcaaaa gaatccccgg acaaattctt agaagtttgt acatgggtgg atcaaattgc 1560
agctctgaat gattcgaaga cgcgtaaaac aacttctgaa accgttcgtg ctgtgctaga 1620
cagtttacca ggatccgtgg gaggtctatc gccatctcag gcatccagcg ccgcatcctc 1680
ggcttcctca agcccgggtt cagggatctc cgaagcactc agagctggag caggttccgg 1740
cactggatac aacaaggaat tcctgctcta cctggcgggc ttcgtcgacg gggacggctc 1800
catctatgcc cgtatcaagc cggttcagcg ggctaagttc aagcacgagc tggttctcgg 1860
gttcgatgtc actcagaaga cacagcgccg ttggttcctc gacaagctgg tggacgagat 1920
cggtgtgggt tacgtgtatg acaagggcag cgtctccgcg taccgtctgt cccagatcaa 1980
gcctctgcac aacttcctga cccagctcca gcccttcctg aagctcaagc agaagcaggc 2040
caacctcgtg ctgaagatca tcgagcagct gccctccgcc aaggaatccc cggacaagtt 2100
cctggaggtg tgcacctggg tggaccagat cgccgctctg aacgactcca agacccgcaa 2160
gaccacttcc gaaaccgtcc gcgccgttct agacagtctc tccgagaaga agaagtcgtc 2220
cccctaaggt acgatctgcc tcgactgtgc cttctagttg ccagccatct gttgtttgcc 2280
cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa 2340
atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg 2400
ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg gactcgagtt 2460
aagggcgaat tcccgataag gatcttccta gagcatggct acgtagataa gtagcatggc 2520
gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc ctctctgcgc 2580
gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg 2640
gcggcctcag tgagcgagcg agcgcgcag 2669
<210> 11
<211> 2549
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<220>
<221> misc_feature
<222> (1)..(168)
<223> ITR
<220>
<221> misc_feature
<222> (206)..(1004)
<223> CYP26A1 - 1K promoter
<220>
<221> misc_feature
<222> (1013)..(2107)
<223> PCS7-8L CDS
<220>
<221> misc_feature
<222> (2118)..(2332)
<223> bGH Poly A
<220>
<221> misc_feature
<222> (2382)..(2549)
<223> ITR
<400> 11
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcgccc ttaagttgga tctcagagac gggcaccgac tgccgagccc 240
cagacgaagt gccccagggt cggggatcag gcttgtgcag ggtagcacct ggggacctga 300
gggacctgga ggccttcttg tatcctgaag taggaccttc taagacttca tgagtcctgg 360
cccccttgca ggggttgggg agctggggat cccagatctg cctattgcgc ccgatgcccc 420
gaggctctct cttggactct ggccctgagt tcttctgcgc gatccttcgg agacgtctgg 480
aggcctgctt tatgcatctc tcttggacct cagtttcccc acacgtggga ggaggcagct 540
ggacgattcc tgaaaggact ttcccttgct tcctcatcac gtggaagaga gcccacccgg 600
cacctggaaa tggaaagcca gtgaaggctg ctttgggccg gggcagcggg tgggaccggg 660
cgggagggat tccaaagaga ccgccgggaa ggctagagct tggaattccg gctcctcgga 720
gtcctggccc tcccccaccg ccgcctcgga gctcagcaca ccttggatgg gggaggcagg 780
cagctcctag ccccgcaccc caggaggcgc gctcggaggg aagccgccac cgcgccgcct 840
ctgcctcggc gcggaacaaa cggttaaaga ttttgggcag cgcctcgcgg ggggaggagc 900
caggggccca atccgcaatt aaagatgaac tttgggtgaa ctaattgtct gaccaaggta 960
acgtgggcag caacctgggc cgcctataaa gcggcagcgc cgtgcggccg ccatggcacc 1020
gaagaagaag cgcaaggtgc atatgaatac aaaatataat aaagagttct tactctactt 1080
agcagggttt gtagacggtg acggttccat ctttgccagg atcaagccta gtcaacgtag 1140
taagttcaag cacaagctgc atctcgtttt cgctgtctat cagaagacac agcgccgttg 1200
gttcctcgac aagctggtgg acgagatcgg tgtgggttac gtgctggact ctggcagcgt 1260
ctccttttac tcgctgtccg agatcaagcc tttgcataat tttttaacac aactacaacc 1320
ttttctaaaa ctaaaacaaa aacaagcaaa tttagtttta aaaattattg aacaacttcc 1380
gtcagcaaaa gaatccccgg acaaattctt agaagtttgt acatgggtgg atcaaattgc 1440
agctctgaat gattcgaaga cgcgtaaaac aacttctgaa accgttcgtg ctgtgctaga 1500
cagtttacca ggatccgtgg gaggtctatc gccatctcag gcatccagcg ccgcatcctc 1560
ggcttcctca agcccgggtt cagggatctc cgaagcactc agagctggag caggttccgg 1620
cactggatac aacaaggaat tcctgctcta cctggcgggc ttcgtcgacg gggacggctc 1680
catctatgcc cgtatcaagc cggttcagcg ggctaagttc aagcacgagc tggttctcgg 1740
gttcgatgtc actcagaaga cacagcgccg ttggttcctc gacaagctgg tggacgagat 1800
cggtgtgggt tacgtgtatg acaagggcag cgtctccgcg taccgtctgt cccagatcaa 1860
gcctctgcac aacttcctga cccagctcca gcccttcctg aagctcaagc agaagcaggc 1920
caacctcgtg ctgaagatca tcgagcagct gccctccgcc aaggaatccc cggacaagtt 1980
cctggaggtg tgcacctggg tggaccagat cgccgctctg aacgactcca agacccgcaa 2040
gaccacttcc gaaaccgtcc gcgccgttct agacagtctc tccgagaaga agaagtcgtc 2100
cccctaaggt acgatctgcc tcgactgtgc cttctagttg ccagccatct gttgtttgcc 2160
cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa 2220
atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg 2280
ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg gactcgagtt 2340
aagggcgaat tcccgataag gatcttccta gagcatggct acgtagataa gtagcatggc 2400
gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc ctctctgcgc 2460
gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg 2520
gcggcctcag tgagcgagcg agcgcgcag 2549
<210> 12
<211> 1817
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<220>
<221> misc_feature
<222> (1)..(168)
<223> ITR
<220>
<221> misc_feature
<222> (206)..(269)
<223> TBG-S1-F64 promoter
<220>
<221> misc_feature
<222> (281)..(1375)
<223> PCS7-8 CDS
<220>
<221> misc_feature
<222> (1386)..(1600)
<223> bGH Poly A
<220>
<221> misc_feature
<222> (1650)..(1817)
<223> ITR
<400> 12
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcgccc ttaaggagtg ctctagtttt gcaatacagg acatgctata 240
aaaatggaaa gatgttgctt tctgagagac agcggccgcc atggcaccga agaagaagcg 300
caaggtgcat atgaatacaa aatataataa agagttctta ctctacttag cagggtttgt 360
agacggtgac ggttccatct ttgccaggat caagcctagt caacgtagta agttcaagca 420
caagctgcat ctcgttttcg ctgtctatca gaagacacag cgccgttggt tcctcgacaa 480
gctggtggac gagatcggtg tgggttacgt gctggactct ggcagcgtct ccttttactc 540
gctgtccgag atcaagcctt tgcataattt tttaacacaa ctacaacctt ttctaaaact 600
aaaacaaaaa caagcaaatt tagttttaaa aattattgaa caacttccgt cagcaaaaga 660
atccccggac aaattcttag aagtttgtac atgggtggat caaattgcag ctctgaatga 720
ttcgaagacg cgtaaaacaa cttctgaaac cgttcgtgct gtgctagaca gtttaccagg 780
atccgtggga ggtctatcgc catctcaggc atccagcgcc gcatcctcgg cttcctcaag 840
cccgggttca gggatctccg aagcactcag agctggagca ggttccggca ctggatacaa 900
caaggaattc ctgctctacc tggcgggctt cgtcgacggg gacggctcca tctatgcccg 960
tatcaagccg gttcagcggg ctaagttcaa gcacgagctg gttctcgggt tcgatgtcac 1020
tcagaagaca cagcgccgtt ggttcctcga caagctggtg gacgagatcg gtgtgggtta 1080
cgtgtatgac aagggcagcg tctccgcgta ccgtctgtcc cagatcaagc ctctgcacaa 1140
cttcctgacc cagctccagc ccttcctgaa gctcaagcag aagcaggcca acctcgtgct 1200
gaagatcatc gagcagctgc cctccgccaa ggaatccccg gacaagttcc tggaggtgtg 1260
cacctgggtg gaccagatcg ccgctctgaa cgactccaag acccgcaaga ccacttccga 1320
aaccgtccgc gccgttctag acagtctctc cgagaagaag aagtcgtccc cctaaggtac 1380
gatctgcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc 1440
cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg 1500
catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca 1560
agggggagga ttgggaagac aatagcaggc atgctgggga ctcgagttaa gggcgaattc 1620
ccgataagga tcttcctaga gcatggctac gtagataagt agcatggcgg gttaatcatt 1680
aactacaagg aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc 1740
actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg 1800
agcgagcgag cgcgcag 1817
<210> 13
<211> 1866
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<220>
<221> misc_feature
<222> (1)..(168)
<223> ITR
<220>
<221> misc_feature
<222> (206)..(318)
<223> TBG-S1-F113 promoter
<220>
<221> misc_feature
<222> (330)..(1424)
<223> PCS7-8 CDS
<220>
<221> misc_feature
<222> (1435)..(1649)
<223> bGH Poly A
<220>
<221> misc_feature
<222> (1699)..(1866)
<223> ITR
<400> 13
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcgccc ttaagctttg aaaataccat cccagggtta atgctggggt 240
taatttataa ctaagagtgc tctagttttg caatacagga catgctataa aaatggaaag 300
atgttgcttt ctgagagaca gcggccgcca tggcaccgaa gaagaagcgc aaggtgcata 360
tgaatacaaa atataataaa gagttcttac tctacttagc agggtttgta gacggtgacg 420
gttccatctt tgccaggatc aagcctagtc aacgtagtaa gttcaagcac aagctgcatc 480
tcgttttcgc tgtctatcag aagacacagc gccgttggtt cctcgacaag ctggtggacg 540
agatcggtgt gggttacgtg ctggactctg gcagcgtctc cttttactcg ctgtccgaga 600
tcaagccttt gcataatttt ttaacacaac tacaaccttt tctaaaacta aaacaaaaac 660
aagcaaattt agttttaaaa attattgaac aacttccgtc agcaaaagaa tccccggaca 720
aattcttaga agtttgtaca tgggtggatc aaattgcagc tctgaatgat tcgaagacgc 780
gtaaaacaac ttctgaaacc gttcgtgctg tgctagacag tttaccagga tccgtgggag 840
gtctatcgcc atctcaggca tccagcgccg catcctcggc ttcctcaagc ccgggttcag 900
ggatctccga agcactcaga gctggagcag gttccggcac tggatacaac aaggaattcc 960
tgctctacct ggcgggcttc gtcgacgggg acggctccat ctatgcccgt atcaagccgg 1020
ttcagcgggc taagttcaag cacgagctgg ttctcgggtt cgatgtcact cagaagacac 1080
agcgccgttg gttcctcgac aagctggtgg acgagatcgg tgtgggttac gtgtatgaca 1140
agggcagcgt ctccgcgtac cgtctgtccc agatcaagcc tctgcacaac ttcctgaccc 1200
agctccagcc cttcctgaag ctcaagcaga agcaggccaa cctcgtgctg aagatcatcg 1260
agcagctgcc ctccgccaag gaatccccgg acaagttcct ggaggtgtgc acctgggtgg 1320
accagatcgc cgctctgaac gactccaaga cccgcaagac cacttccgaa accgtccgcg 1380
ccgttctaga cagtctctcc gagaagaaga agtcgtcccc ctaaggtacg atctgcctcg 1440
actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 1500
ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 1560
ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 1620
tgggaagaca atagcaggca tgctggggac tcgagttaag ggcgaattcc cgataaggat 1680
cttcctagag catggctacg tagataagta gcatggcggg ttaatcatta actacaagga 1740
acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg 1800
gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc 1860
gcgcag 1866
<210> 14
<211> 1893
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<220>
<221> misc_feature
<222> (1)..(168)
<223> ITR
<220>
<221> misc_feature
<222> (206)..(345)
<223> TBG-S1-F140
<220>
<221> misc_feature
<222> (357)..(1451)
<223> PCS7-8 CDS
<220>
<221> misc_feature
<222> (1462)..(1676)
<223> bGH PolyA
<220>
<221> misc_feature
<222> (1726)..(1893)
<223> ITR
<400> 14
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcgccc ttaagcctct tggccttggt tttgtacatc agctttgaaa 240
ataccatccc agggttaatg ctggggttaa tttataacta agagtgctct agttttgcaa 300
tacaggacat gctataaaaa tggaaagatg ttgctttctg agagacagcg gccgccatgg 360
caccgaagaa gaagcgcaag gtgcatatga atacaaaata taataaagag ttcttactct 420
acttagcagg gtttgtagac ggtgacggtt ccatctttgc caggatcaag cctagtcaac 480
gtagtaagtt caagcacaag ctgcatctcg ttttcgctgt ctatcagaag acacagcgcc 540
gttggttcct cgacaagctg gtggacgaga tcggtgtggg ttacgtgctg gactctggca 600
gcgtctcctt ttactcgctg tccgagatca agcctttgca taatttttta acacaactac 660
aaccttttct aaaactaaaa caaaaacaag caaatttagt tttaaaaatt attgaacaac 720
ttccgtcagc aaaagaatcc ccggacaaat tcttagaagt ttgtacatgg gtggatcaaa 780
ttgcagctct gaatgattcg aagacgcgta aaacaacttc tgaaaccgtt cgtgctgtgc 840
tagacagttt accaggatcc gtgggaggtc tatcgccatc tcaggcatcc agcgccgcat 900
cctcggcttc ctcaagcccg ggttcaggga tctccgaagc actcagagct ggagcaggtt 960
ccggcactgg atacaacaag gaattcctgc tctacctggc gggcttcgtc gacggggacg 1020
gctccatcta tgcccgtatc aagccggttc agcgggctaa gttcaagcac gagctggttc 1080
tcgggttcga tgtcactcag aagacacagc gccgttggtt cctcgacaag ctggtggacg 1140
agatcggtgt gggttacgtg tatgacaagg gcagcgtctc cgcgtaccgt ctgtcccaga 1200
tcaagcctct gcacaacttc ctgacccagc tccagccctt cctgaagctc aagcagaagc 1260
aggccaacct cgtgctgaag atcatcgagc agctgccctc cgccaaggaa tccccggaca 1320
agttcctgga ggtgtgcacc tgggtggacc agatcgccgc tctgaacgac tccaagaccc 1380
gcaagaccac ttccgaaacc gtccgcgccg ttctagacag tctctccgag aagaagaagt 1440
cgtcccccta aggtacgatc tgcctcgact gtgccttcta gttgccagcc atctgttgtt 1500
tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa 1560
taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg 1620
gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc tggggactcg 1680
agttaagggc gaattcccga taaggatctt cctagagcat ggctacgtag ataagtagca 1740
tggcgggtta atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct 1800
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 1860
ccgggcggcc tcagtgagcg agcgagcgcg cag 1893
<210> 15
<211> 2625
<212> DNA
<213> Artificial sequence
<220>
<223> PCSK7-8L.197
<220>
<221> CDS
<222> (1089)..(2183)
<223> M2PCSK9 coding sequence
<400> 15
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcgccc ttaagctagc aggttaattt ttaaaaagca gtcaaaagtc 240
caagtggccc ttggcagcat ttactctctc tgtttgctct ggttaataat ctcaggagca 300
caaacattcc agatccaggt taatttttaa aaagcagtca aaagtccaag tggcccttgg 360
cagcatttac tctctctgtt tgctctggtt aataatctca ggagcacaaa cattccagat 420
ccggcgcgcc agggctggaa gctacctttg acatcatttc ctctgcgaat gcatgtataa 480
tttctacaga acctattaga aaggatcacc cagcctctgc ttttgtacaa ctttccctta 540
aaaaactgcc aattccactg ctgtttggcc caatagtgag aactttttcc tgctgcctct 600
tggtgctttt gcctatggcc cctattctgc ctgctgaaga cactcttgcc agcatggact 660
taaacccctc cagctctgac aatcctcttt ctcttttgtt ttacatgaag ggtctggcag 720
ccaaagcaat cactcaaagt tcaaacctta tcattttttg ctttgttcct cttggccttg 780
gttttgtaca tcagctttga aaataccatc ccagggttaa tgctggggtt aatttataac 840
taagagtgct ctagttttgc aatacaggac atgctataaa aatggaaaga tgttgctttc 900
tgagagactg cagaagttgg tcgtgaggca ctgggcaggt aagtatcaag gttacaagac 960
aggtttaagg agaccaatag aaactgggct tgtcgagaca gagaagactc ttgcgtttct 1020
gataggcacc tattggtctt actgacatcc actttgcctt tctctccaca ggtgtccagg 1080
cggccgcc atg gca ccg aag aag aag cgc aag gtg cat atg aat aca aaa 1130
Met Ala Pro Lys Lys Lys Arg Lys Val His Met Asn Thr Lys
1 5 10
tat aat aaa gag ttc tta ctc tac tta gca ggg ttt gta gac ggt gac 1178
Tyr Asn Lys Glu Phe Leu Leu Tyr Leu Ala Gly Phe Val Asp Gly Asp
15 20 25 30
ggt tcc atc ttt gcc agg atc aag cct agt caa cgt agt aag ttc aag 1226
Gly Ser Ile Phe Ala Arg Ile Lys Pro Ser Gln Arg Ser Lys Phe Lys
35 40 45
cac aag ctg cat ctc gtt ttc gct gtc tat cag aag aca cag cgc cgt 1274
His Lys Leu His Leu Val Phe Ala Val Tyr Gln Lys Thr Gln Arg Arg
50 55 60
tgg ttc ctc gac aag ctg gtg gac gag atc ggt gtg ggt tac gtg ctg 1322
Trp Phe Leu Asp Lys Leu Val Asp Glu Ile Gly Val Gly Tyr Val Leu
65 70 75
gac tct ggc agc gtc tcc ttt tac tcg ctg tcc gag atc aag cct ttg 1370
Asp Ser Gly Ser Val Ser Phe Tyr Ser Leu Ser Glu Ile Lys Pro Leu
80 85 90
cat aat ttt tta aca caa cta caa cct ttt cta aaa cta aaa caa aaa 1418
His Asn Phe Leu Thr Gln Leu Gln Pro Phe Leu Lys Leu Lys Gln Lys
95 100 105 110
caa gca aat tta gtt tta aaa att att gaa caa ctt ccg tca gca aaa 1466
Gln Ala Asn Leu Val Leu Lys Ile Ile Glu Gln Leu Pro Ser Ala Lys
115 120 125
gaa tcc ccg gac aaa ttc tta gaa gtt tgt aca tgg gtg gat caa att 1514
Glu Ser Pro Asp Lys Phe Leu Glu Val Cys Thr Trp Val Asp Gln Ile
130 135 140
gca gct ctg aat gat tcg aag acg cgt aaa aca act tct gaa acc gtt 1562
Ala Ala Leu Asn Asp Ser Lys Thr Arg Lys Thr Thr Ser Glu Thr Val
145 150 155
cgt gct gtg cta gac agt tta cca gga tcc gtg gga ggt cta tcg cca 1610
Arg Ala Val Leu Asp Ser Leu Pro Gly Ser Val Gly Gly Leu Ser Pro
160 165 170
tct cag gca tcc agc gcc gca tcc tcg gct tcc tca agc ccg ggt tca 1658
Ser Gln Ala Ser Ser Ala Ala Ser Ser Ala Ser Ser Ser Pro Gly Ser
175 180 185 190
ggg atc tcc gaa gca ctc aga gct gga gca ggt tcc ggc act gga tac 1706
Gly Ile Ser Glu Ala Leu Arg Ala Gly Ala Gly Ser Gly Thr Gly Tyr
195 200 205
aac aag gaa ttc ctg ctc tac ctg gcg ggc ttc gtc gac ggg gac ggc 1754
Asn Lys Glu Phe Leu Leu Tyr Leu Ala Gly Phe Val Asp Gly Asp Gly
210 215 220
tcc atc tat gcc cgt atc aag ccg gtt cag cgg gct aag ttc aag cac 1802
Ser Ile Tyr Ala Arg Ile Lys Pro Val Gln Arg Ala Lys Phe Lys His
225 230 235
gag ctg gtt ctc ggg ttc gat gtc act cag aag aca cag cgc cgt tgg 1850
Glu Leu Val Leu Gly Phe Asp Val Thr Gln Lys Thr Gln Arg Arg Trp
240 245 250
ttc ctc gac aag ctg gtg gac gag atc ggt gtg ggt tac gtg tat gac 1898
Phe Leu Asp Lys Leu Val Asp Glu Ile Gly Val Gly Tyr Val Tyr Asp
255 260 265 270
aag ggc agc gtc tcc gcg tac cgt ctg tcc cag atc aag cct ctg cac 1946
Lys Gly Ser Val Ser Ala Tyr Arg Leu Ser Gln Ile Lys Pro Leu His
275 280 285
aac ttc ctg acc cag ctc cag ccc ttc ctg aag ctc aag cag aag cag 1994
Asn Phe Leu Thr Gln Leu Gln Pro Phe Leu Lys Leu Lys Gln Lys Gln
290 295 300
gcc aac ctc gtg ctg aag atc atc gag cag ctg ccc tcc gcc aag gaa 2042
Ala Asn Leu Val Leu Lys Ile Ile Glu Gln Leu Pro Ser Ala Lys Glu
305 310 315
tcc ccg gac aag ttc ctg gag gtg tgc acc tgg gtg gac cag atc gcc 2090
Ser Pro Asp Lys Phe Leu Glu Val Cys Thr Trp Val Asp Gln Ile Ala
320 325 330
gct ctg aac gac tcc aag acc cgc aag acc act tcc gaa acc gtc cgc 2138
Ala Leu Asn Asp Ser Lys Thr Arg Lys Thr Thr Ser Glu Thr Val Arg
335 340 345 350
gcc gtt cta gac agt ctc tcc gag aag aag aag tcg tcc ccc taa 2183
Ala Val Leu Asp Ser Leu Ser Glu Lys Lys Lys Ser Ser Pro
355 360
ggtacgatct gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc 2243
cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga 2303
aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga 2363
cagcaagggg gaggattggg aagacaatag caggcatgct ggggactcga gttaagggcg 2423
aattcccgat aaggatcttc ctagagcatg gctacgtaga taagtagcat ggcgggttaa 2483
tcattaacta caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 2543
cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 2603
cagtgagcga gcgagcgcgc ag 2625
<210> 16
<211> 364
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic Construct
<400> 16
Met Ala Pro Lys Lys Lys Arg Lys Val His Met Asn Thr Lys Tyr Asn
1 5 10 15
Lys Glu Phe Leu Leu Tyr Leu Ala Gly Phe Val Asp Gly Asp Gly Ser
20 25 30
Ile Phe Ala Arg Ile Lys Pro Ser Gln Arg Ser Lys Phe Lys His Lys
35 40 45
Leu His Leu Val Phe Ala Val Tyr Gln Lys Thr Gln Arg Arg Trp Phe
50 55 60
Leu Asp Lys Leu Val Asp Glu Ile Gly Val Gly Tyr Val Leu Asp Ser
65 70 75 80
Gly Ser Val Ser Phe Tyr Ser Leu Ser Glu Ile Lys Pro Leu His Asn
85 90 95
Phe Leu Thr Gln Leu Gln Pro Phe Leu Lys Leu Lys Gln Lys Gln Ala
100 105 110
Asn Leu Val Leu Lys Ile Ile Glu Gln Leu Pro Ser Ala Lys Glu Ser
115 120 125
Pro Asp Lys Phe Leu Glu Val Cys Thr Trp Val Asp Gln Ile Ala Ala
130 135 140
Leu Asn Asp Ser Lys Thr Arg Lys Thr Thr Ser Glu Thr Val Arg Ala
145 150 155 160
Val Leu Asp Ser Leu Pro Gly Ser Val Gly Gly Leu Ser Pro Ser Gln
165 170 175
Ala Ser Ser Ala Ala Ser Ser Ala Ser Ser Ser Pro Gly Ser Gly Ile
180 185 190
Ser Glu Ala Leu Arg Ala Gly Ala Gly Ser Gly Thr Gly Tyr Asn Lys
195 200 205
Glu Phe Leu Leu Tyr Leu Ala Gly Phe Val Asp Gly Asp Gly Ser Ile
210 215 220
Tyr Ala Arg Ile Lys Pro Val Gln Arg Ala Lys Phe Lys His Glu Leu
225 230 235 240
Val Leu Gly Phe Asp Val Thr Gln Lys Thr Gln Arg Arg Trp Phe Leu
245 250 255
Asp Lys Leu Val Asp Glu Ile Gly Val Gly Tyr Val Tyr Asp Lys Gly
260 265 270
Ser Val Ser Ala Tyr Arg Leu Ser Gln Ile Lys Pro Leu His Asn Phe
275 280 285
Leu Thr Gln Leu Gln Pro Phe Leu Lys Leu Lys Gln Lys Gln Ala Asn
290 295 300
Leu Val Leu Lys Ile Ile Glu Gln Leu Pro Ser Ala Lys Glu Ser Pro
305 310 315 320
Asp Lys Phe Leu Glu Val Cys Thr Trp Val Asp Gln Ile Ala Ala Leu
325 330 335
Asn Asp Ser Lys Thr Arg Lys Thr Thr Ser Glu Thr Val Arg Ala Val
340 345 350
Leu Asp Ser Leu Ser Glu Lys Lys Lys Ser Ser Pro
355 360
<210> 17
<211> 2214
<212> DNA
<213> adeno-associated virus rh79
<220>
<221> CDS
<222> (1)..(2214)
<400> 17
atg gct gct gac ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
gag ggc att cgc gag tgg tgg gac ctg aaa cct gga gcc ccc aag ccc 96
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
aag gcc aac cag cag aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
gtc aac gag gcg gac gcc gcg gcc ctc gag cac gac aag gcc tac gac 240
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
cag cag ctc aaa gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
ctc ggt ctg gtt gag gaa gct gct aag acg gct cct gga aag aag aga 432
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
ccg gta gaa ccg tca cct cag cga tcc ccc gac tcc tcc acg ggc atc 480
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
ggc aaa aaa ggc cag cag ccc gcg aga aag aga ctg aac ttt ggg cag 528
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
act ggc gac tca gag tca gtc ccc gac cct caa cca atc gga gaa cca 576
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
cca gca ggc ccc tct ggt ctg gga tct ggt aca atg gct gca ggc ggt 624
Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly
195 200 205
ggc gct cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
tcc tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
ctc tac aag caa atc tcc aat ggg aca tcg gga gga agc acc aac gac 816
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac 864
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
aga ttc cac tgt cac ttc tca cca cgt gac tgg cag aga ctc atc aac 912
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
aac aac tgg gga ttc cgg ccc aag aga ctc agc ttc aag ctc ttc aac 960
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
atc cag gtt aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc 1008
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
aat aac ctt acc agc acg att cag gta ttt acg gac tcg gaa tac cag 1056
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
ctg ccg tac gtc ctc ggc tcc gcg cac cag ggc tgc ctg cct ccg ttc 1104
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
ccg gcg gat gtc ttc atg att ccc cag tac ggc tac ctg aca ctg aac 1152
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
aac gga agt caa gcc gta ggc cgt tcc tca ttc tac tgc ctg gaa tat 1200
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
ttt cca tct caa atg ctg cgg act gga aac aac ttt gaa ttt agc tac 1248
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
acc ttt gag gac gtg ccc ttc cac agc agc tac gca cac agc cag agc 1296
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
ctg gac cgg ctg atg aac cct ctc atc gac cag tac ctg tat tac cta 1344
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
tcc aga act cag tcc aca gga gga act caa ggt aca cag caa ttg tta 1392
Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu
450 455 460
ttt tct caa gcc ggg cct gca aat atg tcg gct cag gcc aag aac tgg 1440
Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp
465 470 475 480
cta cct gga cct tgc tac cgg cag cag cga gtc tcc acg aca ctg tcg 1488
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser
485 490 495
caa aac aac aac agc aac ttt gct tgg act ggt gcc acg aaa tat cat 1536
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
ctg aac gga aga gac tct ttg gtg aat ccc ggt gtt gct atg gca acg 1584
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
cat aag gac gac gag gaa cgt ttc ttt cca tcg agc gga gtc ctg atg 1632
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met
530 535 540
ttt gga aaa cag ggt gct gga aga gac aat gtg gac tat agc agc gtt 1680
Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val
545 550 555 560
atg cta acc agc gag gaa gaa atc aag acc act aac cct gta gcc act 1728
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
gaa caa tac ggc gtg gtg gct gat aac ttg cag caa acc aat aca gga 1776
Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Thr Asn Thr Gly
580 585 590
cct atc gtg gga aat gtc aac agc caa gga gcc tta cct ggc atg gtc 1824
Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
tgg cag aac cga gac gtg tac ctg cag ggt ccc att tgg gcc aag att 1872
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
cct cac acg gac ggc aac ttt cac ccg tct cct ctg atg ggc ggc ttt 1920
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
gga ctg aaa cac ccg cct cct caa atc ctg atc aag aac act ccc gtt 1968
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
cct gcg gat cct cca acg acg ttc agc cag gcg aaa ttg gct tcc ttc 2016
Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe
660 665 670
atc acg cag tat agt acc ggc cag gtc agc gtg gag atc gag tgg gag 2064
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
ctg cag aag gag aac agc aag cgc tgg aac cca gaa att cag tat act 2112
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
tcc aac tac tac aaa tct aca aat gtg gac ttt gct gtc aat acc gag 2160
Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
ggt aca tat tca gag cct cgc ccc att gga act cgt tac ctc acc cgt 2208
Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
aat ctg 2214
Asn Leu
<210> 18
<211> 738
<212> PRT
<213> adeno-associated virus rh79
<400> 18
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu
450 455 460
Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met
530 535 540
Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Thr Asn Thr Gly
580 585 590
Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 19
<211> 2214
<212> DNA
<213> adeno-associated virus 8
<220>
<221> CDS
<222> (1)..(2214)
<400> 19
atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
gag ggc att cgc gag tgg tgg gcg ctg aaa cct gga gcc ccg aag ccc 96
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
cag cag ctg cag gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
ctc ggt ctg gtt gag gaa ggc gct aag acg gct cct gga aag aag aga 432
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
ccg gta gag cca tca ccc cag cgt tct cca gac tcc tct acg ggc atc 480
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
ggc aag aaa ggc caa cag ccc gcc aga aaa aga ctc aat ttt ggt cag 528
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
act ggc gac tca gag tca gtt cca gac cct caa cct ctc gga gaa cct 576
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
cca gca gcg ccc tct ggt gtg gga cct aat aca atg gct gca ggc ggt 624
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
ggc gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
tcc tcg gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
ctc tac aag caa atc tcc aac ggg aca tcg gga gga gcc acc aac gac 816
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp
260 265 270
aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttt aac 864
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
aga ttc cac tgc cac ttt tca cca cgt gac tgg cag cga ctc atc aac 912
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
aac aac tgg gga ttc cgg ccc aag aga ctc agc ttc aag ctc ttc aac 960
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
atc cag gtc aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc 1008
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
aat aac ctc acc agc acc atc cag gtg ttt acg gac tcg gag tac cag 1056
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
ctg ccg tac gtt ctc ggc tct gcc cac cag ggc tgc ctg cct ccg ttc 1104
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
ccg gcg gac gtg ttc atg att ccc cag tac ggc tac cta aca ctc aac 1152
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
aac ggt agt cag gcc gtg gga cgc tcc tcc ttc tac tgc ctg gaa tac 1200
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
ttt cct tcg cag atg ctg aga acc ggc aac aac ttc cag ttt act tac 1248
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr
405 410 415
acc ttc gag gac gtg cct ttc cac agc agc tac gcc cac agc cag agc 1296
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
ttg gac cgg ctg atg aat cct ctg att gac cag tac ctg tac tac ttg 1344
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
tct cgg act caa aca aca gga ggc acg gca aat acg cag act ctg ggc 1392
Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly
450 455 460
ttc agc caa ggt ggg cct aat aca atg gcc aat cag gca aag aac tgg 1440
Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp
465 470 475 480
ctg cca gga ccc tgt tac cgc caa caa cgc gtc tca acg aca acc ggg 1488
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly
485 490 495
caa aac aac aat agc aac ttt gcc tgg act gct ggg acc aaa tac cat 1536
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His
500 505 510
ctg aat gga aga aat tca ttg gct aat cct ggc atc gct atg gca aca 1584
Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr
515 520 525
cac aaa gac gac gag gag cgt ttt ttt ccc agt aac ggg atc ctg att 1632
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile
530 535 540
ttt ggc aaa caa aat gct gcc aga gac aat gcg gat tac agc gat gtc 1680
Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val
545 550 555 560
atg ctc acc agc gag gaa gaa atc aaa acc act aac cct gtg gct aca 1728
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
gag gaa tac ggt atc gtg gca gat aac ttg cag cag caa aac acg gct 1776
Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
cct caa att gga act gtc aac agc cag ggg gcc tta ccc ggt atg gtc 1824
Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
tgg cag aac cgg gac gtg tac ctg cag ggt ccc atc tgg gcc aag att 1872
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
cct cac acg gac ggc aac ttc cac ccg tct ccg ctg atg ggc ggc ttt 1920
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
ggc ctg aaa cat cct ccg cct cag atc ctg atc aag aac acg cct gta 1968
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
cct gcg gat cct ccg acc acc ttc aac cag tca aag ctg aac tct ttc 2016
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe
660 665 670
atc acg caa tac agc acc gga cag gtc agc gtg gaa att gaa tgg gag 2064
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
ctg cag aag gaa aac agc aag cgc tgg aac ccc gag atc cag tac acc 2112
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
tcc aac tac tac aaa tct aca agt gtg gac ttt gct gtt aat aca gaa 2160
Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
ggc gtg tac tct gaa ccc cgc ccc att ggc acc cgt tac ctc acc cgt 2208
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
aat ctg 2214
Asn Leu
<210> 20
<211> 738
<212> PRT
<213> adeno-associated virus 8
<400> 20
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly
450 455 460
Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile
530 535 540
Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 21
<211> 2214
<212> DNA
<213> adeno-associated virus hu37
<220>
<221> CDS
<222> (1)..(2214)
<400> 21
atg gct gct gac ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
gag ggc att cgc gag tgg tgg gac ctg aaa cct gga gcc ccc aag ccc 96
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
aag gcc aac cag cag aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
cag cag ctc aaa gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
ctc ggt ctg gtt gag gaa gct gct aag acg gct cct gga aag aag aga 432
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
ccg gta gaa ccg tca cct cag cgt tcc ccc gac tcc tcc acg ggc atc 480
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
ggc aag aaa ggc cag cag ccc gct aaa aag aga ctg aac ttt ggt cag 528
Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
act ggc gac tca gag tca gtc ccc gac cct caa cca atc gga gaa cca 576
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
cca gca ggc ccc tct ggt ctg gga tct ggt aca atg gct gca ggc ggt 624
Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly
195 200 205
ggc gct cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
tcc tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
ctc tac aag caa ata tcc aat ggg aca tcg gga gga agc acc aac gac 816
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac 864
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
aga ttc cac tgc cac ttc tca cca cgt gac tgg cag cga ctc atc aac 912
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
aac aac tgg gga ttc cgg cca aaa aga ctc agc ttc aag ctc ttc aac 960
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
atc cag gtc aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc 1008
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
aat aac ctt acc agc acg att cag gta ttt acg gac tcg gaa tac cag 1056
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
ctg ccg tac gtc ctc ggc tcc gcg cac cag ggc tgc ctg cct ccg ttc 1104
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
ccg gcg gac gtc ttc atg att ccc cag tac ggc tac ctt aca ctg aac 1152
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
aat gga agt caa gcc gta ggc cgt tcc tcc ttc tac tgc ctg gaa tat 1200
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
ttt cca tct caa atg ctg cga act gga aac aat ttt gaa ttc agc tac 1248
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
acc ttc gag gac gtg cct ttc cac agc agc tac gca cac agc cag agc 1296
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
ttg gac cga ctg atg aat cct ctc atc gac cag tac ctg tac tac tta 1344
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
tcc aga act cag tcc aca gga gga act caa ggt acc cag caa ttg tta 1392
Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu
450 455 460
ttt tct caa gct ggg cct gca aac atg tcg gct cag gct aag aac tgg 1440
Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp
465 470 475 480
cta cct gga cct tgc tac cgg cag cag cga gtc tct acg aca ctg tcg 1488
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser
485 490 495
caa aac aac aac agc aac ttt gct tgg act ggt gcc acc aaa tat cac 1536
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
ctg aac gga aga gac tct ttg gta aat ccc ggt gtc gcc atg gca acc 1584
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
cac aag gac gac gag gaa cgc ttc ttc ccg tcg agt gga gtc ctg atg 1632
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met
530 535 540
ttc gga aaa cag ggt gct gga aga gac aat gtg gac tac agc agc gtt 1680
Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val
545 550 555 560
atg cta acc agc gaa gaa gaa att aaa acc act aac ccc gta gcc aca 1728
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
gaa caa tac ggt gtg gtg gct gac aac ttg cag caa acc aat aca ggg 1776
Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Thr Asn Thr Gly
580 585 590
cct att gtg gga aat gtc aac agc caa gga gcc tta cct ggc atg gtc 1824
Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
tgg cag aac cga gac gtg tac ctg cag ggt ccc atc tgg gcc aag att 1872
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
cct cac acg gac ggc aac ttc cac cct tca ccg cta atg gga gga ttt 1920
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
gga ctg aag cac cca cct cct cag atc ctg atc aag aac acg ccg gta 1968
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
cct gcg gat cct cca aca acg ttc agc cag gcg aaa ttg gct tcc ttc 2016
Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe
660 665 670
att acg cag tac agc acc gga cag gtc agc gtg gaa atc gag tgg gag 2064
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
ctg cag aag gag aac agc aaa cgc tgg aac cca gag att cag tac act 2112
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
tca aac tac tac aaa tct aca aat gtg gac ttt gct gtc aat aca gag 2160
Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
gga act tat tct gag cct cgc ccc att ggt act cgt tac ctc acc cgt 2208
Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
aat ctg 2214
Asn Leu
<210> 22
<211> 738
<212> PRT
<213> adeno-associated virus hu37
<400> 22
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu
450 455 460
Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met
530 535 540
Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Thr Asn Thr Gly
580 585 590
Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 23
<211> 2217
<212> DNA
<213> adeno-associated virus rh.90
<220>
<221> CDS
<222> (1)..(2217)
<400> 23
atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
gag ggc att cgc gag tgg tgg gac ctg aaa cct gga gcc cca aaa ccc 96
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
cag cag ctg cag gcg ggt gat aat ccg tac ctg cgg tat aac cac gcc 288
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tca ttt ggg ggc 336
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
ctc ggt ctg gtt gag gaa ggc gct aag acg gct cct gga aag aag aga 432
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
ccg gta gag cca tca cca cag cgt tcc ccc gac tcc tcc acg ggc atc 480
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
ggc aag aaa ggc cag cag ccc gcc aga aag aga ctc aat ttc ggt cag 528
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
act ggc gac tca gag tca gtc ccc gac cct caa cct ctc gga gaa cct 576
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
cca gca gcg ccc tct agt gtg gga tct ggt aca atg gct gca ggc ggt 624
Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Met Ala Ala Gly Gly
195 200 205
ggc gca cca atg gca gac aat aac gaa ggt gcc gac gga gtg ggt agt 672
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
tcc tcg gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
ctc tac aag caa atc tcc aac ggg acc tcg gga ggc agc acc aac gac 816
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttt aac 864
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
aga ttc cac tgc cac ttc tca cca cgt gac tgg cag cga ctt atc aac 912
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
aac aac tgg gga ttc cgg ccc aag aga ctc agc ttc aag ctc ttc aac 960
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
atc cag gtc aag gag gtc acg caa aat gaa ggc acc aag acc atc gcc 1008
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
aat aac ctc acc agc acc atc cag gtg ttt acg gac tcg gaa tac cag 1056
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
ctg cca tac gtc ctc ggc tct gcc cac cag ggc tgc ctg cct ccg ttc 1104
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
ccg gcg gac gtc ttc atg att cct cag tat ggc tac ctg acg ctg aac 1152
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
aac gga agt cag gcc gtg ggc cgt tcc tcc ttc tac tgc ctg gag tac 1200
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
ttt ccc tct cag atg cta aga acg ggc aac aac ttc tcc ttc agc tat 1248
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Ser Phe Ser Tyr
405 410 415
acc ttc gag gac gtg cct ttc cac agc agc tac gcg cac agc cag agc 1296
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
ctg gac cgg ctg atg aat ccc ctc att gac cag tac ctg tac tac ctg 1344
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
tcg cgg aca caa tcc aca gga ggc aca gcg gga act cag cag ttg ctg 1392
Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu
450 455 460
ttt tct cag gcc ggg cct aac aac atg tct gct cag gcc aaa aac tgg 1440
Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp
465 470 475 480
cta ccc gga cct tgt tat cgg cag caa cgt gtt tcc acg aca ctg tcg 1488
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser
485 490 495
caa aac aac aac agc aac ttt gcc tgg acc ggt gcc acc aaa tac cac 1536
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
ctg aac gga aga gac tct ctg gta aat ccg ggt gtc gcc atg gca acc 1584
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
aac aag gac gac gag gac cgc ttc ttc cca tcc agc ggc atc ctc atg 1632
Asn Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Ile Leu Met
530 535 540
ttt ggc aag cag ggg gct gga aaa gac aac gtg gac tat agc aac gtg 1680
Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Asn Val
545 550 555 560
atg cta acc agc gag gaa gaa atc aag acc act aac cct gtg gcc aca 1728
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
gaa cag tat ggt gtg gtg gcg gat aac ctg cag cag caa aac aca gct 1776
Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
cct att gtg ggg gcc gtc aac agc caa gga gcc tta cct ggc atg gtt 1824
Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
tgg cag aac cgg gac gtg tac ctg cag ggt ccc atc tgg gcc aag att 1872
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
cct cac acg gat ggt aac ttt cac ccg tct cct ctc atg ggc ggc ttt 1920
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
gga ctt aaa cat ccg cct cct cag atc ctg atc aag aac act ccc gtt 1968
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
cct gcg gat cct cca acg gcg ttc aac cag gcc aag ctg aac tct ttc 2016
Pro Ala Asp Pro Pro Thr Ala Phe Asn Gln Ala Lys Leu Asn Ser Phe
660 665 670
atc acg cag tac agc acc gga caa gtc agc gtg gag atc gag tgg gag 2064
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
ctg cag aag gag aac agc aag cgc tgg aac cca gag att cag tat acc 2112
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
tcc aac tac tac aaa tct aca aat gtg gac ttt gct gtt aat act gag 2160
Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
ggt gtt tac tct gag cct cgc ccc att ggc acc cgt tac ctc acc cgt 2208
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
aat ctg taa 2217
Asn Leu
<210> 24
<211> 738
<212> PRT
<213> adeno-associated virus rh.90
<400> 24
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Ser Phe Ser Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu
450 455 460
Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
Asn Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Ile Leu Met
530 535 540
Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Asn Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Ala Phe Asn Gln Ala Lys Leu Asn Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 25
<211> 176
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 25
actcaaagtt caaaccttat cattttttgc tttgttcctc ttggccttgg ttttgtacat 60
cagctttgaa aataccatcc cagggttaat gctggggtta atttataact aagagtgctc 120
tagttttgca atacaggaca tgctataaaa atggaaagat gttgctttct gagaga 176
Claims (24)
- 유전자 편집화 뉴클레아제 발현 카세트로서, 상기 뉴클레아제가 표적화되는 서열을 갖는 숙주 세포로의 전달 이후에 상기 뉴클레아제의 발현을 안내하는 조절 서열에 작동가능하게 연결된 뉴클레아제 코딩 서열을 포함하는 핵산 서열을 포함하고, 상기 조절 서열은 낮은 전사 활성을 갖는 프로모터를 포함하는, 뉴클레아제 발현 카세트.
- 제 1항에 있어서,
상기 프로모터는 간-특이적 프로모터인, 뉴클레아제 발현 카세트. - 제 1항 또는 제 2항에 있어서,
상기 프로모터는 TBG-S1 프로모터 변이체인, 뉴클레아제 발현 카세트. - 제 3항에 있어서,
상기 TBG-S1 변이체는 5' 말단 또는 3' 말단, 또는 양쪽 말단에서 절단되는, 뉴클레아제 발현 카세트. - 제 4항에 있어서,
상기 TBG-S1 변이체는 5' 말단에서 절단되는, 뉴클레아제 발현 카세트. - 제 1항 내지 제 5항 중 어느 한 항에 있어서,
상기 프로모터는 TBG-S1-F64 (서열번호 6)인, 뉴클레아제 발현 카세트. - 제 1항 내지 제 5항 중 어느 한 항에 있어서,
상기 프로모터는 TBG-S1-F113 (서열번호 7)인, 뉴클레아제 발현 카세트. - 제 1항 내지 제 5항 중 어느 한 항에 있어서,
상기 프로모터는 TBG-S1-F140 (서열번호 8)인, 뉴클레아제 발현 카세트. - 제 1항 또는 제 2항에 있어서,
상기 프로모터는 CCL16 프로모터인, 뉴클레아제 발현 카세트. - 제 1항 또는 제 2항에 있어서,
상기 프로모터는 SCLC22A9 프로모터인, 뉴클레아제 발현 카세트. - 제 1항 또는 제 2항에 있어서,
상기 프로모터는 CYP26A1 프로모터인, 뉴클레아제 발현 카세트. - 제 1항 내지 제 11항 중 어느 한 항에 있어서,
상기 뉴클레아제는 메가뉴클레아제, CRISPR/Cas 뉴클레아제, 아연 핑거 뉴클레아제 또는 TALEN인, 뉴클레아제 발현 카세트. - 제 1항 내지 제 11항 중 어느 한 항에 있어서,
상기 뉴클레아제는 메가뉴클레아제인, 뉴클레아제 발현 카세트. - 제 1항 내지 제 13항 중 어느 한 항에 따른 뉴클레아제 발현 카세트, 및 담체, 현탁제 및/또는 부형제 중 하나 이상을 포함하는 약제학적 조성물.
- 제 14항에 있어서,
상기 발현은 비-바이러스성 전달 시스템으로 되는, 약제학적 조성물. - 제 15항에 있어서,
상기 비-바이러스성 전달 시스템은 지질 나노입자인, 약제학적 조성물. - 제 1항 내지 제 13항 중 어느 한 항에 따른 뉴클레아제 발현 카세트를 포함하는 바이러스성 벡터.
- 유전자 편집화에 유용한 재조합 AAV로서, AAV 캡시드 및 상기 AAV 캡시드에 포장된 벡터 게놈을 포함하고, 상기 벡터 게놈은
(a) 제 1항 내지 제 13항 중 어느 한 항에 따른 발현 카세트; 및
(b) 상기 발현 카세트를 상기 캡시드 내에 포장하는데 필요한 AAV 역전된 말단 반복서열
을 포함하는, 재조합 AAV. - 제 17항에 따른 바이러스성 벡터 또는 제 18항에 따른 재조합 AAV, 및 담체, 희석제 및/또는 부형제 중 하나 이상을 포함하는 조성물.
- 표적화된 유전자를 편집하는 방법으로서, 제 1항 내지 제 13항 중 어느 한 항에 따른 뉴클레아제 발현 카세트, 제 14항 내지 제 16항 중 어느 한 항에 따른 조성물, 제 17항에 따른 바이러스성 벡터, 또는 제 18항에 따른 rAAV를 전달하는 단계를 포함하는, 방법.
- 유전자 표적화 뉴클레아제의 표적-외 활성을 감소시키는 방법으로서, 제 1항 내지 제 13항 중 어느 한 항에 따른 뉴클레아제 발현 카세트, 제 14항 내지 제 16항 중 어느 한 항에 따른 조성물, 제 17항에 따른 바이러스성 벡터 또는 제 18항에 따른 rAAV를 전달하는 단계를 포함하는, 방법.
- 서열번호 6, 서열번호 7 또는 서열번호 8의 서열을 포함하는 프로모터.
- 제 22항의 프로모터를 포함하는 발현 카세트.
- 제 22항의 프로모터를 포함하는 발현 벡터.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063016139P | 2020-04-27 | 2020-04-27 | |
US63/016,139 | 2020-04-27 | ||
PCT/US2021/029403 WO2021222249A1 (en) | 2020-04-27 | 2021-04-27 | Compositions and methods for reducing nuclease expression and off-target activity using a promoter with low transcriptional activity |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230003554A true KR20230003554A (ko) | 2023-01-06 |
Family
ID=78332160
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227040655A KR20230003554A (ko) | 2020-04-27 | 2021-04-27 | 낮은 전사 활성을 갖는 프로모터를 사용하여 뉴클레아제 발현 및 표적-외 활성을 감소시키기 위한 조성물 및 방법 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230167464A1 (ko) |
EP (1) | EP4142801A1 (ko) |
JP (1) | JP2023524436A (ko) |
KR (1) | KR20230003554A (ko) |
WO (1) | WO2021222249A1 (ko) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3169776A4 (en) * | 2014-07-14 | 2018-07-04 | The Regents of The University of California | Crispr/cas transcriptional modulation |
JP6851319B2 (ja) * | 2015-04-27 | 2021-03-31 | ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア | ヒト疾患のCRISPR/Cas9媒介性の修正のためのデュアルAAVベクター系 |
JP2020532987A (ja) * | 2017-09-08 | 2020-11-19 | ポセイダ セラピューティクス,インコーポレイティド | キメラリガンド受容体(clr)介在性の条件遺伝子発現のための組成物および方法 |
CN109797153A (zh) * | 2019-03-05 | 2019-05-24 | 内蒙古自治区农牧业科学院 | 弱化组织特异性启动子、提高植物光合作用效率的方法及其应用 |
-
2021
- 2021-04-27 EP EP21795925.3A patent/EP4142801A1/en active Pending
- 2021-04-27 WO PCT/US2021/029403 patent/WO2021222249A1/en unknown
- 2021-04-27 US US17/997,108 patent/US20230167464A1/en active Pending
- 2021-04-27 JP JP2022565788A patent/JP2023524436A/ja active Pending
- 2021-04-27 KR KR1020227040655A patent/KR20230003554A/ko active Search and Examination
Also Published As
Publication number | Publication date |
---|---|
EP4142801A1 (en) | 2023-03-08 |
WO2021222249A1 (en) | 2021-11-04 |
JP2023524436A (ja) | 2023-06-12 |
US20230167464A1 (en) | 2023-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7349931B2 (ja) | 高ビリルビン血症の処置 | |
CN113646005A (zh) | 用于drg特异性降低转基因表达的组合物 | |
KR102526711B1 (ko) | 고효율 게놈 편집을 위한 아데노-관련 바이러스 벡터 변이체 및 이의 방법 | |
US20200407750A1 (en) | Novel adeno-associated virus (aav) vectors, aav vectors having reduced capsid deamidation and uses therefor | |
US11938197B2 (en) | Polynucleotides and vectors for the expression of transgenes | |
RU2725813C2 (ru) | Векторы, содержащие спейсерные/филлер полинуклеотидные последовательности, и способы их применения | |
US20210123073A1 (en) | Novel adeno-associated virus (aav) vectors, aav vectors having reduced capsid deamidation and uses therefor | |
CN115803064A (zh) | 用于drg特异性降低转基因表达的组合物 | |
KR20220004696A (ko) | 폼페병의 치료에 유용한 조성물 | |
TW202305124A (zh) | 具有腦特異性靶向模體的新穎構成物及含有其之組成物 | |
TW202304528A (zh) | 用於治療遺傳疾病的體內核酸酶媒介的基因靶向之組成物及方法 | |
CN113747926A (zh) | 用于肌肉表达的杂合启动子 | |
US20230383313A1 (en) | Improved adeno-associated virus (aav) vector and uses therefor | |
US20220370638A1 (en) | Compositions and methods for treatment of maple syrup urine disease | |
US20230374541A1 (en) | Recombinant adeno-associated viruses for cns or muscle delivery | |
KR20240028976A (ko) | 뇌에서 높은 발현 수준을 갖는 aav 조성물 | |
KR20230003554A (ko) | 낮은 전사 활성을 갖는 프로모터를 사용하여 뉴클레아제 발현 및 표적-외 활성을 감소시키기 위한 조성물 및 방법 | |
KR20230117157A (ko) | 조직 특이적 표적화 모티프를 갖는 신규 조성물 및 이를 포함하는 조성물 | |
US20230175014A1 (en) | Compositions and methods for reducing nuclease expression and off-target activity using a promoter with low transcriptional activity | |
WO2024154102A1 (en) | Compositions and methods for administration of therapeutic and diagnostic agents to the central nervous system | |
JP2024515612A (ja) | 球脊髄性筋萎縮症(sbma)の治療に有用な組成物 | |
CN117897492A (zh) | 用于肌肉和cns中的基因表达的杂合启动子 | |
CN116209430A (zh) | 囊泡靶向蛋白及其用途 | |
WO2019212973A1 (en) | Raav-mediated nuclease-associated vector integration (raav-navi) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |