KR20230117157A - 조직 특이적 표적화 모티프를 갖는 신규 조성물 및 이를 포함하는 조성물 - Google Patents
조직 특이적 표적화 모티프를 갖는 신규 조성물 및 이를 포함하는 조성물 Download PDFInfo
- Publication number
- KR20230117157A KR20230117157A KR1020237020955A KR20237020955A KR20230117157A KR 20230117157 A KR20230117157 A KR 20230117157A KR 1020237020955 A KR1020237020955 A KR 1020237020955A KR 20237020955 A KR20237020955 A KR 20237020955A KR 20230117157 A KR20230117157 A KR 20230117157A
- Authority
- KR
- South Korea
- Prior art keywords
- gly
- ser
- ala
- leu
- asn
- Prior art date
Links
- 230000008685 targeting Effects 0.000 title claims abstract description 105
- 239000000203 mixture Substances 0.000 title claims abstract description 69
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 164
- 210000000234 capsid Anatomy 0.000 claims abstract description 152
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 138
- 239000013598 vector Substances 0.000 claims abstract description 116
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 85
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 75
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 39
- 210000004027 cell Anatomy 0.000 claims description 90
- 238000000034 method Methods 0.000 claims description 76
- 150000007523 nucleic acids Chemical group 0.000 claims description 69
- 230000014509 gene expression Effects 0.000 claims description 62
- 238000010361 transduction Methods 0.000 claims description 48
- 230000026683 transduction Effects 0.000 claims description 44
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 42
- 210000004556 brain Anatomy 0.000 claims description 38
- 238000004519 manufacturing process Methods 0.000 claims description 37
- 150000001413 amino acids Chemical class 0.000 claims description 36
- 239000002245 particle Substances 0.000 claims description 29
- 241000702421 Dependoparvovirus Species 0.000 claims description 26
- 229920001184 polypeptide Polymers 0.000 claims description 26
- 108090000565 Capsid Proteins Proteins 0.000 claims description 25
- 102100023321 Ceruloplasmin Human genes 0.000 claims description 25
- 239000002105 nanoparticle Substances 0.000 claims description 24
- 230000003612 virological effect Effects 0.000 claims description 22
- 210000002889 endothelial cell Anatomy 0.000 claims description 21
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 18
- 230000004927 fusion Effects 0.000 claims description 18
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 15
- 238000000338 in vitro Methods 0.000 claims description 15
- 206010022000 influenza Diseases 0.000 claims description 15
- 230000001225 therapeutic effect Effects 0.000 claims description 15
- 201000010099 disease Diseases 0.000 claims description 14
- 238000011282 treatment Methods 0.000 claims description 14
- 230000003511 endothelial effect Effects 0.000 claims description 13
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 11
- 239000007900 aqueous suspension Substances 0.000 claims description 9
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 9
- 210000004072 lung Anatomy 0.000 claims description 8
- 201000003883 Cystic fibrosis Diseases 0.000 claims description 6
- 101000987117 Homo sapiens Monocarboxylate transporter 8 Proteins 0.000 claims description 5
- 102100027871 Monocarboxylate transporter 8 Human genes 0.000 claims description 5
- 210000004899 c-terminal region Anatomy 0.000 claims description 5
- 239000003795 chemical substances by application Substances 0.000 claims description 4
- 230000001965 increasing effect Effects 0.000 claims description 4
- 108091005703 transmembrane proteins Proteins 0.000 claims description 4
- 102000035160 transmembrane proteins Human genes 0.000 claims description 4
- 101150054399 ace2 gene Proteins 0.000 claims description 3
- 208000019693 Lung disease Diseases 0.000 claims description 2
- 108010052285 Membrane Proteins Proteins 0.000 abstract description 4
- 235000018102 proteins Nutrition 0.000 description 79
- 229940024606 amino acid Drugs 0.000 description 39
- 241000282326 Felis catus Species 0.000 description 37
- 235000001014 amino acid Nutrition 0.000 description 36
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 36
- 108010079364 N-glycylalanine Proteins 0.000 description 34
- 108700019146 Transgenes Proteins 0.000 description 31
- 230000003472 neutralizing effect Effects 0.000 description 25
- 230000001105 regulatory effect Effects 0.000 description 25
- 108020004414 DNA Proteins 0.000 description 24
- 230000027455 binding Effects 0.000 description 24
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 24
- 108010015792 glycyllysine Proteins 0.000 description 24
- 210000001519 tissue Anatomy 0.000 description 24
- 239000013612 plasmid Substances 0.000 description 22
- 108010061238 threonyl-glycine Proteins 0.000 description 22
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 20
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 20
- 241000700605 Viruses Species 0.000 description 20
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 20
- 150000002632 lipids Chemical class 0.000 description 20
- 108010053725 prolylvaline Proteins 0.000 description 20
- 239000013603 viral vector Substances 0.000 description 20
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 19
- 108010050848 glycylleucine Proteins 0.000 description 19
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 18
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 18
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 18
- 238000001415 gene therapy Methods 0.000 description 18
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 18
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 18
- 102000039446 nucleic acids Human genes 0.000 description 18
- 108020004707 nucleic acids Proteins 0.000 description 18
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 17
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 17
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 17
- 108010092854 aspartyllysine Proteins 0.000 description 17
- 230000008499 blood brain barrier function Effects 0.000 description 17
- 210000001218 blood-brain barrier Anatomy 0.000 description 17
- 241000880493 Leptailurus serval Species 0.000 description 16
- 239000003623 enhancer Substances 0.000 description 16
- -1 spacer amino acids Chemical class 0.000 description 16
- 108060003951 Immunoglobulin Proteins 0.000 description 15
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 15
- 241000125945 Protoparvovirus Species 0.000 description 15
- 108010044940 alanylglutamine Proteins 0.000 description 15
- 108010087823 glycyltyrosine Proteins 0.000 description 15
- 108010092114 histidylphenylalanine Proteins 0.000 description 15
- 102000018358 immunoglobulin Human genes 0.000 description 15
- 238000003780 insertion Methods 0.000 description 15
- 230000037431 insertion Effects 0.000 description 15
- 229920000638 styrene acrylonitrile Polymers 0.000 description 15
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 14
- ODBLJLZVLAWVMS-GUBZILKMSA-N Gln-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N ODBLJLZVLAWVMS-GUBZILKMSA-N 0.000 description 14
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 14
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 14
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 14
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 14
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 14
- 108010070944 alanylhistidine Proteins 0.000 description 14
- 108010087924 alanylproline Proteins 0.000 description 14
- 230000006240 deamidation Effects 0.000 description 14
- 230000000694 effects Effects 0.000 description 14
- 108010057821 leucylproline Proteins 0.000 description 14
- 108010054155 lysyllysine Proteins 0.000 description 14
- 108010031719 prolyl-serine Proteins 0.000 description 14
- 239000013607 AAV vector Substances 0.000 description 13
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 13
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 13
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 13
- 241000282553 Macaca Species 0.000 description 13
- 241000699670 Mus sp. Species 0.000 description 13
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 13
- 206010035664 Pneumonia Diseases 0.000 description 13
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 13
- 239000012634 fragment Substances 0.000 description 13
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 13
- 108010012581 phenylalanylglutamate Proteins 0.000 description 13
- 108010051242 phenylalanylserine Proteins 0.000 description 13
- 108091026890 Coding region Proteins 0.000 description 12
- 201000003176 Severe Acute Respiratory Syndrome Diseases 0.000 description 12
- 210000003169 central nervous system Anatomy 0.000 description 12
- 108020004999 messenger RNA Proteins 0.000 description 12
- 238000004806 packaging method and process Methods 0.000 description 12
- 102000005962 receptors Human genes 0.000 description 12
- 108020003175 receptors Proteins 0.000 description 12
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 11
- 239000004971 Cross linker Substances 0.000 description 11
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 11
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 11
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 11
- 210000001552 airway epithelial cell Anatomy 0.000 description 11
- 108010047495 alanylglycine Proteins 0.000 description 11
- 108010093581 aspartyl-proline Proteins 0.000 description 11
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 11
- 108010009298 lysylglutamic acid Proteins 0.000 description 11
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 11
- 239000007921 spray Substances 0.000 description 11
- 108010073969 valyllysine Proteins 0.000 description 11
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 10
- QMNFFXRFOJIOKZ-UHFFFAOYSA-N Cycloguanyl Natural products CC1(C)N=C(N)N=C(N)N1C1=CC=C(Cl)C=C1 QMNFFXRFOJIOKZ-UHFFFAOYSA-N 0.000 description 10
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 10
- 230000008901 benefit Effects 0.000 description 10
- 239000003814 drug Substances 0.000 description 10
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 10
- 230000001976 improved effect Effects 0.000 description 10
- 108010017391 lysylvaline Proteins 0.000 description 10
- 239000002773 nucleotide Substances 0.000 description 10
- 125000003729 nucleotide group Chemical group 0.000 description 10
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 10
- 239000000523 sample Substances 0.000 description 10
- 229960002930 sirolimus Drugs 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 9
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 9
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 9
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 9
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 9
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 9
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 9
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 9
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 9
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 9
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 9
- JNJHNBXBGNJESC-KKXDTOCCSA-N Ala-Tyr-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JNJHNBXBGNJESC-KKXDTOCCSA-N 0.000 description 9
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 9
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 9
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 9
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 9
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 9
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 9
- FNXCAFKDGBROCU-STECZYCISA-N Arg-Ile-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FNXCAFKDGBROCU-STECZYCISA-N 0.000 description 9
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 9
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 9
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 9
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 9
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 9
- UBGGJTMETLEXJD-DCAQKATOSA-N Asn-Leu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O UBGGJTMETLEXJD-DCAQKATOSA-N 0.000 description 9
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 9
- HGGIYWURFPGLIU-FXQIFTODSA-N Asn-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(N)=O HGGIYWURFPGLIU-FXQIFTODSA-N 0.000 description 9
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 9
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 9
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 9
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 9
- AKPLMZMNJGNUKT-ZLUOBGJFSA-N Asp-Asp-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O AKPLMZMNJGNUKT-ZLUOBGJFSA-N 0.000 description 9
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 9
- WWOYXVBGHAHQBG-FXQIFTODSA-N Asp-Met-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O WWOYXVBGHAHQBG-FXQIFTODSA-N 0.000 description 9
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 9
- ZFHXNNXMNLWKJH-HJPIBITLSA-N Cys-Tyr-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZFHXNNXMNLWKJH-HJPIBITLSA-N 0.000 description 9
- 108010090461 DFG peptide Proteins 0.000 description 9
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 9
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 9
- JXBZEDIQFFCHPZ-PEFMBERDSA-N Gln-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JXBZEDIQFFCHPZ-PEFMBERDSA-N 0.000 description 9
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 9
- YMCPEHDGTRUOHO-SXNHZJKMSA-N Gln-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N YMCPEHDGTRUOHO-SXNHZJKMSA-N 0.000 description 9
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 9
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 9
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 9
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 9
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 9
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 9
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 9
- SWDNPSMMEWRNOH-HJGDQZAQSA-N Glu-Pro-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWDNPSMMEWRNOH-HJGDQZAQSA-N 0.000 description 9
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 9
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 9
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 9
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 9
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 9
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 9
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 9
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 9
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 9
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 9
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 9
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 9
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 9
- CMMBEMZGNGYJRJ-IHRRRGAJSA-N His-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N CMMBEMZGNGYJRJ-IHRRRGAJSA-N 0.000 description 9
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 9
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 9
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 9
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 9
- FJWALBCCVIHZBS-QXEWZRGKSA-N Ile-Met-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N FJWALBCCVIHZBS-QXEWZRGKSA-N 0.000 description 9
- NPAYJTAXWXJKLO-NAKRPEOUSA-N Ile-Met-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N NPAYJTAXWXJKLO-NAKRPEOUSA-N 0.000 description 9
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 9
- RTSQPLLOYSGMKM-DSYPUSFNSA-N Ile-Trp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N RTSQPLLOYSGMKM-DSYPUSFNSA-N 0.000 description 9
- XDVKZSJODLMNLJ-GGQYPGDFSA-N Ile-Trp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC=3C4=CC=CC=C4NC=3)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 XDVKZSJODLMNLJ-GGQYPGDFSA-N 0.000 description 9
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 9
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 9
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 9
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 9
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 9
- JRJLGNFWYFSJHB-HOCLYGCPSA-N Leu-Gly-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRJLGNFWYFSJHB-HOCLYGCPSA-N 0.000 description 9
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 9
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 9
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 9
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 9
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 9
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 9
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 9
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 9
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 9
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 9
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 9
- PINHPJWGVBKQII-SRVKXCTJSA-N Lys-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N PINHPJWGVBKQII-SRVKXCTJSA-N 0.000 description 9
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 9
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 9
- IPSDPDAOSAEWCN-RHYQMDGZSA-N Lys-Met-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IPSDPDAOSAEWCN-RHYQMDGZSA-N 0.000 description 9
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 9
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 9
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 9
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 9
- NLDXSXDCNZIQCN-ULQDDVLXSA-N Met-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=CC=C1 NLDXSXDCNZIQCN-ULQDDVLXSA-N 0.000 description 9
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 9
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 9
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 9
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 9
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 9
- HQCSLJFGZYOXHW-KKUMJFAQSA-N Phe-His-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O)N HQCSLJFGZYOXHW-KKUMJFAQSA-N 0.000 description 9
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 9
- MLQVJYMFASXBGZ-IHRRRGAJSA-N Pro-Asn-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O MLQVJYMFASXBGZ-IHRRRGAJSA-N 0.000 description 9
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 9
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 9
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 9
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 9
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 9
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 9
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 9
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 9
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 9
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 9
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 9
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 9
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 9
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 9
- QNJZOAHSYPXTAB-VEVYYDQMSA-N Thr-Asn-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O QNJZOAHSYPXTAB-VEVYYDQMSA-N 0.000 description 9
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 9
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 9
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 9
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 9
- HJWVPKJHHLZCNH-DVXDUOKCSA-N Trp-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=3C4=CC=CC=C4NC=3)C)C(O)=O)=CNC2=C1 HJWVPKJHHLZCNH-DVXDUOKCSA-N 0.000 description 9
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 9
- UGFOSENEZHEQKX-PJODQICGSA-N Trp-Val-Ala Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](C)C(O)=O UGFOSENEZHEQKX-PJODQICGSA-N 0.000 description 9
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 9
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 9
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 9
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 9
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 9
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 9
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 9
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 9
- FXVDGDZRYLFQKY-WPRPVWTQSA-N Val-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C FXVDGDZRYLFQKY-WPRPVWTQSA-N 0.000 description 9
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 9
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 9
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 9
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 9
- 108010005233 alanylglutamic acid Proteins 0.000 description 9
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 9
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 9
- 108010062796 arginyllysine Proteins 0.000 description 9
- 239000000872 buffer Substances 0.000 description 9
- 108010069495 cysteinyltyrosine Proteins 0.000 description 9
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 9
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 9
- 108010037850 glycylvaline Proteins 0.000 description 9
- 108010025306 histidylleucine Proteins 0.000 description 9
- 108010027338 isoleucylcysteine Proteins 0.000 description 9
- 108010034529 leucyl-lysine Proteins 0.000 description 9
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 9
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 9
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 9
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 9
- 108010038320 lysylphenylalanine Proteins 0.000 description 9
- 108010056582 methionylglutamic acid Proteins 0.000 description 9
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 9
- 238000000746 purification Methods 0.000 description 9
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 9
- 108010078580 tyrosylleucine Proteins 0.000 description 9
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 9
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 8
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 8
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 8
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 8
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 8
- GBAWQWASNGUNQF-ZLUOBGJFSA-N Asp-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N GBAWQWASNGUNQF-ZLUOBGJFSA-N 0.000 description 8
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 8
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 8
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 8
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 8
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 8
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 8
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 8
- 241000699666 Mus <mouse, genus> Species 0.000 description 8
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 8
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 8
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 8
- AGTHXWTYCLLYMC-FHWLQOOXSA-N Phe-Tyr-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 AGTHXWTYCLLYMC-FHWLQOOXSA-N 0.000 description 8
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 8
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 8
- 108010079005 RDV peptide Proteins 0.000 description 8
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 8
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 8
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 8
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 8
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 8
- YRNBANYVJJBGDI-VZFHVOOUSA-N Thr-Ala-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N)O YRNBANYVJJBGDI-VZFHVOOUSA-N 0.000 description 8
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 8
- WMIUTJPFHMMUGY-ZFWWWQNUSA-N Trp-Pro-Gly Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)NCC(=O)O WMIUTJPFHMMUGY-ZFWWWQNUSA-N 0.000 description 8
- HHPSUFUXXBOFQY-AQZXSJQPSA-N Trp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O HHPSUFUXXBOFQY-AQZXSJQPSA-N 0.000 description 8
- QARCDOCCDOLJSF-HJPIBITLSA-N Tyr-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QARCDOCCDOLJSF-HJPIBITLSA-N 0.000 description 8
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 8
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 8
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 8
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 8
- 108010077245 asparaginyl-proline Proteins 0.000 description 8
- 238000010276 construction Methods 0.000 description 8
- 229940088598 enzyme Drugs 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 239000003112 inhibitor Substances 0.000 description 8
- 238000007431 microscopic evaluation Methods 0.000 description 8
- 239000013608 rAAV vector Substances 0.000 description 8
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 7
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 7
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 7
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 7
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 7
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 7
- 108010047857 aspartylglycine Proteins 0.000 description 7
- 125000002091 cationic group Chemical group 0.000 description 7
- 238000009472 formulation Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000001939 inductive effect Effects 0.000 description 7
- 108010003700 lysyl aspartic acid Proteins 0.000 description 7
- 108010004914 prolylarginine Proteins 0.000 description 7
- 230000010076 replication Effects 0.000 description 7
- 239000004094 surface-active agent Substances 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- 238000010200 validation analysis Methods 0.000 description 7
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 6
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 6
- 108010067770 Endopeptidase K Proteins 0.000 description 6
- BTSPOOHJBYJRKO-CIUDSAMLSA-N Gln-Asp-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BTSPOOHJBYJRKO-CIUDSAMLSA-N 0.000 description 6
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 6
- 108091092195 Intron Proteins 0.000 description 6
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 6
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 6
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 6
- 241000725643 Respiratory syncytial virus Species 0.000 description 6
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 6
- 241000700584 Simplexvirus Species 0.000 description 6
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 108010068265 aspartyltyrosine Proteins 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 102000037865 fusion proteins Human genes 0.000 description 6
- 108020001507 fusion proteins Proteins 0.000 description 6
- 239000000499 gel Substances 0.000 description 6
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 6
- 208000015181 infectious disease Diseases 0.000 description 6
- 239000003446 ligand Substances 0.000 description 6
- 239000002502 liposome Substances 0.000 description 6
- 210000004185 liver Anatomy 0.000 description 6
- 230000004807 localization Effects 0.000 description 6
- 210000003928 nasal cavity Anatomy 0.000 description 6
- 230000036961 partial effect Effects 0.000 description 6
- 238000002823 phage display Methods 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 239000003981 vehicle Substances 0.000 description 6
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 5
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 5
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 5
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 5
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 5
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 5
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 5
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 5
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 5
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 5
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 5
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 5
- OTUQSEPIIVBYEM-IHRRRGAJSA-N Arg-Asn-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OTUQSEPIIVBYEM-IHRRRGAJSA-N 0.000 description 5
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 5
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 5
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 5
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 5
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 5
- WTFIFQWLQXZLIZ-UMPQAUOISA-N Arg-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O WTFIFQWLQXZLIZ-UMPQAUOISA-N 0.000 description 5
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 5
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 5
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 5
- RAKKBBHMTJSXOY-XVYDVKMFSA-N Asn-His-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O RAKKBBHMTJSXOY-XVYDVKMFSA-N 0.000 description 5
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 5
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 5
- QDXQWFBLUVTOFL-FXQIFTODSA-N Asn-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)N)N QDXQWFBLUVTOFL-FXQIFTODSA-N 0.000 description 5
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 5
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 5
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 5
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 5
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 5
- ILJQISGMGXRZQQ-IHRRRGAJSA-N Asp-Arg-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ILJQISGMGXRZQQ-IHRRRGAJSA-N 0.000 description 5
- PJERDVUTUDZPGX-ZKWXMUAHSA-N Asp-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC(O)=O PJERDVUTUDZPGX-ZKWXMUAHSA-N 0.000 description 5
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 5
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 5
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 5
- OGTCOKZFOJIZFG-CIUDSAMLSA-N Asp-His-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OGTCOKZFOJIZFG-CIUDSAMLSA-N 0.000 description 5
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 5
- FQHBAQLBIXLWAG-DCAQKATOSA-N Asp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N FQHBAQLBIXLWAG-DCAQKATOSA-N 0.000 description 5
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 5
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 5
- 241000193738 Bacillus anthracis Species 0.000 description 5
- 208000035473 Communicable disease Diseases 0.000 description 5
- BUIYOWKUSCTBRE-CIUDSAMLSA-N Cys-Arg-Gln Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O BUIYOWKUSCTBRE-CIUDSAMLSA-N 0.000 description 5
- SSNJZBGOMNLSLA-CIUDSAMLSA-N Cys-Leu-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O SSNJZBGOMNLSLA-CIUDSAMLSA-N 0.000 description 5
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 5
- QQOWCDCBFFBRQH-IXOXFDKPSA-N Cys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N)O QQOWCDCBFFBRQH-IXOXFDKPSA-N 0.000 description 5
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 5
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 5
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 5
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 5
- PODFFOWWLUPNMN-DCAQKATOSA-N Gln-His-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PODFFOWWLUPNMN-DCAQKATOSA-N 0.000 description 5
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 5
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 5
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 5
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 5
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 5
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 5
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 5
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 5
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 5
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 5
- UDEPRBFQTWGLCW-CIUDSAMLSA-N Glu-Pro-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O UDEPRBFQTWGLCW-CIUDSAMLSA-N 0.000 description 5
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 5
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 5
- WXONSNSSBYQGNN-AVGNSLFASA-N Glu-Ser-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WXONSNSSBYQGNN-AVGNSLFASA-N 0.000 description 5
- XAXJIUAWAFVADB-VJBMBRPKSA-N Glu-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XAXJIUAWAFVADB-VJBMBRPKSA-N 0.000 description 5
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 5
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 5
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 5
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 5
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 5
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 5
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 5
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 5
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 5
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 5
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 5
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 5
- LDTJBEOANMQRJE-CIUDSAMLSA-N His-Cys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LDTJBEOANMQRJE-CIUDSAMLSA-N 0.000 description 5
- DVHGLDYMGWTYKW-GUBZILKMSA-N His-Gln-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DVHGLDYMGWTYKW-GUBZILKMSA-N 0.000 description 5
- AKEDPWJFQULLPE-IUCAKERBSA-N His-Glu-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O AKEDPWJFQULLPE-IUCAKERBSA-N 0.000 description 5
- CHZRWFUGWRTUOD-IUCAKERBSA-N His-Gly-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N CHZRWFUGWRTUOD-IUCAKERBSA-N 0.000 description 5
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 5
- JUIOPCXACJLRJK-AVGNSLFASA-N His-Lys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N JUIOPCXACJLRJK-AVGNSLFASA-N 0.000 description 5
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 5
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 5
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 5
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 5
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 5
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 5
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 5
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 5
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 description 5
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 description 5
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 5
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 5
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 5
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 5
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 5
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 5
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 5
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 5
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 5
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 5
- MJWVXZABPOKJJF-ACRUOGEOSA-N Leu-Phe-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MJWVXZABPOKJJF-ACRUOGEOSA-N 0.000 description 5
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 5
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 5
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 5
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 5
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 5
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 5
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 5
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 5
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 5
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 5
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 5
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 5
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 5
- HZLSUXCMSIBCRV-RVMXOQNASA-N Met-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N HZLSUXCMSIBCRV-RVMXOQNASA-N 0.000 description 5
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 5
- 108010047562 NGR peptide Proteins 0.000 description 5
- 101710163270 Nuclease Proteins 0.000 description 5
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 5
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 5
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 5
- AKJAKCBHLJGRBU-JYJNAYRXSA-N Phe-Glu-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AKJAKCBHLJGRBU-JYJNAYRXSA-N 0.000 description 5
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 5
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 5
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 5
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 5
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 5
- ZYBUKTMPPFQSHL-JYJNAYRXSA-N Pro-Asp-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZYBUKTMPPFQSHL-JYJNAYRXSA-N 0.000 description 5
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 5
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 5
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 5
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 5
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 5
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 5
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 5
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 5
- HOTVCUAVDQHUDB-UFYCRDLUSA-N Pro-Phe-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 HOTVCUAVDQHUDB-UFYCRDLUSA-N 0.000 description 5
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 5
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 5
- DMNANGOFEUVBRV-GJZGRUSLSA-N Pro-Trp-Gly Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)O)C(=O)[C@@H]1CCCN1 DMNANGOFEUVBRV-GJZGRUSLSA-N 0.000 description 5
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 5
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 5
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 5
- DGPGKMKUNGKHPK-QEJZJMRPSA-N Ser-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGPGKMKUNGKHPK-QEJZJMRPSA-N 0.000 description 5
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 5
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 5
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 5
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 5
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 5
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 5
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 5
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 5
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 5
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 5
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 5
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 5
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 5
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 5
- QNMIVTOQXUSGLN-SZMVWBNQSA-N Trp-Arg-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QNMIVTOQXUSGLN-SZMVWBNQSA-N 0.000 description 5
- BGWSLEYVITZIQP-DCPHZVHLSA-N Trp-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O BGWSLEYVITZIQP-DCPHZVHLSA-N 0.000 description 5
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 5
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 5
- DZKFGCNKEVMXFA-JUKXBJQTSA-N Tyr-Ile-His Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O DZKFGCNKEVMXFA-JUKXBJQTSA-N 0.000 description 5
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 5
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 5
- XEYUMGGWQCIWAR-XVKPBYJWSA-N Val-Gln-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N XEYUMGGWQCIWAR-XVKPBYJWSA-N 0.000 description 5
- JXGWQYWDUOWQHA-DZKIICNBSA-N Val-Gln-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N JXGWQYWDUOWQHA-DZKIICNBSA-N 0.000 description 5
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 5
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 5
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 5
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 5
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 5
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 5
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 5
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 5
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 5
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 5
- 210000005058 airway cell Anatomy 0.000 description 5
- 108010060035 arginylproline Proteins 0.000 description 5
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 238000004113 cell culture Methods 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 230000001268 conjugating effect Effects 0.000 description 5
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 5
- 108010078144 glutaminyl-glycine Proteins 0.000 description 5
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 5
- 238000003306 harvesting Methods 0.000 description 5
- 230000003053 immunization Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 238000001990 intravenous administration Methods 0.000 description 5
- 108010049589 leucyl-leucyl-leucine Proteins 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 5
- 229920000642 polymer Polymers 0.000 description 5
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 5
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 5
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 5
- 108010029020 prolylglycine Proteins 0.000 description 5
- 108010015796 prolylisoleucine Proteins 0.000 description 5
- 108010026333 seryl-proline Proteins 0.000 description 5
- 229940124597 therapeutic agent Drugs 0.000 description 5
- 238000002560 therapeutic procedure Methods 0.000 description 5
- 108010080629 tryptophan-leucine Proteins 0.000 description 5
- 241000701161 unidentified adenovirus Species 0.000 description 5
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 4
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 4
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 4
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 4
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 4
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 4
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 4
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 4
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 4
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 4
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 4
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 4
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 4
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 4
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 4
- BGDILZXXDJCKPF-CIUDSAMLSA-N Arg-Gln-Cys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(O)=O BGDILZXXDJCKPF-CIUDSAMLSA-N 0.000 description 4
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 4
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 4
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 4
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 4
- VRTWYUYCJGNFES-CIUDSAMLSA-N Arg-Ser-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O VRTWYUYCJGNFES-CIUDSAMLSA-N 0.000 description 4
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 4
- CTAPSNCVKPOOSM-KKUMJFAQSA-N Arg-Tyr-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O CTAPSNCVKPOOSM-KKUMJFAQSA-N 0.000 description 4
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 4
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 4
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 4
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 4
- MOHUTCNYQLMARY-GUBZILKMSA-N Asn-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MOHUTCNYQLMARY-GUBZILKMSA-N 0.000 description 4
- FODVBOKTYKYRFJ-CIUDSAMLSA-N Asn-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FODVBOKTYKYRFJ-CIUDSAMLSA-N 0.000 description 4
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 4
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 4
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 4
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 4
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 4
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 4
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 4
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 4
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 4
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 4
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 4
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 4
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 4
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 4
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 4
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 4
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 4
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 4
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 4
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 4
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 102100021277 Beta-secretase 2 Human genes 0.000 description 4
- 101710150190 Beta-secretase 2 Proteins 0.000 description 4
- 241000283690 Bos taurus Species 0.000 description 4
- 102100034746 Cyclin-dependent kinase-like 5 Human genes 0.000 description 4
- DGQJGBDBFVGLGL-ZKWXMUAHSA-N Cys-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N DGQJGBDBFVGLGL-ZKWXMUAHSA-N 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 201000011240 Frontotemporal dementia Diseases 0.000 description 4
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 4
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 4
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 4
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 4
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 4
- BZULIEARJFRINC-IHRRRGAJSA-N Gln-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N BZULIEARJFRINC-IHRRRGAJSA-N 0.000 description 4
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 4
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 4
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 4
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 4
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 4
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 4
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 4
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 4
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 4
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 4
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 4
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 4
- XOIATPHFYVWFEU-DCAQKATOSA-N Glu-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOIATPHFYVWFEU-DCAQKATOSA-N 0.000 description 4
- JGHNIWVNCAOVRO-DCAQKATOSA-N Glu-His-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGHNIWVNCAOVRO-DCAQKATOSA-N 0.000 description 4
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 4
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 4
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 4
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 4
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 4
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 4
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 4
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 4
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 4
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 4
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 4
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 4
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 4
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 4
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 4
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 4
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 4
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 4
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 4
- 101000929928 Homo sapiens Angiotensin-converting enzyme 2 Proteins 0.000 description 4
- 108090000144 Human Proteins Proteins 0.000 description 4
- 102000003839 Human Proteins Human genes 0.000 description 4
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 4
- AMSYMDIIIRJRKZ-HJPIBITLSA-N Ile-His-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AMSYMDIIIRJRKZ-HJPIBITLSA-N 0.000 description 4
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 4
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 4
- 102000013463 Immunoglobulin Light Chains Human genes 0.000 description 4
- 108010065825 Immunoglobulin Light Chains Proteins 0.000 description 4
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 4
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 4
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 4
- ZDSNOSQHMJBRQN-SRVKXCTJSA-N Leu-Asp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZDSNOSQHMJBRQN-SRVKXCTJSA-N 0.000 description 4
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 4
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 4
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 4
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 4
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 4
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 4
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 4
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 4
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 4
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 4
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 4
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 4
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 4
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 4
- GHOIOYHDDKXIDX-SZMVWBNQSA-N Lys-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 GHOIOYHDDKXIDX-SZMVWBNQSA-N 0.000 description 4
- KFSALEZVQJYHCE-AVGNSLFASA-N Lys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N KFSALEZVQJYHCE-AVGNSLFASA-N 0.000 description 4
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 4
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 4
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 4
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 4
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 4
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 4
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 101100182712 Mus musculus Ly6a gene Proteins 0.000 description 4
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 4
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 4
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 4
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 4
- QRUOLOPKCOEZKU-HJWJTTGWSA-N Phe-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N QRUOLOPKCOEZKU-HJWJTTGWSA-N 0.000 description 4
- GRVMHFCZUIYNKQ-UFYCRDLUSA-N Phe-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GRVMHFCZUIYNKQ-UFYCRDLUSA-N 0.000 description 4
- YVXPUUOTMVBKDO-IHRRRGAJSA-N Phe-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CS)C(=O)O YVXPUUOTMVBKDO-IHRRRGAJSA-N 0.000 description 4
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 4
- CXMSESHALPOLRE-MEYUZBJRSA-N Phe-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O CXMSESHALPOLRE-MEYUZBJRSA-N 0.000 description 4
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 4
- ZOGICTVLQDWPER-UFYCRDLUSA-N Phe-Tyr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O ZOGICTVLQDWPER-UFYCRDLUSA-N 0.000 description 4
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 4
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 4
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 4
- RETPETNFPLNLRV-JYJNAYRXSA-N Pro-Asn-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O RETPETNFPLNLRV-JYJNAYRXSA-N 0.000 description 4
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 4
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 4
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 4
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 4
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 4
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 4
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 4
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 4
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 4
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 4
- 238000011529 RT qPCR Methods 0.000 description 4
- 108091027981 Response element Proteins 0.000 description 4
- BKOKTRCZXRIQPX-ZLUOBGJFSA-N Ser-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N BKOKTRCZXRIQPX-ZLUOBGJFSA-N 0.000 description 4
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 4
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 4
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 4
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 4
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 4
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 4
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 4
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 4
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 4
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 4
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 4
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 4
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 4
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 4
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 4
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 4
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 4
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 4
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 4
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 4
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 4
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 4
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 4
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 4
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 4
- XZLHHHYSWIYXHD-XIRDDKMYSA-N Trp-Gln-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XZLHHHYSWIYXHD-XIRDDKMYSA-N 0.000 description 4
- YRSOERSDNRSCBC-XIRDDKMYSA-N Trp-His-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CS)C(=O)O)N YRSOERSDNRSCBC-XIRDDKMYSA-N 0.000 description 4
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 4
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 4
- SDNVRAKIJVKAGS-LKTVYLICSA-N Tyr-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N SDNVRAKIJVKAGS-LKTVYLICSA-N 0.000 description 4
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 4
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 4
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 4
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 4
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 4
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 4
- XDGPTBVOSHKDFT-KKUMJFAQSA-N Tyr-Met-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XDGPTBVOSHKDFT-KKUMJFAQSA-N 0.000 description 4
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 4
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 4
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 4
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 4
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 4
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 4
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 4
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 4
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 4
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 4
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 4
- 239000000427 antigen Substances 0.000 description 4
- 108091007433 antigens Proteins 0.000 description 4
- 102000036639 antigens Human genes 0.000 description 4
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000007812 deficiency Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 210000002919 epithelial cell Anatomy 0.000 description 4
- 108010077515 glycylproline Proteins 0.000 description 4
- 108010084389 glycyltryptophan Proteins 0.000 description 4
- 108010040030 histidinoalanine Proteins 0.000 description 4
- 108010036413 histidylglycine Proteins 0.000 description 4
- 102000048657 human ACE2 Human genes 0.000 description 4
- 210000005260 human cell Anatomy 0.000 description 4
- 238000002649 immunization Methods 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 208000033065 inborn errors of immunity Diseases 0.000 description 4
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 4
- 108010012058 leucyltyrosine Proteins 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 108091070501 miRNA Proteins 0.000 description 4
- 239000002679 microRNA Substances 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000007481 next generation sequencing Methods 0.000 description 4
- 244000052769 pathogen Species 0.000 description 4
- 108010024607 phenylalanylalanine Proteins 0.000 description 4
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 4
- 229920001993 poloxamer 188 Polymers 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 108010077112 prolyl-proline Proteins 0.000 description 4
- 108010070643 prolylglutamic acid Proteins 0.000 description 4
- 108010071207 serylmethionine Proteins 0.000 description 4
- 210000000278 spinal cord Anatomy 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- QJJXYPPXXYFBGM-SHYZHZOCSA-N tacrolimus Natural products CO[C@H]1C[C@H](CC[C@@H]1O)C=C(C)[C@H]2OC(=O)[C@H]3CCCCN3C(=O)C(=O)[C@@]4(O)O[C@@H]([C@H](C[C@H]4C)OC)[C@@H](C[C@H](C)CC(=C[C@@H](CC=C)C(=O)C[C@H](O)[C@H]2C)C)OC QJJXYPPXXYFBGM-SHYZHZOCSA-N 0.000 description 4
- 230000032258 transport Effects 0.000 description 4
- 108010038745 tryptophylglycine Proteins 0.000 description 4
- 108010045269 tryptophyltryptophan Proteins 0.000 description 4
- 210000005166 vasculature Anatomy 0.000 description 4
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 3
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 3
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 3
- FSPQNLYOFCXUCE-BPUTZDHNSA-N Arg-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FSPQNLYOFCXUCE-BPUTZDHNSA-N 0.000 description 3
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 3
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 3
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 3
- BKZFBJYIVSBXCO-KKUMJFAQSA-N Asn-Phe-His Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O BKZFBJYIVSBXCO-KKUMJFAQSA-N 0.000 description 3
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 3
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 3
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 3
- 102000007370 Ataxin2 Human genes 0.000 description 3
- 108010032951 Ataxin2 Proteins 0.000 description 3
- 238000011740 C57BL/6 mouse Methods 0.000 description 3
- 238000011746 C57BL/6J (JAX™ mouse strain) Methods 0.000 description 3
- 208000025721 COVID-19 Diseases 0.000 description 3
- 241000711573 Coronaviridae Species 0.000 description 3
- JRZMCSIUYGSJKP-ZKWXMUAHSA-N Cys-Val-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JRZMCSIUYGSJKP-ZKWXMUAHSA-N 0.000 description 3
- 102100027723 Endogenous retrovirus group K member 6 Rec protein Human genes 0.000 description 3
- 101710091045 Envelope protein Proteins 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 241000282324 Felis Species 0.000 description 3
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 3
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 3
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 3
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 3
- ININBLZFFVOQIO-JHEQGTHGSA-N Gln-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O ININBLZFFVOQIO-JHEQGTHGSA-N 0.000 description 3
- UQKVUFGUSVYJMQ-IRIUXVKKSA-N Gln-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N)O UQKVUFGUSVYJMQ-IRIUXVKKSA-N 0.000 description 3
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 3
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 3
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 3
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 3
- 101000623857 Homo sapiens Serine/threonine-protein kinase mTOR Proteins 0.000 description 3
- 102000018251 Hypoxanthine Phosphoribosyltransferase Human genes 0.000 description 3
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 3
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 3
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 3
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 3
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 3
- JTBFQNHKNRZJDS-SYWGBEHUSA-N Ile-Trp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C)C(=O)O)N JTBFQNHKNRZJDS-SYWGBEHUSA-N 0.000 description 3
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 3
- 108010001831 LDL receptors Proteins 0.000 description 3
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 3
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 3
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 3
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 3
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 3
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 3
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 3
- OTKQHDPECKUDSB-SZMVWBNQSA-N Met-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OTKQHDPECKUDSB-SZMVWBNQSA-N 0.000 description 3
- 108010066427 N-valyltryptophan Proteins 0.000 description 3
- 102100028200 Ornithine transcarbamylase, mitochondrial Human genes 0.000 description 3
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 3
- GCFNFKNPCMBHNT-IRXDYDNUSA-N Phe-Tyr-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)NCC(=O)O)N GCFNFKNPCMBHNT-IRXDYDNUSA-N 0.000 description 3
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 3
- 229920002873 Polyethylenimine Polymers 0.000 description 3
- 108010071690 Prealbumin Proteins 0.000 description 3
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 3
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 3
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 3
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 3
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 3
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 3
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 3
- 229940096437 Protein S Drugs 0.000 description 3
- 101710188315 Protein X Proteins 0.000 description 3
- 241001068295 Replication defective viruses Species 0.000 description 3
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 3
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 3
- 102100023085 Serine/threonine-protein kinase mTOR Human genes 0.000 description 3
- 101710198474 Spike protein Proteins 0.000 description 3
- QJJXYPPXXYFBGM-LFZNUXCKSA-N Tacrolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1\C=C(/C)[C@@H]1[C@H](C)[C@@H](O)CC(=O)[C@H](CC=C)/C=C(C)/C[C@H](C)C[C@H](OC)[C@H]([C@H](C[C@H]2C)OC)O[C@@]2(O)C(=O)C(=O)N2CCCC[C@H]2C(=O)O1 QJJXYPPXXYFBGM-LFZNUXCKSA-N 0.000 description 3
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 3
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 3
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 102000009190 Transthyretin Human genes 0.000 description 3
- QNTBGBCOEYNAPV-CWRNSKLLSA-N Trp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O QNTBGBCOEYNAPV-CWRNSKLLSA-N 0.000 description 3
- OBWQLWYNNZPWGX-QEJZJMRPSA-N Trp-Gln-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OBWQLWYNNZPWGX-QEJZJMRPSA-N 0.000 description 3
- UUZYQOUJTORBQO-ZVZYQTTQSA-N Trp-Val-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 UUZYQOUJTORBQO-ZVZYQTTQSA-N 0.000 description 3
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 3
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 3
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 3
- QVYFTFIBKCDHIE-ACRUOGEOSA-N Tyr-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O QVYFTFIBKCDHIE-ACRUOGEOSA-N 0.000 description 3
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 239000004480 active ingredient Substances 0.000 description 3
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 3
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 3
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 3
- 210000004958 brain cell Anatomy 0.000 description 3
- 210000005013 brain tissue Anatomy 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000009792 diffusion process Methods 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 238000011304 droplet digital PCR Methods 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 210000003038 endothelium Anatomy 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 208000037797 influenza A Diseases 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 210000004379 membrane Anatomy 0.000 description 3
- 201000003694 methylmalonic acidemia Diseases 0.000 description 3
- 239000003595 mist Substances 0.000 description 3
- 102000035118 modified proteins Human genes 0.000 description 3
- 108091005573 modified proteins Proteins 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 230000003071 parasitic effect Effects 0.000 description 3
- 239000002831 pharmacologic agent Substances 0.000 description 3
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Substances [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 3
- 229920001983 poloxamer Polymers 0.000 description 3
- 108010090894 prolylleucine Proteins 0.000 description 3
- 230000000241 respiratory effect Effects 0.000 description 3
- 208000023504 respiratory system disease Diseases 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000010186 staining Methods 0.000 description 3
- 150000003431 steroids Chemical class 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 238000002626 targeted therapy Methods 0.000 description 3
- 239000003053 toxin Substances 0.000 description 3
- 231100000765 toxin Toxicity 0.000 description 3
- 108700012359 toxins Proteins 0.000 description 3
- 108010003137 tyrosyltyrosine Proteins 0.000 description 3
- 241000712461 unidentified influenza virus Species 0.000 description 3
- 229960005486 vaccine Drugs 0.000 description 3
- 210000002845 virion Anatomy 0.000 description 3
- KSXTUUUQYQYKCR-LQDDAWAPSA-M 2,3-bis[[(z)-octadec-9-enoyl]oxy]propyl-trimethylazanium;chloride Chemical compound [Cl-].CCCCCCCC\C=C/CCCCCCCC(=O)OCC(C[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC KSXTUUUQYQYKCR-LQDDAWAPSA-M 0.000 description 2
- 102100038837 2-Hydroxyacid oxidase 1 Human genes 0.000 description 2
- HXUVTXPOZRFMOY-NSHDSACASA-N 2-[[(2s)-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]-3-phenylpropanoyl]amino]acetic acid Chemical compound NCC(=O)NCC(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 HXUVTXPOZRFMOY-NSHDSACASA-N 0.000 description 2
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 2
- 208000005452 Acute intermittent porphyria Diseases 0.000 description 2
- 241000958487 Adeno-associated virus 3B Species 0.000 description 2
- 102000055025 Adenosine deaminases Human genes 0.000 description 2
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 2
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 2
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 2
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 2
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 2
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 2
- 108010088751 Albumins Proteins 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 2
- 241000712891 Arenavirus Species 0.000 description 2
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 2
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 2
- 102100022146 Arylsulfatase A Human genes 0.000 description 2
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 2
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 2
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 2
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 2
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 2
- LRCIOEVFVGXZKB-BZSNNMDCSA-N Asn-Tyr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LRCIOEVFVGXZKB-BZSNNMDCSA-N 0.000 description 2
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 2
- JGLWFWXGOINXEA-YDHLFZDLSA-N Asp-Val-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JGLWFWXGOINXEA-YDHLFZDLSA-N 0.000 description 2
- 231100000699 Bacterial toxin Toxicity 0.000 description 2
- 102100026189 Beta-galactosidase Human genes 0.000 description 2
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 2
- 241000711895 Bovine orthopneumovirus Species 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 101150044789 Cap gene Proteins 0.000 description 2
- 102100026422 Carbamoyl-phosphate synthase [ammonia], mitochondrial Human genes 0.000 description 2
- 102000000844 Cell Surface Receptors Human genes 0.000 description 2
- 108010001857 Cell Surface Receptors Proteins 0.000 description 2
- 108010036867 Cerebroside-Sulfatase Proteins 0.000 description 2
- 241000606161 Chlamydia Species 0.000 description 2
- 206010008761 Choriomeningitis lymphocytic Diseases 0.000 description 2
- 208000025809 Citrullinemia type II Diseases 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 101710178912 Cyclin-dependent kinase-like 5 Proteins 0.000 description 2
- 241000701022 Cytomegalovirus Species 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 201000011001 Ebola Hemorrhagic Fever Diseases 0.000 description 2
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 2
- 206010014561 Emphysema Diseases 0.000 description 2
- 241000709661 Enterovirus Species 0.000 description 2
- CTKXFMQHOOWWEB-UHFFFAOYSA-N Ethylene oxide/propylene oxide copolymer Chemical compound CCCOC(C)COCCO CTKXFMQHOOWWEB-UHFFFAOYSA-N 0.000 description 2
- 208000024720 Fabry Disease Diseases 0.000 description 2
- 241000711950 Filoviridae Species 0.000 description 2
- 241000710831 Flavivirus Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 102100028496 Galactocerebrosidase Human genes 0.000 description 2
- 108010042681 Galactosylceramidase Proteins 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 2
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 2
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 2
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 2
- 102000006395 Globulins Human genes 0.000 description 2
- 108010044091 Globulins Proteins 0.000 description 2
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 2
- TWYFJOHWGCCRIR-DCAQKATOSA-N Glu-Pro-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYFJOHWGCCRIR-DCAQKATOSA-N 0.000 description 2
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 2
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 2
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 2
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 2
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 2
- MREVELMMFOLESM-HOCLYGCPSA-N Gly-Trp-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O MREVELMMFOLESM-HOCLYGCPSA-N 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 2
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 2
- 101000855412 Homo sapiens Carbamoyl-phosphate synthase [ammonia], mitochondrial Proteins 0.000 description 2
- 101000945692 Homo sapiens Cyclin-dependent kinase-like 5 Proteins 0.000 description 2
- 101000600434 Homo sapiens Putative uncharacterized protein encoded by MIR7-3HG Proteins 0.000 description 2
- 101000617738 Homo sapiens Survival motor neuron protein Proteins 0.000 description 2
- 208000000563 Hyperlipoproteinemia Type II Diseases 0.000 description 2
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 2
- HTDRTKMNJRRYOJ-SIUGBPQLSA-N Ile-Gln-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HTDRTKMNJRRYOJ-SIUGBPQLSA-N 0.000 description 2
- LEHPJMKVGFPSSP-ZQINRCPSSA-N Ile-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 LEHPJMKVGFPSSP-ZQINRCPSSA-N 0.000 description 2
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 2
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 2
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 2
- 208000002979 Influenza in Birds Diseases 0.000 description 2
- 108010074328 Interferon-gamma Proteins 0.000 description 2
- 208000007764 Legionnaires' Disease Diseases 0.000 description 2
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 2
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 2
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 2
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 2
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 2
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 2
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 2
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 2
- 201000009906 Meningitis Diseases 0.000 description 2
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 2
- UFOWQBYMUILSRK-IHRRRGAJSA-N Met-Lys-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 UFOWQBYMUILSRK-IHRRRGAJSA-N 0.000 description 2
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 2
- 102100039124 Methyl-CpG-binding protein 2 Human genes 0.000 description 2
- NWIBSHFKIJFRCO-WUDYKRTCSA-N Mytomycin Chemical compound C1N2C(C(C(C)=C(N)C3=O)=O)=C3[C@@H](COC(N)=O)[C@@]2(OC)[C@@H]2[C@H]1N2 NWIBSHFKIJFRCO-WUDYKRTCSA-N 0.000 description 2
- 241000187654 Nocardia Species 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 2
- 241000150452 Orthohantavirus Species 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 2
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 2
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 2
- 108010069013 Phenylalanine Hydroxylase Proteins 0.000 description 2
- 102100038223 Phenylalanine-4-hydroxylase Human genes 0.000 description 2
- 102000014190 Phosphatidylcholine-sterol O-acyltransferase Human genes 0.000 description 2
- 108010011964 Phosphatidylcholine-sterol O-acyltransferase Proteins 0.000 description 2
- 206010036182 Porphyria acute Diseases 0.000 description 2
- 208000010291 Primary Progressive Nonfluent Aphasia Diseases 0.000 description 2
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 2
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 2
- ZTMLZUNPFDGPKY-VKOGCVSHSA-N Pro-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ZTMLZUNPFDGPKY-VKOGCVSHSA-N 0.000 description 2
- HATVCTYBNCNMAA-AVGNSLFASA-N Pro-Leu-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O HATVCTYBNCNMAA-AVGNSLFASA-N 0.000 description 2
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 102100037401 Putative uncharacterized protein encoded by MIR7-3HG Human genes 0.000 description 2
- 206010037660 Pyrexia Diseases 0.000 description 2
- 206010057190 Respiratory tract infections Diseases 0.000 description 2
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 2
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 208000009415 Spinocerebellar Ataxias Diseases 0.000 description 2
- 201000003622 Spinocerebellar ataxia type 2 Diseases 0.000 description 2
- 102100021947 Survival motor neuron protein Human genes 0.000 description 2
- 241000282898 Sus scrofa Species 0.000 description 2
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 2
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 2
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 2
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 2
- RCEHMXVEMNXRIW-IRIUXVKKSA-N Thr-Gln-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O RCEHMXVEMNXRIW-IRIUXVKKSA-N 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 2
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 description 2
- 108091000117 Tyrosine 3-Monooxygenase Proteins 0.000 description 2
- 102000048218 Tyrosine 3-monooxygenases Human genes 0.000 description 2
- 101150114976 US21 gene Proteins 0.000 description 2
- 206010046306 Upper respiratory tract infection Diseases 0.000 description 2
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 2
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 2
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 2
- NGXQOQNXSGOYOI-BQFCYCMXSA-N Val-Trp-Gln Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 NGXQOQNXSGOYOI-BQFCYCMXSA-N 0.000 description 2
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 2
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 2
- 241000700647 Variola virus Species 0.000 description 2
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 description 2
- 241001492404 Woodchuck hepatitis virus Species 0.000 description 2
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- RJURFGZVJUQBHK-UHFFFAOYSA-N actinomycin D Natural products CC1OC(=O)C(C(C)C)N(C)C(=O)CN(C)C(=O)C2CCCN2C(=O)C(C(C)C)NC(=O)C1NC(=O)C1=C(N)C(=O)C(C)=C2OC(C(C)=CC=C3C(=O)NC4C(=O)NC(C(N5CCCC5C(=O)N(C)CC(=O)N(C)C(C(C)C)C(=O)OC4C)=O)C(C)C)=C3N=C21 RJURFGZVJUQBHK-UHFFFAOYSA-N 0.000 description 2
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 2
- 102000013529 alpha-Fetoproteins Human genes 0.000 description 2
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 2
- 108010030291 alpha-Galactosidase Proteins 0.000 description 2
- 102000005840 alpha-Galactosidase Human genes 0.000 description 2
- 108010061314 alpha-L-Fucosidase Proteins 0.000 description 2
- 102000012086 alpha-L-Fucosidase Human genes 0.000 description 2
- 230000000340 anti-metabolite Effects 0.000 description 2
- 229940100197 antimetabolite Drugs 0.000 description 2
- 239000002256 antimetabolite Substances 0.000 description 2
- 206010064097 avian influenza Diseases 0.000 description 2
- 229940065181 bacillus anthracis Drugs 0.000 description 2
- 244000052616 bacterial pathogen Species 0.000 description 2
- 239000000688 bacterial toxin Substances 0.000 description 2
- 230000008033 biological extinction Effects 0.000 description 2
- 210000004204 blood vessel Anatomy 0.000 description 2
- 108010006025 bovine growth hormone Proteins 0.000 description 2
- 238000011072 cell harvest Methods 0.000 description 2
- 235000013330 chicken meat Nutrition 0.000 description 2
- 235000012000 cholesterol Nutrition 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 206010013023 diphtheria Diseases 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical group P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 231100000676 disease causative agent Toxicity 0.000 description 2
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 2
- 206010014599 encephalitis Diseases 0.000 description 2
- ZUBDGKVDJUIMQQ-ZTNLKOGPSA-N endothelin i Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)NC(=O)[C@H]1NC(=O)[C@H](CC=2C=CC=CC=2)NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]2CSSC[C@@H](C(N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N2)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CSSC1)C1=CNC=N1 ZUBDGKVDJUIMQQ-ZTNLKOGPSA-N 0.000 description 2
- 201000001386 familial hypercholesterolemia Diseases 0.000 description 2
- 239000013020 final formulation Substances 0.000 description 2
- 238000001476 gene delivery Methods 0.000 description 2
- 102000054767 gene variant Human genes 0.000 description 2
- 239000003862 glucocorticoid Substances 0.000 description 2
- AWUCVROLDVIAJX-UHFFFAOYSA-N glycerol 1-phosphate Chemical compound OCC(O)COP(O)(O)=O AWUCVROLDVIAJX-UHFFFAOYSA-N 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 230000002519 immonomodulatory effect Effects 0.000 description 2
- 230000002163 immunogen Effects 0.000 description 2
- 229940072221 immunoglobulins Drugs 0.000 description 2
- 239000003018 immunosuppressive agent Substances 0.000 description 2
- 238000011081 inoculation Methods 0.000 description 2
- 238000007918 intramuscular administration Methods 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 231100000518 lethal Toxicity 0.000 description 2
- 230000001665 lethal effect Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 210000005228 liver tissue Anatomy 0.000 description 2
- 210000005265 lung cell Anatomy 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 208000001419 lymphocytic choriomeningitis Diseases 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- VKHAHZOOUSRJNA-GCNJZUOMSA-N mifepristone Chemical compound C1([C@@H]2C3=C4CCC(=O)C=C4CC[C@H]3[C@@H]3CC[C@@]([C@]3(C2)C)(O)C#CC)=CC=C(N(C)C)C=C1 VKHAHZOOUSRJNA-GCNJZUOMSA-N 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- RTGDFNSFWBGLEC-SYZQJQIISA-N mycophenolate mofetil Chemical compound COC1=C(C)C=2COC(=O)C=2C(O)=C1C\C=C(/C)CCC(=O)OCCN1CCOCC1 RTGDFNSFWBGLEC-SYZQJQIISA-N 0.000 description 2
- 229960004866 mycophenolate mofetil Drugs 0.000 description 2
- 201000009240 nasopharyngitis Diseases 0.000 description 2
- 239000006199 nebulizer Substances 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- 230000000144 pharmacologic effect Effects 0.000 description 2
- 239000002953 phosphate buffered saline Substances 0.000 description 2
- 108010079892 phosphoglycerol kinase Proteins 0.000 description 2
- 230000001766 physiological effect Effects 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 229940044519 poloxamer 188 Drugs 0.000 description 2
- 229920001451 polypropylene glycol Polymers 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 239000003755 preservative agent Substances 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 210000002345 respiratory system Anatomy 0.000 description 2
- 238000004062 sedimentation Methods 0.000 description 2
- 229940126586 small molecule drug Drugs 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 208000002320 spinal muscular atrophy Diseases 0.000 description 2
- 210000000952 spleen Anatomy 0.000 description 2
- 238000012289 standard assay Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000009885 systemic effect Effects 0.000 description 2
- 229940037128 systemic glucocorticoids Drugs 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 210000003437 trachea Anatomy 0.000 description 2
- 230000010415 tropism Effects 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- TZCPCKNHXULUIY-RGULYWFUSA-N 1,2-distearoyl-sn-glycero-3-phosphoserine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@H](N)C(O)=O)OC(=O)CCCCCCCCCCCCCCCCC TZCPCKNHXULUIY-RGULYWFUSA-N 0.000 description 1
- LDGWQMRUWMSZIU-LQDDAWAPSA-M 2,3-bis[(z)-octadec-9-enoxy]propyl-trimethylazanium;chloride Chemical compound [Cl-].CCCCCCCC\C=C/CCCCCCCCOCC(C[N+](C)(C)C)OCCCCCCCC\C=C/CCCCCCCC LDGWQMRUWMSZIU-LQDDAWAPSA-M 0.000 description 1
- KWVJHCQQUFDPLU-YEUCEMRASA-N 2,3-bis[[(z)-octadec-9-enoyl]oxy]propyl-trimethylazanium Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(C[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC KWVJHCQQUFDPLU-YEUCEMRASA-N 0.000 description 1
- JVKUCNQGESRUCL-UHFFFAOYSA-N 2-Hydroxyethyl 12-hydroxyoctadecanoate Chemical compound CCCCCCC(O)CCCCCCCCCCC(=O)OCCO JVKUCNQGESRUCL-UHFFFAOYSA-N 0.000 description 1
- KLDBMPMWBVTYGW-AIDJSRAFSA-N 2-aminoacetic acid (2S)-2-amino-3-hydroxypropanoic acid Chemical compound NCC(O)=O.NCC(O)=O.NCC(O)=O.NCC(O)=O.OC[C@H](N)C(O)=O KLDBMPMWBVTYGW-AIDJSRAFSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- ZISVTYVLWSZJAL-UHFFFAOYSA-N 3,6-bis[4-[bis(2-hydroxydodecyl)amino]butyl]piperazine-2,5-dione Chemical compound CCCCCCCCCCC(O)CN(CC(O)CCCCCCCCCC)CCCCC1NC(=O)C(CCCCN(CC(O)CCCCCCCCCC)CC(O)CCCCCCCCCC)NC1=O ZISVTYVLWSZJAL-UHFFFAOYSA-N 0.000 description 1
- 108010046716 3-Methyl-2-Oxobutanoate Dehydrogenase (Lipoamide) Proteins 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- 241000235389 Absidia Species 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 108010001058 Acyl-CoA Dehydrogenase Proteins 0.000 description 1
- 102000002735 Acyl-CoA Dehydrogenase Human genes 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- WYPUMLRSQMKIJU-BPNCWPANSA-N Ala-Arg-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WYPUMLRSQMKIJU-BPNCWPANSA-N 0.000 description 1
- DAEFQZCYZKRTLR-ZLUOBGJFSA-N Ala-Cys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O DAEFQZCYZKRTLR-ZLUOBGJFSA-N 0.000 description 1
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- RIPMDCIXRYWXSH-KNXALSJPSA-N Ala-Trp-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N RIPMDCIXRYWXSH-KNXALSJPSA-N 0.000 description 1
- 241000223602 Alternaria alternata Species 0.000 description 1
- 108010048154 Angiopoietin-1 Proteins 0.000 description 1
- 102100034594 Angiopoietin-1 Human genes 0.000 description 1
- 201000003126 Anuria Diseases 0.000 description 1
- 102000018655 Apolipoproteins C Human genes 0.000 description 1
- 108010027070 Apolipoproteins C Proteins 0.000 description 1
- 102000013918 Apolipoproteins E Human genes 0.000 description 1
- 108010025628 Apolipoproteins E Proteins 0.000 description 1
- 102000053640 Argininosuccinate synthases Human genes 0.000 description 1
- 108700024106 Argininosuccinate synthases Proteins 0.000 description 1
- 206010058298 Argininosuccinate synthetase deficiency Diseases 0.000 description 1
- 208000002109 Argyria Diseases 0.000 description 1
- 102000003823 Aromatic-L-amino-acid decarboxylases Human genes 0.000 description 1
- 108090000121 Aromatic-L-amino-acid decarboxylases Proteins 0.000 description 1
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 1
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 1
- NYQHSUGFEWDWPD-ACZMJKKPSA-N Asp-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N NYQHSUGFEWDWPD-ACZMJKKPSA-N 0.000 description 1
- YRBGRUOSJROZEI-NHCYSSNCSA-N Asp-His-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O YRBGRUOSJROZEI-NHCYSSNCSA-N 0.000 description 1
- 108010023546 Aspartylglucosylaminase Proteins 0.000 description 1
- 201000002909 Aspergillosis Diseases 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 208000036641 Aspergillus infections Diseases 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 201000001320 Atherosclerosis Diseases 0.000 description 1
- 241000711404 Avian avulavirus 1 Species 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 241000124740 Bocaparvovirus Species 0.000 description 1
- 102100025422 Bone morphogenetic protein receptor type-2 Human genes 0.000 description 1
- 241000588832 Bordetella pertussis Species 0.000 description 1
- 241000712005 Bovine respirovirus 3 Species 0.000 description 1
- 241000711506 Canine coronavirus Species 0.000 description 1
- 241000712083 Canine morbillivirus Species 0.000 description 1
- 241000701931 Canine parvovirus Species 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 241000207206 Cardiobacterium Species 0.000 description 1
- 108090000751 Ceramidases Proteins 0.000 description 1
- 102000004201 Ceramidases Human genes 0.000 description 1
- 206010053684 Cerebrohepatorenal syndrome Diseases 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 201000011297 Citrullinemia Diseases 0.000 description 1
- 241000222290 Cladosporium Species 0.000 description 1
- 241000223205 Coccidioides immitis Species 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 206010010904 Convulsion Diseases 0.000 description 1
- 102100027591 Copper-transporting ATPase 2 Human genes 0.000 description 1
- 241001274613 Corvus frugilegus Species 0.000 description 1
- 241000709687 Coxsackievirus Species 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 201000007336 Cryptococcosis Diseases 0.000 description 1
- 241000221204 Cryptococcus neoformans Species 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- PMATZTZNYRCHOR-CGLBZJNRSA-N Cyclosporin A Chemical compound CC[C@@H]1NC(=O)[C@H]([C@H](O)[C@H](C)C\C=C\C)N(C)C(=O)[C@H](C(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)N(C)C(=O)CN(C)C1=O PMATZTZNYRCHOR-CGLBZJNRSA-N 0.000 description 1
- 108010036949 Cyclosporine Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 108010092160 Dactinomycin Proteins 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 208000000655 Distemper Diseases 0.000 description 1
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 1
- 241001115402 Ebolavirus Species 0.000 description 1
- 241001466953 Echovirus Species 0.000 description 1
- 208000005189 Embolism Diseases 0.000 description 1
- 208000004232 Enteritis Diseases 0.000 description 1
- 208000025127 Erdheim-Chester disease Diseases 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 206010016202 Familial Amyloidosis Diseases 0.000 description 1
- 102000009109 Fc receptors Human genes 0.000 description 1
- 108010087819 Fc receptors Proteins 0.000 description 1
- 108091006020 Fc-tagged proteins Proteins 0.000 description 1
- 241000725579 Feline coronavirus Species 0.000 description 1
- 241000701915 Feline panleukopenia virus Species 0.000 description 1
- 241000701925 Feline parvovirus Species 0.000 description 1
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 1
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 1
- 108010000916 Fimbriae Proteins Proteins 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 241000589602 Francisella tularensis Species 0.000 description 1
- 102100029115 Fumarylacetoacetase Human genes 0.000 description 1
- 206010017533 Fungal infection Diseases 0.000 description 1
- 208000001905 GM2 Gangliosidoses Diseases 0.000 description 1
- 201000008905 GM2 gangliosidosis Diseases 0.000 description 1
- 208000027472 Galactosemias Diseases 0.000 description 1
- 208000015872 Gaucher disease Diseases 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- 208000010055 Globoid Cell Leukodystrophy Diseases 0.000 description 1
- 101710088083 Glomulin Proteins 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 102000003638 Glucose-6-Phosphatase Human genes 0.000 description 1
- 108010086800 Glucose-6-Phosphatase Proteins 0.000 description 1
- 102000004547 Glucosylceramidase Human genes 0.000 description 1
- 108010017544 Glucosylceramidase Proteins 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- GNBMOZPQUXTCRW-STQMWFEESA-N Gly-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)CN)C(O)=O)=CNC2=C1 GNBMOZPQUXTCRW-STQMWFEESA-N 0.000 description 1
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- JZNWSCPGTDBMEW-UHFFFAOYSA-N Glycerophosphorylethanolamin Natural products NCCOP(O)(=O)OCC(O)CO JZNWSCPGTDBMEW-UHFFFAOYSA-N 0.000 description 1
- ZWZWYGMENQVNFU-UHFFFAOYSA-N Glycerophosphorylserin Natural products OC(=O)C(N)COP(O)(=O)OCC(O)CO ZWZWYGMENQVNFU-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 208000032007 Glycogen storage disease due to acid maltase deficiency Diseases 0.000 description 1
- 206010053185 Glycogen storage disease type II Diseases 0.000 description 1
- AEMRFAOFKBGASW-UHFFFAOYSA-N Glycolic acid Polymers OCC(O)=O AEMRFAOFKBGASW-UHFFFAOYSA-N 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 201000005569 Gout Diseases 0.000 description 1
- 102100020948 Growth hormone receptor Human genes 0.000 description 1
- 241000606768 Haemophilus influenzae Species 0.000 description 1
- 241000606766 Haemophilus parainfluenzae Species 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 208000002972 Hepatolenticular Degeneration Diseases 0.000 description 1
- 208000005139 Hereditary Angioedema Types I and II Diseases 0.000 description 1
- 208000033981 Hereditary haemochromatosis Diseases 0.000 description 1
- 208000007514 Herpes zoster Diseases 0.000 description 1
- 101710094396 Hexon protein Proteins 0.000 description 1
- 241000228404 Histoplasma capsulatum Species 0.000 description 1
- 101001031589 Homo sapiens 2-Hydroxyacid oxidase 1 Proteins 0.000 description 1
- 101000823116 Homo sapiens Alpha-1-antitrypsin Proteins 0.000 description 1
- 101000765010 Homo sapiens Beta-galactosidase Proteins 0.000 description 1
- 101001045440 Homo sapiens Beta-hexosaminidase subunit alpha Proteins 0.000 description 1
- 101000936280 Homo sapiens Copper-transporting ATPase 2 Proteins 0.000 description 1
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 1
- 101001122174 Homo sapiens Lipoamide acyltransferase component of branched-chain alpha-keto acid dehydrogenase complex, mitochondrial Proteins 0.000 description 1
- 101000986595 Homo sapiens Ornithine transcarbamylase, mitochondrial Proteins 0.000 description 1
- 101001098868 Homo sapiens Proprotein convertase subtilisin/kexin type 9 Proteins 0.000 description 1
- 101000629622 Homo sapiens Serine-pyruvate aminotransferase Proteins 0.000 description 1
- 101000785978 Homo sapiens Sphingomyelin phosphodiesterase Proteins 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 238000009015 Human TaqMan MicroRNA Assay kit Methods 0.000 description 1
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 1
- 241000702617 Human parvovirus B19 Species 0.000 description 1
- 241000726041 Human respirovirus 1 Species 0.000 description 1
- 241000712003 Human respirovirus 3 Species 0.000 description 1
- 241001559187 Human rubulavirus 2 Species 0.000 description 1
- 241001559186 Human rubulavirus 4 Species 0.000 description 1
- 108010056651 Hydroxymethylbilane synthase Proteins 0.000 description 1
- SHBUUTHKGIVMJT-UHFFFAOYSA-N Hydroxystearate Chemical compound CCCCCCCCCCCCCCCCCC(=O)OO SHBUUTHKGIVMJT-UHFFFAOYSA-N 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- 102100026120 IgG receptor FcRn large subunit p51 Human genes 0.000 description 1
- 101710177940 IgG receptor FcRn large subunit p51 Proteins 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 1
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 1
- 208000028547 Inborn Urea Cycle disease Diseases 0.000 description 1
- 241000371980 Influenza B virus (B/Shanghai/361/2002) Species 0.000 description 1
- 108010001127 Insulin Receptor Proteins 0.000 description 1
- 102100036721 Insulin receptor Human genes 0.000 description 1
- 102100026720 Interferon beta Human genes 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 108090000467 Interferon-beta Proteins 0.000 description 1
- 102000008070 Interferon-gamma Human genes 0.000 description 1
- 102100020873 Interleukin-2 Human genes 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 241000588747 Klebsiella pneumoniae Species 0.000 description 1
- 208000028226 Krabbe disease Diseases 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- 208000006302 Laron syndrome Diseases 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 239000000232 Lipid Bilayer Substances 0.000 description 1
- 102100027064 Lipoamide acyltransferase component of branched-chain alpha-keto acid dehydrogenase complex, mitochondrial Human genes 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- 101100007427 Manduca sexta COVA gene Proteins 0.000 description 1
- 208000030162 Maple syrup disease Diseases 0.000 description 1
- 201000005505 Measles Diseases 0.000 description 1
- 102000018897 Membrane Fusion Proteins Human genes 0.000 description 1
- 108010027796 Membrane Fusion Proteins Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- GRKPXCKLOOUDFG-UFYCRDLUSA-N Met-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 GRKPXCKLOOUDFG-UFYCRDLUSA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 102000019010 Methylmalonyl-CoA Mutase Human genes 0.000 description 1
- 108010051862 Methylmalonyl-CoA mutase Proteins 0.000 description 1
- 241000588621 Moraxella Species 0.000 description 1
- 241000588655 Moraxella catarrhalis Species 0.000 description 1
- 241000712045 Morbillivirus Species 0.000 description 1
- 241000378863 Mucor plumbeus Species 0.000 description 1
- 241000711386 Mumps virus Species 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- 241000186367 Mycobacterium avium Species 0.000 description 1
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 208000031888 Mycoses Diseases 0.000 description 1
- 102100021003 N(4)-(beta-N-acetylglucosaminyl)-L-asparaginase Human genes 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 208000029726 Neurodevelopmental disease Diseases 0.000 description 1
- 208000014060 Niemann-Pick disease Diseases 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 206010030113 Oedema Diseases 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 208000000599 Ornithine Carbamoyltransferase Deficiency Disease Diseases 0.000 description 1
- 206010052450 Ornithine transcarbamoylase deficiency Diseases 0.000 description 1
- 208000035903 Ornithine transcarbamylase deficiency Diseases 0.000 description 1
- 241000712464 Orthomyxoviridae Species 0.000 description 1
- 208000002606 Paramyxoviridae Infections Diseases 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 201000005702 Pertussis Diseases 0.000 description 1
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 1
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 1
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 1
- 201000011252 Phenylketonuria Diseases 0.000 description 1
- 208000005746 Phosphoenolpyruvate carboxykinase deficiency Diseases 0.000 description 1
- 208000000609 Pick Disease of the Brain Diseases 0.000 description 1
- 208000024571 Pick disease Diseases 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 241000364051 Pima Species 0.000 description 1
- 241000711902 Pneumovirus Species 0.000 description 1
- RVGRUAULSDPKGF-UHFFFAOYSA-N Poloxamer Chemical compound C1CO1.CC1CO1 RVGRUAULSDPKGF-UHFFFAOYSA-N 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 229920000954 Polyglycolide Polymers 0.000 description 1
- 229920001214 Polysorbate 60 Polymers 0.000 description 1
- 102100037935 Polyubiquitin-C Human genes 0.000 description 1
- 241000702619 Porcine parvovirus Species 0.000 description 1
- 102100034391 Porphobilinogen deaminase Human genes 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- 102100038955 Proprotein convertase subtilisin/kexin type 9 Human genes 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 102000017975 Protein C Human genes 0.000 description 1
- 201000005660 Protein C Deficiency Diseases 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 206010064911 Pulmonary arterial hypertension Diseases 0.000 description 1
- 108020005115 Pyruvate Kinase Proteins 0.000 description 1
- 102000013009 Pyruvate Kinase Human genes 0.000 description 1
- 208000035977 Rare disease Diseases 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 208000001647 Renal Insufficiency Diseases 0.000 description 1
- 241000702263 Reovirus sp. Species 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 208000006289 Rett Syndrome Diseases 0.000 description 1
- 241000710799 Rubella virus Species 0.000 description 1
- 101150027482 SLC16A2 gene Proteins 0.000 description 1
- 208000021811 Sandhoff disease Diseases 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 206010039587 Scarlet Fever Diseases 0.000 description 1
- 208000018642 Semantic dementia Diseases 0.000 description 1
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 102100026842 Serine-pyruvate aminotransferase Human genes 0.000 description 1
- 229920001304 Solutol HS 15 Polymers 0.000 description 1
- 108010068542 Somatotropin Receptors Proteins 0.000 description 1
- 108010061312 Sphingomyelin Phosphodiesterase Proteins 0.000 description 1
- 102000011971 Sphingomyelin Phosphodiesterase Human genes 0.000 description 1
- 102100026263 Sphingomyelin phosphodiesterase Human genes 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 241000701093 Suid alphaherpesvirus 1 Species 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 102100040347 TAR DNA-binding protein 43 Human genes 0.000 description 1
- 101710150875 TAR DNA-binding protein 43 Proteins 0.000 description 1
- 208000022292 Tay-Sachs disease Diseases 0.000 description 1
- 208000002903 Thalassemia Diseases 0.000 description 1
- 241000203770 Thermoactinomyces vulgaris Species 0.000 description 1
- BWUHENPAEMNGQJ-ZDLURKLDSA-N Thr-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O BWUHENPAEMNGQJ-ZDLURKLDSA-N 0.000 description 1
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 102100026966 Thrombomodulin Human genes 0.000 description 1
- 108010079274 Thrombomodulin Proteins 0.000 description 1
- 108010000499 Thromboplastin Proteins 0.000 description 1
- 208000007536 Thrombosis Diseases 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 1
- 208000002474 Tinea Diseases 0.000 description 1
- 102100030859 Tissue factor Human genes 0.000 description 1
- 241000711484 Transmissible gastroenteritis virus Species 0.000 description 1
- 241000893966 Trichophyton verrucosum Species 0.000 description 1
- 108010063130 Type II Bone Morphogenetic Protein Receptors Proteins 0.000 description 1
- HDSKHCBAVVWPCQ-FHWLQOOXSA-N Tyr-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HDSKHCBAVVWPCQ-FHWLQOOXSA-N 0.000 description 1
- LTSIAOZUVISRAQ-QWRGUYRKSA-N Tyr-Gly-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O LTSIAOZUVISRAQ-QWRGUYRKSA-N 0.000 description 1
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 1
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 1
- 102000003425 Tyrosinase Human genes 0.000 description 1
- 108060008724 Tyrosinase Proteins 0.000 description 1
- 208000032001 Tyrosinemia type 1 Diseases 0.000 description 1
- 101150013568 US16 gene Proteins 0.000 description 1
- 108010058532 UTP-hexose-1-phosphate uridylyltransferase Proteins 0.000 description 1
- 102000006321 UTP-hexose-1-phosphate uridylyltransferase Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108010056354 Ubiquitin C Proteins 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- NMPXRFYMZDIBRF-ZOBUZTSGSA-N Val-Asn-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N NMPXRFYMZDIBRF-ZOBUZTSGSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 1
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 1
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 208000028227 Viral hemorrhagic fever Diseases 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 108070000030 Viral receptors Proteins 0.000 description 1
- 208000018839 Wilson disease Diseases 0.000 description 1
- 101001023436 Xenopus tropicalis Forkhead box protein J1 Proteins 0.000 description 1
- 201000004525 Zellweger Syndrome Diseases 0.000 description 1
- 208000036813 Zellweger spectrum disease Diseases 0.000 description 1
- ATBOMIWRCZXYSZ-XZBBILGWSA-N [1-[2,3-dihydroxypropoxy(hydroxy)phosphoryl]oxy-3-hexadecanoyloxypropan-2-yl] (9e,12e)-octadeca-9,12-dienoate Chemical compound CCCCCCCCCCCCCCCC(=O)OCC(COP(O)(=O)OCC(O)CO)OC(=O)CCCCCCC\C=C\C\C=C\CCCCC ATBOMIWRCZXYSZ-XZBBILGWSA-N 0.000 description 1
- 238000011000 absolute method Methods 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 239000003070 absorption delaying agent Substances 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- RJURFGZVJUQBHK-IIXSONLDSA-N actinomycin D Chemical compound C[C@H]1OC(=O)[C@H](C(C)C)N(C)C(=O)CN(C)C(=O)[C@@H]2CCCN2C(=O)[C@@H](C(C)C)NC(=O)[C@H]1NC(=O)C1=C(N)C(=O)C(C)=C2OC(C(C)=CC=C3C(=O)N[C@@H]4C(=O)N[C@@H](C(N5CCC[C@H]5C(=O)N(C)CC(=O)N(C)[C@@H](C(C)C)C(=O)O[C@@H]4C)=O)C(C)C)=C3N=C21 RJURFGZVJUQBHK-IIXSONLDSA-N 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 244000000022 airborne pathogen Species 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 229940100198 alkylating agent Drugs 0.000 description 1
- 239000002168 alkylating agent Substances 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 102000019199 alpha-Mannosidase Human genes 0.000 description 1
- 108010012864 alpha-Mannosidase Proteins 0.000 description 1
- 201000008333 alpha-mannosidosis Diseases 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 239000003957 anion exchange resin Substances 0.000 description 1
- 229940045799 anthracyclines and related substance Drugs 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000003097 anti-respiratory effect Effects 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 229940045719 antineoplastic alkylating agent nitrosoureas Drugs 0.000 description 1
- 239000003972 antineoplastic antibiotic Substances 0.000 description 1
- 229940045985 antineoplastic platinum compound Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 125000000613 asparagine group Chemical class N[C@@H](CC(N)=O)C(=O)* 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 229960002170 azathioprine Drugs 0.000 description 1
- LMEKQMALGUDUQG-UHFFFAOYSA-N azathioprine Chemical compound CN1C=NC([N+]([O-])=O)=C1SC1=NC=NC2=C1NC=N2 LMEKQMALGUDUQG-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-FPRJBGLDSA-N beta-D-galactose Chemical group OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-FPRJBGLDSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 108010085377 beta-N-Acetylhexosaminidases Proteins 0.000 description 1
- 102000007478 beta-N-Acetylhexosaminidases Human genes 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 229940125385 biologic drug Drugs 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 229920001400 block copolymer Polymers 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000000621 bronchi Anatomy 0.000 description 1
- 206010006451 bronchitis Diseases 0.000 description 1
- 239000007975 buffered saline Substances 0.000 description 1
- 239000012830 cancer therapeutic Substances 0.000 description 1
- 208000014058 canine distemper Diseases 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 208000015114 central nervous system disease Diseases 0.000 description 1
- 201000004559 cerebral degeneration Diseases 0.000 description 1
- 229930183167 cerebroside Natural products 0.000 description 1
- 150000001784 cerebrosides Chemical class 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 238000002038 chemiluminescence detection Methods 0.000 description 1
- CRQQGFGUEAVUIL-UHFFFAOYSA-N chlorothalonil Chemical compound ClC1=C(Cl)C(C#N)=C(Cl)C(C#N)=C1Cl CRQQGFGUEAVUIL-UHFFFAOYSA-N 0.000 description 1
- 229960001265 ciclosporin Drugs 0.000 description 1
- 238000011260 co-administration Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 235000008504 concentrate Nutrition 0.000 description 1
- 108700036934 congenital Sucrase-isomaltase deficiency Proteins 0.000 description 1
- 208000001970 congenital sucrase-isomaltase deficiency Diseases 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 238000009295 crossflow filtration Methods 0.000 description 1
- 229940097362 cyclodextrins Drugs 0.000 description 1
- 229930182912 cyclosporin Natural products 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 239000000824 cytostatic agent Substances 0.000 description 1
- 229960000640 dactinomycin Drugs 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- CFCUWKMKBJTWLW-UHFFFAOYSA-N deoliosyl-3C-alpha-L-digitoxosyl-MTM Natural products CC=1C(O)=C2C(O)=C3C(=O)C(OC4OC(C)C(O)C(OC5OC(C)C(O)C(OC6OC(C)C(O)C(C)(O)C6)C5)C4)C(C(OC)C(=O)C(O)C(C)O)CC3=CC2=CC=1OC(OC(C)C1O)CC1OC1CC(O)C(O)C(C)O1 CFCUWKMKBJTWLW-UHFFFAOYSA-N 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000011026 diafiltration Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- 239000013024 dilution buffer Substances 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000002612 dispersion medium Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 229940126534 drug product Drugs 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 201000002491 encephalomyelitis Diseases 0.000 description 1
- 238000003366 endpoint assay Methods 0.000 description 1
- 238000002641 enzyme replacement therapy Methods 0.000 description 1
- 238000011067 equilibration Methods 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- HQPMKSGTIOYHJT-UHFFFAOYSA-N ethane-1,2-diol;propane-1,2-diol Chemical compound OCCO.CC(O)CO HQPMKSGTIOYHJT-UHFFFAOYSA-N 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 229940126864 fibroblast growth factor Drugs 0.000 description 1
- 239000013305 flexible fiber Substances 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 239000012537 formulation buffer Substances 0.000 description 1
- 229940118764 francisella tularensis Drugs 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 108010022687 fumarylacetoacetase Proteins 0.000 description 1
- 229940044627 gamma-interferon Drugs 0.000 description 1
- 150000002270 gangliosides Chemical class 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 208000007345 glycogen storage disease Diseases 0.000 description 1
- 201000004502 glycogen storage disease II Diseases 0.000 description 1
- 108010062584 glycollate oxidase Proteins 0.000 description 1
- 239000011544 gradient gel Substances 0.000 description 1
- 229940047650 haemophilus influenzae Drugs 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 208000017105 hereditary amyloidosis Diseases 0.000 description 1
- 208000013746 hereditary thrombophilia due to congenital protein C deficiency Diseases 0.000 description 1
- 238000005734 heterodimerization reaction Methods 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 102000051631 human SERPINA1 Human genes 0.000 description 1
- 244000052637 human pathogen Species 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 229940072106 hydroxystearate Drugs 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 229940124452 immunizing agent Drugs 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 229960003444 immunosuppressant agent Drugs 0.000 description 1
- 229940125721 immunosuppressive agent Drugs 0.000 description 1
- 238000002650 immunosuppressive therapy Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 208000005562 infectious bovine rhinotracheitis Diseases 0.000 description 1
- 208000037798 influenza B Diseases 0.000 description 1
- 208000037799 influenza C Diseases 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- NBQNWMBBSKPBAY-UHFFFAOYSA-N iodixanol Chemical compound IC=1C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C(I)C=1N(C(=O)C)CC(O)CN(C(C)=O)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I NBQNWMBBSKPBAY-UHFFFAOYSA-N 0.000 description 1
- 229960004359 iodixanol Drugs 0.000 description 1
- 208000023589 ischemic disease Diseases 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 201000006370 kidney failure Diseases 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 208000036546 leukodystrophy Diseases 0.000 description 1
- 238000002898 library design Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000006194 liquid suspension Substances 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 239000003120 macrolide antibiotic agent Substances 0.000 description 1
- 229940041033 macrolides Drugs 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 210000005171 mammalian brain Anatomy 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 208000024393 maple syrup urine disease Diseases 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- HAWPXGHAZFHHAD-UHFFFAOYSA-N mechlorethamine Chemical class ClCCN(C)CCCl HAWPXGHAZFHHAD-UHFFFAOYSA-N 0.000 description 1
- 229960004961 mechlorethamine Drugs 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 230000034217 membrane fusion Effects 0.000 description 1
- GLVAUDGFNGKCSF-UHFFFAOYSA-N mercaptopurine Chemical compound S=C1NC=NC2=C1NC=N2 GLVAUDGFNGKCSF-UHFFFAOYSA-N 0.000 description 1
- 229960001428 mercaptopurine Drugs 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 229960003248 mifepristone Drugs 0.000 description 1
- CFCUWKMKBJTWLW-BKHRDMLASA-N mithramycin Chemical compound O([C@@H]1C[C@@H](O[C@H](C)[C@H]1O)OC=1C=C2C=C3C[C@H]([C@@H](C(=O)C3=C(O)C2=C(O)C=1C)O[C@@H]1O[C@H](C)[C@@H](O)[C@H](O[C@@H]2O[C@H](C)[C@H](O)[C@H](O[C@@H]3O[C@H](C)[C@@H](O)[C@@](C)(O)C3)C2)C1)[C@H](OC)C(=O)[C@@H](O)[C@@H](C)O)[C@H]1C[C@@H](O)[C@H](O)[C@@H](C)O1 CFCUWKMKBJTWLW-BKHRDMLASA-N 0.000 description 1
- 229960004857 mitomycin Drugs 0.000 description 1
- 210000002161 motor neuron Anatomy 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000002088 nanocapsule Substances 0.000 description 1
- 239000002077 nanosphere Substances 0.000 description 1
- 210000002850 nasal mucosa Anatomy 0.000 description 1
- 210000001989 nasopharynx Anatomy 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 238000002663 nebulization Methods 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 239000002736 nonionic surfactant Substances 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 210000001331 nose Anatomy 0.000 description 1
- 102000006255 nuclear receptors Human genes 0.000 description 1
- 108020004017 nuclear receptors Proteins 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 125000001117 oleyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])/C([H])=C([H])\C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 201000011278 ornithine carbamoyltransferase deficiency Diseases 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 206010034674 peritonitis Diseases 0.000 description 1
- 210000002824 peroxisome Anatomy 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 238000001050 pharmacotherapy Methods 0.000 description 1
- 125000001095 phosphatidyl group Chemical group 0.000 description 1
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 1
- 150000008104 phosphatidylethanolamines Chemical class 0.000 description 1
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 1
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 1
- 229910000073 phosphorus hydride Inorganic materials 0.000 description 1
- 201000009442 piebaldism Diseases 0.000 description 1
- BXRNXXXXHLBUKK-UHFFFAOYSA-N piperazine-2,5-dione Chemical compound O=C1CNC(=O)CN1 BXRNXXXXHLBUKK-UHFFFAOYSA-N 0.000 description 1
- 150000003058 platinum compounds Chemical class 0.000 description 1
- 229960003171 plicamycin Drugs 0.000 description 1
- 229960000502 poloxamer Drugs 0.000 description 1
- 229920000771 poly (alkylcyanoacrylate) Polymers 0.000 description 1
- 229920000747 poly(lactic acid) Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920000058 polyacrylate Polymers 0.000 description 1
- 229920001610 polycaprolactone Polymers 0.000 description 1
- 239000004632 polycaprolactone Substances 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 235000013594 poultry meat Nutrition 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000000583 progesterone congener Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 210000004129 prosencephalon Anatomy 0.000 description 1
- 239000003223 protective agent Substances 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 208000009305 pseudorabies Diseases 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 101150066583 rep gene Proteins 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 208000020029 respiratory tract infectious disease Diseases 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000012679 serum free medium Substances 0.000 description 1
- 208000002491 severe combined immunodeficiency Diseases 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 150000003408 sphingolipids Chemical class 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000007447 staining method Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 201000010740 swine influenza Diseases 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 229960001967 tacrolimus Drugs 0.000 description 1
- BWMISRWJRUSYEX-SZKNIZGXSA-N terbinafine hydrochloride Chemical compound Cl.C1=CC=C2C(CN(C\C=C\C#CC(C)(C)C)C)=CC=CC2=C1 BWMISRWJRUSYEX-SZKNIZGXSA-N 0.000 description 1
- 229940126622 therapeutic monoclonal antibody Drugs 0.000 description 1
- 238000011285 therapeutic regimen Methods 0.000 description 1
- 239000005495 thyroid hormone Substances 0.000 description 1
- 229940036555 thyroid hormone Drugs 0.000 description 1
- 230000036964 tight binding Effects 0.000 description 1
- 201000004647 tinea pedis Diseases 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 229920000428 triblock copolymer Polymers 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 201000011296 tyrosinemia Diseases 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 208000030954 urea cycle disease Diseases 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 210000005167 vascular cell Anatomy 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0008—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
- A61K48/0025—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid
- A61K48/0041—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid the non-active part being polymeric
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/1703—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- A61K38/1709—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/215—Coronaviridae, e.g. avian infectious bronchitis virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/395—Antibodies; Immunoglobulins; Immune serum, e.g. antilymphocytic serum
- A61K39/42—Antibodies; Immunoglobulins; Immune serum, e.g. antilymphocytic serum viral
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0066—Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5256—Virus expressing foreign proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/33—Fusion polypeptide fusions for targeting to specific cell types, e.g. tissue specific targeting, targeting of a bacterial subspecies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14145—Special targeting system for viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14171—Demonstrated in vivo effect
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2810/00—Vectors comprising a targeting moiety
- C12N2810/40—Vectors comprising a peptide as targeting moiety, e.g. a synthetic peptide, from undefined source
Abstract
N- x- (T/I/V/A)- (K/R)의 아미노산 서열 (서열번호 47)을 포함하는 적어도 하나의 외인성 펩티드를 갖는 재조합 벡터의 표적 단백질에 결합되거나 삽입된 표적화 펩티드를 포함하는 조성물이 제공된다. 돌연변이 캡시드 또는 막 단백질을 갖는 이러한 접합체, 표적화 펩티드 또는 재조합 벡터를 제공하는 조성물이 이의 용도로 제공된다.
Description
아데노-연관 바이러스(AAV)는 현재 선택된 유전자 치료 벡터이다. 이는 AAV가 통합되지 않은 게놈에서 수십 년 동안 안정적으로 발현되는 이식유전자를 전달할 수 있고 AAV가 매우 안전하고 비면역원성이기 때문이다. 그러나 AAV 유전자 요법은 현재 전달 및 향성 문제로 인해 소수의 질병으로 제한된다. 이는 특히 중추신경계(CNS) 장애에 해당된다. AAV 유전자 치료 벡터의 직접 전달은 벡터를 뇌척수액(CSF)에 직접 주입하여 가능하지만, 이 방법은 전형적으로 뇌 세포의 1% 이하를 형질도입한다. 더욱이, 그 형질도입의 대부분은 CSF와 직접 접촉하는 세포에 집중되어 있다. "심부 뇌"의 세포는 거의 형질도입되지 않는다. 이것은 유전자 요법으로 치료할 수 있는 CNS 장애의 수를 제한했다.
CSF 네트워크와 달리 뇌의 혈관계는 CNS의 거의 모든 세포에 도달한다. 이것은 이러한 조직이 포도당, 산소 및 기타 영양소에 대한 수요가 높기 때문이다. 그러나 뇌와 척수의 세포는 특수 혈관 단위인 혈관 뇌 장벽(BBB)에 의해 순환계로부터 보호된다. BBB는 뇌와 척수의 혈관을 둘러싸고 있는 단단히 연결된 세포의 복잡한 네트워크를 통해 바이러스 벡터 및 단백질과 같은 큰 분자, 심지어 많은 작은 분자 약물의 확산을 제한한다. 따라서, CNS에 대한 유전자 치료 전달의 큰 과제는 높은 효율로 BBB를 통과할 수 있는 AAV 변이체의 조작과 심부 뇌의 세포를 형질도입하는 것이었다.
캘리포니아 공과대학(CalTech)에서 개발한 한 AAV 캡시드에는 일부 마우스 계통의 뇌 맥관 구조에 있는 GPI 고정 수용체인 Ly6a와의 상호작용을 매개하는 것으로 보고된 AAV9-PHP.B라는 rAAV를 생성하기 위해 AAV9 캡시드의 초가변 루프 8(HVR8)에 삽입된 7개의 아미노산 펩티드가 있다. 미국 특허 공개 출원 번호 2017/0166926A1. 이 상호 작용은 BBB를 통해 AAV9-PHP.B의 수송을 유도하여 AAV9 보다 ~50배 더 높은 뇌 세포의 전달을 초래한다. 그러나 이 발견은 더 큰 동물이나 인간에게 적용되지 않았다.
선별된 조직 및 세포 유형을 특이적으로 표적화할 수 있는 벡터에 대한 필요성이 여전히 존재한다.
특정 구체예에서, 모티프 N- x- (T/I/V/A)- (K/R) (서열번호 47)을 포함하는 아미노산 서열을 포함하는 캡시드를 갖는 재조합 아데노-연관 바이러스 입자(rAAV)가 제공된다. 적합하게는, 아미노산 서열은 캡시드 내의 적어도 AAV vp3 단백질의 일부 및 캡시드가 NDVRAVS(서열번호 48) 서열을 포함하는 돌연변이 AAV2 캡시드가 아닌 경우, 이의 발현을 지시하는 서열의 제어 하에 유전자 생성물을 인코딩하는 핵산 서열을 포함하는 캡시드 내에 패키징된 벡터 게놈의 일부이다. 특정 구체예에서, 아미노산 서열은 N- x- (T/I/V/A)- (K/R) 모티프는 2개의 아미노산 내지 7개의 아미노산에 의해 모티프의 아미노 말단 및/또는 카르복시 말단에서 선택적으로 측접되어 AAV 캡시드 vp3 영역에 삽입되는 것을 포함하는 것을 포함한다. 특정 구체예에서, 캡시드에 삽입된 서열은 다음을 포함한다: (a) SSNTVKLTSGH (서열번호 40); (b) EFSSNTVKLTS (서열번호 38); (c) GGVLTNIARGEYMRGG (서열번호 46); (d) GGIEINATRAGTNLGG (서열번호 43); (e) GGSSNTVKLTSGHGG (서열번호 39); (f) IEINATRAGTNL(서열번호 42); 또는 (g) SANFIKPTSY (서열번호 41). 특정 구체예에서, 모티프의 아미노산 서열은 NTVK이고, 선택적으로 카르복시- 및/또는 아미노 말단에 2개 내지 7개의 아미노산이 측접되어 있고 아미노산 서열: 서열번호 44의 넘버링에 기초하여 AAV9 캡시드 단백질의 아미노산 588 및 589 사이에 삽입된다.
특정 구체예에서, 캡시드에 NTVK 서열이 삽입된 rAAV로서, 서열은 선택적으로 카르복시- 및/또는 아미노 말단에 2개 내지 7개의 아미노산이 측접되어 있고 아미노산 서열: 서열번호 44의 넘버링에 기초하여 AAV9 캡시드 단백질의 아미노산 588 및 589 사이에 삽입된다.
특정 구체예에서, 조성물은 삽입된 모티프 및 선택적 측접 서열을 갖는 rAAV 및 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스 중 하나 이상을 포함한다.
특정 구체예에서, 내피 세포 표적화 펩티드가 제공되고, 펩티드는 N- x- (T/I/V/A)- (K/R) (서열번호 47)의 아미노산 서열을 포함하고 선택적으로 모티프의 아미노 말단 및/또는 카르복시 말단에 2개의 아미노산 내지 7개의 아미노산이 측접되어 있고, 선택적으로 나노입자, 제2 분자, 또는 바이러스 캡시드 단백질에 추가로 접합된다. 특정 구체예에서, 내피 세포 표적화 펩티드는 다음을 포함한다: (a) SSNTVKLTSGH (서열번호 40); (b) EFSSNTVKLTS (서열번호 38); (c) GGVLTNIARGEYMRGG (서열번호 46); (d) GGIEINATRAGTNLGG (서열번호 43); (e) GGSSNTVKLTSGHGG (서열번호 39); (f) IEINATRAGTNL(서열번호 42); 또는 (g) SANFIKPTSY(서열번호 41). 특정 구체예에서, 모티프의 아미노산 서열은 NTVK이다. 특정 구체예에서, 내피 세포 표적화 펩티드 및 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스 중 하나 이상을 포함하는 조성물이 제공된다.
특정 구체예에서, 뇌 내피 세포 표적화 펩티드 및 적어도 하나의 폴리펩티드 또는 단백질을 포함하는 융합 파트너를 포함하는 융합 폴리펩티드 또는 단백질이 본원에서 제공된다. 특정 구체예에서, 제11항에 따른 융합 폴리펩티드 또는 단백질 및 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스 중 하나 이상을 포함하는 조성물.
치료를 필요로 하는 환자에게 치료제를 전달하기 위한 rAAV, 내피 세포 표적화 펩티드, 융합 폴리펩티드 또는 단백질, 및/또는 본원에 기술된 조성물을 사용하기 위한 조성물 및 방법이 본원에 제공된다. 특정 구체예에서, 치료제는 뇌 내피 세포를 표적으로 한다.
특정 구체예에서, 상기 인코딩된 유전자 산물은 MCT8 단백질인, 본원에 기술된 바와 같은 rAAV를 이를 필요로 하는 대상체에게 전달함으로써 알란-헌돈-더들리병을 치료하기 위한 조성물 및 방법이 제공된다.
특정 구체예에서, 본원에 기술된 rAAV를 이를 필요로 하는 환자에게 투여하는 단계를 포함하는 폐에 대한 표적 요법을 위한 방법이 제공된다.
특정 구체예에서, 표적화 펩티드가 삽입된 캡시드를 갖고 치료 유전자 산물을 인코딩하는 rAAV를 이를 필요로 하는 대상체에게 전달함으로써 폐 질환을 치료하는 방법이 제공되고, 상기 인코딩된 유전자 산물은 가용성 Ace2 단백질, 항-SARS 항체, 항-SARS-CoV2 항체, 항-인플루엔자 항체 또는 낭포성 섬유증 막횡단 단백질이다.
특정 구체예에서, N- x- (T/I/V/A)- (K/R) 모티프를 AAV 캡시드에 삽입하는 단계를 포함하는 시험관 내에서 AAV 생산 세포의 형질도입을 증가시키는 방법이 제공된다. 특정 구체예에서, 생산 세포는 293 세포이다.
본 발명의 이들 및 다른 구체예 및 이점은 본 발명의 상세한 설명을 포함하지만 이에 제한되지 않는 명세서로부터 명백할 것이다.
도 1a 내지 1b는 참조 펩티드와 함께 스크린에서 마우스 뇌에서 최고 수행 펩티드 히트에 대한 농축 점수를 보여준다. 도 1a는 C57BL/6J 마우스에 대한 농축 점수를 보여준다. 도 1b는 Balb/c 마우스에 대한 농축 점수를 보여준다.
도 2a 및 2b는 스크린에서 NHP 조직에서 최고 수행 히트에 대한 농축 점수를 보여준다. 도 2a는 NHP 뇌에 대한 농축 점수를 보여준다. 도 2b는 NHP 척수 조직에 대한 농축 점수를 보여준다.
도 3a 내지 3d는 GFP 리포터 이식유전자를 포함하는 AAV 캡시드에서 최고 수행 펩티드 적중의 형질도입 수준의 2차 검증을 보여준다. 결과는 AAV9 형질도입과 관련하여 플롯된다. 도 3a는 Balb/c 마우스에서 뇌 조직의 선택된 펩티드 표적의 2차 검증 스크린을 보여준다. 도 3b는 C57BL/6 마우스에서 뇌 조직의 선택된 펩티드 표적의 2차 검증 스크린을 보여준다. 도 3c는 Balb/c 마우스에서 간 조직의 선택된 펩티드 표적의 2차 검증 스크린을 보여준다. 도 3d는 C57BL/6 마우스에서 간 조직의 선택된 펩티드 표적의 2차 검증 스크린을 보여준다.
도 4는 AA9, AAV8, AAV7, AAV6, AAV5, AAV4, AAV3B. AAV2, 및 AAV1의 다양한 AAV 캡시드 단백질의 아미노산 서열 정렬 영역을 나타낸 것으로, 표적화 펩티드가 삽입될 수 있는 HVRVIII 영역에 초점이 맞춰져 있다(구조 분석 기준).
도 5는 "NxTK" 모티프가 SAN 삽입체에서 뇌 생체분포를 위한 결정적인 모티프임을 나타내고, 치환의 평균 영향(원래 서열로부터 배수-변화)을 나타낸다.
도 6은 "NxTK" 모티프가 SAN 펩티드 삽입체에서 플라스미드에서 AAV로의 전환을 제어하고 치환의 평균 영향(원래 배수 변화)을 보여준다는 것을 보여준다.
도 7a 내지 7d는 "NxTK" 모티프가 세포주에 걸쳐 광범위한 형질도입 이점을 부여함을 보여준다. 도 7a는 293 세포에서 AAV9 캡시드와 비교할 때 상대적 형질도입 수준을 보여준다. 도 7b는 NIH3T3 세포에서 AAV9 캡시드와 비교할 때 상대적 형질도입 수준을 보여준다. 도 7c는 HUH7 세포에서 AAV9 캡시드와 비교할 때 상대적 형질도입 수준을 보여준다. 도 7d는 마카크 1차 기도 세포에서 형질도입 후 3일(3DPT) 및 형질도입 후 7일(7DPT)에서의 형질도입 수준을 보여준다. 도 7e는 담체(즉, 벡터 없음)로 처리된 대조군 샘플에서 마카크 원발성 기도 상피 세포의 현미경 분석을 보여준다. 도 7f는 AAV9-GFP 벡터로 형질도입 후 마카크 원발성 기도 상피 세포의 현미경 분석을 나타낸다. 도 7g는 EFS 펩티드 삽입물을 포함하는 AAV9-GFP 벡터로 형질도입 후 마카크 1차 기도 상피 세포의 현미경 분석을 나타낸다. 도 7h는 SAN 펩티드 삽입물을 포함하는 AAV9-GFP로 형질도입 후 마카크 1차 기도 상피 세포의 현미경 분석을 보여준다.
도 8은 마이크로그램 총 mRNA에 대한 mRNA 카피 수의 비율로서 플로팅된 배양된 인간 세포(비강, 기관지 및 기관)에서 GFP 벡터를 사용한 예비 형질도입 시험을 보여준다.
도 2a 및 2b는 스크린에서 NHP 조직에서 최고 수행 히트에 대한 농축 점수를 보여준다. 도 2a는 NHP 뇌에 대한 농축 점수를 보여준다. 도 2b는 NHP 척수 조직에 대한 농축 점수를 보여준다.
도 3a 내지 3d는 GFP 리포터 이식유전자를 포함하는 AAV 캡시드에서 최고 수행 펩티드 적중의 형질도입 수준의 2차 검증을 보여준다. 결과는 AAV9 형질도입과 관련하여 플롯된다. 도 3a는 Balb/c 마우스에서 뇌 조직의 선택된 펩티드 표적의 2차 검증 스크린을 보여준다. 도 3b는 C57BL/6 마우스에서 뇌 조직의 선택된 펩티드 표적의 2차 검증 스크린을 보여준다. 도 3c는 Balb/c 마우스에서 간 조직의 선택된 펩티드 표적의 2차 검증 스크린을 보여준다. 도 3d는 C57BL/6 마우스에서 간 조직의 선택된 펩티드 표적의 2차 검증 스크린을 보여준다.
도 4는 AA9, AAV8, AAV7, AAV6, AAV5, AAV4, AAV3B. AAV2, 및 AAV1의 다양한 AAV 캡시드 단백질의 아미노산 서열 정렬 영역을 나타낸 것으로, 표적화 펩티드가 삽입될 수 있는 HVRVIII 영역에 초점이 맞춰져 있다(구조 분석 기준).
도 5는 "NxTK" 모티프가 SAN 삽입체에서 뇌 생체분포를 위한 결정적인 모티프임을 나타내고, 치환의 평균 영향(원래 서열로부터 배수-변화)을 나타낸다.
도 6은 "NxTK" 모티프가 SAN 펩티드 삽입체에서 플라스미드에서 AAV로의 전환을 제어하고 치환의 평균 영향(원래 배수 변화)을 보여준다는 것을 보여준다.
도 7a 내지 7d는 "NxTK" 모티프가 세포주에 걸쳐 광범위한 형질도입 이점을 부여함을 보여준다. 도 7a는 293 세포에서 AAV9 캡시드와 비교할 때 상대적 형질도입 수준을 보여준다. 도 7b는 NIH3T3 세포에서 AAV9 캡시드와 비교할 때 상대적 형질도입 수준을 보여준다. 도 7c는 HUH7 세포에서 AAV9 캡시드와 비교할 때 상대적 형질도입 수준을 보여준다. 도 7d는 마카크 1차 기도 세포에서 형질도입 후 3일(3DPT) 및 형질도입 후 7일(7DPT)에서의 형질도입 수준을 보여준다. 도 7e는 담체(즉, 벡터 없음)로 처리된 대조군 샘플에서 마카크 원발성 기도 상피 세포의 현미경 분석을 보여준다. 도 7f는 AAV9-GFP 벡터로 형질도입 후 마카크 원발성 기도 상피 세포의 현미경 분석을 나타낸다. 도 7g는 EFS 펩티드 삽입물을 포함하는 AAV9-GFP 벡터로 형질도입 후 마카크 1차 기도 상피 세포의 현미경 분석을 나타낸다. 도 7h는 SAN 펩티드 삽입물을 포함하는 AAV9-GFP로 형질도입 후 마카크 1차 기도 상피 세포의 현미경 분석을 보여준다.
도 8은 마이크로그램 총 mRNA에 대한 mRNA 카피 수의 비율로서 플로팅된 배양된 인간 세포(비강, 기관지 및 기관)에서 GFP 벡터를 사용한 예비 형질도입 시험을 보여준다.
표적화 펩티드 서열이 본원에서 제공된다. N- x- (T/I/V/A)- (K/R)(서열번호 47)의 외인성 표적화 펩티드 모티프에 작동 가능하게 연결된 융합 단백질, 변형된 단백질, 돌연변이 바이러스 캡시드 및 기타 모이어티도 본원에서 제공된다. 특정 구체예에서, 이 외인성 모티프는 소스(모) 단백질, 바이러스 벡터 또는 다른 모이어티의 천연 조직 특이성을 변형시키는 이들 조성물에 부여한다. 특정 구체예에서, 이 모티프의 표적화 펩티드는 강화되거나 변경된 내피 세포 표적화를 제공한다. 특정 구체예에서, 이 모티프의 표적화 펩티드는 향상되거나 변경된 폐, 기관지, 기관 및/또는 비상피 표적화를 제공한다. 특정 구체예에서, 이 모티프를 갖는 변형된 캡시드를 갖는 바이러스 벡터는 시험관내에서 AAV 생산 세포의 증가된 형질도입을 나타낸다.
표적화 펩티드는 융합 단백질 또는 접합체를 형성하기 위해 원하는 조직(예를 들어, CNS 또는 폐)을 표적화하기 위해 재조합 단백질(예를 들어, 효소 대체 요법용) 또는 폴리펩티드(예를 들어, 면역글로불린)에 연결될 수 있다. 추가적으로, 표적화 펩티드는 원하는 조직을 표적화하기 위해 펩티드-코팅된 리포좀 및/또는 LNP를 형성하는 리포좀 및/또는 나노입자(지질 나노입자, LNP)에 연결될 수 있다. 적어도 하나의 표적화 펩티드 카피를 인코딩하는 서열 및 선택적 연결 서열은 재조합 단백질에 대한 인코딩 서열과 프레임 내에서 융합될 수 있고 융합 단백질 또는 접합체를 제공하기 위해 단백질 또는 폴리펩티드와 공동-발현될 수 있다. 또는 다른 합성 방법을 사용하여 단백질, 폴리펩티드 또는 다른 부분(예를 들어 DNA, RNA 또는 소분자)과 접합체를 형성할 수 있다. 특정 구체예에서, 표적화 펩티드의 다중 카피가 융합 단백질/접합체에 존재한다. 표적화 펩티드를 재조합 단백질에 접합시키기에 적합한 방법은 제1 가교제를 사용하여 재조합 인간 단백질(예를 들어, 효소) 상의 아미노 (N)-말단 및 하나 이상의 잔기를 변형시켜 제1 가교제 변형된 재조합 인간 단백질을 발생시키는 단계, 제2 가교제를 사용하여 표적화 펩티드 앞의 짧은 연장 링커 영역의 아미노 (N)-말단을 변형시켜 제2 가교제 변형된 변이체 표적 펩티드를 발생시키는 단계, 및 이어서 짧은 연장 링커를 함유하는 제2 가교제 변형된 변이체 표적화 펩티드에 제1 가교제 변형된 재조합 인간 단백질을 접합시키는 단계를 포함한다. 표적화 펩티드를 재조합 단백질에 접합시키는 다른 적합한 방법은 제1 가교제 변형된 재조합 인간 단백질을 하나 이상의 제2 가교제 변형된 변이체 표적화 펩티드에 접합시키는 단계, 상기 제1 가교제 변형된 재조합 단백질은 화학적으로 변형된 N-말단을 갖는 것을 특징으로 하는 재조합 단백질을 포함하고, 하나 이상의 변형된 라이신 잔기 및 하나 이상의 제2 가교제 변형된 변이체 표적화 펩티드는 표적화 펩티드 앞의 짧은 연장 링커의 변형된 N-말단 아미노산을 포함하는 하나 이상의 변이체 표적화 펩티드를 포함한다. 표적화 펩티드를 단백질, 폴리펩티드, 나노입자 또는 다른 생물학적으로 유용한 화학적 모이어티에 접합시키기 위한 또 다른 적합한 방법이 선택될 수 있다. 예를 들어, 미국 특허 번호 US 9,545,450 B2(NHS-포스핀 가교제; NHS-아지드 가교제); 미국 공개 특허 출원 번호 US 2018/0185503 A1(알데히드-히드라지드 가교결합)을 참조한다.
특정 구체예에서, 표적화 펩티드는 단백질 또는 폴리펩티드(예를 들어, 바이러스 캡시드 단백질) 내의 적합한 부위에 삽입될 수 있다. 특정 이들 구체예 및 특정 다른 구체예에서, 표적화 펩티드는 짧은 연장 링커에 의해 그의 카르복시(COO-) 및/또는 아미노(N) 말단에서 측접할 수 있다. 이러한 링커는 길이가 1 내지 20개 아미노산 잔기, 또는 약 2 내지 20개 아미노산 잔기, 또는 약 1 내지 15개 아미노산 잔기, 또는 약 2 내지 12개 아미노산 잔기, 또는 2 내지 7개 아미노산 잔기 길이일 수 있다. 짧은 연장 링커는 길이가 약 10개 아미노산일 수도 있다. N-말단 링커의 존재 및 길이는 카르복시-말단 링커로부터 독립적으로 선택되고, 카르복시 말단 링커의 존재 및 길이는 N-말단 링커로부터 독립적으로 선택된다. 적합한 짧은 연장 링커는 5-아미노산 유연한 GS 연장 링커(글리신-글리신-글리신-글리신-세린), 2개의 유연한 GS 링커를 포함하는 10-아미노산 확장 링커, 3개의 유연한 GS 링커를 포함하는 15-아미노산 확장 링커, 4개의 유연한 GS 링커를 포함하는 20-아미노산 확장 링커, 또는 이들의 임의의 조합을 사용하여 제공될 수 있다.
특정 구체예에서, 내피 세포를 표적화하는데 유용한 조성물이 제공된다. 조성물은 다음을 포함하는 적어도 하나의 외인성 표적화 펩티드를 포함하는 돌연변이 캡시드, 융합 단백질 또는 또 다른 접합체이다: N- x- (T/I/V/A)- (K/R) (서열번호 47)의 아미노산 서열 선택적으로 모티프의 아미노 말단 및/또는 카르복시 말단에 2개의 아미노산 내지 7개의 아미노산이 측접되어 있고, 선택적으로 나노입자, 제2 분자, 또는 바이러스 캡시드 단백질에 추가로 접합된다. 표적화 펩티드는 선택적인 연결서열과 함께 다음 서열을 포함한다:
(a) SSNTVKLTSGH (서열번호 40);
(b) EFSSNTVKLTS (서열번호 38);
(c) GGVLTNIARGEYMRGG (서열번호 46);
(d) GGIEINATRAGTNLGG (서열번호 43);
(e) GGSSNTVKLTSGHGG (서열번호 39);
(f) IEINATRAGTNL(서열번호 42); 또는
(g) SANFIKPTSY(서열번호 41).
특정 구체예에서, 표적화 펩티드 모티프는 다음으로부터 선택된 핵산 서열에 의해 인코딩된다:
(a) agcagcaacaccgtgaagctgaccagcggacac (서열번호 54);
(b) gagttcagcagcaacaccgtgaagctgaccagc (서열번호 50);
(c) ggaggagtgctgaccaacatcgctagaggagagtacatgagaggagga (서열번호 56);
(d) ggaggaatcgagatcaacgctaccagagctggaaccaacctgggagga (서열번호 52);
(e) ggaggaagcagcaacaccgtgaagctgaccagcggacacggagga (서열번호 55);
(f) atcgagatcaacgctaccagagctggaaccaacctg (서열번호 51); 또는
(g) agcgctaacttcatcaagcctaccagctac (서열번호 53).
특정 구체예에서, 표적화 펩티드는 서열번호 50의 핵산 서열 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 51의 핵산 서열, 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 52의 핵산 서열, 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 53의 핵산 서열, 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 54의 핵산 서열, 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 55의 핵산 서열, 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 56의 핵산 서열, 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 일부 구체예에서, 표적화 펩티드 모티프를 인코딩하는 핵산 서열은 연장 링커의 6개 내지 21개 뉴클레오티드에 의해 모티프의 핵산 서열의 5' 및/또는 3' 말단에서 선택적으로 측접되어 있다.
특정 구체예에서, 표적화 펩티드 NTVK. 특정 구체예에서, 표적화 펩티드 NTVR. 특정 구체예에서, 이 모티프 내의 표적화 펩티드의 하나 이상의 카피가 접합체 또는 변형된 단백질(예를 들어, 파보바이러스 캡시드)로 제공된다. 특정 구체예에서, 2개 이상의 상이한 표적화 펩티드가 존재한다
특정 구체예에서, 비-상피 및/또는 폐 상피 세포를 표적화하는데 유용한 조성물이 제공된다. 조성물은 N-x- 선택적으로 아미노 말단 및/또는 모티프의 카르복시 말단에 2개의 아미노산 내지 7개의 아미노산이 측접되어 있고, 선택적으로 추가로 나노입자, 제2 분자 또는 바이러스 캡시드 단백질에 측접되어 있는 (T/I/V/A)-(K/R)의 아미노산 서열(서열번호 47)을 포함하는 적어도 하나의 외인성 표적화 펩티드를 포함하는 돌연변이 캡시드, 융합 단백질 또는 또 다른 접합체이다. 표적화 펩티드는 (a) SSNTVKLTSGH(서열번호 40); (b) EFSSNTVKLTS(서열번호 38); (c) GGVLTNIARGEYMRGG(서열번호 46); (d) GGIEINATRAGTNLGG(서열번호 43); (e) GGSSNTVKLTSGHGG(서열번호 39); (f) IEINATRAGTNL(서열번호 42); 또는 (g) SANFIKPTSY(서열번호 41)를 포함한다.
특정 구체예에서, 표적화 펩티드 NTVK. 특정 구체예에서, 표적 펩티드 NTVR은 선택적으로 본원에 기재된 바와 같은 스페이서 아미노산에 측접되어 있다. 특정 구체예에서, 이 모티프 내의 표적화 펩티드의 하나 이상의 카피가 접합체 또는 변형된 단백질(예를 들어, 파보바이러스 캡시드)로 제공된다. 특정 구체예에서, 2개 이상의 상이한 표적화 펩티드가 존재한다.
효소, 면역글로불린, 치료 단백질, 면역원성 폴리펩티드, 나노입자, DNA, RNA, 및 표적화를 위한 기타 모이어티(예를 들어, 소분자 등)를 포함하는 적합한 단백질의 예는 하기에 보다 상세히 기술된다. 이들 및 다른 생물학적 및 화학적 모이어티는 본원에 제공된 표적화 펩티드와 함께 사용하기에 적합하다.
특정 구체예에서, 조성물은 핵산 서열 분자이고, 상기 핵산 서열은 DNA 분자 또는 RNA 분자, 예를 들어 네이키드 DNA, 네이키드 플라스미드 DNA, 메신저 RNA(mRNA)이며, 핵산 분자에 연결된 표적화 펩티드 서열 모티프를 함유한다. 일부 구체예에서, 핵산 분자는 예를 들어 미셀, 리포솜, 양이온성 지질-핵산 조성물, 폴리-글리칸 조성물 및 기타 중합체, 지질 및/또는 콜레스테롤-기반 핵산 접합체, 및 본원에 기술된 것과 같은 다른 작제물을 포함하는 다양한 조성물 및 나노 입자와 추가로 커플링된다. 예를 들어, WO2014/089486, US 2018/0353616A1, US2013/0037977A1, WO2015/074085A1, US9670152B2, 및 US 8,853,377B2, X. Su 등, Mol. Pharmaceutics, 2011, 8 (3), pp 774-787; 웹 간행물: 2011년 3월 21일; WO2013/182683, WO 2010/053572 및 WO 2012/170930을 참조하며, 이들 모두는 본 명세서에 참조로 포함된다. 특정 구체예에서, 표적화 펩티드 모티프는 나노입자 표면에 화학적으로 연결되며, 상기 나노입자는 핵산 분자를 캡슐화한다. 일부 구체예에서 표면에 연결된 표적화 펩티드를 포함하는 나노입자는 표적화된 조직 특이적 전달을 위해 설계된다. 일부 구체예에서 2개 이상의 상이한 표적화 펩티드가 나노입자의 표면에 연결된다. 적합한 화학적 연결 또는 가교는 당업자에게 공지된 것을 포함한다.
캡시드
특정 구체예에서, N- x- (T/I/V/A)- (K/R) 표적화 모티프로부터 적어도 외인성 펩티드를 갖는 변형된 파보바이러스 캡시드를 갖는 재조합 파보바이러스가 제공된다. 이러한 재조합 파보바이러스는 하이브리드 보카바이러스/AAV 또는 재조합 AAV 벡터일 수 있다. 다른 구체예에서, 모 벡터와 비교하여 바이러스 벡터의 표적 특이성을 조절 및/또는 변경하기 위해 노출된 캡시드 단백질에서 N- x- (T/I/V/A)- (K/R) 모티프(동일하거나 상이하거나 이들의 조합일 수 있음)로부터의 하나 이상의 외인성 표적화 펩티드를 갖는 다른 바이러스 벡터가 생성될 수 있다.
표적화 펩티드는 임의의 적합한 위치에서 초가변 루프(HVR) VIII에 삽입될 수 있다. 예를 들어, AAV9 캡시드의 넘버링에 기초하여 펩티드는 AAV9 VP1 아미노산 서열의 넘버링에 기초하여 AAV9 캡시드 단백질의 아미노산 588과 589(Q-A) 사이에 다양한 길이의 링커와 함께 삽입된다: 서열번호 44. 또한, AAV9에 대한 탈아미드화 패턴을 제공하는 표 G를 포함하여 2019년 9월 6일에 공개된 WO 2019/168961 및 2018년 9월 7일에 출원된 WO 2020/160582를 참조한다. 아미노산 잔기 위치는 AAVhu68(SEQ ID NO: 45)에서 동일하다. 그러나 HVRVIII 내에서 다른 위치를 선택할 수 있다. 대안적으로, 다른 노출된 루프 HVR(예를 들어, HVRIV)이 삽입을 위해 선택될 수 있다. 비교 가능한 HVR 영역은 다른 캡시드에서 선택될 수 있다. 특정 구체예에서, HVRVIII 및 HVRIV에 대한 위치는 본원에 그 전체 내용이 참조로 포함된 미국 특허 번호 US 9,737,618 B2(컬럼 15, 행 3-23), 및 미국 특허 번호 US 10,308,958 B2(컬럼 15, 행 46 - 컬럼 16, 행 6)에 기술된 바와 같은 알고리즘 및/또는 정렬 기술을 사용하여 결정된다. 특정 구체예에서, AAV1 캡시드 단백질은 모 캡시드로서 선택되며, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 vp1 넘버링에 기초한 아미노산 582 내지 585의 HVRVIII 영역, 또는 아미노산 456 내지 459의 HVRIV 영역의 적합한 위치에 삽입된다(Gurda, BL., 등, Capsid Antibodies to Different Adeno-Associated Virus Serotypes Bind Common Regions, 2012, Journal of Virology, 2013년 6월 12일, 87(16): 9111-91114). 특정 구체예에서, AAV8은 모 캡시드로서 선택되며, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 VP1 넘버링에 기초한 아미노산 586 내지 591(예를 들어, 590-591(N-T))의 HVRVIII 영역, 또는 아미노산 456 내지 460의 HVRIV 영역의 적합한 위치에 삽입된다(Gurda, BL., 등, Mapping a Neutralizing epitope onto the Capsid of Adeno-Associated Virus Serotype 8, 2012, Journal of Virology, 2012년 5월 16일, 86(15):7739-7751). 특정 구체예에서, AAV7은 모 캡시드로서 선택되고, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 아미노산 589 내지 590(N-T)의 적합한 위치에 삽입된다. 특정 구체예에서, AAV6은 모 캡시드로서 선택되며, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 아미노산 588 내지 589(S-T)의 적합한 위치에 삽입된다. 특정 구체예에서, AAV5는 모 캡시드로서 선택되며, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 아미노산 577 내지 578(T-T)의 적합한 위치에 삽입된다. 특정 구체예에서, AAV4는 모 캡시드로서 선택되며, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 아미노산 586 내지 587(S-N)의 적합한 위치에 삽입된다. 특정 구체예에서, AAV3B는 모 캡시드로서 선택되고, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 아미노산 588 내지 589(N-T)의 적합한 위치에 삽입된다. 특정 구체예에서, AAV2는 모 캡시드로서 선택되며, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 아미노산 587 내지 588(N-R)의 적합한 위치에 삽입된다. 특정 구체예에서, AAV1은 모 캡시드로서 선택되며, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 아미노산 589 내지 589(S-T)의 적합한 위치에 삽입된다. 또한, 도 4를 참조한다.
특정 구체예에서, 선택적 측접 서열과 함께 N- x- (T/I/V/A)- (K/R) 모티프를 함유하도록 변형된 모 캡시드는 발현을 향상 및/또는 그렇지 않으면 CNS 표적 세포의 유형을 조절하기 위해 CNS (예를 들어, 클레이드 F AAV(예를 들어, AAVhu68 또는 AAV9), 클레이드 E(예를 들어, AAV8) 또는 특정 클레이드 A AAV(예를 들어, AAV1, AAVrh91)) 캡시드 또는 비-파보바이러스 캡시드(예를 들어, 단순 헤르페스 바이러스 등)를 천연적으로 표적화하는 파보바이러스로부터 선택된다. 다른 실시형태에서, 캡시드는 CNS(예를 들어, 클레이드 F AAV, 예를 들어, AAVhu68 또는 AAV9, 또는 특정 클레이드 A AAV, 예를 들어, AAV1, AAVrh91) 캡시드, 또는 비파보바이러스 캡시드(예를 들어, 단순 포진 바이러스(HSV) 등)를 천연적으로 표적화하지 않는 파보바이러스로부터 선택된다. 예를 들어, WO 2020/223231, 2020년 11월 5일 공개(rh91, 탈아미드화 패턴이 있는 표 포함), 2020년 8월 14일에 제출된 미국 가출원 번호 63/065,616 및 2020년 11월 4일에 제출된 미국 가출원 번호 63/109734를 참조한다. 특정 구체예에서, 캡시드는 AAV 클레이드 F AAVhu95 및 AAVhu96 캡시드로부터 선택된다. 예를 들어, 2201년 10월 2일에 출원된 미국 가출원 번호 63/251,599를 참조한다.
특정 구체예에서, N- x- (T/I/V/A)- (K/R) 모티프를 함유하도록 변형된 모 캡시드는 모 AAV(예를 들어, 클레이드 A AAV, 예를 들어, AAV1, AAVrh32.33, AAV6.2, AAV6, AAVrh91), 또는 AAV5, 또는 특정 클레이드 F AAV, 예를 들어, AAVhu68 또는 AAV9, 캡시드 또는 비파보바이러스 캡시드(예를 들어 아데노바이러스, HSV, RSV) 등과 비교하여 표적화를 향상시키기 위해 비강 상피 세포, 비인두 세포 및/또는 폐 세포를 기본적으로 표적으로 하는 바이러스(예를 들어, AAV)로부터 선택된다. 예를 들어, WO 2020/223231, 2020년 11월 5일 공개(rh91, 탈아미드화 패턴이 있는 표 포함), 2020년 8월 14일에 출원된 미국 임시 특허 출원 번호 63/065,616 및 2020년 11월 4일에 출원된 미국 가출원 번호 63/109734를 참조한다.
특정 구체예에서, AAV 캡시드는 NDVRAVS(서열번호 48) 서열을 포함하는 돌연변이 AAV2 캡시드가 아니다.
예를 들어, AAVhu68 또는 AAV9와 같은 Clade F AAV의 캡시드가 선택될 수 있다. AAV9 캡시드 또는 AAVhu68 캡시드, 및/또는 AAV9로부터 유도된 키메라 캡시드를 갖는 벡터를 생성하는 방법이 기술되었다. 예를 들어, 본원에 참조로 포함된 US 7,906,111을 참조한다. 비강 세포 또는 다른 적합한 표적(예를 들어, 근육 또는 폐)을 형질도입하는 다른 AAV 혈청형은 예를 들어 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, rh10, AAVrh64R1, AAVrh64R2, rh8, AAVrh32.33을 포함하는 AAV 바이러스 벡터의 캡시드에 대한 소스로서 선택될 수 있다(예를 들어, 미국 공개 특허 출원 번호 2007-0036760-A1; 미국 공개 특허 출원 번호 2009-0197338-A1; 및 EP 1310571 참조한다). 또한, WO 2003/042397(AAV7 및 기타 유인원 AAV), 미국 특허 7790449 및 미국 특허 7282199(AAV8), WO 2005/033321(AAV9), 및 WO 2006/110689, 또는 아직 발견되지 않은, 또는 이에 기초한 재조합 AAV는 AAV 캡시드에 대한 공급원으로 사용될 수 있음을 참조한다. 예를 들어 WO 2020/223232 A1(AAV rh90), WO 2020/223231 A1 및 2021년 8월 13일에 출원된 국제 출원 번호 PCT/US21/45945(AAV rh91), 및 WO 2020/223236 A1(AAV rh92, AAV rh93, AAV rh9193)을 참조하며, 이는 그 전체가 참조로 본 명세서에 포함된다. 이들 문서는 또한 AAV를 생성하기 위해 선택될 수 있는 다른 AAV를 기술하고 참조에 의해 통합된다. 일부 구체예에서, 바이러스 벡터에 사용하기 위한 AAV 캡시드(cap)는 전술한 AAV 캡 중 하나 또는 이의 인코딩 핵산의 돌연변이 유발에 의해(즉, 삽입, 결실 또는 치환에 의해) 생성될 수 있다. 일부 구체예에서, AAV 캡시드는 전술한 AAV 캡시드 단백질 중 2개 또는 3개 또는 4개 이상으로부터의 도메인을 포함하는 키메라이다. 일부 구체예에서, AAV 캡시드는 2개 또는 3개의 상이한 AAV 또는 재조합 AAV로부터의 Vp1, Vp2 및 Vp3 단량체의 모자이크이다. 일부 구체예에서, rAAV 조성물은 전술한 캡 중 하나 이상을 포함한다.
본원에서 사용되는 용어 "클레이드"는 최소 75%의 부트스트랩 값(최소 1000회 복제 중)으로 이웃 결합 알고리즘을 사용하여 결정된 대로 서로 계통발생학적으로 관련있는 AAV 그룹과 관련하여 AAV vp1 아미노산 서열의 정렬에 기초하여 AAV 그룹 및 0.05 이하의 포아송 보정 거리 측정치를 지칭한다. 이웃 결합 알고리즘은 문헌에 설명되어 있다. 예를 들어, M. Nei 및 S. Kumar, Molecular Evolution and Phylogenetics(Oxford University Press, New York(2000))를 참조한다. 이 알고리즘을 구현하는 데 사용할 수 있는 컴퓨터 프로그램이 있다. 예를 들어, MEGA v2.1 프로그램은 수정된 Nei-Gojobori 방법을 구현한다. 이들 기술 및 컴퓨터 프로그램, 및 AAV vp1 캡시드 단백질의 서열을 사용하여, 당업자는 선택된 AAV가 본원에서 확인된 클레이드 중 하나에 포함되는지, 또 다른 클레이드에 포함되는지 또는 이러한 클레이드 외부에 있는지를 쉽게 결정할 수 있다. 예를 들어, 클레이드 A, B, C, D, E 및 F를 식별하고 신규 AAV, GenBank 접근 번호 AY530553 내지 AY530629의 핵산 서열을 제공하는 G Gao, 등, J Virol, 2004 Jun; 78(12): 6381-6388을 참조한다. 또한 WO 2005/033321을 참조한다.
본원에서 사용되는 바와 같이, "AAV9 캡시드"는 다수의 AAV9 vp 단백질로 구성된 자가 조립된 AAV 캡시드이다. AAV9 vp 단백질은 전형적으로 GenBank accession: AAS99264의 vp1 아미노산 서열을 인코딩하는 핵산 서열에 의해 인코딩된 대체 스플라이스 변이체로서 발현된다. 이러한 스플라이스 변형으로 인해 길이가 다른 단백질이 생성된다. 특정 구체예에서, "AAV9 캡시드"는 AAS99264와 99% 동일하거나 이에 대해 99% 동일한 아미노산 서열을 갖는 AAV를 포함한다. 또한, AAV9에 대한 탈아미드화 패턴을 제공하는 표 G를 포함하여 2019년 9월 6일에 공개된 WO 2019/168961을 참조한다. US7906111 및 WO 2005/033321 참조. 본원에 사용된 "AAV9 변이체"는 예를 들어 WO2016/049230, US 8,927,514, US 2015/0344911 및 US 8,734,809에 기재된 것을 포함한다.
rAAVhu68은 AAVhu68 캡시드와 벡터 게놈으로 구성된다. AAVhu68 캡시드는 vp1의 이종 집단, vp2의 이종 집단 및 vp3 단백질의 이종 집단의 집합체이다. vp 캡시드 단백질을 지칭하기 위해 본원에서 사용되는 용어 "이종" 또는 그의 임의의 문법적 변형은 동일하지 않은 요소, 예를 들어 상이한 변형된 아미노산 서열을 갖는 vp1, vp2 또는 vp3 단량체(단백질)를 갖는 구성된 집단을 지칭한다. 또한, PCT/US2018/019992, WO 2018/160582, 제목 "Adeno-Associated Virus (AAV) Clade F Vector and Uses Therefor"를 참조한다.
다른 재조합 바이러스 벡터의 경우, 표적 특이성을 담당하는 바이러스 캡시드 또는 외피 단백질의 적합한 노출 부분이 표적 펩티드의 삽입을 위해 선택된다. 예를 들어, 아데노바이러스에서 헥손 단백질을 변형하는 것이 바람직할 수 있다. 렌티바이러스에서, 막 융합 단백질은 표적 모티프의 하나 이상의 카피를 포함하는 변형될 수 있다. 백시니아 바이러스의 경우, 표적 모티프의 하나 이상의 카피를 포함하도록 주요 당단백질이 변형될 수 있다. 적합하게는, 이러한 재조합 바이러스 벡터는 안전 목적을 위해 복제 결함이 있다.
발현 카세트 및 벡터
AAV 캡시드에 패키징되어 숙주 세포로 전달되는 벡터 게놈 서열은 전형적으로 최소한, 이식유전자 및 이의 조절 서열 및 AAV 역위 말단 반복부(ITR)로 구성된다. 단일 가닥 AAV 및 자체 보완(sc) AAV 둘 모두는 rAAV에 포함된다. 이식유전자는 폴리펩티드, 단백질, 기능적 RNA 분자(예를 들어, miRNA, miRNA 억제제) 또는 기타 관심 유전자 산물을 인코딩하는 벡터 서열과 이종인 핵산 코딩 서열이다. 핵산 코딩 서열은 표적 조직의 세포에서 이식유전자 전사, 번역 및/또는 발현을 허용하는 방식으로 조절 구성요소에 작동가능하게 연결된다.
벡터의 AAV 서열은 전형적으로 cis-작용 5' 및 3' 역 말단 반복(ITR) 서열을를 포함한다(예를 들어, B. J. Carter, in "Handbook of Parvoviruses", ed., P. Tijsser, CRC Press, pp. 155 168 (1990)을 참조한다). ITR 서열은 길이가 약 145 염기쌍(bp)이다. 바람직하게는, 실질적으로 ITR을 인코딩하는 전체 서열이 분자에 사용되지만, 이들 서열의 약간의 변형이 어느 정도 허용된다. 이러한 ITR 서열을 수정하는 능력은 당업계의 기술 범위 내에 있다. (예를 들어, Sambrook 등, "Molecular Cloning. A Laboratory Manual" 2d ed., Cold Spring Harbor Laboratory, New York (1989); 및 K. Fisher 등, J. Virol., 70:520 532 (1996)와 같은 텍스트를 참조한다). 본 발명에서 사용되는 이러한 분자의 예는 선택된 이식유전자 서열 및 연관된 조절 구성요소가 5' 및 3' AAV ITR 서열에 측접한 이식유전자를 함유하는 "cis-작용" 플라스미드이다. 일 구체예에서, ITR은 캡시드를 공급하는 것과 상이한 AAV로부터 유래한다. 일 구체예에서, ITR 서열은 AAV2로부터의 것이다. ΔITR이라고 하는 5' ITR의 단축 버전은 D-서열과와 터미널 해상도 사이트(trs)가 삭제된 것으로 설명되었다. 특정 구체예에서, (예를 들어, 플라스미드의) 벡터 게놈은 130개 염기쌍의 단축된 AAV2 ITR을 포함하고, 여기서 외부 A 요소는 결실된다. 단축된 ITR은 내부 A 요소를 주형으로 사용하고 캡시드로 패키징하여 바이러스 입자를 형성하는 벡터 DNA 증폭 동안 145개 염기쌍의 야생형 길이로 되돌아갈 수 있다. 다른 구체예에서, 전장 AAV 5' 및 3' ITR이 사용된다. 그러나 다른 AAV 소스의 ITR을 선택할 수 있다. ITR의 소스가 AAV2에 있고 AAV 캡시드가 다른 AAV 소스에 있는 경우 결과 벡터는 유사형이라고 할 수 있다. 그러나 이러한 요소의 다른 구성이 적합할 수 있다.
재조합 AAV 벡터에 대해 위에서 확인된 주요 요소에 더하여, 벡터는 또한 플라스미드 벡터로 형질감염되거나 본 발명에 의해 생성된 바이러스로 감염된 세포에서 그의 전사, 번역 및/또는 발현을 허용하는 방식으로 이식유전자에 작동가능하게 연결된 필수적인 통상적인 제어 요소를 포함한다. 본원에서 사용되는 바와 같이, "작동가능하게 연결된" 서열은 관심 유전자와 인접하는 발현 제어 서열 및 관심 유전자를 제어하기 위해 트랜스로 또는 일정 거리에서 작용하는 발현 제어 서열 모두를 포함한다.
조절 제어 요소는 전형적으로 예를 들어 선택된 5' ITR 서열과 코딩 서열 사이에 위치한 발현 제어 서열의 일부로서 프로모터 서열을 함유한다. 구성적 프로모터, 조절 가능한 프로모터[예를 들어, WO 2011/126808 및 WO 2013/04943을 참조한다], 조직 특이적 프로모터 또는 생리학적 신호에 반응하는 프로모터가 본원에 기재된 벡터에서 사용될 수 있다.
치료제의 발현 조절에 적합한 구성적 프로모터의 예는 닭 β-액틴(CB) 프로모터, CB7 프로모터, 인간 사이토메갈로바이러스(CMV) 프로모터, 유비퀴틴 C 프로모터(UbC), 유인원 바이러스 40(SV40)의 초기 및 후기 프로모터, U6 프로모터, 메탈로티오네인 프로모터, EFlα 프로모터, 유비퀴틴 프로모터, 하이포크산틴 포스포리보실 전이효소(HPRT) 프로모터, 디히드로폴레이트 환원효소(DHFR) 프로모터 (Scharfmann 등, Proc. Natl. Acad. Sci. USA 88:4626-4630 (1991), 아데노신 데아미나제 프로모터, 포스포글리세롤 키나제(PGK) 프로모터, 피루베이트 키나제 프로모터 포스포글리세롤 뮤타제 프로모터, β-액틴 프로모터 (Lai 등, Proc. Natl. Acad. Sci. USA 86: 10006-10010 (1989)), 몰로니 백혈병 바이러스 및 기타 레트로바이러스의 긴 말단 반복부(LTR), 단순 헤르페스 바이러스의 티미딘 키나제 프로모터 및 당업자에게 공지된 다른 구성적 프로모터를 포함하나 이에 제한되지 않는다. 본 발명에 사용하기에 적합한 조직- 또는 세포-특이적 프로모터의 예는 내피 세포에 특이적인 엔도텔린-I(ET-I) 및 Flt-I, FoxJ1을 포함하지만 이에 제한되지 않는다(섬모 세포를 표적으로 함). 본 발명에 사용하기에 적합한 조직 특이적 프로모터의 다른 예는 간 특이적 프로모터를 포함하나 이에 제한되지 않는다. 간-특이적 프로모터의 예는 예를 들어 갑상선 호르몬-결합 글로불린(TBG), 알부민, Miyatake 등, (1997) J. Virol., 71:5124 32; B형 간염 바이러스 코어 프로모터, Sandig 등, (1996) Gene Ther., 3:1002 9; 또는 인간 알파 1-항트립신, 포스포에놀피루베이트 카르복시키나제(PECK) 또는 알파 태아단백질(AFP), Arbuthnot 등, (1996) Hum. Gene Ther., 7:1503 14)을 포함할 수 있다. 바람직하게는, 이러한 프로모터는 인간 기원이다.
치료제의 발현 조절에 적합한 유도성 프로모터는 외인성 제제(예를 들어, 약리학적 제제) 또는 생리학적 신호에 반응하는 프로모터를 포함한다. 이러한 반응 요소에는 HIF-Iα 및 β에 결합하는 저산소증 반응 요소(HRE), Mayo 등 (1982, Cell 29:99-108); Brinster 등 (1982, Nature 296:39-42) 및 Searle 등 (1985, Mol. Cell. Biol. 5:1480-1489); 또는 Nouer 등에 의해 기술된 것과 같은 열충격 반응 요소 (in: Heat Shock Response, ed. Nouer, L., CRC, Boca Raton, Fla., ppI67-220, 1991)에 의해 기술된 금속 이온 반응 요소가 포함되지만 이에 제한되지 않는다.
일 구체예에서, 유전자 산물의 발현은 유전자 산물, 예를 들어, 약리학적 제제, 또는 약리학적 제제에 의해 활성화된 전사 인자를 인코딩하는 서열의 전사에 대한 엄격한 제어를 제공하거나, 대안적 구체예에서는 생리학적 신호를 제공하는 조절가능한 프로모터에 의해 제어된다. 새지 않고 엄격하게 제어할 수 있는 프로모터 시스템이 선호된다.
본 발명에서 사용될 수 있는 리간드-의존성 전사 인자 복합체인 조절 가능한 프로모터의 예는 이의 각각의 리간드에 의해 활성화되는 핵 수용체 슈퍼패밀리의 구성원(예를 들어, 글루코코르티코이드, 에스트로겐, 프로게스틴, 레티노이드, 엑디손, 및 이들의 유사체 및 모방체) 및 테트라사이클린에 의해 활성화되는 rTTA를 포함하지만 이에 제한되지 않는다. 본 발명의 일 측면에서, 유전자 스위치는 EcR 기반 유전자 스위치이다. 그러한 시스템의 예는 제한 없이 미국 특허 번호 6,258,603, 7,045,315, 미국 공개 특허 출원 번호 2006/0014711, 2007/0161086 및 국제 공개 출원 번호 WO 01/70816에 설명된 시스템을 포함한다. 키메라 에크디손 수용체 시스템의 예는 미국 특허 번호 7,091,038, 미국 공개 특허 출원 번호 2002/0110861, 2004/0033600, 2004/0096942, 2005/0266457 및 2006/0100416, 및 국제 공개 출원 번호 WO 01/70816, WO 02/066612, WO 02/066613, WO 02/066614, WO 02/066615, WO 02/29075, 및 WO 2005/108617에 기술되어 있으며, 이들 각각은 전문이 참조로 포함되어 있다. 비스테로이드성 엑디손 작용제 조절 시스템의 예는 RheoSwitch® 포유류 유도 발현 시스템(New England Biolabs, Ipswich, MA)이다.
또 다른 프로모터 시스템은 테트라사이클린(tet) 반응 요소(Gossen & Bujard(1992, Proc. Natl. Acad. Sci. USA 89:5547-551)에 기술된 것과 같은) 또는 Lee 등 (1981, Nature 294:228-232); Hynes 등 (1981, Proc. Natl. Acad. Sci. USA 78:2038-2042); Klock 등 (1987, Nature 329:734-736); 및 Israel & Kaufman (1989, Nucl. Acids Res. 17:2589-2604)으로 기술된 것과 같은 호르몬 반응 요소 및 당업계에 공지된 다른 유도성 프로모터를 포함하나 이에 제한되지 않는 반응 요소를 포함할 수 있다. 이러한 프로모터를 사용하여 가용성 hACE2 구조의 발현을 예를 들어 Tet-on/off 시스템(Gossen 등, 1995, Science 268:1766-9; Gossen 등, 1992, Proc. Natl. Acad. Sci. USA., 89(12):5547-51); TetR-KRAB 시스템 (Urrutia R., 2003, Genome Biol., 4(10):231; Deuschle U 등, 1995, Mol Cell Biol. (4):1907-14); 미페프리스톤(RU486) 조절 시스템 (Geneswitch; Wang Y 등, 1994, Proc. Natl. Acad. Sci. USA., 91(17):8180-4; Schillinger 등, 2005, Proc. Natl. Acad. Sci. U S A.102(39):13789-94) 및 인간화 타목시펜-dep 조절 시스템 (Roscilli 등, 2002, Mol. Ther. 6(5):653-63)으로 제어할 수 있다.
또 다른 측면에서, 유전자 스위치는 FKBP 라파마이신 관련 단백질(FRAP)과 FK506 결합 단백질(FKBP)의 이종이량체화를 기반으로 하며 라파마이신 또는 이의 비면역억제 유사체를 통해 조절된다. 이러한 시스템의 예는 제한 없이 ARGENT™ Transcriptional Technology(ARIAD Pharmaceuticals, Cambridge, Mass.) 및 미국 특허 번호 6,015,709, 6,117,680, 6,479,653, 6,187,757, 및 6,649,595, 미국 공개 번호 2002/0173474, 미국 공개 번호 200910100535, 미국 특허 번호 5,834,266, 미국 특허 번호 7,109,317, 미국 특허 번호 7,485,441, 미국 특허 번호 5,830,462, 미국 특허 번호 5,869,337, 미국 특허 번호 5,871,753, 미국 특허 번호 6,011,018, 미국 특허 번호 6,043,082, 미국 특허 번호 6,046,047, 미국 특허 번호 6,063,625, 미국 특허 번호 6,140,120, 미국 특허 번호 6,165,787, 미국 특허 번호 6,972,193, 미국 특허 번호 6,326,166, 미국 특허 번호 7,008,780, 미국 특허 번호 6,133,456, 미국 특허 번호 6,150,527, 미국 특허 번호 6,506,379, 미국 특허 번호 6,258,823, 미국 특허 번호 6,693,189, 미국 특허 번호 6,127,521, 미국 특허 번호 6,150,137, 미국 특허 번호 6,464,974, 미국 특허 번호 6,509,152, 미국 특허 번호 6,015,709, 미국 특허 번호 6,117,680, 미국 특허 번호 6,479,653, 미국 특허 번호 6,187,757, 미국 특허 번호 6,649,595, 미국 특허 번호 6,984,635, 미국 특허 번호 7,067,526, 미국 특허 번호 7,196,192, 미국 특허 번호 6,476,200, 미국 특허 번호 6,492,106, WO 94/18347, WO 96/20951, WO 96/06097, WO 97/31898, WO 96/41865, WO 98/02441, WO 95/33052, WO 99110508, WO 99110510, WO 99/36553, WO 99/41258,WO 01114387, ARGENT™ 규제 전사 레트로바이러스 키트, 버전 2.0(9109102) 및 ARGENT™ 규제 전사 플라스미드 키트, 버전 2.0(9109/02)에 기술된 시스템을 포함하며, 이들 각각은 그 전문이 본원에 참조로 포함된다. Ariad 시스템은 라파마이신 및 "라파로그"라고 하는 이의 유사체에 의해 유도되도록 설계되었다. 적합한 라파마이신의 예는 ARGENT™ 시스템의 설명과 관련하여 위에 나열된 문서에 제공된다. 일 구체예에서, 분자는 라파마이신[예를 들어, Pfizer에 의해 Rapamune™으로 시판됨]이다. 다른 구체예에서, AP21967[ARIAD]로 알려진 라팔로그가 사용된다. 본 발명에서 사용될 수 있는 이러한 이합체 분자의 예는 내인성 FKBP 및/또는 FRAP에 대한 친화성을 감소시키거나 제거하는 "돌기"를 추가하기 위해 천연 제품의 화학적 변형에 의해 쉽게 준비되는 라파마이신, FK506, FK1012(FK506의 동종이량체), 라파마이신 유사체("라파로그")를 포함하지만 이에 제한되지 않는다. 라파로그의 예는 내인성 FKBP와의 상호 작용을 최소화하도록 설계된 '범프'가 있는 AP26113(Ariad), AP1510 (Amara, J.F. 등, 1997, Proc. Natl. Acad. Sci. USA, 94(20): 10618-23) AP22660, AP22594, AP21370, AP22594, AP23054, AP1855, AP1856, AP1701, AP1861, AP1692 및 AP1889를 포함하지만 이에 제한되지 않는다. 또 다른 라파로그, 예를 들어 AP23573[Merck]이 선택될 수 있다. 특정 구체예에서, 라파마이신 또는 적합한 유사체는 비인두의 AAV-형질감염된 세포에 국소적으로 전달될 수 있다. 이 국소 전달은 볼루스, 크림 또는 젤을 통해 세포에 국소적으로 비강내 주사에 의해 이루어질 수 있다. 본원에 참조로 포함된 미국 특허 출원 US 2019/0216841 A1을 참조한다.
다른 적합한 인핸서는 원하는 표적 조직 적응증에 적절한 것들을 포함한다. 일 구체예에서, 발현 카세트는 하나 이상의 발현 인핸서를 포함한다. 일 구체예에서, 발현 카세트는 2개 이상의 발현 인핸서를 함유한다. 이들 인핸서는 서로 동일하거나 상이할 수 있다. 예를 들어, 인핸서는 CMV 즉시 초기 인핸서를 포함할 수 있다. 이 인핸서는 서로 인접해 있는 두 개의 사본에 존재할 수 있다. 대안적으로, 인핸서의 이중 카피는 하나 이상의 서열에 의해 분리될 수 있다. 또 다른 구체예에서, 발현 카세트는 인트론, 예를 들어 닭 베타-액틴 인트론을 추가로 함유한다. 다른 적합한 인트론은 당업계에 공지된 것, 예를 들어 WO 2011/126808에 기재된 것을 포함한다. 적합한 폴리아데닐화(polyA) 서열의 예는 예를 들어 토끼 결합 글로불린(토끼 베타 글로빈 또는 rBG라고도 함), SV40, SV50, 소 성장 호르몬(bGH), 인간 성장 호르몬 및 합성 polyA를 포함한다. 선택적으로, mRNA를 안정화하기 위해 하나 이상의 서열이 선택될 수 있다. 그러한 서열의 예는 폴리A 서열의 상류 및 코딩 서열의 하류에서 조작될 수 있는 변형된 WPRE 서열이다(예를 들어, MA Zanta-Boussif, 등, Gene Therapy (2009) 16: 605-619를 참조한다).
AAV 바이러스 벡터는 다수의 이식유전자를 포함할 수 있다. 특정 상황에서, 단백질의 각 서브유닛(예를 들어, 면역글로불린 도메인, 면역글로불린 중쇄, 면역글로불린 경쇄)을 인코딩하기 위해 상이한 이식유전자가 사용될 수 있다. 일 구체예에서, 세포는 각각의 상이한 서브유닛을 함유하는 바이러스로 감염/형질감염된 후 다중 서브유닛 단백질을 생산한다. 또 다른 구체예에서, 단백질의 상이한 서브유닛은 동일한 이식유전자에 의해 인코딩될 수 있다. IRES는 각각의 서브유닛을 인코딩하는 DNA의 크기가 작을 때, 예를 들어 서브유닛과 IRES를 인코딩하는 DNA의 총 크기가 5킬로베이스 미만일 때 바람직하다. IRES에 대한 대안으로서, DNA는 2A 펩티드를 인코딩하는 서열에 의해 분리될 수 있으며, 이는 번역 후 사건에서 자가 절단된다. 예를 들어, ML Donnelly, 등, (Jan 1997) J. Gen. Virol., 78(Pt 1):13-21; S. Furler, S 등, (June 2001) Gene Ther., 8(11):864-873; H. Klump, 등., (May 2001) Gene Ther., 8(10):811-817을 참조한다. 이 2A 펩티드는 IRES보다 훨씬 작기 때문에 공간이 제한 요인일 때 사용하기에 매우 적합하다. 더 자주, 이식유전자가 크거나 다중 서브유닛으로 구성되거나 두 개의 이식유전자가 공동 전달되는 경우, 원하는 이식유전자(들) 또는 서브유닛을 운반하는 rAAV가 공동 투여되어 단일 벡터 게놈을 형성하기 위해 생체 내에서 연쇄체화할 수 있다. 이러한 구체예에서, 제1 AAV는 단일 이식유전자를 발현하는 발현 카세트를 운반할 수 있고, 제2 AAV는 숙주 세포에서 공동-발현을 위해 상이한 이식유전자를 발현하는 발현 카세트를 운반할 수 있다. 그러나, 선택된 이식유전자는 임의의 생물학적 활성 생성물 또는 다른 생성물, 예를 들어 연구에 바람직한 생성물을 인코딩할 수 있다.
발현 카세트에 대해 위에서 확인된 요소에 더하여, 벡터는 또한 플라스미드 벡터로 형질감염되거나 본 발명에 의해 생성된 바이러스로 감염된 세포에서 인코딩된 생성물(예를 들어, 가용성 hACE2 구조, 항-인플루엔자 항체, 항-COVID19 항체)의 전사, 번역 및/또는 발현을 허용하는 방식으로 코딩 서열에 작동가능하게 연결된 통상적인 제어 요소를 포함한다. 다른 적합한 이식유전자의 예가 본원에 제공된다. 본원에서 사용되는 바와 같이, "작동가능하게 연결된" 서열은 관심 유전자와 인접하는 발현 제어 서열 및 관심 유전자를 제어하기 위해 트랜스로 또는 일정 거리에서 작용하는 발현 제어 서열 모두를 포함한다.
발현 조절 서열은 적절한 강화제; 전사 인자; 전사 종결자; 발기인; 스플라이싱 및 폴리아데닐화(polyA) 신호와 같은 효율적인 RNA 처리 신호; 세포질 mRNA를 안정화시키는 서열, 예를 들어 우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE); 번역 효율성을 향상시키는 서열(즉, Kozak 컨센서스 서열); 단백질 안정성을 향상시키는 서열; 및 원하는 경우 인코딩된 생성물의 분비를 향상시키는 서열을 포함한다. 일 구체예에서, 전체 rAAV 벡터 게놈의 크기가 약 2.0 내지 약 5.5킬로베이스가 되도록 조절 서열이 선택된다. 일 구체예에서, rAAV 벡터 게놈은 천연 AAV 게놈의 크기에 근접하는 것이 바람직하다. 따라서, 일 구체예에서, 전체 rAAV 벡터 게놈의 크기가 약 4.7kb가 되도록 조절 서열을 선택한다. 다른 구체예에서, 전체 rAAV 벡터 게놈은 크기가 약 5.2kb 미만이다. 벡터 게놈의 크기는 프로모터, 인핸서, 인트론, 폴리 A 등을 포함하는 조절 서열의 크기에 따라 조작될 수 있다. 본 명세서에 참조로 포함된 Wu 등, Mol. Ther., Jan 2010 18(1):80-6을 참조한다.
따라서, 일 구체예에서, 인트론은 벡터에 포함된다. 적합한 인트론은 닭 베타-액틴 인트론, 인간 베타 글로빈 IVS2(Kelly 등, Nucleic Acids Research, 43(9):4721-32 (2015)); Promega 키메라 인트론(Almond, B. 및 Schenborn, E. T. A Comparison of pCI-neo Vector and pcDNA4/HisMax Vector); 및 hFIX 인트론을 포함한다. 본원에 적합한 다양한 인트론은 당업계에 공지되어 있고, 본원에 참조로 포함된 bpg.utoledo.edu/~afedorov/lab/eid.html에서 발견된 것들을 포함하나 이에 제한되지 않는다. 또한, Shepelev V., Fedorov A. Advances in the Exon-Intron Database. Briefings in Bioinformatics 2006, 7: 178-185를 참조하며, 이는 본원에 참조로 포함된다.
본원에 기술된 연구에서 여러 상이한 바이러스 게놈이 생성되었다. 그러나, 당업자는 다른 조절 서열을 포함하는 다른 게놈 구성이 프로모터, 인핸서를 대체할 수 있고 다른 코딩 서열이 선택될 수 있음을 이해할 것이다.
rAAV 벡터 생산
AAV 바이러스 벡터(예를 들어, 재조합(r) AAV)를 생산하는 데 사용하기 위한 발현 카세트는 패키징 숙주 세포에 전달되는 임의의 적합한 벡터, 예를 들어 플라스미드에 운반될 수 있다. 본 발명에 유용한 플라스미드는 특히 원핵 세포, 곤충 세포, 포유동물 세포에서 복제 및 시험관내 패키징에 적합하도록 조작될 수 있다. 적합한 형질감염 기술 및 패키징 숙주 세포는 공지되어 있고/있거나 당업자에 의해 용이하게 설계될 수 있다.
특정 구체예에서, AAV 캡시드에 N- x- (T/I/V/A)- (K/R) 모티프의 적어도 하나의 카피를 포함하는 것은 AAV 캡시드에 적어도 하나의 모티프 카피를 포함하지 않는 방법과 비교하여 생산에서 이점을 제공하며, 상기 생산 세포는 293 세포이다.
AAV 기반 벡터(예를 들어, AAV9 또는 다른 AAV 캡시드를 가짐)를 제조하는 방법은 알려져 있다. 예를 들어, 본원에 참조로 포함된 미국 공개 특허 출원 번호 2007/0036760(2007년 2월 15일)을 참조한다. 본 발명은 AAV9 또는 다른 클레이드 F AAV 아미노산 서열의 사용에 제한되지 않고, 예를 들어 화학적 합성, 다른 합성 기술 또는 다른 방법에 의해 포함하는 당업계에 공지된 다른 방법에 의해 생성된 말단 β-갈락토스 결합을 함유하는 펩티드 및/또는 단백질을 포함한다. 본원에 제공된 임의의 AAV 캡시드의 서열은 다양한 기술을 사용하여 쉽게 생성될 수 있다. 적합한 생산 기술은 당업자에게 잘 알려져 있다. 예를 들어 Sambrook 등, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press (Cold Spring Harbor, NY)를 참조한다. 대안적으로, 펩티드는 잘 알려진 고상 펩티드 합성 방법에 의해 합성될 수도 있다(Merrifield, (1962) J. Am. Chem. Soc., 85:2149; Stewart 및 Young, Solid Phase Peptide Synthesis (Freeman, San Francisco, 1969) pp. 27-62). 이러한 방법에는 예를 들어 AAV 캡시드를 인코딩하는 핵산 서열을 함유하는 숙주 세포를 배양하는 단계; 기능적 대표 유전자; 최소한 AAV 역위 말단 반복부(ITR) 및 이식유전자로 구성된 미니유전자; 미니유전자를 AAV 캡시드 단백질로 패키징할 수 있도록 하는 충분한 헬퍼 기능이 포함될 수 있다. 이들 및 다른 적합한 제조 방법은 당업자의 지식 내에 있으며 본 발명의 제한이 아니다.
AAV 캡시드에 AAV 미니유전자를 패키징하기 위해 숙주 세포에서 배양되는 데 필요한 구성요소는 숙주 세포에 트랜스로 제공될 수 있다. 대안적으로, 임의의 하나 이상의 필요한 구성요소(예를 들어, 미니유전자, rep 서열, cap 서열 및/또는 헬퍼 기능)는 당업자에게 공지된 방법을 사용하여 하나 이상의 필요한 구성요소를 함유하도록 조작된 안정한 숙주 세포에 의해 제공될 수 있다. 가장 적절하게는, 그러한 안정한 숙주 세포는 유도성 프로모터의 제어 하에 필요한 성분을 함유할 것이다. 그러나 필요한 구성 요소는 구성적 프로모터의 통제하에 있을 수 있다. 적합한 유도성 및 구성적 프로모터의 예는 이식유전자와 함께 사용하기에 적합한 조절 요소의 논의에서 본원에서 제공된다. 또 다른 대안에서, 선택된 안정한 숙주 세포는 구성적 프로모터의 제어 하에 선택된 성분 및 하나 이상의 유도성 프로모터의 제어 하에 다른 선택된 성분을 함유할 수 있다. 예를 들어, 293 세포(구성적 프로모터의 제어 하에 E1 헬퍼 기능을 함유함)로부터 유도되지만 유도성 프로모터의 제어 하에 rep 및/또는 cap 단백질을 함유하는 안정한 숙주 세포가 생성될 수 있다. 또 다른 안정한 숙주 세포는 당업자에 의해 생성될 수 있다.
이러한 rAAV는 치료 목적 및 감염 예방을 위한 유전자 전달에 특히 적합하다. 또한, 본 발명의 조성물은 시험관 내에서 목적하는 유전자 산물의 생산에도 사용될 수 있다. 시험관내 생성을 위해, 원하는 생성물(예를 들어, 단백질)은 원하는 생성물을 코딩하는 분자를 함유하는 rAAV로 숙주 세포를 형질감염시키고 발현을 허용하는 조건 하에서 세포 배양물을 배양한 후 원하는 배양물로부터 얻을 수 있다. 그런 다음 발현된 제품을 원하는 대로 정제하고 분리할 수 있다. 형질감염, 세포 배양, 정제 및 단리를 위한 적합한 기술은 당업자에게 공지되어 있다. 벡터로서 사용하기에 적합한 AAV를 생성하고 분리하는 방법은 당업계에 공지되어 있다. 일반적으로, 예를 들어, Grieger & Samulski, 2005, "Adeno-associated virus as a gene therapy vector: Vector development, production and clinical applications," Adv. Biochem. Engin/Biotechnol. 99: 119-145; Buning 등, 2008, "Recent developments in adeno-associated virus vector technology," J. Gene Med. 10:717-733; 아래에 인용된 참고문헌, 각각은 그 전체가 참고문헌으로 본 명세서에 포함된다. 이식유전자를 비리온으로 패키징하기 위해, ITR은 발현 카세트를 포함하는 핵산 분자와 동일한 구조에서 cis에 필요한 유일한 AAV 구성 요소이다. cap 및 rep 유전자는 트랜스로 제공될 수 있다.
일 구체예에서, 본원에 기술된 발현 카세트는 바이러스 벡터 생산을 위해 그 위에 운반된 면역글로불린 작제물 서열을 패키징 숙주 세포로 전달하는 유전 요소(예를 들어, 셔틀 플라스미드)로 조작된다. 일 구체예에서, 선택된 유전 요소는 형질감염, 전기천공법, 리포좀 전달, 막 융합 기술, 고속 DNA-코팅된 펠릿, 바이러스 감염 및 원형질체 융합을 포함하는 임의의 적합한 방법에 의해 AAV 패키징 세포로 전달될 수 있다. 안정적인 AAV 패키징 셀도 만들 수 있다. 대안적으로, 발현 카세트는 AAV 이외의 바이러스 벡터를 생성하기 위해 또는 시험관 내에서 항체 혼합물의 생성을 위해 사용될 수 있다. 그러한 작제물을 만드는 데 사용되는 방법은 핵산 조작 분야의 숙련자에게 알려져 있으며 유전 공학, 재조합 공학 및 합성 기술을 포함한다. 예를 들어, Molecular Cloning: A Laboratory Manual, ed. Green and Sambrook, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012)를 참조한다.
용어 "AAV 중간체" 또는 "AAV 벡터 중간체"는 패키징된 원하는 게놈 서열이 결여된 조립된 rAAV 캡시드를 지칭한다. 이들은 또한 "빈" 캡시드라고도 한다. 이러한 캡시드는 검출 가능한 발현 카세트의 게놈 서열을 포함하지 않거나, 유전자 산물의 발현을 달성하기에 불충분한 부분적으로 패키징된 게놈 서열만을 포함할 수 있다. 이러한 빈 캡시드는 관심 있는 유전자를 숙주 세포로 전달하는 기능이 없다.
본원에 기재된 재조합 AAV는 공지된 기술을 사용하여 생성될 수 있다. 예를 들어 WO 2003/042397; WO 2005/033321, WO 2006/110689; US 7588772 B2를 참조한다. 이러한 방법은 AAV 캡시드를 인코딩하는 핵산 서열; 기능적 대표 유전자; 최소한 AAV 역위 말단 반복(ITR) 및 이식유전자로 구성된 발현 카세트; 및 AAV 캡시드 단백질로의 발현 카세트의 패키징을 허용하기에 충분한 헬퍼 기능을 포함하는 숙주 세포를 배양하는 것을 포함한다. 캡시드를 생성하는 방법, 그에 따른 코딩 서열, 및 rAAV 바이러스 벡터의 생성 방법이 기재되어 있다. 예를 들어, Gao, 등, Proc. Natl. Acad. Sci. U.S.A. 100 (10), 6081-6086 (2003) 및 US 2013/0045186A1를 참조한다.
일 구체예에서, 세포는 적합한 세포 배양물에서 제조된다(예를 들어, HEK 293 세포). 본 명세서에 기술된 유전자 치료 벡터의 제조 방법은 유전자 치료 벡터의 생산에 사용되는 플라스미드 DNA의 생성, 벡터의 생성 및 벡터의 정제와 같은 당업계에 잘 알려진 방법을 포함한다. 일부 구체예에서, 유전자 치료 벡터는 AAV 벡터이고 생성된 플라스미드는 AAV 게놈을 인코딩하는 AAV cis-플라스미드와 캡시드로 패키징하기 위한 관심 유전자, AAV rep 및 cap 유전자를 포함하는 AAV 트랜스-플라스미드 및 아데노바이러스 헬퍼 플라스미드이다. 벡터 생성 프로세스에는 세포 배양 개시, 세포 계대, 세포 접종, 플라스미드 DNA로 세포의 형질감염, 형질감염 후 배지를 무혈청 배지로 교환, 벡터 함유 세포 및 배양 배지의 수확 과 같은 방법 단계가 포함될 수 있다. 수확된 벡터 함유 세포 및 배양 배지는 본원에서 미정제 세포 수확으로 지칭된다. 또 다른 시스템에서 유전자 치료 벡터는 배큘로바이러스 기반 벡터로 감염시켜 곤충 세포에 도입된다. 이러한 생산 시스템에 대한 검토를 위해 일반적으로, 예를 들어 전체가 참조로 본 명세서에 포함된 Zhang 등, 2009, "Adenovirus-adeno-associated virus hybrid for large-scale recombinant adeno-associated virus production," Human Gene Therapy 20:922-929 를 참조한다. 이들 및 다른 AAV 생산 시스템을 만들고 사용하는 방법은 또한 다음 미국 특허에 설명되어 있으며, 각 특허의 내용은 전체적으로 참조로 본원에 포함된다: 5,139,941; 5,741,683; 6,057,152; 6,204,059; 6,268,213; 6,491,907; 6,660,514; 6,951,753; 7,094,604; 7,172,893; 7,201,898; 7,229,823; 및 7,439,065. 특정 구체예에서, AAV 생산 시스템을 만들고 사용하는 방법은 2020년 4월 28일에 출원된 미국 특허 출원 63/016,894에 기술된 가성 광견병 바이러스(rPRV)를 사용하는 방법을 포함하며, 본원에 참조로 포함된다.
조 세포 수거물은 그 후 벡터 수확물의 농축, 벡터 수확물의 정용여과, 벡터 수확물의 미세유동화, 벡터 수확물의 뉴클레아제 소화, 미세유동화 중간체의 여과, 크로마토그래피에 의한 조 정제, 초원심분리에 의한 조 정제, 접선 흐름 여과에 의한 완충액 교환, 및/또는 벌크 벡터를 준비하기 위한 제형화 및 여과와 같은 대상 방법 단계일 수 있다.
높은 염 농도에서 2단계 친화성 크로마토그래피 정제 후 음이온 교환 수지 크로마토그래피를 사용하여 벡터 약물 제품을 정제하고 빈 캡시드를 제거한다. 이들 방법은 2016년 12월 9일 출원된 "Scalable Purification Method for AAV9"라는 제목의 국제 특허 출원 번호 PCT/US2016/065970에 더 자세히 설명되어 있으며, 이는 참조로 포함된다. 2016년 12월 9일 출원된 국제 특허 출원 번호 PCT/US2016/065976에 기재된 AAV8의 정제 방법, 및 2016년 12월 9일 출원된 "Scalable Purification Method for AAVrh10"라는 제목의, 또한 2015년 12월 11일 출원된, 국제 특허 출원 번호 PCT/US16/66013의 rh10의 정제 방법, 및 2015년 12월 11일 출원된 "Scalable Purification Method for AAV1"에 대해 2016년 12월 9일 출원된 국제 특허 출원 번호 PCT/US2016/065974의 AAV1의 정제 방법은 모두 본원에 참조로 포함된다.
빈 입자 및 전체 입자 함량을 계산하기 위해, 선택된 샘플(예를 들어, 본원의 예에서 GC 수 = 입자 수인 요오딕사놀 구배-정제 제제)에 대한 vp3 밴드 부피가 로드된 GC 입자에 대해 플롯된다. 결과 선형 방정식(y = mx+c)은 테스트 항목 피크의 밴드 부피에서 입자 수를 계산하는 데 사용된다. 로드된 20μL당 입자 수(pt)에 50을 곱하여 입자(pt)/mL를 제공한다. Pt/mL을 GC/mL로 나눈 값은 입자 대 게놈 사본의 비율(pt/GC)을 제공한다. Pt/mL-GC/mL은 빈 pt/mL을 제공한다. 빈 pt/mL을 pt/mL으로 나누고 x 100 하면 빈 입자의 백분율을 제공한다.
일반적으로, 패키징된 게놈을 갖는 빈 캡시드 및 AAV 벡터 입자에 대한 검정 방법은 당업계에 공지되어 있다. 예를 들어, Grimm 등, Gene Therapy (1999) 6:1322-1330; 및 Sommer 등, Molec. Ther. (2003) 7:122-128을 참조한다. 변성 캡시드를 테스트하기 위해 방법에는 처리된 AAV 스톡을 SDS-폴리아크릴아미드 겔 전기영동에 적용하는 단계, 3개의 캡시드 단백질을 분리할 수 있는 임의의 겔, 예를 들어 완충액에 3-8% 트리스-아세테이트를 함유한 구배 겔, 그리고 샘플 물질이 분리될 때까지 겔 실행하는 단계, 및 젤을 나일론 또는 니트로셀룰로스 막, 바람직하게는 나일론에 블로팅하는 단계가 포함된다. 항-AAV 캡시드 항체는 변성 캡시드 단백질, 바람직하게는 항-AAV 캡시드 단일 클론 항체, 가장 바람직하게는 B1 항-AAV-2 단일 클론 항체에 결합하는 1차 항체로 사용된다(Wobus 등, J. Virol. (2000) 74:9281-9293). 그런 다음 1차 항체에 결합하고 1차 항체, 보다 바람직하게는 이것에 공유 결합된 검출 분자를 함유하는 항-IgG 항체, 가장 바람직하게는 서양고추냉이 퍼옥시다제에 공유 결합된 양 항-마우스 IgG 항체와의 결합을 검출하는 수단을 포함하는 2차 항체가 사용된다. 결합을 검출하는 방법은 1차 항체와 2차 항체 사이의 결합을 반정량적으로 결정하기 위해 사용되며, 바람직하게는 방사성 동위원소 방출, 전자기 방사선 또는 비색 변화를 검출할 수 있는 검출 방법, 가장 바람직하게는 화학발광 검출 키트이다. 예를 들어, SDS-PAGE의 경우 컬럼 분획의 샘플을 채취하여 환원제(예를 들어, DTT)를 함유하는 SDS-PAGE 로딩 완충액에서 가열할 수 있으며, 캡시드 단백질은 미리 주조된 구배 폴리아크릴아미드 겔(예를 들어, Novex)에서 분해되었다. 실버 염색은 제조업체의 지침에 따라 SilverXpress(Invitrogen, CA) 또는 기타 적합한 염색 방법, 즉 SYPRO ruby 또는 쿠마시 염색을 사용하여 수행할 수 있다. 일 구체예에서, 컬럼 분획에서 AAV 벡터 게놈(vg)의 농도는 정량적 실시간 PCR(Q-PCR)에 의해 측정될 수 있다. 샘플을 희석하고 DNase I(또는 다른 적합한 뉴클레아제)로 분해하여 외인성 DNA를 제거한다. 뉴클레아제를 불활성화한 후, 샘플을 추가로 희석하고 프라이머 사이의 DNA 서열에 특이적인 TaqMan™ 형광 프로브와 프라이머를 사용하여 증폭한다. 정의된 형광 수준(임계값 주기, Ct)에 도달하는 데 필요한 주기 수는 Applied Biosystems Prism 7700 Sequence Detection System에서 각 샘플에 대해 측정된다. AAV 벡터에 포함된 것과 동일한 서열을 포함하는 플라스미드 DNA는 Q-PCR 반응에서 표준 곡선을 생성하기 위해 사용된다. 샘플에서 얻은 주기 역치(Ct) 값은 플라스미드 표준 곡선의 Ct 값으로 정규화하여 벡터 게놈 역가를 결정하는 데 사용된다. 디지털 PCR을 기반으로 하는 종점 분석도 사용할 수 있다.
또한, 빈 입자 대 전체 입자 비율을 측정하는 또 다른 예도 당업계에 알려져 있다. 분석 초원심분리기(AUC)에서 측정된 침전 속도는 응집체, 기타 미량 성분을 검출할 수 있을 뿐만 아니라 서로 다른 침전 계수를 기반으로 서로 다른 입자 종의 상대적인 양을 양호하게 정량화할 수 있다. 이것은 길이와 시간의 기본 단위를 기반으로 하는 절대 방법이며 참조로 표준 분자가 필요하지 않다. 벡터 샘플은 광학 경로 길이가 12mm인 2채널 목탄-에폰 센터피스가 있는 셀에 로드된다. 제공된 희석 완충액은 각 셀의 참조 채널에 로드된다. 그런 다음 로드된 세포를 AN-60Ti 분석 로터에 넣고 흡광도 및 RI 검출기가 모두 장착된 Beckman-Coulter ProteomeLab XL-I 분석 초원심분리기에 로드한다. 20℃에서 전체 온도 평형 후 로터는 12,000 rpm의 최종 실행 속도가 된다. A280 스캔은 ~5.5시간 동안 약 3분마다 기록된다(각 샘플에 대해 총 110개의 스캔). 원시 데이터는 c(s) 방법을 사용하여 분석되고 분석 프로그램 SEDFIT에서 구현된다. 결과 크기 분포가 그래프로 표시되고 피크가 통합된다. 각 피크와 관련된 백분율 값은 모든 피크 아래 총 면적의 피크 면적 비율을 나타내며 280nm에서 생성된 원시 데이터를 기반으로 하며; 많은 실험실에서 이 값을 사용하여 빈: 전체 입자 비율을 계산한다. 그러나 빈 입자와 가득 찬 입자는 이 파장에서 흡광 계수가 다르기 때문에 원시 데이터를 그에 따라 조정할 수 있다. 흡광계수 조정 전후의 빈 입자와 전체 단량체 피크 값의 비율을 사용하여 빈-가득 입자 비율을 결정한다.
일 측면에서, 광범위한 스펙트럼의 세린 프로테아제, 예를 들어 프로테이나제 K(예를 들어 Qiagen에서 시판됨)를 이용하는 최적화된 q-PCR 방법이 사용된다. 보다 구체적으로, 최적화된 qPCR 게놈 역가 분석은 DNase I 소화 후 샘플을 프로테이나제 K 완충액으로 희석하고 프로테이나제 K로 처리한 다음 열 불활성화한다는 점을 제외하면 표준 분석과 유사하다. 적당하게 샘플은 샘플 크기와 동일한 양의 프로테이나제 K 완충액으로 희석된다. 단백분해효소 K 완충액은 2배 이상으로 농축될 수 있다. 전형적으로, 프로테이나제 K 처리는 약 0.2mg/mL이지만, 0.1mg/mL에서 약 1mg/mL까지 다양할 수 있다. 상기 처리 단계는 일반적으로 약 55℃에서 약 15분 동안 수행되나, 더 낮은 온도(예를 들어 약 37℃ 내지 약 50℃)에서 더 긴 시간(예를 들어 약 20분 내지 약 30분) 또는 더 짧은 시간(예를 들어, 약 5 내지 10분) 동안 더 높은 온도(예를 들어, 최대 약 60℃)에 걸쳐 수행될 수 있다. 유사하게, 열 불활성화는 일반적으로 약 95℃에서 약 15분 동안이지만, 온도를 낮추고(예를 들어, 약 70 내지 약 90℃) 시간을 연장할 수 있다(예를 들어, 약 20분 내지 약 30분). 그런 다음 샘플을 희석(예를 들어 1000배)하고 표준 분석에 설명된 대로 TaqMan 분석을 수행한다. 정량화는 ViroCyt 또는 유세포 분석을 사용하여 수행할 수도 있다.
추가로 또는 대안적으로 액적 디지털 PCR(ddPCR)을 사용할 수 있다. 예를 들어, ddPCR에 의해 단일 가닥 및 자체 상보적 AAV 벡터 게놈 역가를 결정하는 방법이 설명되었다. 예를 들어, M. Lock 등, Hu Gene Therapy Methods, Hum. Gene Ther. Methods. 2014 Apr;25(2):115-25. doi: 10.1089/hgtb.2013.131. Epub 2014 Feb 14를 참조한다.
치료 단백질 및 전달 시스템
본원에 제공된 표적화 모티프인 N- x- (T/I/V/A)- (K/R) 모티프를 함유하는 융합 파트너, 컨쥬게이트 파트너 및 재조합 벡터는 다양한 상이한 치료 단백질, 폴리펩티드, 나노입자 및 전달 시스템에 유용하다. 본원에서 제공되는 조성물 및 표적 전달에 유용한 단백질 및 화합물의 예는 다음을 포함한다. 바이러스 벡터, 나노입자 및 기타 전달 시스템은 생체내 발현을 위해 선택된 단백질(또는 접합체)을 인코딩하는 서열을 함유한다는 것을 이해할 것이다.
특정 구체예에서, 단백질은 Allan-Herndon-Dudley 질병 및 이의 증상을 치료하기 위한 MCT8 단백질(SLC16A2 유전자) 및 기타 화합물이다.
특정 구체예에서, 단백질은 예를 들어 무엇보다도 낭포성 섬유증(낭포성 섬유증 막관통 조절제), 알파-1-항트립신(유전성 폐기종), FE(유전성 혈색소침착증), 티로시나아제(눈피부 백색증), 단백질 C(단백질 C 결핍증), 보체 C 억제제(I형 유전성 혈관부종), 알파-D-갈락토시다제(파브리병), 베타 헥소사미니다제(Tay-Sachs), 수크라제-이소말타제(선천성 수크라제-이소말타제 결핍증), UDP-글루코로노실-트랜스퍼라제(Crigler-Najjar 유형 II), 인슐린 수용체(당뇨병), 성장 호르몬 수용체(라론 증후군)와 같은 수송 결함과 관련된 질병으로부터 선택된다. 무엇보다도 척수성 근위축증(SMA, SMN1), 헌팅던병, 레트 증후군(예: 메틸-CpG 결합 단백질 2(MeCP2); UniProtKB - P51608), 근위축성 측삭 경화증(ALS), 뒤쉔형 근이영양증, 프리드리히 운동 실조증(예: 프라탁신), 척수소뇌 운동실조 2형(SCA2)/ALS와 관련된 ATXN2; ALS와 관련된 TDP-43, 프로그래눌린(PRGN)(전측두엽 치매(FTD), 진행성 비유창성 실어증(PNFA) 및 의미 치매를 포함하는 비알츠하이머 뇌 변성과 관련됨)과 관련된 다른 유전자 및 단백질의 예. 예를 들어, www.orpha.net/consor/cgi-bin/Disease_Search_List.php; rarediseases.info.nih.gov/diseases를 참조한다. rAAV를 통해 전달될 수 있는 추가의 예시적인 유전자에는 글리코겐 축적 질환 또는 결핍 유형 1A(GSD1)와 관련된 글루코스-6-포스파타제, PEPCK 결핍과 관련된 포스포에놀피루베이트-카르복시키나제(PEPCK); 발작 및 심각한 신경 발달 장애와 관련된 세린/트레오닌 키나아제 9(STK9)로도 알려진 사이클린 의존 키나아제 유사 5(CDKL5); 갈락토오스혈증과 관련된 갈락토오스-1 인산염 유리딜 전이효소; 페닐케톤뇨증(PKU)과 관련된 페닐알라닌 수산화효소(PAH); 히드록시산 옥시다제 1(GO/HAO1) 및 메이플 시럽 소변 질환과 관련된 BCKDH, BCKDH-E2, BAKDH-E1a 및 BAKDH-E1b를 포함하는 분지쇄 알파-케토산 탈수소효소인 AGXT를 포함하는 원발성 고옥산뇨증 1형과 관련된 유전자 산물; 티로신혈증 유형 1과 관련된 푸마릴아세토아세테이트 가수분해효소; 메틸말론산혈증과 관련된 메틸말로닐-CoA 뮤타제; 중쇄 아세틸 CoA 결핍과 관련된 중쇄 아실 CoA 탈수소효소; 오르니틴 트랜스카바밀라제 결핍과 관련된 오르니틴 트랜스카바밀라제(OTC); 시트룰린혈증과 관련된 아르기니노숙신산 합성효소(ASS1); 레시틴-콜레스테롤 아실트랜스퍼라제(LCAT) 결핍; 메틸말론산혈증(MMA); 니만-픽병(C1형)과 관련된 NPC1); 프로피온 학계(PA); 트랜스티레틴(TTR) 관련 유전성 아밀로이드증과 관련된 TTR; 가족성 고콜레스테롤혈증(FH)과 관련된 저밀도 지단백질 수용체(LDLR) 단백질, LDLR 변이체, 예컨대 WO 2015/164778에 기술된 것들; PCSK9; 치매와 관련된 ApoE 및 ApoC 단백질; Crigler-Najjar 질병과 관련된 UDP-glucouronosyltransferase; 중증 복합 면역결핍 질환과 관련된 아데노신 데아미나제; 통풍 및 Lesch-Nyan 증후군과 관련된 하이포크산틴 구아닌 포스포리보실 전이효소; 바이오티미다제 결핍과 관련된 바이오티미다제; 파브리병과 관련된 알파-갈락토시다제 A(a-Gal A); GM1 강글리오시다제와 관련된 베타-갈락토시다제(GLB1); 윌슨병과 관련된 ATP7B; Gaucher병 2형 및 3형과 관련된 베타-글루코세레브로시다제; Zellweger 증후군과 관련된 peroxisome 막 단백질 70 kDa; 이색성 백질이영양증과 관련된 아릴설파타제 A(ARSA), 크라베병과 관련된 갈락토세레브로시다제(GALC) 효소, 폼페병과 관련된 알파-글루코시다제(GAA); Nieman Pick 질병 A형과 관련된 스핑고미엘리나제(SMPD1) 유전자; 성인 발병 II형 시트룰린혈증(CTLN2)과 관련된 아르기니노숙시네이트 합성효소; 우레아 순환 장애와 관련된 카르바모일-포스페이트 신타제 1(CPS1); 척수성 근위축증과 관련된 생존 운동 뉴런(SMN) 단백질; 파버 지방육아종증과 관련된 세라미다제; GM2 강글리오시드증 및 테이-삭스병 및 샌드호프병과 관련된 b-헥소사미니다제; 아스파르틸-글루코사미뇨증과 관련된 아스파르틸글루코사미니다제; 푸코시다아제와 관련된 α-푸코시다아제; 알파-만노시다증과 관련된 α-만노시다아제; 급성 간헐적 포르피린증(AIP)과 관련된 포르포빌리노겐 데아미나제; 알파-1 항트립신 결핍(폐기종) 치료를 위한 알파-1 항트립신; 지중해 빈혈 또는 신부전으로 인한 빈혈 치료를 위한 에리스로포이에틴; 허혈성 질환 치료를 위한 혈관 내피 성장 인자, 안지오포이에틴-1 및 섬유아세포 성장 인자; 예를 들어 죽상경화증, 혈전증 또는 색전증에서 볼 수 있는 폐색된 혈관의 치료를 위한 트롬보모듈린 및 조직 인자 경로 억제제; 파킨슨병 치료를 위한 방향족 아미노산 탈탄산효소(AADC) 및 티로신 수산화효소(TH)가 포함되나 이에 제한되지 않는다.
본원에서 제공되는 조성물 및 표적 전달에 유용한 단백질 및 화합물의 예는 치료 단백질 및 기타 화합물 및 다음의 호흡기 관련 감염 질환의 백신 단백질 유도체 및 이러한 감염 질환에 대한 직접적인 수동 면역글로불린을 포함한다. 적합한 치료 단백질의 예는 예를 들어 알파-1-항트립신, 낭포성 섬유증 막관통 단백질 및 이의 변이체, 계면활성제-B, 골형성 단백질 수용체 유형 II(폐동맥 고혈압과 관련됨) 및 다양한 암 치료제를 포함한다.
적합한 백신 또는 수동 면역화의 예에는 중증급성호흡기증후군(SARS-CoV1), 일반 감기 및 A형, B형 또는 C형 이외의 간염과 관련이 있는 인간 호흡기 코로나바이러스를 포함하여 공기 중 병원체에서 유래한 단백질이 포함된다. SARS-CoV2는 COVID-19의 원인 병원체이며 이 바이러스에 특이적인 항체가 설명되었다. SARS-CoV2의 인간 ACE2의 스파이크 단백질에 결합하는 데 유용하고 중화 활성을 갖는 것으로 기술된 IgG 항체의 예는 예를 들어 LY-CoV555 (Eli Lilly), TY027 (Tychon), STI-1499 및 STI-2020 (COVI-GUARD; Sorrento), 80R, ADI055689/56046 (Adimab) (Renn 등, Trends in Pharmacological Sciences, 2020); BD-217, BD-218, BD-236 (Cao 등, Cell, 182, 73-84 (2020))를 포함한다. SARS-COV2의 인간 ACE2의 수용체 결합 도메인(RBD)에 결합하는 데 유용하고 중화 활성을 갖는 것으로 기술된 IgG 항체의 예는 예를 들어 COV2-2196, COV2-2130, COV2-2165 (Zost 등, Nature, 584, 443-465 (2020)); BD-361, BD-368, BD-368-2 (Cao 등, Cell, 182, 73-84 (2020)); B38, H4 (Y. Wu 등, Science 10.1126/science.abc2241 (2020); Jahanshahlu 및 Rezaei, Biomedicine and Pharmacotherapy 129 (2020)); S309, S315, S304(Pinto 등, Nature, 583, 290-311 (2020)); CC6.29, CC6.30, CC6.33, CC12.1, CC12.3(Rogers 등, Science 369, 956-963 (2020)); JS016(일라이 릴리), CA1, CB6-LALA, P2C-1F11/P2B-2F6/P2A-1A3, 311mab-31B5311/32D4, COVA 2-15, 414-1, (Renn 등., Trends in Pharmacological Sciences, 2020)를 포함한다. SARS-COV1의 인간 ACE2의 스파이크 단백질에 결합하는 데 유용하고 중화 활성을 갖는 것으로 기술된 IgG 항체의 예는 예를 들어 m396 및 CR3104(Prabakaran 등, Journal of Biological Chemistry, 281, 15829-15836 (2006); ter Meulen 등, PLoS, 3, 7 (2006))을 포함한다. SARS-COV1 및 SARS-CoV2 모두의 RBD 또는 인간 ACE2의 스파이크 단백질에 결합하는 데 유용하고 중화 활성을 갖는 것으로 기술된 IgG 항체의 예는 예를 들어 CR3022 및 47D11(Wang 등, Nature Communications, 11, nature.com/naturecommunications (2020))을 포함한다.
다른 표적 바이러스의 예는 인플루엔자 A, 인플루엔자 B 및 인플루엔자 C를 포함하는 오르토믹소바이러스과의 인플루엔자 바이러스를 포함한다. 유형 A 바이러스는 가장 치명적인 인간 병원체이다. 전염병과 관련된 인플루엔자 A의 혈청형에는 1918년 스페인 독감과 2009년 돼지 독감을 일으킨 H1N1; 1957년 아시아 독감을 일으킨 H2N2; 1968년 홍콩 독감을 일으킨 H3N2; 2004년에 조류 독감을 일으킨 H5N1; H7N7; H1N2; H9N2; H7N2; H7N3; 및 H10N7이 포함된다. 인플루엔자 A에 대한 광범위한 중화 항체가 설명되었다. 본원에서 사용되는 바와 같이, "광범위한 중화 항체"는 다수의 아형으로부터 다수의 균주를 중화시킬 수 있는 중화 항체를 의미한다. 예를 들어, CR6261[The Scripps Institute/Crucell]은 1918년 "스페인 독감"(SC1918/H1)을 포함한 광범위한 인플루엔자 바이러스와 2004년 베트남에서 닭에서 인간으로 점프한 조류 인플루엔자(Viet04/H5)의 H5N1 클래스 바이러스에 결합하는 단일 클론 항체로 설명되었다. CR6261은 인플루엔자 바이러스 표면의 우세한 단백질인 헤마글루티닌의 막 근위 줄기에서 고도로 보존된 나선형 영역을 인식한다. 이 항체는 본원에 참고로 포함된 WO 2010/130636에 기술되어 있다. 또 다른 중화 항체인 F10[XOMA Ltd]는 H1N1 및 H5N1에 대해 유용한 것으로 설명되었다. [Sui 등, Nature Structural and Molecular Biology (Sui, 등 2009, 16(3):265-73)] 인플루엔자에 대한 다른 항체, 예를 들어 Fab28 및 Fab49가 선택될 수 있다. 예를 들어, 참고로 포함된 WO 2010/140114 및 WO 2009/115972를 참조한다. WO 2010/010466, 미국 공개 특허 공개 US/2011/076265 및 WO 2008/156763에 기술된 것과 같은 또 다른 항체가 쉽게 선택될 수 있다.
다른 표적 병원성 바이러스에는 아레나바이러스(후닌, 마추포 및 라사 포함), 필로바이러스(마르버그 및 에볼라 포함), 한타바이러스, 피코르노바이러스과(라이노바이러스, 에코바이러스 포함), 코로나바이러스, 파라믹소바이러스, 모르빌리바이러스, 호흡기 세포융합 바이러스, 토가바이러스, 콕사키바이러스, 파보바이러스 B19, 파라인플루엔자, 아데노바이러스, 리오바이러스, 천연두(중증형(두창)) 및 폭스바이러스 계열의 백시니아(우두) 및 수두-대상포진(가성광견병)이 포함된다. 바이러스성 출혈열은 아레나바이러스 계열(라사열)(이 계열은 림프구성 맥락수막염(LCM)과도 관련이 있음), 필로바이러스(에볼라 바이러스) 및 한타바이러스(퓨레말라)에 의해 발생한다. 피코르나바이러스(라이노바이러스의 아과)의 구성원은 인간의 감기와 관련이 있다. 전염성 기관지염 바이러스(가금류), 돼지 전염성 위장병 바이러스(돼지), 돼지 혈구응집소 뇌척수염 바이러스(돼지), 고양이 전염성 복막염 바이러스(고양이), 고양이 장 코로나바이러스(고양이), 개 코로나바이러스(개)와 같은 다수의 비인간 바이러스를 포함하는 코로나바이러스 계열. 파라믹소바이러스 계열에는 파라인플루엔자 바이러스 1형, 파라인플루엔자 바이러스 3형, 소 파라인플루엔자 바이러스 3형, 루벨라바이러스(볼거리 바이러스, 파라인플루엔자 바이러스 2형, 파라인플루엔자 바이러스 4형, 뉴캐슬병 바이러스(닭), 우역, 홍역 및 개 홍역을 포함하는 모르빌리바이러스 및 호흡기 세포융합 바이러스(RSV)를 포함하는 뉴모바이러스가 포함된다. 파보바이러스 계열에는 고양이 파보바이러스(고양이 장염), 고양이 범백혈구 감소증 바이러스, 개 파보바이러스 및 돼지 파보바이러스가 포함된다. 아데노바이러스 계열에는 호흡기 질환을 일으키는 바이러스(EX, AD7, ARD, O.B.)가 포함된다.
박테리아 병원체에 대한 중화 항체 작제물이 또한 본 발명에서 사용하기 위해 선택될 수 있다. 일 구체예에서, 중화 항체 작제물은 박테리아 자체에 대해 지시된다. 또 다른 구체예에서, 중화 항체 작제물은 박테리아에 의해 생성된 독소에 대해 지시된다. 공기 중 박테리아 병원체의 예는 예를 들어, 나이세리아 수막염(수막염), 클렙시엘라 슈모니아(폐렴), 슈도모나스 애루기노사(폐렴), 슈도모나스 슈도말레이(폐렴), 슈도모나스 말레이(폐렴), 아시네토박터(폐렴), 모락셀라 카타랄리스, 모락셀라 라쿠나타, 알칼리겐, 카디오박테리움, 헤모필루스 인플루엔자(독감), 헤모필루스 파라인플루엔자에, 보르데텔라 퍼투시스(백일해), 프란시셀라 툴라렌시스(폐렴/발열), 레지오넬라 슈모니아(재향군인병), 클라미디아 시타시(폐렴), 클라미디아 슈모니아(폐렴), 마이코박테리움 투베르쿨로시스(결핵(TB)), 마이코박테리움 칸사시(TB), 마이코박테리움 아비움 (폐렴), 노카르디아 아스테로이드(폐렴), 바실러스 안트라시스(탄저균), 스타필로코커스 아우레우스 (폐렴), 스트렙토코커스 표진스(성홍열), 스트렙토코커스 슈모니애(폐렴), 코리네박테리아 디프테리아(디프테리아), 마이코플라즈마 슈모니애(폐렴)을 포함한다. 탄저병의 원인 물질은 바실러스 안트라시스가 생성하는 독소이다. 톡소이드를 형성하는 3개의 펩티드 중 하나인 보호제(PA)에 대한 중화 항체가 기술되었다. 다른 두 폴리펩티드는 치사 인자(LF)와 부종 인자(EF)로 구성된다. 항-PA 중화 항체는 탄저병에 대한 수동 면역화에 효과적인 것으로 기술되었다. 예를 들어 미국 특허 번호 7,442,373; R. Sawada-Hirai 등, J Immune Based Ther Vaccines. 2004; 2: 5를 참조한다. (온라인 2004년 5월 12일). 또 다른 항-탄저 독소 중화 항체가 기술되었고/되거나 생성될 수 있다. 마찬가지로, 다른 박테리아 및/또는 박테리아 독소에 대한 중화 항체를 사용하여 본원에 기술된 비-IgG 항체를 생성할 수 있다.
다른 감염성 질병은 예를 들어, 아스페르길루스 종, 압시디아 코림비페라, 릭퍼스 스톨로니퍼, 무코르 플럼베우스, 크립토코쿠스 네오포르만스, 히스토플라즘 캡슐라텀, 블라스토마이스 더마티티디스, 콕시디오이데스 임미티스, 페니실리움 종, 마이크로폴리스포라 패니, 써모악티노마이세스 불가리스, 알터나리아 알터네이트, 클라도스포리움 종, 헬민토스포리움, 및 스타치보트리스 종을 포함한 공기 중 진균에 의해 발생할 수 있다.
인간에게 영향을 미치는 공기 감염성 질병 상태에 더하여, 그 중 다수는 위에 설명되어 있고, 본 발명에 따른 수동 면역화는 비강의 직접적인 접종과 관련된 상태, 예를 들어 손가락과 비강의 직접적인 접촉에 의해 전염될 수 있는 상태를 예방하기 위해 사용될 수 있다. 이러한 조건에는 진균 감염(예를 들어, 무좀), 백선 또는 바이러스, 박테리아, 기생충, 진균 및 직접 접촉으로 전염될 수 있는 기타 병원체가 포함될 수 있다. 또한, 가정용 애완동물, 소 및 기타 가축 및 기타 동물에 영향을 미치는 다양한 조건. 예를 들어, 개에서 개 부비동 아스페르길루스증에 의한 상기도 감염은 심각한 질병을 유발한다. 고양이의 경우, 코에서 발생하는 상부 호흡기 질환 또는 고양이 호흡기 질환 복합체를 치료하지 않고 방치하면 이환율과 사망을 유발한다. 소는 전염성 소 비기관염(일반적으로 IBR 또는 빨간 코라고 함)에 의해 감염되기 쉽다. 소의 급성 전염성 바이러스 질병이다. 또한 소는 경증에서 중증의 호흡기 질환을 유발하고 다른 질병에 대한 내성을 손상시킬 수 있는 소 호흡기 세포융합 바이러스(BRSV)에 걸리기 쉽다. 또 다른 병원체 및 질병은 당업자에게 자명할 것이다.
본원에서 구체적으로 확인된 것과 같은 병원체에 대한 항체(예를 들어, 항SARS-CoV2, 항SARS-CoV1, 항인플루엔자, 항에볼라, 항RSV), 특히 중화 항체는 클래스 전환 또는 비-IgG 항체를 생성하는 데 사용될 수 있다. 광범위한 중화 능력을 가진 단일 클론 항체(mAb)는 항체 파지 디스플레이를 사용하여 최근에 계절성 독감 백신을 접종한 기증자, 면역이 없는 인간 또는 자연 감염의 생존자로부터 라이브러리를 스크리닝하여 식별할 수 있다. 인플루엔자의 경우, 숙주 세포와의 바이러스 융합을 차단하여 하나 이상의 인플루엔자 아형을 중화시키는 항체가 확인되었다. 이 기술은 중화 단일 클론 항체를 얻기 위해 다른 감염과 함께 활용될 수 있다. 예를 들어, 항호흡기 세포융합 바이러스(RSV) 중화 항체의 생성을 설명하는 US 5,811,524를 참조한다. 본원에 기술된 기술은 다른 병원체에 적용할 수 있다. 이러한 항체는 그대로 사용하거나 인공 또는 재조합 중화 항체 작제물을 생성하기 위해 변형된 이의 서열(스캐폴드)을 사용할 수 있다. 이러한 방법은 [예를 들어, WO 2010/13036; WO 2009/115972; WO 2010/140114]에 설명되어 있다. 일 구체예에서, 마우스, 래트, 햄스터 또는 다른 숙주 동물은 면역화 항원에 대한 결합 특이성을 갖는 항체를 생산하는 림프구를 생성하기 위해 면역화제로 면역화된다. 대안적인 접근법에서, 림프구는 시험관 내에서 면역화될 수 있다. 인간 항체는 파지 디스플레이 라이브러리와 같은 기술을 사용하여 생산할 수 있다(Hoogenboom 및 Winter, J. Mol. Biol, 1991, 227:381, Marks 등, J. Mol. Biol. 1991, 222:581).
조성물 및 용도
적어도 하나의 rAAV 스톡(예를 들어, rAAV9 또는 rAAVhu68 돌연변이 스톡) 및 선택적 담체, 부형제 및/또는 보존제를 함유하는 조성물이 본원에서 제공된다. rAAV 스톡은 예를 들어 농도 및 용량 단위의 논의에서 하기 기술된 양과 같이 동일한 다수의 rAAV 벡터를 지칭한다.
특정 구체예에서, 조성물은 적어도 제2의 상이한 rAAV 스톡을 함유할 수 있다. 이 두 번째 벡터 스톡은 다른 AAV 캡시드 및/또는 다른 벡터 게놈을 가짐으로써 첫 번째 스톡과 다를 수 있다. 특정 구체예에서, 본원에 기재된 바와 같은 조성물은 본원에 기재된 바와 같은 발현 카세트를 발현하는 상이한 벡터 또는 또 다른 활성 성분(예를 들어, 항체 작제물, 또 다른 생물제제 및/또는 소분자 약물)을 함유할 수 있다.
본원에서 사용되는 "담체"는 모든 용매, 분산 매질, 비히클, 코팅, 희석제, 항균제 및 항진균제, 등장성 및 흡수 지연제, 완충액, 담체 용액, 현탁액, 콜로이드 등을 포함한다. 약제학적 활성 물질에 대한 이러한 매질 및 제제의 사용은 당업계에 잘 알려져 있다. 보충 활성 성분이 또한 조성물에 혼입될 수 있다. "약제학적으로 허용되는"이라는 어구는 숙주에 투여될 때 알레르기 반응 또는 이와 유사한 원치 않는 반응을 일으키지 않는 분자 실체 및 조성물을 의미한다. 리포좀, 나노캡슐, 미세입자, 미세구, 지질 입자, 소포 등과 같은 전달 비히클은 본 발명의 조성물을 적합한 숙주 세포로 도입하기 위해 사용될 수 있다. 특히, rAAV 벡터 전달된 이식유전자는 지질 입자, 리포좀, 소포, 나노구 또는 나노입자 등에 캡슐화된 전달을 위해 제형화될 수 있다.
일 구체예에서, 조성물은 대상체에게 전달하기에 적합한 최종 제형을 포함하며, 예를 들어 생리학적으로 적합한 pH 및 염 농도로 완충된 수성 액체 현탁액이다. 선택적으로 하나 이상의 계면활성제가 제형에 존재한다. 다른 구체예에서, 조성물은 대상체에게 투여하기 위해 희석되는 농축물로서 수송될 수 있다. 다른 구체예에서, 조성물은 동결건조되고 투여 시점에 재구성될 수 있다.
적합한 계면활성제 또는 계면활성제의 조합은 비독성인 비이온성 계면활성제 중에서 선택될 수 있다. 일 구체예에서, 1차 히드록실기에서 종결되는 이작용기성 블록 공중합체 계면활성제가 선택되며, 예를 들어 중성 pH를 갖고 8400의 평균 분자량을 갖는 Pluronic® F68[BASF](폴록사머 188로도 알려짐)이 선택된다. 다른 계면활성제 및 다른 폴록사머, 즉 폴리옥시에틸렌(폴리(에틸렌 옥사이드)), SOLUTOL HS 15(마크로골-15 히드록시스테아레이트), LABRASOL(폴리옥시 카프릴릭 글리세라이드), 폴리옥시 10 올레일 에테르, TWEEN(폴리옥시에틸렌 소르비탄 지방산 에스테르), 에탄올 및 폴리에틸렌 글리콜 의 2개의 친수성 사슬이 측접한 폴리옥시프로필렌(폴리(프로필렌 옥사이드))의 중심 소수성 사슬로 구성된 비이온성 삼블록 공중합체가 선택될 수 있다. 일 구체예에서, 제형은 폴록사머를 함유한다. 이러한 공중합체는 일반적으로 문자 "P"(폴록사머의 경우) 뒤에 3자리 숫자로 명명된다. 처음 두 자리 x 100은 폴리옥시프로필렌 코어의 대략적인 분자량을 나타내고 마지막 숫자 x 10은 폴리옥시에틸렌 함량의 백분율을 나타낸다. 일 구체예에서 폴록사머 188이 선택된다. 계면활성제는 현탁액의 약 0.0005% 내지 약 0.001%까지의 양으로 존재할 수 있다.
일 구체예에서, 제형 완충액은 총 염 농도가 200mM, 0.001%(w/v) 플루로닉 F68(최종 제형 완충액, FFB)인 인산염 완충 식염수(PBS)이다.
벡터는 세포를 형질감염시키고 충분한 수준의 유전자 전달 및 발현을 제공하기에 충분한 양으로 투여되어 과도한 역효과 없이 또는 의학적으로 허용되는 생리학적 효과를 갖는 치료적 이점을 제공하며, 이는 의학 분야의 숙련자에 의해 결정될 수 있다. 특정 구체예에서, 벡터는 비강 및/또는 비인두 상피 세포로의 표적 전달을 위한 비강내 전달 장치를 통한 전달을 위해 제형화된다. 특정 구체예에서, 벡터는 에어로졸 전달 장치용으로, 예를 들어 분무기 또는 다른 적합한 장치를 통해 제형화된다. 다른 통상적이고 약제학적으로 허용되는 투여 경로는 원하는 기관(예를 들어, 폐), 경구 흡입, 척수강내, 기관내, 동맥내, 안구내, 정맥내, 근육내, 피하, 피내 및 기타 비경구 투여 경로로의 직접 전달을 포함하지만 이에 제한되지 않는다. 일 구체예에서, 벡터는 비강 점막 분무화 장치(LMA® MAD Nasal™- MAD110)를 사용하여 비강내로 투여된다. 다른 구체예에서 벡터는 Vibrating Mesh Nebulizer(Aerogen® 단독) 또는 MADgic™ Laryngeal Mucosal Atomizer를 사용하여 분무된 형태로 폐내 투여된다. 원하는 경우 투여 경로를 조합할 수 있다. rAAV 벡터를 전달하기 위한 투여 경로 및 이용 경로는 다음의 공개된 미국 특허 출원에도 기술되어 있으며, 각각의 내용은 전문이 본원에 참조로 포함된다: US 2018/0155412A1, US 2018/0243416A1, US 2014/0031418 A1 및 US 2019/0216841A1.
바이러스 벡터의 용량은 주로 치료되는 상태, 환자의 연령, 체중 및 건강과 같은 요인에 따라 달라지므로 환자마다 다를 수 있다. 예를 들어, 바이러스 벡터의 치료학적으로 유효한 인간 투여량은 일반적으로 약 109 내지 4x1014 GC의 AAV 벡터를 함유하는 약 25 내지 약 1000 마이크로리터 내지 약 5 mL의 수성 현탁액 범위이다. 투여량은 임의의 부작용에 대한 치료적 이점의 균형을 맞추도록 조정될 것이며 이러한 투여량은 재조합 벡터가 사용되는 치료 적용에 따라 달라질 수 있다. 이식유전자의 발현 수준은 바이러스 벡터, 바람직하게는 미니유전자를 함유하는 AAV 벡터를 초래하는 투여 빈도를 결정하기 위해 모니터링될 수 있다. 선택적으로, 치료 목적을 위해 기술된 것과 유사한 투여 요법이 본 발명의 조성물을 사용하는 면역화에 이용될 수 있다.
복제-결함 바이러스 조성물은 범위 내의 모든 정수 또는 분수, 바람직하게는 인간 환자의 경우 1012 GC 내지 1014 GC를 포함하는 약 109 GC 내지 약 1016 GC(체중 70kg의 평균 대상체를 치료하기 위해)의 범위인 복제-결함 바이러스의 양을 함유하도록 용량 단위로 제형화될 수 있다. 일 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수 양을 포함하여 용량당 적어도 109, 2x109, 3x109, 4x109, 5x109, 6x109, 7x109, 8x109, 또는 9x109 GC를 함유하도록 제형화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 부분량을 포함하여 용량당 적어도 1010, 2x1010, 3x1010, 4x1010, 5x1010, 6x1010, 7x1010, 8x1010, 또는 9x1010 GC를 함유하도록 제형화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 부분량을 포함하여 용량당 적어도 1011, 2x1011, 3x1011, 4x1011, 5x1011, 6x1011, 7x1011, 8x1011, 또는 9x1011 GC를 함유하도록 제형화된다. 또 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 부분량을 포함하여 용량당 적어도 1012, 2x1012, 3x1012, 4x1012, 5x1012, 6x1012, 7x1012, 8x1012, or 9x1012 GC를 함유하도록 제형화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 부분량을 포함하여 용량당 적어도 1013, 2x1013, 3x1013, 4x1013, 5x1013, 6x1013, 7x1013, 8x1013, 또는 9x1013 GC를 함유하도록 제형화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 부분량을 포함하여 용량당 적어도 1014, 2x1014, 3x1014, 4x1014, 5x1014, 6x1014, 7x1014, 8x1014, 또는 9x1014 GC를 함유하도록 제형화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 부분량을 포함하여 용량당 적어도 1015, 2x1015, 3x1015, 4x1015, 5x1015, 6x1015, 7x1015, 8x1015, 또는 9x1015 GC를 함유하도록 제형화된다. 일 구체예에서, 인간 적용을 위한 용량은 범위 내의 모든 정수 또는 분수 양을 포함하여 용량당 1010 내지 약 1012 GC 범위일 수 있다. 일 구체예에서, 인간 적용을 위한 용량은 범위 내의 모든 정수 또는 소수량을 포함하여 용량당 109 내지 약 7x1013 GC 범위일 수 있다. 일 구체예에서, 인간 적용을 위한 용량 범위는 6.25x1012 GC 내지 5.00x1013 GC이다. 추가 구체예에서, 용량은 약 6.25x1012 GC, 약 1.25x1013 GC, 약 2.50x1013 GC, 또는 약 5.00x1013 GC이다. 특정 구체예에서, 용량은 절반으로 균등하게 분할되어 각각의 콧구멍에 투여된다. 특정 구체예에서, 인간 적용을 위한 용량 범위는 6.25x1012 GC 내지 5.00x1013 GC이며 각 피험자에게 전달되는 총 부피 0.8ml에 대해 콧구멍당 0.2ml의 2개의 분취량으로 투여된다.
이러한 상기 용량은 약 25 내지 약 1000 마이크로리터 또는 그 이상의 부피 범위의 다양한 부피의 담체, 부형제 또는 완충제 제형으로 투여될 수 있고, 치료할 영역의 크기, 사용된 바이러스 역가, 투여 경로 및 방법의 원하는 효과에 따라 범위 내의 모든 숫자를 포함한다. 일 구체예에서, 담체, 부형제 또는 완충제의 부피는 적어도 약 25μL이다. 일 구체예에서, 부피는 약 50μL이다. 다른 구체예에서, 부피는 약 75μL이다. 다른 구체예에서, 부피는 약 100μL이다. 다른 구체예에서, 부피는 약 125μL이다. 다른 구체예에서, 부피는 약 150μL이다. 또 다른 구체예에서, 부피는 약 175μL이다. 또 다른 구체예에서, 부피는 약 200μL이다. 다른 구체예에서, 부피는 약 225μL이다. 또 다른 구체예에서, 부피는 약 250μL이다. 또 다른 구체예에서, 부피는 약 275μL이다. 또 다른 구체예에서, 부피는 약 300μL이다. 또 다른 구체예에서, 부피는 약 325μL이다. 또 다른 구체예에서, 부피는 약 350μL이다. 다른 구체예에서, 부피는 약 375μL이다. 다른 구체예에서, 부피는 약 400μL이다. 다른 구체예에서, 부피는 약 450μL이다. 다른 구체예에서, 부피는 약 500μL이다. 다른 구체예에서, 부피는 약 550μL이다. 다른 구체예에서, 부피는 약 600μL이다. 또 다른 구체예에서, 부피는 약 650μL이다. 다른 구체예에서, 부피는 약 700μL이다. 다른 구체예에서, 부피는 약 700 내지 1000μL이다.
특정 구체예에서, 재조합 벡터는 각각의 콧구멍에 2개의 스프레이를 사용함으로써 비강내 투여될 수 있다. 일 구체예에서, 2개의 스프레이는 각각의 콧구멍에 교대로, 예를 들어 왼쪽 콧구멍 스프레이, 오른쪽 콧구멍 스프레이, 이어서 왼쪽 콧구멍 스프레이, 오른쪽 콧구멍 스프레이로 투여된다. 특정 구체예에서, 교대 스프레이 사이에 지연이 있을 수 있다. 예를 들어, 각각의 콧구멍은 약 10 내지 60초, 또는 20 내지 40초, 또는 약 30초 내지 몇 분 또는 그 이상의 간격으로 분리된 다수의 스프레이를 수용할 수 있다. 이러한 스프레이는 약 200μL 내지 약 600μL, 400μL 내지 700μL, 또는 450μL 내지 1000μL의 투여된 총 부피를 달성하기 위해 예를 들어 각 스프레이에서 약 150μL 내지 300μL 또는 약 250μL를 전달할 수 있다.
특정 구체예에서, 재조합 AAV 벡터는 투약 후 비강 세척 용액에서 측정될 때 5-20 ng/ml의 이식유전자 발현 산물 농도를 달성하기 위해 비강내로 예를 들어, 벡터 투여 후 1주 내지 4주, 또는 약 2주 후 투약될 수 있다. 이식유전자의 발현 산물의 정량화 방법뿐만 아니라 피험자에서 비강 세척액을 얻는 방법은 통상적이다.
다른 투여 경로(예를 들어, 정맥내 또는 근육내)의 경우 용량 수준은 비강내 전달보다 높을 것이다. 예를 들어, 이러한 현탁액은 약 2.5x1015 GC까지의 용량을 갖는 약 1mL 내지 약 25mL의 부피 용량일 수 있다.
특정 구체예에서, 비강내 전달 장치는 약 30미크론 내지 약 100미크론 크기의 평균 크기 범위를 갖는 미스트 입자를 전달하는 스페이 분무기를 제공한다. 특정 구체예에서, 평균 크기 범위는 약 10미크론 내지 약 50미크론이다. 적합한 장치는 문헌에 기술되어 있으며 일부는 예를 들어 LMA MAD NASAL™(Teleflex Medical, 아일랜드); Teleflex VaxINator™(Teleflex Medical, 아일랜드); Kurve Technologies의 Controlled Particle Dispersion®(CPD)와 같이 상업적으로 이용 가능하다. 또한 PG Djupesland, Drug Deliv and Transl. Res (2013) 3: 42-62를 참조한다. 특정 구체예에서, 비강 상피 세포를 우선적으로 표적화하고 폐로의 표적화를 최소화하기 위해 입자 크기 및 전달 부피를 제어한다. 다른 구체예에서, 미스트 입자는 폐 세포에 전달하기 위해 약 0.1 마이크론 내지 약 20 마이크론 이하이다. 이러한 더 작은 입자 크기는 비강 상피의 체류를 최소화할 수 있다.
한 장치는 약 16미크론에서 약 22미크론의 평균 직경으로 입자를 분무한다. 미스트는 3.5mm 굴곡성 광섬유 기관지경(Olympus, Melville, NY)의 흡입 채널을 통해 삽입된 기관지 나무에 직접 전달될 수 있다. 다른 적합한 전달 장치는 성대를 지나 상기도를 가로질러 투여하기 위해 제공되는 후두-기관 점막 분무기를 포함할 수 있다. 그것은 성대를 통해 후두 마스크 또는 비강으로 들어간다. 액적은 약 30미크론 내지 약 100미크론의 평균 직경으로 원자화된다. 표준 장치는 팁 직경이 약 0.18인치(4.6mm)이고 길이가 약 4.5-8.5인치이며 흡입 채널을 통해 삽입되고 스코프의 원위 팁을 넘어 약 3mm 전진한다. 용량은 오른쪽 및 왼쪽 주 줄기 기관지에 분무된 식염수 또는 rAAV를 사용하여 대조군의 10 분취량(각각 약 150 μl)으로 투여될 수 있다.
일 구체예에서, 본원에 기술된 바와 같은 완충액 중에 rAAV를 동결 형태로 함유하는 동결 조성물이 제공된다. 임의로, 하나 이상의 계면활성제(예를 들어, 플로로닉 F68), 안정제 또는 방부제가 이 조성물에 존재한다. 적합하게는, 사용을 위해 조성물을 해동하고 적합한 희석제, 예를 들어 멸균 식염수 또는 완충 식염수를 사용하여 원하는 용량으로 적정한다.
일 구체예에서, 모티프 N- x- (T/I/V/A)- (K/R)(서열번호 47)로부터의 하나 이상의 외인성 내피 세포 표적화 펩티드 및 임의의 측접 링커 서열을 포함하는 조성물이 하나 이상의 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스와 함께 제공된다. 이를 인코딩하는 핵산 서열을 포함하는 조성물이 추가로 제공된다. 특정 구체예에서, 표적화 펩티드는 서열번호 40이고 서열번호 54의 핵산 서열 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 38이고 서열번호 50의 핵산 서열 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 46이고 서열번호 56의 핵산 서열 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 43이고 서열번호 52의 핵산 서열, 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 39이고 서열번호 55의 핵산 서열 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 42이고 서열번호 51의 핵산 서열 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 41이고 서열번호 53의 핵산 서열 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다.
다른 구체예에서, 모티프 N- x- (T/I/V/A)- (K/R) (서열번호 47)로부터의 하나 이상의 외인성 뇌 내피 세포 표적화 펩티드를 포함하는 융합 폴리펩티드 또는 단백질이 제공되며, 적어도 하나의 폴리펩티드 또는 단백질을 포함하는 융합 파트너가 제공된다. 이를 인코딩하는 핵산 서열이 추가로 제공된다.
특정 구체예에서, 융합 폴리펩티드 또는 단백질, 또는 융합 폴리펩티드 또는 단백질을 인코딩하는 핵산 서열, 또는 이를 함유하는 나노입자를 포함하는 조성물이 제공된다. 조성물은 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스 중 하나 이상을 추가로 포함할 수 있다.
특정 구체예에서, 융합 폴리펩티드 단백질을 인코딩하는 핵산 서열은 지질 나노입자(LNP)에 캡슐화된다. 본원에서 사용되는 "지질 나노입자" 또는 "나노입자"라는 어구는 하나 이상의 지질(예를 들어, 양이온성 지질, 비양이온성 지질 및 PEG-변성 지질)을 포함하는 전달 비히클을 의미한다. 바람직하게는, 지질 나노입자는 하나 이상의 표적 세포(예를 들어, 간 및/또는 근육)에 하나 이상의 핵산 서열을 전달하도록 제형화된다. 적합한 지질의 예는 예를 들어 포스파티딜 화합물(예를 들어, 포스파티딜글리세롤, 포스파티딜콜린, 포스파티딜세린, 포스파티딜에탄올아민, 스핑고지질, 세레브로시드 및 강글리오시드)을 포함한다. 단독으로 또는 다른 전달 비히클과 함께 폴리머를 전달 비히클로 사용하는 것도 고려된다. 적합한 중합체는 예를 들어 폴리아크릴레이트, 폴리알킬시아노아크릴레이트, 폴리락티드, 폴리락티드-폴리글리콜라이드 공중합체, 폴리카프로락톤, 덱스트란, 알부민, 젤라틴, 알기네이트, 콜라겐, 키토산, 사이클로덱스트린, 덴드리머 및 폴리에틸렌이민을 포함할 수 있다. 일 구체예에서, 전달 비히클은 그 안에 캡슐화된 핵산 서열의 표적 세포로의 형질감염을 용이하게 하는 능력에 기초하여 선택된다. 핵산 서열에 유용한 지질 나노입자는 단백질 생산을 위한 창고로서 작용할 표적 세포로의 이러한 핵산 서열의 전달을 캡슐화 및/또는 향상시키기 위한 양이온성 지질을 포함한다. 본원에서 사용되는 "양이온성 지질"이라는 어구는 생리학적 pH와 같은 선택된 pH에서 알짜 양전하를 갖는 임의의 다수의 지질 종을 의미한다. 고려되는 지질 나노입자는 하나 이상의 양이온성 지질, 비양이온성 지질 및 PEG-변성 지질을 사용하는 다양한 비율의 다성분 지질 혼합물을 포함함으로써 제조될 수 있다. 여러 양이온성 지질이 문헌에 기재되어 있으며, 이들 중 다수는 상업적으로 입수가능하다. 예를 들어 WO2014/089486, US 2018/0353616A1 및 US 8,853,377B2를 참조한다. 특정 구체예에서, LNP 제형은 콜레스테롤, 이온화 지질, 헬퍼 지질, PEG-지질 및 캡슐화된 핵산 서열 주위에 지질 이중층을 형성하는 중합체를 포함하는 일상적인 절차를 사용하여 수행된다(Kowalski 등, 2019, Mol. Ther. 27(4):710-728). 일부 구체예에서, LNP는 헬퍼 지질 DOPE와 함께 양이온성 지질(즉, N-[1-(2,3-디올레오일옥시)프로필]-N,N,N-트리메틸암모늄 클로라이드(DOTMA) 또는 1,2-디올레오일-3-트리메틸암모늄-프로판(DOTAP))을 포함한다. 일부 구체예에서, LNP는 이온화 지질 Dlin-MC3-DMA 이온화 지질, 또는 디케토피페라진계 이온화 지질(cKK-E12)을 포함한다. 일부 구체예에서, 중합체는 폴리에틸렌이민(PEI) 또는 폴리(β-아미노)에스테르(PBAE)를 포함한다. 예를 들어 WO2014/089486, US 2018/0353616A1, US2013/0037977A1, WO2015/074085A1, US9670152B2 및 US 8,853,377B2를 참조한다.
특정 구체예에서, 조성물, 예를 들어, N- x- (T/I/V/A)- (K/R)(서열번호 47) 펩티드 및 선택적 링커 서열, 융합 폴리펩티드 또는 단백질, 또는 나노입자 또는 화학 잔기를 포함하는 접합체가 있는 변형된 캡시드를 갖는 rAAV는 이를 환자에게 치료제를 전달하는 데 유용하다. 특정 구체예에서, 방법은 뇌 내피 세포에 대한 표적 요법을 위한 것이다. 특정 구체예에서, 상기 방법은 MCT8 단백질(예를 들어, UniProt ID No.: P36021) 또는 MCT8을 생체 내에서 발현하는 유전자를 전달함으로써 알란-헌돈-더들리병을 치료하기 위한 것이다. 다른 구체예에서, 상기 방법은 폐에 대한 표적 요법을 위한 것이다. 특정 구체예에서, 전달된 제품은 가용성 Ace2 단백질(예를 들어, hAce2 디코이 또는 hAce2 디코이 융합), 항-SARS 항체, 항-SARS-CoV2 항체, 항-인플루엔자 항체 또는 낭포성 섬유증 막관통 단백질이다. 또한 omim.org/entry/300523을 참조하며, 그 내용은 본원에 참조로 포함되어 있다. 또한, 본원에 참조로 포함된 2021년 1월 29일에 출원된 미국 가출원 번호 63/143,614, 2021년 3월 12일에 출원된 미국 가출원 번호 63/16 5 0,511 및 2021년 3월 26일에 출원된 미국 특허 출원 번호 63/166,686, 2021년 6월 25일에 출원된 미국 가출원 번호 63/215,159, 2021년 10월 8일에 출원된 미국 가출원 번호 63/253,654를 참조한다.
특정 구체예에서, 본원에 기재된 바와 같은 변형된 캡시드를 갖는 rAAV는 하나 이상의 다른 활성 성분을 추가로 포함하는 공동-치료 요법으로 전달될 수 있다. 특정 구체예에서, 요법은 면역조절 요소의 공동-투여를 수반할 수 있다. 이러한 면역조절 요법은 예를 들어 글루코코르티코이드, 스테로이드, 항대사물질, T-세포 억제제, 마크로라이드(예를 들어, 라파마이신 또는 라파로그), 및 알킬화제, 항대사물질, 세포독성 항생제, 항체 또는 면역필린 활성 작용제를 포함하는 세포증식억제제와 같은 면역억제제를 포함할 수 있지만 이에 제한되지 않는다. 면역억제제는 질소 머스타드, 니트로소우레아, 백금 화합물, 메토트렉세이트, 아자티오프린, 머캅토퓨린, 플루오로우라실, 닥티노마이신, 안트라사이클린, 미토마이신 C, 블레오마이신, 미트라마이신, IL-2 수용체-(CD25-) 또는 CD3-지시 항체, 항-IL-2 항체, 사이클로스포린, 타크로리무스, 시롤리무스, IFN-β, IFN-γ, 오피오이드 또는 TNF-α(종양 괴사 인자-알파) 결합제를 포함할 수 있다. 특정 구체예에서, 면역억제 요법은 유전자 요법 투여 전에 시작될 수 있다. 이러한 요법은 같은 날에 2개 이상의 약물(예를 들어, 프레드넬리손, 미코페놀레이트 모페틸(MMF) 및/또는 시롤리무스(즉, 라파마이신))의 병용 투여를 포함할 수 있다. 이러한 약물 중 하나 이상은 유전자 요법 투여 후 동일한 용량 또는 조정된 용량으로 계속 사용할 수 있다. 이러한 요법은 필요에 따라 약 1주, 약 15일, 약 30일, 약 45일, 60일 또는 그 이상 동안 있을 수 있다. 또 다른 공동-치료제는 예를 들어 항-AAV 항체를 고갈시키는 데 유용한 것으로 기술된 항-IgG 효소(따라서 선택된 AAV 캡시드에 대한 항체의 역치 수준 이상으로 시험하는 환자에게 투여를 허용할 수 있음), 및/또는 예를 들어, "Compositions and Methods for Treatment of Gene Therapy Patients"라는 제목으로 2020년 6월 17일에 출원된 미국 가출원 번호 63/040,381에 기재된 항-FcRN 항체의 전달, 및/또는 a) 스테로이드 또는 스테로이드의 조합 및/또는 (b) IgG 절단 효소, (c) Fc-IgE 결합 억제제; (d) Fc-IgM 결합 억제제; (e) Fc-IgA 결합 억제제; 및/또는 (f) 감마 인터페론을 포함할 수 있다.
항체 "Fc 영역"은 세포 표면 수용체(Fc 수용체)와 상호작용하는 항체 영역인 결정성 단편을 의미한다. 일 구체예에서, Fc 영역은 인간 IgG1 Fc이다. 일 구체예에서, Fc 영역은 인간 IgG2 Fc이다. 일 구체예에서, Fc 영역은 인간 IgG4 Fc이다. 일 구체예에서, Fc 영역은 조작된 Fc 단편이다. 예를 들어, Lobner, Elisabeth, 등 "Engineered IgG1-Fc-one fragment to bind them all." Immunological reviews 270.1 (2016): 113-131; Saxena, Abhishek, 및 Donghui Wu. "Advances in therapeutic Fc engineering-modulation of IgG-Associated effector functions and serum half-life." Frontiers in immunology 7 (2016); Irani, Vashti, 등 "Molecular properties of human IgG subclasses and their implications for designing therapeutic monoclonal antibodies against infectious diseases." Molecular immunology 67.2 (2015): 171-182; Rath, Timo, 등 "Fc-fusion proteins and FcRn: structural insights for longer-lasting and more effective therapeutics." Critical reviews in biotechnology 35.2 (2015): 235-254; 및 Invivogen, IgG-Fc Engineering For Therapeutic Use, invivogen.com/docs/Insight200605.pdf, April 2006를 참조하며, 이들 각각은 본 명세서에 참조로 포함된다.
항체 "힌지 영역"은 이황화 결합에 의해 이들 두 사슬을 연결하는 IgG 및 IgA 면역글로불린 클래스의 중쇄의 유연한 아미노산 부분이다.
"면역글로불린 분자"는 함께 공유 결합되고 항원과 특이적으로 결합할 수 있는 면역글로불린 중쇄 및 면역글로불린 경쇄의 면역학적 활성 부분을 함유하는 단백질이다. 면역글로불린 분자는 모든 유형(예를 들어, IgG, IgE, IgM, IgD, IgA 및 IgY), 클래스(예를 들어, IgG1, IgG2, IgG3, IgG4, IgA1 및 IgA2) 또는 하위 클래스이다. 용어 "항체" 및 "면역글로불린"은 본원에서 상호교환적으로 사용될 수 있다.
"면역글로불린 중쇄"는 면역글로불린의 항원 결합 도메인의 적어도 일부 및 면역글로불린 중쇄의 가변 영역의 적어도 일부 또는 면역글로불린 중쇄의 불변 영역의 적어도 일부를 포함하는 폴리펩티드이다. 따라서, 면역글로불린 유래 중쇄는 면역글로불린 유전자 슈퍼패밀리의 구성원과 아미노산 서열 상동성의 상당한 영역을 갖는다. 예를 들어, Fab 단편의 중쇄는 면역글로불린 유래 중쇄이다.
"면역글로불린 경쇄"는 면역글로불린의 항원 결합 도메인의 적어도 일부 및 면역글로불린 경쇄의 가변 영역의 적어도 일부 또는 불변 영역의 적어도 일부를 포함하는 폴리펩티드이다. 따라서, 면역글로불린 유래 경쇄는 면역글로불린 유전자 슈퍼패밀리의 구성원과 아미노산 상동성의 상당한 영역을 갖는다.
"중화 항체 역가"(NAb 역가)는 표적화된 에피토프(예를 들어, AAV)의 생리학적 효과를 중화시키는 중화 항체(예를 들어, 항-AAV NAb)가 생성되는 양의 측정치이다. 항-AAV NAb 역가는 예를 들어 Calcedo, R., 등, Worldwide Epidemiology of Neutralizing Antibodies to Adeno-Associated Viruses. Journal of Infectious Diseases, 2009, 199 (3): p. 381-390에 기재된 바와 같이 측정될 수 있으며, 본원에 참조로 포함된다.
본원에 사용된 바와 같이, vp 단백질의 "하위 집단"은 달리 명시되지 않는 한, 적어도 하나의 공통된 정의된 특징을 갖고 적어도 하나의 군 구성원 내지 참조 군의 모든 구성원 미만으로 구성되는 vp 단백질 그룹을 지칭한다. 예를 들어, vp1 단백질의 "하위 집단"은 달리 명시되지 않는 한 적어도 하나(1)의 vp1 단백질이고 조립된 AAV 캡시드의 모든 vp1 단백질보다 적다. 달리 명시되지 않는 한, vp3 단백질의 "하위 집단"은 하나(1)의 vp3 단백질 내지 조립된 AAV 캡시드의 모든 vp3 단백질 미만일 수 있다. 예를 들어, vp1 단백질은 vp 단백질의 하위 집단일 수 있고; vp2 단백질은 vp 단백질의 별도 하위 집단일 수 있으며; vp3은 조립된 AAV 캡시드에서 vp 단백질의 추가 하위 집단이다. 또 다른 예에서, vp1, vp2 및 vp3 단백질은 예를 들어 아스파라긴-글리신 쌍에서 예를 들어 적어도 1, 2, 3 또는 4개의 고도로 탈아미노화된 아스파라긴과 같이 상이한 변형을 갖는 하위 집단을 함유할 수 있다. 달리 명시되지 않는 한, 고도로 탈아미드화된 것은 참조 아미노산 위치에서 예측된 아미노산 서열과 비교하여 참조 아미노산 위치에서 최소 45% 탈아미드화, 최소 50% 탈아미드화, 최소 60% 탈아미드화, 최소 65% 탈아미드화, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 97%, 99%, 최대 약 100% 탈아미드화를 의미한다. 이러한 백분율은 2D-겔, 질량 분석 기술 또는 기타 적합한 기술을 사용하여 결정될 수 있다.
본원에서 사용되는 바와 같이, rAAV의 "스톡"은 rAAV의 집단을 의미한다. 탈아미드화로 인한 캡시드 단백질의 이질성에도 불구하고 스톡의 rAAV는 동일한 벡터 게놈을 공유할 것으로 예상된다. 스톡은 예를 들어 선택된 AAV 캡시드 단백질 및 선택된 생산 시스템의 특징적인 이종 탈아미드화 패턴을 갖는 캡시드를 갖는 rAAV를 포함할 수 있다. 재고는 단일 생산 시스템에서 생산되거나 생산 시스템의 여러 실행에서 풀링될 수 있다. 본원에 설명된 것을 포함하지만 이에 제한되지 않는 다양한 생산 시스템이 선택될 수 있다. 예를 들어, AAV9에 대한 탈아미드화 패턴을 제공하는 표 G를 포함하는 2019년 9월 6일에 공개된 WO 2019/168961 및 2018년 9월 7일에 출원된 WO 2020/160582를 참조한다. 또한, 예를 들어, 2020년 11월 5일에 공개된 WO 2020/223231(rh91, 탈아미드화 패턴을 갖는 표 포함), 2020년 8월 14일에 출원된 미국 가출원 특허 출원 번호 63/065,616 및 2020년 11월 4일에 출원된 미국 가출원 특허 출원 번호 63/109,734 및 2021년 8월 13일에 출원된 국제 특허 출원 번호 PCT/US21/45945를 참조하고, 이들은 모두 그 전문이 본원에 참조로 포함된다.
약어 "sc"는 자체 보완을 나타낸다. "자가-상보적 AAV"는 재조합 AAV 핵산 서열에 의해 운반되는 코딩 영역이 분자내 이중 가닥 DNA 주형을 형성하도록 디자인된 작제물을 지칭한다. 감염 시 두 번째 가닥의 세포 매개 합성을 기다리지 않고 scAAV의 상보적인 두 반쪽이 결합하여 즉각적인 복제 및 전사 준비가 된 하나의 이중 가닥 DNA(dsDNA) 단위를 형성한다. 예를 들어, D M McCarty 등, "Self-complementary recombinant adeno-associated virus (scAAV) vectors promote efficient transduction independently of DNA synthesis", Gene Therapy, (August 2001), Vol 8, Number 16, Pages 1248-1254를 참조한다. 자기-상보적 AAV는 예를 들어 미국 특허 번호 6,596,535; 7,125,717; 및 7,456,683에 기술되어 있으며, 이들 각각은 그 전문이 본 명세서에 참조로 포함된다.
본원에서 사용되는 바와 같이, "작동가능하게 연결된"이라는 용어는 관심 유전자와 인접한 발현 제어 서열 및 관심 유전자를 제어하기 위해 트랜스로 또는 일정 거리에서 작용하는 발현 제어 서열 모두를 의미한다.
단백질 또는 핵산과 관련하여 사용되는 용어 "이종"은 단백질 또는 핵산이 자연에서 서로 동일한 관계로 발견되지 않는 2개 이상의 서열 또는 하위 서열을 포함함을 나타낸다. 예를 들어, 핵산은 일반적으로 새로운 기능적 핵산을 만들기 위해 배열된 관련 없는 유전자의 2개 이상의 서열을 갖는 재조합 방식으로 생산된다. 예를 들어, 일 구체예에서, 핵산은 상이한 유전자로부터의 코딩 서열의 발현을 지시하도록 배열된 하나의 유전자로부터의 프로모터를 갖는다. 따라서, 코딩 서열과 관련하여 프로모터는 이종이다.
"복제 결함 바이러스" 또는 "바이러스 벡터"는 관심 있는 유전자를 포함하는 발현 카세트가 바이러스 캡시드 또는 막에 패키징된 합성 또는 인공 바이러스 입자를 의미하며, 바이러스 캡시드 또는 막 내에 패키징된 임의의 바이러스 게놈 서열이 복제 결핍인 경우; 즉, 그들은 자손 비리온을 생성할 수 없지만 표적 세포를 감염시키는 능력을 유지한다. 일 구체예에서, 바이러스 벡터의 게놈은 복제에 필요한 효소를 코딩하는 유전자를 포함하지 않지만(게놈은 인공 게놈의 증폭 및 패키징에 필요한 신호가 측접한 관심 이식유전자만 포함하는 "무감각"으로 조작될 수 있다), 이러한 유전자는 생산 중에 공급될 수 있다. 따라서 복제에 필요한 바이러스 효소가 있는 경우를 제외하고 자손 비리온에 의한 복제 및 감염이 발생할 수 없기 때문에 유전자 치료에 사용하기에 안전한 것으로 간주된다.
"재조합 AAV" 또는 "rAAV"는 AAV 캡시드 및 AAV 캡시드 내에 패키징된 적어도 비-AAV 코딩 서열을 포함하는 벡터 게놈의 2개 요소를 함유하는 DNAse-내성 바이러스 입자이다. 특정 구체예에서, 캡시드는 자가 조립하여 캡시드를 형성하는 vp1 단백질, vp2 단백질 및 vp3 단백질로 구성된 약 60개의 단백질을 함유한다. 달리 명시되지 않는 한, "재조합 AAV" 또는 "rAAV"는 구 "rAAV 벡터"와 상호교환적으로 사용될 수 있다. rAAV는 기능적 AAV rep 유전자 또는 기능적 AAV cap 유전자가 결여되어 자손을 생성할 수 없기 때문에 "복제 결함 바이러스" 또는 "바이러스 벡터"이다. 특정 구체예에서, 유일한 AAV 서열은 AAV 역위 말단 반복 서열(ITR)이고, 일반적으로 벡터 게놈의 극단 5' 및 3' 말단에 위치하여 ITR 사이에 위치한 유전자 및 조절 서열이 AAV 캡시드 내에 패키징되도록 한다.
"뉴클레아제 저항성"이라는 용어는 AAV 캡시드가 이식유전자를 숙주 세포에 전달하도록 설계되었으며 생산 공정에서 존재할 수 있는 오염 핵산을 제거하도록 설계된 뉴클레아제 인큐베이션 단계 동안 분해(소화)로부터 이러한 포장된 게놈 서열을 보호하는 발현 카세트 주위에 조립되었음을 나타낸다.
본원에서 사용되는 "벡터 게놈"은 바이러스 입자를 형성하는 파보바이러스(예를 들어, rAAV) 캡시드 내부에 패키징된 핵산 서열을 의미한다. 그러한 핵산 서열은 AAV 역위 말단 반복 서열(ITR)을 함유한다. 본 명세서의 예에서, 벡터 게놈은 최소한 5'에서 3'까지 AAV 5' ITR, 코딩 서열(즉, 이식유전자) 및 AAV 3' ITR을 함유한다. AAV2로부터의 ITR, 캡시드와 다른 소스 AAV 또는 전체 길이 ITR 이외의 것이 선택될 수 있다. 특정 구체예에서, ITR은 생성 동안 rep 기능을 제공하는 AAV 또는 트랜스보완 AAV와 동일한 AAV 소스로부터 유래한다. 또한, 다른 ITR, 예를 들어 자가-상보적(scAAV) ITR이 사용될 수 있다. 단일 가닥 AAV 및 자체 보완(sc) AAV는 모두 rAAV에 포함된다. 이식유전자는 폴리펩티드, 단백질, 기능적 RNA 분자(예를 들어, miRNA, miRNA 억제제) 또는 기타 관심 유전자 산물을 인코딩하는 벡터 서열과 이종인 핵산 코딩 서열이다. 핵산 코딩 서열은 표적 조직의 세포에서 이식유전자 전사, 번역 및/또는 발현을 허용하는 방식으로 조절 구성요소에 작동가능하게 연결된다. 벡터 게놈의 적합한 구성요소는 본 명세서에서 보다 상세히 논의된다. 일 예에서, "벡터 게놈"은 최소한 5'에서 3'까지 벡터 특이적 서열, 조절 제어 서열에 작동 가능하게 연결된 관심 단백질을 인코딩하는 핵산 서열을 포함하고(표적 세포에서 발현을 지시함), 여기서 벡터 특이적 서열은 벡터 게놈을 바이러스 벡터 캡시드 또는 외피 단백질로 특이적으로 패키징하는 말단 반복 서열일 수 있다. 예를 들어, AAV 반전 말단 반복은 AAV 및 특정 기타 파보바이러스 캡시드로 패키징하는 데 사용된다.
본원에서 사용되는 바와 같이, "작동가능하게 연결된" 서열은 관심 유전자와 인접하는 발현 제어 서열 및 관심 유전자를 제어하기 위해 트랜스로 또는 일정 거리에서 작용하는 발현 제어 서열 모두를 포함한다.
특정 구체예에서, rAAV의 제조에 사용되는 비-바이러스 유전 요소는 벡터(예를 들어, 생산 벡터)로 지칭될 것이다. 특정 구체예에서, 이들 벡터는 플라스미드이지만, 다른 적합한 유전 요소의 사용이 고려된다. 이러한 생산 플라스미드는 rAAV 생산 동안 발현되는 서열, 예를 들어 rAAV로 패키징되지 않는 rAAV의 생산에 필요한 AAV 캡시드 또는 rep 단백질을 인코딩할 수 있다. 대안적으로, 그러한 생성 플라스미드는 rAAV에 패키징되는 벡터 게놈을 운반할 수 있다.
본원에서 사용되는 "모체 캡시드"는 파보바이러스 또는 기타 바이러스(예를 들어, AAV, 아데노바이러스, HSV, RSV 등)로부터 선택되는 비돌연변이 또는 비변형 캡시드를 의미한다. 특정 구체예에서, 모 캡시드는 캡시드 단백질(즉, vp 단백질)을 인코딩하는 야생형 게놈을 포함하는 임의의 자연 발생 AAV 캡시드를 포함하며, 상기 캡시드 단백질은 AAV 형질도입 및/또는 조직 특이적 향성을 지시한다. 일부 구체예에서, 모 캡시드는 본래 CNS를 표적으로 하는 AAV로부터 선택된다. 다른 구체예에서, 모 캡시드는 본래 CNS를 표적화하지 않는 AAV로부터 선택된다.
본원에서 사용된 "변이체 캡시드" 또는 "변이체 AAV" 또는 "변체 AAV 캡시드"는 변형된 캡시드 또는 돌연변이된 캡시드를 지칭하며, 상기 캡시드 단백질은 조직-특이적 표적화 펩티드의 삽입을 포함한다.
본원에서 사용되는 바와 같이, "발현 카세트"는 생물학적으로 유용한 핵산 서열(예를 들어, 단백질, 효소 또는 기타 유용한 유전자 산물, mRNA 등을 인코딩하는 유전자 cDNA) 및 작동 가능하게 연결된 조절 서열을 포함하는 핵산 분자를 의미한다. 핵산 서열 및 이의 유전자 산물의 전사, 번역 및/또는 발현을 지시하거나 조절한다. 본원에서 사용되는 바와 같이, "작동가능하게 연결된" 서열은 핵산 서열과 인접하거나 비연속적인 조절 서열 및 트랜스 또는 시스 핵산 서열에서 작용하는 조절 서열을 모두 포함한다. 이러한 조절 서열은 전형적으로 예를 들어 프로모터, 인핸서, 인트론, 코작 서열, 폴리아데닐화 서열 및 TATA 신호 중 하나 이상을 포함한다. 발현 카세트는 유전자 서열의 상류(5'에서) 조절 서열, 예를 들어 하나 이상의 프로모터, 인핸서, 인트론 등, 및 하나 이상의 인핸서, 또는 유전자 서열 하류(3'에서) 조절 서열, 예를 들어 다른 요소 중에서 폴리아데닐화 부위를 포함하는 3' 비번역 영역(3' UTR)을 포함할 수 있다. 특정 구체예에서, 조절 서열은 유전자 산물의 핵산 서열에 작동가능하게 연결되며, 여기서 조절 서열은 개재 핵산 서열, 즉 5'-비번역 영역(5' UTR)에 의해 유전자 산물의 핵산 서열로부터 분리된다. 특정 구체예에서, 발현 카세트는 하나 이상의 유전자 산물의 핵산 서열을 포함한다. 일부 구체예에서, 발현 카세트는 모노시스트론 또는 바이시스트론 발현 카세트일 수 있다. 다른 구체예에서, 용어 "이식유전자"는 표적 세포에 삽입되는 외인성 공급원으로부터의 하나 이상의 DNA 서열을 의미한다.
본 발명의 맥락에서 용어 "번역"은 리보솜에서의 과정에 관한 것이며, 상기 mRNA 가닥은 아미노산 서열의 조립을 제어하여 단백질 또는 펩티드를 생성한다.
용어 "발현"은 본원에서 가장 넓은 의미로 사용되며 RNA 또는 RNA 및 단백질의 생성을 포함한다. 발현은 일시적이거나 안정적일 수 있다.
핵산 또는 이의 단편을 언급할 때 "실질적인 상동성" 또는 "실질적인 유사성"이라는 용어는 다른 핵산(또는 이의 상보적 가닥)과의 적절한 뉴클레오티드 삽입 또는 결실로 최적으로 정렬될 때, 정렬된 서열의 적어도 약 95 내지 99%에서 뉴클레오티드 서열 동일성이 존재함을 나타낸다. 바람직하게는, 상동성은 전체 길이 서열, 또는 이의 오픈 리딩 프레임, 또는 길이가 적어도 15개 뉴클레오티드인 또 다른 적합한 단편에 걸쳐 있다. 적합한 단편의 예는 본원에 기술되어 있다.
핵산 서열과 관련하여 용어 "서열 동일성" "서열 동일성 백분율" 또는 "동일성 비율"은 최대 일치를 위해 정렬될 때 동일한 두 서열의 잔기를 의미한다. 서열 동일성 비교의 길이는 게놈의 전장, 유전자 코딩 서열의 전장, 또는 적어도 약 500 내지 5000개 뉴클레오티드의 단편일 수 있다. 그러나, 예를 들어, 적어도 약 9개의 뉴클레오티드, 일반적으로 적어도 약 20 내지 24개의 뉴클레오티드, 적어도 약 28 내지 32개의 뉴클레오티드, 적어도 약 36개 이상의 뉴클레오티드의 더 작은 단편들 사이의 동일성이 또한 바람직할 수 있다. 유사하게, "퍼센트 서열 동일성"은 단백질 또는 이의 단편의 전체 길이에 걸쳐 아미노산 서열에 대해 쉽게 결정될 수 있다. 적합하게는, 단편은 적어도 약 8개의 아미노산 길이이고 최대 약 700개의 아미노산일 수 있다. 적합한 단편의 예는 본원에 기술되어 있다.
아미노산 또는 이의 단편을 언급할 때 용어 "실질적인 상동성" 또는 "실질적인 유사성"은 다른 아미노산(또는 이의 상보적 가닥)과 적절한 아미노산 삽입 또는 결실로 최적으로 정렬될 때, 정렬된 서열의 적어도 약 95 내지 99%에서 아미노산 서열 동일성이 존재함을 의미한다. 바람직하게는, 상동성은 예를 들어, 면역글로불린 영역 또는 도메인, AAV 캡 단백질, 또는 적어도 8개 아미노산, 또는 더 바람직하게는 적어도 15개 아미노산 길이인 이의 단편과 같은 전장 서열, 또는 이의 단백질에 걸쳐 있다. 적합한 단편의 예는 본원에 기술되어 있다.
용어 "고도로 보존된"은 적어도 80% 동일성, 바람직하게는 적어도 90% 동일성, 보다 바람직하게는 97% 이상의 동일성을 의미한다. 동일성은 당업자에게 공지된 알고리즘 및 컴퓨터 프로그램에 의지하여 당업자에 의해 쉽게 결정된다.
일반적으로, 2개의 상이한 아데노 관련 바이러스 간의 "동일성", "상동성" 또는 "유사성"을 언급할 때 "동일성", "상동성" 또는 "유사성"은 "정렬된" 서열을 참조하여 결정된다. "정렬된" 서열 또는 "정렬"은 종종 참조 서열과 비교하여 누락되거나 추가된 염기 또는 아미노산에 대한 수정을 포함하는 다수의 핵산 서열 또는 단백질(아미노산) 서열을 지칭한다. 정렬은 공개적으로 또는 상업적으로 이용 가능한 다양한 다중 서열 정렬 프로그램을 사용하여 수행된다. 이러한 프로그램의 예로는 인터넷의 웹 서버를 통해 액세스할 수 있는 "Clustal Omega", "Clustal W", "CAP Sequence Assembly", "MAP" 및 "MEME"가 있다. 그러한 프로그램에 대한 다른 소스는 당업자에게 알려져 있다. 또는 Vector NTI 유틸리티도 사용된다. 또한, 전술한 프로그램에 포함된 것을 포함하여 뉴클레오티드 서열 동일성을 측정하기 위해 사용될 수 있는 당업계에 공지된 다수의 알고리즘이 있다. 또 다른 예로서, 폴리뉴클레오티드 서열은 Fasta™를 사용하여 비교할 수 있으며, GCG 버전 6.1. Fasta™의 프로그램은 질의와 검색 서열 사이에서 가장 잘 겹치는 영역의 정렬 및 퍼센트 서열 동일성을 제공한다. 예를 들어, GCG 버전 6.1(본원에 참조로 포함됨)에 제공된 기본 매개변수(단어 크기 6 및 스코어링 매트릭스에 대한 NOPAM 인자)와 함께 Fasta™를 사용하여 핵산 서열 사이의 서열 동일성 백분율을 결정할 수 있다. "Clustal Omega", "Clustal X", "MAP", "PIMA", "MSA", "BLOCKMAKER", "MEME" 및 "Match-Box" 프로그램과 같은 아미노산 서열에 대해 여러 서열 정렬 프로그램도 사용할 수 있다. 일반적으로 이러한 프로그램은 기본 설정으로 사용되지만 당업자는 필요에 따라 이러한 설정을 변경할 수 있다. 대안적으로, 당업자는 참조된 알고리즘 및 프로그램에 의해 제공되는 것과 같은 수준의 동일성 또는 정렬을 제공하는 다른 알고리즘 또는 컴퓨터 프로그램을 이용할 수 있다. 예를 들어, J. D. Thomson 등, Nucl. Acids. Res., “comprehensive comparison of multiple sequence alignments”27(13):2682-2690 (1999)을 참조한다.
유효량은 인간 환자가 아닌 동물 모델을 기준으로 결정될 수 있다.
전술한 바와 같이 수치를 수식하는 데 사용되는 용어 "약"은 달리 명시되지 않는 한 주어진 기준으로부터 ±10%(±10%, 예를 들어, ±1, ±2, ±3, ±4, ±5, ±6, ±7, ±8, ±9, ±10 또는 그 사이의 값)의 변동을 의미한다.
특정 경우에 "E+#" 또는 "e+#"라는 용어는 지수를 참조하는 데 사용된다. 예를 들어, "5E10" 또는 "5e10"은 5 x 1010이다. 이 용어는 같은 의미로 사용할 수 있다.
본 명세서 및 청구범위 전반에 걸쳐 사용된 바와 같이, 용어 "포함하다" 및 "포함하다" 및 "포함하다", "포함하다", "함유하다" 및 "함유하는"을 포함하는 그의 변형은 다른 구성요소, 요소, 정수, 단계 등을 포함한다. "이루어진" 또는 "구성된"이라는 용어는 다른 구성 요소, 요소, 정수, 단계 등을 배제한다.
용어 "a" 또는 "an"은 하나 이상, 예를 들어 "인핸서"를 의미하며 하나 이상의 인핸서를 나타내는 것으로 이해된다는 점에 유의해야 한다. 이와 같이, 용어 "a"(또는 "an"), "하나 이상" 및 "적어도 하나"는 본 명세서에서 상호교환적으로 사용된다.
이들 발명의 설명과 관련하여, 본 명세서에 기술된 각각의 조성물은 본 발명의 방법에서 또 다른 구체예에서 유용한 것으로 의도된다. 또한, 방법에 유용한 것으로 본 명세서에 기술된 각각의 조성물은 또 다른 구체예에서 그 자체가 본 발명의 구체예인 것으로 의도된다.
본 명세서에서 달리 정의되지 않는 한, 본 명세서에서 사용된 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 통상의 기술자에 의해 공개된 텍스트를 참조하여 일반적으로 이해되는 것과 동일한 의미를 가지며, 이는 본 출원에서 사용되는 많은 용어에 대한 일반적인 가이드를 당업자에게 제공한다.
실험예
하기 실험예는 예시일 뿐이며 본 명세서에 기술된 발명을 제한하지 않는다.
실험예 1. 1차 스크린
AAV 캡시드 표면의 유연한 루프에 작은 펩티드 삽입이 새로운 세포 수용체와의 상호작용을 매개할 수 있는 것으로 나타났다. CalTech(AAV9-PHP.B)에서 발견된 한 사례에서는 AAV9의 HVR8 루프에 삽입된 7개의 아미노산 펩티드가 일부 마우스 계통의 뇌 맥관 구조에 있는 GPI 고정 수용체인 Ly6a와의 상호작용을 매개한다. 이 상호작용은 혈액-뇌 장벽(BBB)을 가로질러 AAV9-PHP.B의 수송을 유도하여 AAV9보다 ~50배 더 높은 뇌 세포의 전달을 초래한다. 이 작업에서 본 발명자는 BBB의 세포막 표적에 결합하여 BBB를 가로질러 AAV9 캡시드를 구동할 수 있는 펩티드 삽입물을 검색한다.
본 발명자는 먼저 뇌의 혈관 세포와 상호 작용할 가능성이 있는 펩티드 서열에 대한 이용 가능한 학술 및 특허 문헌을 조사하여 AAV-BBB 문제를 해결하고자 하였다. 본 발명자는 이러한 펩티드의 다음 소스를 찾았다.
· 파지 디스플레이 라이브러리가 일차 뇌 내피 세포에 대해 패닝된 파지 디스플레이 실험의 발표된 결과;
· 알려진 BBB 상주 막 단백질에 대한 천연 리간드 펩티드;
· BBB 상주 막 단백질을 표적으로 하는 항체의 CDR;
· 뇌염을 유발하는 플라비바이러스의 바이러스 외피 단백질; 및
· GPI 앵커리지에서 세포 결합 활동을 하는 세균성 독소.
본 발명자는 HVR8 유전자좌(위치 588과 589 사이, 서열번호 44의 AAV9 캡시드의 아미노산 서열의 넘버링에 기초함)에 개별적으로 삽입된 이들 공급원으로부터의 수백 개의 펩티드를 포함하는 AAV9 삽입 돌연변이 라이브러리를 생성하였다. 각 펩티드는 일반적으로 라이브러리에 1) 삽입된 펩티드의 길이, 2) 펩티드 양쪽에 유연한 GSG 또는 GG 링커 서열의 존재가 다른 여러 형태로 존재하였다. 펩티드는 또한 다중 동의 코돈을 사용하여 인코딩되어 화면에서 복제 활동을 독립적으로 관찰할 수 있다.
또한, 본 발명자는 AAVhu68 캡시드의 HVR8에서 혈액-뇌 장벽(BBB) 수용체를 표적으로 하는 알려진 또는 의심되는 리간드 펩티드(서열번호 45의 AAVhu68의 아미노산 서열의 넘버링을 기준으로 위치 588과 589 사이)를 사용하여 삽입 변이체 라이브러리를 생성하였다. 이는 다음과 같다:
· 포유류 뇌 내피에 결합하는 펩티드(파지 디스플레이 데이터 공개);
· 고전적인 RMT 수용체 리간드(예를 들어, Tf);
· RMT 수용체에 대한 mAb의 CDR(예를 들어, 항-TfR); 및
· 뇌염을 일으키는 플라비바이러스의 외피 단백질.
대조군으로서 PHP.B 펩티드도 포함되었다(C57/BL6에 대한 양성 대조군 및 Balb/c & NHP에 대한 음성 대조군). 각 펩티드는 여러 방식으로(링커가 있거나 없거나, 여러 동의 DNA 서열에서) 인코딩되었다.
본 발명자는 이 라이브러리를 고용량 정맥 주사(IV)로 2마리의 마우스 변종과 1마리의 비인간 영장류에 주입하였다. 2-3주의 수명 기간 후, 동물을 부검하고 조직을 수집하였다. 본 발명자는 CNS 및 기타 조직에서 AAV 벡터의 DNA 게놈을 추출하고 이를 차세대 시퀀싱(NGS)에 적용하였다. 벡터 변이체는 자신의 캡시드 유전자 변이체를 캡슐화하여 관심 있는 조직에서 캡시드 유전자 변이체의 상대적 풍부함을 통해 캡시드 활동을 추적할 수 있다. 본 발명자는 주입된 라이브러리 혼합물의 풍부함으로 정규화된 CNS의 풍부함을 계산하여 라이브러리의 각 변형의 BBB 활동("농축 점수")을 기록하였다.
마우스 연구에서, C57/BL6 마우스에서 상부 뇌 강화 HVR8 삽입은 다음과 같다: TLAVPFK(SEQ ID NO: 49)(PHP.B), 양성 대조군 PHP.B는 가장 강화된 적중으로 독립적으로 3배 나타난다. 동의 코돈이 있는 PHP.B 펩티드 중 3개가 독립적으로 강화된다. 여러 다른 펩티드도 뇌에 풍부하다. 도 1a 및 1b는 화면에서 최고의 마우스 뇌 히트에 대한 농축 점수를 나타내고, 참조 펩티드와 함께(C57BL/6J 마우스에 대한 도 1a; 및 Balb/c 마우스에 대한 도 1b. 도 2a 및 2b는 최고 수행 NHP 뇌(도 2a) 및 척수(도 2b) 조직에 대한 농축 점수를 보여준다.
표 1. 기본 화면의 히트 펩티드 목록(NHP 및 마우스의 화면에서 확인됨).
실험예 2. 2차 검증
여러 적중 캡시드에 대한 GFP 리포터 벡터를 생성하여 마우스의 기본 스크린을 추적하였다. 벡터를 C57BL/6J 마우스에 고용량 IV로 주사하였다. 2주 후, 마우스를 부검하고 뇌 섹션의 GFP 이미지를 수집하였다(데이터는 표시되지 않음). GFP 연구에서 테스트된 모든 적중 벡터는 간 GFP 염색(데이터는 표시되지 않음)에서 명백한 바와 같이 간에서 비편재화되었다.
고배율 이미징은 캡시드 SSN과 SAN이 상당히 뇌에 국한되어 있지만 내피로 제한되어 있음을 보여주었다. RCA-렉틴은 이 섹션에서 뇌 내피 세포의 공동 염색 마커이다(데이터는 표시되지 않음). 이러한 결과는 화면에서 확인된 AAV 캡시드가 BBB-수용체 결합이지만 BBB를 가로지르지 않음을 나타낸다. 돌연변이 계열은 Ly6a 수용체에 대해 다양한 친화성을 보였다. 뇌 형질도입 수준은 Ly6a 수용체에 대한 펩티드의 보다 긴밀한 친화성 결합이 관찰된 것과 관련하여 감소하였다. 관찰된 단단한 결합은 게놈이 내피에 고착되었을 가능성이 있기 때문에 형질도입을 감소시켰다.
이 내피 국소화는 특정 질병에 유용할 수 있다. 또한, 이 활동은 뇌 국소화에서 BBB 교차 벡터로 변환하도록 최적화될 수 있다. 본 발명자는 바코드 벡터 연구에서 이러한 BBB 교차 및 뇌 국소화 활동을 확인하였다. 간략하게, 각각의 캡시드는 고유한 DNA 바코드가 포함된 GFP 리포터 유전자를 포함하는 벡터를 개별적으로 생산하는 데 사용되었다. 바코딩된 캡시드 프렙을 동일한 비율로 혼합하고 C57BL/6J 또는 Balb/c 마우스에 주사하였다(도 3a-3d). 사망하면 마우스 조직을 NGS 시퀀싱하여 조직에서 추출한 벡터 게놈 중 각 바코드의 존재비를 세었다. 결과는 기본 화면에서 식별된 모든 히트 캡시드에 대한 벡터 게놈의 뇌 위치를 확인한다. Balb/c 마우스에서, 2차 검증 스크린은 1차 스크린에서 발견된 모든 히트 서열에 대한 뇌 표적화를 보여주었다(도 3a). C576BL/6 마우스에서 2차 검증 화면은 1차 화면에서 발견된 모든 적중 서열에 대한 뇌 표적화를 보여주었다(도 3b). Balb/c 및 C57BL/6 마우스 모두에서, AVA9에 비해 모든 적중 서열에 대한 간 탈표적화는 뇌 맥관구조에 대한 친화성과 일치하였다(도 3c 및 3d).
실험예 3. 내피 표적화 서열
NHP 2차 검증을 위해 바코드 연구가 수행되었다. 이 연구는 21일 후 4.5x1013 GC/kg에서 AAV9를 포함하여 27개의 바코딩된 벡터의 주입된 혼합물로 2개의 NHP에서 수행되었다. 전뇌 조직 균질물의 분석이 수행되었다. 일부 벡터는 완만하게 개선된 벡터 생체분포를 보였지만 어떤 벡터도 개선된 전뇌 형질도입을 나타내지 않았다. 뇌(DNA)에서 벡터 게놈의 축적과 벡터 유래 전사체(mRNA)의 발현은 거의 상관관계가 없었다(표 2). 본 발명자는 내피 표적화 벡터에 대한 불량한 mRNA 대 DNA 상관관계를 관찰하였다.
표 2.
아래의 표 3은 AAV9(1과 동일)로 표준화된 바코드 연구에서 두 NHP에 대한 평균 상대 위치 파악 점수를 보여준다. 뇌 중심 라이브러리 설계에 따라 대부분의 벡터는 비 뇌 조직에서 눈에 띄지 않는 국소화를 보인다. 이에 대한 예외는 벡터 PMK로 AAV9에 비해 두 NHP의 비장에 크게 재편성되었다.
표 3.
하기 표 4는 뇌 내피 히트가 공통 시험관내 형질도입 프로파일(293 형질도입에서 측정된 바와 같음) 및 공통 생산 프로파일을 가짐을 보여준다. 중요하게도, 내피 표적화 활성을 갖는 벡터는 모두 NGS에 의해 측정된 바와 같이 AAV 대 플라스미드 라이브러리에서 극적으로 증가된 상대적 존재비를 나타낸다.
표 4.
SAN 펩티드의 돌연변이 라이브러리는 뇌 표적화에서 "NxTK" 모티프의 역할을 확인한다. 이 연구에서는 SAN 삽입에 가능한 모든 단일 아미노산 변경이 이루어지고 최적화된 라이브러리 변이체가 마우스에 주입되었으며 각 변이체에 대한 생체 분포 및 수율에 대한 점수가 측정되었다. "NxTK" 모티프는 SAN 삽입물에서 뇌 생체분포를 위한 중요한 모티프이다(표 5 및 도 5). "NxTK" 모티프는 SAN 펩티드 삽입물에서 플라스미드에서 AAV로의 전환을 제어한다(표 6 및 도 6). 또한, "NxTK" 모티프는 "NxTK" 부류에서 이러한 내피 벡터의 세 가지 특성, 즉 내피 세포 형질도입, 개선된 293 세포 형질도입 및 라이브러리 생산 동안 전파되는 능력을 연결하였다. 도 7a 내지 7d는 "NxTK" 모티프가 세포주에 걸쳐 광범위한 형질도입 이점을 부여함을 보여준다. 상대적 형질도입 수준은 293 세포(도 7a), NIH3T3 세포(도 7b) 및 HUH7 세포(도 7c)에서 AAV9 캡시드와 비교할 때 개선되었다. 도 7d는 형질도입 후 3일(3DPT)에서 형질도입의 상당한 초기 개선 및 형질도입 후 7일(7DPT)까지 약 10배 개선을 보여준다. EFS 및 SAN 펩티드 삽입물이 있는 AAV-GFP 벡터는 일차 마카크 기도 상피 세포를 형질도입했을 때 개선된 형질도입을 보여주었다(도 7e-7h).
표 5. 뇌 생체분포(위에서 아래로의 평균).
표 6. 플라스미드에서 AAV로의 수율 전환
요약하면, 표 7에 나열된 선택된 아미노산 서열은 모두 기능적 모티프 N- x- (T/I/V/A)- (K/R) 모티프(서열번호 47)를 포함한다. 표 7에 나타낸 선택된 서열 외에, 스크리닝 동안 다른 서열이 확인되었다. 본 발명자는 이러한 삽입 서열에 대한 많은 대체가 또한 내피 표적화 활동을 지원하거나 개선한다는 것을 뒷받침하는 데이터를 가지고 있다. 또한 대규모 무작위 삽입 라이브러리에서 이 모티프에 맞는 약 수천 개의 시퀀스를 발견하였다. 이러한 시퀀스는 모두 향상된 변환 속성을 공유할 가능성이 높다.
표 7. 선택된 내피 표적화 서열
본 발명자는 NHP에서 기본 스크린 히트의 바코드 평가를 완료하였다. AAV9-PMK에 의한 비장 표적화 가능성을 제외하고는 말초 조직 표적화에 있어 유의미한 향상이 없는 반면, 뇌 국소화는 이 라이브러리로부터의 적중의 가장 두드러진 특징이다. 본 발명자는 뇌-내피 표적 활동을 가진 모든 펩티드 삽입물에 공통적인 서열 모티프를 정의하였다. 본 발명자는 광범위한 시험관 내 전달 이점을 부여할 뿐만 아니라 뇌-내피 표적화에서 이 모티프의 활성을 확인하였다. 단일 시퀀스 모티프 "NxTK"는 세 가지 속성을 공유하는 4개의 관련 없는 소스에서 삽입을 정의한다:
(1) 293 및 기타 세포주에서 극적으로 개선된 시험관내 형질도입;
(2) 라이브러리 생산 중 기생 확장 - "확산" 표현형; 및
(3) 마우스 및 NHP에서 생체내 내피 생체분포.
"NxTK" 모티프는 SAN 및 EFS 벡터 삽입의 전신 돌연변이 스크린에 매핑되었다. 전신 돌연변이 스크리닝에서 "NxTK" 모티프는 라이브러리 생산의 풍부함뿐만 아니라 뇌 내피 생체 분포에 중요한 것으로 나타났다. 라이브러리 생산 중 캡시드 수율을 의미하는 플라스미드에서 AAV로의 전환은 2가지 요인, 즉 기생 확산 모티프의 존재(주 요인) 및 고유 캡시드 수율(부수 요인)에 의해 제어된다. 확산 모티프 중 하나는 "NxTK"로 확인되었으며 293개의 세포 표면 수용체와 상호 작용하고 전달 이점을 부여할 가능성이 있다. 293의 형질도입 이점은 라이브러리 생산이 제한된 Cap으로 이루어지기 때문에 생산 기간 동안 벡터 게놈(Cap)을 이웃 세포로 전파할 수 있으므로 대부분의 세포는 초기에 Cap 유전자를 제외한 모든 것을 가지고 있다. 사소한 요인은 기생 확산 모티프가 있는 벡터를 디지털 필터링한 후에만 분명했다.
실험예 4. 기도 전달을 위한 AAV 캡시드 개발을 위한 공학적 전략
현재 AAV 벡터는 비강과 상기도의 세포를 제대로 변환하지 못하여 인플루엔자 또는 COVID-19와 같은 상기도 전염병으로부터 보호하기 위한 예방적 AAV 전략의 효능을 제한한다. 이 프로젝트는 이러한 조직의 향상된 형질도입을 위해 AAV 캡시드를 설계하는 것을 목표로 하며, 특히 유도 진화 및 수용체 표적화 전략을 추구한다. AAV 기도 특정 캡시드 선택을 위해 추구하는 엔지니어링 전략은 삽입물(103에서 109 초기 다양성)이 있는 다양한 구성 라이브러리 생성을 포함하되 이에 국한되지 않는 단계, 1차 영장류 또는 인간 기도 세포에서의 스크리닝 및 선택하는 단계, 선택된 작제물의 게놈 정체성(DNA 또는 RNA)을 확인하는 단계, 히트에 수렴하기 위해 추가 스크리닝을 수행하고 NHP에서 개선된 캡시드의 히트를 검증하는 단계로 구성된다. 기도 전달을 위한 캡시드 다양성의 출처는 편향되지 않은 접근 방식과 편향된 접근 방식의 두 가지 접근 방식을 추구하는 것으로 구성된다. 편향되지 않은 접근 방식에서 임의의 펩티드가 AAV 캡시드 표면에 삽입되어 107개 이상의 변이체 다양성이 있는 큰 라이브러리를 생성한다. 편향된 접근법에서 알려진 또는 의심되는 기도 세포 결합 활성을 가진 펩티드가 AAV Capsid에 삽입되어 약 103개의 변이 다양성을 가진 작은 라이브러리를 생성한다. 이러한 알려진 또는 의심되는 기도 세포 결합 펩티드의 소스: 발표된 파지 디스플레이 결과, 바이러스 수용체 결합 도메인의 펩티드, 기도 수용체에 대한 알려진 리간드 및 이전 시험관 내 라이브러리 스크리닝에서 생성된 펩티드. 생성된 캡시드 라이브러리를 시험관 내에서 스크리닝하기 위해 공기-액체 인터페이스(ALI) 배양에서 1차 기도 세포를 사용한 분석이 사용된다. 사용된 세포는 인간 및 마카크 기원이며 비강, 기관 및 기관지 세포 기원을 포함한다. 마카크 1차 기도 상피 세포 배양물에서 GFP 벡터를 사용한 예비 형질도입 시험은 AAV 캡시드로의 EFS 및 SAN 삽입 펩티드에 대한 형질도입에서 상당한 초기 개선을 보여주었다(도 7d 및 7e-7h). 도 7e는 담체(즉, 벡터 없음)로 처리된 대조군 샘플에서 마카크 원발성 기도 상피 세포의 현미경 분석을 보여준다. 도 7f는 AAV9-GFP 벡터로 형질도입 후 마카크 원발성 기도 상피 세포의 현미경 분석을 나타낸다. 도 7g는 EFS 펩티드 삽입물을 포함하는 AAV9-GFP 벡터로 형질도입 후 마카크 일차 기도 상피 세포의 현미경 분석을 보여준다. 도 7h는 SAN 펩티드 삽입물을 포함하는 AAV9-GFP로 형질도입 후 마카크 일차 기도 상피 세포의 현미경 분석을 보여준다. 배양된 인간 세포에서 GFP 벡터를 사용한 예비 형질도입 테스트는 전반적으로 낮은 형질도입을 보여주었으며, 상기 7일째 총 mRNA 마이크로그램에 대한 mRNA 카피 수의 비율은 배양된 인간 세포의 경우 1x104(도 8) 및 배양된 마카크 원발성 기도 상피 세포의 경우 1x106(도 7d)이었다. SAN 모티프는 AAV9 형질도입과 비교할 때 7일째 형질도입에서 이점을 보였다(도 8). EFS 모티프는 기관지 및 기관 배양 인간 세포에서 더 불량한 형질도입을 보였다(도 8).
또한, 극적으로 개선된 세포 결합 및 형질도입 활성을 부여하는 다른 프로젝트에서 시험관 내 선택 체계를 통해 다수의 삽입 서열을 개발하였다. 생성된 AAV 삽입 벡터는 ALI 문화의 바코드 풀에서 테스트된다. 결과는 시험관 내에서 선택된 모든 AAV9-삽입 벡터가 AAV9 벡터보다 우수함을 보여준다(결과는 나타내지 않음). 구체적으로, Spr3L(NxTK)의 AAV9-삽입 벡터는 비교할 때 가장 좋았고, 후자는 AAV9 캡시드보다 약 50배 더 나은 형질도입을 보였다.
(서열 목록 자유 텍스트)
아래의 자유 텍스트를 포함하는 시퀀스에 대해 다음 정보가 제공된다.
숫자 식별자 <223>.
본 명세서에 인용된 모든 문헌은 본 명세서에 참조로 포함된다. 2020년 12월 1일에 출원된 미국 가출원 번호 63/119,863은 그 전체 내용이 참조로 본원에 포함된다. "20-9409PCT_ST25"로 명명된 본원에 제출된 서열 목록 및 그 안의 서열 및 텍스트는 참고로 포함된다. 본 발명은 특정 구체예를 참조하여 설명되었지만, 본 발명의 사상을 벗어나지 않고 수정이 이루어질 수 있음을 이해할 것이다. 그러한 수정은 첨부된 청구 범위 내에 있는 것으로 의도된다.
SEQUENCE LISTING
<110> The Trustees of the University of Pennsylvania
<120> NOVEL AAV CAPSIDS WITH ENDOTHELIAL TISSUE-SPECIFIC TARGETING
MOTIFS AND COMPOSITIONS CONTAINING SAME
<130> UPN-20-9409.PCT
<150> US 63/119,863
<151> 2020-12-01
<160> 56
<170> PatentIn version 3.5
<210> 1
<211> 4725
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV2/9 n.588.EFS nucleic acid sequence expression cassette
<220>
<221> misc_feature
<222> (1)..(36)
<223> truncated promoter
<220>
<221> promoter
<222> (1)..(7)
<223> p5 promoter
<220>
<221> CDS
<222> (37)..(1899)
<223> AAV2-Rep
<220>
<221> CDS
<222> (1919)..(4162)
<223> AAV9 Cap
<220>
<221> misc_feature
<222> (3683)..(3715)
<223> EFS
<220>
<221> misc_feature
<222> (4253)..(4383)
<223> p5 promoter
<220>
<221> misc_feature
<222> (4511)..(4725)
<223> LacZ promoter
<400> 1
ccattttgaa gcgggaggtt tgaacgcgca gccgcc atg ccg ggg ttt tac gag 54
Met Pro Gly Phe Tyr Glu
1 5
att gtg att aag gtc ccc agc gac ctt gac gag cat ctg ccc ggc att 102
Ile Val Ile Lys Val Pro Ser Asp Leu Asp Glu His Leu Pro Gly Ile
10 15 20
tct gac agc ttt gtg aac tgg gtg gcc gag aag gaa tgg gag ttg ccg 150
Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys Glu Trp Glu Leu Pro
25 30 35
cca gat tct gac atg gat ctg aat ctg att gag cag gca ccc ctg acc 198
Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu Gln Ala Pro Leu Thr
40 45 50
gtg gcc gag aag ctg cag cgc gac ttt ctg acg gaa tgg cgc cgt gtg 246
Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr Glu Trp Arg Arg Val
55 60 65 70
agt aag gcc ccg gag gct ctt ttc ttt gtg caa ttt gag aag gga gag 294
Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln Phe Glu Lys Gly Glu
75 80 85
agc tac ttc cac atg cac gtg ctc gtg gaa acc acc ggg gtg aaa tcc 342
Ser Tyr Phe His Met His Val Leu Val Glu Thr Thr Gly Val Lys Ser
90 95 100
atg gtt ttg gga cgt ttc ctg agt cag att cgc gaa aaa ctg att cag 390
Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg Glu Lys Leu Ile Gln
105 110 115
aga att tac cgc ggg atc gag ccg act ttg cca aac tgg ttc gcg gtc 438
Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro Asn Trp Phe Ala Val
120 125 130
aca aag acc aga aat ggc gcc gga ggc ggg aac aag gtg gtg gat gag 486
Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn Lys Val Val Asp Glu
135 140 145 150
tgc tac atc ccc aat tac ttg ctc ccc aaa acc cag cct gag ctc cag 534
Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr Gln Pro Glu Leu Gln
155 160 165
tgg gcg tgg act aat atg gaa cag tat tta agc gcc tgt ttg aat ctc 582
Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser Ala Cys Leu Asn Leu
170 175 180
acg gag cgt aaa cgg ttg gtg gcg cag cat ctg acg cac gtg tcg cag 630
Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu Thr His Val Ser Gln
185 190 195
acg cag gag cag aac aaa gag aat cag aat ccc aat tct gat gcg ccg 678
Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro Asn Ser Asp Ala Pro
200 205 210
gtg atc aga tca aaa act tca gcc agg tac atg gag ctg gtc ggg tgg 726
Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met Glu Leu Val Gly Trp
215 220 225 230
ctc gtg gac aag ggg att acc tcg gag aag cag tgg atc cag gag gac 774
Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Glu Asp
235 240 245
cag gcc tca tac atc tcc ttc aat gcg gcc tcc aac tcg cgg tcc caa 822
Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn Ser Arg Ser Gln
250 255 260
atc aag gct gcc ttg gac aat gcg gga aag att atg agc ctg act aaa 870
Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met Ser Leu Thr Lys
265 270 275
acc gcc ccc gac tac ctg gtg ggc cag cag ccc gtg gag gac att tcc 918
Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val Glu Asp Ile Ser
280 285 290
agc aat cgg att tat aaa att ttg gaa cta aac ggg tac gat ccc caa 966
Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly Tyr Asp Pro Gln
295 300 305 310
tat gcg gct tcc gtc ttt ctg gga tgg gcc acg aaa aag ttc ggc aag 1014
Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys Lys Phe Gly Lys
315 320 325
agg aac acc atc tgg ctg ttt ggg cct gca act acc ggg aag acc aac 1062
Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr Gly Lys Thr Asn
330 335 340
atc gcg gag gcc ata gcc cac act gtg ccc ttc tac ggg tgc gta aac 1110
Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Val Asn
345 350 355
tgg acc aat gag aac ttt ccc ttc aac gac tgt gtc gac aag atg gtg 1158
Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Met Val
360 365 370
atc tgg tgg gag gag ggg aag atg acc gcc aag gtc gtg gag tcg gcc 1206
Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val Val Glu Ser Ala
375 380 385 390
aaa gcc att ctc gga gga agc aag gtg cgc gtg gac cag aaa tgc aag 1254
Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Cys Lys
395 400 405
tcc tcg gcc cag ata gac ccg act ccc gtg atc gtc acc tcc aac acc 1302
Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val Thr Ser Asn Thr
410 415 420
aac atg tgc gcc gtg att gac ggg aac tca acg acc ttc gaa cac cag 1350
Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr Phe Glu His Gln
425 430 435
cag ccg ttg caa gac cgg atg ttc aaa ttt gaa ctc acc cgc cgt ctg 1398
Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu Thr Arg Arg Leu
440 445 450
gat cat gac ttt ggg aag gtc acc aag cag gaa gtc aaa gac ttt ttc 1446
Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val Lys Asp Phe Phe
455 460 465 470
cgg tgg gca aag gat cac gtg gtt gag gtg gag cat gaa ttc tac gtc 1494
Arg Trp Ala Lys Asp His Val Val Glu Val Glu His Glu Phe Tyr Val
475 480 485
aaa aag ggt gga gcc aag aaa aga ccc gcc ccc agt gac gca gat ata 1542
Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser Asp Ala Asp Ile
490 495 500
agt gag ccc aaa cgg gtg cgc gag tca gtt gcg cag cca tcg acg tca 1590
Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln Pro Ser Thr Ser
505 510 515
gac gcg gaa gct tcg atc aac tac gca gac agg tac caa aac aaa tgt 1638
Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr Gln Asn Lys Cys
520 525 530
tct cgt cac gtg ggc atg aat ctg atg ctg ttt ccc tgc aga caa tgc 1686
Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro Cys Arg Gln Cys
535 540 545 550
gag aga atg aat cag aat tca aat atc tgc ttc act cac gga cag aaa 1734
Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr His Gly Gln Lys
555 560 565
gac tgt tta gag tgc ttt ccc gtg tca gaa tct caa ccc gtt tct gtc 1782
Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln Pro Val Ser Val
570 575 580
gtc aaa aag gcg tat cag aaa ctg tgc tac att cat cat atc atg gga 1830
Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His His Ile Met Gly
585 590 595
aag gtg cca gac gct tgc act gcc tgc gat ctg gtc aat gtg gat ttg 1878
Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val Asn Val Asp Leu
600 605 610
gat gac tgc atc ttt gaa caa taaatgattt aaatcaggt atg gct gcc gat 1930
Asp Asp Cys Ile Phe Glu Gln Met Ala Ala Asp
615 620 625
ggt tat ctt cca gat tgg ctc gag gac aac ctt agt gaa gga att cgc 1978
Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu Gly Ile Arg
630 635 640
gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc aag gca aat caa 2026
Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro Lys Ala Asn Gln
645 650 655
caa cat caa gac aac gct cga ggt ctt gtg ctt ccg ggt tac aaa tac 2074
Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr
660 665 670
ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg gtc aac gca gca 2122
Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala
675 680 685
gac gcg gcg gcc ctc gag cac gac aag gcc tac gac cag cag ctc aag 2170
Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys
690 695 700 705
gcc gga gac aac ccg tac ctc aag tac aac cac gcc gac gcc gag ttc 2218
Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe
710 715 720
cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc aac ctc ggg cga 2266
Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly Asn Leu Gly Arg
725 730 735
gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct ctt ggt ctg gtt 2314
Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro Leu Gly Leu Val
740 745 750
gag gaa gcg gct aag acg gct cct gga aag aag agg cct gta gag cag 2362
Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln
755 760 765
tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc aaa tcg ggt gca 2410
Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala
770 775 780 785
cag ccc gct aaa aag aga ctc aat ttc ggt cag act ggc gac aca gag 2458
Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu
790 795 800
tca gtc cca gac cct caa cca atc gga gaa cct ccc gca gcc ccc tca 2506
Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser
805 810 815
ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc gca cca gtg gca 2554
Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala
820 825 830
gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc tcg gga aat tgg 2602
Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser Ser Gly Asn Trp
835 840 845
cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc acc acc agc acc 2650
His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr
850 855 860 865
cga acc tgg gcc ctg ccc acc tac aac aat cac ctc tac aag caa atc 2698
Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile
870 875 880
tcc aac agc aca tct gga gga tct tca aat gac aac gcc tac ttc ggc 2746
Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly
885 890 895
tac agc acc ccc tgg ggg tat ttt gac ttc aac aga ttc cac tgc cac 2794
Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys His
900 905 910
ttc tca cca cgt gac tgg cag cga ctc atc aac aac aac tgg gga ttc 2842
Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe
915 920 925
cgg cct aag cga ctc aac ttc aag ctc ttc aac att cag gtc aaa gag 2890
Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys Glu
930 935 940 945
gtt acg gac aac aat gga gtc aag acc atc gcc aat aac ctt acc agc 2938
Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn Asn Leu Thr Ser
950 955 960
acg gtc cag gtc ttc acg gac tca gac tat cag ctc ccg tac gtg ctc 2986
Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu
965 970 975
ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca gcg gac gtt ttc 3034
Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe
980 985 990
atg att cct cag tac ggg tat ctg acg ctt aat gat gga agc cag gcc 3082
Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala
995 1000 1005
gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc ccg tcg caa 3127
Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln
1010 1015 1020
atg cta aga acg ggt aac aac ttc cag ttc agc tac gag ttt gag 3172
Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu Phe Glu
1025 1030 1035
aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg gac 3217
Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
1040 1045 1050
cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 3262
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
1055 1060 1065
aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc 3307
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe
1070 1075 1080
agt gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac 3352
Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr
1085 1090 1095
ata cct gga ccc agc tac cga caa caa cgt gtc tca acc act gtg 3397
Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val
1100 1105 1110
act caa aac aac aac agc gaa ttt gct tgg cct gga gct tct tct 3442
Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser
1115 1120 1125
tgg gct ctc aat gga cgt aat agc ttg atg aat cct gga cct gct 3487
Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala
1130 1135 1140
atg gcc agc cac aaa gaa gga gag gac cgt ttc ttt cct ttg tct 3532
Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser
1145 1150 1155
gga tct tta att ttt ggc aaa caa gga act gga aga gac aac gtg 3577
Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val
1160 1165 1170
gat gcg gac aaa gtc atg ata acc aac gaa gaa gaa att aaa act 3622
Asp Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr
1175 1180 1185
act aac ccg gta gca acg gag tcc tat gga caa gtg gcc aca aac 3667
Thr Asn Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn
1190 1195 1200
cac cag agt gcc caa gag ttc agc agc aac acc gtg aag ctg acc 3712
His Gln Ser Ala Gln Glu Phe Ser Ser Asn Thr Val Lys Leu Thr
1205 1210 1215
agc gca cag gcg cag acc ggc tgg gtt caa aac caa gga ata ctt 3757
Ser Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile Leu
1220 1225 1230
ccg ggt atg gtt tgg cag gac aga gat gtg tac ctg caa gga ccc 3802
Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro
1235 1240 1245
att tgg gcc aaa att cct cac acg gac ggc aac ttt cac cct tct 3847
Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser
1250 1255 1260
ccg ctg atg gga ggg ttt gga atg aag cac ccg cct cct cag atc 3892
Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile
1265 1270 1275
ctc atc aaa aac aca cct gta cct gcg gat cct cca acg gcc ttc 3937
Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe
1280 1285 1290
aac aag gac aag ctg aac tct ttc atc acc cag tat tct act ggc 3982
Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly
1295 1300 1305
caa gtc agc gtg gag atc gag tgg gag ctg cag aag gaa aac agc 4027
Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser
1310 1315 1320
aag cgc tgg aac ccg gag atc cag tac act tcc aac tat tac aag 4072
Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys
1325 1330 1335
tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gta tat agt 4117
Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser
1340 1345 1350
gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg taa 4162
Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
1355 1360 1365
ttgcttgtta atcaataaac cgtttaattc gtttcagttg aactttggtc tctgcgaagg 4222
gcgaattcgt ttaaacctgc aggactagag gtcctgtatt agaggtcacg tgagtgtttt 4282
gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg agcacgcagg 4342
gtctccattt tgaagcggga ggtttgaacg cgcagccgcc aagccgaatt ctgcagatat 4402
ccatcacact ggcggccgct cgactagagc ggccgccacc gcggtggagc tccagctttt 4462
gttcccttta gtgagggtta attgcgcgct tggcgtaatc atggtcatag ctgtttcctg 4522
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 4582
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 4642
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 4702
gaggcggttt gcgtattggg cgc 4725
<210> 2
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 2
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 3
<211> 747
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 3
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Glu Phe Ser Ser
580 585 590
Asn Thr Val Lys Leu Thr Ser Ala Gln Ala Gln Thr Gly Trp Val Gln
595 600 605
Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr
610 615 620
Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe
625 630 635 640
His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro
645 650 655
Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala
660 665 670
Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly
675 680 685
Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys
690 695 700
Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn
705 710 715 720
Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg
725 730 735
Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 4
<211> 4728
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV2/9 n.588.IEI nucleic acid sequence expression cassette
<220>
<221> misc_feature
<222> (1)..(36)
<223> truncated promoter
<220>
<221> promoter
<222> (1)..(7)
<223> p5 promoter
<220>
<221> CDS
<222> (37)..(1899)
<223> AAV2-Rep
<220>
<221> CDS
<222> (1919)..(4165)
<223> AAV9 Cap
<220>
<221> misc_feature
<222> (3683)..(3718)
<223> IEI
<220>
<221> misc_feature
<222> (4256)..(4386)
<223> p5 promoter
<220>
<221> misc_feature
<222> (4514)..(4728)
<223> LacZ promoter
<400> 4
ccattttgaa gcgggaggtt tgaacgcgca gccgcc atg ccg ggg ttt tac gag 54
Met Pro Gly Phe Tyr Glu
1 5
att gtg att aag gtc ccc agc gac ctt gac gag cat ctg ccc ggc att 102
Ile Val Ile Lys Val Pro Ser Asp Leu Asp Glu His Leu Pro Gly Ile
10 15 20
tct gac agc ttt gtg aac tgg gtg gcc gag aag gaa tgg gag ttg ccg 150
Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys Glu Trp Glu Leu Pro
25 30 35
cca gat tct gac atg gat ctg aat ctg att gag cag gca ccc ctg acc 198
Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu Gln Ala Pro Leu Thr
40 45 50
gtg gcc gag aag ctg cag cgc gac ttt ctg acg gaa tgg cgc cgt gtg 246
Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr Glu Trp Arg Arg Val
55 60 65 70
agt aag gcc ccg gag gct ctt ttc ttt gtg caa ttt gag aag gga gag 294
Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln Phe Glu Lys Gly Glu
75 80 85
agc tac ttc cac atg cac gtg ctc gtg gaa acc acc ggg gtg aaa tcc 342
Ser Tyr Phe His Met His Val Leu Val Glu Thr Thr Gly Val Lys Ser
90 95 100
atg gtt ttg gga cgt ttc ctg agt cag att cgc gaa aaa ctg att cag 390
Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg Glu Lys Leu Ile Gln
105 110 115
aga att tac cgc ggg atc gag ccg act ttg cca aac tgg ttc gcg gtc 438
Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro Asn Trp Phe Ala Val
120 125 130
aca aag acc aga aat ggc gcc gga ggc ggg aac aag gtg gtg gat gag 486
Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn Lys Val Val Asp Glu
135 140 145 150
tgc tac atc ccc aat tac ttg ctc ccc aaa acc cag cct gag ctc cag 534
Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr Gln Pro Glu Leu Gln
155 160 165
tgg gcg tgg act aat atg gaa cag tat tta agc gcc tgt ttg aat ctc 582
Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser Ala Cys Leu Asn Leu
170 175 180
acg gag cgt aaa cgg ttg gtg gcg cag cat ctg acg cac gtg tcg cag 630
Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu Thr His Val Ser Gln
185 190 195
acg cag gag cag aac aaa gag aat cag aat ccc aat tct gat gcg ccg 678
Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro Asn Ser Asp Ala Pro
200 205 210
gtg atc aga tca aaa act tca gcc agg tac atg gag ctg gtc ggg tgg 726
Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met Glu Leu Val Gly Trp
215 220 225 230
ctc gtg gac aag ggg att acc tcg gag aag cag tgg atc cag gag gac 774
Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Glu Asp
235 240 245
cag gcc tca tac atc tcc ttc aat gcg gcc tcc aac tcg cgg tcc caa 822
Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn Ser Arg Ser Gln
250 255 260
atc aag gct gcc ttg gac aat gcg gga aag att atg agc ctg act aaa 870
Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met Ser Leu Thr Lys
265 270 275
acc gcc ccc gac tac ctg gtg ggc cag cag ccc gtg gag gac att tcc 918
Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val Glu Asp Ile Ser
280 285 290
agc aat cgg att tat aaa att ttg gaa cta aac ggg tac gat ccc caa 966
Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly Tyr Asp Pro Gln
295 300 305 310
tat gcg gct tcc gtc ttt ctg gga tgg gcc acg aaa aag ttc ggc aag 1014
Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys Lys Phe Gly Lys
315 320 325
agg aac acc atc tgg ctg ttt ggg cct gca act acc ggg aag acc aac 1062
Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr Gly Lys Thr Asn
330 335 340
atc gcg gag gcc ata gcc cac act gtg ccc ttc tac ggg tgc gta aac 1110
Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Val Asn
345 350 355
tgg acc aat gag aac ttt ccc ttc aac gac tgt gtc gac aag atg gtg 1158
Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Met Val
360 365 370
atc tgg tgg gag gag ggg aag atg acc gcc aag gtc gtg gag tcg gcc 1206
Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val Val Glu Ser Ala
375 380 385 390
aaa gcc att ctc gga gga agc aag gtg cgc gtg gac cag aaa tgc aag 1254
Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Cys Lys
395 400 405
tcc tcg gcc cag ata gac ccg act ccc gtg atc gtc acc tcc aac acc 1302
Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val Thr Ser Asn Thr
410 415 420
aac atg tgc gcc gtg att gac ggg aac tca acg acc ttc gaa cac cag 1350
Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr Phe Glu His Gln
425 430 435
cag ccg ttg caa gac cgg atg ttc aaa ttt gaa ctc acc cgc cgt ctg 1398
Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu Thr Arg Arg Leu
440 445 450
gat cat gac ttt ggg aag gtc acc aag cag gaa gtc aaa gac ttt ttc 1446
Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val Lys Asp Phe Phe
455 460 465 470
cgg tgg gca aag gat cac gtg gtt gag gtg gag cat gaa ttc tac gtc 1494
Arg Trp Ala Lys Asp His Val Val Glu Val Glu His Glu Phe Tyr Val
475 480 485
aaa aag ggt gga gcc aag aaa aga ccc gcc ccc agt gac gca gat ata 1542
Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser Asp Ala Asp Ile
490 495 500
agt gag ccc aaa cgg gtg cgc gag tca gtt gcg cag cca tcg acg tca 1590
Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln Pro Ser Thr Ser
505 510 515
gac gcg gaa gct tcg atc aac tac gca gac agg tac caa aac aaa tgt 1638
Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr Gln Asn Lys Cys
520 525 530
tct cgt cac gtg ggc atg aat ctg atg ctg ttt ccc tgc aga caa tgc 1686
Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro Cys Arg Gln Cys
535 540 545 550
gag aga atg aat cag aat tca aat atc tgc ttc act cac gga cag aaa 1734
Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr His Gly Gln Lys
555 560 565
gac tgt tta gag tgc ttt ccc gtg tca gaa tct caa ccc gtt tct gtc 1782
Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln Pro Val Ser Val
570 575 580
gtc aaa aag gcg tat cag aaa ctg tgc tac att cat cat atc atg gga 1830
Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His His Ile Met Gly
585 590 595
aag gtg cca gac gct tgc act gcc tgc gat ctg gtc aat gtg gat ttg 1878
Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val Asn Val Asp Leu
600 605 610
gat gac tgc atc ttt gaa caa taaatgattt aaatcaggt atg gct gcc gat 1930
Asp Asp Cys Ile Phe Glu Gln Met Ala Ala Asp
615 620 625
ggt tat ctt cca gat tgg ctc gag gac aac ctt agt gaa gga att cgc 1978
Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu Gly Ile Arg
630 635 640
gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc aag gca aat caa 2026
Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro Lys Ala Asn Gln
645 650 655
caa cat caa gac aac gct cga ggt ctt gtg ctt ccg ggt tac aaa tac 2074
Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr
660 665 670
ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg gtc aac gca gca 2122
Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala
675 680 685
gac gcg gcg gcc ctc gag cac gac aag gcc tac gac cag cag ctc aag 2170
Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys
690 695 700 705
gcc gga gac aac ccg tac ctc aag tac aac cac gcc gac gcc gag ttc 2218
Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe
710 715 720
cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc aac ctc ggg cga 2266
Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly Asn Leu Gly Arg
725 730 735
gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct ctt ggt ctg gtt 2314
Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro Leu Gly Leu Val
740 745 750
gag gaa gcg gct aag acg gct cct gga aag aag agg cct gta gag cag 2362
Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln
755 760 765
tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc aaa tcg ggt gca 2410
Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala
770 775 780 785
cag ccc gct aaa aag aga ctc aat ttc ggt cag act ggc gac aca gag 2458
Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu
790 795 800
tca gtc cca gac cct caa cca atc gga gaa cct ccc gca gcc ccc tca 2506
Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser
805 810 815
ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc gca cca gtg gca 2554
Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala
820 825 830
gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc tcg gga aat tgg 2602
Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser Ser Gly Asn Trp
835 840 845
cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc acc acc agc acc 2650
His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr
850 855 860 865
cga acc tgg gcc ctg ccc acc tac aac aat cac ctc tac aag caa atc 2698
Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile
870 875 880
tcc aac agc aca tct gga gga tct tca aat gac aac gcc tac ttc ggc 2746
Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly
885 890 895
tac agc acc ccc tgg ggg tat ttt gac ttc aac aga ttc cac tgc cac 2794
Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys His
900 905 910
ttc tca cca cgt gac tgg cag cga ctc atc aac aac aac tgg gga ttc 2842
Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe
915 920 925
cgg cct aag cga ctc aac ttc aag ctc ttc aac att cag gtc aaa gag 2890
Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys Glu
930 935 940 945
gtt acg gac aac aat gga gtc aag acc atc gcc aat aac ctt acc agc 2938
Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn Asn Leu Thr Ser
950 955 960
acg gtc cag gtc ttc acg gac tca gac tat cag ctc ccg tac gtg ctc 2986
Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu
965 970 975
ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca gcg gac gtt ttc 3034
Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe
980 985 990
atg att cct cag tac ggg tat ctg acg ctt aat gat gga agc cag gcc 3082
Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala
995 1000 1005
gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc ccg tcg caa 3127
Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln
1010 1015 1020
atg cta aga acg ggt aac aac ttc cag ttc agc tac gag ttt gag 3172
Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu Phe Glu
1025 1030 1035
aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg gac 3217
Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
1040 1045 1050
cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 3262
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
1055 1060 1065
aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc 3307
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe
1070 1075 1080
agt gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac 3352
Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr
1085 1090 1095
ata cct gga ccc agc tac cga caa caa cgt gtc tca acc act gtg 3397
Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val
1100 1105 1110
act caa aac aac aac agc gaa ttt gct tgg cct gga gct tct tct 3442
Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser
1115 1120 1125
tgg gct ctc aat gga cgt aat agc ttg atg aat cct gga cct gct 3487
Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala
1130 1135 1140
atg gcc agc cac aaa gaa gga gag gac cgt ttc ttt cct ttg tct 3532
Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser
1145 1150 1155
gga tct tta att ttt ggc aaa caa gga act gga aga gac aac gtg 3577
Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val
1160 1165 1170
gat gcg gac aaa gtc atg ata acc aac gaa gaa gaa att aaa act 3622
Asp Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr
1175 1180 1185
act aac ccg gta gca acg gag tcc tat gga caa gtg gcc aca aac 3667
Thr Asn Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn
1190 1195 1200
cac cag agt gcc caa atc gag atc aac gct acc aga gct gga acc 3712
His Gln Ser Ala Gln Ile Glu Ile Asn Ala Thr Arg Ala Gly Thr
1205 1210 1215
aac ctg gca cag gcg cag acc ggc tgg gtt caa aac caa gga ata 3757
Asn Leu Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile
1220 1225 1230
ctt ccg ggt atg gtt tgg cag gac aga gat gtg tac ctg caa gga 3802
Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly
1235 1240 1245
ccc att tgg gcc aaa att cct cac acg gac ggc aac ttt cac cct 3847
Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro
1250 1255 1260
tct ccg ctg atg gga ggg ttt gga atg aag cac ccg cct cct cag 3892
Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln
1265 1270 1275
atc ctc atc aaa aac aca cct gta cct gcg gat cct cca acg gcc 3937
Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala
1280 1285 1290
ttc aac aag gac aag ctg aac tct ttc atc acc cag tat tct act 3982
Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr
1295 1300 1305
ggc caa gtc agc gtg gag atc gag tgg gag ctg cag aag gaa aac 4027
Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn
1310 1315 1320
agc aag cgc tgg aac ccg gag atc cag tac act tcc aac tat tac 4072
Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr
1325 1330 1335
aag tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gta tat 4117
Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr
1340 1345 1350
agt gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg 4162
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
1355 1360 1365
taa ttgcttgtta atcaataaac cgtttaattc gtttcagttg aactttggtc 4215
tctgcgaagg gcgaattcgt ttaaacctgc aggactagag gtcctgtatt agaggtcacg 4275
tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg 4335
agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc aagccgaatt 4395
ctgcagatat ccatcacact ggcggccgct cgactagagc ggccgccacc gcggtggagc 4455
tccagctttt gttcccttta gtgagggtta attgcgcgct tggcgtaatc atggtcatag 4515
ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 4575
ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 4635
tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 4695
cgcgcgggga gaggcggttt gcgtattggg cgc 4728
<210> 5
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 5
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 6
<211> 748
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ile Glu Ile Asn
580 585 590
Ala Thr Arg Ala Gly Thr Asn Leu Ala Gln Ala Gln Thr Gly Trp Val
595 600 605
Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val
610 615 620
Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn
625 630 635 640
Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro
645 650 655
Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr
660 665 670
Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr
675 680 685
Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser
690 695 700
Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser
705 710 715 720
Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro
725 730 735
Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 7
<211> 4740
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV2/9 n.588.IEI-L nucleic acid sequence epxression cassette
<220>
<221> misc_feature
<222> (1)..(36)
<223> trunccated promoter
<220>
<221> promoter
<222> (1)..(7)
<223> p5 Promoter
<220>
<221> CDS
<222> (37)..(1899)
<223> AAV2 Rep
<220>
<221> CDS
<222> (1919)..(4177)
<223> AAV9 Cap
<220>
<221> misc_feature
<222> (3683)..(3739)
<223> IEI-L
<220>
<221> misc_feature
<222> (4268)..(4398)
<223> p5 promoter
<220>
<221> misc_feature
<222> (4526)..(4740)
<223> LacZ promoter
<400> 7
ccattttgaa gcgggaggtt tgaacgcgca gccgcc atg ccg ggg ttt tac gag 54
Met Pro Gly Phe Tyr Glu
1 5
att gtg att aag gtc ccc agc gac ctt gac gag cat ctg ccc ggc att 102
Ile Val Ile Lys Val Pro Ser Asp Leu Asp Glu His Leu Pro Gly Ile
10 15 20
tct gac agc ttt gtg aac tgg gtg gcc gag aag gaa tgg gag ttg ccg 150
Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys Glu Trp Glu Leu Pro
25 30 35
cca gat tct gac atg gat ctg aat ctg att gag cag gca ccc ctg acc 198
Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu Gln Ala Pro Leu Thr
40 45 50
gtg gcc gag aag ctg cag cgc gac ttt ctg acg gaa tgg cgc cgt gtg 246
Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr Glu Trp Arg Arg Val
55 60 65 70
agt aag gcc ccg gag gct ctt ttc ttt gtg caa ttt gag aag gga gag 294
Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln Phe Glu Lys Gly Glu
75 80 85
agc tac ttc cac atg cac gtg ctc gtg gaa acc acc ggg gtg aaa tcc 342
Ser Tyr Phe His Met His Val Leu Val Glu Thr Thr Gly Val Lys Ser
90 95 100
atg gtt ttg gga cgt ttc ctg agt cag att cgc gaa aaa ctg att cag 390
Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg Glu Lys Leu Ile Gln
105 110 115
aga att tac cgc ggg atc gag ccg act ttg cca aac tgg ttc gcg gtc 438
Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro Asn Trp Phe Ala Val
120 125 130
aca aag acc aga aat ggc gcc gga ggc ggg aac aag gtg gtg gat gag 486
Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn Lys Val Val Asp Glu
135 140 145 150
tgc tac atc ccc aat tac ttg ctc ccc aaa acc cag cct gag ctc cag 534
Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr Gln Pro Glu Leu Gln
155 160 165
tgg gcg tgg act aat atg gaa cag tat tta agc gcc tgt ttg aat ctc 582
Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser Ala Cys Leu Asn Leu
170 175 180
acg gag cgt aaa cgg ttg gtg gcg cag cat ctg acg cac gtg tcg cag 630
Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu Thr His Val Ser Gln
185 190 195
acg cag gag cag aac aaa gag aat cag aat ccc aat tct gat gcg ccg 678
Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro Asn Ser Asp Ala Pro
200 205 210
gtg atc aga tca aaa act tca gcc agg tac atg gag ctg gtc ggg tgg 726
Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met Glu Leu Val Gly Trp
215 220 225 230
ctc gtg gac aag ggg att acc tcg gag aag cag tgg atc cag gag gac 774
Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Glu Asp
235 240 245
cag gcc tca tac atc tcc ttc aat gcg gcc tcc aac tcg cgg tcc caa 822
Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn Ser Arg Ser Gln
250 255 260
atc aag gct gcc ttg gac aat gcg gga aag att atg agc ctg act aaa 870
Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met Ser Leu Thr Lys
265 270 275
acc gcc ccc gac tac ctg gtg ggc cag cag ccc gtg gag gac att tcc 918
Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val Glu Asp Ile Ser
280 285 290
agc aat cgg att tat aaa att ttg gaa cta aac ggg tac gat ccc caa 966
Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly Tyr Asp Pro Gln
295 300 305 310
tat gcg gct tcc gtc ttt ctg gga tgg gcc acg aaa aag ttc ggc aag 1014
Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys Lys Phe Gly Lys
315 320 325
agg aac acc atc tgg ctg ttt ggg cct gca act acc ggg aag acc aac 1062
Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr Gly Lys Thr Asn
330 335 340
atc gcg gag gcc ata gcc cac act gtg ccc ttc tac ggg tgc gta aac 1110
Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Val Asn
345 350 355
tgg acc aat gag aac ttt ccc ttc aac gac tgt gtc gac aag atg gtg 1158
Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Met Val
360 365 370
atc tgg tgg gag gag ggg aag atg acc gcc aag gtc gtg gag tcg gcc 1206
Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val Val Glu Ser Ala
375 380 385 390
aaa gcc att ctc gga gga agc aag gtg cgc gtg gac cag aaa tgc aag 1254
Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Cys Lys
395 400 405
tcc tcg gcc cag ata gac ccg act ccc gtg atc gtc acc tcc aac acc 1302
Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val Thr Ser Asn Thr
410 415 420
aac atg tgc gcc gtg att gac ggg aac tca acg acc ttc gaa cac cag 1350
Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr Phe Glu His Gln
425 430 435
cag ccg ttg caa gac cgg atg ttc aaa ttt gaa ctc acc cgc cgt ctg 1398
Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu Thr Arg Arg Leu
440 445 450
gat cat gac ttt ggg aag gtc acc aag cag gaa gtc aaa gac ttt ttc 1446
Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val Lys Asp Phe Phe
455 460 465 470
cgg tgg gca aag gat cac gtg gtt gag gtg gag cat gaa ttc tac gtc 1494
Arg Trp Ala Lys Asp His Val Val Glu Val Glu His Glu Phe Tyr Val
475 480 485
aaa aag ggt gga gcc aag aaa aga ccc gcc ccc agt gac gca gat ata 1542
Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser Asp Ala Asp Ile
490 495 500
agt gag ccc aaa cgg gtg cgc gag tca gtt gcg cag cca tcg acg tca 1590
Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln Pro Ser Thr Ser
505 510 515
gac gcg gaa gct tcg atc aac tac gca gac agg tac caa aac aaa tgt 1638
Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr Gln Asn Lys Cys
520 525 530
tct cgt cac gtg ggc atg aat ctg atg ctg ttt ccc tgc aga caa tgc 1686
Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro Cys Arg Gln Cys
535 540 545 550
gag aga atg aat cag aat tca aat atc tgc ttc act cac gga cag aaa 1734
Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr His Gly Gln Lys
555 560 565
gac tgt tta gag tgc ttt ccc gtg tca gaa tct caa ccc gtt tct gtc 1782
Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln Pro Val Ser Val
570 575 580
gtc aaa aag gcg tat cag aaa ctg tgc tac att cat cat atc atg gga 1830
Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His His Ile Met Gly
585 590 595
aag gtg cca gac gct tgc act gcc tgc gat ctg gtc aat gtg gat ttg 1878
Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val Asn Val Asp Leu
600 605 610
gat gac tgc atc ttt gaa caa taaatgattt aaatcaggt atg gct gcc gat 1930
Asp Asp Cys Ile Phe Glu Gln Met Ala Ala Asp
615 620 625
ggt tat ctt cca gat tgg ctc gag gac aac ctt agt gaa gga att cgc 1978
Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu Gly Ile Arg
630 635 640
gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc aag gca aat caa 2026
Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro Lys Ala Asn Gln
645 650 655
caa cat caa gac aac gct cga ggt ctt gtg ctt ccg ggt tac aaa tac 2074
Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr
660 665 670
ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg gtc aac gca gca 2122
Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala
675 680 685
gac gcg gcg gcc ctc gag cac gac aag gcc tac gac cag cag ctc aag 2170
Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys
690 695 700 705
gcc gga gac aac ccg tac ctc aag tac aac cac gcc gac gcc gag ttc 2218
Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe
710 715 720
cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc aac ctc ggg cga 2266
Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly Asn Leu Gly Arg
725 730 735
gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct ctt ggt ctg gtt 2314
Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro Leu Gly Leu Val
740 745 750
gag gaa gcg gct aag acg gct cct gga aag aag agg cct gta gag cag 2362
Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln
755 760 765
tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc aaa tcg ggt gca 2410
Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala
770 775 780 785
cag ccc gct aaa aag aga ctc aat ttc ggt cag act ggc gac aca gag 2458
Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu
790 795 800
tca gtc cca gac cct caa cca atc gga gaa cct ccc gca gcc ccc tca 2506
Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser
805 810 815
ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc gca cca gtg gca 2554
Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala
820 825 830
gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc tcg gga aat tgg 2602
Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser Ser Gly Asn Trp
835 840 845
cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc acc acc agc acc 2650
His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr
850 855 860 865
cga acc tgg gcc ctg ccc acc tac aac aat cac ctc tac aag caa atc 2698
Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile
870 875 880
tcc aac agc aca tct gga gga tct tca aat gac aac gcc tac ttc ggc 2746
Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly
885 890 895
tac agc acc ccc tgg ggg tat ttt gac ttc aac aga ttc cac tgc cac 2794
Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys His
900 905 910
ttc tca cca cgt gac tgg cag cga ctc atc aac aac aac tgg gga ttc 2842
Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe
915 920 925
cgg cct aag cga ctc aac ttc aag ctc ttc aac att cag gtc aaa gag 2890
Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys Glu
930 935 940 945
gtt acg gac aac aat gga gtc aag acc atc gcc aat aac ctt acc agc 2938
Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn Asn Leu Thr Ser
950 955 960
acg gtc cag gtc ttc acg gac tca gac tat cag ctc ccg tac gtg ctc 2986
Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu
965 970 975
ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca gcg gac gtt ttc 3034
Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe
980 985 990
atg att cct cag tac ggg tat ctg acg ctt aat gat gga agc cag gcc 3082
Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala
995 1000 1005
gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc ccg tcg caa 3127
Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln
1010 1015 1020
atg cta aga acg ggt aac aac ttc cag ttc agc tac gag ttt gag 3172
Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu Phe Glu
1025 1030 1035
aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg gac 3217
Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
1040 1045 1050
cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 3262
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
1055 1060 1065
aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc 3307
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe
1070 1075 1080
agt gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac 3352
Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr
1085 1090 1095
ata cct gga ccc agc tac cga caa caa cgt gtc tca acc act gtg 3397
Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val
1100 1105 1110
act caa aac aac aac agc gaa ttt gct tgg cct gga gct tct tct 3442
Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser
1115 1120 1125
tgg gct ctc aat gga cgt aat agc ttg atg aat cct gga cct gct 3487
Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala
1130 1135 1140
atg gcc agc cac aaa gaa gga gag gac cgt ttc ttt cct ttg tct 3532
Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser
1145 1150 1155
gga tct tta att ttt ggc aaa caa gga act gga aga gac aac gtg 3577
Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val
1160 1165 1170
gat gcg gac aaa gtc atg ata acc aac gaa gaa gaa att aaa act 3622
Asp Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr
1175 1180 1185
act aac ccg gta gca acg gag tcc tat gga caa gtg gcc aca aac 3667
Thr Asn Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn
1190 1195 1200
cac cag agt gcc caa gga gga atc gag atc aac gct acc aga gct 3712
His Gln Ser Ala Gln Gly Gly Ile Glu Ile Asn Ala Thr Arg Ala
1205 1210 1215
gga acc aac ctg gga gga gca cag gcg cag acc ggc tgg gtt caa 3757
Gly Thr Asn Leu Gly Gly Ala Gln Ala Gln Thr Gly Trp Val Gln
1220 1225 1230
aac caa gga ata ctt ccg ggt atg gtt tgg cag gac aga gat gtg 3802
Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val
1235 1240 1245
tac ctg caa gga ccc att tgg gcc aaa att cct cac acg gac ggc 3847
Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly
1250 1255 1260
aac ttt cac cct tct ccg ctg atg gga ggg ttt gga atg aag cac 3892
Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His
1265 1270 1275
ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg gat 3937
Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp
1280 1285 1290
cct cca acg gcc ttc aac aag gac aag ctg aac tct ttc atc acc 3982
Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
1295 1300 1305
cag tat tct act ggc caa gtc agc gtg gag atc gag tgg gag ctg 4027
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
1310 1315 1320
cag aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act 4072
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
1325 1330 1335
tcc aac tat tac aag tct aat aat gtt gaa ttt gct gtt aat act 4117
Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr
1340 1345 1350
gaa ggt gta tat agt gaa ccc cgc ccc att ggc acc aga tac ctg 4162
Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu
1355 1360 1365
act cgt aat ctg taa ttgcttgtta atcaataaac cgtttaattc gtttcagttg 4217
Thr Arg Asn Leu
1370
aactttggtc tctgcgaagg gcgaattcgt ttaaacctgc aggactagag gtcctgtatt 4277
agaggtcacg tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta 4337
agcccgagtg agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc 4397
aagccgaatt ctgcagatat ccatcacact ggcggccgct cgactagagc ggccgccacc 4457
gcggtggagc tccagctttt gttcccttta gtgagggtta attgcgcgct tggcgtaatc 4517
atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 4577
agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 4637
tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 4697
aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgc 4740
<210> 8
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 8
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 9
<211> 752
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 9
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Gly Gly Ile Glu
580 585 590
Ile Asn Ala Thr Arg Ala Gly Thr Asn Leu Gly Gly Ala Gln Ala Gln
595 600 605
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
610 615 620
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
625 630 635 640
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
645 650 655
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
660 665 670
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
675 680 685
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
690 695 700
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
705 710 715 720
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
725 730 735
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745 750
<210> 10
<211> 4722
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV2/9 n.588.SAN nucleic acid sequence expression cassette
<220>
<221> misc_feature
<222> (1)..(36)
<223> truncated promoter
<220>
<221> promoter
<222> (1)..(7)
<223> p5 promoter
<220>
<221> CDS
<222> (37)..(1899)
<223> AAV2 Rep
<220>
<221> CDS
<222> (1919)..(4159)
<223> AAV 9 Cap
<220>
<221> misc_feature
<222> (3683)..(3712)
<223> SAN
<220>
<221> misc_feature
<222> (4250)..(4380)
<223> p5 promoter
<220>
<221> misc_feature
<222> (4508)..(4722)
<223> LacZ promoter
<400> 10
ccattttgaa gcgggaggtt tgaacgcgca gccgcc atg ccg ggg ttt tac gag 54
Met Pro Gly Phe Tyr Glu
1 5
att gtg att aag gtc ccc agc gac ctt gac gag cat ctg ccc ggc att 102
Ile Val Ile Lys Val Pro Ser Asp Leu Asp Glu His Leu Pro Gly Ile
10 15 20
tct gac agc ttt gtg aac tgg gtg gcc gag aag gaa tgg gag ttg ccg 150
Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys Glu Trp Glu Leu Pro
25 30 35
cca gat tct gac atg gat ctg aat ctg att gag cag gca ccc ctg acc 198
Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu Gln Ala Pro Leu Thr
40 45 50
gtg gcc gag aag ctg cag cgc gac ttt ctg acg gaa tgg cgc cgt gtg 246
Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr Glu Trp Arg Arg Val
55 60 65 70
agt aag gcc ccg gag gct ctt ttc ttt gtg caa ttt gag aag gga gag 294
Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln Phe Glu Lys Gly Glu
75 80 85
agc tac ttc cac atg cac gtg ctc gtg gaa acc acc ggg gtg aaa tcc 342
Ser Tyr Phe His Met His Val Leu Val Glu Thr Thr Gly Val Lys Ser
90 95 100
atg gtt ttg gga cgt ttc ctg agt cag att cgc gaa aaa ctg att cag 390
Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg Glu Lys Leu Ile Gln
105 110 115
aga att tac cgc ggg atc gag ccg act ttg cca aac tgg ttc gcg gtc 438
Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro Asn Trp Phe Ala Val
120 125 130
aca aag acc aga aat ggc gcc gga ggc ggg aac aag gtg gtg gat gag 486
Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn Lys Val Val Asp Glu
135 140 145 150
tgc tac atc ccc aat tac ttg ctc ccc aaa acc cag cct gag ctc cag 534
Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr Gln Pro Glu Leu Gln
155 160 165
tgg gcg tgg act aat atg gaa cag tat tta agc gcc tgt ttg aat ctc 582
Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser Ala Cys Leu Asn Leu
170 175 180
acg gag cgt aaa cgg ttg gtg gcg cag cat ctg acg cac gtg tcg cag 630
Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu Thr His Val Ser Gln
185 190 195
acg cag gag cag aac aaa gag aat cag aat ccc aat tct gat gcg ccg 678
Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro Asn Ser Asp Ala Pro
200 205 210
gtg atc aga tca aaa act tca gcc agg tac atg gag ctg gtc ggg tgg 726
Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met Glu Leu Val Gly Trp
215 220 225 230
ctc gtg gac aag ggg att acc tcg gag aag cag tgg atc cag gag gac 774
Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Glu Asp
235 240 245
cag gcc tca tac atc tcc ttc aat gcg gcc tcc aac tcg cgg tcc caa 822
Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn Ser Arg Ser Gln
250 255 260
atc aag gct gcc ttg gac aat gcg gga aag att atg agc ctg act aaa 870
Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met Ser Leu Thr Lys
265 270 275
acc gcc ccc gac tac ctg gtg ggc cag cag ccc gtg gag gac att tcc 918
Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val Glu Asp Ile Ser
280 285 290
agc aat cgg att tat aaa att ttg gaa cta aac ggg tac gat ccc caa 966
Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly Tyr Asp Pro Gln
295 300 305 310
tat gcg gct tcc gtc ttt ctg gga tgg gcc acg aaa aag ttc ggc aag 1014
Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys Lys Phe Gly Lys
315 320 325
agg aac acc atc tgg ctg ttt ggg cct gca act acc ggg aag acc aac 1062
Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr Gly Lys Thr Asn
330 335 340
atc gcg gag gcc ata gcc cac act gtg ccc ttc tac ggg tgc gta aac 1110
Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Val Asn
345 350 355
tgg acc aat gag aac ttt ccc ttc aac gac tgt gtc gac aag atg gtg 1158
Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Met Val
360 365 370
atc tgg tgg gag gag ggg aag atg acc gcc aag gtc gtg gag tcg gcc 1206
Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val Val Glu Ser Ala
375 380 385 390
aaa gcc att ctc gga gga agc aag gtg cgc gtg gac cag aaa tgc aag 1254
Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Cys Lys
395 400 405
tcc tcg gcc cag ata gac ccg act ccc gtg atc gtc acc tcc aac acc 1302
Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val Thr Ser Asn Thr
410 415 420
aac atg tgc gcc gtg att gac ggg aac tca acg acc ttc gaa cac cag 1350
Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr Phe Glu His Gln
425 430 435
cag ccg ttg caa gac cgg atg ttc aaa ttt gaa ctc acc cgc cgt ctg 1398
Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu Thr Arg Arg Leu
440 445 450
gat cat gac ttt ggg aag gtc acc aag cag gaa gtc aaa gac ttt ttc 1446
Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val Lys Asp Phe Phe
455 460 465 470
cgg tgg gca aag gat cac gtg gtt gag gtg gag cat gaa ttc tac gtc 1494
Arg Trp Ala Lys Asp His Val Val Glu Val Glu His Glu Phe Tyr Val
475 480 485
aaa aag ggt gga gcc aag aaa aga ccc gcc ccc agt gac gca gat ata 1542
Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser Asp Ala Asp Ile
490 495 500
agt gag ccc aaa cgg gtg cgc gag tca gtt gcg cag cca tcg acg tca 1590
Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln Pro Ser Thr Ser
505 510 515
gac gcg gaa gct tcg atc aac tac gca gac agg tac caa aac aaa tgt 1638
Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr Gln Asn Lys Cys
520 525 530
tct cgt cac gtg ggc atg aat ctg atg ctg ttt ccc tgc aga caa tgc 1686
Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro Cys Arg Gln Cys
535 540 545 550
gag aga atg aat cag aat tca aat atc tgc ttc act cac gga cag aaa 1734
Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr His Gly Gln Lys
555 560 565
gac tgt tta gag tgc ttt ccc gtg tca gaa tct caa ccc gtt tct gtc 1782
Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln Pro Val Ser Val
570 575 580
gtc aaa aag gcg tat cag aaa ctg tgc tac att cat cat atc atg gga 1830
Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His His Ile Met Gly
585 590 595
aag gtg cca gac gct tgc act gcc tgc gat ctg gtc aat gtg gat ttg 1878
Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val Asn Val Asp Leu
600 605 610
gat gac tgc atc ttt gaa caa taaatgattt aaatcaggt atg gct gcc gat 1930
Asp Asp Cys Ile Phe Glu Gln Met Ala Ala Asp
615 620 625
ggt tat ctt cca gat tgg ctc gag gac aac ctt agt gaa gga att cgc 1978
Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu Gly Ile Arg
630 635 640
gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc aag gca aat caa 2026
Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro Lys Ala Asn Gln
645 650 655
caa cat caa gac aac gct cga ggt ctt gtg ctt ccg ggt tac aaa tac 2074
Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr
660 665 670
ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg gtc aac gca gca 2122
Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala
675 680 685
gac gcg gcg gcc ctc gag cac gac aag gcc tac gac cag cag ctc aag 2170
Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys
690 695 700 705
gcc gga gac aac ccg tac ctc aag tac aac cac gcc gac gcc gag ttc 2218
Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe
710 715 720
cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc aac ctc ggg cga 2266
Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly Asn Leu Gly Arg
725 730 735
gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct ctt ggt ctg gtt 2314
Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro Leu Gly Leu Val
740 745 750
gag gaa gcg gct aag acg gct cct gga aag aag agg cct gta gag cag 2362
Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln
755 760 765
tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc aaa tcg ggt gca 2410
Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala
770 775 780 785
cag ccc gct aaa aag aga ctc aat ttc ggt cag act ggc gac aca gag 2458
Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu
790 795 800
tca gtc cca gac cct caa cca atc gga gaa cct ccc gca gcc ccc tca 2506
Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser
805 810 815
ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc gca cca gtg gca 2554
Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala
820 825 830
gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc tcg gga aat tgg 2602
Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser Ser Gly Asn Trp
835 840 845
cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc acc acc agc acc 2650
His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr
850 855 860 865
cga acc tgg gcc ctg ccc acc tac aac aat cac ctc tac aag caa atc 2698
Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile
870 875 880
tcc aac agc aca tct gga gga tct tca aat gac aac gcc tac ttc ggc 2746
Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly
885 890 895
tac agc acc ccc tgg ggg tat ttt gac ttc aac aga ttc cac tgc cac 2794
Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys His
900 905 910
ttc tca cca cgt gac tgg cag cga ctc atc aac aac aac tgg gga ttc 2842
Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe
915 920 925
cgg cct aag cga ctc aac ttc aag ctc ttc aac att cag gtc aaa gag 2890
Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys Glu
930 935 940 945
gtt acg gac aac aat gga gtc aag acc atc gcc aat aac ctt acc agc 2938
Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn Asn Leu Thr Ser
950 955 960
acg gtc cag gtc ttc acg gac tca gac tat cag ctc ccg tac gtg ctc 2986
Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu
965 970 975
ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca gcg gac gtt ttc 3034
Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe
980 985 990
atg att cct cag tac ggg tat ctg acg ctt aat gat gga agc cag gcc 3082
Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala
995 1000 1005
gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc ccg tcg caa 3127
Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln
1010 1015 1020
atg cta aga acg ggt aac aac ttc cag ttc agc tac gag ttt gag 3172
Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu Phe Glu
1025 1030 1035
aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg gac 3217
Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
1040 1045 1050
cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 3262
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
1055 1060 1065
aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc 3307
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe
1070 1075 1080
agt gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac 3352
Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr
1085 1090 1095
ata cct gga ccc agc tac cga caa caa cgt gtc tca acc act gtg 3397
Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val
1100 1105 1110
act caa aac aac aac agc gaa ttt gct tgg cct gga gct tct tct 3442
Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser
1115 1120 1125
tgg gct ctc aat gga cgt aat agc ttg atg aat cct gga cct gct 3487
Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala
1130 1135 1140
atg gcc agc cac aaa gaa gga gag gac cgt ttc ttt cct ttg tct 3532
Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser
1145 1150 1155
gga tct tta att ttt ggc aaa caa gga act gga aga gac aac gtg 3577
Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val
1160 1165 1170
gat gcg gac aaa gtc atg ata acc aac gaa gaa gaa att aaa act 3622
Asp Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr
1175 1180 1185
act aac ccg gta gca acg gag tcc tat gga caa gtg gcc aca aac 3667
Thr Asn Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn
1190 1195 1200
cac cag agt gcc caa agc gct aac ttc atc aag cct acc agc tac 3712
His Gln Ser Ala Gln Ser Ala Asn Phe Ile Lys Pro Thr Ser Tyr
1205 1210 1215
gca cag gcg cag acc ggc tgg gtt caa aac caa gga ata ctt ccg 3757
Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro
1220 1225 1230
ggt atg gtt tgg cag gac aga gat gtg tac ctg caa gga ccc att 3802
Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile
1235 1240 1245
tgg gcc aaa att cct cac acg gac ggc aac ttt cac cct tct ccg 3847
Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro
1250 1255 1260
ctg atg gga ggg ttt gga atg aag cac ccg cct cct cag atc ctc 3892
Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile Leu
1265 1270 1275
atc aaa aac aca cct gta cct gcg gat cct cca acg gcc ttc aac 3937
Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe Asn
1280 1285 1290
aag gac aag ctg aac tct ttc atc acc cag tat tct act ggc caa 3982
Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln
1295 1300 1305
gtc agc gtg gag atc gag tgg gag ctg cag aag gaa aac agc aag 4027
Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys
1310 1315 1320
cgc tgg aac ccg gag atc cag tac act tcc aac tat tac aag tct 4072
Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser
1325 1330 1335
aat aat gtt gaa ttt gct gtt aat act gaa ggt gta tat agt gaa 4117
Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu
1340 1345 1350
ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg taa 4159
Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
1355 1360 1365
ttgcttgtta atcaataaac cgtttaattc gtttcagttg aactttggtc tctgcgaagg 4219
gcgaattcgt ttaaacctgc aggactagag gtcctgtatt agaggtcacg tgagtgtttt 4279
gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg agcacgcagg 4339
gtctccattt tgaagcggga ggtttgaacg cgcagccgcc aagccgaatt ctgcagatat 4399
ccatcacact ggcggccgct cgactagagc ggccgccacc gcggtggagc tccagctttt 4459
gttcccttta gtgagggtta attgcgcgct tggcgtaatc atggtcatag ctgtttcctg 4519
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 4579
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 4639
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 4699
gaggcggttt gcgtattggg cgc 4722
<210> 11
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 11
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 12
<211> 746
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ser Ala Asn Phe
580 585 590
Ile Lys Pro Thr Ser Tyr Ala Gln Ala Gln Thr Gly Trp Val Gln Asn
595 600 605
Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu
610 615 620
Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His
625 630 635 640
Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln
645 650 655
Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe
660 665 670
Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln
675 680 685
Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg
690 695 700
Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn
705 710 715 720
Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro
725 730 735
Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 13
<211> 4725
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV2/9 n.588.SSN nucleic acid sequence expression cassette
<220>
<221> misc_feature
<222> (1)..(36)
<223> trunctaed promoter
<220>
<221> promoter
<222> (1)..(7)
<223> p5 promoter
<220>
<221> CDS
<222> (37)..(1899)
<223> AAV2 Rep
<220>
<221> CDS
<222> (1919)..(4162)
<223> AAV9 Cap
<220>
<221> misc_feature
<222> (3683)..(3715)
<223> SSN
<220>
<221> misc_feature
<222> (4253)..(4383)
<223> p5 promoter
<220>
<221> misc_feature
<222> (4511)..(4725)
<223> LacZ promoter
<400> 13
ccattttgaa gcgggaggtt tgaacgcgca gccgcc atg ccg ggg ttt tac gag 54
Met Pro Gly Phe Tyr Glu
1 5
att gtg att aag gtc ccc agc gac ctt gac gag cat ctg ccc ggc att 102
Ile Val Ile Lys Val Pro Ser Asp Leu Asp Glu His Leu Pro Gly Ile
10 15 20
tct gac agc ttt gtg aac tgg gtg gcc gag aag gaa tgg gag ttg ccg 150
Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys Glu Trp Glu Leu Pro
25 30 35
cca gat tct gac atg gat ctg aat ctg att gag cag gca ccc ctg acc 198
Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu Gln Ala Pro Leu Thr
40 45 50
gtg gcc gag aag ctg cag cgc gac ttt ctg acg gaa tgg cgc cgt gtg 246
Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr Glu Trp Arg Arg Val
55 60 65 70
agt aag gcc ccg gag gct ctt ttc ttt gtg caa ttt gag aag gga gag 294
Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln Phe Glu Lys Gly Glu
75 80 85
agc tac ttc cac atg cac gtg ctc gtg gaa acc acc ggg gtg aaa tcc 342
Ser Tyr Phe His Met His Val Leu Val Glu Thr Thr Gly Val Lys Ser
90 95 100
atg gtt ttg gga cgt ttc ctg agt cag att cgc gaa aaa ctg att cag 390
Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg Glu Lys Leu Ile Gln
105 110 115
aga att tac cgc ggg atc gag ccg act ttg cca aac tgg ttc gcg gtc 438
Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro Asn Trp Phe Ala Val
120 125 130
aca aag acc aga aat ggc gcc gga ggc ggg aac aag gtg gtg gat gag 486
Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn Lys Val Val Asp Glu
135 140 145 150
tgc tac atc ccc aat tac ttg ctc ccc aaa acc cag cct gag ctc cag 534
Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr Gln Pro Glu Leu Gln
155 160 165
tgg gcg tgg act aat atg gaa cag tat tta agc gcc tgt ttg aat ctc 582
Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser Ala Cys Leu Asn Leu
170 175 180
acg gag cgt aaa cgg ttg gtg gcg cag cat ctg acg cac gtg tcg cag 630
Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu Thr His Val Ser Gln
185 190 195
acg cag gag cag aac aaa gag aat cag aat ccc aat tct gat gcg ccg 678
Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro Asn Ser Asp Ala Pro
200 205 210
gtg atc aga tca aaa act tca gcc agg tac atg gag ctg gtc ggg tgg 726
Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met Glu Leu Val Gly Trp
215 220 225 230
ctc gtg gac aag ggg att acc tcg gag aag cag tgg atc cag gag gac 774
Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Glu Asp
235 240 245
cag gcc tca tac atc tcc ttc aat gcg gcc tcc aac tcg cgg tcc caa 822
Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn Ser Arg Ser Gln
250 255 260
atc aag gct gcc ttg gac aat gcg gga aag att atg agc ctg act aaa 870
Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met Ser Leu Thr Lys
265 270 275
acc gcc ccc gac tac ctg gtg ggc cag cag ccc gtg gag gac att tcc 918
Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val Glu Asp Ile Ser
280 285 290
agc aat cgg att tat aaa att ttg gaa cta aac ggg tac gat ccc caa 966
Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly Tyr Asp Pro Gln
295 300 305 310
tat gcg gct tcc gtc ttt ctg gga tgg gcc acg aaa aag ttc ggc aag 1014
Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys Lys Phe Gly Lys
315 320 325
agg aac acc atc tgg ctg ttt ggg cct gca act acc ggg aag acc aac 1062
Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr Gly Lys Thr Asn
330 335 340
atc gcg gag gcc ata gcc cac act gtg ccc ttc tac ggg tgc gta aac 1110
Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Val Asn
345 350 355
tgg acc aat gag aac ttt ccc ttc aac gac tgt gtc gac aag atg gtg 1158
Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Met Val
360 365 370
atc tgg tgg gag gag ggg aag atg acc gcc aag gtc gtg gag tcg gcc 1206
Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val Val Glu Ser Ala
375 380 385 390
aaa gcc att ctc gga gga agc aag gtg cgc gtg gac cag aaa tgc aag 1254
Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Cys Lys
395 400 405
tcc tcg gcc cag ata gac ccg act ccc gtg atc gtc acc tcc aac acc 1302
Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val Thr Ser Asn Thr
410 415 420
aac atg tgc gcc gtg att gac ggg aac tca acg acc ttc gaa cac cag 1350
Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr Phe Glu His Gln
425 430 435
cag ccg ttg caa gac cgg atg ttc aaa ttt gaa ctc acc cgc cgt ctg 1398
Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu Thr Arg Arg Leu
440 445 450
gat cat gac ttt ggg aag gtc acc aag cag gaa gtc aaa gac ttt ttc 1446
Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val Lys Asp Phe Phe
455 460 465 470
cgg tgg gca aag gat cac gtg gtt gag gtg gag cat gaa ttc tac gtc 1494
Arg Trp Ala Lys Asp His Val Val Glu Val Glu His Glu Phe Tyr Val
475 480 485
aaa aag ggt gga gcc aag aaa aga ccc gcc ccc agt gac gca gat ata 1542
Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser Asp Ala Asp Ile
490 495 500
agt gag ccc aaa cgg gtg cgc gag tca gtt gcg cag cca tcg acg tca 1590
Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln Pro Ser Thr Ser
505 510 515
gac gcg gaa gct tcg atc aac tac gca gac agg tac caa aac aaa tgt 1638
Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr Gln Asn Lys Cys
520 525 530
tct cgt cac gtg ggc atg aat ctg atg ctg ttt ccc tgc aga caa tgc 1686
Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro Cys Arg Gln Cys
535 540 545 550
gag aga atg aat cag aat tca aat atc tgc ttc act cac gga cag aaa 1734
Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr His Gly Gln Lys
555 560 565
gac tgt tta gag tgc ttt ccc gtg tca gaa tct caa ccc gtt tct gtc 1782
Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln Pro Val Ser Val
570 575 580
gtc aaa aag gcg tat cag aaa ctg tgc tac att cat cat atc atg gga 1830
Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His His Ile Met Gly
585 590 595
aag gtg cca gac gct tgc act gcc tgc gat ctg gtc aat gtg gat ttg 1878
Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val Asn Val Asp Leu
600 605 610
gat gac tgc atc ttt gaa caa taaatgattt aaatcaggt atg gct gcc gat 1930
Asp Asp Cys Ile Phe Glu Gln Met Ala Ala Asp
615 620 625
ggt tat ctt cca gat tgg ctc gag gac aac ctt agt gaa gga att cgc 1978
Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu Gly Ile Arg
630 635 640
gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc aag gca aat caa 2026
Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro Lys Ala Asn Gln
645 650 655
caa cat caa gac aac gct cga ggt ctt gtg ctt ccg ggt tac aaa tac 2074
Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr
660 665 670
ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg gtc aac gca gca 2122
Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala
675 680 685
gac gcg gcg gcc ctc gag cac gac aag gcc tac gac cag cag ctc aag 2170
Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys
690 695 700 705
gcc gga gac aac ccg tac ctc aag tac aac cac gcc gac gcc gag ttc 2218
Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe
710 715 720
cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc aac ctc ggg cga 2266
Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly Asn Leu Gly Arg
725 730 735
gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct ctt ggt ctg gtt 2314
Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro Leu Gly Leu Val
740 745 750
gag gaa gcg gct aag acg gct cct gga aag aag agg cct gta gag cag 2362
Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln
755 760 765
tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc aaa tcg ggt gca 2410
Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala
770 775 780 785
cag ccc gct aaa aag aga ctc aat ttc ggt cag act ggc gac aca gag 2458
Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu
790 795 800
tca gtc cca gac cct caa cca atc gga gaa cct ccc gca gcc ccc tca 2506
Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser
805 810 815
ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc gca cca gtg gca 2554
Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala
820 825 830
gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc tcg gga aat tgg 2602
Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser Ser Gly Asn Trp
835 840 845
cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc acc acc agc acc 2650
His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr
850 855 860 865
cga acc tgg gcc ctg ccc acc tac aac aat cac ctc tac aag caa atc 2698
Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile
870 875 880
tcc aac agc aca tct gga gga tct tca aat gac aac gcc tac ttc ggc 2746
Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly
885 890 895
tac agc acc ccc tgg ggg tat ttt gac ttc aac aga ttc cac tgc cac 2794
Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys His
900 905 910
ttc tca cca cgt gac tgg cag cga ctc atc aac aac aac tgg gga ttc 2842
Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe
915 920 925
cgg cct aag cga ctc aac ttc aag ctc ttc aac att cag gtc aaa gag 2890
Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys Glu
930 935 940 945
gtt acg gac aac aat gga gtc aag acc atc gcc aat aac ctt acc agc 2938
Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn Asn Leu Thr Ser
950 955 960
acg gtc cag gtc ttc acg gac tca gac tat cag ctc ccg tac gtg ctc 2986
Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu
965 970 975
ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca gcg gac gtt ttc 3034
Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe
980 985 990
atg att cct cag tac ggg tat ctg acg ctt aat gat gga agc cag gcc 3082
Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala
995 1000 1005
gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc ccg tcg caa 3127
Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln
1010 1015 1020
atg cta aga acg ggt aac aac ttc cag ttc agc tac gag ttt gag 3172
Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu Phe Glu
1025 1030 1035
aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg gac 3217
Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
1040 1045 1050
cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 3262
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
1055 1060 1065
aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc 3307
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe
1070 1075 1080
agt gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac 3352
Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr
1085 1090 1095
ata cct gga ccc agc tac cga caa caa cgt gtc tca acc act gtg 3397
Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val
1100 1105 1110
act caa aac aac aac agc gaa ttt gct tgg cct gga gct tct tct 3442
Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser
1115 1120 1125
tgg gct ctc aat gga cgt aat agc ttg atg aat cct gga cct gct 3487
Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala
1130 1135 1140
atg gcc agc cac aaa gaa gga gag gac cgt ttc ttt cct ttg tct 3532
Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser
1145 1150 1155
gga tct tta att ttt ggc aaa caa gga act gga aga gac aac gtg 3577
Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val
1160 1165 1170
gat gcg gac aaa gtc atg ata acc aac gaa gaa gaa att aaa act 3622
Asp Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr
1175 1180 1185
act aac ccg gta gca acg gag tcc tat gga caa gtg gcc aca aac 3667
Thr Asn Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn
1190 1195 1200
cac cag agt gcc caa agc agc aac acc gtg aag ctg acc agc gga 3712
His Gln Ser Ala Gln Ser Ser Asn Thr Val Lys Leu Thr Ser Gly
1205 1210 1215
cac gca cag gcg cag acc ggc tgg gtt caa aac caa gga ata ctt 3757
His Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile Leu
1220 1225 1230
ccg ggt atg gtt tgg cag gac aga gat gtg tac ctg caa gga ccc 3802
Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro
1235 1240 1245
att tgg gcc aaa att cct cac acg gac ggc aac ttt cac cct tct 3847
Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser
1250 1255 1260
ccg ctg atg gga ggg ttt gga atg aag cac ccg cct cct cag atc 3892
Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile
1265 1270 1275
ctc atc aaa aac aca cct gta cct gcg gat cct cca acg gcc ttc 3937
Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe
1280 1285 1290
aac aag gac aag ctg aac tct ttc atc acc cag tat tct act ggc 3982
Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly
1295 1300 1305
caa gtc agc gtg gag atc gag tgg gag ctg cag aag gaa aac agc 4027
Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser
1310 1315 1320
aag cgc tgg aac ccg gag atc cag tac act tcc aac tat tac aag 4072
Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys
1325 1330 1335
tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gta tat agt 4117
Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser
1340 1345 1350
gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg taa 4162
Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
1355 1360 1365
ttgcttgtta atcaataaac cgtttaattc gtttcagttg aactttggtc tctgcgaagg 4222
gcgaattcgt ttaaacctgc aggactagag gtcctgtatt agaggtcacg tgagtgtttt 4282
gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg agcacgcagg 4342
gtctccattt tgaagcggga ggtttgaacg cgcagccgcc aagccgaatt ctgcagatat 4402
ccatcacact ggcggccgct cgactagagc ggccgccacc gcggtggagc tccagctttt 4462
gttcccttta gtgagggtta attgcgcgct tggcgtaatc atggtcatag ctgtttcctg 4522
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 4582
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 4642
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 4702
gaggcggttt gcgtattggg cgc 4725
<210> 14
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 14
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 15
<211> 747
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 15
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ser Ser Asn Thr
580 585 590
Val Lys Leu Thr Ser Gly His Ala Gln Ala Gln Thr Gly Trp Val Gln
595 600 605
Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr
610 615 620
Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe
625 630 635 640
His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro
645 650 655
Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala
660 665 670
Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly
675 680 685
Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys
690 695 700
Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn
705 710 715 720
Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg
725 730 735
Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 16
<211> 4737
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV2/9 n.588.SSN-L nucleic acid sequence expression cassette
<220>
<221> misc_feature
<222> (1)..(36)
<223> truncated promoter
<220>
<221> promoter
<222> (1)..(7)
<223> p5 promoter
<220>
<221> CDS
<222> (37)..(1899)
<223> AAV2 Rep
<220>
<221> CDS
<222> (1919)..(4174)
<223> AAV9 Cap
<220>
<221> misc_feature
<222> (3683)..(3727)
<223> SSN-L
<220>
<221> misc_feature
<222> (4253)..(4737)
<223> LacZ promoter
<220>
<221> misc_feature
<222> (4265)..(4395)
<223> p5 promoter
<400> 16
ccattttgaa gcgggaggtt tgaacgcgca gccgcc atg ccg ggg ttt tac gag 54
Met Pro Gly Phe Tyr Glu
1 5
att gtg att aag gtc ccc agc gac ctt gac gag cat ctg ccc ggc att 102
Ile Val Ile Lys Val Pro Ser Asp Leu Asp Glu His Leu Pro Gly Ile
10 15 20
tct gac agc ttt gtg aac tgg gtg gcc gag aag gaa tgg gag ttg ccg 150
Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys Glu Trp Glu Leu Pro
25 30 35
cca gat tct gac atg gat ctg aat ctg att gag cag gca ccc ctg acc 198
Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu Gln Ala Pro Leu Thr
40 45 50
gtg gcc gag aag ctg cag cgc gac ttt ctg acg gaa tgg cgc cgt gtg 246
Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr Glu Trp Arg Arg Val
55 60 65 70
agt aag gcc ccg gag gct ctt ttc ttt gtg caa ttt gag aag gga gag 294
Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln Phe Glu Lys Gly Glu
75 80 85
agc tac ttc cac atg cac gtg ctc gtg gaa acc acc ggg gtg aaa tcc 342
Ser Tyr Phe His Met His Val Leu Val Glu Thr Thr Gly Val Lys Ser
90 95 100
atg gtt ttg gga cgt ttc ctg agt cag att cgc gaa aaa ctg att cag 390
Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg Glu Lys Leu Ile Gln
105 110 115
aga att tac cgc ggg atc gag ccg act ttg cca aac tgg ttc gcg gtc 438
Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro Asn Trp Phe Ala Val
120 125 130
aca aag acc aga aat ggc gcc gga ggc ggg aac aag gtg gtg gat gag 486
Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn Lys Val Val Asp Glu
135 140 145 150
tgc tac atc ccc aat tac ttg ctc ccc aaa acc cag cct gag ctc cag 534
Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr Gln Pro Glu Leu Gln
155 160 165
tgg gcg tgg act aat atg gaa cag tat tta agc gcc tgt ttg aat ctc 582
Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser Ala Cys Leu Asn Leu
170 175 180
acg gag cgt aaa cgg ttg gtg gcg cag cat ctg acg cac gtg tcg cag 630
Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu Thr His Val Ser Gln
185 190 195
acg cag gag cag aac aaa gag aat cag aat ccc aat tct gat gcg ccg 678
Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro Asn Ser Asp Ala Pro
200 205 210
gtg atc aga tca aaa act tca gcc agg tac atg gag ctg gtc ggg tgg 726
Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met Glu Leu Val Gly Trp
215 220 225 230
ctc gtg gac aag ggg att acc tcg gag aag cag tgg atc cag gag gac 774
Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Glu Asp
235 240 245
cag gcc tca tac atc tcc ttc aat gcg gcc tcc aac tcg cgg tcc caa 822
Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn Ser Arg Ser Gln
250 255 260
atc aag gct gcc ttg gac aat gcg gga aag att atg agc ctg act aaa 870
Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met Ser Leu Thr Lys
265 270 275
acc gcc ccc gac tac ctg gtg ggc cag cag ccc gtg gag gac att tcc 918
Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val Glu Asp Ile Ser
280 285 290
agc aat cgg att tat aaa att ttg gaa cta aac ggg tac gat ccc caa 966
Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly Tyr Asp Pro Gln
295 300 305 310
tat gcg gct tcc gtc ttt ctg gga tgg gcc acg aaa aag ttc ggc aag 1014
Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys Lys Phe Gly Lys
315 320 325
agg aac acc atc tgg ctg ttt ggg cct gca act acc ggg aag acc aac 1062
Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr Gly Lys Thr Asn
330 335 340
atc gcg gag gcc ata gcc cac act gtg ccc ttc tac ggg tgc gta aac 1110
Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Val Asn
345 350 355
tgg acc aat gag aac ttt ccc ttc aac gac tgt gtc gac aag atg gtg 1158
Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Met Val
360 365 370
atc tgg tgg gag gag ggg aag atg acc gcc aag gtc gtg gag tcg gcc 1206
Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val Val Glu Ser Ala
375 380 385 390
aaa gcc att ctc gga gga agc aag gtg cgc gtg gac cag aaa tgc aag 1254
Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Cys Lys
395 400 405
tcc tcg gcc cag ata gac ccg act ccc gtg atc gtc acc tcc aac acc 1302
Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val Thr Ser Asn Thr
410 415 420
aac atg tgc gcc gtg att gac ggg aac tca acg acc ttc gaa cac cag 1350
Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr Phe Glu His Gln
425 430 435
cag ccg ttg caa gac cgg atg ttc aaa ttt gaa ctc acc cgc cgt ctg 1398
Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu Thr Arg Arg Leu
440 445 450
gat cat gac ttt ggg aag gtc acc aag cag gaa gtc aaa gac ttt ttc 1446
Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val Lys Asp Phe Phe
455 460 465 470
cgg tgg gca aag gat cac gtg gtt gag gtg gag cat gaa ttc tac gtc 1494
Arg Trp Ala Lys Asp His Val Val Glu Val Glu His Glu Phe Tyr Val
475 480 485
aaa aag ggt gga gcc aag aaa aga ccc gcc ccc agt gac gca gat ata 1542
Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser Asp Ala Asp Ile
490 495 500
agt gag ccc aaa cgg gtg cgc gag tca gtt gcg cag cca tcg acg tca 1590
Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln Pro Ser Thr Ser
505 510 515
gac gcg gaa gct tcg atc aac tac gca gac agg tac caa aac aaa tgt 1638
Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr Gln Asn Lys Cys
520 525 530
tct cgt cac gtg ggc atg aat ctg atg ctg ttt ccc tgc aga caa tgc 1686
Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro Cys Arg Gln Cys
535 540 545 550
gag aga atg aat cag aat tca aat atc tgc ttc act cac gga cag aaa 1734
Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr His Gly Gln Lys
555 560 565
gac tgt tta gag tgc ttt ccc gtg tca gaa tct caa ccc gtt tct gtc 1782
Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln Pro Val Ser Val
570 575 580
gtc aaa aag gcg tat cag aaa ctg tgc tac att cat cat atc atg gga 1830
Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His His Ile Met Gly
585 590 595
aag gtg cca gac gct tgc act gcc tgc gat ctg gtc aat gtg gat ttg 1878
Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val Asn Val Asp Leu
600 605 610
gat gac tgc atc ttt gaa caa taaatgattt aaatcaggt atg gct gcc gat 1930
Asp Asp Cys Ile Phe Glu Gln Met Ala Ala Asp
615 620 625
ggt tat ctt cca gat tgg ctc gag gac aac ctt agt gaa gga att cgc 1978
Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu Gly Ile Arg
630 635 640
gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc aag gca aat caa 2026
Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro Lys Ala Asn Gln
645 650 655
caa cat caa gac aac gct cga ggt ctt gtg ctt ccg ggt tac aaa tac 2074
Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr
660 665 670
ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg gtc aac gca gca 2122
Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala
675 680 685
gac gcg gcg gcc ctc gag cac gac aag gcc tac gac cag cag ctc aag 2170
Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys
690 695 700 705
gcc gga gac aac ccg tac ctc aag tac aac cac gcc gac gcc gag ttc 2218
Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe
710 715 720
cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc aac ctc ggg cga 2266
Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly Asn Leu Gly Arg
725 730 735
gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct ctt ggt ctg gtt 2314
Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro Leu Gly Leu Val
740 745 750
gag gaa gcg gct aag acg gct cct gga aag aag agg cct gta gag cag 2362
Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln
755 760 765
tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc aaa tcg ggt gca 2410
Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala
770 775 780 785
cag ccc gct aaa aag aga ctc aat ttc ggt cag act ggc gac aca gag 2458
Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu
790 795 800
tca gtc cca gac cct caa cca atc gga gaa cct ccc gca gcc ccc tca 2506
Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser
805 810 815
ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc gca cca gtg gca 2554
Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala
820 825 830
gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc tcg gga aat tgg 2602
Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser Ser Gly Asn Trp
835 840 845
cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc acc acc agc acc 2650
His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr
850 855 860 865
cga acc tgg gcc ctg ccc acc tac aac aat cac ctc tac aag caa atc 2698
Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile
870 875 880
tcc aac agc aca tct gga gga tct tca aat gac aac gcc tac ttc ggc 2746
Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly
885 890 895
tac agc acc ccc tgg ggg tat ttt gac ttc aac aga ttc cac tgc cac 2794
Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys His
900 905 910
ttc tca cca cgt gac tgg cag cga ctc atc aac aac aac tgg gga ttc 2842
Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe
915 920 925
cgg cct aag cga ctc aac ttc aag ctc ttc aac att cag gtc aaa gag 2890
Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys Glu
930 935 940 945
gtt acg gac aac aat gga gtc aag acc atc gcc aat aac ctt acc agc 2938
Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn Asn Leu Thr Ser
950 955 960
acg gtc cag gtc ttc acg gac tca gac tat cag ctc ccg tac gtg ctc 2986
Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu
965 970 975
ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca gcg gac gtt ttc 3034
Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe
980 985 990
atg att cct cag tac ggg tat ctg acg ctt aat gat gga agc cag gcc 3082
Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala
995 1000 1005
gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc ccg tcg caa 3127
Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln
1010 1015 1020
atg cta aga acg ggt aac aac ttc cag ttc agc tac gag ttt gag 3172
Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu Phe Glu
1025 1030 1035
aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg gac 3217
Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
1040 1045 1050
cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 3262
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
1055 1060 1065
aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc 3307
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe
1070 1075 1080
agt gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac 3352
Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr
1085 1090 1095
ata cct gga ccc agc tac cga caa caa cgt gtc tca acc act gtg 3397
Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val
1100 1105 1110
act caa aac aac aac agc gaa ttt gct tgg cct gga gct tct tct 3442
Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser
1115 1120 1125
tgg gct ctc aat gga cgt aat agc ttg atg aat cct gga cct gct 3487
Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala
1130 1135 1140
atg gcc agc cac aaa gaa gga gag gac cgt ttc ttt cct ttg tct 3532
Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser
1145 1150 1155
gga tct tta att ttt ggc aaa caa gga act gga aga gac aac gtg 3577
Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val
1160 1165 1170
gat gcg gac aaa gtc atg ata acc aac gaa gaa gaa att aaa act 3622
Asp Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr
1175 1180 1185
act aac ccg gta gca acg gag tcc tat gga caa gtg gcc aca aac 3667
Thr Asn Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn
1190 1195 1200
cac cag agt gcc caa gga gga agc agc aac acc gtg aag ctg acc 3712
His Gln Ser Ala Gln Gly Gly Ser Ser Asn Thr Val Lys Leu Thr
1205 1210 1215
agc gga cac gga gga gca cag gcg cag acc ggc tgg gtt caa aac 3757
Ser Gly His Gly Gly Ala Gln Ala Gln Thr Gly Trp Val Gln Asn
1220 1225 1230
caa gga ata ctt ccg ggt atg gtt tgg cag gac aga gat gtg tac 3802
Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr
1235 1240 1245
ctg caa gga ccc att tgg gcc aaa att cct cac acg gac ggc aac 3847
Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn
1250 1255 1260
ttt cac cct tct ccg ctg atg gga ggg ttt gga atg aag cac ccg 3892
Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro
1265 1270 1275
cct cct cag atc ctc atc aaa aac aca cct gta cct gcg gat cct 3937
Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro
1280 1285 1290
cca acg gcc ttc aac aag gac aag ctg aac tct ttc atc acc cag 3982
Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln
1295 1300 1305
tat tct act ggc caa gtc agc gtg gag atc gag tgg gag ctg cag 4027
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
1310 1315 1320
aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act tcc 4072
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser
1325 1330 1335
aac tat tac aag tct aat aat gtt gaa ttt gct gtt aat act gaa 4117
Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu
1340 1345 1350
ggt gta tat agt gaa ccc cgc ccc att ggc acc aga tac ctg act 4162
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr
1355 1360 1365
cgt aat ctg taa ttgcttgtta atcaataaac cgtttaattc gtttcagttg 4214
Arg Asn Leu
1370
aactttggtc tctgcgaagg gcgaattcgt ttaaacctgc aggactagag gtcctgtatt 4274
agaggtcacg tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta 4334
agcccgagtg agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc 4394
aagccgaatt ctgcagatat ccatcacact ggcggccgct cgactagagc ggccgccacc 4454
gcggtggagc tccagctttt gttcccttta gtgagggtta attgcgcgct tggcgtaatc 4514
atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 4574
agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 4634
tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 4694
aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgc 4737
<210> 17
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 17
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 18
<211> 751
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 18
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Gly Gly Ser Ser
580 585 590
Asn Thr Val Lys Leu Thr Ser Gly His Gly Gly Ala Gln Ala Gln Thr
595 600 605
Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp
610 615 620
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
625 630 635 640
Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys
645 650 655
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp
660 665 670
Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln
675 680 685
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
690 695 700
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
705 710 715 720
Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr
725 730 735
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745 750
<210> 19
<211> 4740
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV2/9 n.588.VLT-L nucleic acid sequence expression cassette
<220>
<221> misc_feature
<222> (1)..(36)
<223> truncated promoter
<220>
<221> promoter
<222> (1)..(7)
<223> p5 promoter
<220>
<221> CDS
<222> (37)..(1899)
<223> AAV2 Rep
<220>
<221> CDS
<222> (1919)..(4177)
<223> AAV9 Cap
<220>
<221> misc_feature
<222> (3683)..(3730)
<223> VLT-L
<220>
<221> misc_feature
<222> (4268)..(4398)
<223> p5 promoter
<220>
<221> misc_feature
<222> (4526)..(4740)
<223> LacZ promoter
<400> 19
ccattttgaa gcgggaggtt tgaacgcgca gccgcc atg ccg ggg ttt tac gag 54
Met Pro Gly Phe Tyr Glu
1 5
att gtg att aag gtc ccc agc gac ctt gac gag cat ctg ccc ggc att 102
Ile Val Ile Lys Val Pro Ser Asp Leu Asp Glu His Leu Pro Gly Ile
10 15 20
tct gac agc ttt gtg aac tgg gtg gcc gag aag gaa tgg gag ttg ccg 150
Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys Glu Trp Glu Leu Pro
25 30 35
cca gat tct gac atg gat ctg aat ctg att gag cag gca ccc ctg acc 198
Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu Gln Ala Pro Leu Thr
40 45 50
gtg gcc gag aag ctg cag cgc gac ttt ctg acg gaa tgg cgc cgt gtg 246
Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr Glu Trp Arg Arg Val
55 60 65 70
agt aag gcc ccg gag gct ctt ttc ttt gtg caa ttt gag aag gga gag 294
Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln Phe Glu Lys Gly Glu
75 80 85
agc tac ttc cac atg cac gtg ctc gtg gaa acc acc ggg gtg aaa tcc 342
Ser Tyr Phe His Met His Val Leu Val Glu Thr Thr Gly Val Lys Ser
90 95 100
atg gtt ttg gga cgt ttc ctg agt cag att cgc gaa aaa ctg att cag 390
Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg Glu Lys Leu Ile Gln
105 110 115
aga att tac cgc ggg atc gag ccg act ttg cca aac tgg ttc gcg gtc 438
Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro Asn Trp Phe Ala Val
120 125 130
aca aag acc aga aat ggc gcc gga ggc ggg aac aag gtg gtg gat gag 486
Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn Lys Val Val Asp Glu
135 140 145 150
tgc tac atc ccc aat tac ttg ctc ccc aaa acc cag cct gag ctc cag 534
Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr Gln Pro Glu Leu Gln
155 160 165
tgg gcg tgg act aat atg gaa cag tat tta agc gcc tgt ttg aat ctc 582
Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser Ala Cys Leu Asn Leu
170 175 180
acg gag cgt aaa cgg ttg gtg gcg cag cat ctg acg cac gtg tcg cag 630
Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu Thr His Val Ser Gln
185 190 195
acg cag gag cag aac aaa gag aat cag aat ccc aat tct gat gcg ccg 678
Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro Asn Ser Asp Ala Pro
200 205 210
gtg atc aga tca aaa act tca gcc agg tac atg gag ctg gtc ggg tgg 726
Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met Glu Leu Val Gly Trp
215 220 225 230
ctc gtg gac aag ggg att acc tcg gag aag cag tgg atc cag gag gac 774
Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Glu Asp
235 240 245
cag gcc tca tac atc tcc ttc aat gcg gcc tcc aac tcg cgg tcc caa 822
Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn Ser Arg Ser Gln
250 255 260
atc aag gct gcc ttg gac aat gcg gga aag att atg agc ctg act aaa 870
Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met Ser Leu Thr Lys
265 270 275
acc gcc ccc gac tac ctg gtg ggc cag cag ccc gtg gag gac att tcc 918
Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val Glu Asp Ile Ser
280 285 290
agc aat cgg att tat aaa att ttg gaa cta aac ggg tac gat ccc caa 966
Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly Tyr Asp Pro Gln
295 300 305 310
tat gcg gct tcc gtc ttt ctg gga tgg gcc acg aaa aag ttc ggc aag 1014
Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys Lys Phe Gly Lys
315 320 325
agg aac acc atc tgg ctg ttt ggg cct gca act acc ggg aag acc aac 1062
Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr Gly Lys Thr Asn
330 335 340
atc gcg gag gcc ata gcc cac act gtg ccc ttc tac ggg tgc gta aac 1110
Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Val Asn
345 350 355
tgg acc aat gag aac ttt ccc ttc aac gac tgt gtc gac aag atg gtg 1158
Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Met Val
360 365 370
atc tgg tgg gag gag ggg aag atg acc gcc aag gtc gtg gag tcg gcc 1206
Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val Val Glu Ser Ala
375 380 385 390
aaa gcc att ctc gga gga agc aag gtg cgc gtg gac cag aaa tgc aag 1254
Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Cys Lys
395 400 405
tcc tcg gcc cag ata gac ccg act ccc gtg atc gtc acc tcc aac acc 1302
Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val Thr Ser Asn Thr
410 415 420
aac atg tgc gcc gtg att gac ggg aac tca acg acc ttc gaa cac cag 1350
Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr Phe Glu His Gln
425 430 435
cag ccg ttg caa gac cgg atg ttc aaa ttt gaa ctc acc cgc cgt ctg 1398
Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu Thr Arg Arg Leu
440 445 450
gat cat gac ttt ggg aag gtc acc aag cag gaa gtc aaa gac ttt ttc 1446
Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val Lys Asp Phe Phe
455 460 465 470
cgg tgg gca aag gat cac gtg gtt gag gtg gag cat gaa ttc tac gtc 1494
Arg Trp Ala Lys Asp His Val Val Glu Val Glu His Glu Phe Tyr Val
475 480 485
aaa aag ggt gga gcc aag aaa aga ccc gcc ccc agt gac gca gat ata 1542
Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser Asp Ala Asp Ile
490 495 500
agt gag ccc aaa cgg gtg cgc gag tca gtt gcg cag cca tcg acg tca 1590
Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln Pro Ser Thr Ser
505 510 515
gac gcg gaa gct tcg atc aac tac gca gac agg tac caa aac aaa tgt 1638
Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr Gln Asn Lys Cys
520 525 530
tct cgt cac gtg ggc atg aat ctg atg ctg ttt ccc tgc aga caa tgc 1686
Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro Cys Arg Gln Cys
535 540 545 550
gag aga atg aat cag aat tca aat atc tgc ttc act cac gga cag aaa 1734
Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr His Gly Gln Lys
555 560 565
gac tgt tta gag tgc ttt ccc gtg tca gaa tct caa ccc gtt tct gtc 1782
Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln Pro Val Ser Val
570 575 580
gtc aaa aag gcg tat cag aaa ctg tgc tac att cat cat atc atg gga 1830
Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His His Ile Met Gly
585 590 595
aag gtg cca gac gct tgc act gcc tgc gat ctg gtc aat gtg gat ttg 1878
Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val Asn Val Asp Leu
600 605 610
gat gac tgc atc ttt gaa caa taaatgattt aaatcaggt atg gct gcc gat 1930
Asp Asp Cys Ile Phe Glu Gln Met Ala Ala Asp
615 620 625
ggt tat ctt cca gat tgg ctc gag gac aac ctt agt gaa gga att cgc 1978
Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu Gly Ile Arg
630 635 640
gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc aag gca aat caa 2026
Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro Lys Ala Asn Gln
645 650 655
caa cat caa gac aac gct cga ggt ctt gtg ctt ccg ggt tac aaa tac 2074
Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr
660 665 670
ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg gtc aac gca gca 2122
Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala
675 680 685
gac gcg gcg gcc ctc gag cac gac aag gcc tac gac cag cag ctc aag 2170
Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys
690 695 700 705
gcc gga gac aac ccg tac ctc aag tac aac cac gcc gac gcc gag ttc 2218
Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe
710 715 720
cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc aac ctc ggg cga 2266
Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly Asn Leu Gly Arg
725 730 735
gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct ctt ggt ctg gtt 2314
Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro Leu Gly Leu Val
740 745 750
gag gaa gcg gct aag acg gct cct gga aag aag agg cct gta gag cag 2362
Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln
755 760 765
tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc aaa tcg ggt gca 2410
Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala
770 775 780 785
cag ccc gct aaa aag aga ctc aat ttc ggt cag act ggc gac aca gag 2458
Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu
790 795 800
tca gtc cca gac cct caa cca atc gga gaa cct ccc gca gcc ccc tca 2506
Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser
805 810 815
ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc gca cca gtg gca 2554
Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala
820 825 830
gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc tcg gga aat tgg 2602
Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser Ser Gly Asn Trp
835 840 845
cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc acc acc agc acc 2650
His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr
850 855 860 865
cga acc tgg gcc ctg ccc acc tac aac aat cac ctc tac aag caa atc 2698
Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile
870 875 880
tcc aac agc aca tct gga gga tct tca aat gac aac gcc tac ttc ggc 2746
Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly
885 890 895
tac agc acc ccc tgg ggg tat ttt gac ttc aac aga ttc cac tgc cac 2794
Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys His
900 905 910
ttc tca cca cgt gac tgg cag cga ctc atc aac aac aac tgg gga ttc 2842
Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe
915 920 925
cgg cct aag cga ctc aac ttc aag ctc ttc aac att cag gtc aaa gag 2890
Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys Glu
930 935 940 945
gtt acg gac aac aat gga gtc aag acc atc gcc aat aac ctt acc agc 2938
Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn Asn Leu Thr Ser
950 955 960
acg gtc cag gtc ttc acg gac tca gac tat cag ctc ccg tac gtg ctc 2986
Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu
965 970 975
ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca gcg gac gtt ttc 3034
Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe
980 985 990
atg att cct cag tac ggg tat ctg acg ctt aat gat gga agc cag gcc 3082
Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala
995 1000 1005
gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc ccg tcg caa 3127
Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln
1010 1015 1020
atg cta aga acg ggt aac aac ttc cag ttc agc tac gag ttt gag 3172
Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu Phe Glu
1025 1030 1035
aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg gac 3217
Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
1040 1045 1050
cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 3262
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
1055 1060 1065
aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc 3307
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe
1070 1075 1080
agt gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac 3352
Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr
1085 1090 1095
ata cct gga ccc agc tac cga caa caa cgt gtc tca acc act gtg 3397
Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val
1100 1105 1110
act caa aac aac aac agc gaa ttt gct tgg cct gga gct tct tct 3442
Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser
1115 1120 1125
tgg gct ctc aat gga cgt aat agc ttg atg aat cct gga cct gct 3487
Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala
1130 1135 1140
atg gcc agc cac aaa gaa gga gag gac cgt ttc ttt cct ttg tct 3532
Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser
1145 1150 1155
gga tct tta att ttt ggc aaa caa gga act gga aga gac aac gtg 3577
Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val
1160 1165 1170
gat gcg gac aaa gtc atg ata acc aac gaa gaa gaa att aaa act 3622
Asp Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr
1175 1180 1185
act aac ccg gta gca acg gag tcc tat gga caa gtg gcc aca aac 3667
Thr Asn Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn
1190 1195 1200
cac cag agt gcc caa gga gga gtg ctg acc aac atc gct aga gga 3712
His Gln Ser Ala Gln Gly Gly Val Leu Thr Asn Ile Ala Arg Gly
1205 1210 1215
gag tac atg aga gga gga gca cag gcg cag acc ggc tgg gtt caa 3757
Glu Tyr Met Arg Gly Gly Ala Gln Ala Gln Thr Gly Trp Val Gln
1220 1225 1230
aac caa gga ata ctt ccg ggt atg gtt tgg cag gac aga gat gtg 3802
Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val
1235 1240 1245
tac ctg caa gga ccc att tgg gcc aaa att cct cac acg gac ggc 3847
Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly
1250 1255 1260
aac ttt cac cct tct ccg ctg atg gga ggg ttt gga atg aag cac 3892
Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His
1265 1270 1275
ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg gat 3937
Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp
1280 1285 1290
cct cca acg gcc ttc aac aag gac aag ctg aac tct ttc atc acc 3982
Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
1295 1300 1305
cag tat tct act ggc caa gtc agc gtg gag atc gag tgg gag ctg 4027
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
1310 1315 1320
cag aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act 4072
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
1325 1330 1335
tcc aac tat tac aag tct aat aat gtt gaa ttt gct gtt aat act 4117
Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr
1340 1345 1350
gaa ggt gta tat agt gaa ccc cgc ccc att ggc acc aga tac ctg 4162
Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu
1355 1360 1365
act cgt aat ctg taa ttgcttgtta atcaataaac cgtttaattc gtttcagttg 4217
Thr Arg Asn Leu
1370
aactttggtc tctgcgaagg gcgaattcgt ttaaacctgc aggactagag gtcctgtatt 4277
agaggtcacg tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta 4337
agcccgagtg agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc 4397
aagccgaatt ctgcagatat ccatcacact ggcggccgct cgactagagc ggccgccacc 4457
gcggtggagc tccagctttt gttcccttta gtgagggtta attgcgcgct tggcgtaatc 4517
atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 4577
agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 4637
tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 4697
aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgc 4740
<210> 20
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 20
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 21
<211> 752
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 21
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Gly Gly Val Leu
580 585 590
Thr Asn Ile Ala Arg Gly Glu Tyr Met Arg Gly Gly Ala Gln Ala Gln
595 600 605
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
610 615 620
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
625 630 635 640
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
645 650 655
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
660 665 670
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
675 680 685
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
690 695 700
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
705 710 715 720
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
725 730 735
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745 750
<210> 22
<211> 1863
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV2 Rep nucleic acid sequence
<400> 22
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggctct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caa 1863
<210> 23
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV2 Rep amino acid sequence
<400> 23
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 24
<211> 2244
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV9 Cap n.588.EFS nucleic acid sequence
<220>
<221> misc_feature
<222> (1765)..(1797)
<223> EFS
<400> 24
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaagagttc agcagcaaca ccgtgaagct gaccagcgca 1800
caggcgcaga ccggctgggt tcaaaaccaa ggaatacttc cgggtatggt ttggcaggac 1860
agagatgtgt acctgcaagg acccatttgg gccaaaattc ctcacacgga cggcaacttt 1920
cacccttctc cgctgatggg agggtttgga atgaagcacc cgcctcctca gatcctcatc 1980
aaaaacacac ctgtacctgc ggatcctcca acggccttca acaaggacaa gctgaactct 2040
ttcatcaccc agtattctac tggccaagtc agcgtggaga tcgagtggga gctgcagaag 2100
gaaaacagca agcgctggaa cccggagatc cagtacactt ccaactatta caagtctaat 2160
aatgttgaat ttgctgttaa tactgaaggt gtatatagtg aaccccgccc cattggcacc 2220
agatacctga ctcgtaatct gtaa 2244
<210> 25
<211> 747
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV9 Cap n.588.EFS amino acid sequence
<220>
<221> MISC_FEATURE
<222> (499)..(599)
<223> EFS
<400> 25
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Glu Phe Ser Ser
580 585 590
Asn Thr Val Lys Leu Thr Ser Ala Gln Ala Gln Thr Gly Trp Val Gln
595 600 605
Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr
610 615 620
Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe
625 630 635 640
His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro
645 650 655
Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala
660 665 670
Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly
675 680 685
Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys
690 695 700
Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn
705 710 715 720
Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg
725 730 735
Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 26
<211> 2247
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV9 Cap n588.IEI nucleic acid sequence
<220>
<221> misc_feature
<222> (1765)..(1800)
<223> IEI
<400> 26
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaaatcgag atcaacgcta ccagagctgg aaccaacctg 1800
gcacaggcgc agaccggctg ggttcaaaac caaggaatac ttccgggtat ggtttggcag 1860
gacagagatg tgtacctgca aggacccatt tgggccaaaa ttcctcacac ggacggcaac 1920
tttcaccctt ctccgctgat gggagggttt ggaatgaagc acccgcctcc tcagatcctc 1980
atcaaaaaca cacctgtacc tgcggatcct ccaacggcct tcaacaagga caagctgaac 2040
tctttcatca cccagtattc tactggccaa gtcagcgtgg agatcgagtg ggagctgcag 2100
aaggaaaaca gcaagcgctg gaacccggag atccagtaca cttccaacta ttacaagtct 2160
aataatgttg aatttgctgt taatactgaa ggtgtatata gtgaaccccg ccccattggc 2220
accagatacc tgactcgtaa tctgtaa 2247
<210> 27
<211> 748
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV9 Cap n588.IEI amino acid sequence
<220>
<221> MISC_FEATURE
<222> (499)..(600)
<223> IEI
<400> 27
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ile Glu Ile Asn
580 585 590
Ala Thr Arg Ala Gly Thr Asn Leu Ala Gln Ala Gln Thr Gly Trp Val
595 600 605
Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val
610 615 620
Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn
625 630 635 640
Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro
645 650 655
Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr
660 665 670
Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr
675 680 685
Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser
690 695 700
Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser
705 710 715 720
Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro
725 730 735
Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 28
<211> 2259
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV9 Cap n.588.IEI-L nucleic acid sequence
<220>
<221> misc_feature
<222> (1765)..(1812)
<223> IEI-L
<400> 28
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaaggagga atcgagatca acgctaccag agctggaacc 1800
aacctgggag gagcacaggc gcagaccggc tgggttcaaa accaaggaat acttccgggt 1860
atggtttggc aggacagaga tgtgtacctg caaggaccca tttgggccaa aattcctcac 1920
acggacggca actttcaccc ttctccgctg atgggagggt ttggaatgaa gcacccgcct 1980
cctcagatcc tcatcaaaaa cacacctgta cctgcggatc ctccaacggc cttcaacaag 2040
gacaagctga actctttcat cacccagtat tctactggcc aagtcagcgt ggagatcgag 2100
tgggagctgc agaaggaaaa cagcaagcgc tggaacccgg agatccagta cacttccaac 2160
tattacaagt ctaataatgt tgaatttgct gttaatactg aaggtgtata tagtgaaccc 2220
cgccccattg gcaccagata cctgactcgt aatctgtaa 2259
<210> 29
<211> 752
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV9 Cap n.588.IEI-L amino acid sequence
<220>
<221> MISC_FEATURE
<222> (499)..(604)
<223> IEI-L
<400> 29
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Gly Gly Ile Glu
580 585 590
Ile Asn Ala Thr Arg Ala Gly Thr Asn Leu Gly Gly Ala Gln Ala Gln
595 600 605
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
610 615 620
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
625 630 635 640
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
645 650 655
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
660 665 670
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
675 680 685
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
690 695 700
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
705 710 715 720
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
725 730 735
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745 750
<210> 30
<211> 2241
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV9 Cap n.588.SAN nucleic acid sequence
<220>
<221> misc_feature
<222> (1765)..(1794)
<223> SAN
<400> 30
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaaagcgct aacttcatca agcctaccag ctacgcacag 1800
gcgcagaccg gctgggttca aaaccaagga atacttccgg gtatggtttg gcaggacaga 1860
gatgtgtacc tgcaaggacc catttgggcc aaaattcctc acacggacgg caactttcac 1920
ccttctccgc tgatgggagg gtttggaatg aagcacccgc ctcctcagat cctcatcaaa 1980
aacacacctg tacctgcgga tcctccaacg gccttcaaca aggacaagct gaactctttc 2040
atcacccagt attctactgg ccaagtcagc gtggagatcg agtgggagct gcagaaggaa 2100
aacagcaagc gctggaaccc ggagatccag tacacttcca actattacaa gtctaataat 2160
gttgaatttg ctgttaatac tgaaggtgta tatagtgaac cccgccccat tggcaccaga 2220
tacctgactc gtaatctgta a 2241
<210> 31
<211> 746
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV9 Cap n.588.SAN amino acid sequence
<220>
<221> MISC_FEATURE
<222> (499)..(598)
<223> SAN
<400> 31
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ser Ala Asn Phe
580 585 590
Ile Lys Pro Thr Ser Tyr Ala Gln Ala Gln Thr Gly Trp Val Gln Asn
595 600 605
Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu
610 615 620
Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His
625 630 635 640
Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln
645 650 655
Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe
660 665 670
Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln
675 680 685
Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg
690 695 700
Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn
705 710 715 720
Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro
725 730 735
Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 32
<211> 2244
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV9 Cap n.588.SSN nucleic acid sequence
<220>
<221> misc_feature
<222> (1765)..(1797)
<223> SSN
<400> 32
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaaagcagc aacaccgtga agctgaccag cggacacgca 1800
caggcgcaga ccggctgggt tcaaaaccaa ggaatacttc cgggtatggt ttggcaggac 1860
agagatgtgt acctgcaagg acccatttgg gccaaaattc ctcacacgga cggcaacttt 1920
cacccttctc cgctgatggg agggtttgga atgaagcacc cgcctcctca gatcctcatc 1980
aaaaacacac ctgtacctgc ggatcctcca acggccttca acaaggacaa gctgaactct 2040
ttcatcaccc agtattctac tggccaagtc agcgtggaga tcgagtggga gctgcagaag 2100
gaaaacagca agcgctggaa cccggagatc cagtacactt ccaactatta caagtctaat 2160
aatgttgaat ttgctgttaa tactgaaggt gtatatagtg aaccccgccc cattggcacc 2220
agatacctga ctcgtaatct gtaa 2244
<210> 33
<211> 747
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV9 Cap n.588.SSN amino acid sequence
<220>
<221> MISC_FEATURE
<222> (499)..(599)
<223> SSN
<400> 33
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ser Ser Asn Thr
580 585 590
Val Lys Leu Thr Ser Gly His Ala Gln Ala Gln Thr Gly Trp Val Gln
595 600 605
Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr
610 615 620
Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe
625 630 635 640
His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro
645 650 655
Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala
660 665 670
Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly
675 680 685
Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys
690 695 700
Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn
705 710 715 720
Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg
725 730 735
Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 34
<211> 2256
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV9 Cap n.588.SSN-L nucleic acid sequence
<220>
<221> misc_feature
<222> (1765)..(1809)
<223> SSN-L
<400> 34
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaaggagga agcagcaaca ccgtgaagct gaccagcgga 1800
cacggaggag cacaggcgca gaccggctgg gttcaaaacc aaggaatact tccgggtatg 1860
gtttggcagg acagagatgt gtacctgcaa ggacccattt gggccaaaat tcctcacacg 1920
gacggcaact ttcacccttc tccgctgatg ggagggtttg gaatgaagca cccgcctcct 1980
cagatcctca tcaaaaacac acctgtacct gcggatcctc caacggcctt caacaaggac 2040
aagctgaact ctttcatcac ccagtattct actggccaag tcagcgtgga gatcgagtgg 2100
gagctgcaga aggaaaacag caagcgctgg aacccggaga tccagtacac ttccaactat 2160
tacaagtcta ataatgttga atttgctgtt aatactgaag gtgtatatag tgaaccccgc 2220
cccattggca ccagatacct gactcgtaat ctgtaa 2256
<210> 35
<211> 751
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV9 Cap n.588.SSN-L amino acid sequence
<220>
<221> MISC_FEATURE
<222> (499)..(603)
<223> SSN-L
<400> 35
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Gly Gly Ser Ser
580 585 590
Asn Thr Val Lys Leu Thr Ser Gly His Gly Gly Ala Gln Ala Gln Thr
595 600 605
Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp
610 615 620
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
625 630 635 640
Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys
645 650 655
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp
660 665 670
Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln
675 680 685
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
690 695 700
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
705 710 715 720
Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr
725 730 735
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745 750
<210> 36
<211> 2259
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV9 Cap n588.VLT-L nucleic acid sequence
<220>
<221> misc_feature
<222> (1765)..(1812)
<223> VLT-L
<400> 36
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaaggagga gtgctgacca acatcgctag aggagagtac 1800
atgagaggag gagcacaggc gcagaccggc tgggttcaaa accaaggaat acttccgggt 1860
atggtttggc aggacagaga tgtgtacctg caaggaccca tttgggccaa aattcctcac 1920
acggacggca actttcaccc ttctccgctg atgggagggt ttggaatgaa gcacccgcct 1980
cctcagatcc tcatcaaaaa cacacctgta cctgcggatc ctccaacggc cttcaacaag 2040
gacaagctga actctttcat cacccagtat tctactggcc aagtcagcgt ggagatcgag 2100
tgggagctgc agaaggaaaa cagcaagcgc tggaacccgg agatccagta cacttccaac 2160
tattacaagt ctaataatgt tgaatttgct gttaatactg aaggtgtata tagtgaaccc 2220
cgccccattg gcaccagata cctgactcgt aatctgtaa 2259
<210> 37
<211> 752
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV9 Cap n588.VLT-L amino acid sequence
<220>
<221> MISC_FEATURE
<222> (499)..(604)
<223> VLT-L
<400> 37
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Gly Gly Val Leu
580 585 590
Thr Asn Ile Ala Arg Gly Glu Tyr Met Arg Gly Gly Ala Gln Ala Gln
595 600 605
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
610 615 620
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
625 630 635 640
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
645 650 655
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
660 665 670
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
675 680 685
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
690 695 700
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
705 710 715 720
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
725 730 735
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745 750
<210> 38
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> EFS peptide sequence
<400> 38
Glu Phe Ser Ser Asn Thr Val Lys Leu Thr Ser
1 5 10
<210> 39
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> SSN-L peptide sequence
<400> 39
Gly Gly Ser Ser Asn Thr Val Lys Leu Thr Ser Gly His Gly Gly
1 5 10 15
<210> 40
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> SSN peptide sequence
<400> 40
Ser Ser Asn Thr Val Lys Leu Thr Ser Gly His
1 5 10
<210> 41
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> SAN peptide sequence
<400> 41
Ser Ala Asn Phe Ile Lys Pro Thr Ser Tyr
1 5 10
<210> 42
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> IEI peptide sequence
<400> 42
Ile Glu Ile Asn Ala Thr Arg Ala Gly Thr Asn Leu
1 5 10
<210> 43
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> IEI-L peptide sequence
<400> 43
Gly Gly Ile Glu Ile Asn Ala Thr Arg Ala Gly Thr Asn Leu Gly Gly
1 5 10 15
<210> 44
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV9 capsid
<400> 44
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 45
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAVhu68 capsid
<400> 45
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Val Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 46
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> VLT-L peptide sequence
<400> 46
Gly Gly Val Leu Thr Asn Ile Ala Arg Gly Glu Tyr Met Arg Gly Gly
1 5 10 15
<210> 47
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> N-X-(T/I/V/A)-(K/R) motif
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> any amino acid
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa is selected from Threonine (T), Isoleucine (I), Valine (V) or
Alanine (A)
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa is selelcted from Lysine (K) or Arginine (R)
<400> 47
Asn Xaa Xaa Xaa
1
<210> 48
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV2 variant peptide NDVRAVS
<400> 48
Asn Asp Val Arg Ala Val Ser
1 5
<210> 49
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> PHP.B peptide insert
<400> 49
Thr Leu Ala Val Pro Phe Lys
1 5
<210> 50
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid sequence EFS
<400> 50
gagttcagca gcaacaccgt gaagctgacc agc 33
<210> 51
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid sequence IEI
<400> 51
atcgagatca acgctaccag agctggaacc aacctg 36
<210> 52
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid sequence IEI-L
<400> 52
ggaggaatcg agatcaacgc taccagagct ggaaccaacc tgggagga 48
<210> 53
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid sequence SAN
<400> 53
agcgctaact tcatcaagcc taccagctac 30
<210> 54
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid sequence SSN
<400> 54
agcagcaaca ccgtgaagct gaccagcgga cac 33
<210> 55
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid sequence SSN-L
<400> 55
ggaggaagca gcaacaccgt gaagctgacc agcggacacg gagga 45
<210> 56
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid sequence VLT-L
<400> 56
ggaggagtgc tgaccaacat cgctagagga gagtacatga gaggagga 48
Claims (19)
- 모티프 N- x- (T/I/V/A)- (K/R)(서열번호 47)을 포함하는 아미노산 서열을 포함하는 캡시드를 갖는 재조합 아데노-연관 바이러스 입자(rAAV)로서, 상기 아미노산 서열은 캡시드 내의 적어도 AAV vp3 단백질의 일부이고, 이의 발현을 지시하는 서열의 제어 하에 유전자 산물을 인코딩하는 핵산 서열을 포함하는 캡시드 내에 패키징된 벡터 게놈이되, 캡시드는 NDVRAVS(서열번호 48) 서열을 포함하는 돌연변이 AAV2 캡시드가 아닌 것인 재조합 아데노-연관 바이러스 입자.
- 제1항에 있어서, 상기 아미노산 서열은 2개의 아미노산 내지 7개의 아미노산에 의해 모티프의 아미노 말단 및/또는 카르복시 말단에서 선택적으로 측접한 N- x- (T/I/V/A)- (K/R) 모티프가 AAV 캡시드 vp3 영역에 삽입되는 것을 포함하는, rAAV.
- 제1항 또는 제2항에 있어서, 상기 캡시드에 삽입된 서열은 다음을 포함하는 것인, rAAV:
(a) SSNTVKLTSGH (서열번호 40);
(b) EFSSNTVKLTS (서열번호 38);
(c) GGVLTNIARGEYMRGG (서열번호 46);
(d) GGIEINATRAGTNLGG (서열번호 43);
(e) GGSSNTVKLTSGHGG (서열번호 39);
(f) IEINATRAGTNL(서열번호 42); 또는
(g) SANFIKPTSY (서열번호 41). - 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 모티프의 아미노산 서열은 NTVK인, rAAV.
- 제1항에 있어서, 상기 모티프 N- x- (T/I/V/A)- (K/R)(서열번호 47)은 선택적으로 이의 카르복시- 및/또는 아미노 말단에 2개 내지 7개의 아미노산이 측접되어 있고 아미노산 서열: 서열번호 44의 넘버링에 기초하여 AAV9 캡시드 단백질의 아미노산 588 및 589 사이에 삽입된 것인, rAAV.
- 제1항 내지 제5항 중 어느 한 항에 따른 rAAV의 스톡 및 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스 중 하나 이상을 포함하는, 조성물.
- 내피 세포 표적화 펩티드로서, 상기 내피 세포 표적화 펩티드는 N- x- (T/I/V/A)- (K/R) (서열번호 47)의 아미노산 서열을 포함하고 선택적으로 모티프의 아미노 말단 및/또는 카르복시 말단에 2개의 아미노산 내지 7개의 아미노산이 측접되어 있고, 선택적으로 나노입자, 제2 분자, 또는 바이러스 캡시드 단백질에 추가로 접합되는 것인, 내피 세포 표적화 펩티드.
- 제7항에 있어서, 상기 내피 세포 표적화 펩티드는 다음을 포함하는, 내피 세포 표적화 펩티드:
(a) SSNTVKLTSGH (서열번호 40);
(b) EFSSNTVKLTS (서열번호 38);
(c) GGVLTNIARGEYMRGG (서열번호 46);
(d) GGIEINATRAGTNLGG (서열번호 43);
(e) GGSSNTVKLTSGHGG (서열번호 39);
(f) IEINATRAGTNL(서열번호 42); 또는
(g) SANFIKPTSY(서열번호 41). - 제7항 또는 제8항에 있어서, 상기 모티프의 아미노산 서열은 NTVK인, 내피 세포 표적화 펩티드.
- 제7항 내지 제9항 중 어느 한 항에 따른 내피 세포 표적화 펩티드 및 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스 중 하나 이상을 포함하는, 조성물.
- 제7항 내지 제9항 중 어느 한 항에 따른 뇌 내피 세포 표적화 펩티드 및 적어도 하나의 폴리펩티드 또는 단백질을 포함하는 융합 파트너를 포함하는, 융합 폴리펩티드 또는 단백질.
- 제11항에 따른 융합 폴리펩티드 또는 단백질 및 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스 중 하나 이상을 포함하는 조성물.
- 치료를 필요로 하는 환자에게 치료제를 전달하기 위한, 제1항 내지 제5항 중 어느 한 항에 따른 rAAV의 스톡, 제7항 내지 제9항 중 어느 한 항에 따른 내피 세포 표적화 펩티드, 또는 제11항에 따른 융합 폴리펩티드 또는 단백질, 또는 제6항, 제10항 또는 제12항 중 어느 한 항에 따른 조성물의 용도.
- 뇌의 내피 세포에 대한 표적 치료 방법으로서, 상기 방법은 치료를 필요로 하는 환자에게 제1항 내지 제5항 중 어느 한 항에 따른 rAAV의 스톡을 투여하는 단계를 포함하는, 방법.
- 제1항 내지 제5항 중 어느 한 항에 따른 rAAV의 스톡을 이를 필요로 하는 대상체에게 전달함으로써 알란-헌돈-더들리병을 치료하는 방법으로서, 인코딩된 유전자 산물이 MCT8 단백질인, 방법.
- 폐에 대한 표적 치료 방법으로서, 치료를 필요로 하는 환자에게 제1항 내지 제5항 중 어느 한 항에 따른 rAAV의 스톡을 투여하는 단계를 포함하는, 방법.
- 제1항 내지 제5항 중 어느 한 항에 따른 rAAV의 스톡을 치료를 필요로 하는 대상체에게 전달함으로써 폐 질환을 치료하는 방법으로서, 인코딩된 유전자 산물은 가용성 Ace2 단백질, 항-SARS 항체, 항-SARS-CoV2 항체, 항인플루엔자 항체 또는 낭포성 섬유증 막관통 단백질인, 방법.
- N- x- (T/I/V/A)- (K/R)(서열번호 47) 모티프를 AAV 캡시드에 삽입하는 단계를 포함하는 시험관 내에서 AAV 생산 세포의 형질도입을 증가시키는 방법.
- 제16항에 있어서, 상기 생산 세포는 293 세포인 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063119863P | 2020-12-01 | 2020-12-01 | |
US63/119,863 | 2020-12-01 | ||
PCT/US2021/061312 WO2022119871A2 (en) | 2020-12-01 | 2021-12-01 | Novel compositions with tissue-specific targeting motifs and compositions containing same |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230117157A true KR20230117157A (ko) | 2023-08-07 |
Family
ID=80050581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237020955A KR20230117157A (ko) | 2020-12-01 | 2021-12-01 | 조직 특이적 표적화 모티프를 갖는 신규 조성물 및 이를 포함하는 조성물 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20240024507A1 (ko) |
EP (1) | EP4256065A2 (ko) |
JP (1) | JP2023551903A (ko) |
KR (1) | KR20230117157A (ko) |
CN (1) | CN116670152A (ko) |
AR (1) | AR124216A1 (ko) |
AU (1) | AU2021390480A1 (ko) |
CA (1) | CA3200014A1 (ko) |
IL (1) | IL303236A (ko) |
TW (1) | TW202237850A (ko) |
WO (1) | WO2022119871A2 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024016003A2 (en) * | 2022-07-14 | 2024-01-18 | The Broad Institute, Inc. | Aav capsids that enable cns-wide gene delivery through interactions with the transferrin receptor |
Family Cites Families (96)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5139941A (en) | 1985-10-31 | 1992-08-18 | University Of Florida Research Foundation, Inc. | AAV transduction vectors |
US5436146A (en) | 1989-09-07 | 1995-07-25 | The Trustees Of Princeton University | Helper-free stocks of recombinant adeno-associated virus vectors |
US6268213B1 (en) | 1992-06-03 | 2001-07-31 | Richard Jude Samulski | Adeno-associated virus vector and cis-acting regulatory and promoter elements capable of expressing at least one gene and method of using same for gene therapy |
US5869305A (en) | 1992-12-04 | 1999-02-09 | The University Of Pittsburgh | Recombinant viral vector system |
JPH08506144A (ja) | 1993-02-05 | 1996-07-02 | ラポート グループ オーストラリア リミティド | スラグ脱泡複合材料 |
US5869337A (en) | 1993-02-12 | 1999-02-09 | President And Fellows Of Harvard College | Regulated transcription of targeted genes and other biological events |
WO1994018317A1 (en) | 1993-02-12 | 1994-08-18 | The Board Of Trustees Of The Leland Stanford Junior University | Regulated transcription of targeted genes and other biological events |
US5834266A (en) | 1993-02-12 | 1998-11-10 | President & Fellows Of Harvard College | Regulated apoptosis |
US6972193B1 (en) | 1993-02-12 | 2005-12-06 | Board Of Trustees Of Leland Stanford Junior University | Regulated transcription of targeted genes and other biological events |
US5830462A (en) | 1993-02-12 | 1998-11-03 | President & Fellows Of Harvard College | Regulated transcription of targeted genes and other biological events |
US20020173474A1 (en) | 1993-02-12 | 2002-11-21 | President And Fellows Of Harvard College | Methods & materials involving dimerization-mediated regulation of biological events |
US6063625A (en) | 1993-02-12 | 2000-05-16 | Board Of Trustees Of Leland S, Stanford, Jr. University | Regulated transcription of targeted genes and other biological events |
US6150137A (en) | 1994-05-27 | 2000-11-21 | Ariad Pharmaceuticals, Inc. | Immunosuppressant target proteins |
US6492106B1 (en) | 1994-06-27 | 2002-12-10 | The Johns Hopkins University | Mammalian proteins that bind to FKBP12 in a rapamycin-dependent fashion |
US6476200B1 (en) | 1994-06-27 | 2002-11-05 | The Johns Hopkins University | Mammalian proteins that bind to FKBP12 in a rapamycin-dependent fashion |
US6204059B1 (en) | 1994-06-30 | 2001-03-20 | University Of Pittsburgh | AAV capsid vehicles for molecular transfer |
JP4470226B2 (ja) | 1994-08-18 | 2010-06-02 | アリアド・ファーマシューティカルズ・インコーポレイテッド | 新規な多量体化剤 |
US6150527A (en) | 1994-08-18 | 2000-11-21 | Ariad Pharmaceuticals, Inc. | Synthetic multimerizing agents |
US6133456A (en) | 1994-08-18 | 2000-10-17 | Ariad Gene Therapeutics, Inc. | Synthetic multimerizing agents |
US6326166B1 (en) | 1995-12-29 | 2001-12-04 | Massachusetts Institute Of Technology | Chimeric DNA-binding proteins |
EP0805819B1 (en) | 1994-12-29 | 2012-02-08 | Massachusetts Institute Of Technology | Chimeric dna-binding proteins |
US6506379B1 (en) | 1995-06-07 | 2003-01-14 | Ariad Gene Therapeutics, Inc. | Intramuscular delivery of recombinant AAV |
US6187757B1 (en) | 1995-06-07 | 2001-02-13 | Ariad Pharmaceuticals, Inc. | Regulation of biological events using novel compounds |
US5811524A (en) | 1995-06-07 | 1998-09-22 | Idec Pharmaceuticals Corporation | Neutralizing high affinity human monoclonal antibodies specific to RSV F-protein and methods for their manufacture and therapeutic use thereof |
US5741683A (en) | 1995-06-07 | 1998-04-21 | The Research Foundation Of State University Of New York | In vitro packaging of adeno-associated virus DNA |
WO1996041865A1 (en) | 1995-06-07 | 1996-12-27 | Ariad Gene Therapeutics, Inc. | Rapamcycin-based regulation of biological events |
US6093570A (en) | 1995-06-07 | 2000-07-25 | The University Of North Carolina At Chapel Hill | Helper virus-free AAV production |
AU731826B2 (en) | 1996-02-28 | 2001-04-05 | Ariad Pharmaceuticals, Inc. | Synthetic Multimerizing Agents |
US6723531B2 (en) | 1996-04-05 | 2004-04-20 | The Salk Institute For Biological Studies | Method for modulating expression of exogenous genes in mammalian systems, and products related thereto |
US6258823B1 (en) | 1996-07-12 | 2001-07-10 | Ariad Pharmaceuticals, Inc. | Materials and method for treating or preventing pathogenic fungal infection |
US6548286B1 (en) | 1997-04-14 | 2003-04-15 | Cell Genesys, Inc. | Methods for increasing the efficiency of recombinant AAV product |
US6015709A (en) | 1997-08-26 | 2000-01-18 | Ariad Pharmaceuticals, Inc. | Transcriptional activators, and compositions and uses related thereto |
EP1017829A2 (en) | 1997-08-26 | 2000-07-12 | Ariad Gene Therapeutics, Inc. | Fusion proteins comprising a dimerization, trimerization or tetramerization domain and an additional heterologous transcription activation, transcription repression, dna binding or ligand binding domain |
US6479653B1 (en) | 1997-08-26 | 2002-11-12 | Ariad Gene Therapeutics, Inc. | Compositions and method for regulation of transcription |
JP2001514007A (ja) | 1997-08-27 | 2001-09-11 | アリアド ジーン セラピューティクス インコーポレイテッド | キメラ転写アクチベーター、ならびにそれに関連する組成物および使用 |
CA2318402A1 (en) | 1998-01-15 | 1999-07-22 | Ariad Gene Therapeutics, Inc. | Regulation of biological events using multimeric chimeric proteins |
AU766513B2 (en) | 1998-02-13 | 2003-10-16 | Board Of Trustees Of The Leland Stanford Junior University | Novel dimerizing agents, their production and use |
US6984635B1 (en) | 1998-02-13 | 2006-01-10 | Board Of Trustees Of The Leland Stanford Jr. University | Dimerizing agents, their production and use |
US6333318B1 (en) | 1998-05-14 | 2001-12-25 | The Salk Institute For Biological Studies | Formulations useful for modulating expression of exogenous genes in mammalian systems, and products related thereto |
EP1080218A1 (en) | 1998-05-27 | 2001-03-07 | University of Florida | Method of preparing recombinant adeno-associated virus compositions by using an iodixanol gradient |
US6258603B1 (en) | 1998-06-17 | 2001-07-10 | Rohm And Haas Company | Ligands for modulating the expression of exogenous genes via an ecdysone receptor complex |
US7109317B1 (en) | 1998-11-06 | 2006-09-19 | President And Fellows Of Harvard College | FK506-based regulation of biological events |
AU780231B2 (en) | 1998-11-10 | 2005-03-10 | University Of North Carolina At Chapel Hill, The | Virus vectors and methods of making and administering the same |
ES2478635T3 (es) | 1999-08-09 | 2014-07-22 | Targeted Genetics Corporation | Incremento de la expresión de una secuencia de nucleótidos heteróloga monocatenaria de vectores virales recombinantes diseñando la secuencia de modo que forma pares de bases intracatenarios |
DE60010098T2 (de) | 1999-08-24 | 2005-03-31 | Ariad Gene Therapeutics, Inc., Cambridge | 28-epirapaloge |
US7067526B1 (en) | 1999-08-24 | 2006-06-27 | Ariad Gene Therapeutics, Inc. | 28-epirapalogs |
US20040033600A1 (en) | 2001-03-21 | 2004-02-19 | Palli Subba Reddy | Ecdysone receptor-based inducible gene expression system |
CA2404253C (en) | 2000-03-22 | 2014-05-13 | Rohm And Haas Company | Novel ecdysone receptor-based inducible gene expression system |
ATE438414T1 (de) | 2000-06-01 | 2009-08-15 | Univ North Carolina | Verfahren und zusammensetzungen zur kontrollierter abgabe von rekombinant parvovirus vektoren |
US8105825B2 (en) | 2000-10-03 | 2012-01-31 | Intrexon Corporation | Multiple inducible gene regulation system |
WO2002066612A2 (en) | 2001-02-20 | 2002-08-29 | Rheogene, Inc. | Novel substitution mutant receptors and their use in a nuclear receptor-based inducible gene expression system |
CA2441444C (en) | 2001-02-20 | 2013-09-03 | Rheogene Holdings, Inc. | Novel ecdysone receptor/invertebrate retinoid x receptor-based inducible gene expression system |
DK1534738T3 (da) | 2001-02-20 | 2012-10-01 | Intrexon Corp | Nye substitutionsmutantreceptorer og anvendelse heraf i et inducérbart genekpressionssystem på basis af en nuklear receptor |
CA2438119C (en) | 2001-02-20 | 2014-12-16 | Rheogene Holdings, Inc. | Chimeric retinoid x receptors and their use in a novel ecdysone receptor-based inducible gene expression system |
ES2258601T3 (es) | 2001-11-13 | 2006-09-01 | The Trustees Of The University Of Pennsylvania | Un metodo para la identificacion de las secuencias desconocidas del virus adeno-asociado (vaa) y un kit para el metodo. |
EP3517134B1 (en) | 2001-12-17 | 2024-01-17 | The Trustees of the University of Pennsylvania | Adeno-associated virus (aav) serotype 8 sequences, vectors containing same and uses therefor |
US20070015238A1 (en) | 2002-06-05 | 2007-01-18 | Snyder Richard O | Production of pseudotyped recombinant AAV virions |
CN1856576B (zh) | 2003-09-30 | 2011-05-04 | 宾夕法尼亚州立大学托管会 | 腺伴随病毒(aav)进化支、序列、含有这些序列的载体及它们的应用 |
US20060246079A1 (en) | 2003-11-14 | 2006-11-02 | Morrow Phillip R | Neutralizing human antibodies to anthrax toxin |
US7935510B2 (en) | 2004-04-30 | 2011-05-03 | Intrexon Corporation | Mutant receptors and their use in a nuclear receptor-based inducible gene expression system |
EP2359865B1 (en) | 2005-04-07 | 2013-10-02 | The Trustees of The University of Pennsylvania | Method of increasing the function of an AAV vector |
WO2006132118A1 (ja) | 2005-06-09 | 2006-12-14 | Matsushita Electric Industrial Co., Ltd. | 振幅誤差補償装置及び直交度誤差補償装置 |
EP2007795B1 (en) | 2006-03-30 | 2016-11-16 | The Board Of Trustees Of The Leland Stanford Junior University | Aav capsid proteins |
WO2008156763A2 (en) | 2007-06-15 | 2008-12-24 | The Board Of Trustees Of The Leland Stanford Junior University | Human neutralizing monoclonal antibodies to h5n1 influenza a virus |
ITTO20080204A1 (it) | 2008-03-17 | 2009-09-18 | Pomona Biotechnologies Llc | Anticorpi monoclonali atti a reagire con una pluralita di sottotipi del virus influenzale a |
ITTO20080398A1 (it) | 2008-05-27 | 2009-11-28 | Pomona Biotechnologies Llc | Anticorpi monoclonali aventi proprieta' di cross-neutralizzazione omosubtipica per virus influenzali di tipo a sottotipo h1 |
WO2010010466A2 (en) | 2008-07-25 | 2010-01-28 | Institute For Research In Biomedicine | Neutralizing anti-influenza a virus antibodies and uses thereof |
GB0813784D0 (en) | 2008-07-28 | 2008-09-03 | Ct Integrated Photonics Ltd | Optical intergration system |
JP6087504B2 (ja) | 2008-11-07 | 2017-03-01 | マサチューセッツ インスティテュート オブ テクノロジー | アミノアルコールリピドイドおよびその使用 |
US8470327B2 (en) | 2009-05-11 | 2013-06-25 | Crucell Holland B.V. | Human binding molecules capable of neutralizing influenza virus H3N2 and uses thereof |
WO2010136549A2 (en) * | 2009-05-28 | 2010-12-02 | Deutsches Krebsforschungszentrum | Modified aav capsid polypeptides |
WO2010138263A2 (en) | 2009-05-28 | 2010-12-02 | University Of Massachusetts | Novel aav 's and uses thereof |
IT1395961B1 (it) | 2009-06-01 | 2012-11-02 | Pomona Biotechnologies Llc | Anticorpi monoclonali come medicamento per il trattamento terapeutico e/o profilattico delle infezioni da virus influenzale a (h1n1) di origine suina (s-oiv) |
AU2011238708B2 (en) | 2010-03-29 | 2016-02-11 | The Trustees Of The University Of Pennsylvania | Pharmacologically Induced Transgene Ablation system |
WO2011127255A1 (en) | 2010-04-08 | 2011-10-13 | Merck Sharp & Dohme Corp. | Preparation of lipid nanoparticles |
US8927514B2 (en) | 2010-04-30 | 2015-01-06 | City Of Hope | Recombinant adeno-associated vectors for targeted treatment |
WO2012075040A2 (en) | 2010-11-30 | 2012-06-07 | Shire Human Genetic Therapies, Inc. | mRNA FOR USE IN TREATMENT OF HUMAN GENETIC DISEASES |
WO2012145572A1 (en) | 2011-04-20 | 2012-10-26 | The Trustees Of The University Of Pennsylvania | Regimens and compositions for aav-mediated passive immunization of airborne pathogens |
PL2714752T3 (pl) | 2011-05-27 | 2018-04-30 | Amicus Therapeutics, Inc. | Sposoby sprzęgania peptydów nakierowanych na rekombinowane enzymy lizosomalne dla poprawy leczenia lizosomalnych chorób spichrzeniowych |
EP4043025A1 (en) | 2011-06-08 | 2022-08-17 | Translate Bio, Inc. | Lipid nanoparticle compositions and methods for mrna delivery |
FR2977562B1 (fr) | 2011-07-06 | 2016-12-23 | Gaztransport Et Technigaz | Cuve etanche et thermiquement isolante integree dans une structure porteuse |
CA2873274C (en) | 2012-06-08 | 2021-06-01 | Ethris Gmbh | Pulmonary delivery of messenger rna |
WO2014089486A1 (en) | 2012-12-07 | 2014-06-12 | Shire Human Genetic Therapies, Inc. | Lipidic nanoparticles for mrna delivering |
ES2804594T3 (es) | 2013-03-15 | 2021-02-08 | Amicus Therapeutics Inc | Reticuladores químicos |
AU2014348212C1 (en) | 2013-11-18 | 2018-11-29 | Arcturus Therapeutics, Inc. | Ionizable cationic lipid for RNA delivery |
EP3919508A1 (en) | 2014-04-25 | 2021-12-08 | The Trustees of The University of Pennsylvania | Ldlr variants and their use in compositions for reducing cholesterol levels |
DK3198018T3 (da) | 2014-09-24 | 2021-03-01 | Hope City | Vektorvarianter af adenoassocieret virus til højeffektiv genomredigering og fremgangsmåder dertil |
CA2971901C (en) * | 2014-12-24 | 2022-06-21 | Neuorphan Pty Ltd | Improvements in oligodendroglial cell culturing methods and in methods for treating neurodegenerative disorders by using thyroid hormones or analogues |
CN108135994B (zh) | 2015-05-13 | 2022-01-25 | 宾夕法尼亚州大学信托人 | Aav-介导的抗-流感抗体的表达及其使用方法 |
SG11201804713VA (en) | 2015-12-11 | 2018-07-30 | California Inst Of Techn | TARGETING PEPTIDES FOR DIRECTING ADENO-ASSOCIATED VIRUSES (AAVs) |
FI3589730T3 (fi) | 2017-02-28 | 2024-02-22 | Univ Pennsylvania | Kladin f adenoassosioitunut virus (aav) -vektori ja sen käyttötapoja |
TW201837170A (zh) | 2017-02-28 | 2018-10-16 | 賓州大學委員會 | 新穎aav媒介的流感疫苗 |
WO2018189244A1 (en) * | 2017-04-11 | 2018-10-18 | Ruprecht-Karls-Universität Heidelberg | Adeno-associated virus library |
AU2019227726A1 (en) | 2018-02-27 | 2020-09-10 | The Trustees Of The University Of Pennsylvania | Novel adeno-associated virus (AAV) vectors, aav vectors having reduced capsid deamidation and uses therefor |
US11867060B2 (en) | 2019-02-04 | 2024-01-09 | Technische Universität Wien | Reinforced concrete tubbing segment |
US20220220453A1 (en) | 2019-04-29 | 2022-07-14 | The Trustees Of The University Of Pennsylvania | Novel aav capsids and compositions containing same |
-
2021
- 2021-12-01 TW TW110144803A patent/TW202237850A/zh unknown
- 2021-12-01 CA CA3200014A patent/CA3200014A1/en active Pending
- 2021-12-01 US US18/255,154 patent/US20240024507A1/en active Pending
- 2021-12-01 KR KR1020237020955A patent/KR20230117157A/ko unknown
- 2021-12-01 CN CN202180085871.6A patent/CN116670152A/zh active Pending
- 2021-12-01 EP EP21848319.6A patent/EP4256065A2/en active Pending
- 2021-12-01 AU AU2021390480A patent/AU2021390480A1/en active Pending
- 2021-12-01 IL IL303236A patent/IL303236A/en unknown
- 2021-12-01 AR ARP210103330A patent/AR124216A1/es unknown
- 2021-12-01 JP JP2023533645A patent/JP2023551903A/ja active Pending
- 2021-12-01 WO PCT/US2021/061312 patent/WO2022119871A2/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
IL303236A (en) | 2023-07-01 |
EP4256065A2 (en) | 2023-10-11 |
WO2022119871A2 (en) | 2022-06-09 |
WO2022119871A3 (en) | 2022-07-14 |
AU2021390480A9 (en) | 2024-02-08 |
CN116670152A (zh) | 2023-08-29 |
US20240024507A1 (en) | 2024-01-25 |
AU2021390480A1 (en) | 2023-06-22 |
TW202237850A (zh) | 2022-10-01 |
AR124216A1 (es) | 2023-03-01 |
CA3200014A1 (en) | 2022-06-09 |
JP2023551903A (ja) | 2023-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102380265B1 (ko) | 변종 aav 및 조성물, 세포, 기관 및 조직으로의 유전자 전이를 위한 방법 및 용도 | |
KR102526711B1 (ko) | 고효율 게놈 편집을 위한 아데노-관련 바이러스 벡터 변이체 및 이의 방법 | |
US20220249705A1 (en) | Novel aav capsids and compositions containing same | |
AU2018229293A1 (en) | Influenza vaccines based on AAV vectors | |
AU2018281306A1 (en) | Enhancing agents for improved cell transfection and/or rAAV vector production | |
US20210363192A1 (en) | Engineered aav capsids with increased tropism and aav vectors comprising the engineered capsids and methods of making and using same | |
US20230042103A1 (en) | Engineered nucleic acid regulatory element and methods of uses thereof | |
Xiao et al. | Recombinant adeno-associated virus: clinical application and development as a gene-therapy vector | |
US20220362408A1 (en) | Optimized promoter sequences, intron-free expression constructs and methods of use | |
CA3195553A1 (en) | Improved adeno-associated virus (aav) vector and uses therefor | |
EP3790960A1 (en) | Plasmid free aav vector producing cell lines | |
KR20230117157A (ko) | 조직 특이적 표적화 모티프를 갖는 신규 조성물 및 이를 포함하는 조성물 | |
TW202305124A (zh) | 具有腦特異性靶向模體的新穎構成物及含有其之組成物 | |
US20240110201A1 (en) | Compositions and Methods for Treating Hereditary Angioedema | |
WO2023056399A1 (en) | Novel aav capsids and compositions containing same | |
CN117642173A (zh) | 用于诱导对基因递送靶媒剂的免疫耐受性的方法和试剂盒 |