KR20190117571A - 혈관계를 통한 유전자 전달 방법 및 조성물 - Google Patents
혈관계를 통한 유전자 전달 방법 및 조성물 Download PDFInfo
- Publication number
- KR20190117571A KR20190117571A KR1020197025393A KR20197025393A KR20190117571A KR 20190117571 A KR20190117571 A KR 20190117571A KR 1020197025393 A KR1020197025393 A KR 1020197025393A KR 20197025393 A KR20197025393 A KR 20197025393A KR 20190117571 A KR20190117571 A KR 20190117571A
- Authority
- KR
- South Korea
- Prior art keywords
- amino acid
- seq
- capsid protein
- aav capsid
- aav
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 137
- 239000000203 mixture Substances 0.000 title claims description 64
- 238000001476 gene delivery Methods 0.000 title description 11
- 230000002792 vascular Effects 0.000 title description 10
- 108090000565 Capsid Proteins Proteins 0.000 claims abstract description 227
- 102100023321 Ceruloplasmin Human genes 0.000 claims abstract description 225
- 239000013603 viral vector Substances 0.000 claims abstract description 206
- 210000000234 capsid Anatomy 0.000 claims abstract description 199
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 152
- 230000004048 modification Effects 0.000 claims abstract description 77
- 238000012986 modification Methods 0.000 claims abstract description 77
- 210000004027 cell Anatomy 0.000 claims description 152
- 150000007523 nucleic acids Chemical class 0.000 claims description 123
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims description 121
- 238000010361 transduction Methods 0.000 claims description 112
- 230000026683 transduction Effects 0.000 claims description 111
- 125000000539 amino acid group Chemical group 0.000 claims description 110
- 102000039446 nucleic acids Human genes 0.000 claims description 110
- 108020004707 nucleic acids Proteins 0.000 claims description 110
- 150000001413 amino acids Chemical class 0.000 claims description 109
- 239000013598 vector Substances 0.000 claims description 106
- 238000003780 insertion Methods 0.000 claims description 79
- 230000037431 insertion Effects 0.000 claims description 79
- 210000001519 tissue Anatomy 0.000 claims description 78
- 108090000623 proteins and genes Proteins 0.000 claims description 68
- 210000002569 neuron Anatomy 0.000 claims description 57
- 241000700605 Viruses Species 0.000 claims description 49
- 230000008499 blood brain barrier function Effects 0.000 claims description 48
- 210000001218 blood-brain barrier Anatomy 0.000 claims description 48
- 230000001225 therapeutic effect Effects 0.000 claims description 45
- 210000003169 central nervous system Anatomy 0.000 claims description 44
- 210000004185 liver Anatomy 0.000 claims description 41
- 102000004169 proteins and genes Human genes 0.000 claims description 38
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 32
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 31
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 30
- 241000702421 Dependoparvovirus Species 0.000 claims description 29
- 239000013607 AAV vector Substances 0.000 claims description 28
- 241001164823 Adeno-associated virus - 7 Species 0.000 claims description 27
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 21
- 210000003734 kidney Anatomy 0.000 claims description 21
- 238000011282 treatment Methods 0.000 claims description 20
- 208000012902 Nervous system disease Diseases 0.000 claims description 15
- 230000007547 defect Effects 0.000 claims description 14
- 210000000952 spleen Anatomy 0.000 claims description 14
- 239000004215 Carbon black (E152) Substances 0.000 claims description 13
- 208000025966 Neurological disease Diseases 0.000 claims description 13
- 238000001990 intravenous administration Methods 0.000 claims description 12
- 239000008194 pharmaceutical composition Substances 0.000 claims description 11
- 210000004413 cardiac myocyte Anatomy 0.000 claims description 10
- 239000003937 drug carrier Substances 0.000 claims description 10
- 208000024172 Cardiovascular disease Diseases 0.000 claims description 8
- 108091081062 Repeated sequence (DNA) Proteins 0.000 claims description 8
- 210000000278 spinal cord Anatomy 0.000 claims description 8
- 238000007914 intraventricular administration Methods 0.000 claims description 7
- 238000007917 intracranial administration Methods 0.000 claims description 6
- 241000124008 Mammalia Species 0.000 claims description 5
- 230000000926 neurological effect Effects 0.000 claims description 4
- 238000007910 systemic administration Methods 0.000 claims description 4
- 210000003494 hepatocyte Anatomy 0.000 claims description 3
- 238000007913 intrathecal administration Methods 0.000 claims description 3
- 210000003292 kidney cell Anatomy 0.000 claims description 3
- 210000004988 splenocyte Anatomy 0.000 claims description 2
- 238000001361 intraarterial administration Methods 0.000 claims 2
- 238000007912 intraperitoneal administration Methods 0.000 claims 2
- 230000003612 virological effect Effects 0.000 abstract description 77
- 238000001727 in vivo Methods 0.000 abstract description 21
- 235000001014 amino acid Nutrition 0.000 description 112
- 229940024606 amino acid Drugs 0.000 description 97
- 108090000765 processed proteins & peptides Proteins 0.000 description 67
- 210000004556 brain Anatomy 0.000 description 66
- 206010028980 Neoplasm Diseases 0.000 description 64
- 230000014509 gene expression Effects 0.000 description 60
- 239000005090 green fluorescent protein Substances 0.000 description 58
- 102000004196 processed proteins & peptides Human genes 0.000 description 58
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 55
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 55
- 108091030071 RNAI Proteins 0.000 description 54
- 230000009368 gene silencing by RNA Effects 0.000 description 54
- 229920001184 polypeptide Polymers 0.000 description 53
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 46
- 201000011510 cancer Diseases 0.000 description 42
- 238000002347 injection Methods 0.000 description 41
- 239000007924 injection Substances 0.000 description 41
- 201000010099 disease Diseases 0.000 description 37
- 238000004806 packaging method and process Methods 0.000 description 36
- 230000002163 immunogen Effects 0.000 description 35
- 241000701161 unidentified adenovirus Species 0.000 description 33
- 241000699670 Mus sp. Species 0.000 description 32
- 238000012384 transportation and delivery Methods 0.000 description 27
- 108700019146 Transgenes Proteins 0.000 description 25
- 230000002518 glial effect Effects 0.000 description 25
- 239000005089 Luciferase Substances 0.000 description 24
- 241000125945 Protoparvovirus Species 0.000 description 24
- 238000006467 substitution reaction Methods 0.000 description 24
- 235000018102 proteins Nutrition 0.000 description 23
- 230000028993 immune response Effects 0.000 description 22
- 108060001084 Luciferase Proteins 0.000 description 21
- 239000000427 antigen Substances 0.000 description 21
- 108091007433 antigens Proteins 0.000 description 21
- 102000036639 antigens Human genes 0.000 description 21
- 241000699666 Mus <mouse, genus> Species 0.000 description 20
- 230000000875 corresponding effect Effects 0.000 description 20
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 19
- 230000001537 neural effect Effects 0.000 description 19
- 210000002216 heart Anatomy 0.000 description 18
- 210000004498 neuroglial cell Anatomy 0.000 description 18
- 230000002829 reductive effect Effects 0.000 description 18
- 230000027455 binding Effects 0.000 description 17
- 102000005962 receptors Human genes 0.000 description 17
- 108020003175 receptors Proteins 0.000 description 17
- 210000003462 vein Anatomy 0.000 description 17
- 108020004414 DNA Proteins 0.000 description 15
- 210000001320 hippocampus Anatomy 0.000 description 15
- -1 For example Chemical class 0.000 description 14
- 230000008901 benefit Effects 0.000 description 13
- 210000002889 endothelial cell Anatomy 0.000 description 13
- 210000003016 hypothalamus Anatomy 0.000 description 13
- 208000015181 infectious disease Diseases 0.000 description 13
- 102000004127 Cytokines Human genes 0.000 description 12
- 108090000695 Cytokines Proteins 0.000 description 12
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 12
- 241000725303 Human immunodeficiency virus Species 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 12
- 238000001415 gene therapy Methods 0.000 description 12
- 210000001577 neostriatum Anatomy 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- 230000009885 systemic effect Effects 0.000 description 12
- 230000008685 targeting Effects 0.000 description 12
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 11
- 230000010076 replication Effects 0.000 description 11
- 230000032258 transport Effects 0.000 description 11
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 10
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 10
- 108091028043 Nucleic acid sequence Proteins 0.000 description 10
- 210000001947 dentate gyrus Anatomy 0.000 description 10
- 239000012634 fragment Substances 0.000 description 10
- 108010050848 glycylleucine Proteins 0.000 description 10
- 230000001404 mediated effect Effects 0.000 description 10
- 210000000337 motor cortex Anatomy 0.000 description 10
- 230000002265 prevention Effects 0.000 description 10
- 210000001103 thalamus Anatomy 0.000 description 10
- 241001529453 unidentified herpesvirus Species 0.000 description 10
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 9
- 108010079364 N-glycylalanine Proteins 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000000338 in vitro Methods 0.000 description 9
- 230000001939 inductive effect Effects 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 9
- 108010059929 phospholamban Proteins 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 238000002864 sequence alignment Methods 0.000 description 9
- 210000000130 stem cell Anatomy 0.000 description 9
- 239000013638 trimer Substances 0.000 description 9
- 230000010415 tropism Effects 0.000 description 9
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 8
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 8
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 8
- 241001465754 Metazoa Species 0.000 description 8
- 210000003710 cerebral cortex Anatomy 0.000 description 8
- 230000002490 cerebral effect Effects 0.000 description 8
- 208000035475 disorder Diseases 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- 210000003205 muscle Anatomy 0.000 description 8
- 102000005681 phospholamban Human genes 0.000 description 8
- 230000001681 protective effect Effects 0.000 description 8
- 210000002027 skeletal muscle Anatomy 0.000 description 8
- 102100039939 Growth/differentiation factor 8 Human genes 0.000 description 7
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 7
- 108010056852 Myostatin Proteins 0.000 description 7
- 241000288906 Primates Species 0.000 description 7
- 241000713311 Simian immunodeficiency virus Species 0.000 description 7
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 7
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 7
- 210000004727 amygdala Anatomy 0.000 description 7
- 230000000692 anti-sense effect Effects 0.000 description 7
- 230000000747 cardiac effect Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 239000003102 growth factor Substances 0.000 description 7
- 108010057821 leucylproline Proteins 0.000 description 7
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 7
- 210000000056 organ Anatomy 0.000 description 7
- 230000002093 peripheral effect Effects 0.000 description 7
- 208000024891 symptom Diseases 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 241000649046 Adeno-associated virus 11 Species 0.000 description 6
- 241000649047 Adeno-associated virus 12 Species 0.000 description 6
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 6
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 6
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 6
- 230000003110 anti-inflammatory effect Effects 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 108010077245 asparaginyl-proline Proteins 0.000 description 6
- 229930182830 galactose Natural products 0.000 description 6
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 6
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 239000002245 particle Substances 0.000 description 6
- 102000040430 polynucleotide Human genes 0.000 description 6
- 108091033319 polynucleotide Proteins 0.000 description 6
- 239000002157 polynucleotide Substances 0.000 description 6
- 108010015796 prolylisoleucine Proteins 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 208000002320 spinal muscular atrophy Diseases 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 210000003556 vascular endothelial cell Anatomy 0.000 description 6
- 241000649045 Adeno-associated virus 10 Species 0.000 description 5
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 5
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 5
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 5
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 5
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 5
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 5
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 5
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 5
- 101150044789 Cap gene Proteins 0.000 description 5
- 206010010904 Convulsion Diseases 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 5
- 102000003951 Erythropoietin Human genes 0.000 description 5
- 108090000394 Erythropoietin Proteins 0.000 description 5
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 5
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 5
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 5
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 5
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 5
- 229920002971 Heparan sulfate Polymers 0.000 description 5
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 5
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 5
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 5
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 5
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 5
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 5
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 5
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 5
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 5
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 5
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 5
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 5
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 5
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 5
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 5
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 5
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 5
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 5
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 5
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 230000007812 deficiency Effects 0.000 description 5
- 206010015037 epilepsy Diseases 0.000 description 5
- 229940105423 erythropoietin Drugs 0.000 description 5
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 5
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 5
- 108010040030 histidinoalanine Proteins 0.000 description 5
- 230000036039 immunity Effects 0.000 description 5
- 230000002458 infectious effect Effects 0.000 description 5
- 230000002401 inhibitory effect Effects 0.000 description 5
- 108010034529 leucyl-lysine Proteins 0.000 description 5
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 210000004165 myocardium Anatomy 0.000 description 5
- 208000015122 neurodegenerative disease Diseases 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 5
- 108010051242 phenylalanylserine Proteins 0.000 description 5
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 5
- 108010077112 prolyl-proline Proteins 0.000 description 5
- 239000013608 rAAV vector Substances 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000002207 retinal effect Effects 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 238000007619 statistical method Methods 0.000 description 5
- 238000012916 structural analysis Methods 0.000 description 5
- 108010061238 threonyl-glycine Proteins 0.000 description 5
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 5
- 108010045269 tryptophyltryptophan Proteins 0.000 description 5
- 241000712461 unidentified influenza virus Species 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 4
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 4
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 4
- 102400000068 Angiostatin Human genes 0.000 description 4
- 108010079709 Angiostatins Proteins 0.000 description 4
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 4
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical group NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 4
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 4
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 4
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 4
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 4
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 4
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 4
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 4
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 4
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 4
- 241000701931 Canine parvovirus Species 0.000 description 4
- 241000282472 Canis lupus familiaris Species 0.000 description 4
- 108090000994 Catalytic RNA Proteins 0.000 description 4
- 102000053642 Catalytic RNA Human genes 0.000 description 4
- 102100022641 Coagulation factor IX Human genes 0.000 description 4
- 108010069091 Dystrophin Proteins 0.000 description 4
- 102400001047 Endostatin Human genes 0.000 description 4
- 108010079505 Endostatins Proteins 0.000 description 4
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 4
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 4
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 4
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 4
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 4
- 102000000588 Interleukin-2 Human genes 0.000 description 4
- 108010002350 Interleukin-2 Proteins 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 4
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 4
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 4
- 102000004083 Lymphotoxin-alpha Human genes 0.000 description 4
- 108090000542 Lymphotoxin-alpha Proteins 0.000 description 4
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 4
- 208000019022 Mood disease Diseases 0.000 description 4
- 108010025020 Nerve Growth Factor Proteins 0.000 description 4
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 4
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 4
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 4
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 4
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 4
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 4
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 4
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 4
- 108010079005 RDV peptide Proteins 0.000 description 4
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 4
- 102000005157 Somatostatin Human genes 0.000 description 4
- 108010056088 Somatostatin Proteins 0.000 description 4
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 4
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 4
- YRSOERSDNRSCBC-XIRDDKMYSA-N Trp-His-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CS)C(=O)O)N YRSOERSDNRSCBC-XIRDDKMYSA-N 0.000 description 4
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 4
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 4
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 4
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 4
- 108020005202 Viral DNA Proteins 0.000 description 4
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 4
- 108010070944 alanylhistidine Proteins 0.000 description 4
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 4
- 230000033115 angiogenesis Effects 0.000 description 4
- FZCSTZYAHCUGEM-UHFFFAOYSA-N aspergillomarasmine B Natural products OC(=O)CNC(C(O)=O)CNC(C(O)=O)CC(O)=O FZCSTZYAHCUGEM-UHFFFAOYSA-N 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 4
- 210000003618 cortical neuron Anatomy 0.000 description 4
- 210000004748 cultured cell Anatomy 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 150000004676 glycans Chemical class 0.000 description 4
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 4
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 4
- 108010089804 glycyl-threonine Proteins 0.000 description 4
- 108010077515 glycylproline Proteins 0.000 description 4
- 108010087823 glycyltyrosine Proteins 0.000 description 4
- 229920000669 heparin Polymers 0.000 description 4
- 229960002897 heparin Drugs 0.000 description 4
- 108010025306 histidylleucine Proteins 0.000 description 4
- 238000012744 immunostaining Methods 0.000 description 4
- 230000001976 improved effect Effects 0.000 description 4
- 238000012750 in vivo screening Methods 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 4
- 210000004072 lung Anatomy 0.000 description 4
- 239000006166 lysate Substances 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 210000004897 n-terminal region Anatomy 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 4
- 239000011148 porous material Substances 0.000 description 4
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 108091092562 ribozyme Proteins 0.000 description 4
- 210000002966 serum Anatomy 0.000 description 4
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 4
- 239000007858 starting material Substances 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 238000002054 transplantation Methods 0.000 description 4
- 241000701447 unidentified baculovirus Species 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 3
- 108010059616 Activins Proteins 0.000 description 3
- 102000055025 Adenosine deaminases Human genes 0.000 description 3
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 3
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 3
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 3
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 3
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 3
- 208000024827 Alzheimer disease Diseases 0.000 description 3
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 3
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 3
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 3
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 3
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 3
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 3
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 3
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 3
- 208000003174 Brain Neoplasms Diseases 0.000 description 3
- 108091033409 CRISPR Proteins 0.000 description 3
- 241000283707 Capra Species 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 201000003883 Cystic fibrosis Diseases 0.000 description 3
- 208000020401 Depressive disease Diseases 0.000 description 3
- 206010012689 Diabetic retinopathy Diseases 0.000 description 3
- 102100025907 Dyslexia-associated protein KIAA0319-like protein Human genes 0.000 description 3
- 102000001039 Dystrophin Human genes 0.000 description 3
- 102400001368 Epidermal growth factor Human genes 0.000 description 3
- 101800003838 Epidermal growth factor Proteins 0.000 description 3
- 108010076282 Factor IX Proteins 0.000 description 3
- 208000010412 Glaucoma Diseases 0.000 description 3
- 102000034615 Glial cell line-derived neurotrophic factor Human genes 0.000 description 3
- 108091010837 Glial cell line-derived neurotrophic factor Proteins 0.000 description 3
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 3
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 3
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 3
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 3
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 3
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 3
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 3
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 3
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 3
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 3
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 3
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 3
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 3
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 3
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 3
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 3
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 3
- 206010019280 Heart failures Diseases 0.000 description 3
- VUUFXXGKMPLKNH-BZSNNMDCSA-N His-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N VUUFXXGKMPLKNH-BZSNNMDCSA-N 0.000 description 3
- 208000023105 Huntington disease Diseases 0.000 description 3
- 206010062767 Hypophysitis Diseases 0.000 description 3
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 3
- JTBFQNHKNRZJDS-SYWGBEHUSA-N Ile-Trp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C)C(=O)O)N JTBFQNHKNRZJDS-SYWGBEHUSA-N 0.000 description 3
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 3
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 3
- 208000026350 Inborn Genetic disease Diseases 0.000 description 3
- 102100026818 Inhibin beta E chain Human genes 0.000 description 3
- 108090001061 Insulin Proteins 0.000 description 3
- 102000004877 Insulin Human genes 0.000 description 3
- 108010065920 Insulin Lispro Proteins 0.000 description 3
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 3
- 102000006992 Interferon-alpha Human genes 0.000 description 3
- 108010047761 Interferon-alpha Proteins 0.000 description 3
- 102000003996 Interferon-beta Human genes 0.000 description 3
- 108090000467 Interferon-beta Proteins 0.000 description 3
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- 102000000853 LDL receptors Human genes 0.000 description 3
- 108010001831 LDL receptors Proteins 0.000 description 3
- 206010023927 Lassa fever Diseases 0.000 description 3
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 3
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 3
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 3
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 3
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 3
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 3
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 3
- OTKQHDPECKUDSB-SZMVWBNQSA-N Met-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OTKQHDPECKUDSB-SZMVWBNQSA-N 0.000 description 3
- 206010048723 Multiple-drug resistance Diseases 0.000 description 3
- 108090000189 Neuropeptides Proteins 0.000 description 3
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- 208000018737 Parkinson disease Diseases 0.000 description 3
- 241000286209 Phasianidae Species 0.000 description 3
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 3
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 3
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 3
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 3
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 3
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 3
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 3
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 3
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 3
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 3
- QNTBGBCOEYNAPV-CWRNSKLLSA-N Trp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O QNTBGBCOEYNAPV-CWRNSKLLSA-N 0.000 description 3
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 3
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 3
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 3
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 3
- QSFJHIRIHOJRKS-ULQDDVLXSA-N Tyr-Leu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QSFJHIRIHOJRKS-ULQDDVLXSA-N 0.000 description 3
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 3
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 3
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 3
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 3
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 3
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 3
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 3
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 3
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 3
- 108010067390 Viral Proteins Proteins 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 239000000488 activin Substances 0.000 description 3
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 3
- 239000002870 angiogenesis inducing agent Substances 0.000 description 3
- 238000010171 animal model Methods 0.000 description 3
- 230000001772 anti-angiogenic effect Effects 0.000 description 3
- 210000003050 axon Anatomy 0.000 description 3
- 230000002146 bilateral effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 210000001185 bone marrow Anatomy 0.000 description 3
- 235000014633 carbohydrates Nutrition 0.000 description 3
- 210000001638 cerebellum Anatomy 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 230000001054 cortical effect Effects 0.000 description 3
- 239000013078 crystal Substances 0.000 description 3
- 108010069495 cysteinyltyrosine Proteins 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 229940116977 epidermal growth factor Drugs 0.000 description 3
- 210000002919 epithelial cell Anatomy 0.000 description 3
- 229960004222 factor ix Drugs 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 108091006104 gene-regulatory proteins Proteins 0.000 description 3
- 208000016361 genetic disease Diseases 0.000 description 3
- 210000004907 gland Anatomy 0.000 description 3
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 108010085325 histidylproline Proteins 0.000 description 3
- 229940088597 hormone Drugs 0.000 description 3
- 239000005556 hormone Substances 0.000 description 3
- 229940125396 insulin Drugs 0.000 description 3
- 102000006495 integrins Human genes 0.000 description 3
- 108010044426 integrins Proteins 0.000 description 3
- 238000007918 intramuscular administration Methods 0.000 description 3
- 201000010901 lateral sclerosis Diseases 0.000 description 3
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 3
- 230000002132 lysosomal effect Effects 0.000 description 3
- 230000003211 malignant effect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 201000001441 melanoma Diseases 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 108091070501 miRNA Proteins 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 210000002161 motor neuron Anatomy 0.000 description 3
- 208000005264 motor neuron disease Diseases 0.000 description 3
- 201000000585 muscular atrophy Diseases 0.000 description 3
- 230000002276 neurotropic effect Effects 0.000 description 3
- 238000001543 one-way ANOVA Methods 0.000 description 3
- 208000030613 peripheral artery disease Diseases 0.000 description 3
- 238000013081 phylogenetic analysis Methods 0.000 description 3
- 210000003635 pituitary gland Anatomy 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 208000020016 psychiatric disease Diseases 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000003753 real-time PCR Methods 0.000 description 3
- 230000003362 replicative effect Effects 0.000 description 3
- 210000001525 retina Anatomy 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000001953 sensory effect Effects 0.000 description 3
- 230000003238 somatosensory effect Effects 0.000 description 3
- 229960000553 somatostatin Drugs 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 210000001324 spliceosome Anatomy 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 230000000699 topical effect Effects 0.000 description 3
- 239000003053 toxin Substances 0.000 description 3
- 231100000765 toxin Toxicity 0.000 description 3
- 108700012359 toxins Proteins 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 210000004881 tumor cell Anatomy 0.000 description 3
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 3
- 229960005486 vaccine Drugs 0.000 description 3
- 210000005166 vasculature Anatomy 0.000 description 3
- 210000002845 virion Anatomy 0.000 description 3
- 108010046716 3-Methyl-2-Oxobutanoate Dehydrogenase (Lipoamide) Proteins 0.000 description 2
- SQDAZGGFXASXDW-UHFFFAOYSA-N 5-bromo-2-(trifluoromethoxy)pyridine Chemical compound FC(F)(F)OC1=CC=C(Br)C=N1 SQDAZGGFXASXDW-UHFFFAOYSA-N 0.000 description 2
- UBDHSURDYAETAL-UHFFFAOYSA-N 8-aminonaphthalene-1,3,6-trisulfonic acid Chemical compound OS(=O)(=O)C1=CC(S(O)(=O)=O)=C2C(N)=CC(S(O)(=O)=O)=CC2=C1 UBDHSURDYAETAL-UHFFFAOYSA-N 0.000 description 2
- 208000017194 Affective disease Diseases 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 2
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 2
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 2
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 2
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 2
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 2
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- 241000272517 Anseriformes Species 0.000 description 2
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 2
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 2
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 2
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 2
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 2
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 2
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 2
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 2
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 2
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 2
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 2
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 2
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 2
- VBVKSAFJPVXMFJ-CIUDSAMLSA-N Asp-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N VBVKSAFJPVXMFJ-CIUDSAMLSA-N 0.000 description 2
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 2
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 2
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 2
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 2
- LLRJPYJQNBMOOO-QEJZJMRPSA-N Asp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N LLRJPYJQNBMOOO-QEJZJMRPSA-N 0.000 description 2
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 2
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 2
- 206010003591 Ataxia Diseases 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 206010005003 Bladder cancer Diseases 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 238000010354 CRISPR gene editing Methods 0.000 description 2
- 206010007559 Cardiac failure congestive Diseases 0.000 description 2
- 102000000844 Cell Surface Receptors Human genes 0.000 description 2
- 108010001857 Cell Surface Receptors Proteins 0.000 description 2
- 206010008342 Cervix carcinoma Diseases 0.000 description 2
- 229920001287 Chondroitin sulfate Polymers 0.000 description 2
- 206010009944 Colon cancer Diseases 0.000 description 2
- XIZWKXATMJODQW-KKUMJFAQSA-N Cys-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N XIZWKXATMJODQW-KKUMJFAQSA-N 0.000 description 2
- XLLSMEFANRROJE-GUBZILKMSA-N Cys-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XLLSMEFANRROJE-GUBZILKMSA-N 0.000 description 2
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 2
- 108091000069 Cystinyl Aminopeptidase Proteins 0.000 description 2
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 2
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 2
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- 108700039887 Essential Genes Proteins 0.000 description 2
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 2
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 2
- 102000016970 Follistatin Human genes 0.000 description 2
- 108010014612 Follistatin Proteins 0.000 description 2
- 208000024412 Friedreich ataxia Diseases 0.000 description 2
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 2
- 102000006575 G-Protein-Coupled Receptor Kinases Human genes 0.000 description 2
- 108010008959 G-Protein-Coupled Receptor Kinases Proteins 0.000 description 2
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 2
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 2
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 2
- ULXXDWZMMSQBDC-ACZMJKKPSA-N Gln-Asp-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ULXXDWZMMSQBDC-ACZMJKKPSA-N 0.000 description 2
- HVQCEQTUSWWFOS-WDSKDSINSA-N Gln-Gly-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N HVQCEQTUSWWFOS-WDSKDSINSA-N 0.000 description 2
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 2
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 2
- UESYBOXFJWJVSB-AVGNSLFASA-N Gln-Phe-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O UESYBOXFJWJVSB-AVGNSLFASA-N 0.000 description 2
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 2
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 2
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 2
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 2
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 2
- 102000004547 Glucosylceramidase Human genes 0.000 description 2
- 108010017544 Glucosylceramidase Proteins 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 2
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 2
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 2
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 2
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 2
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 2
- 102000003886 Glycoproteins Human genes 0.000 description 2
- 108090000288 Glycoproteins Proteins 0.000 description 2
- 108010009202 Growth Factor Receptors Proteins 0.000 description 2
- 102000009465 Growth Factor Receptors Human genes 0.000 description 2
- 108010051696 Growth Hormone Proteins 0.000 description 2
- 108020005004 Guide RNA Proteins 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 2
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 2
- 102000016871 Hexosaminidase A Human genes 0.000 description 2
- 108010053317 Hexosaminidase A Proteins 0.000 description 2
- AASLOGQZZKZWKH-SRVKXCTJSA-N His-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AASLOGQZZKZWKH-SRVKXCTJSA-N 0.000 description 2
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 2
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 2
- 208000017604 Hodgkin disease Diseases 0.000 description 2
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 2
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 2
- 101000901140 Homo sapiens Arylsulfatase A Proteins 0.000 description 2
- 101001076904 Homo sapiens Dyslexia-associated protein KIAA0319-like protein Proteins 0.000 description 2
- 101000685712 Homo sapiens Protein S100-A1 Proteins 0.000 description 2
- 244000309467 Human Coronavirus Species 0.000 description 2
- 241000702617 Human parvovirus B19 Species 0.000 description 2
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 2
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 2
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 2
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 2
- 206010061218 Inflammation Diseases 0.000 description 2
- 102000008070 Interferon-gamma Human genes 0.000 description 2
- 108010074328 Interferon-gamma Proteins 0.000 description 2
- 102000004388 Interleukin-4 Human genes 0.000 description 2
- 108090000978 Interleukin-4 Proteins 0.000 description 2
- 208000008839 Kidney Neoplasms Diseases 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 2
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 2
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 2
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 2
- 102100020872 Leucyl-cystinyl aminopeptidase Human genes 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 206010025323 Lymphomas Diseases 0.000 description 2
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 2
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 2
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 2
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 2
- 101710096786 Lysosomal acid alpha-glucosidase Proteins 0.000 description 2
- XUMBMVFBXHLACL-UHFFFAOYSA-N Melanin Chemical compound O=C1C(=O)C(C2=CNC3=C(C(C(=O)C4=C32)=O)C)=C2C4=CNC2=C1C XUMBMVFBXHLACL-UHFFFAOYSA-N 0.000 description 2
- 102100022430 Melanocyte protein PMEL Human genes 0.000 description 2
- 101710151321 Melanostatin Proteins 0.000 description 2
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 2
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 2
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 2
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 2
- HZLSUXCMSIBCRV-RVMXOQNASA-N Met-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N HZLSUXCMSIBCRV-RVMXOQNASA-N 0.000 description 2
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 2
- 102000014962 Monocyte Chemoattractant Proteins Human genes 0.000 description 2
- 108010064136 Monocyte Chemoattractant Proteins Proteins 0.000 description 2
- 206010028289 Muscle atrophy Diseases 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- HOKKHZGPKSLGJE-GSVOUGTGSA-N N-Methyl-D-aspartic acid Chemical compound CN[C@@H](C(O)=O)CC(O)=O HOKKHZGPKSLGJE-GSVOUGTGSA-N 0.000 description 2
- 102000015336 Nerve Growth Factor Human genes 0.000 description 2
- 102000007072 Nerve Growth Factors Human genes 0.000 description 2
- 102400000064 Neuropeptide Y Human genes 0.000 description 2
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 2
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 2
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- 206010033128 Ovarian cancer Diseases 0.000 description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 229930040373 Paraformaldehyde Natural products 0.000 description 2
- 108060005874 Parvalbumin Proteins 0.000 description 2
- 102000001675 Parvalbumin Human genes 0.000 description 2
- 241000701945 Parvoviridae Species 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 2
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 2
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 2
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 2
- WFHRXJOZEXUKLV-IRXDYDNUSA-N Phe-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 WFHRXJOZEXUKLV-IRXDYDNUSA-N 0.000 description 2
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 2
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 2
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 2
- FKFCKDROTNIVSO-JYJNAYRXSA-N Phe-Pro-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O FKFCKDROTNIVSO-JYJNAYRXSA-N 0.000 description 2
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 2
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 2
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 2
- 108090000430 Phosphatidylinositol 3-kinases Proteins 0.000 description 2
- 102000003993 Phosphatidylinositol 3-kinases Human genes 0.000 description 2
- 208000007913 Pituitary Neoplasms Diseases 0.000 description 2
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 2
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 2
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 2
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 2
- GNADVDLLGVSXLS-ULQDDVLXSA-N Pro-Phe-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GNADVDLLGVSXLS-ULQDDVLXSA-N 0.000 description 2
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 2
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 2
- DMNANGOFEUVBRV-GJZGRUSLSA-N Pro-Trp-Gly Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)O)C(=O)[C@@H]1CCCN1 DMNANGOFEUVBRV-GJZGRUSLSA-N 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 102100035703 Prostatic acid phosphatase Human genes 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- 102100023097 Protein S100-A1 Human genes 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 102000014128 RANK Ligand Human genes 0.000 description 2
- 108010025832 RANK Ligand Proteins 0.000 description 2
- 108020005067 RNA Splice Sites Proteins 0.000 description 2
- 206010037742 Rabies Diseases 0.000 description 2
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 2
- 206010038389 Renal cancer Diseases 0.000 description 2
- 241000725643 Respiratory syncytial virus Species 0.000 description 2
- 201000007737 Retinal degeneration Diseases 0.000 description 2
- 206010039491 Sarcoma Diseases 0.000 description 2
- 102000011265 Sarcospan Human genes 0.000 description 2
- 108050001531 Sarcospan Proteins 0.000 description 2
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 2
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 2
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 2
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 2
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 2
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 2
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 2
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 2
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 2
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 2
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 2
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 2
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 2
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 2
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 208000027520 Somatoform disease Diseases 0.000 description 2
- 102000013275 Somatomedins Human genes 0.000 description 2
- 102100038803 Somatotropin Human genes 0.000 description 2
- 102000011971 Sphingomyelin Phosphodiesterase Human genes 0.000 description 2
- 108010061312 Sphingomyelin Phosphodiesterase Proteins 0.000 description 2
- 208000006011 Stroke Diseases 0.000 description 2
- 101710172711 Structural protein Proteins 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- 102000019197 Superoxide Dismutase Human genes 0.000 description 2
- 108010012715 Superoxide dismutase Proteins 0.000 description 2
- 101800001271 Surface protein Proteins 0.000 description 2
- 102220564325 TIR domain-containing adapter molecule 2_S16E_mutation Human genes 0.000 description 2
- 108700012411 TNFSF10 Proteins 0.000 description 2
- 208000022292 Tay-Sachs disease Diseases 0.000 description 2
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 2
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 2
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 2
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 2
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 2
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 2
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 2
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 2
- 108010009583 Transforming Growth Factors Proteins 0.000 description 2
- 102000009618 Transforming Growth Factors Human genes 0.000 description 2
- 208000030886 Traumatic Brain injury Diseases 0.000 description 2
- NOFFAYIYPAUNRM-HKUYNNGSSA-N Trp-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC2=CNC3=CC=CC=C32)N NOFFAYIYPAUNRM-HKUYNNGSSA-N 0.000 description 2
- WVHUFSCKCBQKJW-HKUYNNGSSA-N Trp-Gly-Tyr Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 WVHUFSCKCBQKJW-HKUYNNGSSA-N 0.000 description 2
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 2
- 102100031988 Tumor necrosis factor ligand superfamily member 6 Human genes 0.000 description 2
- 108050002568 Tumor necrosis factor ligand superfamily member 6 Proteins 0.000 description 2
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 2
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 2
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 2
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 2
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 2
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 2
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 2
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 2
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 2
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 2
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 2
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 2
- 102000003425 Tyrosinase Human genes 0.000 description 2
- 108060008724 Tyrosinase Proteins 0.000 description 2
- 108091026823 U7 small nuclear RNA Proteins 0.000 description 2
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 2
- 208000002495 Uterine Neoplasms Diseases 0.000 description 2
- 102000011856 Utrophin Human genes 0.000 description 2
- 108010075653 Utrophin Proteins 0.000 description 2
- 206010046851 Uveitis Diseases 0.000 description 2
- 206010046865 Vaccinia virus infection Diseases 0.000 description 2
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 2
- UZDHNIJRRTUKKC-DLOVCJGASA-N Val-Gln-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UZDHNIJRRTUKKC-DLOVCJGASA-N 0.000 description 2
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- ZEBRMWPTJNHXAJ-JYJNAYRXSA-N Val-Phe-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N ZEBRMWPTJNHXAJ-JYJNAYRXSA-N 0.000 description 2
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 2
- 108010003205 Vasoactive Intestinal Peptide Proteins 0.000 description 2
- 102400000015 Vasoactive intestinal peptide Human genes 0.000 description 2
- 208000009956 adenocarcinoma Diseases 0.000 description 2
- 108060000200 adenylate cyclase Proteins 0.000 description 2
- 102000030621 adenylate cyclase Human genes 0.000 description 2
- 239000000443 aerosol Substances 0.000 description 2
- 206010064930 age-related macular degeneration Diseases 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 2
- 102000005840 alpha-Galactosidase Human genes 0.000 description 2
- 108010030291 alpha-Galactosidase Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000000540 analysis of variance Methods 0.000 description 2
- 208000007502 anemia Diseases 0.000 description 2
- 210000002159 anterior chamber Anatomy 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 206010003246 arthritis Diseases 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000003376 axonal effect Effects 0.000 description 2
- 210000004227 basal ganglia Anatomy 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 102000016966 beta-2 Adrenergic Receptors Human genes 0.000 description 2
- 108010014499 beta-2 Adrenergic Receptors Proteins 0.000 description 2
- MSWZFWKMSRAUBD-UHFFFAOYSA-N beta-D-galactosamine Natural products NC1C(O)OC(CO)C(O)C1O MSWZFWKMSRAUBD-UHFFFAOYSA-N 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 230000015861 cell surface binding Effects 0.000 description 2
- 230000008614 cellular interaction Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 206010008118 cerebral infarction Diseases 0.000 description 2
- 208000026106 cerebrovascular disease Diseases 0.000 description 2
- 201000010881 cervical cancer Diseases 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 229940059329 chondroitin sulfate Drugs 0.000 description 2
- 208000010877 cognitive disease Diseases 0.000 description 2
- 208000029742 colonic neoplasm Diseases 0.000 description 2
- 238000010835 comparative analysis Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000009089 cytolysis Effects 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- 210000004443 dendritic cell Anatomy 0.000 description 2
- 238000011033 desalting Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 206010013023 diphtheria Diseases 0.000 description 2
- 238000009510 drug design Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 229940088598 enzyme Drugs 0.000 description 2
- 108700020302 erbB-2 Genes Proteins 0.000 description 2
- 208000030533 eye disease Diseases 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 229940126864 fibroblast growth factor Drugs 0.000 description 2
- 150000002270 gangliosides Chemical class 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 238000012226 gene silencing method Methods 0.000 description 2
- 102000034356 gene-regulatory proteins Human genes 0.000 description 2
- 210000004602 germ cell Anatomy 0.000 description 2
- 150000002298 globosides Chemical class 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 208000006454 hepatitis Diseases 0.000 description 2
- 231100000283 hepatitis Toxicity 0.000 description 2
- 208000002672 hepatitis B Diseases 0.000 description 2
- 231100000304 hepatotoxicity Toxicity 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 2
- 230000004054 inflammatory process Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 229940079322 interferon Drugs 0.000 description 2
- 229940028885 interleukin-4 Drugs 0.000 description 2
- VBUWHHLIZKOSMS-RIWXPGAOSA-N invicorp Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)C(C)C)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 VBUWHHLIZKOSMS-RIWXPGAOSA-N 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 201000010982 kidney cancer Diseases 0.000 description 2
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 2
- 208000032839 leukemia Diseases 0.000 description 2
- 201000007270 liver cancer Diseases 0.000 description 2
- 210000005229 liver cell Anatomy 0.000 description 2
- 208000014018 liver neoplasm Diseases 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 208000002780 macular degeneration Diseases 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 150000002739 metals Chemical class 0.000 description 2
- 230000009401 metastasis Effects 0.000 description 2
- 230000001394 metastastic effect Effects 0.000 description 2
- 206010061289 metastatic neoplasm Diseases 0.000 description 2
- 238000009126 molecular therapy Methods 0.000 description 2
- 201000006417 multiple sclerosis Diseases 0.000 description 2
- 210000000663 muscle cell Anatomy 0.000 description 2
- 201000006938 muscular dystrophy Diseases 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 210000005036 nerve Anatomy 0.000 description 2
- 229940053128 nerve growth factor Drugs 0.000 description 2
- 230000004770 neurodegeneration Effects 0.000 description 2
- 230000009689 neuronal regeneration Effects 0.000 description 2
- 239000003900 neurotrophic factor Substances 0.000 description 2
- URPYMXQQVHTUDU-OFGSCBOVSA-N nucleopeptide y Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 URPYMXQQVHTUDU-OFGSCBOVSA-N 0.000 description 2
- 210000001328 optic nerve Anatomy 0.000 description 2
- 210000002741 palatine tonsil Anatomy 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 229920002866 paraformaldehyde Polymers 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 238000002823 phage display Methods 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 108010043671 prostatic acid phosphatase Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 101150066583 rep gene Proteins 0.000 description 2
- 230000004258 retinal degeneration Effects 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 125000005629 sialic acid group Chemical group 0.000 description 2
- 239000002924 silencing RNA Substances 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 208000008732 thymoma Diseases 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 230000002463 transducing effect Effects 0.000 description 2
- 230000009529 traumatic brain injury Effects 0.000 description 2
- YFDSDPIBEUFTMI-UHFFFAOYSA-N tribromoethanol Chemical compound OCC(Br)(Br)Br YFDSDPIBEUFTMI-UHFFFAOYSA-N 0.000 description 2
- 229950004616 tribromoethanol Drugs 0.000 description 2
- 201000005112 urinary bladder cancer Diseases 0.000 description 2
- 206010046766 uterine cancer Diseases 0.000 description 2
- 238000002255 vaccination Methods 0.000 description 2
- 208000007089 vaccinia Diseases 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- PQFMROVJTOPVDF-JBDRJPRFSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]-4-carboxybutanoyl]amino]butanedioic acid Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PQFMROVJTOPVDF-JBDRJPRFSA-N 0.000 description 1
- HOZBSSWDEKVXNO-BXRBKJIMSA-N (2s)-2-azanylbutanedioic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O.OC(=O)[C@@H](N)CC(O)=O HOZBSSWDEKVXNO-BXRBKJIMSA-N 0.000 description 1
- LOGFVTREOLYCPF-KXNHARMFSA-N (2s,3r)-2-[[(2r)-1-[(2s)-2,6-diaminohexanoyl]pyrrolidine-2-carbonyl]amino]-3-hydroxybutanoic acid Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-KXNHARMFSA-N 0.000 description 1
- KBSORCBSCSOBHH-IHJZLXGESA-N (4s)-5-[(2s)-2-[[(2s)-6-amino-1-[[(2s)-1-[[(2s)-1-[[(2s)-1-[[2-[[(2s)-1-amino-3-methyl-1-oxobutan-2-yl]amino]-2-oxoethyl]amino]-1-oxopropan-2-yl]amino]-3-carboxy-1-oxopropan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-1-oxohexan-2-yl]carbamoyl]pyrrolidin Chemical compound CC(C)[C@@H](C(N)=O)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KBSORCBSCSOBHH-IHJZLXGESA-N 0.000 description 1
- 101150084750 1 gene Proteins 0.000 description 1
- MSWZFWKMSRAUBD-GASJEMHNSA-N 2-amino-2-deoxy-D-galactopyranose Chemical compound N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O MSWZFWKMSRAUBD-GASJEMHNSA-N 0.000 description 1
- MSWZFWKMSRAUBD-IVMDWMLBSA-N 2-amino-2-deoxy-D-glucopyranose Chemical compound N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O MSWZFWKMSRAUBD-IVMDWMLBSA-N 0.000 description 1
- NEWKHUASLBMWRE-UHFFFAOYSA-N 2-methyl-6-(phenylethynyl)pyridine Chemical compound CC1=CC=CC(C#CC=2C=CC=CC=2)=N1 NEWKHUASLBMWRE-UHFFFAOYSA-N 0.000 description 1
- 102100035352 2-oxoisovalerate dehydrogenase subunit alpha, mitochondrial Human genes 0.000 description 1
- LKKMLIBUAXYLOY-UHFFFAOYSA-N 3-Amino-1-methyl-5H-pyrido[4,3-b]indole Chemical compound N1C2=CC=CC=C2C2=C1C=C(N)N=C2C LKKMLIBUAXYLOY-UHFFFAOYSA-N 0.000 description 1
- 101800000504 3C-like protease Proteins 0.000 description 1
- BMNBFRJBYVIOAY-UHFFFAOYSA-N 4,7,8-trihydroxy-3,4-dihydro-2h-isoquinolin-2-ium-1-one;chloride Chemical compound [Cl-].OC1=CC=C2C(O)C[NH2+]C(=O)C2=C1O BMNBFRJBYVIOAY-UHFFFAOYSA-N 0.000 description 1
- QCVGEOXPDFCNHA-UHFFFAOYSA-N 5,5-dimethyl-2,4-dioxo-1,3-oxazolidine-3-carboxamide Chemical compound CC1(C)OC(=O)N(C(N)=O)C1=O QCVGEOXPDFCNHA-UHFFFAOYSA-N 0.000 description 1
- 102100030310 5,6-dihydroxyindole-2-carboxylic acid oxidase Human genes 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- LVRVABPNVHYXRT-BQWXUCBYSA-N 52906-92-0 Chemical compound C([C@H](N)C(=O)N[C@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O)C(C)C)C1=CC=CC=C1 LVRVABPNVHYXRT-BQWXUCBYSA-N 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- 241000238876 Acari Species 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 102100036464 Activated RNA polymerase II transcriptional coactivator p15 Human genes 0.000 description 1
- 241000958487 Adeno-associated virus 3B Species 0.000 description 1
- 102100032534 Adenosine kinase Human genes 0.000 description 1
- 108010076278 Adenosine kinase Proteins 0.000 description 1
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- 208000007848 Alcoholism Diseases 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 101710195183 Alpha-bungarotoxin Proteins 0.000 description 1
- 241000710929 Alphavirus Species 0.000 description 1
- 208000031277 Amaurotic familial idiocy Diseases 0.000 description 1
- 241000702419 Ambidensovirus Species 0.000 description 1
- 108010064733 Angiotensins Proteins 0.000 description 1
- 102000015427 Angiotensins Human genes 0.000 description 1
- 208000000103 Anorexia Nervosa Diseases 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 241000726096 Aratinga Species 0.000 description 1
- 241000712891 Arenavirus Species 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- OCOZPTHLDVSFCZ-BPUTZDHNSA-N Arg-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N OCOZPTHLDVSFCZ-BPUTZDHNSA-N 0.000 description 1
- ALOVURZCXKYKJC-NAKRPEOUSA-N Arg-Asp-Gln-Ser Chemical compound N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O ALOVURZCXKYKJC-NAKRPEOUSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- BQBPFMNVOWDLHO-XIRDDKMYSA-N Arg-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N BQBPFMNVOWDLHO-XIRDDKMYSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 1
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 1
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 1
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 1
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 102100032948 Aspartoacylase Human genes 0.000 description 1
- 108700023155 Aspartoacylases Proteins 0.000 description 1
- 206010003571 Astrocytoma Diseases 0.000 description 1
- 102000007372 Ataxin-1 Human genes 0.000 description 1
- 108010032963 Ataxin-1 Proteins 0.000 description 1
- 208000006096 Attention Deficit Disorder with Hyperactivity Diseases 0.000 description 1
- 208000036864 Attention deficit/hyperactivity disease Diseases 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 102100035526 B melanoma antigen 1 Human genes 0.000 description 1
- 101150061927 BMP2 gene Proteins 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 102000036365 BRCA1 Human genes 0.000 description 1
- 102000052609 BRCA2 Human genes 0.000 description 1
- 108700020462 BRCA2 Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 102000015735 Beta-catenin Human genes 0.000 description 1
- 108060000903 Beta-catenin Proteins 0.000 description 1
- 102400000748 Beta-endorphin Human genes 0.000 description 1
- 101800005049 Beta-endorphin Proteins 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 241000537222 Betabaculovirus Species 0.000 description 1
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 1
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 1
- 108010051479 Bombesin Proteins 0.000 description 1
- 102000013585 Bombesin Human genes 0.000 description 1
- 102000007350 Bone Morphogenetic Proteins Human genes 0.000 description 1
- 108010007726 Bone Morphogenetic Proteins Proteins 0.000 description 1
- 241000701922 Bovine parvovirus Species 0.000 description 1
- 102400000967 Bradykinin Human genes 0.000 description 1
- 101800004538 Bradykinin Proteins 0.000 description 1
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 description 1
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 1
- 206010006550 Bulimia nervosa Diseases 0.000 description 1
- 108010029697 CD40 Ligand Proteins 0.000 description 1
- 102100032937 CD40 ligand Human genes 0.000 description 1
- 206010006895 Cachexia Diseases 0.000 description 1
- 102100035344 Cadherin-related family member 1 Human genes 0.000 description 1
- 101100005789 Caenorhabditis elegans cdk-4 gene Proteins 0.000 description 1
- 101100342337 Caenorhabditis elegans klf-1 gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 208000022526 Canavan disease Diseases 0.000 description 1
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical group O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 1
- 102100026548 Caspase-8 Human genes 0.000 description 1
- 108090000538 Caspase-8 Proteins 0.000 description 1
- 102100035882 Catalase Human genes 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 241000684559 Chicken parvovirus Species 0.000 description 1
- 101000936911 Chionoecetes opilio Sarcoplasmic/endoplasmic reticulum calcium ATPase Proteins 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- 208000028698 Cognitive impairment Diseases 0.000 description 1
- 206010010099 Combined immunodeficiency Diseases 0.000 description 1
- 206010010456 Congenital emphysema Diseases 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 108700002856 Coronavirus Envelope Proteins Proteins 0.000 description 1
- 201000003075 Crimean-Congo hemorrhagic fever Diseases 0.000 description 1
- 102000000311 Cytosine Deaminase Human genes 0.000 description 1
- 108010080611 Cytosine Deaminase Proteins 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 206010012239 Delusion Diseases 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 229920000045 Dermatan sulfate Polymers 0.000 description 1
- 102000016607 Diphtheria Toxin Human genes 0.000 description 1
- 108010053187 Diphtheria Toxin Proteins 0.000 description 1
- 101100396994 Drosophila melanogaster Inos gene Proteins 0.000 description 1
- 241000684283 Duck parvovirus Species 0.000 description 1
- 101710205593 Dyslexia-associated protein KIAA0319-like protein Proteins 0.000 description 1
- 102000001301 EGF receptor Human genes 0.000 description 1
- 108060006698 EGF receptor Proteins 0.000 description 1
- 241001115402 Ebolavirus Species 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 1
- 102100027723 Endogenous retrovirus group K member 6 Rec protein Human genes 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 108010049140 Endorphins Proteins 0.000 description 1
- 102000009025 Endorphins Human genes 0.000 description 1
- 102100038083 Endosialin Human genes 0.000 description 1
- 101710144543 Endosialin Proteins 0.000 description 1
- 101710121417 Envelope glycoprotein Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000713730 Equine infectious anemia virus Species 0.000 description 1
- 241000121268 Erythroparvovirus Species 0.000 description 1
- 208000024720 Fabry Disease Diseases 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 201000003542 Factor VIII deficiency Diseases 0.000 description 1
- 108010014173 Factor X Proteins 0.000 description 1
- 241000701915 Feline panleukopenia virus Species 0.000 description 1
- 241000701925 Feline parvovirus Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108090000386 Fibroblast Growth Factor 1 Proteins 0.000 description 1
- 102100031706 Fibroblast growth factor 1 Human genes 0.000 description 1
- 102100024785 Fibroblast growth factor 2 Human genes 0.000 description 1
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 1
- 102000003972 Fibroblast growth factor 7 Human genes 0.000 description 1
- 108090000385 Fibroblast growth factor 7 Proteins 0.000 description 1
- 241000711950 Filoviridae Species 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 241000710831 Flavivirus Species 0.000 description 1
- 206010017076 Fracture Diseases 0.000 description 1
- 201000011240 Frontotemporal dementia Diseases 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 102100039717 G antigen 1 Human genes 0.000 description 1
- 108010046649 GDNP peptide Proteins 0.000 description 1
- 101710177291 Gag polyprotein Proteins 0.000 description 1
- 102400001370 Galanin Human genes 0.000 description 1
- 101800002068 Galanin Proteins 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 102000004862 Gastrin releasing peptide Human genes 0.000 description 1
- 108090001053 Gastrin releasing peptide Proteins 0.000 description 1
- 208000015872 Gaucher disease Diseases 0.000 description 1
- 201000004311 Gilles de la Tourette syndrome Diseases 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 1
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 1
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 1
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 1
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 1
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 1
- 208000010055 Globoid Cell Leukodystrophy Diseases 0.000 description 1
- 102000006395 Globulins Human genes 0.000 description 1
- 108010044091 Globulins Proteins 0.000 description 1
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- MUGLKCQHTUFLGF-WPRPVWTQSA-N Gly-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)CN MUGLKCQHTUFLGF-WPRPVWTQSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 208000032007 Glycogen storage disease due to acid maltase deficiency Diseases 0.000 description 1
- 206010053185 Glycogen storage disease type II Diseases 0.000 description 1
- 229920002683 Glycosaminoglycan Polymers 0.000 description 1
- 102000009165 Gonadoliberin Human genes 0.000 description 1
- 108050000048 Gonadoliberin Proteins 0.000 description 1
- 241001517118 Goose parvovirus Species 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 241000702620 H-1 parvovirus Species 0.000 description 1
- QXZGBUJJYSLZLT-UHFFFAOYSA-N H-Arg-Pro-Pro-Gly-Phe-Ser-Pro-Phe-Arg-OH Natural products NC(N)=NCCCC(N)C(=O)N1CCCC1C(=O)N1C(C(=O)NCC(=O)NC(CC=2C=CC=CC=2)C(=O)NC(CO)C(=O)N2C(CCC2)C(=O)NC(CC=2C=CC=CC=2)C(=O)NC(CCCN=C(N)N)C(O)=O)CCC1 QXZGBUJJYSLZLT-UHFFFAOYSA-N 0.000 description 1
- 229940121710 HMGCoA reductase inhibitor Drugs 0.000 description 1
- 208000004547 Hallucinations Diseases 0.000 description 1
- 206010019196 Head injury Diseases 0.000 description 1
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 description 1
- 108091005902 Hemoglobin subunit alpha Proteins 0.000 description 1
- 208000031220 Hemophilia Diseases 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- 241000711557 Hepacivirus Species 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 208000005176 Hepatitis C Diseases 0.000 description 1
- 206010019851 Hepatotoxicity Diseases 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- VBOFRJNDIOPNDO-YUMQZZPRSA-N His-Gly-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N VBOFRJNDIOPNDO-YUMQZZPRSA-N 0.000 description 1
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 1
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 1
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000874316 Homo sapiens B melanoma antigen 1 Proteins 0.000 description 1
- 101000737767 Homo sapiens Cadherin-related family member 1 Proteins 0.000 description 1
- 101000914324 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 5 Proteins 0.000 description 1
- 101000914321 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 7 Proteins 0.000 description 1
- 101000916489 Homo sapiens Chondroitin sulfate proteoglycan 4 Proteins 0.000 description 1
- 101001107084 Homo sapiens E3 ubiquitin-protein ligase RNF5 Proteins 0.000 description 1
- 101000886137 Homo sapiens G antigen 1 Proteins 0.000 description 1
- 101000599951 Homo sapiens Insulin-like growth factor I Proteins 0.000 description 1
- 101000578784 Homo sapiens Melanoma antigen recognized by T-cells 1 Proteins 0.000 description 1
- 101000692455 Homo sapiens Platelet-derived growth factor receptor beta Proteins 0.000 description 1
- 101000617725 Homo sapiens Pregnancy-specific beta-1-glycoprotein 2 Proteins 0.000 description 1
- 101000652321 Homo sapiens Protein SOX-15 Proteins 0.000 description 1
- 101000984042 Homo sapiens Protein lin-28 homolog A Proteins 0.000 description 1
- 101100369992 Homo sapiens TNFSF10 gene Proteins 0.000 description 1
- 101000652332 Homo sapiens Transcription factor SOX-1 Proteins 0.000 description 1
- 101000687905 Homo sapiens Transcription factor SOX-2 Proteins 0.000 description 1
- 101000687911 Homo sapiens Transcription factor SOX-3 Proteins 0.000 description 1
- 241001135569 Human adenovirus 5 Species 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 241000701806 Human papillomavirus Species 0.000 description 1
- 206010020575 Hyperammonaemia Diseases 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- 102000004627 Iduronidase Human genes 0.000 description 1
- 108010003381 Iduronidase Proteins 0.000 description 1
- HTDRTKMNJRRYOJ-SIUGBPQLSA-N Ile-Gln-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HTDRTKMNJRRYOJ-SIUGBPQLSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- LEHPJMKVGFPSSP-ZQINRCPSSA-N Ile-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 LEHPJMKVGFPSSP-ZQINRCPSSA-N 0.000 description 1
- MSASLZGZQAXVFP-PEDHHIEDSA-N Ile-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N MSASLZGZQAXVFP-PEDHHIEDSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 241000711450 Infectious bronchitis virus Species 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 108090001117 Insulin-Like Growth Factor II Proteins 0.000 description 1
- 102100037852 Insulin-like growth factor I Human genes 0.000 description 1
- 102400000022 Insulin-like growth factor II Human genes 0.000 description 1
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 1
- 108010042918 Integrin alpha5beta1 Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000000589 Interleukin-1 Human genes 0.000 description 1
- 108010002352 Interleukin-1 Proteins 0.000 description 1
- 102000003777 Interleukin-1 beta Human genes 0.000 description 1
- 108090000193 Interleukin-1 beta Proteins 0.000 description 1
- 102000003814 Interleukin-10 Human genes 0.000 description 1
- 108090000174 Interleukin-10 Proteins 0.000 description 1
- 102000003815 Interleukin-11 Human genes 0.000 description 1
- 108090000177 Interleukin-11 Proteins 0.000 description 1
- 102000013462 Interleukin-12 Human genes 0.000 description 1
- 108010065805 Interleukin-12 Proteins 0.000 description 1
- 102000003816 Interleukin-13 Human genes 0.000 description 1
- 108090000176 Interleukin-13 Proteins 0.000 description 1
- 102000003810 Interleukin-18 Human genes 0.000 description 1
- 108090000171 Interleukin-18 Proteins 0.000 description 1
- 102000004125 Interleukin-1alpha Human genes 0.000 description 1
- 108010082786 Interleukin-1alpha Proteins 0.000 description 1
- 102000000646 Interleukin-3 Human genes 0.000 description 1
- 108010002386 Interleukin-3 Proteins 0.000 description 1
- 102100039897 Interleukin-5 Human genes 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 102000004889 Interleukin-6 Human genes 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 102100021592 Interleukin-7 Human genes 0.000 description 1
- 108010002586 Interleukin-7 Proteins 0.000 description 1
- 102400001355 Interleukin-8 Human genes 0.000 description 1
- 108090001007 Interleukin-8 Proteins 0.000 description 1
- 102000000585 Interleukin-9 Human genes 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 241000121270 Iteradensovirus Species 0.000 description 1
- 241000710842 Japanese encephalitis virus Species 0.000 description 1
- 208000012659 Joint disease Diseases 0.000 description 1
- 102000011782 Keratins Human genes 0.000 description 1
- 108010076876 Keratins Proteins 0.000 description 1
- 101150072501 Klf2 gene Proteins 0.000 description 1
- 208000028226 Krabbe disease Diseases 0.000 description 1
- 108700021430 Kruppel-Like Factor 4 Proteins 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 125000000998 L-alanino group Chemical group [H]N([*])[C@](C([H])([H])[H])([H])C(=O)O[H] 0.000 description 1
- 102100031413 L-dopachrome tautomerase Human genes 0.000 description 1
- 101710093778 L-dopachrome tautomerase Proteins 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 125000000393 L-methionino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(SC([H])([H])[H])([H])[H] 0.000 description 1
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 208000006136 Leigh Disease Diseases 0.000 description 1
- 208000017507 Leigh syndrome Diseases 0.000 description 1
- 108010092277 Leptin Proteins 0.000 description 1
- 102000016267 Leptin Human genes 0.000 description 1
- 208000009625 Lesch-Nyhan syndrome Diseases 0.000 description 1
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- 102400000243 Leu-enkephalin Human genes 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108010022337 Leucine Enkephalin Proteins 0.000 description 1
- 108010013563 Lipoprotein Lipase Proteins 0.000 description 1
- 102100022119 Lipoprotein lipase Human genes 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 1
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- MQMIRLVJXQNTRJ-SDDRHHMPSA-N Lys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O MQMIRLVJXQNTRJ-SDDRHHMPSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 1
- 208000002569 Machado-Joseph Disease Diseases 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 208000030162 Maple syrup disease Diseases 0.000 description 1
- 241001115401 Marburgvirus Species 0.000 description 1
- 201000005505 Measles Diseases 0.000 description 1
- 102100028389 Melanoma antigen recognized by T-cells 1 Human genes 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 1
- ORRNBLTZBBESPN-HJWJTTGWSA-N Met-Ile-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ORRNBLTZBBESPN-HJWJTTGWSA-N 0.000 description 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 108091027966 Mir-137 Proteins 0.000 description 1
- 238000010629 Molecular evolutionary genetics analysis Methods 0.000 description 1
- 102400001357 Motilin Human genes 0.000 description 1
- 101800002372 Motilin Proteins 0.000 description 1
- 206010056886 Mucopolysaccharidosis I Diseases 0.000 description 1
- 208000005647 Mumps Diseases 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108091057508 Myc family Proteins 0.000 description 1
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 108700026495 N-Myc Proto-Oncogene Proteins 0.000 description 1
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 1
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 1
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 1
- 102100030124 N-myc proto-oncogene protein Human genes 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 102100028782 Neprilysin Human genes 0.000 description 1
- 108090000028 Neprilysin Proteins 0.000 description 1
- 102000005348 Neuraminidase Human genes 0.000 description 1
- 108010006232 Neuraminidase Proteins 0.000 description 1
- 102100032062 Neurogenic differentiation factor 2 Human genes 0.000 description 1
- 108050000625 Neurogenic differentiation factor 2 Proteins 0.000 description 1
- 102000003797 Neuropeptides Human genes 0.000 description 1
- 101100410801 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) pxr-1 gene Proteins 0.000 description 1
- 102400001103 Neurotensin Human genes 0.000 description 1
- 101800001814 Neurotensin Proteins 0.000 description 1
- 208000014060 Niemann-Pick disease Diseases 0.000 description 1
- 108010035916 Nuclear Matrix-Associated Proteins Proteins 0.000 description 1
- 102000008297 Nuclear Matrix-Associated Proteins Human genes 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108090001074 Nucleocapsid Proteins Proteins 0.000 description 1
- 102000011931 Nucleoproteins Human genes 0.000 description 1
- 108010061100 Nucleoproteins Proteins 0.000 description 1
- KUIFHYPNNRVEKZ-VIJRYAKMSA-N O-(N-acetyl-alpha-D-galactosaminyl)-L-threonine Chemical compound OC(=O)[C@@H](N)[C@@H](C)O[C@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1NC(C)=O KUIFHYPNNRVEKZ-VIJRYAKMSA-N 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000713112 Orthobunyavirus Species 0.000 description 1
- 108091007960 PI3Ks Proteins 0.000 description 1
- 102000036673 PRAME Human genes 0.000 description 1
- 108060006580 PRAME Proteins 0.000 description 1
- 102100034640 PWWP domain-containing DNA repair factor 3A Human genes 0.000 description 1
- 108050007154 PWWP domain-containing DNA repair factor 3A Proteins 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 206010033864 Paranoia Diseases 0.000 description 1
- 208000027099 Paranoid disease Diseases 0.000 description 1
- 108010079855 Peptide Aptamers Proteins 0.000 description 1
- 102000015731 Peptide Hormones Human genes 0.000 description 1
- 108010038988 Peptide Hormones Proteins 0.000 description 1
- 201000005702 Pertussis Diseases 0.000 description 1
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 1
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 1
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 1
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 1
- 201000011252 Phenylketonuria Diseases 0.000 description 1
- 102100026918 Phospholipase A2 Human genes 0.000 description 1
- 108010058864 Phospholipases A2 Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 208000000609 Pick Disease of the Brain Diseases 0.000 description 1
- 102100026547 Platelet-derived growth factor receptor beta Human genes 0.000 description 1
- 102100024266 Pneumadin Human genes 0.000 description 1
- 208000000474 Poliomyelitis Diseases 0.000 description 1
- 201000009916 Postpartum depression Diseases 0.000 description 1
- 102100022019 Pregnancy-specific beta-1-glycoprotein 2 Human genes 0.000 description 1
- 208000032319 Primary lateral sclerosis Diseases 0.000 description 1
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 1
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 1
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 1
- YKQNVTOIYFQMLW-IHRRRGAJSA-N Pro-Cys-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 YKQNVTOIYFQMLW-IHRRRGAJSA-N 0.000 description 1
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 1
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 1
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 1
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 241000169446 Promethis Species 0.000 description 1
- 102100030244 Protein SOX-15 Human genes 0.000 description 1
- 101710149951 Protein Tat Proteins 0.000 description 1
- 102100025460 Protein lin-28 homolog A Human genes 0.000 description 1
- 229940116193 Protein phosphatase inhibitor Drugs 0.000 description 1
- 241000287530 Psittaciformes Species 0.000 description 1
- 208000006262 Psychological Sexual Dysfunctions Diseases 0.000 description 1
- 208000028017 Psychotic disease Diseases 0.000 description 1
- 108091008103 RNA aptamers Proteins 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 101710100968 Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 208000005587 Refsum Disease Diseases 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 208000017442 Retinal disease Diseases 0.000 description 1
- 206010038910 Retinitis Diseases 0.000 description 1
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 1
- 101150107345 Rhag gene Proteins 0.000 description 1
- 241000713124 Rift Valley fever virus Species 0.000 description 1
- 108010083379 Sarcoglycans Proteins 0.000 description 1
- 102000006308 Sarcoglycans Human genes 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- CLKKNZQUQMZDGD-SRVKXCTJSA-N Ser-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 CLKKNZQUQMZDGD-SRVKXCTJSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 101710173693 Short transient receptor potential channel 1 Proteins 0.000 description 1
- 101710173694 Short transient receptor potential channel 2 Proteins 0.000 description 1
- 102400000821 Somatostatin-28 Human genes 0.000 description 1
- 101800004701 Somatostatin-28 Proteins 0.000 description 1
- 208000009415 Spinocerebellar Ataxias Diseases 0.000 description 1
- 201000003622 Spinocerebellar ataxia type 2 Diseases 0.000 description 1
- 208000036834 Spinocerebellar ataxia type 3 Diseases 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 102000046283 TNF-Related Apoptosis-Inducing Ligand Human genes 0.000 description 1
- 101710192266 Tegument protein VP22 Proteins 0.000 description 1
- 108010017842 Telomerase Proteins 0.000 description 1
- 108010055044 Tetanus Toxin Proteins 0.000 description 1
- 208000002903 Thalassemia Diseases 0.000 description 1
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 208000035317 Total hypoxanthine-guanine phosphoribosyl transferase deficiency Diseases 0.000 description 1
- 208000000323 Tourette Syndrome Diseases 0.000 description 1
- 208000016620 Tourette disease Diseases 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 108090000340 Transaminases Proteins 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102100030248 Transcription factor SOX-1 Human genes 0.000 description 1
- 102100024270 Transcription factor SOX-2 Human genes 0.000 description 1
- 102100024276 Transcription factor SOX-3 Human genes 0.000 description 1
- 241000711484 Transmissible gastroenteritis virus Species 0.000 description 1
- 206010044565 Tremor Diseases 0.000 description 1
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 1
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 1
- RERRMBXDSFMBQE-ZFWWWQNUSA-N Trp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERRMBXDSFMBQE-ZFWWWQNUSA-N 0.000 description 1
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 1
- YCQXZDHDSUHUSG-FJHTZYQYSA-N Trp-Thr-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 YCQXZDHDSUHUSG-FJHTZYQYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 102100021162 Tubulinyl-Tyr carboxypeptidase 2 Human genes 0.000 description 1
- 101710179228 Tubulinyl-Tyr carboxypeptidase 2 Proteins 0.000 description 1
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 206010054094 Tumour necrosis Diseases 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 1
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 1
- PLVVHGFEMSDRET-IHPCNDPISA-N Tyr-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC3=CC=C(C=C3)O)N PLVVHGFEMSDRET-IHPCNDPISA-N 0.000 description 1
- 108091000117 Tyrosine 3-Monooxygenase Proteins 0.000 description 1
- 102000048218 Tyrosine 3-monooxygenases Human genes 0.000 description 1
- 108091026838 U1 spliceosomal RNA Proteins 0.000 description 1
- 102100027244 U4/U6.U5 tri-snRNP-associated protein 1 Human genes 0.000 description 1
- 101710155955 U4/U6.U5 tri-snRNP-associated protein 1 Proteins 0.000 description 1
- 108020004417 Untranslated RNA Proteins 0.000 description 1
- 102000039634 Untranslated RNA Human genes 0.000 description 1
- 206010046298 Upper motor neurone lesion Diseases 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- XBRMBDFYOFARST-AVGNSLFASA-N Val-His-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N XBRMBDFYOFARST-AVGNSLFASA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 1
- NGXQOQNXSGOYOI-BQFCYCMXSA-N Val-Trp-Gln Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 NGXQOQNXSGOYOI-BQFCYCMXSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 201000004810 Vascular dementia Diseases 0.000 description 1
- 206010063661 Vascular encephalopathy Diseases 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 101001023436 Xenopus tropicalis Forkhead box protein J1 Proteins 0.000 description 1
- 241000710772 Yellow fever virus Species 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 101710185494 Zinc finger protein Proteins 0.000 description 1
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 201000009628 adenosine deaminase deficiency Diseases 0.000 description 1
- 108700015342 adenovirus terminal Proteins 0.000 description 1
- 210000001789 adipocyte Anatomy 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 208000030597 adult Refsum disease Diseases 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 201000007930 alcohol dependence Diseases 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- 239000004037 angiogenesis inhibitor Substances 0.000 description 1
- 229940121369 angiogenesis inhibitor Drugs 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 230000030741 antigen processing and presentation Effects 0.000 description 1
- 210000000612 antigen-presenting cell Anatomy 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 108010021908 aspartyl-aspartyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 210000001130 astrocyte Anatomy 0.000 description 1
- 230000003140 astrocytic effect Effects 0.000 description 1
- 208000015802 attention deficit-hyperactivity disease Diseases 0.000 description 1
- 208000036556 autosomal recessive T cell-negative B cell-negative NK cell-negative due to adenosine deaminase deficiency severe combined immunodeficiency Diseases 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- WOPZMFQRCBYPJU-NTXHZHDSSA-N beta-endorphin Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)[C@@H](C)O)C1=CC=CC=C1 WOPZMFQRCBYPJU-NTXHZHDSSA-N 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 210000001052 bipolar neuron Anatomy 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 239000003114 blood coagulation factor Substances 0.000 description 1
- DNDCVAGJPBKION-DOPDSADYSA-N bombesin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(N)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC=1NC2=CC=CC=C2C=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1NC(=O)CC1)C(C)C)C1=CN=CN1 DNDCVAGJPBKION-DOPDSADYSA-N 0.000 description 1
- 210000002449 bone cell Anatomy 0.000 description 1
- 229940112869 bone morphogenetic protein Drugs 0.000 description 1
- QXZGBUJJYSLZLT-FDISYFBBSA-N bradykinin Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(=O)NCC(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CO)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CCC1 QXZGBUJJYSLZLT-FDISYFBBSA-N 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- 229940077737 brain-derived neurotrophic factor Drugs 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 238000002619 cancer immunotherapy Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 210000001159 caudate nucleus Anatomy 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000036978 cell physiology Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000012412 chemical coupling Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- RQFQJYYMBWVMQG-IXDPLRRUSA-N chitotriose Chemical compound O[C@@H]1[C@@H](N)[C@H](O)O[C@H](CO)[C@H]1O[C@H]1[C@H](N)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)N)[C@@H](CO)O1 RQFQJYYMBWVMQG-IXDPLRRUSA-N 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010205 computational analysis Methods 0.000 description 1
- 210000004087 cornea Anatomy 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 108010068597 corticostatin Proteins 0.000 description 1
- ZKALIGRYJXFMNS-XBDDSDALSA-N corticostatin Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)CNC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C(C)C)C(C)C)CC1=CC=CC=C1 ZKALIGRYJXFMNS-XBDDSDALSA-N 0.000 description 1
- 238000012866 crystallographic experiment Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000016396 cytokine production Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 231100000868 delusion Toxicity 0.000 description 1
- 238000002298 density-gradient ultracentrifugation Methods 0.000 description 1
- AVJBPWGFOQAPRH-FWMKGIEWSA-L dermatan sulfate Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@H](OS([O-])(=O)=O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](C([O-])=O)O1 AVJBPWGFOQAPRH-FWMKGIEWSA-L 0.000 description 1
- 229940051593 dermatan sulfate Drugs 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 210000000188 diaphragm Anatomy 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 208000018459 dissociative disease Diseases 0.000 description 1
- 235000014103 egg white Nutrition 0.000 description 1
- 210000000969 egg white Anatomy 0.000 description 1
- 230000004406 elevated intraocular pressure Effects 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000003511 endothelial effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 108010078428 env Gene Products Proteins 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 210000003013 erythroid precursor cell Anatomy 0.000 description 1
- 102000015694 estrogen receptors Human genes 0.000 description 1
- 108010038795 estrogen receptors Proteins 0.000 description 1
- 231100000318 excitotoxic Toxicity 0.000 description 1
- 230000003492 excitotoxic effect Effects 0.000 description 1
- 229960000301 factor viii Drugs 0.000 description 1
- 229940012426 factor x Drugs 0.000 description 1
- 229940029303 fibroblast growth factor-1 Drugs 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 210000001652 frontal lobe Anatomy 0.000 description 1
- 208000024386 fungal infectious disease Diseases 0.000 description 1
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 1
- 229940044627 gamma-interferon Drugs 0.000 description 1
- PUBCCFNQJQKCNC-XKNFJVFFSA-N gastrin-releasingpeptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(N)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)CNC(=O)[C@H](C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(C)C)[C@@H](C)O)C(C)C)C1=CNC=N1 PUBCCFNQJQKCNC-XKNFJVFFSA-N 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 229960002442 glucosamine Drugs 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 208000007345 glycogen storage disease Diseases 0.000 description 1
- 201000004502 glycogen storage disease II Diseases 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 210000002149 gonad Anatomy 0.000 description 1
- 210000004565 granule cell Anatomy 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000002064 heart cell Anatomy 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 210000005003 heart tissue Anatomy 0.000 description 1
- 208000014951 hematologic disease Diseases 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 208000009429 hemophilia B Diseases 0.000 description 1
- 208000005252 hepatitis A Diseases 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 1
- 230000007686 hepatotoxicity Effects 0.000 description 1
- 229940022353 herceptin Drugs 0.000 description 1
- 210000004295 hippocampal neuron Anatomy 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000001744 histochemical effect Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 206010020718 hyperplasia Diseases 0.000 description 1
- 230000002267 hypothalamic effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000009851 immunogenic response Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000004957 immunoregulator effect Effects 0.000 description 1
- 229960003444 immunosuppressant agent Drugs 0.000 description 1
- 239000003018 immunosuppressive agent Substances 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 208000035231 inattentive type attention deficit hyperactivity disease Diseases 0.000 description 1
- 210000003552 inferior colliculi Anatomy 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 229960003130 interferon gamma Drugs 0.000 description 1
- 108700027921 interferon tau Proteins 0.000 description 1
- 229940076144 interleukin-10 Drugs 0.000 description 1
- 229940074383 interleukin-11 Drugs 0.000 description 1
- 229940117681 interleukin-12 Drugs 0.000 description 1
- 229940076264 interleukin-3 Drugs 0.000 description 1
- 229940100602 interleukin-5 Drugs 0.000 description 1
- 229940100601 interleukin-6 Drugs 0.000 description 1
- 229940100994 interleukin-7 Drugs 0.000 description 1
- 229940096397 interleukin-8 Drugs 0.000 description 1
- XKTZWUACRZHVAN-VADRZIEHSA-N interleukin-8 Chemical compound C([C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](NC(C)=O)CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(=O)N1[C@H](CCC1)C(=O)N1[C@H](CCC1)C(=O)N[C@@H](C)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CC=1C=CC(O)=CC=1)C(=O)N[C@H](CO)C(=O)N1[C@H](CCC1)C(N)=O)C1=CC=CC=C1 XKTZWUACRZHVAN-VADRZIEHSA-N 0.000 description 1
- 229940118526 interleukin-9 Drugs 0.000 description 1
- 210000001153 interneuron Anatomy 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 230000010189 intracellular transport Effects 0.000 description 1
- 238000000185 intracerebroventricular administration Methods 0.000 description 1
- NBQNWMBBSKPBAY-UHFFFAOYSA-N iodixanol Chemical compound IC=1C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C(I)C=1N(C(=O)C)CC(O)CN(C(C)=O)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I NBQNWMBBSKPBAY-UHFFFAOYSA-N 0.000 description 1
- 229960004359 iodixanol Drugs 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 210000002510 keratinocyte Anatomy 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 229940039781 leptin Drugs 0.000 description 1
- NRYBAZVQPHGZNS-ZSOCWYAHSA-N leptin Chemical compound O=C([C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)CCSC)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CS)C(O)=O NRYBAZVQPHGZNS-ZSOCWYAHSA-N 0.000 description 1
- URLZCHNOLZSCCA-UHFFFAOYSA-N leu-enkephalin Chemical compound C=1C=C(O)C=CC=1CC(N)C(=O)NCC(=O)NCC(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 URLZCHNOLZSCCA-UHFFFAOYSA-N 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 210000003715 limbic system Anatomy 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000012669 liquid formulation Substances 0.000 description 1
- 239000006193 liquid solution Substances 0.000 description 1
- 239000006194 liquid suspension Substances 0.000 description 1
- 230000007056 liver toxicity Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000009593 lumbar puncture Methods 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 230000001926 lymphatic effect Effects 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 208000024393 maple syrup urine disease Diseases 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 210000001259 mesencephalon Anatomy 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- CWWARWOPSKGELM-SARDKLJWSA-N methyl (2s)-2-[[(2s)-2-[[2-[[(2s)-2-[[(2s)-2-[[(2s)-5-amino-2-[[(2s)-5-amino-2-[[(2s)-1-[(2s)-6-amino-2-[[(2s)-1-[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carbonyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]-5-oxopentanoyl]amino]-5 Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)OC)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CCCN=C(N)N)C1=CC=CC=C1 CWWARWOPSKGELM-SARDKLJWSA-N 0.000 description 1
- XLTANAWLDBYGFU-UHFFFAOYSA-N methyllycaconitine hydrochloride Natural products C1CC(OC)C2(C3C4OC)C5CC(C(C6)OC)C(OC)C5C6(O)C4(O)C2N(CC)CC31COC(=O)C1=CC=CC=C1N1C(=O)CC(C)C1=O XLTANAWLDBYGFU-UHFFFAOYSA-N 0.000 description 1
- 108091056924 miR-124 stem-loop Proteins 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 210000004925 microvascular endothelial cell Anatomy 0.000 description 1
- 235000021243 milk fat Nutrition 0.000 description 1
- 208000024191 minimally invasive lung adenocarcinoma Diseases 0.000 description 1
- 238000000302 molecular modelling Methods 0.000 description 1
- SLZIZIJTGAYEKK-CIJSCKBQSA-N molport-023-220-247 Chemical compound C([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)CN)[C@@H](C)O)C1=CNC=N1 SLZIZIJTGAYEKK-CIJSCKBQSA-N 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 230000000921 morphogenic effect Effects 0.000 description 1
- 210000003078 multipolar neuron Anatomy 0.000 description 1
- 208000010805 mumps infectious disease Diseases 0.000 description 1
- 230000020763 muscle atrophy Effects 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 206010028417 myasthenia gravis Diseases 0.000 description 1
- 230000002107 myocardial effect Effects 0.000 description 1
- 229950006780 n-acetylglucosamine Drugs 0.000 description 1
- SQMWSBKSHWARHU-SDBHATRESA-N n6-cyclopentyladenosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(NC3CCCC3)=C2N=C1 SQMWSBKSHWARHU-SDBHATRESA-N 0.000 description 1
- 238000011392 neighbor-joining method Methods 0.000 description 1
- 210000000478 neocortex Anatomy 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 210000001178 neural stem cell Anatomy 0.000 description 1
- 230000004766 neurogenesis Effects 0.000 description 1
- 230000003982 neuronal uptake Effects 0.000 description 1
- 201000001119 neuropathy Diseases 0.000 description 1
- 230000007823 neuropathy Effects 0.000 description 1
- 239000004090 neuroprotective agent Substances 0.000 description 1
- PCJGZPGTCUMMOT-ISULXFBGSA-N neurotensin Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(O)C=C1 PCJGZPGTCUMMOT-ISULXFBGSA-N 0.000 description 1
- 230000000508 neurotrophic effect Effects 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 229920002113 octoxynol Polymers 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 101800000607 p15 Proteins 0.000 description 1
- 208000027753 pain disease Diseases 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 210000004738 parenchymal cell Anatomy 0.000 description 1
- 230000001936 parietal effect Effects 0.000 description 1
- 210000001152 parietal lobe Anatomy 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- 210000003668 pericyte Anatomy 0.000 description 1
- 210000000578 peripheral nerve Anatomy 0.000 description 1
- 210000001428 peripheral nervous system Anatomy 0.000 description 1
- 208000033808 peripheral neuropathy Diseases 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 239000008177 pharmaceutical agent Substances 0.000 description 1
- 239000003934 phosphoprotein phosphatase inhibitor Substances 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 210000004560 pineal gland Anatomy 0.000 description 1
- 208000010916 pituitary tumor Diseases 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 108010012604 pneumadin Proteins 0.000 description 1
- 108010089520 pol Gene Products Proteins 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 108010004165 polystatin Proteins 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000001566 pro-viral effect Effects 0.000 description 1
- 201000008752 progressive muscular atrophy Diseases 0.000 description 1
- 210000001176 projection neuron Anatomy 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 210000005267 prostate cell Anatomy 0.000 description 1
- 210000001510 pseudounipolar neuron Anatomy 0.000 description 1
- 210000002637 putamen Anatomy 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 101150007867 rbfox2 gene Proteins 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 108010043277 recombinant soluble CD4 Proteins 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000009256 replacement therapy Methods 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 210000003994 retinal ganglion cell Anatomy 0.000 description 1
- 210000003583 retinal pigment epithelium Anatomy 0.000 description 1
- 201000005404 rubella Diseases 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 201000000980 schizophrenia Diseases 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000001044 sensory neuron Anatomy 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 210000002363 skeletal muscle cell Anatomy 0.000 description 1
- 210000004927 skin cell Anatomy 0.000 description 1
- 208000019116 sleep disease Diseases 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 210000002460 smooth muscle Anatomy 0.000 description 1
- 210000000329 smooth muscle myocyte Anatomy 0.000 description 1
- 239000003998 snake venom Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 208000020431 spinal cord injury Diseases 0.000 description 1
- 210000003594 spinal ganglia Anatomy 0.000 description 1
- 201000003624 spinocerebellar ataxia type 1 Diseases 0.000 description 1
- 210000004989 spleen cell Anatomy 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 239000010902 straw Substances 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 230000000946 synaptic effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012385 systemic delivery Methods 0.000 description 1
- 101150047061 tag-72 gene Proteins 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 210000003478 temporal lobe Anatomy 0.000 description 1
- 229940118376 tetanus toxin Drugs 0.000 description 1
- 230000002992 thymic effect Effects 0.000 description 1
- 210000001578 tight junction Anatomy 0.000 description 1
- 230000005100 tissue tropism Effects 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 238000011820 transgenic animal model Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 102000035160 transmembrane proteins Human genes 0.000 description 1
- 108091005703 transmembrane proteins Proteins 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 230000005740 tumor formation Effects 0.000 description 1
- 239000000225 tumor suppressor protein Substances 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 239000002525 vasculotropin inhibitor Substances 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
- 229940051021 yellow-fever virus Drugs 0.000 description 1
- LYTCVQQGCSNFJU-LKGYBJPKSA-N α-bungarotoxin Chemical compound C(/[C@H]1O[C@H]2C[C@H]3O[C@@H](CC(=C)C=O)C[C@H](O)[C@]3(C)O[C@@H]2C[C@@H]1O[C@@H]1C2)=C/C[C@]1(C)O[C@H]1[C@@]2(C)O[C@]2(C)CC[C@@H]3O[C@@H]4C[C@]5(C)O[C@@H]6C(C)=CC(=O)O[C@H]6C[C@H]5O[C@H]4C[C@@H](C)[C@H]3O[C@H]2C1 LYTCVQQGCSNFJU-LKGYBJPKSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0075—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
- A61P9/10—Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14121—Viruses as such, e.g. new isolates, mutants or their genomic sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14145—Special targeting system for viral vectors
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Virology (AREA)
- Biophysics (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Microbiology (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Heart & Thoracic Surgery (AREA)
- Cardiology (AREA)
- Epidemiology (AREA)
- Neurosurgery (AREA)
- Neurology (AREA)
- Vascular Medicine (AREA)
- Urology & Nephrology (AREA)
- Immunology (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
본 개시는 아미노산 서열 중 변형을 포함하는 AAV 캡시드 단백질 및 상기 변형된 AAV 캡시드 단백질을 포함하는 바이러스 캡시드 및 바이러스 벡터를 제공한다. 본 개시는 또한 본 개시의 바이러스 벡터 및 바이러스 캡시드를 인 비보로 개체에 또는 세포에 투여하는 방법을 제공한다.
Description
교차 참조
본 출원은 모든 목적을 위해 그 전체로 참조에 의해 본 명세서에 포함된, 2017년 2월 15일에 제출된 미국 가출원 제62/459,286호의 25 U.S.C § 119(e)의 이익을 주장한다.
정부 지원의 진술(STATEMENT OF GOVERNMENT SUPPORT)
본 출원은 국립 보건원(National Institutes of Health)에 의해 제공된 그랜트 제P01HL112761호 및 제R01HL089221호 하에 정부 지원으로 이루어졌다. 정부는 본 발명에 대한 일부 권리를 갖는다.
서열 목록(SEQUENCE LISTING)
본 출원과 연관된 서열 목록이 종이 카피 대신 텍스트(text) 포맷으로 제공되고, 이에 의해 참조로 본 명세서에 포함된다. 서열 목록을 담은 텍스트 파일의 명칭은 STRD_004_01WO_SeqListSST25.txt이다. 텍스트 파일은 4 KB이고, 2018년 2월 14일에 작성되고 EFS-Web을 통해 온라인으로 제출된다.
기술 분야
본 발명은 AAV(adeno-associated virus)로부터의 변형된 캡시드(capsid) 단백질 및 이를 포함하는 바이러스 캡시드 및 벡터에 관한 것이다. 구체적으로, 본 발명은 목적 표적 조직에 대해 원하는 형질도입(transduction) 프로파일을 부여하기 위해 바이러스 벡터에 내포될 수 있는, 변형된 AAV 캡시드 단백질 및 이를 포함하는 캡시드에 관한 것이다.
동물 조직 및 아데노바이러스 스톡으로부터 단리된 신규한 AAV 주(adeno-associated virus strain)가 치료 유전자 전달 응용을 위해 이용가능한 AAV 벡터의 패널을 확장시켰다. 동물 모델에서 이러한 AAV 분리주의 조직 친화성(tissue tropism)을 맵핑하기 위한 포괄적 노력이 현재 진행되고 있다. AAV 벡터의 선택된 기관으로의 호밍(homing)을 유도하는 능력이 유전자 요법 및 기타 치료적 응용을 위해 유용하다.
본 발명은 원하는 표적화(targeting) 특징을 갖는 핵산 전달 벡터에 대한 당해 기술 분야의 요구를 다룬다.
발명의 요약
일부 구체예에서, 본 개시는 AAV(adeno-associated virus) 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S262, A263, S264, T265, A267, S268 및 H272에서 변형, 및 잔기 G266과 A267 사이에 단일 아미노산 삽입을 포함하고(VP1 번호부여(numbering)), 각 잔기의 번호부여는 AAV1 (서열번호 1)의 아미노산 서열, 또는 AAV2 (서열번호 2), AAV3 (서열번호 3), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), AAV9 (서열번호 7) 또는 AAVrh10 (서열번호 8) 중 해당하는(equivalent) 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질을 제공한다. 일부 구체예에서, 본 발명의 AAV 캡시드 단백질은 아미노산 잔기 Q148, E152, S157, T162, T326, D328, V330, T331, V341 및 S345에서의 변형, 및 잔기 E152와 P153 사이의 단일 아미노산 삽입을 더 포함할 수 있고(VP1 번호부여), 각 잔기의 번호부여는 서열번호 1의 아미노산 서열 또는 서열번호 2, 3, 4, 5, 6, 7 또는 8 중 해당하는 아미노산 잔기에 근거한다. 추가적 구체예에서, 본 발명의 AAV 캡시드 단백질은 아미노산 잔기 L188, S205, N223 및 A224 (VP1 번호부여)의 변형을 더 포함할 수 있고, 각 잔기의 번호부여는 서열번호 1의 아미노산 서열 또는 서열번호 2, 3, 4, 5, 6, 7 또는 8 중 해당하는 아미노산 잔기에 근거한다.
일부 구체예에서, 본 개시는 AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S262, A263, S264, T265, 및 A267 (VP1 번호부여)에서의 변형 및 잔기 S268과 N269 사이의 단일 아미노산 잔기 삽입을 포함하고, 상기 아미노산 잔기는 AAV1의 아미노산 서열(서열번호 1) 또는 AAV2 (서열번호 2), AAV3 (서열번호 3), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), AAV9 (서열번호 7) 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질을 제공한다. 일부 구체예에서, 상기 캡시드 단백질은 아미노산 잔기 H272에서 변형을 더 포함한다. 일부 구체예에서, AAV 캡시드 단백질은 아미노산 잔기 Q148, E152, S157, T162, H272, T326, D328, V330, T331, V341 및 S345에서의 변형, 및 잔기 E152와 P153 사이의 단일 아미노산 잔기 삽입을 더 포함한다. 추가적 구체예에서, 상기 AAV 캡시드 단백질은 아미노산 잔기 L188, S205, N223, A224, 및 H272에서의 변형을 더 포함한다.
일부 구체예에서, 본 개시는 AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 원형(native) AAV1 캡시드 단백질 (서열번호 1)의 아미노산 위치 262 내지 265(VP1 번호부여)에 해당하는 아미노산에서 아미노산 서열: X1-X2-X3-X4 (서열번호 35)을 초래하는 변형을 포함하고, 상기 서열 중 X1은 S가 아닌 아미노산이고; X2는 A가 아닌 아미노산이며; X3은 S가 아닌 아미노산이고; 및 X4는 T가 아닌 아미노산인 것인 AAV 캡시드 단백질을 제공한다.
일부 구체예에서, 본 개시는 AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S262, A263, S264, T265, A267, 및 H272에서의 변형, 및 잔기 S268과 N269 사이의 단일 아미노산 잔기 삽입(VP1 번호부여)을 포함하고, 각 잔기의 번호부여는 AAV1 (서열번호 2)의 아미노산 서열, 또는 AAV1 (서열번호 1), AAV3 (서열번호 3), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), AAV9 (서열번호 7) 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질을 제공한다.
일부 구체예에서, 본 개시는 AV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S262, Q263, S264, A266, S267, 및 H271에서의 변형 및 잔기 S261과 S262 사이의 하나 이상의 아미노산 잔기 삽입(VP1 번호부여)을 포함하고, 각 잔기의 번호부여는 AAV2 (서열번호 2)의 아미노산 서열, 또는 AAV1 (서열번호 1), AAV3 (서열번호 3), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), AAV9 (서열번호 7) 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질을 제공한다.
일부 구체예에서, 본 개시는 AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S262, Q263, S264, A266, A267, 및 H271에서의 변형 및 잔기 S261과 S262 사이의 하나 이상의 아미노산 잔기 삽입을 포함하고, 각 잔기의 번호부여는 AAV3 (서열번호 3)의 아미노산 서열, 또는 AAV1 (서열번호 1), AAV2 (서열번호 2), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), AAV9 (서열번호 7) 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질을 제공한다.
일부 구체예에서, 본 개시는 AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S263, S269, A237 (VP1 번호부여)에서의 변형을 포함하고, 각 잔기의 번호부여는 AAV9 (서열번호 9)의 아미노산 서열, 또는 AAV1 (서열번호 1), AAV2 (서열번호 2), AAV3 (서열번호 3), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질을 제공한다.
일부 구체예에서, 본 개시는 AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 서열번호 9 내지 서열번호 34 중 어느 하나의 서열을 포함하는 것인 AAV 캡시드 단백질을 제공한다.
본 개시는 또한 본 개시의 캡시드 단백질을 포함하는 AAV 캡시드, 및 본 개시의 AAV 캡시드를 포함하는 바이러스 벡터를 제공한다. 일부 구체예에서, 상기 바이러스 벡터는 본 개시의 AAV 캡시드 및 하나 이상의 말단 반복 서열(terminal repeat sequence)을 포함하는 핵산을 포함하고, 상기 핵산은 AAV 캡시드에 의해 둘러싸인다(encapsidated).
본 개시는 또한 본 명세서에 개시된 AAV 캡시드 및/또는 바이러스 벡터를 포함하는 약제학적 조성물을 제공한다.
또한, 세포를 본 개시의 바이러스 벡터와 접촉시키는 단계를 포함하는, 세포에 핵산 분자를 도입하는 방법, 및 개체에게 본 개시의 바이러스 벡터를 투여하는 단계를 포함하는, 개체에게 핵산 분자를 전달하는 방법을 제공한다.
또한, 본 개시는 신경 세포를 본 발명의 바이러스 벡터와 접촉시키는 단계를 포함하는, 목적 핵산 분자를 신경 세포에 선택적으로(selectively) 전달하는 방법으로서, 상기 바이러스 벡터는 상기 목적 핵산 분자를 포함하는 것인 방법을 제공한다.
또 다른 구체예에서, 본 개시는 개체에게 본 개시의 바이러스 벡터를 투여하는 단계를 포함하는, 개체에서 신경 질환 또는 결함을 치료하는 방법으로서, 상기 바이러스 벡터는 신경 질환 또는 결함의 치료에 효과적인 치료 단백질 또는 치료 RNA를 코딩하는 핵산 분자를 포함하는 것인 방법을 제공한다.
이들 양태 및 기타 양태가 하기에 제시된 설명에서 보다 상세하게 다루어진다.
달리 정의되지 않으면, 모든 기술 및 과학 용어는 본 개시가 속하는 분야에서 통상의 기술자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서에서 사용된 용어는 특정한 구체예를 설명하기 위한 목적 만을 위한 것이고, 한정하는 것으로 의도되지 않는다. 본 명세서에서 언급된 모든 간행물, 특허 출원, 특허, 및 기타 참고문헌은 그 전체로 참조에 의해 본 명세서에 포함된다.
정의
하기 용어가 본 명세서의 설명 및 첨부된 청구항에서 사용된다:
단수형("a," "an" 및 "the")은 문맥상 명확하게 달리 표시되지 않으면 복수형도 포함하는 것으로 의도된다.
또한, 폴리뉴클레오티드 또는 폴리펩티드 서열의 길이, 용량, 시간, 온도 등과 같은 측정가능한 양을 언급할 때 본 명세서에서 사용된 용어 "약(about)"은 특정된 양의 ±20%, ±10%, ±5%, ±1%, ±0.5%, 또는 심지어 ±0.1%의 변이를 포괄하도록 의도된다.
또한, 본 명세서에서 사용된, "및/또는(and/or)"은 관련된 열거 항목들 중 하나 또는 그 이상의 모든 가능한 조합 및 대안적으로 해석되는 경우("또는") 조합의 부재를 의미하고 포괄한다.
본 명세서에서 사용된, 전환 구(transitional phrase) "필수적으로 구성된(consisting essentially of)"은 청구항의 범위가 청구항에 기재된 특정 물질 또는 단계 및 청구된 발명의 "기본적이고 신규한 특징에 실질적으로 영향을 미치지 않는 것들(and those that do not materially affect the basic and novel characteristic(s))"을 포함하는 것으로 해석된다는 것을 의미한다. In re Herz, 537 F.2d 549, 551-52, 190 USPQ 461, 463 (CCPA 1976) (원문 중 강조) 참조; 또하, MPEP § 2111.03 참조. 따라서, 본 명세서의 청구항에서 사용될 때 "필수적으로 구성된(consisting essentially of)"은 "포함하는(comprising)"과 동등한 것으로 해석되는 것으로 의도되지 않는다.
문맥상 달리 표시되지 않으면, 본 명세서에 기재된 캡시드 단백질, 벡터, 조성물 및 방법의 다양한 특징이 임의의 조합으로 사용될 수 있는 것으로 구체적으로 의도된다.
또한, 본 개시는 일부 구체예에서, 본 명세서에 기재된 특징 또는 특징들의 조합이 배제되거나 생략될 수 있다는 것을 고려한다.
예를 들면, 명세서가 특정한 아미노산이 A, G, I, L 및/또는 V로부터 선택될 수 있다는 것을 나타낸다를 것을 더 설명하기 위해, 이 언어는 또한, 각각의 그러한 서브조합(subcombination)이 본 명세서에서 명확하게 기재된 것과 같이, 아미노산이 이러한 아미노산의 서브세트(subset), 예를 들면, A, G, I 또는 L; A, G, I 또는 V; A 또는 G; L 단독; 등으로부터 선택될 수 있다는 것을 나타낸다. 또한, 그러한 언어는 특정한 아미노산의 하나 또는 그 이상이 포기(disclaim)될 수 있다는 것을 나타낸다. 예를 들면, 특정한 구체예에서, 그러한 가능한 포기(disclaimer)가 본 명세서에 명시적으로 기재된 것처럼, 아미노산은 A, G 또는 I가 아니거나; A가 아니거나; G 또는 V가 아니거나; 등을 의미한다.
본 명세서에서 사용된, 용어 "감소(reduce," "reduces," "reduction")" 및 유사한 용어는 대조군(control) 또는 기준(reference) 대비, 적어도 약 25%, 35%, 50%, 75%, 80%, 85%, 90%, 95%, 97% 또는 그 이상의 감소를 의미한다.
본 명세서에서 사용된, 용어 "증가하다(increase, increases), "증가하는(increasing)", "강화하다(enhance, enhances)", "강화(enhancement)" 및 유사한 용어는 대조군 또는 기준 대비, 적어도 약 5%, 10%, 20%, 25%, 50%, 75%, 100%, 150%, 200%, 300%, 400%, 500% 또는 그 이상의 증가를 의미한다.
본 명세서에서 사용된 용어 "파보바이러스(parvovirus)"는 자가복제하는(autonomousl replicating) 파보바이러스 및 디펜도바이러스(dependoviruses)를 포함한, 파보바이러스 과(family Parvoviridae)를 포괄한다. 자가복제(autonomous) 파보바이러스는 파보바이러스(Parvovirus), 에리트로바이러스(Erythrovirus), 덴소바이러스(Densovirus), 이테라바이러스(Iteravirus) 및 콘트라바이러스(Contravirus) 속의 일원들을 포함한다. 대표적인 자가복제 파보바이러스는 MVM(minute virus of mouse), 소 파보바이러스(bovine parvovirus), 개 파보바이러스(canine parvovirus), 닭 파보바이러스(chicken parvovirus), FPV(feline panleukopenia virus), 고양이 파보바이러스(feline parvovirus), 거위 파보바이러스(goose parvovirus), H1 파보바이러스, MDP(muscovy duck parvovirus), B19 바이러스, 및 현재 공지거되나 또는 이후에 발견되는 기타 자가복제 파보바이러스를 포함하나 이에 한정되지 않는다. 기타 자가복제 파보바이러스는 당해 기술분야의 당업자에게 알려져있다. 예를 들면, BERNARD N. FIELDS et al., VIROLOGY, volume 2, chapter 69 (4th ed., Lippincott-Raven Publishers) 참조.
본 명세서에서 사용된, 용어 "아데노-연관 바이러스(adeno-associated virus)" (AAV)는 AAV 타입 1, AAV 타입 2, AAV 타입 3 (타입 3A 및 3B 포함), AAV 타입 4, AAV 타입 5, AAV 타입 6, AAV 타입 7, AAV 타입 8, AAV 타입 9, AAV 타입 10, AAV 타입 rh10, AAV 타입 11, AAV 타입 12, 조류 AAV, 소 AAV, 개 AAV, 말 AAV, 양 AAV, 및 현재 공지되거나 또는 이후에 발견된 기타 AAV를 포함하나, 이에 한정되지 않는다. 예를 들면, BERNARD N. FIELDS et al., VIROLOGY, volume 2, chapter 69 (4th ed., Lippincott-Raven Publishers) 참조. 다수의 AAV 혈청형 및 클레이드(clade)가 확인되었다(예를 들면, Gao et al. (2004) J. Virology 78:6381-6388; Moris et al. (2004) Virology 33-:375-383; 및 표 1 참조).
다양한 혈청형의 AAV 및 자가복제 파보바이러스의 게놈 서열, 및 원형(native) 말단 반복(terminal repeat)(TR), Rep 단백질, 및 캡시드 서브유닛의 서열이 당해 분야에서 알려져 있다. 그러한 서열은 문헌 또는 GenBank® Database와 같은 공개 데이터베이스에서 찾을 수 있다. 예를 들면, GenBank Accession Numbers NC_044927, NC-_002077, NC_001401, NC_001729, NC_001863, NC_001829, NC_001862, NC_000883, NC_001701, NC_001510, NC_006152, NC_006261, AF063497, U89790, AF043303, AF028705, AF028704, J02275, J01901, J02275, X01457, AF288061, AH009962, AY028226, AY028223, NC_001358, NC_001540, AF513851, AF513852, AY530579;를 참조하고, 이들의 개시는 파보바이러스 및 AAV 핵산 및 아미노산 서열의 개시에 대해 참조에 의해 본 명세서에 포함된다. 예를 들면, Srivistava et al. (1983) J. Virology 45:555; Chiorini et al. (1998) J. Virology 71:6823; Chiorini et al. (1999) J. Virology 73:1309; Bantel-Schaal et al. (1999) J. Virology 73:939; Xiao et al. (1999) J. Virology 73:3994; Muramatsu et al. (1996) Virology 221:208; Shade et al. (1986) J. Virol . 58:921; Gao et al. (2002) Proc . Nat. Acad . Sci . USA 99:11854; Moris et al. (2004) Virology 33-:375-383; 국제특허공개 WO 00/28061, WO 99/61601, WO 98/11244; 및 미국특허 제6,156,303호;를 참조하고, 이들의 개시는 파보바이러스 및 AAV 핵산 및 아미노산 서열의 개시에 대해 참조에 의해 본 명세서에 포함된다. 또한, 표 1 참조.
자가복제 파보바이러스 및 AAV의 캡시드 구조가 BERNARD N. FIELDS et al., VIROLOGY, volume 2, chapters 69 and 70 (4th ed., Lippincott-Raven Publishers)에 보다 상세하게 기재된다. 또한, AAV2 (Xie et al. (2002) Proc . Nat. Acad . Sci. 99:10405-10), AAV4 (Padron et al. (2005) J. Virol . 79: 5047-58), AAV5 (Walters et al. (2004) J. Virol . 78: 3361-71) 및 CPV (Xie et al. (1996) J. Mol. Biol . 6:497-520; Tsao et al. (1991) Science 251:1456-64; Drouin et al. (2013) Future Virol. 8(12):1183-1199)의 결정 구조의 설명을 참조한다.
본 명세서에서 사용된 용어 "친화성(tropism)"은 특정한 세포 또는 조직으로의 바이러스의 우선적 진입(preferential entry) 및 뒤이은 세포 중 바이러스 게놈에 의해 운반된 서열의 발현(예를 들면, 전사, 및 선택적으로 번역), 예를 들면, 재조합 바이러스를 위한 목적 이종기원(heterologous) 핵산의 발현을 의미한다. 당업자는, 일부 구체예에서, 바이러스 게놈으로부터의 이종기원 핵산 서열의 전사는 트랜스-작용 인자(trans-acting factor), 예를 들면, 유도성 프로모터 또는 달리 조절되는(otherwise regulated) 핵산 서열을 위한 트랜스-작용 인자의 부재 하에 개시될 수 없다는 것을 이해할 것이다. 재조합 AAV(rAAV) 게놈의 경우에, 바이러스 게놈으로부터의 유전자 발현은 안정적으로 통합된 프로바이러스(stably integrated provirus) 및/또는 비-통합 에피좀(non-integrated episome), 및 바이러스가 세포 내에서 취할 수 있는 기타 형태로부터 유래될 수 있다.
본 명세서에서 사용된, "전신 친화성(systemic tropism)" 및 "전신성 형질도입(systemic transduction)" (및 균등한 용어)은 본 개시의 바이러스 캡시드 또는 바이러스 벡터가 각각 신체 전체의 조직(예를 들면, 뇌, 폐, 골격 근육, 심장, 간, 신장 및/또는 췌장)에 대한 친화성을 보이거나 및/또는 형질도입된다는 것을 의미한다. 구체예에서, 중추 신경계(예를 들면, 뇌, 신경 세포, 등)의 전신성 형질도입이 관찰된다. 다른 구체예에서, 심근 조직의 전신셩 형질도입이 달성된다.
달리 표시되지 않은 경우에, "효율적 형질도입(efficient transduction)" 또는 "효율적 친화성(efficient tropism)", 또는 유사한 용어가 적합한 대조군 대비 결정될 수 있다(예를 들면, 대조군의 형질도입 또는 친화성 각각의 적어도 약 50%, 60%, 70%, 80%, 85%, 90%, 95%, 100%, 125%, 150%, 175%, 200%, 250%, 300%, 350%, 400%, 500% 또는 그 이상). 특정 구체예에서, 바이러스 벡터는 신경 세포 및 심근세포를 효율적으로 형질도입시키거나 또는 그에 대한 효율적 친화성을 갖는다. 적합한 대조군은 원하는 친화성 프로파일을 포함한 다양한 인자들에 의존적일 것이다.
유사하게, 적합한 대조군을 참조하여, 바이러스가 표적 조직에 "효율적으로 형질도입하지 않는(does not efficiently transduce)"지 여부 또는 표적 조직에 대해 "효율적 친화성을 보이지 않는(does not have efficient tropism)"지 여부가 결정될 수 있다. 특정 구체예에서, 바이러스 벡터는 간, 신장, 생식선 및/또는 생식 세포(germ cell)에 대해 효율적으로 형질감염하지 않는다(즉, 효율적 친화성을 갖지 않는다). 특정 구체예에서, 조직(예를 들면, 간)의 원치않는 형질도입은 원하는 표적 조직(예를 들면, 중추 신경계의 세포; 심근세포)의 형질 도입의 수준 대비 20% 또는 그 미만, 10% 또는 그 미만, 5% 또는 그 미만, 1% 또는 그 미만, 0.1% 또는 그 미만이다.
본 명세서에서 사용된용어 "폴리펩티드(polypeptide)"는 달리 표시되지 않는 경우, 펩티드 및 단백질을 모두 포함한다.
"폴리뉴클레오티드(polynucleotide)"는 뉴클레오티드 염기의 서열이고, RNA, DNA 또는 DNA-RNA 하이브리드 서열(천연 및 비-천연 뉴클레오티드 포함)일 수 있으나, 대표적 구체예에서, 단일 가닥 또는 이중 가닥 DNA 서열이다.
본 명세서에서 사용된, "단리된(isolated)" 폴리뉴클레오티드(예를 들면, "단리된 DNA" 또는 "단리된 RNA")는 천연 개체 또는 바이러스의 나머지 성분들 중 적어도 일부, 예를 들면, 해당 폴리뉴클레오티드와 회합된(associated) 것으로 통상적으로 발견되는 세포 또는 바이러스의 구조적 성분 또는 기타 폴리뉴클레오티드와 적어도 부분적으로 분리된 폴리뉴클레오티드를 의미한다. 대표적 구체예에서, "단리된(isolated)" 핵산 분자는 출발 물질 대비 적어도 약 10-배, 100-배, 1000-배, 10,000-배 또는 그 이상 농축(enrich)된다.
마찬가지로, "단리된" 폴리펩티드는 천연 개체 또는 바이러스의 나머지 성분들 중 적어도 일부, 예를 들면, 해당 폴리펩티드와 회합된 것으로 통상적으로 발견되는 세포 또는 바이러스의 구조적 성분 또는 기타 폴리펩티드와 적어도 부분적으로 분리된 폴리펩티드를 의미한다. 대표적 구체예에서, "단리된" 폴리펩티드는 출발 물질 대비 적어도 약 10-배, 100-배, 1000-배, 10,000-배 또는 그 이상 농축된다.
본 명세서에서 사용된, 바이러스 벡터의 "단리(isolate)" 또는 "정제(purify)" (또는 문법적 균등물)는, 바이러스 벡터가 출발 물질 중 나머지 성분들 중 적어도 일부로부터 적어도 부분적으로 분리된다는 것을 의미한다. 대표적 구체예에서, "단리된" 또는 "정제된(purified)" 바이러스 벡터는 출발 물질 대비 적어도 약 10-배, 100-배, 1000-배, 10,000-배 또는 그 이상 농축된다.
본 명세서에서 사용된, "신경 세포(neuronal cell)"는 뇌 하부-구조물(sub-structure), 예를 들면, 피질, 운동 피질(motor cortex), 해마, 시상하부, 선조체, 기저핵, 편도체, 소뇌, 배근 신경절(dorsal root ganglia) 및/또는 척수에 존재하는 감각 뉴런(sensory neuron), 위-단극 뉴런(pseudo-unipolar neuron), 운동 뉴런(motor neuron), 다극성 뉴런(multipolar neuron), 중개뉴런(interneuron), 및/또는 양극성 뉴런(bipolar neuron)을 포함한다.
"치료 단백질(therapeutic protein)"은 세포 또는 개체 중 단백질의 부재 또는 결함으로부터 기인된 증상을 경감, 감소, 예방, 지연시키고 및/또는 안정화시킬 수 있는 단백질이고 및/또는 개체에게 달리 유익을 부여하는 단백질이다.
본 명세서에서 사용된, "치료 RNA 분자(therapeutic RNA molecule)" 또는 "기능성 RNA 분자(functional RNA molecule)"는 안티센스 핵산, 리보자임 (예를 들면, 미국특허 제5,877,022호에 기재된 것과 같은 것), 스플라이세오솜-매개 트랜스-스플라이싱(spliceosome-mediated trans-splicing)을 수행하는 RNA(Puttaraju et al. (1999) Nature Biotech. 17:246; 미국특허 제6,013,487호; 미국특허 제 6,083,702호 참조), 유전자 사일런싱(gene silencing)을 매개하는, siRNA, shRNA 또는 miRNA를 포함한 RNAi(interfering RNA) (Sharp et al., (2000) Science 287:2431 참조), 및 기타 비-번역(non-translated) RNA, 예를 들면, "가이드(guide)" RNA (Gorman et al. (1998) Proc . Nat. Acad . Sci . USA 95:4929; U.S. Patent No. 5,869,248 to Yuan et al.) 및 당업계에 알려진 등가물을 포함한다.
용어 "치료하다(treat)", "치료하는(treating)" 또는 "치료(treatment of)" (및 그의 문법적 변형)에 의해, 개체의 질환의 중증도가 적어도 부분적으로 개선 또는 안정화되고 및/또는 하나 이상의 임상적 증상의 일부 경감, 완화, 감소 또는 안정화가 이루어지고, 및/또는 질병 또는 질환의 진행의 지연이 있다는 것을 의미한다.
용어 "예방하다(prevent)", "예방하는(preventing)" 및 "예방(prevention)" (및 그의 문법적 변형)은 본 개시의 방법의 부재 시 일어났을 것 대비 개체에서 질병, 질환, 및/또는 임상적 증상의 발병의 예방 및/또는 지연, 및/또는 질병, 질환, 및/또는 임상적 증상의 발병의 중증도의 감소를 의미한다. 예방은 완전할 수 있고, 예를 들면, 질병, 질환 및/또는 임상적 증상의 완전한 부재일 수 있다. 예방은 또한 부분적일 수 있어서, 개체에서 질병, 질환 및/또는 임상적 증상의 발생 및/또는 발병의 중증도가 본 개시의 부재 시 일어났을 것보다 덜할 수 있다.
본 명세서에서 사용된 "치료 유효(treatment effective)"량은 개체에게 개선 또는 유익을 제공하기에 충분한 양이다. 대안적으로 기술하면, "치료 유효"량은 개체에서 하나 이상의 임상적 증상의 완화, 경감, 감소 및/또는 안정화를 제공할 양이다. 당업자는 개체에게 일부 유익이 제공되는 한, 치료 효과가 완전하거나 근치적(curative)일 필요는 없다는 것을 이해할 것이다.
본 명세서에서 사용된 "예방 유효(prevention effective)"량은 본 개시의 방법의 부재시 일어났을 것 대비 개체에서 질병, 질환 및/또는 임상적 증상의 발병(onset)을 예방 및/또는 지연시키고 및/또는 개체에서 질병, 질환 및/또는 임상적 증상의 발병의 중증도를 감소 및/또는 지연시키기에 충분한 양이다. 당업자는 일부 유익이 개체에게 제공되는 한, 예방의 수준이 완전할 필요가 없다는 것을 이해할 것이다.
용어 "이종기원 뉴클레오티드 서열(heterologous nucleotide sequence)"과 "이종기원 핵산 분자(heterologous nucleic acid molecule)"는 본 명세서에서 호환적으로 사용되고 바이러스에서 천연적으로 발생하지 않는 핵산 분자 및/또는 뉴클레오티드 서열을 의미한다. 일반적으로, 이종기원 핵산 분자 또는 뉴클레오티드 서열은 (예를 들면, 세포 또는 개체로의 전달을 위한) 목적 단백질 또는 목적 비번역(nontranslated) RNA를 코딩하는 개방 해독 프레임(open reading frame)을 포함한다.
본 명세서에서 사용된, 용어 "바이러스 벡터(virus vector)", "벡터(vector)", 또는 "유전자 전달 벡터(gene delivery vector)"는 핵산 전달 비히클로 기능하고, 비리온(virion) 내에 패키징된 벡터 게놈(예를 들면, 바이러스 DNA [vDNA])을 포함하는 바이러스(예를 들면, AAV) 입자를 의미한다. 대안적으로, 일부 문맥에서, 용어 "벡터"는 벡터 게놈 및/또는 vDNA 단독을 의미하기 위해 사용될 수 있다.
"rAAV 벡터 게놈(rAAV vector genome)" 또는 "rAAV 게놈"은 하나 이상의 이종기원 핵산 서열을 포함하는 재조합 AAV 게놈(즉, vDNA)이다. rAAV 벡터는 일반적으로 바이러스를 생성하기 위해 시스(cis)인 말단 반복(TR)만을 요구한다. 모든 다른 바이러스 서열은 불필요하고(dispensable) 트랜스로(in trans) 제공될 수 있다(Muzyczka (1992) Curr . Topics Microbiol . Immunol . 158:97). 통상적으로, rAAV 벡터 게놈은 벡터에 의해 효율적으로 패키징될 수 있는 형질전환 유전자(transgene)의 크기를 최대화하기 위해 하나 이상의 TR 서열만은 보유할 것이다. 구조 및 비-구조 단백질 코딩 서열은 트랜스로(예를 들면, 벡터, 예를 들면, 플라스미드로부터, 및/또는 서열을 패키징 세포(packaging cell) 내로 안정적으로 통합하는 것에 의해) 제공될 수 있다. 구체예에서, rAAV 벡터 게놈은 하나 이상의 말단 반복(TR) 서열(예를 들면, AAV TR 서열), 선택적으로(optionally) 2개의 TR(예를 들면, 2개의 AAV TR)을 포함하고, 이들은 통상적으로 벡터 게놈의 5' 및 3' 말단에 있고, 이종기원 핵산 서열의 측면에 위치하나(flank), 그에 인접할 필요는 없다. TR은 상호 간에 동일하거나 또는 상이할 수 있다.
용어 "말단 반복(terminal repeat)" 또는 "TR"은 헤어핀(hairpin) 구조를 형성하고 역전 말단 반복(inverted terminal repeat)으로 기능하는(즉, 복제, 바이러스 패키징(virus packaging), 통합(integration), 및/또는 프로바이러스 구제(provirus rescue) 등과 같은 원하는 기능을 매개하는) 바이러스 말단 반복 서열 또는 합성 서열을 포함한다. TR은 AAV TR 또는 비-AAV TR일 수 있다. 예를 들면, 비-AAV TR 서열, 예를 들면, 다른 파보바이러스(예를 들면, CPV(canine parvovirus), MVM(mouse parvovirus), 인간 파보바이러스 B-19)의 TR 서열일 수 있거나, 또는 기타 적합한 바이러스 서열(예를 들면, SV40 복제의 원점(origin)으로 기능할 수 있는 SV40 헤어핀)이 TR로서 사용될 수 있고, 이들은 절단, 치환, 삽입 및/또는 첨가에 의해 더 변형될 수 있다. 또한, TR은 부분적으로 또는 완전히 합성일 수 있고, 예를 들면, Samulski 등에 의한 미국 특허 제5,478,745호에 기재된 "이중-D 서열(double-D sequence)"일 수 있다.
"AAV 말단 반복(AAV terminal repeat)" 또는 "AAV TR"은 혈청형 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 AAV 또는 현재 공지되거나 또는 이후에 발견되는 기타 AAV(예를 들면, 표 1 참조)를 포함하나, 그에 한정되지 않는 AAV로부터 유래될 수 있다. AAV 말단 반복은 말단 반복이 원하는 기능, 예를 들면, 복제, 바이러스 패키징, 통합, 및/또는 프로바이러스 구제 등과 같은 기능을 매개하는 한, 원형(native) 말단 반복 서열일 필요는 없다(예를 들면, 천연 AAV TR 서열은 삽입, 결실, 치환, 절단 및/또는 미스센스(missense) 돌연변이에 의해 변형될 수 있다).
본 개시의 바이러스 벡터는 또한, 국제 특허 공개 WO 00/28004 및 Chao et al. (2000) Molecular Therapy 2:619에 기재된 바와 같은, "표적화(targeted)" 바이러스 벡터(예를 들면, 지향된 친화성(directed tropism)을 갖는 바이러스 벡터) 및/또는 "하이브리드(hybrid)" 파보바이러스(즉, 바이러스 TR 및 바이러스 캡시드가 상이한 파보바이러스로부터 유래된 것인 파보바이러스)일 수 있다.
본 개시의 바이러스 벡터는 또한 국제 특허 공개 WO 01/92551 (그 개시가 전체로 참조에 의해 포함됨)에 기재된 이중가닥 파보바이러스 입자(duplexed parvovivus particle)일 수 있다. 따라서, 일부 구체예에서, 이중가닥(duplex) 게놈은 본 개시의 바이러스 캡시드 내에 패키징될 수 있다.
또한, 바이러스 캡시드 또는 게놈 요소는 삽입, 결실, 및/또는 치환을 포함한 기타 변형을 포함할 수 있다.
본 명세서에서 사용된, 용어 "아미노산(amino acid)"은 천연 아미노산, 그의 변형된 형태, 및 합성 아미노산을 포함한다.
천연, 좌선성(levorotatory) (L-) 아미노산이 표 3에 표시된다.
또한, 비-자연발생(non-naturally occurring) 아미노산은 Wang et al. Annu Rev Biophys Biomol Struct . 35:225-49 (2006))에 의해 기재된 "비천연(unnatural)" 아미노산일 수 있다. 이러한 비천연 아미노산은 목적 분자를 AAV 캡시드 단백질에 화학적으로 연결시키기 위해 유리하게 이용될 수 있다.
변형된
AAV
캡시드
단백질 및 이를 포함하는 바이러스
캡시드
및 바이러스 벡터
본 개시는 아미노산 서열 중 돌연변이(즉, 치환, 또는 삽입, 또는 결실일 수 있는 변형)를 포함하는 AAV 캡시드 단백질 및 변형된 AAV 캡시드 단백질을 포함하는 바이러스 캡시드 및 바이러스 벡터를 제공한다. 돌연변이된 AAV 캡시드 단백질, 및 이들을 코딩하는 핵산은 자연에서 발견되지 않고(즉, 비-천연적이고) 자연에서 발견되는 야생형 서열의 서열이나 이들 서열의 가능을 갖지 않는다. 오히려, 본 발명자들은 본 명세서에 기재된 아미노산 위치에서의 변형이 하기를 포함하나, 이에 한정되지 않는 변형된 AAV 캡시드 단백질을 포함하는 바이러스 벡터에 하나 이상의 바람직한 특성을 부여할 수 있다는 것을 발견했다: (i) 전신 주사 후 혈뇌장벽을 통과한 후 신경 세포의 선택적 형질도입; (ii) 전신 주사 후 심장 조직과 신경 조직의 동시 형질도입; 및 (iii) 간, 비장, 신장 및 기타 말초 기관(peripheral organ)으로부터의 탈표적화.
특정 구체예에서, 본 개시의 변형된 AAV 캡시드 단백질은 원형 AAV1 캡시드 단백질의 아미노산 서열 중 또는 AAV2, AAV3, AAV6, AAV7, AAV8, AAV9 및 AAVrh.10을 포함하나, 이에 한정되지 않는 또 다른 AAV 혈청형으로부터의 캡시드 단백질의 해당하는 아미노산 잔기에서 하나 이상의 돌연변이(즉, 변형)를 포함한다. 원형 AAV1 캡시드 단백질 중 이들 위치에 "상당하는(correspond to)" 다른 AAV 혈청형 또는 변형된 AAV 캡시드 중 아미노산 위치는 당업자에게 자명할 것이고, 서열 정렬 기법(예를 들면, WO 2006/066066의 도 7 참조) 및/또는 결정 구조 분석(Padron et al. (2005) J. Virol . 79:5047-58)을 이용하여 용이하게 결정될 수 있다.
당업자는 특정 AAV 캡시드 단백질에 대해, 상당하는 아미노산 위치가 바이러스에 부분적으로 또는 완전히 존재하는지 여부, 또는 대안적으로 완전히 부재하는지 여부에 따라, 상당하는 변형이 삽입 및/또는 치환일 것으로 이해할 것이다. 유사하게, AAV1이 아닌 AAV를 변형시키는 경우, 특정 아미노산 위치가 (VP1 번호부여 기준) AAV1 중 위치와 상이할 수 있다. 본 명세서의 다른 부분에서 검토되는 바와 같이, 상당하는 아미노산 위치는 공지된 기법을 이용하여 당업자에게 즉시 자명할 것이다.
본 명세서에서 사용된, 아미노산 서열 중 "돌연변이(mutation)" 또는 "변형(modification)"은 치환, 삽입 및/또는 결실을 포함하고, 이들 각각은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 그 이상의 아미노산을 포함할 수 있다. 특정 구체예에서, 변형은 치환이다. 다른 구체예에서, 변형은 삽입(예를 들면, 아미노산 서열 중 2개의 아미노산 사이의 단일 아미노산 잔기의 삽입)이다
따라서, 일 구체예에서, 본 개시는 AAV(adeno-associated virus) 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 (VPI 번호부여) 아미노산 잔기 S262, A263, S264, T265, A267, S268 및 H272에서의 변형, 및 잔기 266과 267 사이의 단일 아미노산 삽입을 포함하거나, 이들로 필수적으로 구성되거나 또는 이들로 구성되고, 각 잔기의 번호부여는 AAV1 (서열번호 1)의 아미노산 서열, 또는 AAV2 (서열번호 2), AAV3 (서열번호 3), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), AAV9 (서열번호 7) 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질을 제공한다. 일부 구체예에서, AAV 캡시드 단백질은 아미노산 잔기 H272에서 변형을 포함할 수 있다. 특정 구체예에서, 상기 변형은 S262N, A263G, S264T, T265S, A267S, S268T, H272T, 및 이들의 조합이다. 특정 구체예에서, 잔기 266과 267 사이의 단일 아미노산 잔기 삽입은 G (-267G로 기재됨)이다.
일부 구체예에서, 전술된 AAV 캡시드 단백질은 아미노산 잔기 Q148, E152, S157, T162, H272, T326, D328, V330, T331, V341 및 S345에서의 변형, 및 잔기 152와 153 사이의 단일 아미노산 잔기 삽입 (VP1 번호부여)을 더 포함하거나, 이들로 필수적으로 구성되거나, 또는 이들로 구성될 수 있고, 각 잔기의 번호부여는 서열번호 1의 아미노산 서열, 또는 서열번호 2, 3, 4, 5, 6, 7 또는 8 중 해당하는 아미노산 서열 잔기에 근거한다. 특정 구체예에서, 변형은 Q148P, E152R, S157T, T162K, H272T, T326Q, D328E, V330T, T331K, V341I 및 S345T이다. 특정 구체예에서, 잔기 152와 153 사이의 단일 아미노산 잔기 삽입은 S (-153S로 기재됨)이다.
일부 구체예에서, 전술된 AAV 캡시드 단백질은 아미노산 잔기 L188, S205, N223, A224, 및 H272 (VP1 numbering)의 변형을 더 포함하거나, 이들로 필수적으로 구성되거나, 또는 이들로 구성될 수 있고, 각 잔기의 번호부여는 서열번호 1의 아미노산 서열 또는 서열번호 2, 3, 4, 5, 6, 7 또는 8 중 해당하는 아미노산 잔기에 근거한다. 특정 구체예에서, 상기 변형은 L188I, S205A, N223S, A224S, 및 H272T이다.
일부 구체예에서, 본 개시는 AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S262, A263, S264, T265, 및 A267 (VP1 번호부여)에서의 변형 및 잔기 S268과 N269 사이의 단일 아미노산 잔기 삽입을 포함하거나, 이들로 필수적으로 구성되거나 또는 이들로 구성되고, 각 아미노산 잔기의 번호부여는 AAV1의 아미노산 서열(서열번호 1) 또는 AAV2 (서열번호 2), AAV3 (서열번호 3), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), AAV9 (서열번호 7) 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질을 제공한다. 일부 구체예에서, 상기 변형은 S262N, A263G, S264T, T265S, 및 A267S 중 하나 이상이다. 일부 구체예에서, AAV 캡시드는 아미노산 잔기 H272에서의 변형을 더 포함하거나, 이로 필수적으로 구성되거나, 또는 이로 구성될 수 있다. 일부 구체예에서, AAV 캡시드 단백질은아미노산 잔기 Q148, E152, S157, T162, H272, T326, D328, V330, T331, V341 및 S345에서의 변형, 및 잔기 E152과 P153 사이의 단일 아미노산 잔기 삽입을 더 포함하거나, 이들로 필수적으로 구성되거나, 또는 이들로 구성될 수 있다. 일부 구체예에서, AAV 캡시드 단백질은 아미노산 잔기 L188, S205, N223, A224, 및 H272에서의 변형을 더 포함한다. 일부 구체예에서, 변형은 L188I, S205A, N223S, A224S 및 H272T 중 하나 이상이다. 일부 구체예에서, 잔기 S268과 N269 사이의 아미노산 잔기 삽입은 단일 T 잔기의 삽입이다. 일부 구체예에서, 잔기 E152와 P153 사이의 아미노산 잔기 삽입은 단일 S 잔기의 삽입이다.
일부 구체예에서, 본 개시는 AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 원형 AAV1 캡시드 단백질 (서열번호 1)의 아미노산 위치 262 내지 265(VP1 번호부여)에 상당하는 아미노산에서 아미노산 서열: X1-X2-X3-X4 (서열번호 35)을 초래하는 변형을 포함하거나, 이들로 구성되거나 또는 이들로 필수적으로 구성되고, 상기 서열 중 X1은 S가 아닌 아미노산이고; X2는 A가 아닌 아미노산이며; X3은 S가 아닌 아미노산이고; 및 X4는 T가 아닌 아미노산인 것인 AAV 캡시드 단백질을 제공한다. 일부 구체예에서, 아미노산 X1은 N이고, 아미노산 X2는 G이며, 아미노산 X3은 T이거나, 또는 아미노산 X4는 S이다. 일부 구체예에서, 아미노산 X1은 N이고, 아미노산 X2는 G이며,, 아미노산 X3 은 T이고, 및 아미노산 X4는 S이다. 일부 구체예에서, AAV 캡시드 단백질은 아미노산 잔기 H272에서의 변형을 더 포함한다. 일부 구체예에서, 변형은 H272T이다. 일부 구체예에서, AAV 캡시드 단백질은 S268과 N269 사이의 아미노산 잔기 삽입을 더 포함한다. 일부 구체예에서, 아미노산 잔기 삽입은 단일 T 잔기의 삽입이다.
일부 구체예에서, 본 개시는 AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S262, A263, S264, T265, A267, 및 H272에서의 변형, 및 잔기 S268과 N269 사이에 단일 아미노산 잔기 삽입(VP1 번호부여)을 포함하거나, 이들로 필수적으로 구성되거나 또는 이들로 구성되고, 각 잔기의 번호부여는 AAV2 (서열번호 2)의 아미노산 서열, 또는 AAV1 (서열번호 1), AAV3 (서열번호 3), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), AAV9 (서열번호 7) 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질을 제공한다. 일부 구체예에서, 변형은 S262N, A263G, S264T, T265S, A267G, 및 H272T 중 하나 이상을 포함한다. 일부 구체예에서, 잔기 S268과 N269 사이의 자연적(natural) 단일 아미노산 잔기 삽입은 단일 T 잔기의 삽입이다.
일부 구체예에서, 본 개시는 AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S262, Q263, S264, A266, A267, 및 H271에서의 변형 및 잔기 S261과 S262 사이의 하나 이상의 아미노산 잔기의 삽입을 포함하거나, 이들로 필수적으로 구성되거나 또는 이들로 구성되고, 각 잔기의 번호는 AAV2 (서열번호 2)의 아미노산 서열, 또는 AAV1 (서열번호 1), AAV3 (서열번호 3), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), AAV9 (서열번호 7) 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질을 제공한다. 일부 구체예에서, 변형은 S262T, Q263S, S264G, A266S, S267T, 및 H271T 중 하나 이상을 포함한다. 일부 구체예에서, 잔기 S261과 S262 사이의 삽입은 단일 아미노산 잔기의 삽입이다. 일부 구체예에서, 잔기 S251과 S252 사이의 삽입은 2개 이상의 아미노산 잔기의 삽입이다. 일부 구체예에서, 잔기 S251과 S252 사이의 삽입은 N 및 G 잔기의 삽입이다.
일부 구체예에서, 본 개시는 AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S262, Q263, S264, A266, A267, 및 H271에서의 변형 및 잔기 S261과 S262 사이에 하나 이상의 아미노산 잔기 삽입을 포함하거나, 이들로 필수적으로 구성되거나 또는 이들로 구성되고, 각 잔기의 번호부여는 AAV3 (서열번호 3)의 아미노산 서열, 또는 AAV1 (서열번호 1), AAV2 (서열번호 2), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), AAV9 (서열번호 7) 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질을 제공한다. 일부 구체예에서, 변형은 S262T, Q263S, S264G, A266S, A267T, H271T 중 하나 이상을 포함한다. 일부 구체예에서, 잔기 SS61과 S262 사이의 삽입은 단일 아미노산 잔기, 또는 2개 이상의 아미노산 잔기의 삽입이다. 일부 구체예에서, 잔기 S251과 S252 사이의 삽입은 N 및 G 잔기의 삽입이다.
일부 구체예에서, 본 개시는 AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S263, S269, A237 (VP1 번호부여)에서의 변형을 포함하거나, 이들로 필수적으로 구성되거나 또는 이들로 구성되고, 각 잔기의 번호부여는 AAV9 (서열번호 9)의 아미노산 서열, 또는 AAV1 (서열번호 1), AAV2 (서열번호 2), AAV3 (서열번호 3), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질을 제공한다. 일부 구체예에서, 변형은 S263G, S269T, 및 A273T 중 하나 이상을 포함한다.
일부 구체예에서, 본 개시는 AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 서열번호 9 내지 서열번호 34 중 어느 하나의 서열을 포함하거나, 이로 필수적으로 구성되거나 또는 이로 구성된다.
AAV 혈청형 1, 2, 3, 6, 7, 8, 및 9, 각각에서 본 개시의 캡시드 단백질을 생성하기 위한 변형의 비한정적 예는 표 2에 표시되고, 각각의 AAV 혈청형 중 해당하는 아미노산이 확인된다.
추가적 구체에에서, 본 개시의 캡시드 단백질은: 서열번호 9 (AAV1RX)의 아미노산 서열; 서열번호 10 (AAV2RX)의 아미노산 서열; 서열번호 11 (AAV3RX)의 아미노산 서열; 서열번호 12 (AAV6RX)의 아미노산 서열; 서열번호 13 (AAV7RX)의 아미노산 서열; 서열번호 14 (AAV8RX)의 아미노산 서열; 서열번호 15 (AAV9RX)의 아미노산 서열; 서열번호 16 (AAV1R6)의 아미노산 서열; 서열번호 17 (AAV2R6)의 아미노산 서열; 서열번호 18 (AAV3R6)의 아미노산 서열; 서열번호 19 (AAV6R6)의 아미노산 서열; 서열번호 20 (AAV7R6)의 아미노산 서열; 서열번호 21 (AAV8R6)의 아미노산 서열; 서열번호 22 (AAV9R6)의 아미노산 서열; 서열번호 23 (AAV1R7)의 아미노산 서열; 서열번호 24 (AAV2R7)의 아미노산 서열; 서열번호 25 (AAV3R7)의 아미노산 서열; 서열번호 26 (AAV6R7)의 아미노산 서열; 서열번호 27 (AAV7R7)의 아미노산 서열; 서열번호 28 (AAV8R7); 및 서열번호 29 (AAV9R7)의 아미노산 서열을 포함하거나, 이들로 필수적으로 구성되거나, 또는 이들로 구성될 수 있다. 일 구체예에서, 본 개시의 캡시드 단백질은 서열번호 9 (AAV1RX)의 아미노산 서열을 갖는다. 일 구체예에서, 본 개시의 캡시드 단백질은 서열번호 16 (AAV1R6)의 아미노산 서열을 갖는다. 일 구체예에서, 본 개시의 캡시드 단백질은 서열번호 23 (AAV1R7)의 아미노산 서열을 갖는다.
일부 구체예에서, 본 개시는 서열번호 9 (AAV1RX)의 아미노산 서열; 서열번호 10 (AAV2RX)의 아미노산 서열; 서열번호 11 (AAV3RX)의 아미노산 서열; 서열번호 12 (AAV6RX)의 아미노산 서열; 서열번호 13 (AAV7RX)의 아미노산 서열; 서열번호 14 (AAV8RX); 서열번호 15 (AAV9RX)의 아미노산 서열에 대해, 모든 범위 및 그들 사이의 하부 범위를 포함하여, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 99% 이상의 서열 동일성(sequence identity)을 갖는 AAV 캡시드 단백질을 제공한다.
일부 구체예에서, 본 개시는 서열번호 16 (AAV1R6)의 아미노산 서열; 서열번호 17 (AAV2R6)의 아미노산 서열; 서열번호 18 (AAV3R6)의 아미노산 서열; 서열번호 19 (AAV6R6)의 아미노산 서열; 서열번호 20 (AAV7R6)의 아미노산 서열; 서열번호 21 (AAV8R6)의 아미노산 서열; 서열번호 22 (AAV9R6)의 아미노산 서열에 대해 모든 범위 및 그들 사이의 하부 범위를 포함하여, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 99% 이상의 서열 동일성을 갖는 AAV 캡시드 단백질을 제공한다.
일부 구체예에서, 본 개시는 서열번호 23 (AAV1R7)의 아미노산 서열; 서열번호 24 (AAV2R7)의 아미노산 서열; 서열번호 25 (AAV3R7)의 아미노산 서열; 서열번호 26 (AAV6R7)의 아미노산 서열; 서열번호 27 (AAV7R7)의 아미노산 서열; 서열번호 28 (AAV8R7); 및 서열번호 29 (AAV9R7)의 아미노산 서열에 대해 그들 사이의 모든 범위 및 하부 범위를 포함하여, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 99% 이상의 서열 동일성을 갖는 AAV 캡시드 단백질을 제공한다.
본 개시는 또한 AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 모든 위치, 또는 모든 위치보다는 적은 위치의 조합에서 하나 이상의 치환을 포함하여, 아미노산 서열: X1-X2-X3-X4 (서열번호 35)을 초래하는 것인 AAV 캡시드 단백질을 제공한다. 일부 구체예에서, 아미노산 서열: X1-X2-X3-X4의 변형은 원형 AAV1 캡시드 단백질(서열번호 1)의 아미노산 위치 262 내지 265(VP1 번호부여)에 상당하는 아미노산에 존재한다. 일부 구체예에서, X1은 S가 아닌 임의의 아미노산일 수 있다. 일부 구체예에서, X2는 A가 아닌 임의의 아미노산일 수 있다. 일부 구체예에서, X3은 S가 아닌 임의의 아미노산일 수 있다. 일부 구체예에서, X4는 T가 아닌 임의의 아미노산일 수 있다. 일 구체예에서, 아미노산 X1은 N이다. 일 구체예에서, 아미노산 X2는 G이다. 일 구체예에서, 아미노산 X3은 T이다. 일 구체예에서, 아미노산 X4는 S이다. 또 다른 구체예에서, X1은 N이고, X2는 G이며, X3은 T이고, 및 X4는 S이다. 일부 구체예에서, X1 내지 X4 중 하나는 치환되지 않고, 비치환 위치에서의 아미노산 잔기는 야생형 아미노산 잔기이다.
본 명세서에 기재된 개별적인 위치에서의 원형 아미노산을 치환할 수 있는 아미노산 잔기의 예가 표 3에 제시된다.
본 개시의 AAV 캡시드 단백질에 기재된 치환 및 삽입은 보존적(conservative) 아미노산에 의한 치환 및/또는 삽입을 포함할 수 있는 것으로 이해된다. 그러한 보존적 치환은 당해 기술 분야에서 잘 알려져 있고, 예를 들면, 임의의 조합으로, 비극성 아미노산 Gly, Ala, Val, Leu, Ile, Met, Phe, Trp 및 Pro은 상호 간에 치환될 수 있고; 극성 아미노산 Ser, Thr, Cys, Tyr, Asn 및 Gln이 상호 간에 치환될 수 있으며; 음으로 하전된 아미노산(negatively charged amino acid) Asp와 Glu는 상호 간에 치환될 수 있고; 양으로 하전된 아미노산 Lys, Arg 및 His이 상호 간에 치환될 수 있다.
본 개시는 또한 본 개시의 캡시드 단백질을 포함하는 AAV 캡시드 및 본 개시의 AAV 캡시드를 포함하는 바이러스 벡터를 제공한다. 일부 구체예에서, 바이러스 벡터는 본 개시의 AAV 캡시드; 및 하나 이상의 말단 반복 서열을 포함하는 핵산 분자를 포함할 수 있거나, 이들로 필수적으로 구성될 수 있거나, 또는 이들로 구성될 수 있고, 상기 핵산은 상기 AAV 캡시드에 의해 둘러싸인다. 일부 구체예에서, 말단 반복은 AAV 말단 반복이다. 일부 구체예에서, 말단 반복은 비-AAV 말단 반복이다.
또한, 약제학적으로 허용가능한 담체 중 본 개시의 캡시드 단백질 및/또는 바이러스 벡터를 포함하는 조성물이 제공된다.
본 개시에서 또한 핵산 분자를 세포 내로 도입하는 방법으로서, 상기 세포를, 본 개시의 바이러스 벡터 및/또는 조성물과 접촉시키는 단계, 예를 들면, 바이러스 벡터가 상기 세포 내로 취해지거나 또는 상기 세포에 의해 내재화되고, 바이러스 벡터를 통해 도입된 핵산 분자가 상기 세포에서 발현되는 것인 조건 하에 접촉시키는 단계를 포함하는 방법을 포함한, 여러 방법이 제공된다.
또한, 개체에게 본 개시의 바이러스 벡터 및/또는 조성물을 투여하는 단계를 포함하는, 개체에게 핵산 분자를 전달하는 방법이 제공된다. 특정 구체예에서, 바이러스 벡터 및/또는 조성물이 개체의 중추 신경계에 투여된다. 특정 구체예에서, 바이러스 벡터 및/또는 조성물이 혈뇌 장벽을 통과하여 전달된다.
일부 구체예에서, 본 개시의 바이러스 벡터는 목적 핵산 분자를 포함할 수 있다. 일부 구체예에서, 목적 핵산 분자는 치료 단백질 또는 치료 RNA 분자를 코딩한다.
본 개시는 또한 신경 세포를 본 개시의 바이러스 벡터와 접촉시키는 단계를 포함하는, 목적 핵산 분자를 신경 세포에 선택적으로 전달하는 방법으로서, 상기 바이러스 벡터가 목적 핵산 분자를 포함하는 것인 방법을 제공한다. 추가적 구체예에서, 상기 방법은, 예를 들면, 상기 방법이 개체(예를 들면, 인간 개체)에서 수행될 때, 목적 핵산 분자를 심근세포에 선택적으로 전달하는 단계를 추가로 포함할 수 있다. 일부 구체예에서, 조성물은 선택적으로 신경 세포에 전달된다. 일부 구체예에서, 조성물은 선택적으로 심근 세포에 전달된다.
추가적 구체예에서, 본 개시는 개체에게 본 개시의 바이러스 벡터를 투여하는 단계를 포함하는, 개체에서 신경 질환 또는 결함(neurological disorder or defect)을 치료하는 방법으로서, 상기 바이러스 벡터는 상기 신경 질환 또는 결함의 치료에 효과적인 치료 단백질 또는 치료 RNA를 코딩하는 핵산 분자를 포함하는 것인 방법을 제공한다.
추가적으로, 개체에게 본 개시의 바이러스 벡터를 투여하는 단계를 포함하는, 개체에서 신경 및 심혈관 질환(neurological and cardiovascular disorder)을 치료하는 방법으로서, 상기 바이러스 벡터는 상기 신경 및 심혈관 질환의 치료에 효과적인 치료 단백질 또는 치료 RNA를 코딩하는 핵산 분자를 포함하는 것인 방법이 본 명세서에서 제공된다.
본 명세서에 기재된 방법에서, 본 개시의 바이러스 벡터 및/또는 조성물은 전신 경로(systemic route)를 통해(예를 들면, 정맥내로, 동맥내로, 복막내로 등) 본 개시의 개체에게 투여/전달될 수 있다. 일부 구체예에서, 바이러스 벡터 및/또는 조성물은 뇌실내(intracerebroventrical), 수조내(intracisternal), 뇌실질내(intraparenchymal), 두개내(intracranial), 및/또는 척수내(intrathecal) 경로를 통해 개체에게 투여될 수 있다.
일부 구체예에서, 상기 바이러스 벡터 및/또는 조성물의 개체로의 전신 투여는 오프-타겟 조직(off-target tissue)(예를 들면, 중추 신경계 이외의 조직)에서 더 낮은 형질도입을 초래한다. 본 개시의 일부 구체예에서, 바이러스 벡터는 비장, 간, 및/또는 신장으로부터 탈표적화된다. 일부 구체예에서, 바이러스 벡터는 비장세포, 간세포, 및/또는 신장 세포로부터 탈표적화된다. 일부 구체예에서, 바이러스 벡터는 AAVrh.10에 의한 형질도입 대비 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 감소된 수준에서 간, 비장, 및/또는 신장에 형질도입시키고, 바이러스 형질도입은 선택적으로 루시페라아제 또는 GFP 발현에 의해 결정된다. 바람직하게는, 상기 바이러스 벡터는 AAVrh.10에 의한 형질도입 대비 적어도 50%-100%, 또는 80-90% 감소된 수준에서 간, 비장, 및/또는 신장에 형질도입시키고, 바이러스 형질도입은 선택적으로 루시페라아제 또는 GFP 발현에 의해 결정된다.
일부 구체예에서, 바이러스 벡터는 AAV1에 의한 형질도입 대비 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 증가된 수준에서 뇌에 형질도입시키고, 바이러스 형질도입은 선택적으로 루시페라아제 또는 GFP 발현에 의해 결정된다. 바람직하게는, 바이러스 벡터는 AAV1에 의한 형질도입 대비 적어도 2-배, 2.5-배, 3-배, 4-배, 4.5-배, 5-배, 5.5-배, 6-배, 6.5-배, 7-배, 7.5-배, 8-배, 8.5-배, 9-배, 9.5-배, 또는 10-배 증가된 수준에서 뇌에 형질도입시키고, 바이러스 형질도입은 선택적으로 루시페라아제 또는 GFP 발현에 의해 결정된다. 일부 구체예에서, 바이러스 벡터는 뉴런을 선택적으로 형질도입시킨다.
본 개시는 본 개시의 변형된 캡시드 단백질이 현재 공지되거나 또는 이후에 발견된 AAV의 캡시드 단백질을 변형시키는 것에 의해 생성될 수 있다는 것을 고려한다. 또한, 변형될 AAV 캡시드 단백질은 천연 AAV 캡시드 단백질(예를 들면, AAV2, AAV3a 또는 3b, AAV6, AAV7, AAV8, AAV9, AAVrh.10 또는 표 1에 표시된 AAV 혈청형 중 하나)일 수 있으나, 그에 한정되지 않는다. 당업자는 AAV 캡시드 단백질에 대한 다양한 조작(manipulation)이 당해 기술 분야에서 알려져 있고, 본 개시는 천연 AAV 캡시드 단백질의 변형에 한정되지 않는다는 것을 이해할 것이다. 예를 들면, 변형될 AAV 캡시드 단백질은 천연 AAV 대비 이미 변형을 가질 수 있다(예를 들면, 천연 AAV 캡시드 단백질, 예를 들면, AAV2, AAV3a, AAV3b, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및/또는 AAV12 또는 현재 공지되거나 또는 이후에 발견된 기타 AAV로부터 유래된다). 그러한 AAV 캡시드 단백질도 본 개시의 범위 내에 속한다.
따라서, 특정 구체예에서, 변형될 AAV 캡시드 단백질은 천연 AAV로부터 유래될 수 있으나, 상기 캡시드 단백질에 삽입 및/또는 치환되고 및/또는 하나 이상의 아미노산의 결실에 의해 변형된 하나 이상의 외래 서열(예를 들면, 원형 바이러스(native virus)에 대한 외생(exogenous) 서열)을 더 포함할 수 있다.
따라서, 본 명세서에서 특정 AAV 캡시드 단백질(예를 들면, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 AAV12 캡시드 단백질 또는 표 1에 표시된 AAV 혈정형 중 하나의 캡시드 단백질, 등)을 언급할 때, 원형 캡시드 단백질 및 본 개시의 변형과 다른 변경(alteration)을 갖는 캡시드 단백질을 포괄하는 것으로 의도된다. 그러한 변경은 치환, 삽입 및/또는 결실을 포함한다. 특정 구체예에서, 캡시드 단백질은 원형 AAV 캡시드 단백질 서열 대비 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개, 20개 미만, 30개 미만, 40개 미만, 50개 미만, 60개 미만, 또는 70개 미만의 아미노산 삽입(본 개시의 삽입 이외의 삽입)을 포함할 수 있다. 본 개시의 구체예에서, 캡시드 단백질은 원형 AAV 캡시드 단백질 서열 대비 (본 발명에 따른 아미노산 치환 이외의) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개, 20개 미만, 30개 미만, 40개 미만, 50개 미만, 60개 미만, 또는 70개 미만의 아미노산 치환을 포함할 수 있다. 구체예에서, 캡시드 단백질은 원형 AAV 캡시드 단백질 서열 대비 (본 발명에 따른 아미노산 결실 이외의) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개, 20개 미만, 30개 미만, 40개 미만, 50개 미만, 60개 미만, 또는 70개 미만의 아미노산 결실을 포함할 수 있다.
특정 구체예에서, AAV 캡시드 단백질은 원형 AAV 캡시드 단백질 서열을 갖거나 또는 원형 AAV 캡시드 단백질 서열과 적어도 약 90%, 95%, 97%, 98% 또는 99% 유사하거나 동일한 아미노산 서열을 갖는다. 예를 들면, 특정 구체예에서, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, 등 캡시드 단백질은 원형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12 캡시드 단백질 서열, 및 원형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12 캡시드 단백질 서열에 적어도 약 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 유사하거나 동일한 서열을 포괄(encompass)한다.
2개 이상의 아미노산 서열 간에 서열 유사성(similarity) 또는 동일성(identity)을 결정하는 방법이 당해 기술 분야에서 알려져 있다. 서열 유사성 또는 동일성은 Smith and Waterman, Adv . Appl . Math. 2, 482 (1981)의 국소 서열 동일성 알고리즘(local sequence identity algorithm), Needleman and Wunsch J. Mol. Biol . 48,443 (1970)의 서열 동일성 정렬 알고리즘(sequence identity alignment algorithm), Pearson and Lipman, Proc . Natl . Acad . Sci . USA 85,2444 (1988)의 유사성 검색 방법(search for similarity method), 이러한 알고리즘의 전산화 구현(computerized implementation)(Wisconsin Genetics Software Package 중 GAP, BESTFIT, FASTA, 및 TFASTA, Genetics Computer Group, 575 Science Drive, Madison, WI), Devereux et al. Nucl . Acid Res. 12, 387-395 (1984)에 의해 기술된 Best Fit 서열 프로그램, 또는 검사(inspection)를 포함하나, 이에 한정되지 않는 당해 기술 분야에서 공지된 표준 기법을 이용하여 결정될 수 있다.
또 다른 적합한 알고리즘은 Altschul et al. J. Mol . Biol. 215, 403-410, (1990) 및 Karlin et al. Proc . Natl . Acad . Sci . USA 90, 5873-5787 (1993)에 기재된 BLAST 알고리즘이다. 특히 유용한 BLAST 프로그램은 Altschul et al. Methods in Enzymology, 266, 460-480 (1996); http://blast.wustl/edu/blast/README.html로부터 수득된 WU-BLAST-2 프로그램이다. WU-BLAST-2는 선택적으로 디폴트 값(default values)으로 설정되는, 여러 검색 파라미터를 이용한다.
또한, 추가적인 유용한 알고리즘은 Altschul et al., (1997) Nucleic Acids Res. 25, 3389-3402에 의해 보고된, gapped BLAST이다.
변형된 바이러스 캡시드는 예를 들면, 미국특허 제5,863,541호에 기재된 바와 같이, "캡시드 비히클(capsid vehicle)"로 이용될 수 있다. 변형된 바이러스 캡시드에 의해 패키징되고 세포 내로 전달될 수 있는 분자는 이종기원 DNA, RNA, 폴리펩티드, 소형 유기 분자(small organic molecule), 금속, 또는 이들의 조합을 포함한다.
이종기원(heterologous) 분자는 AAV 감염에서 자연적으로 발견되지 않는 것들, 예를 들면, 야생형 AAV 게놈에 의해 코딩되지 않은 것들로 정의된다. 또한, 치료적으로 유용한 분자(therapeutically useful molecule)는 숙주 표적 세포로의 분자의 전달을 위해 키메라 바이러스 캡시드의 외부(outside)와 회합될(associated) 수 있다. 그러한 회합된 분자들은 DNA, RNA, 소형 유기 분자, 금속, 탄수화물, 지질 및/또는 폴리펩티드를 포함할 수 있다. 본 개시의 일 구체예에서, 치료적으로 유용한 분자는 캡시드 단백질에 공유결합에 의해 결합된다(즉, 접합되거나(conjugated) 또는 화학적으로 결합된다(chemically coupled)). 공유결합에 의해 분자를 결합하는 방법은 당해 기술 분야에서 통상의 기술자에 의해 알려져 있다.
본 개시의 변형된 바이러스 캡시드는 예를 들면, PCT 출원 PCT/2016/054143에 기재된 바와 같이, 포유동물 혈청에서 중화 항체(neutralizing antibody)를 피하기 위한 항원성의 추가적인 변형을 위한 주형으로서 용도를 갖는다.
본 개시의 변형된 바이러스 캡시드는 또한 신규한 캡시드 구조에 대한 항체의 생성에서 용도를 갖는다. 추가적인 대안으로, 외생 아미노산 서열이 세포에 대한 항원 제시를 위해, 예를 들면, 외생 아미노산 서열에 대한 면역 반응을 생성하기 위해 개체로의 투여를 위해 변형된 바이러스 캡시드에 삽입될 수 있다.
다른 구체예에서, 바이러스 캡시드는 목적 폴리펩티드, 펩티드 및/또는 기능성 RNA를 코딩하는 핵산 분자를 전달하는 바이러스 벡터의 투여 전 및/또는 그와 동시에 (상호 간에 수분 또는 수 시간 내에) 특정 세포 부위를 차단(block)하기 위해 투여될 수 있다. 예를 들면, 본 발명의 캡시드는 특정 세포 상의 세포 수용체를 차단하기 위해 전달될 수 있고, 전달 벡터는 후속으로 또는 동시에 투여될 수 있으며, 이는 차단된 세포의 형질도입을 감소시키고, 다른 표적의 형질감염을 강화시킬 수 있다.
대표적 구체예에 따르면, 변형된 바이러스 캡시드는 본 개시에 따른 변형된 바이러스 벡터 전에 및/또는 그와 동시에 개체에 투여될 수 있다. 또한, 본 개시는 본 발명의 변형된 바이러스 캡시드를 포함하는 조성물 및 약제학적 제형을 제공하고; 선택적으로, 조성물은 또한 본 개시의 변형된 바이러스 벡터를 포함한다.
본 개시는 또한 본 개시의 변형된 바이러스 캡시드 및 캡시드 단백질을 코딩하는 핵산 분자(선택적으로, 단리된 핵산 분자)를 제공한다. 또한, 본 개시의 핵산 분자를 포함하는 벡터 및 본 개시의 핵산 분자 및/또는 벡터를 포함하는 세포(인 비보 또는 배양물)가 제공된다. 적합한 벡터는 한정 없이, 바이러스 벡터(예를 들면, 아데노바이러스, AAV, 헤르페스바이러스, 알파바이러스, 백시니아(vaccinia), 폭스바이러스(poxviruses), 바큘로바이러스, 등), 플라스미드, 파아지, YAC, BAC, 등을 포함한다. 그러한 핵산 분자, 벡터 및 세포는 예를 들면, 본 명세서에 기재된 바와 같은 변형된 바이러스 캡시드 또는 바이러스 벡터의 제조를 위하 시약(예를 들면, 헬퍼 패키징 구조체(helper packaging constructs) 또는 패키징 세포)으로서 사용될 수 있다.
본 개시에 따른 바이러스 캡시드는 당해 기술 분야에서 공지된 방법을 이용하여, 예를 들면, 바큘로바이러스로부터의 발현에 의해(Brown et al. (1994) Virology 198:477-488) 제조될 수 있다.
본 개시에 따른 AAV 캡시드 단백질에 대한 변형은 "선택적(selective)" 변형이다. 이 방식은 AAV 혈청형 간 전체 서브유닛 또는 큰 도메인 스왑에 의한 이전의 연구와 대조된다(예를 들면, 국제특허출원 공개 WO 00/28004; Hauck et al. (2003) J. Virology 77:2768-2774; Shen et al. (2007) Mol Ther . 15(11):1955-62; 및 Mays et al. (2013) J Virol . 87(17):9473-85 참조). 본 발명자들이 아는 바에 따르면, 본 개시의 AAV 캡시드 단백질은 혈뇌 장벽의 통과(crossing)를 가능하게 하는 특정한 아미노산 변화의 최초 예이다.
일부 구체예에서, AAV 캡시드 단백질은 혈뇌 장벽을 통과할 수 있게 하는 특정한 아미노산 변화를 포함한다. 일부 구체예에서, AAV 캡시드 단백질은 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 또는 22개 아미노산의 치환을 포함하고, 치환된 아미노산은 AAVrh.10으로부터 유래되고, 상기 아미노산 치환은 혈뇌 장벽의 통과를 가능하게 한다. 일부 구체예에서, AAV 캡시드 단백질은 AAV1 캡시드 단백질로부터 유래되고, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 또는 22개 아미노산의 치환을 포함하고, 치환된 아미노산은 AAVrh.10으로부터 유래되고, 상기 아미노산 치환은 혈뇌 장벽의 통과를 가능하게 한다. 일부 구체예에서, 혈뇌 장벽의 통과를 가능하게 하는 특정한 아미노산은 262N, 263G, 264T, 265S, 267G, 268S, 269T 및 273T (VP1 번호부여)이고, 각 잔기의 번호부여는 서열번호 9 또는 서열번호 30의 아미노산 서열에 근거한다.
일부 구체예에서, AAV 캡시드 단백질은 간, 신장, 및/또는 비장으로부터 탈표적화될(detargeting) 수 있게 하는 특정 아미노산 변화를 포함한다. 일부 구체예에서, AAV 캡시드 단백질은 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 또는 22개의 아미노산의 치환을 포함하고, 치환된 아미노산은 AAVrh.10으로부터 유래되고, 상기 아미노산 치환은 간, 신장, 및/또는 비장으로부터의 탈표적화를 가능하게 한다. 일부 구체예에서, AAV 캡시드 단백질은 AAV1 캡시드 단백질로부터 유래되고, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 또는 22개의 아미노산의 치환을 포함하고, 치환된 아미노산은 AAVrh.10으로부터 유래되고, 상기 아미노산 치환은 간, 신장, 및/또는 비장으로부터의 탈표적화를 가능하게 한다.
일부 구체예에서, 치환된 아미노산은 캡시드의 VR-I 영역에 위치한다. 일부 구체예에서, 치환된 아미노산은 캡시드의 표면에 위치한다. 일부 구체예에서, 치환된 아미노산은 캡시드의 3-겹 대칭축(3-fold axis of symmetry)에 있는 돌출부(protrusion)의 기부에 위치한다. 일부 구체예에서, 치환된 아미노산은 캡시드의 2-겹 대칭축에 있는 함몰부(depression)에 위치한다. 일부 구체예에서, 치환된 아미노산은 캡시드 단백질의 VR-II 영역 내에, DE-루프(loop) 내에 위치한다. 일부 구체예에서, 치환된 아미노산은 캡시드의 베타-가닥 E 내에 위치한다.
특정 구체예에서, "선택적" 변형은 약 20개, 18개, 15개, 12개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개 또는 2개 미만의 연속된 아미노산의 삽입 및/또는 치환 및/또는 결실을 초래한다.
본 개시의 변형된 캡시드 단백질 및 캡시드는 현재 공지되거나 또는 이후에 확인되는, 다른 변형을 더 포함할 수 있다.
예를 들면, 본 개시의 AAV 캡시드 단백질 및 바이러스 캡시드는 그들이 또 다른 바이러스, 선택적으로 또 다른 파보 바이러스 또는 다른 AAV 혈청형, 예를 들면, 국제특허출원 공개 WO 00/28004에 기재된 바와 같은 바이러스의 캡시드 서브 유닛 전체 또는 일부를 포함할 수 있다는 점에서 키메라(chimeric)일 수 있다.
바이러스 캡시드는 원하는 표적 조직 상에 있는 세포-표적 분자와 상호작용하도록 바이러스 캡시드를 유도하는 표적화 서열(targeting sequence)(예를 들면, 바이러스 캡시드에 치환 및/또는 삽입된 서열)을 포함할 수 있다(예를 들면, 국제특허출원 공개 WO 00/28004 및 Hauck et al. (2003) J. Virology 77:2768-2774); Shi et al. Human Gene Therapy 17:353-361 (2006) [AAV 캡시드 서브유닛의 위치 520 및/또는 584에서 인테그린 수용체 결합 모티프 RGD의 삽입을 기술함]; 미국특허 제7,314,912호 [AAV2 캡시드 서브유닛의 아미노산 위치 447, 534, 573 및 587 다음에 RGD 모티프를 함유한 P1 펩티드의 삽입을 기술함] 및 국제특허출원 공개 WO 2015038958 [CNS 형질감염의 증가를 보이는 펩티드 서열을 함유하는 AAV 벡터의 선택적 복구를 기술함] 참조). 삽입을 허용하는(tolerate) AAV 캡시드 서브유닛 내의 다른 위치들이 당해 기술 분야에서 알려져 있다(예를 들면, Grifman et al. Molecular Therapy 3:964-975 (2001)에 의해 기재된 위치 449 및 558).
예를 들면, 본 개시의 바이러스 캡시드의 일부는 대부분의 목적 표적 조직(예를 들면, 간, 골격근, 심장, 횡격막근, 신장, 뇌, 위, 장, 피부, 내피 세포 및/또는 폐)에 대해 상대적으로 불충분한 친화성을 갖는다. 표적화 서열(targeting sequence)이 이러한 저-형질도입 벡터(low-transduction vector)에 유리하게 내포되어, 그에 의해 바이러스 캡시드에 원하는 친화성, 및 선택적으로, 특정 조직에 대한 선택적 친화성(selective tropism)을 제공할 수 있다. 표적화 서열을 포함하는, AAV 캡시드 단백질, 캡시드, 및 벡터가 예를 들면, 국제특허 공개 WO 00/28004에 기재된다. 또 다른 가능성으로서, Wang et al. (Annu Rev Biophys Biomol Struct . 35:225-49 (2006))에 의해 기재된 바와 같은 하나 이상의 비-천연 아미노산이 저-형질감염 벡터를 원하는 표적 조직으로 다시 향하게 하기 위한 수단으로서 직교 부위(orthogonal site)에서 AAV 캡시드 서브유닛 내로 내포될 수 있다. 이러한 비천연 아미노산이 하기와 같은, 그러나 이에 한정되지 않는 목적 분자를 AAV 캡시드 단백질에 화학적으로 결합시키기 위해 유리하게 이용될 수 있다: 글리칸(glycan) (만노- 수지상 세포 표적화); 특정 암세포 타입으로의 표적화된 전달을 위한 RGD, 봄베신(bombesin) 또는 뉴로펩티드(neuropeptide); 성장 인자 수용체, 인테그린 등과 같은 특이적 세포 표면 수용체에 표적화된 파아지 디스플레이(phage display)로부터 선택된 펩티드 또는 RNA 앱타머. 아미노산을 화학적으로 변형하는 방법이 당해 기술 분야에서 알려져 있다(예를 들면, Greg T. Hermanson, Bioconjugate Techniques, 1st edition, Academic Press, 1996 참조).
대표적 구체예에서, 표적화 서열은 감염을 특정한 세포 타입으로 지시하는 바이러스 캡시드 서열(예를 들면, 자가복제(autonomous) 파보바이러스 캡시드 서열, AAV 캡시드 서열, 또는 기타 바이러스 캡시드 서열)일 수 있다.
또 다른 비한정적 예로서, 결과적으로 수득되는 돌연변이체에 헤파린 결합을 부여하기 위해 헤파린 결합 도메인(예를 들면, RSV(respiratory syncytial virus) 헤파린 결합 도메인)이 일반적으로 헤파란 술페이트(HS) 수용체에 결합하지 않는 캡시드 서브유닛(예를 들면, AAV4, AAV5) 내로 삽입되거나 치환될 수 있다.
또다른 비한정적 예로서, 갈락토오스, 시알산, 만노오스, 락토오스, 술포-N-락토사민, 갈락토사민, 글루코오스, 글루코사민, 프럭토오스, 푸코오스, 강글리오사이드(ganglioside), 키토트리오스(chitotriose), 콘드로이틴 술페이트, 케라틴 술페이트, 더마탄 술페이트(dermatan sulfate)와 같은 글리칸으로의 결합을 가능하게 할 수 있는 아미노산 족문(amino acid footprint)이 앞서 열거된 당 중 하나 또는 그 이상을 결합하지 않는 캡시드 서브유닛 상에 접합(graft)될 수 있다[예를 들면, US 특허출원 공개 US20160017005, Methods and compositions for dual glycan binding AAV vectors 참조].
B19는 글로보시드(globoside)를 그의 수용체로 이용하여 일차 적혈구 전구 세포(primary erythroid progenitor cell)를 감염시킨다(Brown et al. (1993) Science 262:114). B19의 구조가 8 Å 해상도(resolution)로 결정되었다(Agbandje-McKenna et al. (1994) Virology 203:106). 글로보시드에 결합하는 B19 캡시드의 영역은 β-배럴 구조 E와 F 사이의 루프 영역(looped out region)인(Chipman et al. (1996) Proc. Nat. Acad. Sci. USA 93:7502) 아미노산 399-406 (Chapman et al. (1993) Virology 194:419)에 맵핑되었다. 따라서, B19 캡시드의 글로보시드 수용체 결합 도메인은 이를 포함하는 바이러스 캡시드 또는 바이러스 벡터를 적혈구 세포로 표적화시키기 위해 AAV 캡시드 단백질 내로 치환될 수 있다.
대표적 구체예에서, 외생 표적화 서열(exogenous targeting sequence)은 변형된 AAV 캡시드 단백질을 포함하는 바이러스 캡시드 또는 바이러스 벡터의 친화성을 변경하는 펩티드를 코딩하는 아미노산 서열일 수 있다. 특정 구체예에서, 표적화 펩티드 또는 단백질은 천연적이거나, 또는 대안적으로, 완전히 또는 부분적으로 합성일 수 있다. 예시적인 표적화 서열은 세포 표면 수용체 및 당단백질(glycoprotein)에 결합하는 리간드 및 기타 펩티드, 예를 들면, RGD 펩티드 서열, 브래디키닌(bradykinin), 호르몬, 펩티드 성장 인자(예를 들면, 표피 성장 인자(epidermal growth factor), 신경 성장 인자, 섬유모세포 성장 인자, 혈소판-유래 성장 인자(platelet-derived growth factor), 인슐린-유사 성장 인자(insulin-like growth factor) I 및 II, 등), 사이토카인, 멜라닌 세포 자극 호르몬(melanocyte stimulating hormone)(예를 들면, α, β 또는 γ), 뉴로펩티드 및 엔도르핀(endorphin), 등, 및 세포를 그들의 동족 수용체(cognate receptor)로 표적화시키는 능력을 보유하는 그의 단편을 포함한다. 기타 예시적 펩티드 및 단백질은 물질 P(substance P), 각질세포 성장 인자(keratinocyte growth factor), 뉴로펩티드 Y, 가스트린 분비 펩티드(gastrin releasing peptide), 인터루킨 2, HEWL(hen egg white lysozyme), 에리트로포이에틴(erythropoietin), 고나돌리베린(gonadoliberin), 코르티코스타틴, β-엔도르핀, 류-엔케팔린(leu-enkephalin), 리모르핀(rimorphin), α-네오-엔케팔린(a-neo-enkephalin), 안지오텐신, 뉴마딘(pneumadin), VIP(vasoactive intestinal peptide), 뉴로텐신(neurotensin), 모틸린(motilin), 및 전술된 건들의 단편을 포함한다. 또 다른 대안으로서, 독소(예를 들면, 테타누스 독소 또는 뱀 독소, 예를 들면, α-분가로톡신(bungarotoxin), 등)로부터의 결합 도메인이 표적화 서열로서 캡시드 단백질에 치환될 수 있다. 또 다른 대표적 구체예에서, AAV 캡시드 단백질은 Cleves (Current Biology 7:R318 (1997))에 의해 기재된 바와 같은 "비고전적(nonclassical)" 입/출 신호 펩티드(import/export signal peptide) (예를 들면, 섬유모세포 성장 인자-1 및 -2, 인터루킨 1, HIV-1 Tat 단백질, 헤르페스 바이러스 VP22 단백질 등)의 AAV 캡시드 단백질로의 치환에 의해 변형될 수 있다. 또한, 특정 세포에 의한 흡수(uptake)를 지시하는 펩티드 모티프가 또한 포함되고, 예를 들면, FVFLP 펩티드 모티프는 간 세포에 의한 흡수를 유발한다.
파아지 디스플레이 기법, 및 당해 기술 분야에서 공지된 기타 기법이 목적 세포 타입을 인식하는 펩티드를 확인하기 위해 이용될 수 있다.
표적화 서열은 수용체를 포함한, 세포 표면 결합 부위(예를 들면, 단백질, 탄수화물, 당단백질, 또는 프로테오글리칸)를 표적화하는 펩티드를 코딩할 수 있다. 세포 표면 결합 부위의 예는 헤파란 술페이트, 콘드로이틴 술페이트, 및 기타 글리코사미노글리칸, 시알산 모이어티(sialic acid moieties), 폴리시알산 모이어티, 당단백질, 및 강글리오시드, MHC I 당단백질, 만노오스, N-아세틸-갈락토사민, N-아세틸-글루코사민, 푸코오스, 갈락토오스 등을 포함한, 막 당단백질에서 발견되는 탄수화물 성분을 포함하나, 이에 한정되지 않는다.
또 다른 대안으로서, 표적화 서열은 세포로의 진입을 표적화하는 또 다른 분자로의 화학적 결합(chemical coupling)을 위해 이용될 수 있는(예를 들면, 그들의 R 기를 통해 화학적으로 결합될 수 있는 아르기닌 및/또는 라이신 잔기를 포함할 수 있는) 펩티드일 수 있다.
전술된 변형은 상호 간에 조합으로 및/또는 현재 공지되거나 또는 이후에 발견된 다른 변형과 함께 본 개시의 캡시드 단백질 또는 캡시드 내로 내포될 수 있다.
본 개시는 본 개시의 변형된 캡시드 단백질 및 캡시드를 포함하는 바이러스 벡터를 포괄한다. 특정 구체예에서, 바이러스 벡터는 파보바이러스 벡터(예를 들면, 파보바이러스 캡시드 및/또는 벡터 게놈을 포함하는 파보바이러스 벡터), 예를 들면, AAV 벡터(예를 들면, AAV 캡시드 및/또는 벡터 게놈을 포함하는 AAV 벡터)이다. 대표적 구체예에서, 바이러스 벡터는 본 개시의 변형된 캡시드 서브유닛을 포함하는 변형된 AAV 캡시드 및 벡터 게놈을 포함한다.
예를 들면, 대표적 구체예에서, 바이러스 벡터는: (a) 본 개시의 변형된 캡시드 단백질을 포함하는 변형된 바이러스 캡시드(예를 들면, 변형된 AAV 캡시드); 및 (b) 말단 반복 서열(예를 들면, AAV TR)을 포함하는 핵산을 포함하고, 상기 말단 반복 서열을 포함하는 핵산은 상기 변형된 바이러스 캡시드에 의해 둘러싸인다(encapsidate). 핵산은 선택적으로 2개의 말단 반복(예를 들면, 2개의 AAV TR)을 포함할 수 있다.
대표적 구체예에서, 바이러스 벡터는 목적 단백질 또는 기능성 RNA를 코딩하는 이종기원 핵산 분자를 포함하는 재조합 바이러스 벡터이다. 재조합 바이러스 벡터는 하기에서 보다 상세하게 설명된다.
본 개시의 변형된 캡시드 단백질, 바이러스 캡시드, 및 바이러스 벡터는 그들의 원형 상태에서 특정된 위치에 표시된 아미노산을 갖는 캡시드 단백질, 캡시드 및 바이러스 벡터(즉, 돌연변이가 아닌 것)를 배제하는 것으로 당업자에 의해 이해될 것이다.
바이러스 벡터의 생산 방법
본 개시는 본 발명의 바이러스 벡터를 생산하는 방법을 더 제공한다. 하나의 대표적 구체예에서, 본 개시는 바이러스 벡터를 생산하는 방법을 제공하고, 상기 방법은 (a) 하나 이상의 TR 서열(예를 들면, AAV TR 서열)을 포함하는 핵산 주형, 및 (b) 상기 핵산 주형의 복제 및 AAV 캡시드로의 캡시드화(encapsidation)를 위해 충분한 AAV 서열(예를 들면, AAV rep 서열 및 본 개시의 AAV 캡시드를 코딩하는 AAV cap 서열)을 세포에 제공하는 단계를 포함한다. 선택적으로, 핵산 주형은 하나 이상의 이종기원 핵산 서열을 더 포함한다. 특정 구체예에서, 핵산 주형은 (존재하는 경우) 이종기원 핵산 서열의 5' 및 3'에 위치하나, 직접적으로 인접할(contiguous) 필요는 없는, 2개의 AAV ITR 서열을 포함한다.
AAV 캡시드 내에 패키징된 핵산 주형을 포함하는 바이러스 벡터가 세포 내에서 생성되는 조건 하에 AAV 핵산 주형 및 AAV rep 및 cap 서열이 제공된다. 전술된 방법은 상기 세포로부터 바이러스 벡터를 회수하는 단계를 더 포함할 수 있다. 바이러스 벡터는 배지로부터 및/또는 세포의 용해에 의해 회수될 수 있다.
세포는 AAV 바이러스 복제를 허용하는 세포일 수 있다. 당해 분야에서 공지된 적합한 세포가 채택될 수 있다. 특정한 구체예에서, 세포는 포유동물 세포이다. 또 다른 옵션으로서, 세포는 복제-결함(replication-defective) 헬퍼 바이러스로부터 결실된 기능을 제공하는 트랜스-보완 패키징 세포주(trans-complementing packaging cell line), 예를 들면, 293 세포 또는 기타 E1a 트랜스-보완 세포일 수 있다.
AAV 복제 및 캡시드 서열은 당해 분야에서 공지된 방법에 의해 제공될 수 있다. 현재의 프로토콜은 통상적으로 단일 플라스미드에서 AAV rep/cap 유전자를 발현시킨다. AAV 복제 및 패키징 서열이 함께 제공되는 것이 편리할 수 있으나, 함께 제공되지 않아도 된다. AAV rep 및/또는 cap 서열이 바이러스 벡터 또는 비-바이러스 벡터(non-viral vector)에 의해 제공될 수 있다. 예를 들면, rep/cap 서열이 하이브리드 아데노바이러스 또는 헤르페스바이러스 벡터(예를 들면, 결실된 아데노바이러스의 E1a 또는 E3 영역 내로 삽입됨)에 의해 제공될 수 있다. EBV 벡터는 또한 AAV cap 및 rep 유전자를 발현시키기 위해 채택될 수 있다. 이 방법의 하나의 장점은 EBV 벡터가 에피좀이고, 연속적인 세포 분열 동안 높은 카피수를 유지할 것(즉, "EBV 기반 핵 에피좀(EBV base nuclear episome)"으로 지칭되는 염색체-외 요소(extra-chromosomal element)로서 세포 내로 안정적으로 삽입됨, Margolski, (1992) Curr. Top. Microbiol. Immun. 158:67 참조)이라는 것이다.
추가적인 대안으로서, rep/cap 서열이 세포 내로 안정적으로 통합될 수 있다.
통상적으로, AAV rep/cap 서열은 이 서열들의 구제(rescue) 및/또는 패키징을 방지하기 위해, TR에 의해 플랭킹되지(flank) 않을 것이다.
핵산 주형은 당해 분야에서 공지된 방법을 이용하여 세포에 제공될 수 있다. 예를 들면, 주형은 비-바이러스 벡터(예를 들면, 플라스미드) 또는 바이러스 벡터에 의해 공급될 수 있다. 특정한 구체예에서, 핵산 주형은 헤르페스바이러스 또는 아데노바이러스 벡터(예를 들면, 결실된 아데노바이러스의 E1a 또는 E3 영역에 삽입됨)에 의해 공급된다. 또 다른 예시로서, Palombo et al., (1998) J. Virology 72:5025는 AAV TR에 의해 플랭킹된 리포터 유전자를 운반하는 바큘로바이러스 벡터를 기재한다. rep/cap 유전자에 대해 전술된 바와 같이, EBV 벡터는 또한 주형을 전달하기 위해 채택될 수 있다.
또 다른 대표적인 구체예에서, 핵산 주형은 복제성(replicating) rAAV 바이러스에 의해 제공된다. 다른 구체예에서, 핵산 주형을 포함하는 AAV 프로바이러스가 세포의 염색체 내로 안정적으로 통합된다.
바이러스 역가(virus titer)를 증가시키기 위해, 생산적 AAV 감염을 촉진하는 헬퍼 바이러스(예를 들면, 아데노바이러스 또는 헤르페스 바이러스) 기능이 세포에 제공될 수 있다. AAV 복제에 필요한 헬퍼 바이러스 서열이 당해 분야에서 공지되어 있다. 통상적으로, 이 서열들은 아데노바이러스 또는 헤르페스바이러스에 의해 제공될 것이다. 아데노바이러스 또는 헤르페스바이러스 서열은 또 다른 비-바이러스 벡터 또는 바이러스 벡터에 의해, 예를 들면, Ferrari et al., (1997) Nature Med . 3:1295, 및 미국특허 제6,040,183호 및 제6,093,570호에 기재된 바와 같이 효율적 AAV 생성을 촉진하는 헬퍼 유전자 모두를 운반하는 비-감염성(non-infectious) 아데노바이러스 미니플라스미드에 의해 제공될 수 있다.
또한, 헬퍼바이러스 기능이 염색체 내에 내포된 헬퍼 서열 또는 안정적인 염색체외 요소(extrachromosomal element)로서 유지된 헬퍼 서열을 갖는 패키징 세포에 의해 제공될 수 있다. 일반적으로서, 헬퍼 바이러스 서열은 AAV 비리온 내로 패키징될 수 없고, 예를 들면, TR에 의해 플랭킹되지 않는다.
당해 분야의 통상의 기술자는 단일 헬퍼 구조체 상에 AAV 복제 및 캡시드 서열과 헬퍼 바이러스 서열(예를 들면, 아데노바이러스 서열)을 제공하는 것이 유리할 수 있다는 것을 이해할 것이다. 이 헬퍼 구조체는 비-바이러스 구조체 또는 바이러스 구조체일 수 있다. 하나의 비-한정적 예시로서, 헬퍼 구조체는 AAV rep/cap 유전자를 포함하는 하이브리드 아데노바이러스 또는 하이브리드 헤르페스바이러스일 수 있다.
하나의 특정한 구체예에서, AAV rep/cap 서열 및 아데노바이러스 헬퍼 서열이 단일 아데노바이러스 헬퍼 벡터에 의해 공급된다. 이 벡터는 또한 AAV 핵산 주형을 포함할 수 있다. AAV rep/cap 서열 및/또는 rAAV 주형이 아데노바이러스의 결실된 영역(예를 들면, E1a 영역 또는 E3 영역) 내에 삽입될 수 있다.
추가적인 구체예에서, AAV rep/cap 서열 및 아데노바이러스 헬퍼 서열이 단일 아데노바이러스 헬퍼 벡터에 의해 공급된다. 이 구체예에 따르면, rAAV 주형은 플라스미드 주형으로서 제공될 수 있다.
또 다른 예시적인 구체예에서, AAV rep/cap 서열 및 아데노바이러스 헬퍼 서열이 단일 아데노바이러스 헬퍼 벡터에 의해 제공되고, rAAV 주형이 프로바이러스(provirus)로서 세포 내에 통합된다. 대안적으로, rAAV 주형이 염색체외 요소(예를 들면, EBV 기반 핵 에피좀)로서 세포 내에 유지된 EBV 벡터에 의해 제공된다.
추가적인 대표적 구체예에서, AAV rep/cap 서열 및 아데노바이러스 헬퍼 서열이 단일 아데노바이러스 헬퍼에 의해 제공된다. rAAV 주형은 별개의 복제성 바이러스 벡터(replicating viral vector)로 제공될 수 있다. 예를 들면, rAAV 주형이 rAAV 입자 또는 제2 재조합 아데노바이러스 입자에 의해 공급될 수 있다.
전술된 방법에 따르면, 하이브리드 아데노바이러스 벡터는 통상적으로 아데노바이러스 복제 및 패키징을 위해 충분한 아데노바이러스 5' 및 3' 시스 (cis) 서열(즉, 아데노바이러스 말단 반복 및 PAC 서열)을 포함한다. AAV rep/cap 서열 및 존재하는 경우, rAAV 주형은 아데노바이러스 백본에 내포되고, 5' 시스 서열 및 3' 시스 서열에 의해 플랭킹되어, 이 서열들은 아데노바이러스 캡시드 내로 패키징될 수 있다. 전술된 바와 같이, 아데노바이러스 헬퍼 서열 및 AAV rep/cap 서열은 일반적으로 TR에 의해 플랭킹되지 않아서, 이 서열들은 AAV 비리온 내로 패키징되지 않는다.
Zhang et al., ((2001) Gene Ther . 18:704-12)은 아데노바이러스 및 AAV rep 및 cap 유전자를 포함하는 키메라 헬퍼(chimeric helper)를 기재한다.
헤르페스바이러스은 또한 AAV 패키징 방법에서 헬퍼 바이러스로 사용될 수 있다. AAV Rep 단백질을 코딩하는 하이브리드 헤르페스바이러스가 확장가능한 AAV 벡터 생산 방법(scalable AAV production scheme)을 유리하게 촉진할 수 있다. AAV-2 rep 및 cap 유전자를 발현하는 하이브리드 헤르페스 심플렉스 바이러스 타입 I (HSV-1) 벡터가 기재되었다 (Conway et al., (1999) Gene Therapy 6:986 및 WO 00/17377).
추가적인 대안으로서, 본 개시의 바이러스 벡터는 예를 들면, Urabe et al., (2002) Human Gene Therapy 13:1935-43에 의해 기재된 바와 같이, rep/cap 유전자 및 rAAV 주형을 전달하는 바큘로바이러스 벡터를 이용하여, 곤충 세포에서 생산될 수 있다.
오염(contaminating) 헬퍼 바이러스가 없는 AAV 벡터 스톡(Parvovirus vector stock)을 당해 분야에서 공지된 방법에 의해 수득할 수 있다. 예를 들면, AAV 및 헬퍼 바이러스는 크기에 기반하여 용이하게 구별될 수 있다. AAV는 또한 (예를 들면, 헤파린 기질에 대한) 친화도 크로마토그래피에 기반하여(Zolotukhin et al., (1999) Gene Therapy 6:973), 또는 친화도 수지(affinity resin)를 이용하여(Wang et al., (2015), Mol Ther Methods Clin Dev 2:15040), 또는 기타 방법(Qu et al. (2015) Curr Pharm Biotechnol . 16(8):684-95에서 리뷰된 것)을 이용하여 헬퍼 바이러스로부터 분리될 수 있다. 오염 헬퍼 바이러스가 복제 가능하지(replication competent) 않도록, 결실된 복제-결함 헬퍼 바이러스가 이용될 수 있다. 추가적인 대안으로서, AAV 바이러스의 패키징을 매개하기 위해 아데노바이러스 초기 유전자 발현(early gene expression)만이 요구되므로, 후기 유전자 발현(late gene expression)이 결핍된 아데노바이러스 헬퍼가 채택될 수 있다. 후기 유전자 발현에 대해 결함을 갖는 아데노바이러스 돌연변이체가 당해 분야에서 공지되어 있다(예를 들면, ts100K 및 ts149 아데노바이러스 돌연변이체).
재조합 바이러스 벡터
본 개시의 바이러스 벡터는 인 비트로(in vitro), 엑스 비보(ex vivo), 및 인 비보(in vivo)로 세포로의 핵산 전달을 위해 유용하다. 구체적으로, 바이러스 벡터는 포유동물을 포함한 동물, 세포로 핵산을 전달 또는 이동시키기 위해 유리하게 채택될 수 있다.
목적 이종핵산 서열(heterologous nucleic acid sequence(s) of interest)이 본 개시의 바이러스 벡터로 전달될 수 있다. 목적 핵산은 치료 (예를 들면, 의학 및 수의학적 용도용) 또는 면역원성(예를 들면, 백신용) 단백질을 포함한 폴리펩티드 및/또는 기능성 또는 치료 RNA 분자를 코딩하는 핵산을 포함한다.
치료 폴리펩티드는 CFTR(cystic fibrosis transmembrane regulator protein), 디스트로핀(dystrophin)(미니-디스트로핀 및 마이크로-디스로핀 포함, 예를 들면, Vincent et al. (1993) Nature Genetics 5:130; 미국특허출원 공개 2003/017131; 국제출원 공개 WO/2008/088895, Wang et al. Proc . Natl . Acad . Sci . USA 97:13714-13719 (2000); 및 Gregorevic et al. Mol . Ther . 16:657-64 (2008) 참조), 마이오스타틴 프로펩티드(myostatin propeptide), 폴리스타틴(follistatin), 액티빈 타입 II 가용성 수용체(activin type II soluble receptor), IGF-1, 항-염증 폴리펩티드, 예를 들면, Ikappa B 우성 돌연변이체(dominant mutant), 사르코스판(sarcospan), 유트로핀(utrophin)(Tinsley et al. (1996) Nature 384:349), 미니-유트로핀, 응고 인자(clotting factor)(예를 들면, Factor VIII, Factor IX, Factor X, 등), 에리트로포이에틴(erythropoietin), 안지오스타틴(angiostatin), 엔도스타틴(endostatin), 카탈라아제(catalase), 티로신 히드록실라아제, 수퍼옥시드 디스뮤타아제(superoxide dismutase), 렙틴(leptin), LDL 수용체, 지질단백질 리파아제(lipoprotein lipase), 오르니틴 트랜스카르바밀라아제(ornithine transcarbamylase), β-글로빈, α-글로빈, 스텍트린, α1-안티트립신, 아데노신 데아미나아제(adenosine deaminase), 하이포산틴 구아닌 포스포리보실 트랜스퍼라아제(hypoxanthine guanine phosphoribosyl transferase), β-글루코세레브로시다아제(β-glucocerebrosidase), 스핑고마이엘리나아제(sphingomyelinase), 리소좀 헥소오스아미니다아제(lysosomal hexosaminidase) A, 분지쇄 케토산 탈수소효소(branched-chain keto acid dehydrogenase), RP65 단백질, 사이토카인(예를 들면, α-인터페론, β-인터페론, 인터페론-γ, 인터루킨-2, 인터루킨-4, 과립구-대식구 콜로니 자극 인자(granulocyte-macrophage colony stimulating factor), 림포톡신(lymphotoxin), 등), 펩티드 성장 인자, 신경친화성 인자(neurotrophic factor) 및 호르몬(예를 들면, 소마토트로핀(somatotropin), 인슐린, 인슐린-유사 성장 인자 1 및 2, 혈소판 유래 성장 인자, 혈소판 유래 성장 인자(platelet derived growth factor), 섬유모세포 성장 인자. 표피 성장 인자, 신경 성장 인자, 신경친화성 인자(neurotrophic factor) -3 및 -4, 뇌-유래 신경친화성 인자(brain-derived neurotrophic factor), 골 형성 단백질(bone morphogenic proteins)[RANKL 및 VEGF 포함], 신경교세포 유래 성장 인자(glial derived growth factor), TGF(transforming growth factor)-α 및 -β, 등), 리소좀산 α-글루코시다아제(lysosomal acid α-glucosidase), α-갈락토시다아제 A, 수용체(예를 들면, 종양 괴사 성장 인자(tumor necrosis growth factor)α 가용성 수용체), S100A1, 파르브알부민(parvalbumin), 아데닐릴 사이클라아제 타입 6(adenylyl cyclase type 6), 칼슘 처리(calcium handling)를 조절하는 분자(예를 들면, SERCA2A, PP1의 억제제 1(Inhibitor 1 of PP1) 및 그의 단편[예를 들면, WO 2006/029319 및 WO 2007/100465]), G-단백질 결합 수용체 키나아제 타입 2(G-protein coupled receptor kinase type 2) 넉다운을 가져오는 단백질, 예를 들면, 절단된 구성적 활성(truncated constitutively active) bARKct, 항-염증 인자, 예를 들면, IRAP, 항-마이오스타틴 단백질, 아스파르토아실라아제(aspartoacylase), 단일클론 항체(단쇄 단일클론 항체 포함; 예시적 Mab는 Herceptin® Mab임), 뉴로펩티드(neuropeptides) 및 그의 단편(예를 들면, 갈라닌(galanin), 뉴로펩티드 Y (미국특허 제7,071,172호 참조), 혈관생성(angiogenesis) 억제제, 예를 들면, 바소히빈(Vasohibins) 및 기타 VEGF 억제제(예를 들면, 바소히빈 2 [WO JP2006/073052 참조])를 포함하나, 이에 한정되지 않는다. 다른 예시적 이종기원 핵산 서열은 자살 유전자 산물(suicide gene products)(예를 들면, 티미딘 키나아제(thymidine kinase), 시토신 탈아민효소(cytosine deaminase), 디프테리아 독소, 및 TNF(tumor necrosis factor)), 암 치료에서 사용되는 약물에 대한 내성을 부여하는 단백질, 종양 억제자(tumor suppressor) 단백질 산물(예를 들면, p53, Rb, Wt-1), TRAIL, FAS-리간드, 및 필요로 하는 개체에서 치료 효과를 갖는 기타 폴리펩티드를 코딩한다. AAV 벡터는 또한 단일클론 항체 및 항체 단편, 예를 들면, 마이오스타틴에 대한 항체 또는 항체 단편을 전달하기 위해 이용될 수 있다(예를 들면, Fang et al. Nature Biotechnology 23:584-590 (2005) 참조).
폴리펩티드를 코딩하는 이종기원 핵산 서열은 리포터 폴리펩티드(예를 들면, 효소)를 코딩하는 것들을 포함한다. 리포터 폴리펩티드는 당해 기술 분야에서 알려져 있고, GFP(green fluorescent protein), β-갈락토시다아제, 알칼리 포스파타아제, 루시페라아제, 및 클로람페니콜 아세틸트랜스퍼라아제 유전자를 포함하나, 이에 한정되지 않는다.
선택적으로, 이종기원 핵산 분자는 분비된 폴리펩티드(예를 들면, 그의 원형 상태인 분비된 폴리펩티드, 또는 예를 들면 당해 기술 분야에서 공지된 바와 같은 분비 신호 서열(secretory signal sequence)과의 작동가능한 회합(operable association)에 의해 분비되도록 조작된 폴리펩티드)를 코딩할 수 있다.
대안적으로, 본 개시의 특정한 구체예에서, 이종기원 핵산은 안티센스 핵산, 리보자임(예를 들면, 미국특허 제5,877,022호에 기재된 바와 같은 리보자임), 스플라이세오좀-매개 트랜스-스플라이싱(spliceosome-mediated trans-splicing)을 가져오는 RNA (Puttaraju et al. (1999) Nature Biotech. 17:246; 미국특허 제6,013,487호; 미국특허 제6,083,702호 참조), 유전자 침묵(gene silencing)을 수행하는 siRNA, shRNA 또는 miRNA를 포함한, RNAi(interfering RNA)(Sharp et al. (2000) Science 287:2431 참조), 및 기타 비-번역 RNA, 예를 들면, "가이드(guide)" RNA(Gorman et al. (1998) Proc . Nat. Acad. Sci . USA 95:4929; Yuan et al.에 의한 미국특허 제5,869,248호 참조), 등을 코딩할 수 있다. 대표적인 비번역 RNA는 MDR(multiple drug resistance) 유전자 산물에 대한 RNAi(예를 들면, 종양을 치료 및/또는 예방하고 및/또는 화학요법에 의한 손상을 예방하기 위한 심장으로의 투여를 위한 RNAi), 마이오스타틴에 대한 RNAi(예를 들면, 듀헨 근육 이영양증(Duchenne muscular dystrophy)을 위한 RNAi), VEGF에 대한 RNAi (예를 들면, 종양의 치료 및/또는 예방을 위한 VEGF에 대한 RNAi), PLN(phospholamban)에 대한 RNAi(예를 들면, 심혈관 질환 치료용, 예를 들면, Andino et al. J. Gene Med . 10:132-142 (2008) 및 Li et al. Acta Pharmacol Sin. 26:51-55 (2005) 참조); PLN(phospholamban) 억제성 또는 우성-음성 분자(dominant-negative molecule), 예를 들면, PLN S16E(예를 들면, 심혈관 질환 치료용, 예를 들면, Hoshijima et al. Nat. Med . 8:864-871 (2002) 참조), 아데노신 키나아제에 대한 RNAi(예를 들면, 뇌전증을 위한 RNAi), 및 병원성 개체 및 바이러스에 대한 RNAi(예를 들면, B형 및/또는 C형 간염(hepatitis) 바이러스, HIV, CMV, 헤르페스 심플렉스 바이러스(herpes simplex virus), 인간 파필로마 바이러스(human papilloma virus), 등)를 포함한다.
또한, 대안적 스플라이싱(splicing)을 지시하는 핵산 서열이 전달될 수 있다. 예시하기 위해, 디스트로핀 엑손 51의 5' 및/또는 3' 스플라이스 부위에 상보적인 안티센스 서열(또는 기타 억제성 서열(inhibitory sequence)이 이 엑손의 스키핑(skipping)을 유도하기 위해 U1 또는 U7 sn(small nuclear) RNA 프로모터와 함께 전달될 수 있다. 예를 들면, 안티센스/억제성 서열의 5'에 위치한 U1 또는 U7 snRNA 프로모터를 포함하는 DNA 서열이 본 개시의 변형된 캡시드에 패키징되어 전달될 수 있다.
바이러스 벡터는 또한 숙주 염색체 상의 유전자좌(locus)와 상동성(homology)을 공유하고 그와 재조합하는 이종기원 핵산 분자를 포함할 수 있다. 이 방식은 예를 들면, 숙주 세포에서 유전적 결함을 보정하기 위해 이용될 수 있다.
본 개시는 또한 면역원성 폴리펩티드를 발현하는, 예를 들면, 백신접종(vaccination)을 위한 면역원성 폴리펩티드를 발현하는 바이러스 벡터를 제공한다. 핵산 분자는 HIV(human immunodeficiency virus), SIV(simian immunodeficiency virus), 인플루엔자 바이러스, HIV 또는 SIV gag 단백질, 종양 항원, 암 항원, 박테리아 항원, 바이러스 항원, 등으로부터의 면역원을 포함하나, 이에 한정되지 않는, 당해 기술 분야에서 공지된 목적 면역원을 코딩할 수 있다.
면역원성(immunogenic) 폴리펩티드는 미생물, 박테리아, 원생동물, 기생충, 균류 및/또는 바이러스 감염 및/또는 질환을 포함하나, 이에 한정되지 않는 감염 및/또는 질환에 대해 면역 반응을 유발하고 및/또는 개체를 보호하기에 적합한 폴리펩티드일 수 있다. 예를 들면, 면역원성 폴리펩티드는 오르토믹소바이러스(orthomyxovirus) 면역원 (예를 들면, 인플루엔자 바이러스 면역원, 예를 들면, 인플루엔자 바이러스 헤마글루티닌 (HA) 표면 단백질 또는 인플루엔자 바이러스 핵단백질(nucleoprotein), 또는 말 인플루엔자 바이러스(equine influenza virus) 면역원) 또는 렌티바이러스 면역원 (예를 들면, 말 감염성 빈혈 바이러스 면역원(an equine infectious anemia virus immunogen), SIV(Simian Immunodeficiency Virus) 면역원, 또는 HIV(Human Immunodeficiency Virus) 면역원, 예를 들면, HIV 또는 SIV 외피(envelope) GP160 단백질, HIV 또는 SIV 매트릭스/캡시드 단백질, 및 HIV 또는 SIV gag, pol 및 env 유전자 산물)일 수 있다. 면역원성 폴리펩티드는 또한 아레나바이러스(arenavirus) 면역원 (예를 들면, 라싸열 바이러스(Lassa fever virus) 면역원, 예를 들면, 라싸열 바이러스 뉴클레오캡시드 단백질 및 라싸열 외피 당단백질), 폭스바이러스(poxvirus) 면역원 (예를 들면, 백시니아 바이러스 면역원, 예를 들면, 백시니아 L1 또는 L8 유전자 산물), 플라비바이러스(flavivirus) 면역원 (예를 들면, 황열 바이러스(yellow fever virus) 면역원 또는 일본 뇌염 바이러스(Japanese encephalitis virus) 면역원), 필로바이러스(filovirus) 면역원 (예를 들면, 에볼라 바이러스 면역원, 또는 마르부르크(Marburg) 바이러스 면역원, 예를 들면, NP 및 GP 유전자 산물), 부니아바이러스(bunyavirus) 면역원 (예를 들면, RVFV, CCHF, 및/또는 SFS 바이러스 면역원), 또는 코로나바이러스(coronavirus) 면역원 (예를 들면, 감염성 인간 코로나바이러스 면역원, 예를 들면, 인간 코로나바이러스 외피 당단백질, 또는 돼지 전염성 위장염 바이러스(porcine transmissible gastroenteritis virus) 면역원, 또는 조류 감염성 기관지염 바이러스(avian infectious bronchitis virus) 면역원)일 수 있다. 면역원성 폴리펩티드는 또한 폴리오 면역원, 헤르페스 면역원 (예를 들면, CMV, EBV, HSV 면역원), 유행성 이하선염(mumps) 면역원, 홍역(measles) 면역원, 루벨라(rubella) 면역원, 디프테리아 독소 또는 기타 디프테리아 면역원, 백일해(pertussis) 항원, 간염(hepatitis)(예를 들면, A형 간염, B형 간염, C형 간염 등) 면역원, 및/또는 당해 기술 분야에서 현재 알려지거나 이후에 면역원으로 확인되는 기타 백신 면역원일 수 있다.
대안적으로, 면역원성 폴리펩티드는 종양 세포 또는 암 세포 항원일 수 있다. 선택적으로, 종양 또는 암 항원은 암 세포의 표면 상에 발현된다. 대표적인 암 및 종양 세포 항원이 S.A. Rosenberg (Immunity 10:281 (1991))에 기재된다. 기타 예시적인 암 및 종양 항원은 하기를 포함하나, 이에 한정되지 않는다: BRCA1 유전자 산물, BRCA2 유전자 산물, gp100, 티로시나아제(tyrosinase), GAGE-1/2, BAGE, RAGE, LAGE, NY-ESO-1, CDK-4, β-카테닌, MUM-1, 카스파아제-8, KIAA0205, HPVE, SART-1, PRAME, p15, 흑색종 종양 항원(Kawakami et al. (1994) Proc . Natl . Acad . Sci . USA 91:3515; Kawakami et al., (1994) J. Exp . Med., 180:347; Kawakami et al. (1994) Cancer Res. 54:3124), MART-1, gp100 MAGE-1, MAGE-2, MAGE-3, CEA, TRP-1, TRP-2, P-15, 티로시나아제 (Brichard et al. (1993) J. Exp . Med. 178:489); HER-2/neu 유전자 산물 (미국특허 제4,968,603호), CA 125, LK26, FB5 (엔도시알린(endosialin)), TAG 72, AFP, CA19-9, NSE, DU-PAN-2, CA50, SPan-1, CA72-4, HCG, STN (sialyl Tn antigen), c-erbB-2 단백질, PSA, L-CanAg, 에스트로겐 수용체, 유지방 글로불린(milk fat globulin), p53 종양 억제자 단백질(tumor suppressor protein)(Levine (1993) Ann. Rev. Biochem. 62:623); 뮤신 항원(mucin antigen)(국제특허 공개 WO 90/05142); 텔로머라아제(telomerase); 핵 매트릭스 단백질(nuclear matrix protein); PAP(prostatic acid phosphatase); 파필로마 바이러스 항원(papilloma virus antigen); 및/또는 하기 암과 관련된 것으로 현재 알려지거나 또는 이후에 발견되는 항원: 흑색종, 선암종(adenocarcinoma), 흉선종(hymoma), 림프종(lymphoma)(예를 들면, 비호지킨 림프종(non-Hodgkin's lymphoma), 호지킨 림프종), 육종, 폐암, 간암, 결장암, 백혈병, 자궁암, 유방암, 전립선암, 난소암, 자궁경부암(cervical cancer), 방광암, 신장암, 췌장암, 뇌암(brain cancer) 및 현재 알려지거나 또는 이후에 확인되는 기타 암 또는 악성 질환 (예를 들면, Rosenberg (1996) Ann. Rev. Med. 47:481-91 참조).
추가적인 대안으로서, 이종기원 핵산은 바람직하게, 세포에서 인 비트로, 엑스 비보(ex vivo), 또는 인 비보(in vivo)로 생성되는 폴리펩티드를 코딩할 수 있다. 예를 들면, 바이러스 벡터가 배양된 세포 내로 도입될 수 있고, 발현된 유전자 산물이 그로부터 단리될 수 있다.
추가적인 구체예에서, 이종기원 핵산은 (a) DNA-표적화 RNA 분자 (gRNA)와 상호작용하는 RNA-결합 단백질을 포함하는 ZFN(zinc finger nuclease) 또는 메가뉴클레아제(meganuclease) 또는 엔도뉴클레아제 또는 TALEN 또는 CRISPR/Cas 시스템 기반 뉴클레아제에 기반한 부위-지향적 변형 폴리펩티드(site-directed modifying polypeptide) 또는 그러한 폴리펩티드를 코딩하는 mRNA; (b) 표적 DNA 중 서열에 상보적인 뉴클레오티드 서열 및 및 부위-지향적 변형 폴리펩티드와 상호작용하는 제 2 세그먼트를 포함하는 하나 이상의 가이드 RNA 분자(gRNA); 및/또는 포유동물 게놈의 표적 부위 내로의 상동성 재조합을 위해 설계된 단일가닥 또는 이중가닥 DNA 서열을 포함하는 하나 이상의 DNA 공여체 주형(DNA donor template) 분자를 코딩할 수 있다. 예를 들면, 바이러스 벡터가 줄기 세포 및/또는 T 림프구 내로 엑스 비보로 도입되거나 배양된 세포, 조직 및/또는 개체 내로 인 비보로 도입될 수 있고 발현된 유전자 산물이 숙주에서 표적 유전자의 편집(editing), 파괴(disruption), 전사 활성화 및/또는 억제(transcriptional activation and/or repression))를 가능하게 한다.
목적 이종기원 핵산 분자가 적절한 조절 서열과 작동 가능하게 결합될 수 있다는 것을 당업자는 이해할 것이다. 예를 들면, 이종기원 핵산 분자는 발현 조절 요소, 예를 들면, 전사/번역 조절 신호, 복제원점(origin of replication), 폴리아데닐화 신호, IRES(internal ribosome entry site), 프로모터, 및/또는 인핸서 등과 작동 가능하게 결합될 수 있다.
또한, 목적 이종기원 핵산 분자의 조절된 발현이 전사-후(post-transcriptional) 수준에서, 예를 들면, 특정한 부위에서 스플라이싱 활성을 선택적으로 차단하는 올리고뉴클레오티드, 소형 분자 및/또는 기타 화합물(예를 들면, WO 2006/119137에 기재된 것)의 존재 또는 부재에 의해 상이한 인트론의 선택적 스플라이싱을 조절하는 것에 의해 달성될 수 있다.
당업자는 다양한 프로모터/인핸서 요소가 원하는 수준 및 조직-특이적 발현에 따라 이용될 수 있다는 것을 이해할 것이다. 프로모터/인핸서는 원하는 발현 패턴에 따라, 구성적(constitutive)이거나 유도성일 수 있다. 프로모터/인핸서는 원형(native)이거나 외래(foreign)일 수 있고 천연 서열 또는 합성 서열일 수 있다. 외래는, 전사 개시 영역이 전사 개시 영역이 도입된 야생형 숙주에서 발견되지 않는다는 것으로 의도된다.
특정한 구체예에서, 프로모터/인핸서 요소는 표적 세포 또는 치료 대상 개체에 대해 원형일 수 있다. 대표적인 구체예에서, 프로모터/인핸서 요소는 이종기원 핵산 서열에 대해 원형일 수 있다. 프로모터/인핸서 요소는 일반적으로, 목적 표적 세포에서 기능하도록 선택된다. 또한, 특정한 구체예에서, 프로모터/인핸서 요소는 포유동물 프로모터/인핸서 요소이다. 프로모터/인핸서 요소는 구성적이거나 유도성일 수 있다.
유도성 발현 조절 요소(inducible expression control element)는 이종기원 핵산 서열의 발현에 대해 조절을 제공하는 것이 바람직한 적용에서 통상적으로 유리하다. 유전자 전달을 위한 유도성 프로모터/인핸서 요소는 조직-특이적 또는 조직-선호(tissue-preferred) 프로모터/인핸서 요소일 수 있고, 근육 특이적 또는 선호(심장 근육, 골격 근육 및/또는 평활근 특이적 또는 선호 포함), 신경 조직 특이적 또는 선호(뇌-특이적 또는 선호 포함), 안구-특이적 또는 선호(망막-특이적 및 각막-특이적 포함), 간 특이적 또는 선호, 골수 특이적 또는 선호, 췌장 특이적 또는 선호, 비장 특이적 또는 선호, 및 폐 특이적 또는 선호 프로모터/인핸서 요소를 포함한다. 기타 유도성 프로모터/인핸서 요소는 호르몬-유도성 및 금속-유도성 요소를 포함한다. 대표적인 유도성 프로모터/인핸서 요소는 Tet 온/오프 요소, RU486-유도성 프로모터, 엑디손-유도성 프로모터(ecdysone-inducible promoter), 라파마이신-유도성 프로모터, 및 메탈로티오네인 프로모터(metallothionein promoter)를 포함하나, 이에 한정되지 않는다.
표적 세포에서 이종기원 핵산 서열이 전사되고 번역되는 것인 구체예에서, 삽입된 단백질 코딩 서열의 효율적인 번역을 위해, 특이적 개시 신호(specific initiation signal)가 일반적으로 포함된다. ATG 개시 코돈 및 인접한(adjacent) 서열을 포함할 수 있는, 이러한 외인성 번역 조절 서열(exogenous translational control sequence)은 천연 및 합성의 다양한 기원에서 유래된 것일 수 있다.
본 개시에 따른 바이러스 벡터는 분열 세포 및 비-분열(non-dividing) 세포를 포함한, 다양한 세포로 이종기원 핵산을 전달하는 수단을 제공한다. 인 비트로에서 세포에 목적 핵산을 전달하기 위해, 예를 들면, 인 비트로에서 폴리펩티드를 생성하거나, 또는 엑스 비보 유전자 치료를 위해, 바이러스 벡터가 이용될 수 있다. 바이러스 벡터는 필요로 하는 개체로, 예를 들면, 면역원성 또는 치료 폴리펩티드 또는 기능성 RNA를 발현하기 위해 핵산을 전달하는 방법에서 또한 유용하다. 이러한 방식으로, 폴리펩티드 또는 기능성 RNA가 개체에서 인 비보로 생산될 수 있다. 개체는 해당 폴리펩티드의 결핍을 갖기 때문에, 그 폴리펩티드를 필요로 할 수 있다. 또한, 개체 중 폴리펩티드 또는 기능성 RNA의 생산이 유용한 효과를 부여할 수 있기 때문에, 상기 방법이 실시될 수 있다.
바이러스 벡터는 또한 배양된 세포 또는 개체에서(예를 들면, 폴리펩티드를 생산하거나, 예를 들면, 스크리닝 방법과 관련하여, 개체에 대한 기능성 RNA의 효과를 관찰하기 위해 생물반응기로서 개체를 이용하여) 목적 폴리펩티드 또는 기능성 RNA를 생산하기 위해 이용될 수 있다.
일반적으로, 본 개시의 바이러스 벡터는 치료 폴리펩티드 또는 기능성 RNA를 전달하는 것이 유용한 질병 상태를 치료 및/또는 예방하기 위한 폴리펩티드 또는 기능성 RNA를 코딩하는 이종기원 핵산을 전달하기 위해 채택될 수 있다. 예시적 질병 상태는 하기를 포함하나, 이에 한정되지 않는다: 낭포성 섬유증(낭포성 섬유증 막관통 조절자 단백질(cystic fibrosis transmembrane regulator protein)) 및 폐의 기타 질환, A형 혈우병(Factor VIII), B형 혈우병(Factor IX), 탈라세미아(β-글로빈), 빈혈(에리트로포이에틴) 및 기타 혈액 질환, 알츠하이머병(GDF; 네프릴리신(neprilysin)), 다발성 경화증(β-인터페론), 파킨슨병(GDNF(glial-cell line derived neurotrophic factor]), 헌팅턴병(반복(repeats)을 제거하기 위한 RNAi), 근위축성 측삭 경화증(amyotrophic lateral sclerosis), 뇌전증(갈라닌, 신경친화성 인자), 및 기타 신경 질환, 암(엔도스타틴(endostatin), 안지오스타틴(angiostatin), TRAIL, FAS-리간드, 인터페론을 포함한 사이토카인; VEGF 또는 다중 약물 내성 유전자 산물(multiple drug resistance gene product)에 대한 RNAi를 포함한 RNAi, mir-26a [예를 들면, 간세포 암종(hepatocellular carcinoma)을 위한 것]), 당뇨병(인슐린), 뒤센병(Duchenne)을 포함한 근 이영양증(디스트로핀(dystrophin), 미니-디스트로핀, 인슐린-유사 성장 인자(insulin-like growth factor) I, a 사르코글리칸(sarcoglycan)[예를 들면, α, β, γ], 마이오스타틴에 대한 RNAi, 마이오스타틴 프로펩티드, 폴리스타틴(follistatin), 액티빈(activin) 타입 II 가용성 수용체, 항-염증성 폴리펩티드, 예를 들면, Ikappa B 우성 돌연변이체, 사르코스판(sarcospan), 유트로핀(utrophin), 미니-유트로핀, 엑손 스키핑(exon skipping)을 유도하기 위한 디스트로핀 유전자 중 스플라이스 접합부(splice junction)에 대한 안티센스 또는 RNAi [예를 들면, WO/2003/095647 참조], 엑손 스키핑을 유도하기 위한 U7 snRNA에 대한 안티센스[예를 들면, WO/2006/021724 참조], 및 마이오스타틴 또는 마이오스타틴 프로펩티드에 대한 항체 또는 항체 단편) 및 베커, 고셔병(Becker, Gaucher disease) (글루코세레브로시아다제(glucocerebrosidase)), 헐러병(Hurler's disease)(α-L-이두로니다아제(iduronidase)), 아데노신 탈아민효소 결핍(adenosine deaminase deficiency)(아데노신 탈아민효소), 글리코겐 축적 질환(glycogen storage disease)(예를 들면, 파브리(Fabry) 병[α-갈락토시다아제] 및 폼페(Pompe) 병[리소좀산 α-글루코시다아제(lysosomal acid α-glucosidase)]) 및 기타 대사 장애, 선천성 폐기종(congenital emphysema)(α1-안티트립신), 레쉬-니한 증후군(Lesch-Nyhan Syndrome)(하이포산틴 구아닌 포스포리보실 트랜스퍼라아제(hypoxanthine guanine phosphoribosyl transferase)), 니만-피크병(Niemann-Pick disease) (스핑고미엘리나아제(sphingomyelinase)), 테이 삭스병(Tay Sachs disease)(리소좀 헥소스아미니다아제(lysosomal hexosaminidase) A), 메이플 시럽 뇨증(Maple Syrup Urine Disease)(분지쇄 케토산 탈수소효소(branched-chain keto acid dehydrogenase)), 망막 변성 질환(retinal degenerative disease)(및 안구 및 망막의 기타 질환; 예를 들면, 황반변성을 위한 PDGF 및/또는 망막 질환, 예를 들면, 타입 I 당뇨병의 망막 질환을 치료/예방하기 위한 바소히빈 또는 VEGF의 억제제, 또는 기타 혈관형성 억제제), 뇌와 같은 실질 기관(solid organ)의 질환(파킨슨병[GDNF], 성상세포종[엔도스타틴, 안지오스타틴 및/또는 VEGF에 대한 RNAi], 교모세포종 [엔도스타틴, 안지오스타틴 및/또는 VEGF에 대한 RNAi] 포함), 울혈성 심부전(congestive heart failure) 또는 PAD(peripheral artery disease)를 포함한 심장, 신장, 간의 질환 (예를 들면, by delivering protein 포스파타아제 억제제(phosphatase inhibitor) I (I-1) 및 그의 단편 (예를 들면, I1C), serca2a, 포스포람반(phospholamban) 유전자를 조절하는 징크 핑거(zinc finger) 단백질, Barkct, β2-아드레날린성 수용체, β2-아드레날린성 수용체 키나아제(BARK), PI3 키나아제(phosphoinositide-3 kinase), S100A1, 파브알부민(parvalbumin), 아데닐릴 사이클라아제 타입 6(adenylyl cyclase type 6), 절단된 구성적 활성 bARKct와 같은, G-단백질 결합 키나아제 타입 2(G-protein coupled receptor kinase type 2) 넉다운을 수행하는 분자; 칼사르신(calsarcin), 포스포람반에 대한 RNAi; 포스포람반 억제 또는 우성-음성(dominant-negative) 분자, 예를 들면, 포스포람반 S16E, 등), 관절염(인슐린-유사 성장 인자), 관절 장애(joint disorder)(인슐린-유사 성장 인자 1 및/또는 2), 내막 과다증식(intimal hyperplasia)(예를 들면, enos, inos 전달), 심장 이식의 생존율 개선 (수퍼옥사이드 디스뮤타아제), AIDS (가용성 CD4), 근육 소모(muscle wasting) (인슐린-유사 성장 인자 I), 신장 결핍(kidney deficiency)(에리트로포이에틴), 빈혈 (에리트로포이에틴), 관절염(항-염증성 인자, 예를 들면, IRAP 및 TNFα 가용성 수용체), 간염 (α-인터페론), LDL 수용체 결핍(LDL 수용체), 고암모니아혈증(오르니틴 트랜스카르바밀라아제), 크라베병(Krabbe's disease)(갈락토세레브로시다아제), 척수 근육 위축(SMA), 바텐병(Batten's disease), 프리드라이히 운동실조증(Friedreich's ataxia)을 포함한 척수 뇌 운동실조증(spinal cerebral ataxias), SCA1, SCA2 및 SCA3, 페닐케톤뇨증(페닐알라닌 히드록실라아제), 자가면역 질환, 등. 본 개시는 또한 (예를 들면, 면역억제제 또는 사이토카인 생성을 차단하기 위한 억제성 핵산을 투여하는 것에 의해) 이식의 성공률을 높이고 및/또는 기관 이식 또는 보조 요법(adjunct therapy)의 부정적인 부작용을 감소시키기 위해 기관 이식 후 이용될 수 있다. 또 다른 예로서, 골 형성 단백질(BMP 2, 7, 등, RANKL 및/또는 VEGF 포함)이 예를 들면, 암 환자에서 골절(break) 또는 수술에 의한 제거 후, 골 동종이식편(bone allograft)과 함께 투여될 수 있다.
본 개시는 또한 유도 만능 줄기 세포(iPS)를 생성하기 위해 이용될 수 있다. 예를 들면, 본 개시의 바이러스 벡터는 줄기 세포 연관 핵산을 비-만능 세포(non-pluripotent cell), 예를 들면, 성체 섬유모세포, 피부 세포, 간 세포, 신장 세포, 지방 세포, 심장 세포, 신경 세포, 상피 세포, 내피 세포, 등으로 전달하기 위해 이용될 수 있다. 줄기 세포와 연관된 인자를 코딩하는 핵산이 당해 기술 분야에서 알려져 있다. 이러한 줄기 세포 및 전분화능(pluripotency)과 연관된 인자의 비한정적 예는 Oct-3/4, SOX 패밀리(예를 들면, SOX1, SOX2, SOX3 및/또는 SOX15), Klf 패밀리(예를 들면, Klf1, Klf2, Klf4 및/또는 Klf5), Myc 패밀리(예를 들면, C-myc, L-myc 및/또는 N-myc), NANOG 및/또는 LIN28을 포함한다.
본 개시는 또한 뇌전증, 뇌졸중, 외상성 뇌손상, 인지 장애, 행동 장애, 정신 질환, 헌팅턴병, 알츠하이머병, 근위축성 측삭 경화증(ALS), 및 축삭/신경 재생 또는 복구(axonal/neuronal regeneration or repair)로부터 유익을 얻을 수 있거나 또는 이를 요구하는 기타 신경퇴행성 질환을 치료 및/또는 예방하기 위해 실시될 수 있다.
특정 구체예에서, 본 개시는 교정 요법(corrective therapy)으로서, 축삭 재생 및 신경 복구를 촉진하고, 회로를 회복시키고 및/또는 상실된 뉴런을 보충하기 위해 예를 들면, FoxJ1, Fox2, NeuroD2, NG2 또는 Olig2 및/또는 microRNA, 예를 들면, miR-137, MiR124, 및 신경 발생 및 분화에 관여된 기타 인자 또는 miRNA와 같은 줄기세포 분화 및 리프로그래밍 인자의 표적화된 조절 또는 과발현에 의해 실시될 수 있다.
유전자 전달은 질병 상태의 이해 및 치료법의 제공을 위한 실질적인 잠재적 용도를 갖는다. 결함 유전자가 알려지고 클로닝된 다수의 유전병이 있다. 일반적으로, 전술된 질병 상태는 두 개의 종류(class)로 분류된다: 통상적으로 열성 방식으로 유전되는, 결핍 상태, 보통 효소의 결핍 상태, 및 조절 또는 구조 단백질과 관련될 수 있고, 통상적으로 우성 방식으로 유전되는, 불균형(unbalanced) 상태. 결핍 상태 질환의 경우, 치환 요법을 위해 발병 조직(affected tissue) 내로 정상 유전자를 도입하기 위해, 및 안티센스 돌연변이를 이용하여 질병에 대한 동물 모델을 생성하기 위해 유전자 전달이 이용될 수 있다. 불균형 질환 상태의 경우, 질병 상태에 대응하기 위한 노력에서 사용될 수 있는, 모델 시스템에서 질병 상태를 생성하기 위해 유전자 전달이 이용될 수 있다. 따라서, 본 개시에 따른 바이러스 벡터가 유전 질환의 치료 및/또는 예방을 가능하게 한다.
본 개시에 따른 바이러스 벡터는 또한 인 비트로 또는 인 비보로 세포에 기능성 RNA를 제공하기 위해 이용될 수 있다. 세포에서 기능성 RNA의 발현은 예를 들면, 세포에 의한 특정 표적 단백질의 발현을 감소시킬 수 있다. 따라서, 이를 필요로 하는 개체에서 특정 단백질의 발현을 감소시키기 위해 기능성 RNA가 투여될 수 있다. 기능성 RNA는 또한 유전자 발현 및/또는 세포 생리를 조절하기 위해, 예를 들면, 세포 또는 조직 배양 시스템을 최적화하기 위해 또는 스크리닝 방법에서 인 비트로로 세포에 투여될 수 있다.
또한, 본 개시에 따른 바이러스 벡터는 목적 핵산이 세포 배양 시스템에서, 또는 대안적으로, 형질전환 동물 모델에서 일시적으로 또는 안정적으로 발현되는 것인 진단 및 스크리닝 방법에서 용도를 찾는다.
본 개시의 바이러스 벡터는 또한, 당해 분야에서 당업자에게 자명할 바와 같은, 유전자 표적화(gene targeting), 청소(clearance), 전사, 번역 등을 평가하기 위한 프로토콜에서의 용도를 포함하나, 이에 한정되지 않는 다양한 비-치료 목적을 위해 이용될 수 있다. 바이러스 벡터는 또한 안전성(확산(spread), 독성, 면역원성 등)을 평가하기 위한 목적을 위해 이용될 수 있다. 예를 들면, 그러한 데이터는 미국 식품의약국(the United States Food and Drug Administration)에 의해 임상 효능의 평가 전 규제 허가 프로세스(regulatory approval process)의 일부로 고려된다.
또 다른 양태로서, 본 개시의 바이러스 벡터는 개체에서 면역 반응을 생성하기 위해 이용될 수 있다. 이 구체예에 따르면, 면역원성 폴리펩티드를 코딩하는 이종기원 핵산 서열을 포함하는 바이러스 벡터가 개체에게 투여될 수 있고, 능동 면역 반응(active immune response)이 면역원성 폴리펩티드에 대해 개체에 의해 개시된다. 면역원성 폴리펩티드는 전술된 바와 같다. 일부 구체예에서, 보호성 면역 반응이 유도된다.
대안적으로, 바이러스 벡터는 세포에 엑스 비보로 투여될 수 있고, 변형된 세포가 개체에 투여된다. 이종기원 핵산을 포함하는 바이러스 벡터가 세포 내로 도입되고, 세포가 개체에서 투여되어, 면역원을 코딩하는 이종기원 핵산이 발현되어, 개체 내에서 상기 면역원에 대한 면역반응을 유도할 수 있다. 특정한 구체예에서, 세포는 항원-제시 세포(예를 들면, 수지상 세포)이다.
"능동 면역 반응(active immune response)" 또는 "능동 면역(active immunity)"은 면역원과의 대면(encounter) 후 숙주 조직 및 세포의 참여를 특징으로 한다. 이는 림프세망(lymphoreticular) 조직에서 면역적격(immunocompetent) 세포의 분화 및 증식을 포함하고, 이는 항체의 합성 또는 세포-매개 반응성의 생성, 또는 양자 모두를 가져온다. Herbert B. Herscowitz, Immunophysiology: Cell Function and Cellular Interactions in Antibody Formation, in IMMUNOLOGY: BASIC PRocESSES 117 (Joseph A. Bellanti ed., 1985). 달리 말하면, 능동 면역 반응은 감염 또는 백신 접종(vaccination)에 의해 면역원으로의 노출 후 숙주에 의해 개시된다. 능동 면역은 능동적으로 면역력을 갖게 된 숙주로부터 비-면역 숙주(non-immune host)로의 미리 형성된 물질(항체, 전달 인자(transfer factor), 흉선 이식편(thymic graft), 인터루킨-2)의 전달"을 통해 획득되는, 수동 면역(passive immunity)과 대조될 수 있다. Id.
본 명세서에서 사용된, "보호성(protective)" 면역 반응 또는 "보호성" 면역은 면역 반응이 질병의 발생을 예방하거나 또는 감소시킨다는 점에서 개체에게 일부 유익을 부여한다는 것을 나타낸다. 대안적으로, 보호성 면역 반응 또는 보호성 면역은 질병, 특히, 암 또는 종양의 치료 및/또는 예방에서 (예를 들면, 암 또는 종양 형성을 예방하는 것에 의해, 암 또는 종양의 퇴행(regression)을 유발하는 것에 의해, 및/또는 전이를 예방하는 것에 의해 및/또는 전이성 결절(metastatic nodule)의 성장을 예방하는 것에 의해) 유용할 수 있다. 치료의 유익이 그의 단점을 능가하는 한, 보호 효과는 완전하거나 또는 부분적일 수 있다.
특정 구체예에서, 이종기원 핵산을 포함하는 바이러스 벡터 또는 세포는 하기에 기재된 바와 같이, 면역원성 유효량(immunogenically effective amount)으로 투여될 수 있다.
본 개시의 바이러스 벡터는 또한 하나 이상의 암세포 항원(또는 면역학적으로 유사한 분자) 또는 암세포에 대한 면역 반응을 생성하는 기타 면역원을 발현하는 바이러스 벡터의 투여에 의한 암 면역요법을 위해 투여될 수 있다. 설명하자면, 예를 들어 암을 가진 환자를 치료하고 및/또는 개체에서 암이 발생하는 것을 예방하기 위해, 암세포 항원을 코딩하는 이종기원 핵산을 포함하는 바이러스 벡터를 투여하는 것에 의해 개체에서 암세포 항원에 대해 면역 반응이 생성될 수 있다. 바이러스 벡터는 본 명세서에서 기재된 바와 같이, 엑스 비보 방법을 이용하는 것에 의해, 또는 인 비보로 개체에게 투여될 수 있다. 대안적으로, 암 항원은 바이러스 캡시드의 일부로 발현될 수 있거나 또는 바이러스 캡시드(예를 들면, 전술된 바와 같은 바이러스 캡시드)와 달리 연관될 수 있다.
또 다른 대안으로서, 당해 기술 분야에서 공지된, 다른 치료 핵산(예를 들면, RNAi) 또는 폴리펩티드(예를 들면, 사이토카인)가 암을 치료 및/또는 예방하기 위해 투여될 수 있다.
본 명세서에서 사용된, 용어 "암(cancer)"은 종양-형성 암을 포함한다. 유사하게, 용어 "암 조직(cancerous tissue)"은 종양을 포함한다. "암세포 항원(cancer cell antigen)"은 종양 항원을 포함한다.
용어 "암"은 당해 기술 분야에서 그의 이해되는 의미를 갖고, 예를 들면, 신체의 원격(distant) 부위로 확산될(즉, 전이될) 가능성을 갖는 조직의 비조절성 성장을 의미한다. 대표적인 암은 흑색종, 선암종, 흉선종, 림프종(예를 들면, 비호지킨 림프종, 호지킨 림프종), 육종, 폐암, 간암, 결장암, 백혈병, 자궁암, 유방암, 전립선암, 난소암, 자궁경부암, 방광암, 신장암, 췌장암, 뇌암 및 현재 알려지거나 또는 이후에 확인되는 기타 암 또는 악성 질환을 포함하나, 이에 한정되지 않는다. 대표적 구체예에서, 본 개시는 종양-형성 암을 치료 및/또는 예방하는 방법을 제공한다.
용어 "종양"은 당해 기술 분야에서, 예를 들면, 다세포 개체 내에서 미분화 세포의 비정상적인 덩어리(mass)로 이해된다. 종양은 악성이거나 또는 양성일 수 있다. 대표적 구체예에서, 본 명세서에 개시된 방법은 악성 종양을 예방하고 치료하기 위해 이용된다.
용어 "암을 치료하는(treating cancer)", "암의 치료(treatment of cancer)" 및 그와 동등한 용어에 의해, 암의 중증도가 경감되거나 또는 적어도 부분적으로 제거되고, 및/또는 암의 진행이 둔화되고 및/또는 제어되고, 및/또는 암이 안정화된다는 것이 의도된다. 특정 구체예에서, 이러한 용어들은 암의 전이가 예방되거나 또는 감소되거나 또는 적어도 부분적으로 제거되고 및/또는 전이성 결절의 성장이 예방되거나 또는 감소되거나 또는 적어도 부분적으로 제거된다는 것을 나타낸다.
용어 "암의 예방(prevention of cancer)" 또는 "암을 예방하는(preventing cancer)" 및 그와 동등한 용어에 의해, 그 방법이 암의 발병의 발생률 및/또는 중증도를 적어도 부분적으로 제거 또는 감소시키고 및/또는 지연시킨다는 것이 의도된다. 달리 말하면, 개체에서 암의 발병이 가능성 또는 확률에 있어서 감소되고 및/또는 지연될 수 있다.
특정 구체예에서, 암을 가진 개체로부터 세포가 제거되고, 본 개시에 따라 암세포 항원을 발현하는 바이러스 벡터와 접촉될 수 있다. 그 후, 변형된 세포가 개체에게 투여되고, 그에 의해 암세포 항원에 대한 면역 반응이 유도된다. 이 방법은 인 비보로 충분한 면역 반응을 일으킬 수 없는(즉, 강화 항체(enhancing antiboty)를 충분한 양으로 생성할 수 없는) 면역약화(immunocompromised) 개체에 대해 유리하게 이용될 수 있다.
당해 기술 분야에서 면역 반응이 면역조절성(immunomodulatory) 사이토카인(예를 들면, α-인터페론, β-인터페론, γ-인터페론, ω-인터페론, τ-인터페론, 인터루킨-1α, 인터루킨-1β, 인터루킨-2, 인터루킨-3, 인터루킨-4, 인터루킨 5, 인터루킨-6, 인터루킨-7, 인터루킨-8, 인터루킨-9, 인터루킨-10, 인터루킨-11, 인터루킨 12, 인터루킨-13, 인터루킨-14, 인터루킨-18, B 세포 성장 인자, CD40 리간드, TNF(tumor necrosis factor)-α, TNF-β, MCP(monocyte chemoattractant protein)-1, GM-CSF(granulocyte-macrophage colony stimulating factor), 및 림프독소(lymphotoxin))에 의해 강화될 수 있다는 것이 알려져 있다. 따라서, 면역조절성 사이토카인(바람직하게는, CTL 유도성 사이토카인)이 바이러스 벡터와 함께 개체에 투여될 수 있다.
사이토카인은 당해 기술 분야에서 공지된 방법에 의해 투여될 수 있다. 외생 사이토카인이 개체에게 투여될 수 있거나, 또는 대안적으로 사이토카인을 코딩하는 핵산이 적합한 벡터를 이용하여 개체에게 전달될 수 있고, 사이토카인이 인 비보로 생성될 수 있다.
대상(subject), 약제학적 제형, 및 투여 방식
본 개시에 따른 바이러스 벡터 및 캡시드는 수의학 및 의학적 응용 모두에서 용도를 찾는다. 적합한 대상은 조류 및 포유동물을 모두 포함한다. 본 명세서에서 사용된 용어, "조류(avian)"는 닭, 오리, 거위, 메추라기, 칠면조, 꿩, 앵무새, 소형 앵무새(parakeet), 등을 포함하나, 이에 한정되지 않는다. 본 명세서에서 사용된 용어 "포유동물(mammal)"은 인간, 비-인간 영장류(non-human primate), 소, 양, 염소, 말, 고양이, 개, 토끼, 등을 포함하나, 이에 한정되지 않는다. 인간 개체는 신생아, 어린이, 청소년, 성인, 및 노인 개체를 포함한다.
대표적 구체예에서, 개체는 본 개시의 방법을 "필요로 하는(in need of)" 개체이다.
특정한 구체예에서, 본 개시는 약제학적으로 허용가능한 담체 중 본 개시의 바이러스 벡터 및/또는 캡시드, 및 선택적으로, 기타 의약 작용제(medicinal agent), 약제 작용제(pharmaceutical agent), 안정화제, 완충제, 담체, 아쥬반트(adjuvant), 희석제 등을 포함하는 약제학적 조성물을 제공한다. 주사를 위해, 담체는 통상적으로 액체일 것이다. 기타 투여 방법의 경우, 담체는 고체 또는 액체일 수 있다. 흡입 투여의 경우, 담체는 호흡가능할 것이고(respirable), 및 선택적으로, 고체 또는 액체 입자 형태(particulate form)일 수 있다.
"약제학적으로 허용가능한(pharmaceutically acceptable)"은 독성이거나 달리 바람직하지 않은 것이 아닌 물질이라는 것, 즉, 그 물질이 원치 않는 생물학적 효과를 유발하지 않으면서 개체에 투여될 수 있다는 것을 의미한다.
본 개시의 일 양태는 인 비트로에서 세포에 핵산을 전달하는 방법이다. 바이러스 벡터가, 특정한 표적 세포를 위해 적합한 표준 형질도입 방법에 따라, 적절한 감염 다중도(multiplicity of infection)에서 세포 내로 도입될 수 있다. 투여될 바이러스 벡터의 역가는, 표적 세포 종류 및 개수 및 특정 바이러스 벡터에 따라 변할 수 있고, 과도한 실험 없이, 당업자에 의해 결정될 수 있다. 대표적인 구체예에서, 약 103 이상의 감염 유닛(infectious unit), 선택적으로 약 105 이상의 감염 유닛이 세포 내로 도입된다.
바이러스 벡터가 도입될 세포는 신경 세포(말초 신경계 및 중추 신경계의 세포, 특히, 뉴런 및 희소돌기신경교세포(oligodendricyte)외 같은 뇌세포 포함), 폐 세포, 눈 세포(망막 세포, 망막 색소 상피, 및 각막 세포 포함), 상피 세포(예를 들면, 장 및 호흡 상피 세포(gut and respiratory epithelial cell)), 근육 세포(예를 들면, 골격 근육 세포, 심장 근육 세포, 평활근 세포 및/또는 횡격막 근육 세포), 수지상 세포, 췌장 세포(췌도 세포(islet cell) 포함), 간세포, 심근 세포, 골 세포(예를 들면, 골수 줄기 세포), 조혈 줄기 세포, 비장 세포, 각질 세포, 섬유모세포, 내피 세포, 전립선 세포, 생식 세포(germ cell), 등을 포함하나, 이에 한정되지 않는 임의의 종류일 수 있다. 대표적 구체예에서, 세포는 전구 세포(progenitor cell)일 수 있다. 추가적 가능성으로서, 세포는 줄기 세포(예를 들면, 신경 줄기 세포, 간 줄기 세포)일 수 있다. 또 다른 대안으로서, 세포는 암 세포 또는 종양 세포일 수 있다. 또한, 세포는 전술된 바와 같이, 임의의 기원(origin)의 종으로부터 유래될 수 있다.
개체에 변형된 세포를 투여하기 위한 목적으로, 인 비트로에서 세포 내로 바이러스 벡터가 도입될 수 있다. 특정한 구체예에서, 세포가 개체로부터 제거되고, 바이러스 벡터가 그 내부에 도입되고, 그 후, 세포가 다시 개체 내로 투여된다. 엑스 비보 조작을 위해 개체로부터 세포를 제거하고, 뒤이어 개체 내로 다시 도입하는 방법이 당해 분야에서 공지되어 있다(예를 들면, 미국특허 제5,399,346호 참조). 대안적으로, 재조합 바이러스 벡터가 공여체로부터의 세포, 배양된 세포, 또는 기타 적합한 출처로부터의 세포 내로 도입될 수 있고, 세포가 필요로 하는 개체(즉, "수용(recipient)" 개체)에 투여된다.
엑스 비보 핵산 전달을 위해 적합한 세포는 전술된 바와 같다. 개체에 투여할 세포의 용량(dosage)은 개체의 연령, 상태, 및 종, 세포 종류, 세포에 의해 발현되는 핵산, 투여 방식, 등에 따라 다를 것이다. 통상적으로 약 102 내지 약 108 개 이상의 세포 또는 약 103 내지 약 106 개 이상의 세포가 약제학적으로 허용가능한 담체 중 용량 당 투여될 것이다. 특정한 구체예에서, 바이러스 벡터에 의해 형질도입된 세포는 약제학적으로 허용가능한 담체와 함께, 치료 유효량 또는 예방 유효량(treatment effective or prevention effective amount)으로 개체에게 투여된다.
일부 구체예에서, 바이러스 벡터가 세포 내로 도입되고, 세포가 (예를 들면, 형질전환 유전자(transgene)로 발현되거나 또는 캡시드 내에 있는) 전달된 폴리펩티드에 대한 면역 반응을 유도하기 위해 개체에 투여될 수 있다. 통상적으로, 약제학적으로 허용가능한 담체와 함께 면역 유효량의 폴리펩티드를 발현하는 충분한 양의 세포가 투여된다. "면역 유효량(immunogenically effective amount)"은 약제학적 제형이 투여되는 개체에서 발현된 폴리펩티드에 대한 능동 면역 반응을 유발하기에 충분한 폴리펩티드의 양이다. 특정 구체예에서, 용량(dosage)은 (앞서 정의된 바와 같은) 보호성 면역 반응을 생성하기에 충분하다. 부여된 보호의 정도는 면역원성 폴리펩티드 투여의 유익이 그이 단점을 능가하는 한, 완전하거나 영구적일 필요는 없다.
본 개시의 추가적 양태는 개체에게 바이러스 벡터 및/또는 바이러스 캡시드를 투여하는 방법이다. 본 개시에 따른 바이러스 벡터 및/또는 캡시드를 이를 필요로 하는 인간 개체 또는 동물에게 투여하는 것은 당해 분야에서 공지된 수단에 의해 이루어질 수 있다. 선택적으로, 바이러스 벡터 및/또는 캡시드는 약제학적으로 허용가능한 담체 중 치료 유효량 또는 예방 유효량으로 전달된다.
본 개시의 바이러스 벡터 및/또는 캡시드는 또한 (예를 들면, 백신으로서) 면역원성 반응을 유발하기 위해 투여될 수 있다. 통상적으로, 본 개시의 면역원성 조성물은 약제학적으로 허용가능한 담체와 조합된 바이러스 벡터 및/또는 캡시드의 면역원성 유효량(immunogenically effective amount)을 포함한다. 선택적으로, 용량(dosage)은 (앞서 정의된 바와 같은) 보호성 면역 반응을 생성하기에 충분하다. 부여된 보호의 정도는 면역원성 폴리펩티드 투여의 유익이 그의 단점보다 더 큰 한, 완전하거나 또는 영구적이지 않아도 된다. 개체 및 면역원(immunogen)은 전술된 바와 같다.
개체에게 투여되는 바이러스 벡터 및/또는 캡시드의 용량은 투여 방식, 치료 및/또는 예방 대상 질환 또는 질병, 개별 개체의 상태, 특정 바이러스 벡터 또는 캡시드, 및 전달 대상 핵산, 등에 의존적이고, 일반적인(routine) 방식으로 결정될 수 있다. 치료 효과를 달성하기 위한 예시적 용량은 적어도 약 105, 106, 107, 108, 109, 1010, 1011, 1012, 1013, 1014, 1015 형질도입 유닛(transducing unit)의 역가(titer), 선택적으로 약 108 - 1013 형질도입 유닛의 역가이다.
특정 구체예에서, 2회 이상의(more than one) 투여(예를 들면, 2회, 3회, 4회, 또는 그 이상의 투여)가 다양한 간격의 기간에 걸쳐, 예를 들면, 1일, 1주, 1개월, 1년 등에 걸쳐 원하는 수준의 유전자 발현을 달성하기 위해 채택될 수 있다.
예시적 투여 방식은 경구 투여, 직장 투여, 경점막 투여, 비강내 투여, 흡입(예를 들면, 에어로졸을 통한 흡입), 구강(buccal) 투여 (예를 들면, 설하(sublingual)), 질(vaginal) 투여, 척수내(intrathecal) 투여, 안내(intraocular) 투여, 경피(transdermal) 투여, 자궁내(in utero)(또는 난내(in ovo)) 투여, 비경구(예를 들면, 정맥내, 피하, 피내, 근육내, 흉막강내(intrapleural), 뇌내(intracerebral), 및 관절내(intraarticular)) 투여, 국소(topical)(예를 들면, 기도 표면을 포함한 피부 및 점막 표면으로의 투여, 및 경피 투여), 림프관내(intralymphatic) 투여, 등, 및 직접적인 조직 또는 기관 투여(예를 들면, 간, 골격 근육, 심장 근육, 횡격막 근육, 또는 뇌)를 포함한다. 일부 구체예에서, 근육내 투여는 골격 근육, 횡격막 근육, 및/또는 심장 근육으로의 투여를 포함한다. 투여는 또한 종양으로(예를 들면, 종양 또는 림프절 내 또는 근처에) 이루어질 수 있다. 주어진 경우에서 가장 적합한 경로는 치료 및/또는 예방 대상 질병의 속성 및 중증도 및 사용되는 특정 벡터의 속성에 의존적일 것이다.
표적 조직으로의 전달은 또한 바이러스 벡터 및/또는 캡시드를 포함하는 데포(depot)에 전달하는 것에 의해 달성될 수 있다. 대표적 구체예에서, 바이러스 벡터 및/또는 캡시드를 포함하는 데포가 골격 근육, 심장 근육, 및/또는 횡격막 근육 조직 내에 이식되거나, 또는 조직이 바이러스 벡터 및/또는 캡시드를 포함하는 필름 또는 기타 매트릭스와 접촉될 수 있다. 그러한 이식성(implantable) 매트릭스 또는 물질이 미국특허 제7,201,898호에 기재된다.
특정 구체예에서, 본 개시에 따른 바이러스 벡터 및/또는 바이러스 캡시드가 (예를 들면, 근 이영양증(muscular dystrophy), 심장 질환을 치료 및/또는 예방하기 위해) 골격 근육, 횡격막 근육 및/또는 심장 근육에 투여된다. 일부 구체예에서, 본 개시에 따른 바이러스 벡터 및/또는 바이러스 캡시드가 PAD 또는 울혈성 심부전을 치료하기 위해 투여된다.
본 개시의 방법은 또한 전신 전달을 위한 안티센스 RNA, RNAi 또한 기타 기능성(functional) RNA (예를 들면, 리보자임)를 생성하기 위해 실행될 수 있다.
주사제(injectables)는 통상적 형태, 액체 용액, 또는 현탁액, 주사 전에 액체에 용해 또는 현탁시키기에 적합한 고체 형태, 또는 에멀젼으로 제조될 수 있다. 대안적으로, 본 개시의 바이러스 벡터 및/또는 바이러스 캡시드를 전신 방식보다는 국소 방식으로, 예를 들면, 데포 또는 지속-방출 제형(sustained-release formulation)으로 투여할 수 있다. 또한, 바이러스 벡터 및/또는 바이러스 캡시드는 (예를 들면, 미국특허출원 공개 US-2004-0013645-A1에 기재된 바와 같이) 수술에 의해 이식가능한 매트릭스(surgically implantable matrix)에 전달되어 부착될 수 있다.
바이러스 벡터 및 바이러스 캡시드는 CNS의 조직(예를 들면, 뇌, 눈)에 투여될 수 있고, 유리하게, 본 개시의 부재시 관찰될 수 있는 것보다 더 광범위한 바이러스 벡터 또는 캡시드의 분포를 가져올 수 있다.
특정 구체예에서, 본 개시의 전달 벡터는 유전 질환, 신경퇴행성 질환, 정신 질환 및 종양을 포함한, CNS의 질환을 치료하기 위해 투여될 수 있다.
CNS의 예시적 질환은 알쯔하이머 병, 파킨슨 병, 헌팅턴 병, 카나반 병(Canavan disease), 라이 병(Leigh's disease), 레프숨 병(Refsum disease), 투렛 증후군(Tourette syndrome), 원발성 측삭 경화증(primary lateral sclerosis), 근위축성 측삭 경화증(amyotrophic lateral sclerosis: ALS), 진행성 근 위축증(progressive muscular atrophy), 피크 병(Pick's disease), 근 위축증, 다발성 경화증, 중증 근무력증(myasthenia gravis), 빈스완거 병(Binswanger's disease), 척수 및/또는 두부 손상에 의한 외상(trauma due to spinal cord and/or head injury)(예를 들면, 외상성 뇌 손상), 태이 삭스 병(Tay Sachs disease), 레쉬-니안 병(Lesch-Nyan disease), 뇌전증(epilepsy), 뇌졸중, 뇌경색, 기분 장애(예를 들면, 우울증, 양극성 정동 장애(bipolar affective disorder), 지속성 정동 장애(persistent affective disorder), 2차 기분 장애(secondary mood disorder))를 포함한 정신 질환(psychiatric disorder), 조현병(schizophrenia), 약물 의존(drug dependency)(예를 들면, 알코올 중독(alcoholism) 및 기타 물질 의존), 신경증(neuroses)(예를 들면, 불안증, 강박 장애(obsessional disorder), 신체형 장애(somatoform disorder), 해리 장애(dissociative disorder), 비탄(grief), 산후 우울증), 정신병(psychosis)(예를 들면, 환각 및 망상), 치매, 편집증, 주의력 결핍 장애(attention deficit disorder), 정신 성적 장애(psychosexual disorder), 축색/신경(axonal/neuronal) 재생 및/또는 복구로부터 유익을 얻거나 또는 이를 요구하는 신경퇴행성 질환, 인지 장애, 행동 장애, 수면 장애, 통증 장애, 섭식 또는 체중 장애(예를 들면, 비만, 악액질(cachexia), 신경성 식욕부진증(anorexia nervosa), 및 신경성 폭식증) 및 CNS의 암 및 종양(예를 들면, 뇌하수체 종양)을 포함하나 이에 한정되지 않는다.
CNS의 질환은 망막, 후관(posterior tract), 및 시신경에 관련된 안과 질환(예를 들면, 색소성 망막염, 당뇨 망막병증 및 기타 망막 변성 질환, 포도막염, 노인성 황반변성, 녹내장)을 포함한다.
모두는 아니나, 대부분의 안구 질환 및 질병은 적응증의 3가지 종류 중 하나 이상과 연관된다: (1) 혈관형성, (2) 염증, 및 (3) 변성(degeneration). 본 개시의 전달 벡터는 항-혈관형성 인자; 항-염증성 인자; 세포 변성을 지연시키거나, 세포 보존(cell sparing)을 촉진하거나, 세포 성장을 촉진하는 인자들 및 이들의 조합을 전달하기 위해 이용될 수 있다.
예를 들면, 당뇨 망막병증은 혈관형성을 특징으로 한다. 당뇨 망막병증은 하나 이상의 항-혈관형성 인자를 안구내로(예를 들면, 유리체에) 또는 안구 주위로(periocularly) (예를 들면, 테논낭하(sub-Tenon's region)에) 투여하는 것에 의해 치료될 수 있다. 하나 이상의 신경친화성 인자가 또한 안구 내로(예를 들면, 유리체 내로) 또는 안구 주위로 병용-전달될 수 있다.
포도막염(Uveitis)은 염증을 포함한다. 하나 이상의 항-염증성 인자가 본 개시의 전달 벡터의 안구내(예를 들면, 유리체방(vitreous chamber) 또는 전방(anterior chamber)) 투여에 의해 투여될 수 있다.
망막색소변성증(Retinitis pigmentosa)은 그에 비해, 망막 변성을 특징으로 한다. 대표적 구체예에서, 망막색소변성증은 하나 이상의 신경친화성 인자를 코딩하는 전달 벡터의 안구내 투여(예를 들면, 유리체 투여)에 의해 전달될 수 있다.
연령-관련 황반 변성(age-related macular degeneration)은 혈관형성 및 망막변성을 포함한다. 이 질환은 하나 이상의 신경친화성 인자를 코딩하는 본 발명의 전달 벡터를 안구내로(예를 들면, 유리체) 및/또는 하나 이상의 항-혈관형성 인자를 코딩하는 본 발명의 전달 벡터를 안구내로 또는 안구 주위로(예를 들면, 테논낭하에) 투여하는 것에 의해 치료될 수 있다.
녹내장은 상승된 안압 및 망막 신경절 세포의 상실을 특징으로 한다. 녹내장의 치료는 본 발명의 전달 벡터(inventive delivery vector)를 이용한, 세포를 흥분독성(excitotoxic) 손상으로부터 보호하는 하나 이상의 신경보호제의 투여를 포함한다. 그러한 작용제는 안내로, 선택적으로 유리체내로(intravitreally) 전달되는, N-메틸-D-아스파테이트(NMDA) 길항제, 사이토카인 및 신경친화성 인자를 포함한다.
다른 구체예에서, 본 개시는 발작을 치료하기 위해, 예를 들면, 발작의 발병, 발병률, 또는 중증도를 감소시키기 위해 이용될 수 있다. 발작의 치유적 치료의 효능은 행동(예를 들면, 떨림, 눈 또는 입의 틱(tick)) 및/또는 전위기록(electrographic) 수단(대부분의 발작은 특징적인 EG 이상(signature electrographic abnormalities)을 가짐)에 의해 평가될 수 있다. 따라서, 본 개시는 또한 시간의 경과에 따라 다발성 발작에 의해 구분되는, 뇌전증을 치료하기 위해 이용될 수 있다.
하나의 대표적 구체예에서, 소마토스타틴(somatostatin)(또는 그의 활성 단편)은 뇌하수체 종양을 치료하기 위해 본 개시의 전달 벡터를 이용하여 뇌에 투여된다. 이 구체예에 따라, 소마토스타틴(또는 그의 활성 절편)을 코딩하는 전달 벡터가 뇌하수체로의 미세주입(microinfusion)에 의해 투여된다. 마찬가지로, 그러한 치료는 말단 거대증(뇌하수체로부터의 성장 호르몬 분비 이상)을 치료하기 위해 이용될 수 있다. 소마토스타틴의 핵산 (예를 들면, GenBank Accession No. J00306) 및 아미노산 (예를 들면, GenBank Accession No. P01166; 가공된 활성 펩티드인 소마토스타틴-28 및 소마토스타틴-14를 포함함) 서열이 당해 기술 분야에서 알려져 있다.
특정 구체예에서, 벡터는 미국 특허 제7,071,172호에 기재된 분비 신호(secretory signal)를 포함할 수 있다.
본 개시의 대표적 구체예에서, 바이러스 벡터 및/또는 바이러스 캡시드는 CNS에 (예를 들면, 뇌 또는 눈에) 투여된다. 바이러스 벡터 및/또는 바이러스 캡시드는 척수, 뇌간(연수, 교뇌), 중뇌(midbrain)(시상하부, 시상, 시상상부, 뇌하수체, 흑질, 송과선), 소뇌, 종뇌(선조체, 후두엽, 측두엽, 두정엽, 및 전두엽을 포함하는 대뇌, 대뇌 피질, 대뇌 기저핵, 해마, 및 편도체(portaamygdala)), 변연계(limbic system), 신피질(neocortex), 선조체, 대뇌, 및 하구(inferior colliculus) 내로 도입될 수 있다. 바이러스 벡터 및/또는 캡시드는 또한 눈의 상이한 영역, 예를 들면, 망막, 각막 및/또는 시신경으로 투여될 수 있다.
바이러스 벡터 및/또는 캡시드는 전달 벡터의 보다 분산된(disperse) 투여를 위해 (예를 들면, 요추 천자에 의해) 뇌척수액 내로 전달될 수 있다. 바이러스 벡터 및/또는 캡시드는 또한 혈뇌 장벽이 교란된 상황(예를 들면, 뇌종양 또는 뇌경색)에서 CNS에 혈관 내로 투여될 수 있다.
바이러스 벡터 및/또는 캡시드는 뇌실내, 수조내, 뇌실질내, 두개내, 척수내, 안구내(intra-ocular), 대뇌내, 심실내(intraventricular), 정맥내(예를 들면, 만니톨과 같은 당의 존재 하에), 비강내, 이내(intra-aural), 안구-내(예를 들면, 유리체-내(intra-vitreous), 망막하(sub-retinal), 전방(anterior chamber)) 및 안구-주위(peri-ocular)(예를 들면, 안각건하 영역(sub-Tenon's region)) 전달 및 운동 뉴런으로의 역행 전달(retrograde delivery)을 동반한 근육내 전달을 포함하나, 이에 한정되지 않는, 당업계에 공지된 경로에 의해 CNS의 원하는 영역으로 투여될 수 있다.
특정 구체예에서, 바이러스 벡터 및/또는 캡시드는 CNS 중 원하는 영역 또는 구획(compartment)에 직접 주사(예를 들면, 정위(stereotactic) 주사)에 의해 액체 제형으로 투여된다. 다른 구체예에서, 바이러스 벡터 및/또는 캡시드는 원하는 영역으로의 국소 적용에 의해, 또는 에어로졸 제형의 비강내 투여에 의해 제공될 수 있다. 눈으로의 투여는 액적(liquid droplet)의 국소 적용에 의해 이루어질 수 있다. 또 다른 대안으로, 바이러스 벡터 및/또는 캡시드는 고체, 서방형 제형(solid, slow-release formulation)으로 투여될 수 있다(예를 들면, 미국특허 제7,201,898호 참조).
추가적인 구체예에서, 바이러스 벡터는 운동 뉴런과 관련된 질병 및 질환(예를 들면, 근위축성 측색 경화증(ALS); 척수성 근육 위축증(SMA), 등)을 치료 및/또는 예방하기 위한 역행 수송(retrograde transport)을 위해 이용될 수 있다. 예를 들면, 바이러스 벡터는 근육 조직에 전달될 수 있고, 그로부터 뉴런으로 이동할 수 있다.
하기의 실시예는 예시의 목적으로만 본 명세서에 포함되고, 한정하는 것으로 의도되지 않는다.
도 1. 대뇌피질 뉴런 형질도입(cortical neuron transduction)의 정량. 6-8주령 암컷 BL6 마우스에 5 x 1011 vg (vector genomes) 용량으로 of vectors packaging CBh-scGFP (AAV1, AAV1R6 또는 AAV1R7)를 패키징하는 벡터 또는 음성 대조군으로 PBS를 꼬리 정맥(tail vein) 주사를 통해 전신으로 투여했다. 주사 후 21일 차에 마우스를 희생시키고, 조직을 회수하고, 고정시키고, 절편화시켰다(section). 조직을 DAB 기질을 이용하여 GFP에 대해 면역염색시키고, 슬라이드 스캐닝 및 ImageScope 소프트웨어를 통해 GFP 발현을 가시화시켰다. 대뇌 피질 중 GFP 양성 뉴런을 수동으로 계수하고, 정량하고, 마우스 당 복수의 뇌 절편에 대해 평균을 냈다. AAV1에 대한 n= 2; AAV1R6 및 AAV1R7에 대한 n=3.
도 2. 뇌 혈관계 통과 및 뉴런 발현(crossing the brain vasculature and neuronal expression). Cbh-scGFP 형질전환 유전자(transgene)를 패키징한 AAV 벡터를 5 x 1011 vg의 용량으로 꼬리 정맥 투여를 통해 C57/Bl6 마우스에 투여했다. 주사 후 21일 차에 마우스를 희생시키고, 조직을 회수하고, 고정시키고, 절편화시키고, GFP를 검출하기 위해 DAB-염색하고, Aperio Scanner를 통해 이미징하고, ImageScope 소프트웨어를 이용하여 이미지 처리(image processing)를 수행했다. 약어: 피질(Cortex) (CTX), 운동 피질(motor cortex) (MCT), 선조체(striatum) (STR), 해마(hippocampus) (HC), 치상회(dentate gyrus) (DG). N=3.
도 3. 간 탈표적화(liver detargeting). CBA-루시퍼라아제 형질전환 유전자를 패키징하는 AAV 벡터를 1 x 1011 vg의 용량으로 꼬리 정맥 주사를 통해 C57/B16 마우스에 투여했다. 주사 후 14일 차에 마우스를 희생시키고, 조직을 회수하고, 잘게 절단하고(chop), 용해시키고, 뇌, 심장, 간, 및 척수 조직에 대해 상대적 형질도입 수준을 검출하기 위해 루시퍼라아제 분석을 수행했다. 데이터를 그램 조직 당 RLU(relative light units per gram tissue)로 정규화시켰다. N=3.
도 4A-C. AAV1/rh.10 도메인 스왑 캡시드 라이브러리(AAV1/rh.10 domain swap capsid library)의 계통발생 및 구조 분석. 도 4A. 셔플링(shuffling)을 통해 수득된 도메인 스왑의 아미노산 수준에서의 서열 다양성을 보여주는, 라이브러리로부터 단리된 대표적 AAV1/rh.10 키메라 캡시드의 패널의 도식(schematic). 개별적인 모 캡시드 또는 키메라 캡시드가 세로로 열거되고, 상이한 도메인 스왑을 가진 VPI 캡시드 서열이 좌측 N-말단부터 우측 C-말단까지 가로로 표시된다. AAV1-유래 잔기가 회색으로 표시되고, AAVrh.10 잔기는 녹청(green-cyan)으로 표시되며, 둘 간의 보존 잔기(consensus residue)는 흑색으로 표시된다. 도 4B. AAV1/rh.10 키메라 캡시드의 VP1 캡시드 서열의 근접-결합(Neighbor-joining) 계통발생. 캡시드 아미노산 서열을 ClustalW를 이용하여 정렬시키고 근접-결합 알고리즘을 이용하여 계통발생을 생성시켰다. Poisson 보정(correction)을 이용하여 부위당 아미노산 치환의 갯수의 단위로 표현된, 아미노산 거리(amino acid distance)를 산출했다. 계통수(tree)를 정확한 축척으로 작성하고(drawn to scale), 가지 길이는 계통수를 추정하기 위해 이용된 진화적 거리(evolutionary distance)의 단위와 동일한 단위로 표현된다. 1000개의 재현물(replicate) 및 클러스터링된 연관된 분류군(taxa)이 가지 옆에 표시된 재현 트리(replicate tree)의 백분율을 이용하여 부트스트랩(bootstrap) 값을 계산했다. 도 4C. 인 비보 스크리닝을 위해 선택된 모 AAV 캡시드 및 대표적 키메라 AAV 캡시드 돌연변이체의 캡시드 서브유닛 삼량체/3-겹 대칭축(3-fold symmetry of axis) 영역의 3차원 표면 모델. AAV1로부터 유래된 아미노산 잔기는 회색으로 표시되고, AAVrh.10으로부터 유래된 잔기는 녹-청으로 표시된다. PyMol을 이용하여 구조적 모델을 시각화시키고 생성했다.
도 5. 인 비보 스크린(in vivo screen)은 정맥내 투여 후 혈뇌 장벽을 통과할 수 있는 AAV1/rh.10 키메라를 가져온다. 5 x 1011 vg 용량 (또는 모의 처리(mock treatment)의 경우 PBS)의 꼬리 정맥 주사를 통한 투여 후 3주차에 CBh-scGFP 형질전환 유전자를 패키징하는 모 또는 키메라 벡터에 의해 매개된 대뇌 피질에서의 GFP 발현을 보여주는 면역염색된 뇌 절편의 스캔. 전체 관상 뇌 절편(global coronal brain section) (상부)은 개별적인 형질도입 프로파일을 보여주는, 각각의 모 또는 키메라 벡터에 대해 표시된 삽도(inset)에 표시된 상자내 영역(boxed region)을 나타낸다. 스케일 바(scale bar) = 100㎛.
도. 6A- G. 정맥내 투여 후 혈뇌 장벽을 통과하고 다양한 뇌 영역에 형질도입할 수 있는 능력에 대한 AAV1/rh.10 키메라의 인 비보 스크린. 마우스에 꼬리 정맥 주사를 통해 5 x 1011 vg 용량의 CBh-scGFP 형질전환 유전자를 패키징하는 모(AAV1 또는 AAVrh.10) 또는 키메라 벡터를 투여했다. 주사 후 21일차에 면역염색 및 이미징된 마우스 뇌 절편은 흑색/짙은 갈색 염색(black/dark brown staining)으로 GFP 발현을 보여준다. 스케일 바 = 100 ㎛. 도면의 상부에 있는 전체 관상 뇌 절편은 삽도에 표시된 다양한 뇌 영역을 나타낸다: MCT, 운동 피질(motor cortex) (도 6A); HC, 해마(hippocampus) (도 6B); DG, 치상회(dentate gyrus) (도 6C); TH, 시상(thalamus) (도 6D); HY, 시상하부(hypothalamus) (도 6E); STR, 선조체(striatum) (도 6F); Amg, 편도체(amygdala) (도 6G). 각각에 대해 n = 3.
도 7A-H. 뇌에서 모 AAV1 및 AAVrh.10 대비 AAV1R6 및 AAV1R7의 CNS 형질도입 프로파일. 운동 피질 (도 7A), 대뇌 (체감각) 피질(도 7B), 해마 (도 7C), 치상회 (도 7D), 시상 (도 7E), 시상하부 (도 7F), 선조체 (도 7G), 및 편도체 (도 7H)를 포함한, 다양한 뇌 영역에 대한 모 혈청형, AAV1 및 AAVrh.10 (좌측 컬럼), 및 AAV1R6 및 AAV1R7 (우측 컬럼)의 5 x 1011 vg 용량의 Bh-scGFP 형질전환 유전자를 패키징하는 AAV 벡터의 꼬리 정맥 주사 후 3주차 형질도입 프로파일이 도시된다. 스케일 바 = 100 ㎛
도. 8A- H. 모 및 키메라 캡시드 변이체에 대한 뉴론 및 신경교 형질도입 수준의 정량적 비교. 5x 1011 vg의 용량으로 꼬리 정맥 주사를 통한 CBh-scGFP 형질전환 유전자를 패키징하는 벡터의 투여 3주차 상대적 뉴런 형질도입 수준을 50 ㎛ 관상 절편(coronal section) 당 각 뇌 영역에 대해, 형태에 근거하여 확인된 형질도입된 뉴런 및 신경교의 갯수를 계수하는 것에 의해 정량했다. 운동 피질 (도 8A), 대뇌 (체감각) 피질(도 8B), 해마 (도 8C), 치상회 (도 8D), 시상 (도 8E), 시상하부 (도 8F), 선조체 (도 8G), 및 편도체 (도 8H)를 포함한, 뇌의 다양한 영역에 대한, 모 혈청형 AAV1 및 AAVrh.10의 형질도입이 키메라 AAV1R6 및 AAV1R7와 함께 표시된다. 에러 바(Error bar)는 표준 편차를 나타낸다 (n > 또는 = 3). AAV1 대비 각 그룹에 의한 뉴런 및 신경교 형질도입에 대한 통계적 유의성 및 평균간 차이가 각각 통계적으로 유의하다는 것을 입증하기 위해 Welch 보정(correction)을 포함한 독립 양측 T 검정(unpaired two-tailed T test) 및 일원 ANOVA를 이용했다. ns, 유의성 없음(not significant); *, P < 0.05.
도 9A- F. AAV1R6 키메라 캡시드 변이체의 구조 분석. (도 9A) AAV1R6과 AAV1 & AAVrh.10의 서열 정렬은 AAVrh.10으로부터 독특하게 유래된 아미노산 잔기(AAV1R6 번호부여)를 강조한다(흑색 글자로 표시되고, 청색으로 강조됨). 보존된 잔기는 적색으로 기재되고 황색으로 강조되며, AAV1에서 비-보존된 해당 잔기(non-conserved equivalent residue)는 흑색 또는 녹색 텍스트로 표시되고, 녹색 또는 백색으로 강조된다. AAV8의 결정 구조가 상동성 모델링(homology modeling)을 위한 주형으로 작용한 SWISS-MODEL을 이용하여(PDB ID: 2QAO) 키메라 AAV1R6 VP3 서브유닛 (도 9B) 단량체의 삼차원 구조 모델을 생성했다. VIPERdb 올리고머 생성기(oligomer generator)를 통해 AAV1R6 VP3 서브유닛(도 9C) 삼량체 이량체/2-겹 대칭축, (도 9D) 삼량체/3-겹 대칭축, (도 9E) 오량체/5-겹 대칭축의 표면 모델(surface model) 및 (도 9F) 온전한 AAV1R6 캡시드(60량체)의 표면 렌더링(surface rendering)를 생성하고 PyMol을 이용하여 시각화시켰다. AAV1로부터 유래된 잔기는 회색으로 표시되고, AAVrh.10로부터 유래되고, 3-겹 대칭축에서 돌출부(protrusion), 2-겹 대칭축에서 함몰부(depression)의 기부, 및 5-겹 포어(5-fold pore)에 클러스터링된 잔기는 녹청으로 표시된다.
도 10A- B. 모 캡시드 대비 AAV1R6 및 AAV1R7에 의한 심장 및 간의 상대적 형질도입. CBh-scGFP 형질전환 유전자를 패키징하는 모(AAV1 또는 AAVrh.10) 또는 키메라(AAV1R6 또는 AAV1R7) 벡터를 꼬리 정맥 주사를 통해 5 x 1011 vg의 용량으로 투여했다. 주사 후 21일차에, 심장 및 간 절편을 GFP에 대해 면역염색하고, 이미징했다. 도 10A. PBS (모의(Mock)), AAV1, AAVrh.10, AAV1R6 또는 AAV1R7로 처리된 마우스의 심장(상부 패널) 및 간(하부 패널) 조직에 대한 GFP 형광. 도 10B. 각 처리에 대해 취해진 복수 이미지에 대한 상대적 형광을 정량화하는 것에 의해 측정된 심장(상부) 및 간(하부)에 대한 형질도입 수준. 바(bar)는 최소값부터 최대값까지의 범위를 나타내고, 중심선은 샘플들에 대한 평균을 나타낸다. 상대적 형광을 모의 처리 조직(mock treated tissue)으로 정규화시켰다. 에러 바(Error bar)는 표준 편차를 나타낸다 (n = 3). 각 그룹에 대한 Welch 보정을 포함한 독립 양측 T-검정 및 일원 ANOVA를 수행하고, AAVrh.10 대비 유의성이 표시된다. ns, 유의성 없음. *, P < 0.05.
도 11A- H. BBB 통과에 대한 최소(minimal) AAVrh.10 족문(footprint)의 합리적 설계 및 기능적 맵핑. 도 11A. AAV1RX와 AAV1 및 AAVrh.10의 서열 정렬은 신경친화성 족문(neurotropic footprint) 내 및 그에 인접한 번호부여된 아미노산을 보여준다. 보존된 잔기는 황색으로 강조되고, 족문을 구성하는 잔기는 청록색으로 강조되며, 비-보존 잔기는 녹색 또는 백색으로 강조된다. 조작된(engineered) AAV1RX 키메라 캡시드의 구조 모델을 상동성-기반 모델링을 위한 SWISS-MODEL 소프트웨어를 이용하여 생성하고 올리고머를 생성하기 위해 VIPERdb를 이용했다. AAV1RX VP3 서브유닛 단량체(도 11B), 삼량체 이량체/2-겹 대칭축(도 11C), 삼량체/3-겹 대칭축(도 11D), 오량체/5-겹 대칭축(도 11E) 및 완전한 캡시드(60-mer) (도 11F)의 표면 렌더링 모델(surface rendered model)을 생성하기 위해 PyMol을 이용했다. AAV1-유래 아미노산 및 AAV1과 AAVrh.10 간에 상동성인 아미노산을 회색으로 나타내고, BBB 통과를 위한 AAVrh.10으로부터의 신경친화성 족문을 구성하는 잔기를 녹청으로 표시한다. 도 11G. 입체화법 로드맵 투영(stereographic roadmap projection)은 AAV1RX 캡시드에 대한 3중 대칭축에서 내려다 본 신경친화성 족문을 보여주고, RIVEM을 이용하여 생성되었다. 표면-노출(surface-exposed) 아미노산 잔기만이 표시되고, 각각 사이의 경계는 흑색선으로 표시된다. 녹색 영역은 3-겹 대칭축에서 위상 돌출부(topological protrusion)를 도시하고, 청색 영역은 위상 함몰부를 나타낸다. 이 족문의 핵심 아미노산 잔기는 자홍색(magenta)으로 표시된다(AAVrh.10 VP1 번호부여). 도 11H. 5 x 1011 vg의 용량으로 꼬리 정맥 주사를 통해 투여된 CBh-scGFP 형질전환 유전자를 패키징하는 AAV1RX의 CNS 형질도입 프로파일. 주사 후 21일차에서 취해진 절편을 면역염색하고 이미징했다. 스케일 바 = 100 ㎛
도 12A- H. 정맥내 투여 후 AAV1R6, AAV1R7 및 AAV1RX의 말초 조직 형질도입 및 생체내분포(biodistribution). PBS 또는 CBA-Luc 리포터 형질전환 유전자를 패키징하는 AAV1, AAVrh.10, AAV1R6, AAV1R7 또는 AAV1RX 벡터를 1 x 1011 vg의 용량으로 꼬리 정맥을 통해 마우스에 주사했다. 주사 후 2주 차에, 다양한 조직에서 바이러스 게놈 카피의 루시퍼라아제 리포터 형질전환 유전자 발현 수준(도 12A, 12C, 12E, 12G) 및 생체내 분포(도 12B, 12D, 12F, 12H)를 정량했다. 루시퍼라아제 발현 수준을 조직 용해물(tissue lysate)의 그램으로 정규화시키고, RLU로 나타냈다. 벡터 게놈 (vg) 카피를 내생 하우스키핑 유전자(endogenous housekeeping gene)인 마우스 라민 B (mLamB)로 정규화시키고 세포당 vg 카피수로 나타낸다. 에러 바는 표준편차를 나타낸다(루시퍼라아제 분석에 대한 n = 3; 생체내 분포에 대한 n = 4). 각 그룹에 대한 Welch 보정을 포함한 독립 양측 T-검정 및 일원 ANOVA를 수행하고, AAVrh.10 대비 유의성이 표시된다. ns, 유의성 없음. *, P < 0.05.
도 13A- H. 모 캡시드 및 기타 키메라 캡시드 변이체 대비 AAV1RX에 의해 매개되는 신경 및 신경교 형질도입 수준의 정량. 마우스에 꼬리 정맥 주사를 통해 5 x 1011 vg 용량으로 CBh-scGFP 형질전환 유전자를 패키징하는 모 (AAV1 또는 AAVrh.10) 또는 키메라 벡터를 투여했다. 주사 후 3주차에, 뇌를 채취하고, 절편화하고, GFP에 대해 면역염색하고, 이미징했다. 상대적 뉴런 및 신경교 형질도입 수준을 GFP에 대해 면역염색하고, 이미징했다. 50 ㎛ 관상 절편 당 각 영역에 대해, 형태에 근거하여 확인된, 형질감염된 뉴런과 신경교의 갯수를 계수하는 것에 의해 상대적 뉴런 및 신경교 형질도입 수준을 정량했다. 운동 피질 (도 13A), 대뇌 피질 (도 13B), 해마 (도 13C), 치상회 (도 13D), 시상 (도 13E), 시상하부 (도 13F), 선조체 (도 13G), 및 편도체 (도 13H)를 포함한, 다양한 영역에 대해, 모 혈청형, AAV1 & AAVrh.10, 및 키메라 변이체, AAV1R6 및 AAV1R7에 대한 것과 함께 AAV1RX 형질도입 수준이 표시된다. 에러 바는 표준 편차를 나타낸다 (n = 3). AAV1 대비 각 그룹의 통계적 유의성을 입증하기 위해, Welch 보정을 포함한 독립 양측 T-검정을 이용했다. ns: 통계적 유의성 없음(not statistically significant); *, P < 0.05. 또한, 평균들 간의 차이가 통계적으로 유의하다는 것을 입증하기 위해 일원 ANOVA를 이용했다. *, 표시된 모든 뇌 영역에 걸친 뉴런 및 신경교 형질감염에 대한 P < 0.05.
도 14. 일반적(common) AAV 혈청형에 대한 1RX 족문, 및 가변 영역 I(VR-I)의 서열 정렬. AAV1RX와 일반적 AAV 혈청형의 서열 정렬은 일반적 천연 AAV 혈청형 전체 대비, 가변 영역 I(VR-I)의 더 큰 맥락 내에서, 1RX 족문의 아미노산 잔기(VP1 번호부여)를 강조한다. 위 및 아래의 흑색 선은 1RX 족문 내에 있는 특정 잔기들을 구분한다. 키(Key): 혈청형 간에 동일한 잔기는 황색 백그라운드 상에 적색 문자로 표시되고; 보존된 잔기는 청록색(cyan) 백그라운드 상에 청색 문자로 표시되며; 약간 유사한(weakly similar) 잔기는 백색 백그라운드 상에 녹색 문자로 표시되고; 비-유사 잔기는 백색 백그라운드 상에 흑색 문자로 표시된다. 이 서열 정렬은 Vector NTI Advance 11.5.2 소프트웨어를 이용하여 생성되었다.
도 15. AAV1, AAV1R7, 및 AAVrh.10 VP1 캡시드 단백질의 서열 정렬.
도 2. 뇌 혈관계 통과 및 뉴런 발현(crossing the brain vasculature and neuronal expression). Cbh-scGFP 형질전환 유전자(transgene)를 패키징한 AAV 벡터를 5 x 1011 vg의 용량으로 꼬리 정맥 투여를 통해 C57/Bl6 마우스에 투여했다. 주사 후 21일 차에 마우스를 희생시키고, 조직을 회수하고, 고정시키고, 절편화시키고, GFP를 검출하기 위해 DAB-염색하고, Aperio Scanner를 통해 이미징하고, ImageScope 소프트웨어를 이용하여 이미지 처리(image processing)를 수행했다. 약어: 피질(Cortex) (CTX), 운동 피질(motor cortex) (MCT), 선조체(striatum) (STR), 해마(hippocampus) (HC), 치상회(dentate gyrus) (DG). N=3.
도 3. 간 탈표적화(liver detargeting). CBA-루시퍼라아제 형질전환 유전자를 패키징하는 AAV 벡터를 1 x 1011 vg의 용량으로 꼬리 정맥 주사를 통해 C57/B16 마우스에 투여했다. 주사 후 14일 차에 마우스를 희생시키고, 조직을 회수하고, 잘게 절단하고(chop), 용해시키고, 뇌, 심장, 간, 및 척수 조직에 대해 상대적 형질도입 수준을 검출하기 위해 루시퍼라아제 분석을 수행했다. 데이터를 그램 조직 당 RLU(relative light units per gram tissue)로 정규화시켰다. N=3.
도 4A-C. AAV1/rh.10 도메인 스왑 캡시드 라이브러리(AAV1/rh.10 domain swap capsid library)의 계통발생 및 구조 분석. 도 4A. 셔플링(shuffling)을 통해 수득된 도메인 스왑의 아미노산 수준에서의 서열 다양성을 보여주는, 라이브러리로부터 단리된 대표적 AAV1/rh.10 키메라 캡시드의 패널의 도식(schematic). 개별적인 모 캡시드 또는 키메라 캡시드가 세로로 열거되고, 상이한 도메인 스왑을 가진 VPI 캡시드 서열이 좌측 N-말단부터 우측 C-말단까지 가로로 표시된다. AAV1-유래 잔기가 회색으로 표시되고, AAVrh.10 잔기는 녹청(green-cyan)으로 표시되며, 둘 간의 보존 잔기(consensus residue)는 흑색으로 표시된다. 도 4B. AAV1/rh.10 키메라 캡시드의 VP1 캡시드 서열의 근접-결합(Neighbor-joining) 계통발생. 캡시드 아미노산 서열을 ClustalW를 이용하여 정렬시키고 근접-결합 알고리즘을 이용하여 계통발생을 생성시켰다. Poisson 보정(correction)을 이용하여 부위당 아미노산 치환의 갯수의 단위로 표현된, 아미노산 거리(amino acid distance)를 산출했다. 계통수(tree)를 정확한 축척으로 작성하고(drawn to scale), 가지 길이는 계통수를 추정하기 위해 이용된 진화적 거리(evolutionary distance)의 단위와 동일한 단위로 표현된다. 1000개의 재현물(replicate) 및 클러스터링된 연관된 분류군(taxa)이 가지 옆에 표시된 재현 트리(replicate tree)의 백분율을 이용하여 부트스트랩(bootstrap) 값을 계산했다. 도 4C. 인 비보 스크리닝을 위해 선택된 모 AAV 캡시드 및 대표적 키메라 AAV 캡시드 돌연변이체의 캡시드 서브유닛 삼량체/3-겹 대칭축(3-fold symmetry of axis) 영역의 3차원 표면 모델. AAV1로부터 유래된 아미노산 잔기는 회색으로 표시되고, AAVrh.10으로부터 유래된 잔기는 녹-청으로 표시된다. PyMol을 이용하여 구조적 모델을 시각화시키고 생성했다.
도 5. 인 비보 스크린(in vivo screen)은 정맥내 투여 후 혈뇌 장벽을 통과할 수 있는 AAV1/rh.10 키메라를 가져온다. 5 x 1011 vg 용량 (또는 모의 처리(mock treatment)의 경우 PBS)의 꼬리 정맥 주사를 통한 투여 후 3주차에 CBh-scGFP 형질전환 유전자를 패키징하는 모 또는 키메라 벡터에 의해 매개된 대뇌 피질에서의 GFP 발현을 보여주는 면역염색된 뇌 절편의 스캔. 전체 관상 뇌 절편(global coronal brain section) (상부)은 개별적인 형질도입 프로파일을 보여주는, 각각의 모 또는 키메라 벡터에 대해 표시된 삽도(inset)에 표시된 상자내 영역(boxed region)을 나타낸다. 스케일 바(scale bar) = 100㎛.
도. 6A- G. 정맥내 투여 후 혈뇌 장벽을 통과하고 다양한 뇌 영역에 형질도입할 수 있는 능력에 대한 AAV1/rh.10 키메라의 인 비보 스크린. 마우스에 꼬리 정맥 주사를 통해 5 x 1011 vg 용량의 CBh-scGFP 형질전환 유전자를 패키징하는 모(AAV1 또는 AAVrh.10) 또는 키메라 벡터를 투여했다. 주사 후 21일차에 면역염색 및 이미징된 마우스 뇌 절편은 흑색/짙은 갈색 염색(black/dark brown staining)으로 GFP 발현을 보여준다. 스케일 바 = 100 ㎛. 도면의 상부에 있는 전체 관상 뇌 절편은 삽도에 표시된 다양한 뇌 영역을 나타낸다: MCT, 운동 피질(motor cortex) (도 6A); HC, 해마(hippocampus) (도 6B); DG, 치상회(dentate gyrus) (도 6C); TH, 시상(thalamus) (도 6D); HY, 시상하부(hypothalamus) (도 6E); STR, 선조체(striatum) (도 6F); Amg, 편도체(amygdala) (도 6G). 각각에 대해 n = 3.
도 7A-H. 뇌에서 모 AAV1 및 AAVrh.10 대비 AAV1R6 및 AAV1R7의 CNS 형질도입 프로파일. 운동 피질 (도 7A), 대뇌 (체감각) 피질(도 7B), 해마 (도 7C), 치상회 (도 7D), 시상 (도 7E), 시상하부 (도 7F), 선조체 (도 7G), 및 편도체 (도 7H)를 포함한, 다양한 뇌 영역에 대한 모 혈청형, AAV1 및 AAVrh.10 (좌측 컬럼), 및 AAV1R6 및 AAV1R7 (우측 컬럼)의 5 x 1011 vg 용량의 Bh-scGFP 형질전환 유전자를 패키징하는 AAV 벡터의 꼬리 정맥 주사 후 3주차 형질도입 프로파일이 도시된다. 스케일 바 = 100 ㎛
도. 8A- H. 모 및 키메라 캡시드 변이체에 대한 뉴론 및 신경교 형질도입 수준의 정량적 비교. 5x 1011 vg의 용량으로 꼬리 정맥 주사를 통한 CBh-scGFP 형질전환 유전자를 패키징하는 벡터의 투여 3주차 상대적 뉴런 형질도입 수준을 50 ㎛ 관상 절편(coronal section) 당 각 뇌 영역에 대해, 형태에 근거하여 확인된 형질도입된 뉴런 및 신경교의 갯수를 계수하는 것에 의해 정량했다. 운동 피질 (도 8A), 대뇌 (체감각) 피질(도 8B), 해마 (도 8C), 치상회 (도 8D), 시상 (도 8E), 시상하부 (도 8F), 선조체 (도 8G), 및 편도체 (도 8H)를 포함한, 뇌의 다양한 영역에 대한, 모 혈청형 AAV1 및 AAVrh.10의 형질도입이 키메라 AAV1R6 및 AAV1R7와 함께 표시된다. 에러 바(Error bar)는 표준 편차를 나타낸다 (n > 또는 = 3). AAV1 대비 각 그룹에 의한 뉴런 및 신경교 형질도입에 대한 통계적 유의성 및 평균간 차이가 각각 통계적으로 유의하다는 것을 입증하기 위해 Welch 보정(correction)을 포함한 독립 양측 T 검정(unpaired two-tailed T test) 및 일원 ANOVA를 이용했다. ns, 유의성 없음(not significant); *, P < 0.05.
도 9A- F. AAV1R6 키메라 캡시드 변이체의 구조 분석. (도 9A) AAV1R6과 AAV1 & AAVrh.10의 서열 정렬은 AAVrh.10으로부터 독특하게 유래된 아미노산 잔기(AAV1R6 번호부여)를 강조한다(흑색 글자로 표시되고, 청색으로 강조됨). 보존된 잔기는 적색으로 기재되고 황색으로 강조되며, AAV1에서 비-보존된 해당 잔기(non-conserved equivalent residue)는 흑색 또는 녹색 텍스트로 표시되고, 녹색 또는 백색으로 강조된다. AAV8의 결정 구조가 상동성 모델링(homology modeling)을 위한 주형으로 작용한 SWISS-MODEL을 이용하여(PDB ID: 2QAO) 키메라 AAV1R6 VP3 서브유닛 (도 9B) 단량체의 삼차원 구조 모델을 생성했다. VIPERdb 올리고머 생성기(oligomer generator)를 통해 AAV1R6 VP3 서브유닛(도 9C) 삼량체 이량체/2-겹 대칭축, (도 9D) 삼량체/3-겹 대칭축, (도 9E) 오량체/5-겹 대칭축의 표면 모델(surface model) 및 (도 9F) 온전한 AAV1R6 캡시드(60량체)의 표면 렌더링(surface rendering)를 생성하고 PyMol을 이용하여 시각화시켰다. AAV1로부터 유래된 잔기는 회색으로 표시되고, AAVrh.10로부터 유래되고, 3-겹 대칭축에서 돌출부(protrusion), 2-겹 대칭축에서 함몰부(depression)의 기부, 및 5-겹 포어(5-fold pore)에 클러스터링된 잔기는 녹청으로 표시된다.
도 10A- B. 모 캡시드 대비 AAV1R6 및 AAV1R7에 의한 심장 및 간의 상대적 형질도입. CBh-scGFP 형질전환 유전자를 패키징하는 모(AAV1 또는 AAVrh.10) 또는 키메라(AAV1R6 또는 AAV1R7) 벡터를 꼬리 정맥 주사를 통해 5 x 1011 vg의 용량으로 투여했다. 주사 후 21일차에, 심장 및 간 절편을 GFP에 대해 면역염색하고, 이미징했다. 도 10A. PBS (모의(Mock)), AAV1, AAVrh.10, AAV1R6 또는 AAV1R7로 처리된 마우스의 심장(상부 패널) 및 간(하부 패널) 조직에 대한 GFP 형광. 도 10B. 각 처리에 대해 취해진 복수 이미지에 대한 상대적 형광을 정량화하는 것에 의해 측정된 심장(상부) 및 간(하부)에 대한 형질도입 수준. 바(bar)는 최소값부터 최대값까지의 범위를 나타내고, 중심선은 샘플들에 대한 평균을 나타낸다. 상대적 형광을 모의 처리 조직(mock treated tissue)으로 정규화시켰다. 에러 바(Error bar)는 표준 편차를 나타낸다 (n = 3). 각 그룹에 대한 Welch 보정을 포함한 독립 양측 T-검정 및 일원 ANOVA를 수행하고, AAVrh.10 대비 유의성이 표시된다. ns, 유의성 없음. *, P < 0.05.
도 11A- H. BBB 통과에 대한 최소(minimal) AAVrh.10 족문(footprint)의 합리적 설계 및 기능적 맵핑. 도 11A. AAV1RX와 AAV1 및 AAVrh.10의 서열 정렬은 신경친화성 족문(neurotropic footprint) 내 및 그에 인접한 번호부여된 아미노산을 보여준다. 보존된 잔기는 황색으로 강조되고, 족문을 구성하는 잔기는 청록색으로 강조되며, 비-보존 잔기는 녹색 또는 백색으로 강조된다. 조작된(engineered) AAV1RX 키메라 캡시드의 구조 모델을 상동성-기반 모델링을 위한 SWISS-MODEL 소프트웨어를 이용하여 생성하고 올리고머를 생성하기 위해 VIPERdb를 이용했다. AAV1RX VP3 서브유닛 단량체(도 11B), 삼량체 이량체/2-겹 대칭축(도 11C), 삼량체/3-겹 대칭축(도 11D), 오량체/5-겹 대칭축(도 11E) 및 완전한 캡시드(60-mer) (도 11F)의 표면 렌더링 모델(surface rendered model)을 생성하기 위해 PyMol을 이용했다. AAV1-유래 아미노산 및 AAV1과 AAVrh.10 간에 상동성인 아미노산을 회색으로 나타내고, BBB 통과를 위한 AAVrh.10으로부터의 신경친화성 족문을 구성하는 잔기를 녹청으로 표시한다. 도 11G. 입체화법 로드맵 투영(stereographic roadmap projection)은 AAV1RX 캡시드에 대한 3중 대칭축에서 내려다 본 신경친화성 족문을 보여주고, RIVEM을 이용하여 생성되었다. 표면-노출(surface-exposed) 아미노산 잔기만이 표시되고, 각각 사이의 경계는 흑색선으로 표시된다. 녹색 영역은 3-겹 대칭축에서 위상 돌출부(topological protrusion)를 도시하고, 청색 영역은 위상 함몰부를 나타낸다. 이 족문의 핵심 아미노산 잔기는 자홍색(magenta)으로 표시된다(AAVrh.10 VP1 번호부여). 도 11H. 5 x 1011 vg의 용량으로 꼬리 정맥 주사를 통해 투여된 CBh-scGFP 형질전환 유전자를 패키징하는 AAV1RX의 CNS 형질도입 프로파일. 주사 후 21일차에서 취해진 절편을 면역염색하고 이미징했다. 스케일 바 = 100 ㎛
도 12A- H. 정맥내 투여 후 AAV1R6, AAV1R7 및 AAV1RX의 말초 조직 형질도입 및 생체내분포(biodistribution). PBS 또는 CBA-Luc 리포터 형질전환 유전자를 패키징하는 AAV1, AAVrh.10, AAV1R6, AAV1R7 또는 AAV1RX 벡터를 1 x 1011 vg의 용량으로 꼬리 정맥을 통해 마우스에 주사했다. 주사 후 2주 차에, 다양한 조직에서 바이러스 게놈 카피의 루시퍼라아제 리포터 형질전환 유전자 발현 수준(도 12A, 12C, 12E, 12G) 및 생체내 분포(도 12B, 12D, 12F, 12H)를 정량했다. 루시퍼라아제 발현 수준을 조직 용해물(tissue lysate)의 그램으로 정규화시키고, RLU로 나타냈다. 벡터 게놈 (vg) 카피를 내생 하우스키핑 유전자(endogenous housekeeping gene)인 마우스 라민 B (mLamB)로 정규화시키고 세포당 vg 카피수로 나타낸다. 에러 바는 표준편차를 나타낸다(루시퍼라아제 분석에 대한 n = 3; 생체내 분포에 대한 n = 4). 각 그룹에 대한 Welch 보정을 포함한 독립 양측 T-검정 및 일원 ANOVA를 수행하고, AAVrh.10 대비 유의성이 표시된다. ns, 유의성 없음. *, P < 0.05.
도 13A- H. 모 캡시드 및 기타 키메라 캡시드 변이체 대비 AAV1RX에 의해 매개되는 신경 및 신경교 형질도입 수준의 정량. 마우스에 꼬리 정맥 주사를 통해 5 x 1011 vg 용량으로 CBh-scGFP 형질전환 유전자를 패키징하는 모 (AAV1 또는 AAVrh.10) 또는 키메라 벡터를 투여했다. 주사 후 3주차에, 뇌를 채취하고, 절편화하고, GFP에 대해 면역염색하고, 이미징했다. 상대적 뉴런 및 신경교 형질도입 수준을 GFP에 대해 면역염색하고, 이미징했다. 50 ㎛ 관상 절편 당 각 영역에 대해, 형태에 근거하여 확인된, 형질감염된 뉴런과 신경교의 갯수를 계수하는 것에 의해 상대적 뉴런 및 신경교 형질도입 수준을 정량했다. 운동 피질 (도 13A), 대뇌 피질 (도 13B), 해마 (도 13C), 치상회 (도 13D), 시상 (도 13E), 시상하부 (도 13F), 선조체 (도 13G), 및 편도체 (도 13H)를 포함한, 다양한 영역에 대해, 모 혈청형, AAV1 & AAVrh.10, 및 키메라 변이체, AAV1R6 및 AAV1R7에 대한 것과 함께 AAV1RX 형질도입 수준이 표시된다. 에러 바는 표준 편차를 나타낸다 (n = 3). AAV1 대비 각 그룹의 통계적 유의성을 입증하기 위해, Welch 보정을 포함한 독립 양측 T-검정을 이용했다. ns: 통계적 유의성 없음(not statistically significant); *, P < 0.05. 또한, 평균들 간의 차이가 통계적으로 유의하다는 것을 입증하기 위해 일원 ANOVA를 이용했다. *, 표시된 모든 뇌 영역에 걸친 뉴런 및 신경교 형질감염에 대한 P < 0.05.
도 14. 일반적(common) AAV 혈청형에 대한 1RX 족문, 및 가변 영역 I(VR-I)의 서열 정렬. AAV1RX와 일반적 AAV 혈청형의 서열 정렬은 일반적 천연 AAV 혈청형 전체 대비, 가변 영역 I(VR-I)의 더 큰 맥락 내에서, 1RX 족문의 아미노산 잔기(VP1 번호부여)를 강조한다. 위 및 아래의 흑색 선은 1RX 족문 내에 있는 특정 잔기들을 구분한다. 키(Key): 혈청형 간에 동일한 잔기는 황색 백그라운드 상에 적색 문자로 표시되고; 보존된 잔기는 청록색(cyan) 백그라운드 상에 청색 문자로 표시되며; 약간 유사한(weakly similar) 잔기는 백색 백그라운드 상에 녹색 문자로 표시되고; 비-유사 잔기는 백색 백그라운드 상에 흑색 문자로 표시된다. 이 서열 정렬은 Vector NTI Advance 11.5.2 소프트웨어를 이용하여 생성되었다.
도 15. AAV1, AAV1R7, 및 AAVrh.10 VP1 캡시드 단백질의 서열 정렬.
실시예
실시예
1. AAV의 혈뇌 장벽 통과 수송을 가능하게 하는 신경친화성 족문(NEUROTROPIC
FOOTPRINT)의 발견
아데노-연관 바이러스(adeno-associated viruse: AAV)는 약 4.7 kb 단일-가닥 DNA 게놈을 패키징하는 작은, 25 nm 20면체 캡시드로 구성된 비-병원성 파보바이러스이다. 광범위한 어레이의 AAV 캡시드 서열이 인간 및 영장류 조직으로부터 단리되었고, 이들은 서열 및 구조적 다양성에 기초하여 여러 구별되는 클레이드(clade)로 분류되었다. 이러한 클레이드 간에, 상이한 혈청형은 종, 조직 및 세포 수준에서 광범위한 친화성(tropism)을 보인다. 이러한 다양한 표현형은 캡시드 구조에 의해 결정된다. AAV 캡시드는 60개의 바이러스 단백질(VP) 서브유닛으로부터 조립된다. 코어(core) VP 단량체(VP3)는 루프 영역을 맞물리는(interdigitate) 것에 의해 연결된 7개의 역-병렬(anti-parallel) 베타 가닥으로 이루어진 롤케익형, 베타 배럴 구조(jellyroll, beta barrel structure)를 갖는다. 이러한 높은 가변성 루프(highly variable loop)의 일부가 표면 노출되고 AAV 캡시드의 위상(topology)을 정의하고, 이는 뒤이어 다양한 AAV 캡시드 전체에 걸쳐 조직 친화성, 항원성 및 수용체 유용성(receptor usage)을 결정한다. AAV 캡시드 상의 표면 루프 잔기는 고도로 가소성(plastic)이고 변형될 수 있어서, 항원성, 형질도입 프로파일 및 조직 친화성에 대한 조절을 가능하게 한다.
AAV 생활사(lifecycle)의 제 1 단계는 세포 표면 글리칸 구조의 인식 및 그로의 부착이다. 이들은 AAV2, AAV3 및 AAV6의 경우, 헤파란 술페이트(HS), AAV1, AAV5 및 AAV6의 경우, α2,3- 및 α2,6-N-결합 시알산(Sia), AAV4의 경우, O-결합 시알산, 및 AAV9의 경우, 갈락토오스(Gal)를 포함한다. 글리칸 결합에 부수적으로, 세포에 의한 AAV의 흡수(uptake)는 인테그린 및 다양한 성장 인자 수용체를 포함한, 부수적 공-수용체(co-receptor)를 포함한다. 최근에, 막관통 단백질(transmembrane protein), KIAA0319L (AAVR)이 다수의 AAV 혈청형에 대한 유니버설 수용체(universal receptor)로 확인되었다. 이러한 인자들이 조직 글리코실화 패턴과 함께, 상이한 AAV 혈청형의 다양한 조직 친화성에 기여한다. 구체적으로 CNS에 대해, 상이한 AAV 혈청형은 투여 경로에 따라 다양한(a spectrum) 형질도입 프로파일 및 세포 친화성(cellular tropism)을 보인다. 예를 들면, 직접적인 실질내 또는 뇌척수액(CSF)내 주사를 통해 마우스 CNS 내로 직접 투여된 경우, AAV 캡시드는 혈청형에 따라, 전방향 및/또는 역방향(anterograde and/or retrograde direction)으로 축삭 수송 및 시냅스관통 확산(transynaptic spread)을 수행한다. 또한, 본 발명자들은 최근에 CSF의 신경교-연관 림프(글림프) 수송(glial-associated lymphatic (glymphatic) transport)이 마우스 뇌 실질내에서의 AAV 확산 및 CNS로부터의 제거(clearance)에 영향을 미친다는 것을 입증했다.
CNS 유전자 전달을 달성하기 위해, 정맥내로 투여된 AAV 벡터는 뇌로의 진입을 얻기 위해 먼저 혈뇌 장벽(BBB)을 통과해야 한다. 연관된 성상세포 엔드-피트(astrocytic end-feet) 및 혈관 주위 세포(pericyte)와 함께 내피 세포 밀착 연접(tight junction)으로 이루어진, BBB는 거대분자/입자의 확산 및 세포주위 흐름(paracellular flux)을 차단하고 다른 분자들의 수송을 조절한다. 뇌를 감염시키는 대부분의 바이러스는 BBB의 파괴 또는 약화를 통해 감염시키나; 일부 바이러스는 숙주 면역 세포 내에서 히치하이킹(hitchhiking)(예를 들면, HIV)에 의해, 뇌 내피 세포를 감염시키는 것에 의해, 또는 말초 신경을 감염시키고 축삭 수송을 이용하는 것(예를 들면, 광견병(Rabies) 바이러스)과 같은 방법에 의해 CNS로의 진입을 얻기 위한 전략을 고안했다. AAV의 경우, BBB는 일부 중요한 예외가 있으나, 대부분의 혈청형의 뇌로의 진입을 막는다. 예를 들면, AAV 혈청형 1-6 및 8의 혈관내 투여는 부진한 CNS 형질도입을 가져오나, 단리물(isolate) AAV9, AAVrh.8 및 AAVrh.10은 특히, 상이한 동물 모델에서 BBB를 효율적으로 횡단하는 것으로 확인되었다.
CNS에서 형질전환 유전자 발현의 치료적 수준을 달성하기 위해, 높은 벡터 용량(예를 들면, 척수성 근위축 시험 NCT02122952에서 1 x 1014 vg/kg)이 종종 요구된다. 스케일 업(scale up) 및 비용과 관련된 부담 외에, 높은 벡터 용량은 또한 간 독성과 같은 바람직하지 않는 부작용을 유발하는 것으로 확인되었다. CNS로의 유전자 전달의 특이성/효율성을 개선하고 유효 벡터 용량(effective vector dose)을 낮추기 위해, AAV 갭시드가 BBB에 침투할 수 있게 하는 구조적 특징에 대한 보다 높은 이해가 요구된다.
BBB 통과에 대한 구조-기능 상관관계를 분석하기 위해, 본 발명자들은 단지 2종의 혈청형- 혈관계를 횡단하지 않는, AAV1 및 BBB를 효율적으로 통과하는 것으로 알려진, AAVrh.10을 이용하여 변이체 캡시드 유전자의 조합 라이브러리(combinational library)를 생성했다. 새로운 변이체를 진화시키기 보다는, 본 발명자들은 마우스에서 추가적인 스크리닝을 위해 전산학적(computational), 계통발생적 및 구조적 분석에 의해 개별적인 변이체를 선택했다.
키메라
AAV
캡시드 패널의 생성.
DNA 셔플링을 통해 AAV1/rh.10 도메인 스왑 캡시드 라이브러리(domain swap capsid library)를 생성했다. 요약하면, AAV1 및 AAVrh.10의 Cap 유전자를 단시간 DNase 처리(DNase digestion)에 의해 무작위로 단편화시키고 짧은(< 400 bp) 단편의 부분적 상동성이 단편들의 셀프-프라이밍(self-priming)을 가능하게 하는 것인 Phusion High-Fidelity DNA 폴리머라아제(NEB Cat #M0530L)에 의한 프라이머리스(primerless) PCR을 이용하여 재조립하였다. Cap 유전자를 플랭킹하는 특이적 보존 프라이머(conserved primer)를 이용한 이차 PCR 단계를 이용하여 재조립된 전장 Cap 서열의 라이브러리를 증폭시키고 바이러스 생성을 위해 사용되는 pTR 플라스미드 백본 내로의 후속 클로닝을 촉진하기 위해 동시에 플랭킹 제한효소 인식 부위(restrictino site)를 삽입했다.
계통발생 및 서열 분석
상이한 AAV 캡시드 단리물의 아미노산 서열을 ClustalW를 이용하여 정렬시키고, MEGAv7.0.21 소프트웨어 패키지를 이용하여 계통수(phylogenetic tree)를 생성했다. 근접-결합 알고리즘을 이용하여 계통(phylogeny)을 생성시키고 Poisson 보정(correction)을 이용하여 아미노산 거리를 계산했다. 계통수 분석의 신뢰성(confidence)을 테스트하고 부트스트랩 컨센서스 트리(bootstrap consensus tree)를 생성하기 위해 1,000개의 재현물(replicate)을 부트스트랩하는 것에 의해 통계적 검정을 수행했다. 부트스트랩 재현물의 50% 미만에서 재생되는 구획에 해당되는 가지는 없어진다. 부트스트랩 검정에서 연관된 분류군이 함께 클러스터링된 것인 재현 계통수(replicate tree)의 비율이 가지 옆에 표시된다. 모든 서열 정렬은 Invitrogen's Vector NTI Advance 11.5.2 소프트웨어를 이용하여 수행했다.
바이러스 생성 및 역가(titer)
업데이트된 삼중 플라스미드 형질감염(triple plasmid transfection) 프로토콜을 이용하여 재조합 AAV 벡터를 생성했다. 구체적으로, 형질감염된 플라스미드는 (i) 캡시드-특이적 pXR 헬퍼 플라스미드(즉, 본 연구에서 이용된 다양한 키메라 Cap 유전자를 코딩하는 pXR1, pXRrh.10, 또는 다양한 플라스미드), (ii) 아데노바이러스 헬퍼 플라스미드 pXX680, 및 (iii) 각각 AAV2 게놈으로부터 유래된 역전 TR(terminal repeat)에 의해 플랭킹된, CBh(chicken beta actin hybrid) 프로모터에 의해 구동되는 자기-상보적(self-complementary) GFP(green fluorescent protein) 또는 CBA(chicken beta actin) 프로모터에 의해 구동되는 Luc(luciferase reporter transgene)을 코딩하는) pTR-CBh-scGFP 또는 pTR-CBA-Luc 플라스미드를 포함한다. 이오딕산올 밀도 구배 초원심분리(iodixanol density gradient ultracentrifugation)를 이용하여 바이러스 벡터를 정제했다. CBh-scGFP 형질전환 유전자를 패키징하는 벡터를 뒤이어 완충액 교환 및 Sartorius Vivaspin2 100 kDa 분자량 컷-오프(MWCO) 원심분리 컬럼(F-2731-100 Bioexpress, Kaysville, UT)을 이용한 농축에 적용시켰다. CBA-Luc 형질전환 유전자를 패키징하는 벡터에 완충액 교환 및 Zeba Spin Desalting Columns, 40K MWCO (Thermo Scientific, Cat # 87770)을 이용한 탈염(de-salting)을 수행했다. 정제 후에, Roche Lightcycler 480 (Roche Applied Sciences, Pleasanton, CA)를 이용한 정량적 PCR을 통해 바이러스 게놈 역가(titer)를 결정했다. 특이적으로 AAV2 역전 말단 반복부(inverted terminal repeat)를 인식하도록 정량적 PCR 프라이머를 설계했다(정방향, 5'- AACATGCTACGCAGAGAGGGAGTGG-3'; (서열번호 36) 역방향, 5'- CATGAGACAAGGAACCCCTAGTGATGGAG-3') (서열번호 37) (IDT Technologies, Ames IA).
동물 연구
모든 동물 실험은 Jackson Laboratories (BAR Harbor, ME)로부터 구입한 6 내지 8주령 암컷 C57/BL6 마우스를 이용하여 수행하였다. 이 마우스들을 NIH 가이드라인을 준수하고 UNC IACUC(Institutional Animal Care and Use Committee)에 의해 승인된 바와 같이 유지하고 처리했다. AAV 벡터가 BBB를 통과하고 CNS 세포 집단에 형질도입시키는 능력을 조사하기 위해, CBh-scGFP 형질변환 유전자 또는 1x PBS (모의 처리(mock treatment)로서)를 패키징하는 AAV 벡터를 5 x 1011 vg의 용량으로 꼬리 정맥 주사를 통해 정맥내로(i.v.) 투여했다. GFP 리포터 형질전환 유전자 발현에 대해 분석하기 위해, 주사 후 21일차에 트리브로모에탄올 (Avertin) (1.25% 용액 0.2 ml)에 의한 주사 및 뒤이은 30 ml의 1x PBS 및 뒤이은 30 ml의 PBS 중 4% 파라포름알데히드의 경심 관류(transcardial perfusion)에 의해 희생시켰다. 뇌, 심장, 및 간을 포함한 조직을 제거하고, 24시간 동안 고정시키고(post fix)Leica VT 1200S 진동 블레이드 마이크로톰(vibrating blade microtome)(Leica Biosystems, IL)을 이용하여 각 조직에 대해 50-㎛ 두께 절편을 수득했다. 그 후, 마우스 뇌 절편을 하기에 기술된 바와 같이 면역염색시켰다. 인 비보 루시퍼라아제 형질도입 및 바이러스 게놈 생체내분포 실험을 위해, 마우스에 1 x 1011 vg 용량으로 1x PBS 또는 CBA-루시퍼라아제 형질전환 유전자를 패키징하는 바이러스 벡터를 주사했다. 주사 후 14일차에, 전술된 바와 같이, 마우스를 희생시키고, 다양한 조직을 제거했다. 이 실험을 위해, 1x PBS 중 4% 파라포름알데히드에 의한 고정을 수행하지 않고, 대신에 조직을 절단하고 사용 전에 -80℃에서 동결시켰다.
루시퍼라아제 발현을 정량하기 위해, CBA-Luc 형질전환 유전자를 패키징하는 1 x 1011 바이러스 게놈을 주사받은 마우스를 주사 후 14일차에 희생시키고 조직을 회수하고 -80℃에서 동결시켰다. 후에, 조직을 해동시키고, 칭량하고, 150 ㎕의 2x passive lysis buffer (Promega, Madison WI)를 첨가하는 것에 의해 용해시키고Tissue Lyser II 352 장치 (Qiagen, Valencia, CA)를 이용한 기계적 용해를 수행하고 뒤이어 잔류 조직 잔해를 제거하기 위해 원심분리를 수행했다. 루시퍼라아제 형질전환 유전자 발현을 측정하기 위해, 각 용해물로부터의 상층액 50 ㎕를 루시페린 50 ㎕와 함께 분석 플레이트(assay plate)에 로딩하고, Victor2 루미노미터 (PerkinElmer, Waltham, MA)를 이용하여 발광측정(luminometric) 분석을 수행했다. 각 시료에 대해 수득된 RLU(relative light unit)를 그램으로 측정된, 각 시료에 대한 투입 조직 중량(input tissue weight)으로 정규화시켰다. 데이터를 그래프로 작성하고 Welch 보정을 포함한 독립 양측 T 검정(unpaired two-tailed T-test with Welch's correction) 및 ANOVA 및 표시된 경우, 뒤이은 Tukey 다중 비교(Tukey's multiple comparison)를 이용하여 통계 분석을 수행했다. 이러한 통계적 분석은 GraphPad Prism 6® 소프트웨어에서 수행했다.
조직 처리 및 조직학적 분석(
histological
analysis)
GFP 리포터 형질전환 유전자를 패키징하는 바이러스를 이용한 마우스 실험을 위해, 부동성(free-floating) 50-㎛ 두께 관상 뇌 절편(coronal brain section)을 24-웰 플레이트에서 염색했다. 절편을 1x PBS 중 10% 염소 혈청 및 1% Triton X (Sigma-Aldrich)를 포함하는 블록킹(blocking) 완충액 중에 실온에서 1시간 동안 인큐베이션시켰다. 그 후, 수득된 절편을 블록킹 완충액 중에 희석된 일차 단일클론 래빗 α-GFP 항체(Life-Technologies-G10, 362 1:750)와 4℃에서 밤새 인큐베이션시켰다. 다음날, 1x PBS로 10분 세척을 3회 수행했다. Vectastain ABC 키트 (Rabbit IgG PK-4001 kit, Vector biolabs, Burlingame, CA)를 이용하여, GFP 발현의 후속 조직화학적 분석을 수행하고, 조직을 현미경 슬라이드 상에 배치했다. 면역염색된 절편을 UNC Translational Pathology Laboratory에서 Aperio ScanScope XT 장치 (Aperio Technologies, Vista, CA)를 이용하여 명시야(brightfield)(20x objective)에서 디지털 이미징을 수행하고, Aperio ImageScope 및 WebViewer 소프트웨어를 이용하여 분석했다. 50 ㎛ 관상 뇌 절편 당, 형태에 근거하여 결정된, GFP+ 신경 세포 또는 신경교 세포의 개수를 계수하는 것에 의해 정량화를 수행했다. 데이터를 그래프로 작성하고 전술된 바와 같이 통계적 분석을 수행했다. Allen Mouse Brain Atlas에서 수득된 대조군 마우스 뇌 기준(reference)에 대한 비교에 근거하여 특정한 뇌 영역을 확인했다. 심장 및 간에서 GFP 발현을 분석하기 위해, 조직을 전술된 바와 같이, 항-GFP 일차 항체로 GFP에 대해 염색하였으나; Alexa-488에 접합된 항-래빗 염소 항체를 1:500(항-래빗 Abcam-96,883)의 희석으로 2차 항체로 이용했다. 이 조직에서 면역염색된 GFP를 GFP 라이트 큐브(light cube)(여기 470 nm, 발광 510 nm)를 이용한 EVOS FL 형광(epifluorescence) 세포 이미징 시스템(AMC/Life Technologies)을 이용하여 이미징하였다. 전술된 바와 같이 통계적 분석을 수행했다.
벡터 게놈 생체내 분포(
biodistribution
)
전술된 바와 같이, 동물 연구를 수행했다. 주사 후 21일차에, 마우스를 희생시키고 조직을 -80℃에서 동결시켰다. 그 후, 조직을 해동시키고 DNeasy 키트 (Qiagen, Valencia, CA)를 이용하여 조직 용해물로부터 바이러스 게놈을 추출했다. 루시퍼라아제 형질전환 유전자에 특이적인 프라이머(정방향, 5'-AAAAGCACTCTGATTGACAAATAC-3'(서열번호 38); 및 역방향, 5'-CCTTCGCTTCAAAAAATGGAAC-3' (서열번호 39))에 의한 정량적 PCR을 이용하여 각 조직에 대해 바이러스 게놈 카피 수(viral genome copy number)를 결정했다. 그 후, 이러한 바이러스 게놈 카피 수를 프라이머(정방향, 5'-GGACCCAAGGACTACCTCAAGGG-3' (서열번호 40); 및 역방향, 5'-AGGGCACCTCCATCTCGGAAAC-3' (서열번호 41))를 이용하여 마우스 라민(lamin) B2 하우스키핑(housekeeping) 유전자로 정규화시켰다(normalized). 바이러스 게놈의 생체내 분포를 각 조직에 대해 회수된 세포당 벡터 게놈의 비로 나타낸다. 데이터를 그래프로 작성하고, 전술된 바와 같이 통계적 분석을 수행했다.
분자 모델링(Molecular modeling)
이전에 공지된 좌표(PDB ID, 3NG9)를 AAV1 VP3 삼량체/3-겹 대칭축의 3차원 구조를 생성했다. AAVrh.10과 다양한 AAV1/rh.10 키메라 캡시드 구조의 상동성 모델(homology model)을 AAV8 VP3 (PDB ID, 2QA0)의 결정 구조를 주형으로 하여 SWISS-Model 서버 (swissmodel . expasy . org)를 이용하여 수득하고, AAV1 VP3 (PDB ID 3NG9) 단량체를 주형으로 하고, WinCoot 소프트웨어 중 SSM(secondary structure matching) 어플리케이션을 이용하여 구조-기반 정렬을 생성하였다. VIPERd oligomer generator utility (viperdb.scripps.edu/oligomer_multi.php)를 이용하여 VP3 삼량체/3-겹 대칭축, VP3 삼량체 이량체/2-겹 대칭축, VP3 오량체/5-겹 대칭축, 및 완전 캡시드(full capsid)를 생성했다. 이 모델들의 표면-연출 묘사(surface rendered depiction)를 PyMOL (the PyMOL Molecular Graphics System, SchrOdinger LLC, www.pymol.org)을 이용하여 시각화시켰다. RIVEM (Radial Interpretation of Viral Electron Density Maps) 소프트웨어를 이용하여 AAVrh.10-유래 신경친화성 족문(neurotrophic footprint) 내 표면-노출 아미노산 잔기를 강조하는 AAV1RX 캡시드 표면의 입체 로드맵 투영도(stereographic roadmap projection)를 작성했다.
AAV1
/rh.
10 도메인 스왑 라이브러리의 생성 및 키메라 캡
시드 변이체의 단리
본 발명자들은 BBB 횡단을 위한 조직-기능 상관관계(structure-function correlate)를 확인하기 위해 상이한 캡시드 도메인의 비교 분석을 수행했다. 본 발명자들은 DNA 셔플링을 통해 AAV1/rh.10 도메인 스왑 라이브러리를 생성했다. 본 발명자들은 AAV1 및 AAVrh.10이 BBB를 통과하는 능력이 현저하게 상이하고 그들의 캡시드(Cap) 유전자에 의해 공유되는 서열 상동성(85%) 때문에 이들을 DNA 셔플링을 위한 모 캡시드 서열로 선택했다. 그 후, 36종의 키메라 캡시드 서열을 클론으로 단리하고(clonally isolated) 시퀀싱했다. 이 라이브러리로부터 생성된 변이체는 DNA 및 아미노산 수준에서 상당한 다양성을 보였다. 서열 정렬은 다양한 도메인 스왑(a spectrum of domain swaps)을 밝혔고, 본 발명자들은 이들을 AAV1부터 AAVrh.10까지 상동성의 오름차순으로 구성했다(도 4A, 상단부터 하단까지). 이 패널의 클론을 근접-결합 수(neighbor-joining tree)를 작성하는 것에 의해 계통발생적으로 더 규명하였고, 이는 변이체들을 보다 AAV-1 유사(클레이드 A) 또는 보다 AAVrh.10-유사(클레이드 E)로 광범위하게 분류하였다(도 4B). 그 후, 조립이나 패키징에 결함이 있는 캡시드를 연구로부터 배제시키기 위한 상대적 역가를 확립하기 위해 소규모(small-scale) 벡터 생산을 이용하였다. 인 비보에서 최초 스크리닝(initial screening)을 위한 키메라 캡시드 변이체의 목록을 더 축소하기 위해 3-겹 대칭축에 있는 핵심 표면 도메인/잔기들을 강조하는, 모 및 대표적인 키메라 캡시드 삼량체의 상동성-기반 구조적 모델을 생성하였다(도 4C). 구조 분석에 근거하여 10개의 키메라 캡시드 변이체를 선택하였고, 이들 중에 6개가 재조합 벡터(scGFP 또는 ssLuc 형질전환 카세트 패키징함)를 모 AAV1 및 AAVrh.10 벡터와 유사한 역가로 생성했다. 그 후, 이 변이체들을 더 스크리닝하였다.
인 비보
스크리닝은 성체 마우스에서 정맥내 투여 후 BBB를 통과할 수 있는
2개의
AAV1
/rh.10 키메라 캡시드를 확인한다
본 발명자들은 선택된 패널의 캡시드 변이체가 i.v. 투여 후 BBS를 통과하고 CNS에 형질감염시키는 능력이 상이한지 여부를 테스트하였다. 본 발명자들의 방식은 지향성 진화(directed evolution)을 포함하지 않았고, 이 전략은 일반적으로 최적의 캡시드를 선택하기 위해 적용가능하고 구조-기능 관계의 연구에는 덜 적합하기 때문이었다는 것에 주목하는 것이 중요하다. 본 발명자들은 6-8 주령의 마우스에 꼬리 정맥 주사를 통해 자기-상보적(self-complementary) CBh-GFP 리포터 카세트를 패키징하는 AAV1, AAVrh.10, 또는 6종의 상이한 키메라 AAV 벡터 중 하나를 마우스당 5 x 1011 vg(viral genomes)의 용량으로 주사했다.
대뇌 피질에서 GFP 양성 뉴런을 수동으로 계수하고, 정량하고, 마우스 당 복수의 관상 뇌 절편에 대해 평균을 구하였다. AAV1의 경우 n=2; AAV1R6 및 AAV1R7의 경우 n=3 (도 1). 주사 후 3주차에 관상 뇌 절편의 면역염색은 대뇌 피질 중 AAV1 형질도입은 혈관계에 한정되나, AAVrh.10은 형태학적으로 결정된, 뉴런, 신경교, 및 내피 세포를 포함한, 다양한 세포 집단에서 강건한(robust) 형질도입을 보였다는 것을 밝혔다(도 2, 도 5). GFP+ 세포의 추가적인 형태학적 평가는 키메라 변이체에 대한 상이한 표현형을 나타낸다. AAV1R19.1 및 AAV1R20은 피질에서 미소혈관 내피 세포(microvascular endothelial cell)를 우세하게 형질도입시키나, AAV1R8 및 AAV1R19d 벡터의 경우, 뉴런 및 신경교 세포의 저 내지 중 수준(low to modest) 의 형질도입이 명확하다는 것을 나타낸다(도 5). 대조적으로, AAV1R6 및 AAV1R7은 피질 뉴런(cortical neuron)의 강건한 형질도입을 보이고, 신경교의 적당한(modest) 형질도입 및 피질 내의 혈관계의 드문(scarce) 형질도입을 보인다. 고배율에서 피질의 체성 감각 영역의 대표적 이미지가 표시된다. 이 키메라들에 대한 유사한 경향이 뇌의 다른 영역에서도 일관되게 관찰되었다(도 6). 이러한 관찰은 키메라 캡시드 AAV1R6 및 AAV1R7이 메카니즘은 알려져 있지 않으나, 모 AAVrh.10 벡터와 유사하게 BBB를 통과하는 능력을 가질 것이라는 것을 나타낸다. 그러나, 모, AAV1 또는 AAVrh.10과 달리, 어떠한 키메라도 효율적으로 혈관계에 형질도입하지 않는다.
정맥내로 전달된 AAV1R6 및 AAV1R7 키메라 캡시드는 BBB를 통과하고 뇌 전체
에서 우선적으로 뉴런에 형질도입시킨다.
본 발명자들은 뇌의 다수의 기능적으로 관련된 구조에 대해 이 변이체들의 형질도입 프로파일을 더 규명했다. 하기에 검토된 뇌 영역 각각에 대해, 보다 높은 배율에서의 대표적 이미지를 GFP에 대해 면역염색된 마우스 뇌 관상 절편으로부터 수득하고, 20x 배율에서 광시야(bright field)에서 스캐닝했다. 추가적으로, 각 영역에 대한 뉴런 및 신경교 형질도입의 정량적 데이터를 세포 형태에 근거하여, 각각 GFP+ 신경 세포 및 신경교 세포를 계수하는 것에 의해 결정했다.
대뇌 피질. AAVrh.10은 피질 전체에서 신경 세포, 신경교 세포, 및 혈관 내피 세포의 강건한 형질도입을 보이고, 혈관내로 전달된 AAV1의 경우, 뉴런 발현의 부재 및 신경교에서의 낮은 발현 수준을 동반한, 혈관 형질도입(vascular transduction)을 관찰했다 (도 7 및 도 8). 본 발명자들은 또한 분석된 절편 전체에서 일관되게 향하는 수준(trending level)에서 다양하나, 혈관내로 투여된 AAV1R6 및 AAV1R7 (AAV1R6/7) 벡터가 피질 뉴런에서 강건한 GFP 발현, 및 피질의 편도체, 이상(piriform), 내후각(entorhinal), 측두 연합(temporal association), 청각, 체성감각, 운동, 후두정(posterior parietal), 및 팽대후부(retrosplenial) 영역 전체에서 신경교 중 감소된 발현을 매개한다는 것을 관찰했다. 운동 피질(도 7A) 및 피질의 체성 감각 영역(도 7B)에 대해 형질도입된 피질 영역의 대표적 이미지가 표시된다. 또한, AAV1R6/7은 전체 피질에 걸쳐 우선적 신경 세포 친화성(preferentially neuronal cellular tropism)을 보여서, 적당한 신경교 형질도입 및 현저하게 감소된 혈관 형질도입을 보이는 것으로 나타난다. 이 프로파일은 혈관친화성(vasculotropic) AAV1 및 신경 세포, 신경교 세포, 및 혈관 내피 세포를 높은 효율성으로 형질도입하는 AAVrh.10와 명확하게 대조된다(도 7A 및 7B). AAV1R6/7은 피질 전체에서 강건한 뉴런 발현 및 적당한 신경교 발현을 매개하나, 그럼에도 불구하고, 발현 수준은 AAVrh.10에 의해 달성된 발현 수준보다 더 낮다. 이러한 경향은 GFP+ 세포의 형태학적 분석의 정량에 의해 입증되고(도 8A 및 8B), 이들은 AAVrh.10, AAV1R6 및 AAV1R7에 대해 AAV1 대비 피질 형질도입에서 통계적으로 유의한 차이를 보인다. 주목할 하나의 마지막 차이는 피질 전체에서의 AAVrh.10 형질도입은 특히 팽대후부, 운동, 체성 감각 및 시각 피질 영역 내에서, 1 내지 3개의 피질층(cortical layer) 주위에서, 조직의 주위에 집중되는 경향을 갖는다는 것이다. 이는 차등적 면역염색(differential immunostaining)에 기인될 수 있으나, 본 발명자들은 분석에서 이러한 현상을 염색된 AAVrh.10 절편들에 대해 높은 일관성으로 관찰했다. 이러한 경향은 피질층 전체에 걸쳐 보다 균일하게 분포된 발현을 매개하는 것으로 보이는 AAV1R6/7에는 적용되지 않는다.
해마. 정맥내 전달 후에, 키메라 AAV1R6/7 벡터는 뇌 반구에서 양 방향으로, 해마 전체에서 뉴론 중 강건한 GFP 발현을 매개하는 것으로 보인다. GFP+ 해마 뉴런이 CA1, CA2 및 CA3 피라미드층(pyramidal layers) 내에서 관찰된다(도 7C, CA2 및 부분적 CA1 도시). AAV1R6/7은 또한 치상회 내에서 뉴런에 형질도입하기에 효과적이어서, 형태에 근거하여 과립 세포(granular cell)인 것으로 보이는 많은 수의 GFP+ 뉴런을 보여준다(도 7D). 해마에서 AAV1R6/7에 의해 나타나는 뉴런 형질도입 프로파일은 AAVrh.10에 대해 관찰된 것과 유사하다. 그러나, AAVrh.10과 대조적으로, AAV1R6/7은 감지 가능한 수준으로 신경교 세포 또는 내피 세포에 형질도입하지 않는 것으로 보이고, GFP+ 신경교 세포에 있어서 AAV1과 AAV1R6/7 간에는 유의성 있는 차이가 관찰되지 않았다(도 8C 및 8D). 해마에서 관찰된 AAV1 형질도입은 다시 혈관계에 한정된다. 또한, 이러한 정성적 경향은 해마 (도 8C) 및 치상회 (도 8D)에서 신경 세포 및 신경교 세포 형질도입에 대한 정량적 데이터에 의해 확증된다.
시상. GFP+ 뉴런은 시상에서 AAVrh.10과 유사한 수준으로 AAV1R6/7에 대해 검출되었다 (도 7E). 또한, AAV1R6/7은 내피의 최소(minimal) 형질도입 및 AAVrh.10 대비 시상에서 크게 감소한 수준의 신경교 형질도입을 보인다. 이러한 경향은 시상 뉴런의 형질도입이 AAV1 대비, AAVrh.10, AAV1R6 및 AAV1R7에 대해 유의성 있게 다른 것으로 확인된 정량적 데이터에 의해 더 확인된다(도 8E). 대조적으로, 시상 신경교 형질도입은 AAV1 대비 AAV1R6/7에 대해 유의성 있는 차이가 확인되지 않았다.
시상하부. 다소 가변적이나, 본 발명자들은 전신으로 투여된 경우, 모 벡터 및 키메라 벡터에 대해, 시상하부에서 세포 종류에 관계없이, 일관되게 낮은 수준의 GFP 발현을 관찰했다(도 7F). 시상하부에서 AAVrh.10에 대해 뉴런 형질도입의 변이(variation)이 관찰되어, 마우스 전체에서 높은 개수의 GFP+ 뉴런 및 낮은 개수의 GFP+ 뉴런을 밝혔다. 이러한 형질도입 프로파일은 본 발명자들의 정량적 데이터에서 AAVrh.10 형질도입에 대해 보여진 편차(deviation)에 의해 설명된다(도 8F). AAV1은 혈관계에 한정된 적당한(moderate) 시상하부 형질도입을 보인다. AAV1R6/7 벡터는 시상하부에서 낮은 개수의 GFP+ 뉴런 및 신경교 세포 및 작은 개수의 GFP+ 내피 세포를 보여준다(도 7F 및 도 8F).
선조체 . AAV1R6/7은, AAV1 대비 각각에 대해 유의성 있는 차이를 입증하는 우리의 정량적 데이터에 의해 더 확증되는 바와 같이, AAVrh.10 만큼 효율적으로 선조체(구체적으로, 미상핵-피각(caudate putamen)) 중 뉴런에 형질도입시키나(도 7G); 이러한 벡터는 일부 관찰된 변이에도 불구하고, ~2-배 더 적은 신경교 세포에 형질도입하고, 선조체 중 더 적은 개수의 내피 세포에 형질도입한다(도 8G).
편도체. AAV1R6/7에 대한 편도체 형질도입 프로파일은 AAV1과 대비하여 상당히 다른, 강건한 뉴런 GFP 발현을 보인다. GFP+ 신경교 세포는 거의 검출되지 않았고, 이는 AAV1과 비교하여 크게 다르지 않았고(도 7H 및 도 8H), 겨우 검출가능한 GFP+ 내피 세포가 관찰되었고, 이는 선조체 및 시상과 같은 뇌의 다른 영역과 유사했다.
종합하면, AAV1R6 및 AAV1R7의 혈관내 전달 후 마우스로부터 유래된 면역염색된 뇌 영역의 형태학적 평가는 모 AAVrh.10과 유사한 강건하고 선택적인 뉴런 형질도입을 입증한다. 또한, 이러한 키메라는 감소된 신경교 형질도입을 보이고, 뇌 미소혈관계(microvasculature)의 내피 세포에 형질도입하는 능력이 감소된 것으로 보인다. 또한, 이러한 결과는 전반적으로 낮은 형질도입 수준이 관찰된, 시상하부를 제외하고는, 다양한 뇌 영역에 걸쳐 일관된 것으로 보인다.
AAV1R6
및
AAV1R7은 모 심장 형질도입 프로파일을 유지하면서, 간으로부터 탈표적화된다.
본 발명자들은 심장 및 간 절편을 면역염색하는 것에 의해 모 혈청형 대비 이러한 변이체의 상대적 심장 및 간 형질도입을 분석하였다. 6-8 주령의 암컷 BL6 마우스에 5 x 1011 vg 용량의 GFP(green fluorescent protein) 코딩 서열에 연결된 CBh(hybrid chicken beta actin promoter)(CBh-scGFP) 또는 음성 대조군으로서 PBS를 패키징하는 벡터(AAV1, AAV1R6 또는 AAV1R7)를 꼬리 정맥 주사를 통해 전신으로 투여했다. 마우스를 주사 후 21일차에 희생시키고 조직을 회수하고 고정하고, 절편화했다. GFP 리포터 형질도입을 시각화하기 위해 현미경을 이용했다. ImageJ 소프트웨어를 이용하여 마우스 당 복수 개의 이미지에 대해 상대적 형광(relative fluorescence)를 평균하는 것에 의해 GFP 발현을 정량했다. 모의(mock)의 경우, n=1, AAV1의 경우 n=2, 및 AAV1R6 및 AAV1R7의 경우 n=3.
도 10에 도시된 바와 같이, 두 개의 키메라 벡터는 모두 모 혈청형 AAV1 및 AAVrh.10 대비, 심장에서 유사한 수준의 GFP 발현을 보이고, AAV1 대비, AAVrh.10, AAV1R6 또는 AAV1R7에 대해 유의성 있는 차이는 없었고; 그러나, 심장 조직에서 AAVrh.10 발현 수준은 마우스 전체에 걸쳐 실질적 변이(substantial variation)를 보였다(도 10A 및 10B). 간에서, AAV1은 적당한 형질도입 수준을 보였고, AAVrh.10은 예외적으로 우수하게 수행하여, 로그-배(log-fold) 더 높은 형질도입을 보였다. 대조적으로, AAV1R6 및 AAV1R7은 AAVrh.10 대비 유의성 있게 감소된 모의-처리 마우스와 유사한 백그라운드 수준에서 간에서 무시할 수 있을 정도의 GFP 발현을 매개했다(도 10B). 따라서, 본 발명자들은 AAV1R6 및 AAV1R7이 그들의 모 혈청형 대비 간-탈-표적화되는(liver-de-targeted) 것으로 결론짓는다.
별개로, CBA-루시퍼라아제 형질전환 유전자를 생성하기 위해 루시퍼라아제 코딩 서열에 연결된 CBA(chicken beta actin)를 패키징하는 AAV 벡터를 1 x 1011 vg의 용량으로 꼬리 정맥 주사를 통해 C57/Bl6 마우스에 투여했다. 주사 후 14일차에 마우스를 희생시키고, 조직을 회수하고, 절단하고, 용해시키고, 뇌, 심장, 간, 및 골수 조직에 대해 상대적 형질도입 수준을 검출하기 위해 루시퍼라아제 분석을 수행했다. 데이터를 그램(gram) 조직 당 RLU로 정규화시켰다. 뇌에서, AAV1R6, AAV1R7 및 AAV1RX는 AAVrh.10 만큼 높지는 않으나, 상당한 형질도입 수준을 보인다 (도 3). 키메라 캡시드는 추가적으로 심장에서 모 AAV1 및 AAVrh.10에 유사한 형질도입 수준을 보인다. 척수에서, 키메라에 대한 형질도입 수준은 모 벡터들 사이의 중간인 것으로 보인다. 두드러지게, 이 데이터는 AAV1R6, AAV1R7 및 AAV1RX가 모두 간-탈표적화된다는 것을 더 보여준다. N=3.
AAV1R6
키메라 캡시드의 구조적 분석은 BBB의 통과를 가능하게 할 수 있는 AAVrh.10으로부터의 3개의 잠재적 도메인을 확인한다
서열 분석은 AAV1R6은 AAV1과 97-98% 동일하고, 18개의 독특한 아미노산 잔기들은 AAVrh.10으로부터 유래되었다는 것을 밝혔다. AAV1R7은 또한 AAV1과 대부분 동일하나, AAV1R6에 존재하는 18개의 잔기를 포함한 총 22개의 AAVrh.10-유래 잔기를 갖는다. AAV1R7에 독특한 4개의 추가적인 잔기 중에서, 2개가 VP1u(VP1 unique) N-말단 영역(189I, 206A)에 위치하고, 나머지 2개는 매립된(buried) VP3 N-말단 영역(224S 및 225S)에 위치한다. 이러한 잔기들은 캡시드 표면에 노출되지 않고, 인 비트로 데이터는 AAV1R6 및 AAV1R7에 의해 보여지는 형질도입 프로파일이 동등하다는 것을 시사하므로(도 7 및 8), 본 발명자들은 나머지 분석에서 AAV1R7을 배제하고 AAV1R6에만 집중했다.
AAV1R6은 AAVrh.10 모 주(parental strain)로부터 유래된 비-보존적 잔기들의 3개의 신장부(stretch)를 갖는다. 잔기들의 제 1 그룹(그룹 i)은 VP1u 영역 내에 3개의 아미노산(148P, 152R 및 153S)을 포함한다 (도 9A). 구체적으로, 하나의 잔기는 VP1의 제1 NLS(nuclear localization signal)을 포함하는, BR1(basic region 1)에 인접하여 위치한다. 추가적으로, 그룹 i은 VP2 N-말단 영역 내에 위치한 NLS 부근에 2개의 잔기(158T 및 163K)를 포함한다(도 9A). 앞서 언급된 바와 같이, 이 잔기들은 표면-노출되지 않고, 대신에 나중에 세포내 이동 경로(intracellular trafficking pathway)에 들어갈 때까지 내재된 상태로(internalized) 유지된다.
AAV1R6에 존재하는 AAVrh.10-유래 잔기들의 제 2 그룹(그룹 ii)은 VR-I(variable region I)에 위치한, BC 루프를 구성하는 8개의 아미노산으로 구성된다(도 9A 및 9B). 이 잔기들은 3-겹 대칭축에서 돌출부의 기부(base)에 있는 캡시드의 표면에 노출되고(도 9D 및 9F) 또한 2-겹 대칭축에 있는 함몰부에도 배치된다 (도 9C 및 9F). AAVrh.10 상에 있는 아미노산 잔기들의 이 그룹은 전신 투여 후 CNS를 투과할 수 없는 키메라 AAV1R8/19/20 캡시드에 있는 AAV1 잔기들로 치환된다.
AAV1R6에 존재하는 AAVrh.10-유래 잔기들의 제 3 그룹(그룹 iii)은 총 6개의 아미노산을 포함한다. 이 잔기들 중 4개(328Q, 330E, 332T 및 333K)는 5-겹 대칭축에서 포어(pore)의 형성에 기여하는, DE 루프 내에 있는, VR-II에 위치한다(도 9A, 9B, 9E, 9F). 이 그룹 내의 나머지 2개의 잔기들(343I 및 347T)은 캡시드의 내부에 위치한, β-스트랜드(strand) E 내에 배치된다(도 9A 및 9B). 이 잔기들은 AAV1과 AAVrh.10 간에 상이하나, 그들은 상이한 AAV 혈청형에 대해 비교적 보존된다는 것에 주목해야 한다.
BBB 통과를 위한 AARrh.10으로부터 최소 족문을 갖는 키메라 캡시드, AAV1RX의 합리적 설계(rational design)
합리적 방식(rational approach)을 이용하여, 본 발명자들은 BBB의 통과를 가능하게 하고 CNS 친화성을 부여하는 IR6 족문 중 최소 개수의 AAVrh.10-유래 아미노산 잔기들을 줄였다. 본 발명자들은 먼저 캡시드 표면에 노출되지 않는 아미노산을 배제하여, 캡시드 서열의 VP1/2 N-말단 영역 내에 위치한 일련의 잔기들(stretches of residues)을 제거했다(148P, 152R, 153S, 158T 및 163K). 동일한 근거(rationale)를 이용하여, 본 발명자들은 또한 보존된 β-스트랜드 E 내의 잔기들(343I 및 347T) 및 β-스트랜드 D와 E를 연결하는 포어-형성 루프(pore-forming loop)인 VR-II 내에 위치한 잔기들 (328Q, 330E, 332T 및 333K)을 배제시켰다. 이 방식을 통해, AAV1R6 상에서 β-스트랜드 B와 C를 연결하는 루프, VR-I에서 발견되는 8개의 아미노산(263N, 264G, 265T, 266S, 268G (AAV1 서열 대비 삽입), 269S, 270T 및 274T)을 포함하는 족문을 추가적인 평가를 위해 선택했다(도 11A 및 11B). 이러한 표면-노출 잔기들은 2-겹 대칭축에 있는 함몰부 주위 (도 11C 및 11F) 및 3-겹 대칭축 돌출부(three-fold protrusion)(도 11D 및 11F)에 위치한다. 3-겹 대칭축에 있는 표면-노출 잔기들의 입체 로드맵 투영도는 캡시드 표면에 있는 둘러싸는(surrounding) 아미노산 대비 이러한 8개의 잔기들의 위상 배향(topographical orientation)을 강조한다 (도 11G). 앞서 언급되 바와 같이, 본 발명자들은 또한 이들 아미노산이 전신 투여 후 뇌 실질을 형질도입할 수 없는 AAV1R8/19/20 변이체에 부재했다는 것을 고려했다.
그 후, 본 발명자들은 AAVrh.10으로부터의 8개의 아미노산 잔기들을 AAV1 혈청형에 이식(graft)시키는 것에 의해 키메라 캡시드를 생성하고, 이를 키메라 AAV1RX로 명명했다. 본 발명자들은 6-8주령 암컷 C57/Bl6 마우스에 꼬리 정맥 주사를 통해 마우스당 5 x 1011 vg의 용량으로 AAV1RX-CBh-scGFP 벡터를 투여했다. 주사 후 21일차에 면역염색에 의해 뇌에서 GFP 리포터 발현을 평가했다. 도 11H에 도시된 바와 같이, AAV1RX는 운동 피질 내 뉴런 및 전체 피질에서 피질 뉴런(cortical neurons)에 형질도입하나, 앞서 키메라 캡시드 AAV1R6 및 AAV1R7에 대해 보여진 바와 같이, 신경교의 제한된 형질도입 및 감소된 혈관 형질도입을 보였다. 이러한 경향을 지속하여, 치상회 중 다량의 GFP+ 과립 세포와 함께 다수의 GFP+ 피라미드 뉴런(pyramidal neuron)이 해마에서 관찰되었다. 두드러지게, 이 영역들에서 GFP+ 신경교 세포 및 내피 세포는 거의 부재한다. 시상에서, AAV1RX는 AAV1R6 및 AAV1R7과 유사한 수준에서 강건한 뉴런 형질도입을 보이고, 다른 뇌 영역에서보다 더 높은 수준이기는 하나, 신경교 및 내피 세포에서 적당한 형질도입을 보인다. 시상하부에서, GFP+ 뉴런은 드물고, 소수(few)의 GFP+ 신경교 및 혈관 내피 세포가 관찰된다. 마지막으로, AAV1RX에 의해 보여지는 우선적 뉴런 형질도입 프로파일이 또한 선조체(특히, 미상핵 피각) 및 편도체 내에서 관찰된다(도 11H). 이러한 뇌 영역의 정량적 분석 및 AAV1, AAVrh.10 및 키메라 AAV1R6 및 AAV1R7 벡터에 대해 관찰된 것들과의 비교는 AAVrh.10으로부터의 8개의 아미노산 잔기들의 최소 족문이 BBB의 통과를 매우 중요하다(critical)는 것을 시사한다(도 13).
AAV1R6
,
AAV1R7
및
AAV1RX는
말초 조직에서 낮은 형질도입 수준 및
생체내분포를
매개한다.
상이한 키메라 캡시드와 모 혈청형의 비교 분석을 수행하기 위해, 6-8 주령 암컷 C57/Bl6 마우스에 꼬리 정맥을 통해 동물당 1 x 1011 vg의 용량으로 CBA(chicken beta actin) 프로모터에 의해 구동되는 단일-가닥 루시퍼라아제 리포터 형질전환 유전자(ssCBA-Luc)를 패키징하는 AAV1, AAVrh.10, AAV1R6, AAV1R7 또는 AAV1RX 벡터를 주사했다. 주사 후 2주 차에, 마우스를 희생시키고, 조직을 회수했다. 벡터 생체내 분포를 결정하기 위해 qPCR 분석 및 조직 용해물에 대한 루시퍼라아제 활성 분석을 수행했다(도 12). AAV1 대비, 모든 3종의 키메라 벡터가 보다 높은 루시퍼라아제 형질전환 유전자 발현을 매개하고, 각각에 대해 바이러스 게놈 카피의 상응하는 증가가 뇌 내에서 관찰된다(도 12A 및 12B). 그러나, 그들의 형질전환 유전자 발현 및 바이러스 게놈 카피수는 AAVrh.10 대비 뇌에서 ~2 내지 3배 더 낮았고, 이는 AV1RX 생체내분포를 제외하고는 모두 통계적으로 유의한 것으로 확인되었다(도 12A 및 12B). AAV1RX에 대해 관찰된 심장 형질도입 수준에서의 일부 변이에도 불구하고, AAV1에 대해 관찰된 것들과 비슷하게, 심장에서 AAV1R6, AAV1R7 및 AAV1RX에 대해 유사한 형질도입 수준 및 바이러스 게놈 카피 수가 관찰되었다(도 12C 및 12D). AAVrh.10는 나머지 벡터 대비, ~2-4-배 더 높은 심장 루시퍼라아제 발현을 매개하고, 심장에서 상응하게 ~2-배 더 높은 바이러스 게놈 카피수를 보였다(도 12C 및 12D). 다른 그룹들에 의해 입증된 바와 같이, AAVrh.10은 가에서 수배 더 높은 루시퍼라아제 형질전환 유전자 발현 수준 및 일관되게 높은 바이러스 게놈 카피를 보였다. 대조적으로, AAV1, 1R6, 1R7 및 1RX에 대해, 간에서 낮은 수준 내지 백그라운드 수준의(low to background level) 루시퍼라아제 발현 및 유의성 있게 감소된 바이러스 게놈 카피가 검출되었다 (도 12E 및 12F). 신장에서 AAVrh.10에 대해 루시퍼라아제 발현 및 상응하는 바이러스 게놈 카피 수의 경향이 검출되었다는 것이 주목할 만하다(도 12G 및 12H). 3개의 키메라 벡터가 유사한 바이러스 게놈 카피 수 수준을 보였으나, 신장에서 루시퍼라아제 발현은 없었다. 종합하면, 이 데이터는 키메라 AAV1R6, 1R7 및 1RX 벡터가 간으로부터 탈-표적화되고, 신장에 의해 혈액 순환으로부터 제거될 수 있다는 것을 시사하는 것으로 보인다.
정맥내 투여 후, 본 발명자들은 BBB의 통과를 가능하게 하게 효율적으로 CNS에 형질도입하는 벡터의 서브세트를 식별했다. BBB를 통과하는 능력은 세포 배양물중 감염성 및 뉴라미다아제(neuraminidase)에 대한 감수성과 역으로(inversely) 상관되는 것으로 확인되었다. 구조적 모델링 및 로드맥 분석은 또한 뇌 혈관계에서의 수송 및 광범위한 뉴런 형질도입을 가능하게 하는 AAVrh.10 중 잔기들의 여러 핵심 클러스터를 확인하는데 기여하였다. 뒤이어, 본 발명자들은 합리적 돌연변이생성 방식(rational mutagenesis approach)를 통해 이 족문의 크기를 더 줄일 수 있었고, 그 후, 인 비보에서 기능적으로 검증되었다. 결론적으로, 본 발명자들은 다른 AAV 주에 이식되면, BBB를 통한 수송을 허용하고 AAVrh.10 대비 보다 표적화된 CNS 형질도입 프로파일을 가능하게 하는, AAVrh.10 유래 최소 족문(minimal footprint)을 확인했다. 또한, 결과적으로 수득된 캡시드는 뇌 혈관계, 간, 및 기타 말초 조직으로부터 탈표적화된다. 이 신규한 신경친화성 족문(neurotropic footprint)의 기능적 맵핑은 개선된 안전성 프로파일로 효율적인 CNS 유전자 전달을 위한 합성 AAV 캡시드를 제조(engineer)하기 위한 로드맵을 제공한다.
본 연구에서 키메라 캡시드 라이브러리를 생성하기 위해 사용된 모 혈청형, AAV1 및 AAVrh.10은 모두 두개의 상이한 클레이드에 속하는 -AAV1은 클레이드 A에 속하고, AAVrh.10은 클레이드 EDP 속함- 비-인간 영장류 단리물(non-human primate isolate)이다. 그들 간의 진화적 거리에도 불구하고, 그들은 Cap 유전자 간에 ~85% 서열 상동성을 공유한다. AAV1은 N-결합 시알산(Sia)을 인식하는 것으로 알려져 있고, AAV1 캡시드 상에 Sia 인식 족문을 구성하는 핵심 잔기들이 최근에 보고되었다. 현재의 연구는 262N, 263G, 264T, 265S, 267G, 268S, 269T 및 273T가 BBB의 통과를 위해 필수적인, AAVrh.10으로부터 유래된 키메라 AAV1RX 캡시드 상의 핵심 잔기들로 파악했다. AAV1에 대한 Sia 접촉 잔기들 중 어느 것도 키메라 1RX 족문 내에 위치하지 않으나, 잔기 S268, D271, 및 N272의 백본 카르보닐 산소 원자가 아마 캡시드-글리칸 상호작용(capsid-glycan interaction)을 안정화시키고, Sia 결합 친화도를 증가시키는데 관련되었다. 또한, 이 위치에 있는 잔기들(D271 및 N272)은 AAV9 상의 갈락토오스-결합 족문 내에 위치한다. 따라서, 현재의 연구는 VR-I 내의 잔기들이 매우 중요하다는 견해를 뒷받침한다.
천연 AAV 단리물의 VP3 서열의 정렬은 AAV1RX에 CNS 표현형을 부여하는 8개의 아미노산 잔기들이 AAVrh.8 및 AAVrh.39, 클레이드 E의 기타 신경친화성 캡시드에서 보존된다는 것을 밝힌다(도 14). 유사하게, 또한 클레이드 E 내에 위치한, AAV8 및 AAVrh.39도 훨씬 덜 효율적이나, BBB를 통과하는 능력을 보인다. 이들은 둘다 이 족문 중 8개의 잔기 중 7개를 소유하고; 따라서, 이 캡시드들에 완전한 족문을 도입하는 것은 아마 그들이 BBB를 통과하는 능력을 강화할 것이다.
표현형적으로, AAV1과 AAVrh.10은 그들이 BBB를 통과하고 뇌에서 뉴런 및 신경교에 형질도입하는 능력이 크게 다르다. 정맥내로 전달되는 경우, AAV1은 혈관 내피 세포에서 우선적 흡수 및 형질도입을 보인다. 대조적으로, AAVrh.10은 혈관 내피 세포에 의해 흡수되고 형질도입할 뿐 아니라, 혈관계를 횡단하고 CNS 또는 골격 근육과 같은 기저 조직(underlying tissue)에 형질도입시키는 것으로 보인다. 현재의 연구는 부분적으로 AAV1 캡시드에 이러한 형질을 부여하는 AAVrh.10 캡시드 상의 최소 세트의 잔기들을 식별한다. AAV1RX 키메라 상의 이러한 최소 족문이 BBB의 횡단 및 뉴런의 형질도입에 필수적인 것으로 보이나, 간과 같은 말초 조직에서의 형질도입은 크게 감소되고, 심장 발현은 AAV1의 것과 유사하게 유지된다. 이러한 차이는 AAVrh.10 캡시드 상의 다른 구조적 도메인이 전신 형질도입 프로파일(systemic transduction profile)을 부여하는데 있어서 역할을 할 수 있다는 것을 시사한다. 뇌 실질의 경우, CNS 진입 후, AAV1RX의 진입-후 형질도입 프로파일이 우선적으로 뉴론성이며, 신경교 형질도입은 AAVrh.10에 비해 감소된다는 것을 주목하는 것이 중요하다. 이는 캡시드의 대부분이 뇌실내(intracerebroventricular) 주사 후 우선적 뉴론 형질도입을 매개하는 것으로 알려진 AAV1으로부터 유래된다는 사실에서 기인될 수 있다. 또한, 1RX가 BBB를 통과하는 미지의 메카니즘이 우선적 뉴론 흡수(preferential neuronal uptake)를 매개하거나 AAVrh.10 캡시드 상의 추가적인 모티프/아미노산 잔기가 신경교 형질도입에서 진입-후 단계들을 매개할 수 있다는 것이 또한 가능하다.
임상적 관점에서, BBB를 횡단할 수 있고, 뇌 내에서 우선적으로 뉴런에 형질도입하고, 동시에 간으로부터 탈표적화되는 캡시드는 전신 투여 경로로부터 CNS-표적화 유전자 전달 응용을 위한 개선된 안전성 프로파일을 보여줄 수 있다. 말초 기관, 특히, 간에서 감소된 벡터 흡수는 특정 AAV 혈청형의 전신 주사 후 환자 혈청 중 트랜스아미나아제(transaminase)의 일시적 상승에 의해 입증된 바와 같이, 간독성의 잠재적 위협을 감소시킬 수 있다.
AAV1R6/7/X 벡터는 전체(global) CNS 유전자 전달을 위해, 및 특히, 프레드릭 실조증(Friedreich's Ataxia) 또는 척수성 근위축증과 같은 신경 질환을 치료하기 위한 유전자 치료 전략을 개발하기 위해 광범위하게 이용될 수 있다.
GenBank Accession Number | GenBank Accession Number | GenBank Accession Number | |||
완전 게놈 | Hu S17 | AY695376 | Hu66 | AY530626 | |
Adeno -associated virus 1 | NC_002077, AF063497 | Hu T88 | AY695375 | Hu42 | AY530605 |
Adeno -associated virus 2 | NC_001401 | Hu T71 | AY695374 | Hu67 | AY530627 |
Adeno -associated virus 3 | NC_001729 | Hu T70 | AY695373 | Hu40 | AY530603 |
Adeno -associated virus 3B | NC_001863 | Hu T40 | AY695372 | Hu41 | AY530604 |
Adeno -associated virus 4 | NC_001829 | Hu T32 | AY695371 | Hu37 | AY530600 |
Adeno -associated virus 5 | Y18065, AF085716 | Hu T17 | AY695370 | Rh40 | AY530559 |
Adeno -associated virus 6 | NC_001862 | Hu LG15 | AY695377 | Rh2 | AY243007 |
Avian AAV ATCC VR-865 | AY186198, AY629583, NC_004828 | Clade C | Bb1 | AY243023 | |
Avian AAV strain DA-1 | NC_006263, AY629583 | Hu9 | AY530629 | Bb2 | AY243022 |
Bovine AAV | NC_005889, AY388617, AAR26465 | Hu10 | AY530576 | ||
AAV11 | AAT46339, AY631966 | Hu11 | AY530577 | Rh10 | AY243015 |
AAV12 | ABI16639, DQ813647 | Hu17 | AY530582 | ||
Clade A | Hu53 | AY530615 | Hu6 | AY530621 | |
AAV1 | NC_002077, AF063497 | Hu55 | AY530617 | Rh25 | AY530557 |
AAV6 | NC_001862 | Hu54 | AY530616 | Pi2 | AY530554 |
Hu.48 | AY530611 | Hu7 | AY530628 | Pi1 | AY530553 |
Hu 43 | AY530606 | Hu18 | AY530583 | Pi3 | AY530555 |
Hu 44 | AY530607 | Hu15 | AY530580 | Rh57 | AY530569 |
Hu 46 | AY530609 | Hu16 | AY530581 | Rh50 | AY530563 |
Clade B | Hu25 | AY530591 | Rh49 | AY530562 | |
Hu.19 | AY530584 | Hu60 | AY530622 | Hu39 | AY530601 |
Hu.20 | AY530586 | Ch5 | AY243021 | Rh58 | AY530570 |
Hu 23 | AY530589 | Hu3 | AY530595 | Rh61 | AY530572 |
Hu22 | AY530588 | Hu1 | AY530575 | Rh52 | AY530565 |
Hu24 | AY530590 | Hu4 | AY530602 | Rh53 | AY530566 |
Hu21 | AY530587 | Hu2 | AY530585 | Rh51 | AY530564 |
Hu27 | AY530592 | Hu61 | AY530623 | Rh64 | AY530574 |
Hu28 | AY530593 | Clade D | Rh43 | AY530560 | |
Hu 29 | AY530594 | Rh62 | AY530573 | AAV8 | AF513852 |
Hu63 | AY530624 | Rh48 | AY530561 | Rh8 | AY242997 |
Hu64 | AY530625 | Rh54 | AY530567 | Rh1 | AY530556 |
Hu13 | AY530578 | Rh55 | AY530568 | Clade F | |
Hu56 | AY530618 | Cy2 | AY243020 | Hu14 (AAV9) | AY530579 |
Hu57 | AY530619 | AAV7 | AF513851 | Hu31 | AY530596 |
Hu49 | AY530612 | Rh35 | AY243000 | Hu32 | AY530597 |
Hu58 | AY530620 | Rh37 | AY242998 | Clonal Isolate | |
Hu34 | AY530598 | Rh36 | AY242999 | AAV5 | Y18065, AF085716 |
Hu35 | AY530599 | Cy6 | AY243016 | AAV 3 | NC_001729 |
AAV2 | NC_001401 | Cy4 | AY243018 | AAV 3B | NC_001863 |
Hu45 | AY530608 | Cy3 | AY243019 | AAV4 | NC_001829 |
Hu47 | AY530610 | Cy5 | AY243017 | Rh34 | AY243001 |
Hu51 | AY530613 | Rh13 | AY243013 | Rh33 | AY243002 |
Hu52 | AY530614 | Clade E | Rh32 | AY243003 | |
Hu T41 | AY695378 | Rh38 | AY530558 |
표 2.
AAV
혈청형 1, 2, 3, 6, 7, 8, 9, 및
rh10
중 AAR1R7 변형.
AAV1R7 잔기 변화 | |||||||
AAV1 | AAV2 | AAV3 | AAV6 | AAV7 | AAV8 | AAV9 | AAVrh .10 |
Q148P | H148P | Q148P | Q148P | P148P | P148P | Q148P | P148P |
- | -151Q | -151Q | - | - | - | -151Q | - |
E152R | V151R | Q152R | E152R | Q152R | R152R | Q152R | R152R |
-153S | E152S | E153S | -153S | S153S | S153S | E153S | S153S |
S157T | S158T | S158T | S157T | T158T | T158T | A158T | T158T |
T162K | A163K | S163K | T162K | K163K | K163K | S163K | K163K |
L188I | L189I | L189I | L188I | L189I | L189I | I189I | I189I |
S205A | T206A | S206A | S205A | A206A | A206A | S206A | A206A |
N223S | N224S | N224S | N223S | N224S | S224S | S224S | S224S |
A224S | S225S | S225S | A224S | A225S | S225S | S225S | S225S |
S262N | S263N | S263N | S262N | S263N | S263N | N263N | N263N |
A263G | Q264G | Q264G | A263G | E264G | G264G | S264G | G264G |
S264T | S265T | S265T | S264T | T265T | T265T | T265T | T265T |
T265S | -266S | G266S | T265S | A266S | T266S | S266S | S266S |
-267G | -267G | -267G | -267G | -267G | G267G | G267G | G267G |
- | - | -268G | - | - | - | - | - |
A267S | A269S | A269S | A267S | S269S | A269S | S269S | S269S |
S268T | S270T | S270T | S268T | T270T | T270T | S270T | T270T |
H272T | H274T | H274T | H272T | T274T | T274T | A274T | T274T |
T326Q | Q328Q | Q328Q | T326Q | T328Q | Q328Q | D328Q | Q328Q |
D328E | D330E | D330E | D328E | D330E | E330E | N330E | E330E |
V330T | T332T | T332T | V330T | V332T | T332T | V332T | T332T |
T331K | T333K | T333K | T331K | T333K | K333K | K333K | K333K |
V341I | V343I | V343I | V341I | I343I | I343I | V343I | I343I |
S345T | T347T | T347T | S345T | S347T | T347T | T347T | T347T |
*번호부여(Numbering)는 야생형에 근거함.
표
3. 아미노산 잔기 및 약자
.
아미노산 잔기 | 약자 | |
3-문자 코드 | 1-문자 코드 | |
알라닌(Alanine) | Ala | A |
아르기닌(Arginine) | Arg | R |
아스파라긴(Asparagine) | Asn | N |
아스파르트산(Aspartic acid) (Aspartate) | Asp | D |
시스테인(Cysteine) | Cys | C |
글루타민(Glutamine) | Gln | Q |
글루탐산(Glutamic acid) (Glutamate) | Glu | E |
글리신(Glycine) | Gly | G |
히스티딘(Histidine) | His | H |
이소루이신(Isoleucine) | Ile | I |
루이신(Leucine) | Leu | L |
라이신(Lysine) | Lys | K |
메티오닌(Methionine) | Met | M |
페닐알라닌(Phenylalanine) | Phe | F |
프롤린(Proline) | Pro | P |
세린(Serine) | Ser | S |
트레오닌(Threonine) | Thr | T |
트립토판(Tryptophan) | Trp | W |
티로신(Tyrosine) | Tyr | Y |
발린(Valine) | Val | V |
참고문헌
하기 문헌은 모든 목적을 위해 그 전체가 참조에 의해 본 명세서에 포함된다.
1. Berns, K and Parrish, C (2007). Parvoviridae. Knipe DM, Howley PM, Griffin DE, Lamb RA, Martin MA, Roizman B, Straus SE (ed), Fields Virol . 5th ed, vol II., Lippincott Williams & Wilkins, Philadelphia, PA: pp 2437-2477.
2. Gao, G, Vandenberghe, LH, Alvira, MR, Lu, Y, Calcedo, R, Zhou, X, et al. (2004). Clades of Adeno-associated viruses are widely disseminated in human tissues. J. Virol . 78: 6381-8.
3. Gao, G, Alvira, MR, Somanathan, S, Lu, Y, Vandenberghe, LH, Rux, JJ, et al. (2003). Adeno-associated viruses undergo substantial evolution in primates during natural infections. Proc . Natl . Acad . Sci . U. S. A. 100: 6081-6086.
4. Agbandje-McKenna, M and Kleinschmidt, J (2011). AAV capsid structure and cell interactions. Methods Mol . Biol . 807: 47-92.
5. Madigan, VJ and Asokan, A (2016). Engineering AAV receptor footprints for gene therapy. Curr . Opin . Virol . 18: 89-96.
6. Huang, LY, Halder, S and Agbandje-McKenna, M (2014). Parvovirus glycan interactions. Curr . Opin . Virol . 7C: 108-118.
7. Kashiwakura, Y, Tamayose, K, Iwabuchi, K, Hirai, Y, Shimada, T, Matsumoto, K, et al. (2005). Hepatocyte Growth Factor Receptor Is a Coreceptor for Adeno-Associated Virus Type 2 Infection. J. Virol . 79: 609-614.
8. Weller, ML, Amornphimoltham, P, Schmidt, M, Wilson, PA, Gutkind, JS and Chiorini, JA (2010). Epidermal growth factor receptor is a co-receptor for adeno-associated virus 26 serotype 6. Nat. Med . 16: 662-4.
9. Di Pasquale, G, Davidson, BL, Stein, CS, Martins, I, Scudiero, D, Monks, A, et al. (2003). Identification of PDGFR as a receptor for AAV-5 transduction. Nat. Med . 9: 1306-12.
10. Asokan, A, Hamra, JB, Govindasamy, L, Agbandje-McKenna, M and Samulski, RJ (2006). Adeno-associated virus type 2 contains an integrin alpha5beta1 binding domain essential for viral cell entry. J. Virol. 80: 8961-9.
11. Pillay, S, Meyer, NL, Puschnik, AS, Davulcu, O, Diep, J, Ishikawa, Y, et al. (2016). An essential receptor for adeno-associated virus infection. Nature 530: 108-112.
12. Murlidharan, G, Samulski, RJ and Asokan, A (2014). Biology of adeno-associated viral vectors in the central nervous system. Front. Mol . Neurosci. 7: 1-9.
13. Murlidharan, G, Crowther, A, Reardon, RA, Song, J and Asokan, A (2016). Glymphatic fluid transport controls paravascular clearance of AAV vectors from the brain. JCI Insight 1: 1-11.
14. Ballabh, P, Braun, A and Nedergaard, M (2004). The blood-brain barrier: An overview: Structure, regulation, and clinical implications. Neurobiol. Dis . 16: 1-13.
15. Williams, DW, Eugenin, EA, Calderon, TM and Berman, JW (2012). Monocyte maturation, HIV susceptibility, and transmigration across the blood brain barrier are critical in HIV neuropathogenesis. J. Leukoc. Biol . 91: 401-15.
16. Salinas, S, Schiavo, G and Kremer, EJ (2010). A hitchhiker's guide to the nervous system: the complex journey of viruses and toxins. Nat. Rev. Microbiol . 8: 645-655.
17. Yang, B, Li, S, Wang, H, Guo, Y, Gessler, DJ, Cao, C, et al. (2014). Global CNS transduction of adult mice by intravenously delivered rAAVrh.8 and rAAVrh.10 and nonhuman primates by rAAVrh.10. Mol . Ther. 22: 1299-1309.
18. Rosenberg, JB, Sondhi, D, Rubin, DG, Monette, S, Chen, A, Cram, S, et al. (2014). Comparative Efficacy and Safety of Multiple Routes of Direct CNS Administration of Adeno-Associated Virus Gene Transfer Vector Serotype rh.10 Expressing the Human Arylsulfatase A cDNA to Nonhuman Primates. Hum. Gene Ther . Dev .doi:10.1089/humc.2013.239 [doi].
19. Gray, SJ, Matagne, V, Bachaboina, L, Yadav, S, Ojeda, SR and Samulski, RJ (2011). Preclinical differences of intravascular AAV9 delivery to neurons and glia: a comparative study of adult mice and nonhuman primates. Mol. Ther . 19: 1058-1069.
20. Zhang, H, Yang, B, Mu, X, Ahmed, SS, Su, Q, He, R, et al. (2011). Several rAAV vectors efficiently cross the blood-brain barrier and transduce neurons and astrocytes in the neonatal mouse central nervous system. Mol . Ther. 19: 1440-1448.
21. Cearley, CN, Vandenberghe, LH, Parente, MK, Carnish, ER, Wilson, JM and Wolfe, JH (2008). Expanded repertoire of AAV vector serotypes mediate unique patterns of transduction in mouse brain. Mol . Ther . 16: 1710-8.
22. Grieger, JC, Snowdy, S and Samulski, RJ (2006). Separate Basic Region Motifs within the Adeno-Associated Virus Capsid Proteins Are Essential for Infectivity and Assembly. J. Virol . 80: 5199-5210.
23. Sonntag, F, Bleker, S, Leuchs, B, Fischer, R and Kleinschmidt, JA (2006). Adeno-associated virus type 2 capsids with externalized VP1/VP2 trafficking domains are generated prior to passage through the cytoplasm and are maintained until uncoating occurs in the nucleus. J. Virol . 80: 11040-11054.
24. Bowles, DE, McPhee, SW, Li, C, Gray, SJ, Samulski, JJ, Camp, AS, et al. (2012). Phase 1 gene therapy for Duchenne muscular dystrophy using a translational optimized AAV vector. Mol . Ther . 20: 443-455.
25. Li, C, Diprimio, N, Bowles, DE, Hirsch, ML, Monahan, PE, Asokan, A, et al. (2012). Single amino acid modification of adeno-associated virus capsid changes transduction and humoral immune profiles. J. Virol . 86: 7752-7759.
26. Bleker, S, Sonntag, F and Kleinschmidt, JA (2005). Mutational analysis of narrow pores at the fivefold symmetry axes of adeno-associated virus type 2 capsids reveals a dual role in genome packaging and activation of phospholipase A2 activity. J. Virol . 79: 2528-2540.
27. Wu, Z, Miller, E, Agbandje-McKenna, M and Samulski, RJ (2006). Alpha2,3 and alpha2,6 N-linked sialic acids facilitate efficient binding and transduction by adeno-associated virus types 1 and 6. J. Virol . 80: 9093-103.
28. Huang, L-Y, Patel, A, Ng, R, Miller, EB, Halder, S, Mckenna, R, et al. Characterization of the Adeno-Associated Virus 1 and 6 Sialic Acid Binding Sitedoi:10.1128/JVI.00161-16.
29. Bell, CL, Gurda, BL, Vliet, K Van, Agbandje-McKenna, M and Wilson, JM (2012). Identification of the galactose binding domain of the AAV9 capsid. J. Virol . 86: 7326-7333.
30. Rosenberg, JB, Sondhi, D, Rubin, DG, Monette, S, Chen, A, Cram, S, et al. (2014). Comparative efficacy and safety of multiple routes of direct CNS administration of adeno-associated virus gene transfer vector serotype rh.10 expressing the human arylsulfatase A cDNA to nonhuman primates. Hum. Gene Ther . Clin . Dev . 25: 164-77.
31. Cearley, CN and Wolfe, JH (2006). Transduction characteristics of adeno-associated virus vectors expressing cap serotypes 7, 8, 9, and Rh10 in the mouse brain. Mol . Ther . 13: 528-37.
32. Hadaczek, P, Forsayeth, J, Mirek, H, Munson, K, Bringas, J, Pivirotto, P, et al. (2009). Transduction of nonhuman primate brain with adeno-associated virus serotype 1: vector trafficking and immune response. Hum. Gene Ther . 20: 225-237.
33. Chen, S, Kapturczak, M, Loiler, SA, Zolotukhin, S, Glushakova, OY, Madsen, KM, et al. (2005). Efficient Transduction of Vascular Endothelial Cells with Recombinant Adeno-Associated Virus Serotype 1 and 5 Vectors. Hum. Gene Ther . 16: 235-247.
34. Pulicherla, N, Shen, S, Yadav, S, Debbink, K, Govindasamy, L, Agbandje-McKenna, M, et al. (2011). Engineering Liver-detargeted
AAV9
Vectors for Cardiac and Musculoskeletal Gene Transfer. Mol . Ther . 19: 1070-1078.
35. Asokan, A, Conway, JC, Phillips, JL, Li, C, Hegge, J, Sinnott, R, et al. (2010). Reengineering a receptor footprint of adeno-associated virus enables selective and systemic gene transfer to muscle. Nat. Biotechnol . 28: 79-82.
36. Nathwani, AC, Reiss, UM, Tuddenham, EGD, Rosales, C, Chowdary, P, McIntosh, J, et al. (2014). Long-term safety and efficacy of factor IX gene therapy in hemophilia B. N. Engl . J. Med . 371: 1994-2004.
37. Mingozzi, F and High, KA (2013). Immune responses to AAV vectors: overcoming barriers to successful gene therapy. Blood 122: 23-36.
38. Kumar, S, Stecher, G and Tamura, K (2016). MEGA7: Molecular Evolutionary Genetics Analysis Version 7.0 for Bigger Datasets. Mol . Biol . Evol. 33: 1870-4.
39. Saitou, N and Nei, M (1987). The neighbor-joining method: a new method for reconstructing phylogenetic trees. Mol . Biol . Evol . 4: 406-25.
40. Felsenstein, J (1985). CONFIDENCE LIMITS ON PHYLOGENIES: AN APPROACH USING THE BOOTSTRAP. Evolution (NY). 39: 783-791.
41. Murlidharan, G, Sakamoto, K, Rao, L, Corriher, T, Wang, D, Gao, G, et al. (2016). CNS-restricted Transduction and CRISPR/Cas9-mediated Gene Deletion with an Engineered AAV Vector. Mol . Ther . - Nucleic Acids 5: e338.
42. Lein, ES, Hawrylycz, MJ, Ao, N, Ayres, M, Bensinger, A, Bernard, A, et al. (2007). Genome-wide atlas of gene expression in the adult mouse brain. Nature 445: 168-176.
43. Miller, EB, Gurda-Whitaker, B, Govindasamy, L, McKenna, R, Zolotukhin, S, Muzyczka N, et al. (2006). Production, purification and preliminary X-ray crystallographic studies of adeno-associated virus serotype 1. Acta Crystallogr . Sect. F Struct . Biol . Cryst. Commun . 62: 1271-1274.
44. Bordoli, L, Kiefer, F, Arnold, K, Benkert, P, Battey, J and Schwede, T (2008). Protein structure homology modeling using SWISS-MODEL workspace. Nat. Protoc . 4: 1-13.
45. Nam, HJ, Lane, MD, Padron, E, Gurda, B, McKenna, R, Kohlbrenner, E, et al. (2007). Structure of adeno-associated virus serotype 8, a gene therapy vector. J. Virol . 81: 12260-12271.
46. Krissinel, E and Henrick, K (2004). Secondary-structure matching (SSM), a new tool for fast protein structure alignment in three dimensions. Acta Crystallogr. Sect. D Biol. Crystallogr. 60: 2256-2268.
47. Emsley, P, Lohkamp, B, Scott, WG and Cowtan, K (2010). Features and development of Coot. Acta Crystallogr . D. Biol . Crystallogr . 66: 486-501.
48. Carrillo-Tripp, M, Shepherd, CM, Borelli, IA, Venkataraman, S, Lander, G, Natarajan, P, et al. (2009). VIPERdb2: an enhanced and web API enabled relational database for structural virology. Nucleic Acids Res. 37: D436-42.
49. Xiao, C and Rossmann, MG (2007). Interpretation of electron density with stereographic roadmap projections. J. Struct . Biol . 158: 182-187.
<110> The University of North Carolina at Chapel Hill
Asokan, Aravind
Murlidharan, Giridhar
Albright, Blake
<120> METHODS AND COMPOSITIONS FOR GENE TRANSFER ACROSS THE VASCULATURE
<130> 5470-804WO
<150> US 62/459,286
<151> 2017-02-15
<160> 46
<170> PatentIn version 3.5
<210> 1
<211> 736
<212> PRT
<213> Adeno-associated virus
<400> 1
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 2
<211> 735
<212> PRT
<213> Adeno-associated virus
<400> 2
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 3
<211> 736
<212> PRT
<213> Adeno-associated virus
<400> 3
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 4
<211> 736
<212> PRT
<213> Adeno-associated virus
<400> 4
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 5
<211> 737
<212> PRT
<213> Adeno-associated virus
<400> 5
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Ala Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Val Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn
210 215 220
Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Ser Glu Thr Ala Gly Ser Thr Asn Asp Asn
260 265 270
Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Lys Leu Arg Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Ile Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ser Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Ser
405 410 415
Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ala
435 440 445
Arg Thr Gln Ser Asn Pro Gly Gly Thr Ala Gly Asn Arg Glu Leu Gln
450 455 460
Phe Tyr Gln Gly Gly Pro Ser Thr Met Ala Glu Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Phe Arg Gln Gln Arg Val Ser Lys Thr Leu Asp
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Val Leu Ile
530 535 540
Phe Gly Lys Thr Gly Ala Thr Asn Lys Thr Thr Leu Glu Asn Val Leu
545 550 555 560
Met Thr Asn Glu Glu Glu Ile Arg Pro Thr Asn Pro Val Ala Thr Glu
565 570 575
Glu Tyr Gly Ile Val Ser Ser Asn Leu Gln Ala Ala Asn Thr Ala Ala
580 585 590
Gln Thr Gln Val Val Asn Asn Gln Gly Ala Leu Pro Gly Met Val Trp
595 600 605
Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asn Pro Pro Glu Val Phe Thr Pro Ala Lys Phe Ala Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser
690 695 700
Asn Phe Glu Lys Gln Thr Gly Val Asp Phe Ala Val Asp Ser Gln Gly
705 710 715 720
Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn
725 730 735
Leu
<210> 6
<211> 738
<212> PRT
<213> Adeno-associated virus
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly
450 455 460
Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile
530 535 540
Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 7
<211> 736
<212> PRT
<213> Adeno-associated virus
<400> 7
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 8
<211> 738
<212> PRT
<213> Adeno-associated virus
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
Gln Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu
450 455 460
Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met
530 535 540
Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala
580 585 590
Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Asp
705 710 715 720
Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 9
<211> 737
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV1RX
<400> 9
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp Asn
260 265 270
His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr
405 410 415
Phe Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn
435 440 445
Arg Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe
450 455 460
Ser Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu
465 470 475 480
Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp
485 490 495
Asn Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu
500 505 510
Asn Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His
515 520 525
Lys Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe
530 535 540
Gly Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met
545 550 555 560
Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu
565 570 575
Arg Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro
580 585 590
Ala Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp
595 600 605
Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Leu Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser
690 695 700
Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly
705 710 715 720
Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro
725 730 735
Leu
<210> 10
<211> 737
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV2RX
<400> 10
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp Asn
260 265 270
His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr
405 410 415
Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe
450 455 460
Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu
465 470 475 480
Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp
485 490 495
Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu
500 505 510
Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His
515 520 525
Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe
530 535 540
Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met
545 550 555 560
Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu
565 570 575
Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala
580 585 590
Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp
595 600 605
Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser
690 695 700
Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly
705 710 715 720
Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn
725 730 735
Leu
<210> 11
<211> 738
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV3RX
<400> 11
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp Asn
260 265 270
His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr
405 410 415
Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn
435 440 445
Arg Thr Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu
450 455 460
Phe Ser Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn
485 490 495
Asp Asn Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His
500 505 510
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser
515 520 525
His Lys Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile
530 535 540
Phe Gly Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val
545 550 555 560
Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Gln Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala
580 585 590
Pro Thr Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 12
<211> 737
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV6RX
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp Asn
260 265 270
His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr
405 410 415
Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn
435 440 445
Arg Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe
450 455 460
Ser Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu
465 470 475 480
Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp
485 490 495
Asn Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu
500 505 510
Asn Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His
515 520 525
Lys Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe
530 535 540
Gly Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met
545 550 555 560
Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu
565 570 575
Arg Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro
580 585 590
Ala Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp
595 600 605
Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser
690 695 700
Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly
705 710 715 720
Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro
725 730 735
Leu
<210> 13
<211> 738
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV7RX
<400> 13
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Ala Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Val Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn
210 215 220
Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Lys Leu Arg Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Ser Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ser Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
Ser Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ala Arg Thr Gln Ser Asn Pro Gly Gly Thr Ala Gly Asn Arg Glu Leu
450 455 460
Gln Phe Tyr Gln Gly Gly Pro Ser Thr Met Ala Glu Gln Ala Lys Asn
465 470 475 480
Trp Leu Pro Gly Pro Cys Phe Arg Gln Gln Arg Val Ser Lys Thr Leu
485 490 495
Asp Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr
500 505 510
His Leu Asn Gly Arg Asn Ser Leu Val Asn Pro Gly Val Ala Met Ala
515 520 525
Thr His Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Val Leu
530 535 540
Ile Phe Gly Lys Thr Gly Ala Thr Asn Lys Thr Thr Leu Glu Asn Val
545 550 555 560
Leu Met Thr Asn Glu Glu Glu Ile Arg Pro Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ser Ser Asn Leu Gln Ala Ala Asn Thr Ala
580 585 590
Ala Gln Thr Gln Val Val Asn Asn Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asn Pro Pro Glu Val Phe Thr Pro Ala Lys Phe Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Phe Glu Lys Gln Thr Gly Val Asp Phe Ala Val Asp Ser Gln
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 14
<211> 738
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV8RX
<400> 14
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly
450 455 460
Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile
530 535 540
Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 15
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV9RX
<400> 15
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 16
<211> 738
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV1R.6
<400> 16
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn
210 215 220
Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr
405 410 415
Thr Phe Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Asn Arg Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu
450 455 460
Phe Ser Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr
485 490 495
Asp Asn Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn
500 505 510
Leu Asn Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser
515 520 525
His Lys Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile
530 535 540
Phe Gly Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val
545 550 555 560
Met Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr
565 570 575
Glu Arg Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp
580 585 590
Pro Ala Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr
690 695 700
Ser Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn
705 710 715 720
Gly Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Pro Leu
<210> 17
<211> 739
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV2R.6
<400> 17
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Glu Pro Asp Ser Ser Thr Gly
145 150 155 160
Thr Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly
165 170 175
Gln Thr Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln
180 185 190
Pro Pro Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly
195 200 205
Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly
210 215 220
Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg
225 230 235 240
Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn
245 250 255
His Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn
260 265 270
Asp Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe
275 280 285
Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile
290 295 300
Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe
305 310 315 320
Asn Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile
325 330 335
Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr
340 345 350
Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro
355 360 365
Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu
370 375 380
Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu
385 390 395 400
Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser
405 410 415
Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln
420 425 430
Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr
435 440 445
Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu
450 455 460
Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn
465 470 475 480
Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser
485 490 495
Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr
500 505 510
His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala
515 520 525
Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu
530 535 540
Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys
545 550 555 560
Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala
565 570 575
Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg
580 585 590
Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met
595 600 605
Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys
610 615 620
Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly
625 630 635 640
Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro
645 650 655
Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser
660 665 670
Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp
675 680 685
Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr
690 695 700
Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr
705 710 715 720
Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr
725 730 735
Arg Asn Leu
<210> 18
<211> 739
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV3R.6
<400> 18
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Pro Ser Pro Gln Glu Ser Pro Asp Ser Ser Thr Gly Val
145 150 155 160
Gly Lys Lys Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Asn Arg Thr Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu
450 455 460
Leu Phe Ser Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn
465 470 475 480
Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala
485 490 495
Asn Asp Asn Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr
500 505 510
His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala
515 520 525
Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu
530 535 540
Ile Phe Gly Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn
545 550 555 560
Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala
565 570 575
Thr Glu Gln Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr
580 585 590
Ala Pro Thr Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met
595 600 605
Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys
610 615 620
Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly
625 630 635 640
Phe Gly Leu Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro
645 650 655
Val Pro Ala Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser
660 665 670
Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp
675 680 685
Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr
690 695 700
Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr
705 710 715 720
Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr
725 730 735
Arg Asn Leu
<210> 19
<211> 738
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV6R.6
<400> 19
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn
210 215 220
Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Lys Thr Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Asn Arg Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu
450 455 460
Phe Ser Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr
485 490 495
Asp Asn Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn
500 505 510
Leu Asn Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser
515 520 525
His Lys Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile
530 535 540
Phe Gly Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val
545 550 555 560
Met Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr
565 570 575
Glu Arg Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp
580 585 590
Pro Ala Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr
690 695 700
Ser Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn
705 710 715 720
Gly Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Pro Leu
<210> 20
<211> 738
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV7R.6
<400> 20
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Ala Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Val Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn
210 215 220
Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Lys Leu Arg Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ser Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
Ser Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ala Arg Thr Gln Ser Asn Pro Gly Gly Thr Ala Gly Asn Arg Glu Leu
450 455 460
Gln Phe Tyr Gln Gly Gly Pro Ser Thr Met Ala Glu Gln Ala Lys Asn
465 470 475 480
Trp Leu Pro Gly Pro Cys Phe Arg Gln Gln Arg Val Ser Lys Thr Leu
485 490 495
Asp Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr
500 505 510
His Leu Asn Gly Arg Asn Ser Leu Val Asn Pro Gly Val Ala Met Ala
515 520 525
Thr His Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Val Leu
530 535 540
Ile Phe Gly Lys Thr Gly Ala Thr Asn Lys Thr Thr Leu Glu Asn Val
545 550 555 560
Leu Met Thr Asn Glu Glu Glu Ile Arg Pro Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ser Ser Asn Leu Gln Ala Ala Asn Thr Ala
580 585 590
Ala Gln Thr Gln Val Val Asn Asn Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asn Pro Pro Glu Val Phe Thr Pro Ala Lys Phe Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Phe Glu Lys Gln Thr Gly Val Asp Phe Ala Val Asp Ser Gln
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 21
<211> 738
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV8R.6
<400> 21
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly
450 455 460
Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile
530 535 540
Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 22
<211> 737
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV9R.6
<400> 22
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly
195 200 205
Gly Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Asp Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asp Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr
405 410 415
Glu Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe
450 455 460
Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile
465 470 475 480
Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln
485 490 495
Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu
500 505 510
Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His
515 520 525
Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe
530 535 540
Gly Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met
545 550 555 560
Ile Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu
565 570 575
Ser Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala
580 585 590
Gln Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp
595 600 605
Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Met Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser
690 695 700
Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly
705 710 715 720
Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn
725 730 735
Leu
<210> 23
<211> 738
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV1R.7
<400> 23
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr
405 410 415
Thr Phe Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Asn Arg Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu
450 455 460
Phe Ser Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr
485 490 495
Asp Asn Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn
500 505 510
Leu Asn Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser
515 520 525
His Lys Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile
530 535 540
Phe Gly Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val
545 550 555 560
Met Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr
565 570 575
Glu Arg Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp
580 585 590
Pro Ala Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr
690 695 700
Ser Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn
705 710 715 720
Gly Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Pro Leu
<210> 24
<211> 738
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV2R.7
<400> 24
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Glu Pro Asp Ser Ser Thr Gly
145 150 155 160
Thr Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly
165 170 175
Gln Thr Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Ile Gly Gln
180 185 190
Pro Pro Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Ala Gly
195 200 205
Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly
210 215 220
Ser Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg
225 230 235 240
Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn
245 250 255
His Leu Tyr Lys Gln Ile Ser Asn Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln
450 455 460
Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala
485 490 495
Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser
515 520 525
His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile
530 535 540
Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val
545 550 555 560
Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln
580 585 590
Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val
595 600 605
Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 25
<211> 739
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV3R.7
<400> 25
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Pro Ser Pro Gln Glu Ser Pro Asp Ser Ser Thr Gly Val
145 150 155 160
Gly Lys Lys Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Asn Arg Thr Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu
450 455 460
Leu Phe Ser Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn
465 470 475 480
Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala
485 490 495
Asn Asp Asn Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr
500 505 510
His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala
515 520 525
Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu
530 535 540
Ile Phe Gly Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn
545 550 555 560
Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala
565 570 575
Thr Glu Gln Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr
580 585 590
Ala Pro Thr Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met
595 600 605
Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys
610 615 620
Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly
625 630 635 640
Phe Gly Leu Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro
645 650 655
Val Pro Ala Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser
660 665 670
Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp
675 680 685
Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr
690 695 700
Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr
705 710 715 720
Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr
725 730 735
Arg Asn Leu
<210> 26
<211> 738
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV6R.7
<400> 26
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Lys Thr Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Asn Arg Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu
450 455 460
Phe Ser Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr
485 490 495
Asp Asn Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn
500 505 510
Leu Asn Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser
515 520 525
His Lys Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile
530 535 540
Phe Gly Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val
545 550 555 560
Met Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr
565 570 575
Glu Arg Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp
580 585 590
Pro Ala Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr
690 695 700
Ser Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn
705 710 715 720
Gly Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Pro Leu
<210> 27
<211> 738
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV7R.7
<400> 27
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Ala Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Val Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Lys Leu Arg Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ser Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
Ser Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ala Arg Thr Gln Ser Asn Pro Gly Gly Thr Ala Gly Asn Arg Glu Leu
450 455 460
Gln Phe Tyr Gln Gly Gly Pro Ser Thr Met Ala Glu Gln Ala Lys Asn
465 470 475 480
Trp Leu Pro Gly Pro Cys Phe Arg Gln Gln Arg Val Ser Lys Thr Leu
485 490 495
Asp Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr
500 505 510
His Leu Asn Gly Arg Asn Ser Leu Val Asn Pro Gly Val Ala Met Ala
515 520 525
Thr His Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Val Leu
530 535 540
Ile Phe Gly Lys Thr Gly Ala Thr Asn Lys Thr Thr Leu Glu Asn Val
545 550 555 560
Leu Met Thr Asn Glu Glu Glu Ile Arg Pro Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ser Ser Asn Leu Gln Ala Ala Asn Thr Ala
580 585 590
Ala Gln Thr Gln Val Val Asn Asn Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asn Pro Pro Glu Val Phe Thr Pro Ala Lys Phe Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Phe Glu Lys Gln Thr Gly Val Asp Phe Ala Val Asp Ser Gln
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 28
<211> 738
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV8R.7
<400> 28
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly
450 455 460
Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile
530 535 540
Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 29
<211> 737
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV9R.7
<400> 29
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Asp Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asp Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr
405 410 415
Glu Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe
450 455 460
Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile
465 470 475 480
Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln
485 490 495
Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu
500 505 510
Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His
515 520 525
Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe
530 535 540
Gly Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met
545 550 555 560
Ile Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu
565 570 575
Ser Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala
580 585 590
Gln Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp
595 600 605
Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Met Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser
690 695 700
Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly
705 710 715 720
Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn
725 730 735
Leu
<210> 30
<211> 737
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV1RX'
<400> 30
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp Asn
260 265 270
Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr
405 410 415
Phe Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn
435 440 445
Arg Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe
450 455 460
Ser Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu
465 470 475 480
Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp
485 490 495
Asn Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu
500 505 510
Asn Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His
515 520 525
Lys Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe
530 535 540
Gly Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met
545 550 555 560
Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu
565 570 575
Arg Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro
580 585 590
Ala Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp
595 600 605
Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Leu Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser
690 695 700
Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly
705 710 715 720
Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro
725 730 735
Leu
<210> 31
<211> 737
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV2RX'
<400> 31
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp Asn
260 265 270
Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr
405 410 415
Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe
450 455 460
Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu
465 470 475 480
Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp
485 490 495
Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu
500 505 510
Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His
515 520 525
Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe
530 535 540
Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met
545 550 555 560
Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu
565 570 575
Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala
580 585 590
Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp
595 600 605
Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser
690 695 700
Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly
705 710 715 720
Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn
725 730 735
Leu
<210> 32
<211> 738
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV3RX'
<400> 32
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp Asn
260 265 270
Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr
405 410 415
Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn
435 440 445
Arg Thr Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu
450 455 460
Phe Ser Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn
485 490 495
Asp Asn Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His
500 505 510
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser
515 520 525
His Lys Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile
530 535 540
Phe Gly Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val
545 550 555 560
Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Gln Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala
580 585 590
Pro Thr Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 33
<211> 737
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV6RX'
<400> 33
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp Asn
260 265 270
Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr
405 410 415
Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn
435 440 445
Arg Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe
450 455 460
Ser Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu
465 470 475 480
Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp
485 490 495
Asn Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu
500 505 510
Asn Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His
515 520 525
Lys Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe
530 535 540
Gly Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met
545 550 555 560
Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu
565 570 575
Arg Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro
580 585 590
Ala Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp
595 600 605
Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser
690 695 700
Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly
705 710 715 720
Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro
725 730 735
Leu
<210> 34
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
AAV9RX'
<400> 34
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp Asn
260 265 270
Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 35
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
sequence
<220>
<221> MISC_FEATURE
<222> (1)
<223> Xaa can be any naturally occurring amino acid other than Ser
<220>
<221> MISC_FEATURE
<222> (2)
<223> Xaa can be any naturally occurring amino acid other than Ala
<220>
<221> MISC_FEATURE
<222> (3)
<223> Xaa can be any naturally occurring amino acid other than Ser
<220>
<221> MISC_FEATURE
<222> (4)
<223> Xaa can be any naturally occurring amino acid other than Thr
<400> 35
Xaa Xaa Xaa Xaa
1
<210> 36
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetically constructed AAV2 inverted terminal repeat forward
PCR primer
<400> 36
aacatgctac gcagagaggg agtgg 25
<210> 37
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetically constructed AAV2 inverted terminal repeat reverse
PCR primer
<400> 37
catgagacaa ggaaccccta gtgatggag 29
<210> 38
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetically constructed luciferase transgene forward PCR primer
<400> 38
aaaagcactc tgattgacaa atac 24
<210> 39
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetically constructed luciferase transgene reverse PCR primer
<400> 39
ccttcgcttc aaaaaatgga ac 22
<210> 40
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetically constructed mouse lamin B2 housekeeping gene
forward PCR primer
<400> 40
ggacccaagg actacctcaa ggg 23
<210> 41
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetically constructed mouse lamin B2 housekeeping gene
reverse PCR primer
<400> 41
agggcacctc catctcggaa ac 22
<210> 42
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
sequence
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa can be any naturally occurring amino acid
<400> 42
Asn Xaa Xaa Xaa
1
<210> 43
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
sequence
<220>
<221> MISC_FEATURE
<222> (1)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (3)..(4)
<223> Xaa can be any naturally occurring amino acid
<400> 43
Xaa Gly Xaa Xaa
1
<210> 44
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
sequence
<220>
<221> MISC_FEATURE
<222> (1)..(2)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (4)
<223> Xaa can be any naturally occurring amino acid
<400> 44
Xaa Xaa Thr Xaa
1
<210> 45
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
sequence
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> Xaa can be any naturally occurring amino acid
<400> 45
Xaa Xaa Xaa Ser
1
<210> 46
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetically constructed adeno-associated virus capsid protein
sequence
<400> 46
Asn Gly Thr Ser
1
Claims (127)
- AAV(adeno-associated virus) 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 (VPI 번호부여(numbering)) 아미노산 잔기 S262, A263, S264, T265, A267, S268 및 H272에서의 변형, 및 잔기 G266과 A267 사이의 단일 아미노산 삽입을 포함하고, 각 잔기의 번호부여는 AAV1 (서열번호 1)의 아미노산 서열, 또는 AAV2 (서열번호 2), AAV3 (서열번호 3), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), AAV9 (서열번호 7) 또는 AAVrh10 (서열번호 8) 중 해당하는(equivalent) 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질.
- 청구항 1에 있어서, 아미노산 잔기 Q148, E152, S157, T162, T326, D328, V330, T331, V341 및 S345에서의 변형, 및 (VP1 번호부여) 잔기 E152와 P153 사이에 단일 아미노산 삽입을 더 포함하고, 각 잔기의 번호부여는 서열번호 1의 아미노산 서열 또는 서열번호 2, 3, 4, 5, 6, 7 또는 8 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질.
- 청구항 2에 있어서, 아미노산 잔기 L188, S205, N223 및 A224 (VP1 번호부여)의 변형을 더 포함하고, 각 잔기의 번호는 서열번호 1의 아미노산 서열 또는 서열번호 2, 3, 4, 5, 6, 7 또는 8 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질.
- 청구항 1 내지 3 중 어느 한 항에 있어서, 상기 변형은 S262N, A263G, S264T, T265S, A267S, S268T 및 H272T 중 하나 이상인 것인 AAV 캡시드 단백질.
- 청구항 1 및 2 중 어느 한 항에 있어서, 상기 변형은 Q148P, E152R, S157T, T162K, T326Q, D328E, V330T, T331K, V341I 및 S345T 중 하나 이상인 것인 AAV 캡시드 단백질.
- 청구항 3에 있어서, 상기 변형은 L188I, S205A, N223S 및 A224S 중 하나 이상인 것인 AAV 캡시드 단백질.
- 청구항 1에 있어서, 하기로 구성된 군으로부터 선택된 아미노산 서열을 포함하는 것인 AAV 캡시드 단백질:
a) 서열번호 9의 아미노산 서열 (AAV1RX);
b) 서열번호 10의 아미노산 서열 (AAV2RX);
c) 서열번호 11의 아미노산 서열 (AAV3RX);
d) 서열번호 12의 아미노산 서열 (AAV6RX);
e) 서열번호 13의 아미노산 서열 (AAV7RX);
f) 서열번호 14의 아미노산 서열 (AAV8RX); 및
g) 서열번호 15의 아미노산 서열 (AAV9RX). - 청구항 2에 있어서, 하기로 구성된 군으로부터 선택된 아미노산 서열을 포함하는 것인 AAV 캡시드 단백질:
a) 서열번호 16의 아미노산 서열 (AAV1R6);
b) 서열번호 17의 아미노산 서열 (AAV2R6);
c) 서열번호 18의 아미노산 서열 (AAV3R6);
d) 서열번호 19의 아미노산 서열 (AAV6R6);
e) 서열번호 20의 아미노산 서열 (AAV7R6);
f) 서열번호 21의 아미노산 서열 (AAV8R6); 및
g) 서열번호 22의 아미노산 서열 (AAV9R6). - 청구항 3에 있어서, 하기로 구성된 군으로부터 선택된 아미노산 서열을 포함하는 것인 AAV 캡시드 단백질:
a) 서열번호 23의 아미노산 서열 (AAV1R7);
b) 서열번호 24의 아미노산 서열 (AAV2R7);
c) 서열번호 25의 아미노산 서열 (AAV3R7);
d) 서열번호 26의 아미노산 서열 (AAV6R7);
e) 서열번호 27의 아미노산 서열 (AAV7R7);
f) 서열번호 28의 아미노산 서열 (AAV8R7); 및
g) 서열번호 29의 아미노산 서열 (AAV9R7). - 청구항 1 내지 9 중 어느 한 항의 캡시드 단백질을 포함하는 AAV 캡시드.
- (a) 청구항 10의 AAV 캡시드; 및
(b) 하나 이상의 말단 반복 서열(terminal repeat sequence)을 포함하는 핵산을 포함하는 바이러스 벡터로서,
상기 핵산은 상기 AAV 캡시드에 의해 둘러싸인(encapsidated) 것인 바이러스 벡터. - 약제학적으로 허용가능한 담체 중 청구항 11의 바이러스 벡터를 포함하는, 조성물.
- 세포를 청구항 11의 바이러스 벡터 및/또는 청구항 12의 조성물과 접촉시키는 단계를 포함하는, 핵산을 세포에 도입하는 방법.
- 청구항 11의 바이러스 벡터 및/또는 청구항 12의 조성물을 개체에게 투여하는 단계를 포함하는, 핵산 분자를 개체에게 전달하는 방법.
- 청구항 14에 있어서, 상기 바이러스 벡터 및/또는 조성물은 상기 개체의 중추 신경계에 투여되는 것인 방법.
- 청구항 15에 있어서, 상기 바이러스 벡터 및/또는 조성물은 혈뇌 장벽(blood brain barrier)을 통해 전달되는 것인 방법.
- 청구항 14, 15, 또는 16에 있어서, 상기 바이러스 벡터는 목적 핵산 분자를 포함하는 것인 방법.
- 신경 세포를 청구항 11의 바이러스 벡터와 접촉시키는 단계를 포함하는, 목적 핵산 분자를 신경 세포에 선택적으로(selectively) 전달하는 방법으로, 상기 바이러스 벡터가 목적 핵산 분자를 포함하는 것인 방법.
- 청구항 18에 있어서, 목적 핵산 분자를 심근 세포에 선택적으로 전달하는 단계를 더 포함하는 것인 방법.
- 청구항 17, 18 또는 19에 있어서, 상기 목적 핵산 분자는 치료 단백질 또는 치료 RNA를 코딩하는 것인 방법.
- 청구항 18, 19 또는 20에 있어서, 상기 신경 세포 및 심근 세포는 개체 내에 있는 것인 방법.
- 청구항 21에 있어서, 상기 바이러스 벡터는 비장세포, 간세포 또는 신장 세포로부터 탈표적화되는(detargeted) 것인 방법.
- 청구항 14 내지 17, 21, 또는 22 중 어느 한 항에 있어서, 상기 개체는 인간 개체인 것인 방법.
- 개체에게 청구항 11의 바이러스 벡터를 투여하는 단계를 포함하는, 개체에서 신경 질환 또는 결함을 치료하는 방법으로서, 상기 바이러스 벡터는 상기 신경 질환 또는 결함의 치료에 효과적인 치료 단백질 또는 치료 RNA를 코딩하는 핵산 분자를 포함하는 것인 방법.
- 개체에게 청구항 11의 바이러스 벡터를 투여하는 단계를 포함하는, 개체에서 신경 및 심혈관 질환(neurological and cardiovascular disorder) 또는 결함을 치료하는 방법으로서, 상기 바이러스 벡터는 상기 신경 및 심혈관 질환 또는 결함의 치료에 효과적인 치료 단백질 또는 치료 RNA를 코딩하는 핵산 분자를 포함하는 것인 방법.
- 청구항 14 내지 17, 21, 22, 23, 24, 또는 25 중 어느 한 항에 있어서, 상기 바이러스 벡터 또는 조성물은 상기 개체에게 정맥 내로, 동맥 내로, 또는 복막 내로 투여되는 것인 방법.
- 청구항 14 내지 17, 21, 22, 23, 24, 또는 25 중 어느 한 항에 있어서, 상기 바이러스 벡터 또는 조성물은 뇌실내(intracerebroventrical), 수조내(intracisternal), 뇌실질내(intraparenchymal), 두개내(intracranial), 및/또는 척수내(intrathecal) 경로를 통해 상기 개체에게 투여되는 것인 방법.
- 청구항 24 내지 27 중 어느 한 항에 있어서, 상기 개체로의 상기 바이러스 벡터 및/또는 조성물의 전신 투여는 오프-타겟(off-target) 조직에서 더 낮은 형질도입을 초래하는 것인 방법.
- AAV(adeno-associated virus) 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S262, A263, S264, T265, 및 A267 (VP1 번호부여)에서의 변형 및 잔기 S268과 N269 사이의 단일 아미노산 잔기 삽입을 포함하고, 상기 아미노산 잔기는 AAV1의 아미노산 서열(서열번호 1) 또는 AAV2 (서열번호 2), AAV3 (서열번호 3), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), AAV9 (서열번호 7) 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질.
- 청구항 29에 있어서, 상기 캡시드 단백질은 아미노산 잔기 H272에서 변형을 더 포함하는 것인 AAV 캡시드 단백질.
- 청구항 29 또는 청구항 30에 있어서, 상기 AAV 캡시드 단백질은 아미노산 잔기 Q148, E152, S157, T162, H272, T326, D328, V330, T331, V341 및 S345에서 변형, 및 잔기 E152와 P153 사이의 단일 아미노산 잔기 삽입을 더 포함하는 것인 AAV 캡시드 단백질.
- 청구항 29 내지 31 중 어느 한 항에 있어서, 상기 AAV 캡시드 단백질은 아미노산 잔기 L188, S205, N223, A224, 및 H272에서 변형을 더 포함하는 것인 AAV 캡시드 단백질.
- 청구항 29 내지 32 중 어느 한 항에 있어서, 상기 변형은 S262N, A263G, S264T, T265S, 및 A267S 중 하나 이상인 것인 AAV 캡시드 단백질.
- 청구항 31 내지 33 중 어느 한 항에 있어서, 상기 변형은 Q148P, E152R, S157T, T162K, H272T, T326Q, D328E, V330T, T331K, V341I 및 S345T 중 하나 이상인 것인 AAV 캡시드 단백질.
- 청구항 32 내지 34 중 어느 한 항에 있어서, 상기 변형은 L188I, S205A, N223S, A224S 및 H272T 중 하나 이상인 것인 AAV 캡시드 단백질.
- 청구항 29 내지 35 중 어느 한 항에 있어서, 잔기 S268과 N269 사이의 아미노산 잔기 삽입은 단일 T 잔기의 삽입인 것인 AAV 캡시드 단백질.
- 청구항 31 내지 36 중 어느 한 항에 있어서, 잔기 E152와 P153 사이의 아미노산 잔기 삽입은 단일 S 잔기의 삽입인 것인 AAV 캡시드 단백질.
- 청구항 29에 있어서, 상기 캡시드 단백질의 아미노산 서열은 하기로 구성된 군으로부터 선택되는 것인 AAV 캡시드 단백질:
a) 서열번호 9의 아미노산 서열 (AAV1RX);
b) 서열번호 10의 아미노산 서열 (AAV2RX);
c) 서열번호 11의 아미노산 서열 (AAV3RX);
d) 서열번호 12의 아미노산 서열 (AAV6RX);
e) 서열번호 13의 아미노산 서열 (AAV7RX);
f) 서열번호 14의 아미노산 서열 (AAV8RX); 및
g) 서열번호 15의 아미노산 서열 (AAV9RX). - 청구항 38에 있어서, 상기 캡시드 단백질의 아미노산 서열은 서열번호 9 (AAV1RX)인 것인 AAV 캡시드 단백질.
- 청구항 31에 있어서, 상기 캡시드 단백질의 아미노산 서열은 하기로 구성된 군으로부터 선택되는 것인 AAV 캡시드 단백질:
a) 서열번호 16의 아미노산 서열 (AAV1R6);
b) 서열번호 17의 아미노산 서열 (AAV2R6);
c) 서열번호 18의 아미노산 서열 (AAV3R6);
d) 서열번호 19의 아미노산 서열 (AAV6R6);
e) 서열번호 20의 아미노산 서열 (AAV7R6);
f) 서열번호 21의 아미노산 서열 (AAV8R6); 및
g) 서열번호 22의 아미노산 서열 (AAV9R6). - 청구항 40에 있어서, 상기 캡시드 단백질의 아미노산 서열은 서열번호 16 (AAV1R6)인 것인 AAV 캡시드 단백질.
- 청구항 32에 있어서, 상기 캡시드 단백질의 아미노산 서열은 하기로 구성된 군으로부터 선택되는 것인 AAV 캡시드 단백질:
a) 서열번호 23의 아미노산 서열 (AAV1R7);
b) 서열번호 24의 아미노산 서열 (AAV2R7);
c) 서열번호 25의 아미노산 서열 (AAV3R7);
d) 서열번호 26의 아미노산 서열 (AAV6R7);
e) 서열번호 27의 아미노산 서열 (AAV7R7);
f) 서열번호 28의 아미노산 서열 (AAV8R7); 및
g) 서열번호 29의 아미노산 서열 (AAV9R7). - 청구항 42에 있어서, 상기 캡시드 단백질의 아미노산 서열은 서열번호 23 (AAV1R7)인 것인 AAV 캡시드 단백질.
- AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 원형(native) AAV1 캡시드 단백질 (서열번호 1)의 아미노산 위치 262 내지 265(VP1 번호부여)에 해당하는 아미노산에서 아미노산 서열:
X1-X2-X3-X4 을 초래하는 변형을 포함하고,
X1은 S가 아닌 아미노산이고;
X2는 A가 아닌 아미노산이며;
X3은 S가 아닌 아미노산이고; 및
X4는 T가 아닌 아미노산인 것인 AAV 캡시드 단백질. - 청구항 44에 있어서, 상기 아미노산 X1은 N인 것인 AAV 캡시드 단백질.
- 청구항 44에 있어서, 상기 아미노산 X2는 G인 것인 AAV 캡시드 단백질.
- 청구항 44에 있어서, 상기 아미노산 X3은 T인 것인 AAV 캡시드 단백질.
- 청구항 44에 있어서, 상기 아미노산 X4는 S인 것인 AAV 캡시드 단백질.
- 청구항 44에 있어서, 상기 아미노산 X1은 N이고, X2는 G이며, X3은 T이고, 및 X4는 S인 것인 AAV 캡시드 단백질.
- 청구항 44 내지 49 중 어느 한 항에 있어서, 상기 캡시드 단백질은 아미노산 잔기 H272에서 변형을 더 포함하는 것인 AAV 캡시드 단백질.
- 청구항 50에 있어서, 상기 변형은 H272T인 것인 AAV 캡시드 단백질.
- 청구항 44 내지 51 중 어느 한 항에 있어서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S268과 N269 사이에 아미노산 삽입을 더 포함하는 것인 AAV 캡시드 단백질.
- 청구항 52에 있어서, 상기 아미노산 잔기 삽입은 단일 T 잔기의 삽입인 것인 AAV 캡시드 단백질.
- 청구항 29 내지 53 중 어느 한 항의 AAV 캡시드 단백질을 포함하는 AAV 벡터.
- 청구항 54에 있어서,
하나 이상의 말단 반복 서열을 포함하는 핵산을 더 포함하고, 상기 핵산은 상기 AAV 캡시드 단백질에 의해 둘러싸인 것인 AAV 벡터. - 청구항 55에 있어서, 상기 말단 반복 서열은 AAV 말단 반복인 것인 AAV 벡터.
- 청구항 55에 있어서, 상기 말단 반복 서열은 비-AAV 말단 반복(non-AAV terminal repeat)인 것인 AAV 벡터.
- 청구항 55 내지 57 중 어느 한 항에 있어서, 상기 핵산은 치료 단백질 또는 치료 RNA를 코딩하는 서열을 더 포함하는 것인 AAV 벡터.
- 청구항 54 내지 58 중 어느 한 항의 바이러스 벡터를 포함하는, 약제학적 조성물.
- 청구항 59에 있어서, 상기 조성물은 약제학적으로 허용가능한 담체를 더 포함하는 것인 약제학적 조성물.
- 세포를 청구항 54 내지 59 중 어느 한 항의 AAV 바이러스 벡터와 접촉시키는 단계를 포함하는, 핵산 분자를 세포 내로 도입하는 방법.
- 세포를 청구항 59 또는 60의 약제학적 조성물과 접촉시키는 단계를 포함하는, 핵산 분자를 세포 내로 도입하는 방법.
- 청구항 61 또는 62에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 개체의 중추 신경계로 투여되는 것인 방법.
- 청구항 63에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 혈뇌 장벽을 통과하여 전달되는 것인 방법.
- 청구항 61 또는 62에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 간으로부터 탈표적화되는 것인 방법.
- 청구항 61 또는 62에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 신장으로부터 탈표적화되는 것인 방법.
- 청구항 61 또는 62에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 비장으로부터 탈표적화되는 것인 방법.
- 개체 중 신경 세포에 치료 단백질 또는 치료 RNA를 선택적으로 전달하는 방법으로서, 상기 신경 세포를 청구항 54 내지 58 중 어느 한 항의 바이러스 벡터, 또는 청구항 59 내지 60의 조성물과 접촉시키는 단계를 포함하고, 상기 바이러스 벡터 또는 상기 조성물은 치료 단백질 또는 치료 RNA를 포함하는 것인 방법.
- 청구항 68에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 간으로부터 탈표적화되는 것인 방법.
- 청구항 68에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 신장으로부터 탈표적화되는 것인 방법.
- 청구항 68에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 비장으로부터 탈표적화되는 것인 방법.
- 개체에서 신경 질환 또는 결함을 치료하는 방법으로서, 상기 방법은 상기 개체에게 청구항 54 내지 58 중 어느 한 항의 바이러스 벡터 또는 청구항 59 내지 60의 조성물을 투여하는 단계를 포함하고, 상기 바이러스 벡터 또는 조성물은 상기 신경 질환의 치료에 효과적인 치료 단백질 또는 치료 RNA를 코딩하는 핵산 분자를 포함하는 것인 방법.
- 청구항 72에 있어서, 상기 개체에서 심혈관 질환 또는 결함을 치료하는 단계를 더 포함하는 것인 방법.
- 청구항 72에 있어서, 상기 바이러스 벡터 또는 조성물은 신경 세포에 선택적으로 전달되는 것인 방법.
- 청구항 72에 있어서, 상기 바이러스 벡터 또는 조성물은 심근 세포에 선택적으로 전달되는 것인 방법.
- 청구항 72에 있어서, 상기 바이러스 벡터 또는 조성물은 간, 신장 및/또는 비장으로부터 탈표적화되는 것인 방법.
- 청구항 61 내지 76 중 어느 한 항에 있어서, 상기 개체는 포유동물인 것인 방법.
- 청구항 61 내지 77 중 어느 한 항에 있어서, 상기 개체는 인간인 것인 방법.
- 청구항 61 내지 78 중 어느 한 항에 있어서, 상기 바이러스 벡터 또는 조성물은 정맥내, 동맥내, 복막내, 뇌실내, 수조내, 뇌실질내, 두개내, 및 척수내 경로로 구성된 군으로부터 선택된 투여 경로를 통해 전달되는 것인 방법.
- 청구항 79에 있어서, 상기 바이러스 벡터 또는 조성물은 상기 개체에게 정맥내 투여를 통해 전달되는 것인 방법.
- AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S262, A263, S264, T265, A267, 및 H272에서의 변형, 및 잔기 S268과 N269 사이의 단일 아미노산 잔기 삽입을 포함하고(VP1 번호부여), 각 잔기의 번호부여는 AAV1 (서열번호 2)의 아미노산 서열, 또는 AAV1 (서열번호 1), AAV3 (서열번호 3), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), AAV9 (서열번호 7) 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질.
- 청구항 81에 있어서, 상기 변형은 S262N, A263G, S264T, T265S, A267G, 및 H272T 중 하나 이상을 포함하는 것인 AAV 캡시드 단백질.
- 청구항 81 또는 82에 있어서, 상기 잔기 S268과 N269 사이의 단일 아미노산 잔기 삽입은 단일 T 잔기의 삽입인 것인 AAV 캡시드 단백질.
- 청구항 81 내지 83 중 어느 한 항에 있어서, 상기 AAV 캡시드 단백질은 서열번호 30 또는 서열번호 33의 서열을 포함하는 것인 AAV 캡시드 단백질.
- AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S262, Q263, S264, A266, S267, 및 H271에서의 변형 및 잔기 S261과 S262 사이의 하나 이상의 아미노산 잔기 삽입을 포함하고(VP1 번호부여), 각 잔기의 번호부여는 AAV1 (서열번호 2)의 아미노산 서열, 또는 AAV1 (서열번호 1), AAV3 (서열번호 3), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), AAV9 (서열번호 7) 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질.
- 청구항 85에 있어서, 상기 변형은 S262T, Q263S, S264G, A266S, S267T, 및 H271T 중 하나 이상을 포함하는 것인 AAV 캡시드 단백질.
- 청구항 85 또는 86에 있어서, 상기 잔기 S261과 S262 사이의 삽입은 단일 아미노산 잔기의 삽입인 것인 AAV 캡시드 단백질.
- 청구항 85 또는 86에 있어서, 상기 잔기 S251과 S252 사이의 삽입은 2개 이상의 아미노산 잔기의 삽입인 것인 AAV 캡시드 단백질.
- 청구항 88에 있어서, 상기 잔기 S251과 S252 사이의 삽입은 N과 G 잔기의 삽입인 것인 AAV 캡시드 단백질.
- 청구항 85 내지 89 중 어느 한 항에 있어서, 상기 AAV 캡시드 단백질은 서열번호 31의 서열을 포함하는 것인 AAV 캡시드 단백질.
- AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S262, Q263, S264, A266, A267, 및 H271에서의 변형 및 잔기 S261과 S262 사이의 단일 아미노산 잔기 삽입을 포함하고, 각 잔기의 번호부여는 AAV3 (서열번호 3)의 아미노산 서열, 또는 AAV1 (서열번호 1), AAV2 (서열번호 2), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), AAV9 (서열번호 7) 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질.
- 청구항 91에 있어서, 상기 변형은 S262T, Q263S, S264G, A266S, A267T, H271T 중 하나 이상을 포함하는 것인 AAV 캡시드 단백질.
- 청구항 91 또는 92에 있어서, 상기 잔기 S261과 S262 사이의 삽입은 단일 아미노산 잔기의 삽입인 것인 AAV 캡시드 단백질.
- 청구항 91 또는 92에 있어서, 상기 잔기 S251과 S252 사이의 삽입은 2개 이상의 아미노산 잔기의 삽입인 것인 AAV 캡시드 단백질.
- 청구항 94에 있어서, 상기 잔기 S251과 S252 사이의 삽입은 N 및 G 잔기의 삽입인 것인 AAV 캡시드 단백질.
- 청구항 91 내지 95 중 어느 한 항에 있어서, 상기 AAV 캡시드 단백질은 서열번호 32의 서열을 포함하는 것인 AAV 캡시드 단백질.
- AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 아미노산 잔기 S263, S269, A237 (VP1 번호부여)에서의 변형을 포함하고, 각 잔기의 번호 부여는 AAV9 (서열번호 9)의 아미노산 서열, 또는 AAV1 (서열번호 1), AAV2 (서열번호 2), AAV3 (서열번호 3), AAV6 (서열번호 4), AAV7 (서열번호 5), AAV8 (서열번호 6), 또는 AAVrh10 (서열번호 8) 중 해당하는 아미노산 잔기에 근거하는 것인 AAV 캡시드 단백질.
- 청구항 97에 있어서, 상기 변형은 S263G, S269T, 및 A273T 중 하나 이상을 포함하는 것인 AAV 캡시드 단백질.
- 청구항 97 또는 98에 있어서, 상기 AAV 캡시드 단백질은 서열번호 34의 서열을 포함하는 것인 AAV 캡시드 단백질.
- AAV 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 서열번호 9 내지 34 중 어느 하나의 서열을 포함하는 것인 AAV 캡시드 단백질.
- 청구항 81 내지 100 중 어느 한 항의 AAV 캡시드 단백질을 포함하는 AAV 벡터.
- 청구항 101에 있어서,
하나 이상의 말단 반복 서열을 포함하는 핵산을 더 포함하고,
상기 핵산은 상기 AAV 캡시드 단백질에 의해 둘러싸인 것인 AAV 벡터. - 청구항 102에 있어서, 상기 말단 반복 서열은 AAV 말단 반복인 것인 AAV 바이러스 벡터.
- 청구항 102에 있어서, 상기 말단 반복 서열은 비-AAV 말단 반복인 것인 AAV 바이러스 벡터.
- 청구항 101 내지 104 중 어느 한 항에 있어서, 상기 핵산은 치료 단백질 또는 치료 RNA를 코딩하는 서열을 더 포함하는 것인 AAV 바이러스 벡터.
- 청구항 101 내지 105 중 어느 한 항의 바이러스 벡터를 포함하는 약제학적 조성물.
- 청구항 106에 있어서, 상기 조성물은 약제학적으로 허용가능한 담체를 더 포함하는 것인 약제학적 조성물.
- 세포를 청구항 101 내지 105 중 어느 한 항의 AAV 바이러스 벡터와 접촉시키는 단계를 포함하는, 핵산 분자를 세포에 도입하는 방법.
- 세포를 청구항 106 또는 107의 약제학적 조성물과 접촉시키는 단계를 포함하는, 핵산 분자를 세포에 도입하는 방법.
- 청구항 108 또는 109에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 개체의 중추 신경계에 투여되는 것인 방법.
- 청구항 110에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 혈뇌 장벽을 통과하여 전달되는 것인 방법.
- 청구항 108 또는 109에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 간으로부터 탈표적화되는 것인 방법.
- 청구항 108 또는 109에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 신장으로부터 탈표적화되는 것인 방법.
- 청구항 108 또는 109에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 비장으로부터 탈표적화되는 것인 방법..
- 개체에서 치료 단백질 또는 치료 RNA를 신경 세포에 선택적으로 전달하는 방법으로서, 상기 신경 세포를 청구항 101 내지 105 중 어느 한 항의 바이러스 벡터 또는 청구항 106 내지 107의 조성물과 접촉시키는 단계를 포함하고, 상기 바이러스 벡터 또는 상기 조성물은 상기 치료 단백질 또는 치료 RNA를 포함하는 것인 방법.
- 청구항 115에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 간으로부터 탈표적화되는 것인 방법.
- 청구항 115에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 신장으로부터 탈표적화되는 것인 방법.
- 청구항 115에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 비장으로부터 탈표적화되는 것인 방법.
- 개체에서 신경 질환 또는 결함을 치료하는 방법으로서, 상기 방법은 상기 개체에게 청구항 101 내지 105 중 어느 한 항의 바이러스 벡터 또는 청구항 106 내지 107의 조성물을 투여하는 단계를 포함하고, 상기 바이러스 벡터 또는 상기 조성물은 상기 신경 질환의 치료에 효과적인 치료 단백질 또는 치료 RNA를 코딩하는 핵산 분자를 포함하는 것인 방법.
- 청구항 119에 있어서, 상기 개체에서 심혈관 질환 또는 결함을 치료하는 단계를 더 포함하는 것인 방법.
- 청구항 119에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 선택적으로 신경 세포로 전달되는 것인 방법.
- 청구항 119에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 선택적으로 심근 세포로 전달되는 것인 방법.
- 청구항 119에 있어서, 상기 바이러스 벡터 또는 상기 조성물은 간, 신장, 및/또는 비장으로부터 탈표적화되는 것인 방법.
- 청구항 108 내지 123 중 어느 한 항에 있어서, 상기 개체는 포유동물인 것인 방법.
- 청구항 108 내지 124 중 어느 한 항에 있어서, 상기 개체는 인간인 것인 방법.
- 청구항 108 내지 125 중 어느 한 항에 있어서, 상기 바이러스 벡터 또는 조성물은 정맥내, 동맥내, 복막내, 뇌실내, 수조내, 뇌실질내, 두개내, 및 척수내 경로로 구성된 군으로부터 선택된 투여 경로를 통해 전달되는 것인 방법.
- 청구항 126에 있어서, 상기 바이러스 벡터 또는 조성물은 상기 개체에게 정맥내 투여를 통해 전달되는 것인 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762459286P | 2017-02-15 | 2017-02-15 | |
US62/459,286 | 2017-02-15 | ||
PCT/US2018/018381 WO2018152333A1 (en) | 2017-02-15 | 2018-02-15 | Methods and compositions for gene transfer across the vasculature |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190117571A true KR20190117571A (ko) | 2019-10-16 |
Family
ID=63169716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197025393A KR20190117571A (ko) | 2017-02-15 | 2018-02-15 | 혈관계를 통한 유전자 전달 방법 및 조성물 |
Country Status (12)
Country | Link |
---|---|
US (1) | US11905312B2 (ko) |
EP (1) | EP3583220A4 (ko) |
JP (2) | JP7291397B2 (ko) |
KR (1) | KR20190117571A (ko) |
CN (1) | CN110520536A (ko) |
BR (1) | BR112019016769A2 (ko) |
CA (1) | CA3052829A1 (ko) |
EA (1) | EA038695B1 (ko) |
IL (1) | IL268534B1 (ko) |
MX (1) | MX2019009720A (ko) |
SG (1) | SG11201907298WA (ko) |
WO (1) | WO2018152333A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024076190A1 (ko) * | 2022-10-06 | 2024-04-11 | 주식회사 글루진테라퓨틱스 | 폐 기관지 특이적 유전자 전달이 가능한 아데노부속바이러스 벡터 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201508026D0 (en) | 2015-05-11 | 2015-06-24 | Ucl Business Plc | Capsid |
PT3356390T (pt) | 2015-09-28 | 2021-04-21 | Univ Florida | Métodos e composições para vetores virais que se evadem a anticorpos |
KR20200042935A (ko) * | 2017-08-25 | 2020-04-24 | 오비드 테라퓨틱스 인크. | 재조합 아데노-관련된 벡터들 |
BR112020020266A2 (pt) | 2018-04-03 | 2021-01-19 | Stridebio, Inc. | Vetores de vírus com evasão de anticorpos |
US11987801B2 (en) | 2018-05-11 | 2024-05-21 | Massachusetts Eye And Ear Infirmary | Altering tissue tropism of adeno-associated viruses |
CN112703198A (zh) | 2018-07-11 | 2021-04-23 | 布里格姆妇女医院 | 用于跨血脑屏障递送试剂的方法和组合物 |
AU2019346447A1 (en) | 2018-09-26 | 2021-04-29 | California Institute Of Technology | Adeno-associated virus compositions for targeted gene therapy |
CA3133453A1 (en) | 2019-03-21 | 2020-09-24 | Daniel Mccoy | Recombinant adeno-associated virus vectors |
TW202102526A (zh) * | 2019-04-04 | 2021-01-16 | 美商銳進科斯生物股份有限公司 | 重組腺相關病毒及其用途 |
JP2022546236A (ja) * | 2019-08-14 | 2022-11-04 | ユニバーシティー オブ フロリダ リサーチ ファンデーション, インク. | 遺伝子治療のためのaavカプシドバリアント |
US20220411820A1 (en) * | 2019-09-09 | 2022-12-29 | Massachusetts Eye And Ear Infirmary | Methods and compositions for modulating the interaction between adeno-associated virus (aav) and the aav receptor (aavr) for altered bio-distribution of aav |
BR112022006530A2 (pt) | 2019-10-17 | 2022-07-05 | Stridebio Inc | Vetores virais adenoassociados para o tratamento da doença de niemann-pick tipo c |
EP4051324A4 (en) * | 2019-10-28 | 2023-11-29 | University Of Florida Research Foundation, Incorporated | GENE THERAPY VECTORS |
WO2021102234A1 (en) * | 2019-11-22 | 2021-05-27 | The Children's Hospital Of Philadelphia | Adeno-associated viral vector variants |
CN115279400A (zh) | 2020-01-10 | 2022-11-01 | 布里格姆妇女医院 | 用于跨血脑屏障递送免疫治疗剂以治疗脑癌的方法和组合物 |
AU2021218411A1 (en) | 2020-02-13 | 2022-10-06 | Tenaya Therapeutics, Inc. | Gene therapy vectors for treating heart disease |
WO2021163357A2 (en) | 2020-02-13 | 2021-08-19 | Tenaya Therapeutics, Inc. | Gene therapy vectors for treating heart disease |
EP4110792A1 (en) * | 2020-02-25 | 2023-01-04 | Children's Medical Research Institute | Adeno-associated virus capsid polypeptides and vectors |
WO2022076750A2 (en) * | 2020-10-07 | 2022-04-14 | Regenxbio Inc. | Recombinant adeno-associated viruses for cns or muscle delivery |
US20240060087A1 (en) * | 2021-01-08 | 2024-02-22 | Massachusetts Eye And Ear Infirmary | Methods and compositions for modulating the interaction between adeno-associated virus (aav) and the aav receptor (aavr) for altered bio-distribution of aav |
WO2022155358A1 (en) * | 2021-01-13 | 2022-07-21 | Duke University | Compositions for and methods of improving fluid flux in the brain |
EP4367251A1 (en) | 2021-07-08 | 2024-05-15 | Tenaya Therapeutics, Inc. | Optimized expression cassettes for gene therapy |
WO2023288184A2 (en) * | 2021-07-14 | 2023-01-19 | The Board Of Trustees Of The Leland Stanford Junior University | Compositions and methods for treating chronic pain and for retrograde transduction of neurons |
CN113563430B (zh) * | 2021-07-30 | 2022-05-31 | 上海信致医药科技有限公司 | 用于治疗眼部疾病的基因递送系统及其应用 |
CN113480615B (zh) * | 2021-07-30 | 2022-05-31 | 上海信致医药科技有限公司 | 高视网膜亲和性的新型腺相关病毒衣壳蛋白及其应用 |
AU2022335160A1 (en) * | 2021-08-25 | 2024-03-14 | Children's Medical Research Institute | Modified aav capsid polypeptides and vectors |
WO2023060272A2 (en) * | 2021-10-07 | 2023-04-13 | Regenxbio Inc. | Recombinant adeno-associated viruses for cns tropic delivery |
CN114516901B (zh) * | 2022-03-11 | 2023-01-17 | 上海勉亦生物科技有限公司 | 一种神经系统高亲和性的aav载体及其应用 |
WO2023201277A1 (en) * | 2022-04-14 | 2023-10-19 | Regenxbio Inc. | Recombinant adeno-associated viruses for cns tropic delivery |
WO2024054864A1 (en) | 2022-09-06 | 2024-03-14 | Tenaya Therapeutics, Inc. | Cardioprotective heart disease therapies |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000028004A1 (en) * | 1998-11-10 | 2000-05-18 | The University Of North Carolina At Chapel Hill | Virus vectors and methods of making and administering the same |
DE19933288A1 (de) | 1999-07-15 | 2001-01-18 | Medigene Ag | Strukturprotein von Adeno-assoziiertem Virus mit veränderter Antigenität, seine Herstellung und Verwendung |
NZ561656A (en) * | 2002-05-01 | 2009-03-31 | Univ Florida | Improved rAAV expression systems for genetic modification of specific capsid proteins |
WO2010093784A2 (en) * | 2009-02-11 | 2010-08-19 | The University Of North Carolina At Chapel Hill | Modified virus vectors and methods of making and using the same |
EP3539568A1 (en) * | 2011-11-22 | 2019-09-18 | The Children's Hospital of Philadelphia | Virus vectors for highly efficient transgene delivery |
WO2014052789A1 (en) * | 2012-09-28 | 2014-04-03 | The University Of North Carolina At Chapel Hill | Aav vectors targeted to oligodendrocytes |
US10577627B2 (en) * | 2014-06-09 | 2020-03-03 | Voyager Therapeutics, Inc. | Chimeric capsids |
WO2017015102A1 (en) * | 2015-07-17 | 2017-01-26 | The Trustees Of The University Of Pennsylvania | Compositions and methods for achieving high levels of transduction in human liver cells |
-
2018
- 2018-02-15 EA EA201991911A patent/EA038695B1/ru unknown
- 2018-02-15 WO PCT/US2018/018381 patent/WO2018152333A1/en unknown
- 2018-02-15 SG SG11201907298WA patent/SG11201907298WA/en unknown
- 2018-02-15 CA CA3052829A patent/CA3052829A1/en active Pending
- 2018-02-15 BR BR112019016769-2A patent/BR112019016769A2/pt unknown
- 2018-02-15 JP JP2019542561A patent/JP7291397B2/ja active Active
- 2018-02-15 US US16/485,094 patent/US11905312B2/en active Active
- 2018-02-15 EP EP18754551.2A patent/EP3583220A4/en active Pending
- 2018-02-15 MX MX2019009720A patent/MX2019009720A/es unknown
- 2018-02-15 CN CN201880025093.XA patent/CN110520536A/zh active Pending
- 2018-02-15 IL IL268534A patent/IL268534B1/en unknown
- 2018-02-15 KR KR1020197025393A patent/KR20190117571A/ko not_active Application Discontinuation
-
2023
- 2023-01-20 JP JP2023007075A patent/JP2023052541A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024076190A1 (ko) * | 2022-10-06 | 2024-04-11 | 주식회사 글루진테라퓨틱스 | 폐 기관지 특이적 유전자 전달이 가능한 아데노부속바이러스 벡터 |
Also Published As
Publication number | Publication date |
---|---|
EA201991911A1 (ru) | 2020-02-20 |
MX2019009720A (es) | 2019-10-07 |
SG11201907298WA (en) | 2019-09-27 |
EA038695B1 (ru) | 2021-10-06 |
US11905312B2 (en) | 2024-02-20 |
BR112019016769A2 (pt) | 2020-05-26 |
CN110520536A (zh) | 2019-11-29 |
JP2020505936A (ja) | 2020-02-27 |
JP7291397B2 (ja) | 2023-06-15 |
IL268534A (en) | 2019-09-26 |
WO2018152333A1 (en) | 2018-08-23 |
US20190367562A1 (en) | 2019-12-05 |
WO2018152333A9 (en) | 2019-01-24 |
EP3583220A1 (en) | 2019-12-25 |
IL268534B1 (en) | 2024-06-01 |
AU2018221738A1 (en) | 2019-08-22 |
CA3052829A1 (en) | 2018-08-23 |
JP2023052541A (ja) | 2023-04-11 |
EP3583220A4 (en) | 2021-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11905312B2 (en) | Methods and compositions for gene transfer across the vasculature | |
US20240158762A1 (en) | Methods and compositions for delivery of viral vectors across the blood-brain barrier | |
JP7406783B2 (ja) | パルボウイルスベクターの高められた送達のための改変キャプシドタンパク質 | |
JP6042825B2 (ja) | 改変された形質導入プロファイルを有するウイルスベクターならびにその製造および使用の方法 | |
US11718862B2 (en) | Methods and compositions for circular RNA molecules | |
CN113727992A (zh) | 重组腺相关病毒载体 | |
KR20210006357A (ko) | 항체-회피 바이러스 벡터 | |
KR20230034211A (ko) | 변형된 아데노-관련 바이러스 5 캡시드 및 이의 용도 | |
CN117535247A (zh) | 合理的多倍体腺相关病毒载体及其制造和使用方法 | |
US20240209031A1 (en) | Methods and compositions for gene transfer across the vasculature | |
AU2018221738B2 (en) | Methods and compositions for gene transfer across the vasculature |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |