JP2024026872A - アデノ随伴ウイルス変異体及びその使用方法 - Google Patents
アデノ随伴ウイルス変異体及びその使用方法 Download PDFInfo
- Publication number
- JP2024026872A JP2024026872A JP2024006465A JP2024006465A JP2024026872A JP 2024026872 A JP2024026872 A JP 2024026872A JP 2024006465 A JP2024006465 A JP 2024006465A JP 2024006465 A JP2024006465 A JP 2024006465A JP 2024026872 A JP2024026872 A JP 2024026872A
- Authority
- JP
- Japan
- Prior art keywords
- aav
- gly
- pro
- asn
- ser
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000702421 Dependoparvovirus Species 0.000 title claims abstract description 64
- 108090000565 Capsid Proteins Proteins 0.000 claims abstract description 270
- 102100023321 Ceruloplasmin Human genes 0.000 claims abstract description 270
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 177
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 174
- 210000002845 virion Anatomy 0.000 claims abstract description 174
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 169
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 169
- 208000015181 infectious disease Diseases 0.000 claims abstract description 154
- 238000000034 method Methods 0.000 claims abstract description 123
- 230000002458 infectious effect Effects 0.000 claims abstract description 120
- 230000003472 neutralizing effect Effects 0.000 claims abstract description 97
- 210000004027 cell Anatomy 0.000 claims description 298
- 108090000623 proteins and genes Proteins 0.000 claims description 183
- 102000004169 proteins and genes Human genes 0.000 claims description 108
- 210000000130 stem cell Anatomy 0.000 claims description 83
- 230000001965 increasing effect Effects 0.000 claims description 79
- 125000003729 nucleotide group Chemical group 0.000 claims description 74
- 239000002773 nucleotide Substances 0.000 claims description 71
- 150000001413 amino acids Chemical class 0.000 claims description 63
- 238000010361 transduction Methods 0.000 claims description 53
- 230000026683 transduction Effects 0.000 claims description 53
- 238000002703 mutagenesis Methods 0.000 claims description 47
- 231100000350 mutagenesis Toxicity 0.000 claims description 47
- 239000003795 chemical substances by application Substances 0.000 claims description 42
- 210000000234 capsid Anatomy 0.000 claims description 36
- 239000007858 starting material Substances 0.000 claims description 35
- 238000000338 in vitro Methods 0.000 claims description 31
- 238000006467 substitution reaction Methods 0.000 claims description 31
- 210000004962 mammalian cell Anatomy 0.000 claims description 30
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 28
- 230000035772 mutation Effects 0.000 claims description 27
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 26
- 206010028980 Neoplasm Diseases 0.000 claims description 25
- 239000012634 fragment Substances 0.000 claims description 25
- 229920001184 polypeptide Polymers 0.000 claims description 24
- 238000001727 in vivo Methods 0.000 claims description 23
- 239000013607 AAV vector Substances 0.000 claims description 20
- 210000003958 hematopoietic stem cell Anatomy 0.000 claims description 19
- 201000011510 cancer Diseases 0.000 claims description 18
- 238000004519 manufacturing process Methods 0.000 claims description 17
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 16
- 238000003752 polymerase chain reaction Methods 0.000 claims description 16
- 210000004185 liver Anatomy 0.000 claims description 15
- 230000002207 retinal effect Effects 0.000 claims description 15
- 230000009368 gene silencing by RNA Effects 0.000 claims description 13
- 230000002452 interceptive effect Effects 0.000 claims description 10
- 210000002950 fibroblast Anatomy 0.000 claims description 9
- 210000005265 lung cell Anatomy 0.000 claims description 9
- 210000002901 mesenchymal stem cell Anatomy 0.000 claims description 9
- 210000000933 neural crest Anatomy 0.000 claims description 9
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 8
- 210000001671 embryonic stem cell Anatomy 0.000 claims description 8
- 210000004263 induced pluripotent stem cell Anatomy 0.000 claims description 8
- 210000005229 liver cell Anatomy 0.000 claims description 8
- 210000001665 muscle stem cell Anatomy 0.000 claims description 8
- 210000005155 neural progenitor cell Anatomy 0.000 claims description 8
- 210000001178 neural stem cell Anatomy 0.000 claims description 8
- 210000004413 cardiac myocyte Anatomy 0.000 claims description 7
- 210000002889 endothelial cell Anatomy 0.000 claims description 7
- 210000004498 neuroglial cell Anatomy 0.000 claims description 7
- 210000002569 neuron Anatomy 0.000 claims description 7
- 210000002363 skeletal muscle cell Anatomy 0.000 claims description 7
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 claims description 3
- 238000002741 site-directed mutagenesis Methods 0.000 claims description 3
- 241000700605 Viruses Species 0.000 abstract description 90
- 241000701161 unidentified adenovirus Species 0.000 abstract description 15
- 230000001976 improved effect Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 abstract description 2
- 239000002245 particle Substances 0.000 description 59
- 230000006870 function Effects 0.000 description 52
- 230000000890 antigenic effect Effects 0.000 description 44
- 210000002966 serum Anatomy 0.000 description 43
- 230000003612 virological effect Effects 0.000 description 43
- 230000027455 binding Effects 0.000 description 42
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 40
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 40
- 239000013598 vector Substances 0.000 description 40
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 37
- 102000040430 polynucleotide Human genes 0.000 description 36
- 108091033319 polynucleotide Proteins 0.000 description 36
- 239000002157 polynucleotide Substances 0.000 description 36
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 35
- 201000010099 disease Diseases 0.000 description 31
- 230000014509 gene expression Effects 0.000 description 30
- 238000006386 neutralization reaction Methods 0.000 description 30
- 230000002829 reductive effect Effects 0.000 description 28
- 101150044789 Cap gene Proteins 0.000 description 27
- 239000000427 antigen Substances 0.000 description 25
- 238000004806 packaging method and process Methods 0.000 description 24
- 230000010076 replication Effects 0.000 description 23
- 108091007433 antigens Proteins 0.000 description 22
- 102000036639 antigens Human genes 0.000 description 22
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 20
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 20
- 229920000669 heparin Polymers 0.000 description 20
- 229960002897 heparin Drugs 0.000 description 20
- 239000011780 sodium chloride Substances 0.000 description 20
- 241000699670 Mus sp. Species 0.000 description 18
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 18
- 108010061238 threonyl-glycine Proteins 0.000 description 18
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 17
- 108010077245 asparaginyl-proline Proteins 0.000 description 17
- 238000001476 gene delivery Methods 0.000 description 17
- 108010050848 glycylleucine Proteins 0.000 description 17
- 239000005090 green fluorescent protein Substances 0.000 description 17
- 239000000203 mixture Substances 0.000 description 17
- 108010079364 N-glycylalanine Proteins 0.000 description 16
- 108091028043 Nucleic acid sequence Proteins 0.000 description 15
- 239000013608 rAAV vector Substances 0.000 description 15
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 14
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 14
- 108020004459 Small interfering RNA Proteins 0.000 description 14
- 230000000694 effects Effects 0.000 description 14
- 239000013612 plasmid Substances 0.000 description 14
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 13
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 13
- 239000013604 expression vector Substances 0.000 description 13
- 238000001415 gene therapy Methods 0.000 description 13
- 230000010415 tropism Effects 0.000 description 13
- 108060001084 Luciferase Proteins 0.000 description 12
- 238000010459 TALEN Methods 0.000 description 12
- 241000699666 Mus <mouse, genus> Species 0.000 description 11
- 230000000295 complement effect Effects 0.000 description 11
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 11
- 108010057821 leucylproline Proteins 0.000 description 11
- 230000001717 pathogenic effect Effects 0.000 description 11
- 210000001519 tissue Anatomy 0.000 description 11
- 108091026890 Coding region Proteins 0.000 description 10
- 239000005089 Luciferase Substances 0.000 description 10
- 108091030071 RNAI Proteins 0.000 description 10
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 10
- 108010078144 glutaminyl-glycine Proteins 0.000 description 10
- 108010051242 phenylalanylserine Proteins 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 9
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 9
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 9
- 241000288906 Primates Species 0.000 description 9
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 9
- 238000003556 assay Methods 0.000 description 9
- 230000028993 immune response Effects 0.000 description 9
- 239000007924 injection Substances 0.000 description 9
- 238000002347 injection Methods 0.000 description 9
- 239000000463 material Substances 0.000 description 9
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 9
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 9
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 8
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 8
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 8
- 108091033409 CRISPR Proteins 0.000 description 8
- 241000701022 Cytomegalovirus Species 0.000 description 8
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 8
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 8
- 102000002265 Human Growth Hormone Human genes 0.000 description 8
- 108010000521 Human Growth Hormone Proteins 0.000 description 8
- 239000000854 Human Growth Hormone Substances 0.000 description 8
- 208000008955 Mucolipidoses Diseases 0.000 description 8
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 8
- 108700026244 Open Reading Frames Proteins 0.000 description 8
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 8
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 8
- -1 e.g. Proteins 0.000 description 8
- 108010089804 glycyl-threonine Proteins 0.000 description 8
- 108010092114 histidylphenylalanine Proteins 0.000 description 8
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 8
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 8
- 210000003205 muscle Anatomy 0.000 description 8
- 108010077112 prolyl-proline Proteins 0.000 description 8
- 108010031719 prolyl-serine Proteins 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 7
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 7
- 108020005544 Antisense RNA Proteins 0.000 description 7
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 7
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 7
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 7
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 7
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 7
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 7
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 7
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 7
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 7
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 7
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 7
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 7
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 7
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 7
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 7
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 7
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 7
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 7
- YRSOERSDNRSCBC-XIRDDKMYSA-N Trp-His-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CS)C(=O)O)N YRSOERSDNRSCBC-XIRDDKMYSA-N 0.000 description 7
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 7
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 7
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 7
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 7
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 108010060035 arginylproline Proteins 0.000 description 7
- 108010092854 aspartyllysine Proteins 0.000 description 7
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 7
- 108010087823 glycyltyrosine Proteins 0.000 description 7
- 108010040030 histidinoalanine Proteins 0.000 description 7
- 108010034529 leucyl-lysine Proteins 0.000 description 7
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 7
- 239000004055 small Interfering RNA Substances 0.000 description 7
- 208000024891 symptom Diseases 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 238000001890 transfection Methods 0.000 description 7
- 108010045269 tryptophyltryptophan Proteins 0.000 description 7
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 6
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 6
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 6
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 6
- 102100022641 Coagulation factor IX Human genes 0.000 description 6
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 6
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 6
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 6
- 241000880493 Leptailurus serval Species 0.000 description 6
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 6
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 6
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 6
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 6
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 6
- 108010079005 RDV peptide Proteins 0.000 description 6
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 6
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 6
- 108700019146 Transgenes Proteins 0.000 description 6
- 108010070944 alanylhistidine Proteins 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 108010047857 aspartylglycine Proteins 0.000 description 6
- 239000003184 complementary RNA Substances 0.000 description 6
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 6
- 238000010790 dilution Methods 0.000 description 6
- 239000012895 dilution Substances 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 6
- 108010077515 glycylproline Proteins 0.000 description 6
- 108010085325 histidylproline Proteins 0.000 description 6
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 6
- 239000000546 pharmaceutical excipient Substances 0.000 description 6
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 6
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 6
- 230000001225 therapeutic effect Effects 0.000 description 6
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 5
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 5
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 5
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 5
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 5
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 5
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 5
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 5
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 208000001905 GM2 Gangliosidoses Diseases 0.000 description 5
- 201000008905 GM2 gangliosidosis Diseases 0.000 description 5
- 229920002683 Glycosaminoglycan Polymers 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- 101001045440 Homo sapiens Beta-hexosaminidase subunit alpha Proteins 0.000 description 5
- 108010065920 Insulin Lispro Proteins 0.000 description 5
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 5
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 5
- 241000124008 Mammalia Species 0.000 description 5
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 5
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 5
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 5
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 5
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 5
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 5
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 5
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 5
- 241000700584 Simplexvirus Species 0.000 description 5
- 108091027967 Small hairpin RNA Proteins 0.000 description 5
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 5
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 5
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 5
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 5
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 5
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 5
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 5
- 229940088598 enzyme Drugs 0.000 description 5
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 5
- 208000009429 hemophilia B Diseases 0.000 description 5
- 108010025306 histidylleucine Proteins 0.000 description 5
- 210000005260 human cell Anatomy 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 238000002955 isolation Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 210000000663 muscle cell Anatomy 0.000 description 5
- 108010015796 prolylisoleucine Proteins 0.000 description 5
- 108010053725 prolylvaline Proteins 0.000 description 5
- 208000011580 syndromic disease Diseases 0.000 description 5
- 108010038745 tryptophylglycine Proteins 0.000 description 5
- 241001529453 unidentified herpesvirus Species 0.000 description 5
- 239000003981 vehicle Substances 0.000 description 5
- 210000003462 vein Anatomy 0.000 description 5
- 101100524317 Adeno-associated virus 2 (isolate Srivastava/1982) Rep40 gene Proteins 0.000 description 4
- 101100524319 Adeno-associated virus 2 (isolate Srivastava/1982) Rep52 gene Proteins 0.000 description 4
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 description 4
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 description 4
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 4
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 4
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 4
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 4
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 4
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 4
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 4
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 4
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 4
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 4
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 4
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 4
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 4
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 4
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 4
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 4
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 4
- 108091079001 CRISPR RNA Proteins 0.000 description 4
- 101100342815 Caenorhabditis elegans lec-1 gene Proteins 0.000 description 4
- XLLSMEFANRROJE-GUBZILKMSA-N Cys-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XLLSMEFANRROJE-GUBZILKMSA-N 0.000 description 4
- 108020004414 DNA Proteins 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 230000007018 DNA scission Effects 0.000 description 4
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 4
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 4
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 4
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 4
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 4
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 4
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 4
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 4
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 4
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 4
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 4
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 4
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 4
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 4
- 108090001061 Insulin Proteins 0.000 description 4
- 102000004877 Insulin Human genes 0.000 description 4
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 4
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 4
- 206010056886 Mucopolysaccharidosis I Diseases 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 4
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 4
- DMNANGOFEUVBRV-GJZGRUSLSA-N Pro-Trp-Gly Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)O)C(=O)[C@@H]1CCCN1 DMNANGOFEUVBRV-GJZGRUSLSA-N 0.000 description 4
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 4
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 4
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 4
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 4
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 4
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 4
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 4
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 4
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 4
- QSFJHIRIHOJRKS-ULQDDVLXSA-N Tyr-Leu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QSFJHIRIHOJRKS-ULQDDVLXSA-N 0.000 description 4
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 4
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 4
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 4
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 239000013566 allergen Substances 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 239000001506 calcium phosphate Substances 0.000 description 4
- 229910000389 calcium phosphate Inorganic materials 0.000 description 4
- 235000011010 calcium phosphates Nutrition 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 230000007812 deficiency Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 4
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 230000003394 haemopoietic effect Effects 0.000 description 4
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 4
- 210000004072 lung Anatomy 0.000 description 4
- 208000005340 mucopolysaccharidosis III Diseases 0.000 description 4
- 239000008194 pharmaceutical composition Substances 0.000 description 4
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 108010026333 seryl-proline Proteins 0.000 description 4
- 241000894007 species Species 0.000 description 4
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 4
- HXUVTXPOZRFMOY-NSHDSACASA-N 2-[[(2s)-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]-3-phenylpropanoyl]amino]acetic acid Chemical compound NCC(=O)NCC(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 HXUVTXPOZRFMOY-NSHDSACASA-N 0.000 description 3
- 208000030507 AIDS Diseases 0.000 description 3
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 3
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 3
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 3
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 3
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 3
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 3
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 3
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 3
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 3
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 3
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 3
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 3
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 3
- FSPQNLYOFCXUCE-BPUTZDHNSA-N Arg-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FSPQNLYOFCXUCE-BPUTZDHNSA-N 0.000 description 3
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 3
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 3
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 3
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 3
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 3
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 3
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 3
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 3
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 3
- LLRJPYJQNBMOOO-QEJZJMRPSA-N Asp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N LLRJPYJQNBMOOO-QEJZJMRPSA-N 0.000 description 3
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 3
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 3
- 101100059000 Bacillus subtilis (strain 168) capA gene Proteins 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 3
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 206010009944 Colon cancer Diseases 0.000 description 3
- XIZWKXATMJODQW-KKUMJFAQSA-N Cys-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N XIZWKXATMJODQW-KKUMJFAQSA-N 0.000 description 3
- 230000004543 DNA replication Effects 0.000 description 3
- 108010074604 Epoetin Alfa Proteins 0.000 description 3
- 102100031939 Erythropoietin Human genes 0.000 description 3
- 102000053171 Glial Fibrillary Acidic Human genes 0.000 description 3
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 description 3
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 3
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 3
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 3
- ULXXDWZMMSQBDC-ACZMJKKPSA-N Gln-Asp-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ULXXDWZMMSQBDC-ACZMJKKPSA-N 0.000 description 3
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 3
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 3
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 3
- HVQCEQTUSWWFOS-WDSKDSINSA-N Gln-Gly-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N HVQCEQTUSWWFOS-WDSKDSINSA-N 0.000 description 3
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 3
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 3
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 3
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 3
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 3
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 3
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 3
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 3
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 3
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 3
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 3
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 3
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 3
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 3
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 3
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 3
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 3
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 206010053185 Glycogen storage disease type II Diseases 0.000 description 3
- AASLOGQZZKZWKH-SRVKXCTJSA-N His-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AASLOGQZZKZWKH-SRVKXCTJSA-N 0.000 description 3
- VUUFXXGKMPLKNH-BZSNNMDCSA-N His-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N VUUFXXGKMPLKNH-BZSNNMDCSA-N 0.000 description 3
- 241000725303 Human immunodeficiency virus Species 0.000 description 3
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 3
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 3
- 108090001007 Interleukin-8 Proteins 0.000 description 3
- 102000004890 Interleukin-8 Human genes 0.000 description 3
- 108010025815 Kanamycin Kinase Proteins 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 3
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 3
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 3
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 3
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 3
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 3
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 3
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 3
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 3
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 3
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 3
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 3
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 3
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 3
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 3
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 3
- OTKQHDPECKUDSB-SZMVWBNQSA-N Met-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OTKQHDPECKUDSB-SZMVWBNQSA-N 0.000 description 3
- 206010072927 Mucolipidosis type I Diseases 0.000 description 3
- 101100083407 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) pgsA1 gene Proteins 0.000 description 3
- 108010066427 N-valyltryptophan Proteins 0.000 description 3
- 108010047562 NGR peptide Proteins 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 229930182555 Penicillin Natural products 0.000 description 3
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 3
- WFHRXJOZEXUKLV-IRXDYDNUSA-N Phe-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 WFHRXJOZEXUKLV-IRXDYDNUSA-N 0.000 description 3
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 3
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 3
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 3
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 3
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 3
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 3
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 3
- ZTMLZUNPFDGPKY-VKOGCVSHSA-N Pro-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ZTMLZUNPFDGPKY-VKOGCVSHSA-N 0.000 description 3
- GNADVDLLGVSXLS-ULQDDVLXSA-N Pro-Phe-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GNADVDLLGVSXLS-ULQDDVLXSA-N 0.000 description 3
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 3
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 3
- 208000021811 Sandhoff disease Diseases 0.000 description 3
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 3
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 3
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 3
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 3
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 3
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 3
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 3
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 3
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 3
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 3
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 3
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 3
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 3
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 3
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 3
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 3
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 3
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 3
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 3
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 3
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 3
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 3
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 3
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 3
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 3
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 3
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 3
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 3
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 3
- 108020004566 Transfer RNA Proteins 0.000 description 3
- 239000007983 Tris buffer Substances 0.000 description 3
- QNTBGBCOEYNAPV-CWRNSKLLSA-N Trp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O QNTBGBCOEYNAPV-CWRNSKLLSA-N 0.000 description 3
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 3
- WVHUFSCKCBQKJW-HKUYNNGSSA-N Trp-Gly-Tyr Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 WVHUFSCKCBQKJW-HKUYNNGSSA-N 0.000 description 3
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 3
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 3
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 3
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 3
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 3
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 3
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 3
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 3
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 3
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 3
- ZEBRMWPTJNHXAJ-JYJNAYRXSA-N Val-Phe-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N ZEBRMWPTJNHXAJ-JYJNAYRXSA-N 0.000 description 3
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 3
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 3
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 108010093581 aspartyl-proline Proteins 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 3
- 230000000747 cardiac effect Effects 0.000 description 3
- 108010069495 cysteinyltyrosine Proteins 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 230000005782 double-strand break Effects 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 239000012091 fetal bovine serum Substances 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 230000005017 genetic modification Effects 0.000 description 3
- 235000013617 genetically modified food Nutrition 0.000 description 3
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 description 3
- 230000013595 glycosylation Effects 0.000 description 3
- 238000006206 glycosylation reaction Methods 0.000 description 3
- 108010010147 glycylglutamine Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 210000002216 heart Anatomy 0.000 description 3
- 230000002163 immunogen Effects 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 229940125396 insulin Drugs 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 239000002502 liposome Substances 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 244000000010 microbial pathogen Species 0.000 description 3
- 229940049954 penicillin Drugs 0.000 description 3
- 101150076330 pgsA gene Proteins 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 108010040003 polyglutamine Proteins 0.000 description 3
- 229920000155 polyglutamine Polymers 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 210000001525 retina Anatomy 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 229960005322 streptomycin Drugs 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 3
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 2
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 102000055025 Adenosine deaminases Human genes 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 2
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 2
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 2
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 2
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 2
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 2
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 2
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 2
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 2
- 108091023037 Aptamer Proteins 0.000 description 2
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 2
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 2
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 2
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 2
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 2
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 2
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 2
- LYJXHXGPWDTLKW-HJGDQZAQSA-N Arg-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O LYJXHXGPWDTLKW-HJGDQZAQSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 2
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 2
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 2
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 2
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 2
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 2
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 2
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 2
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 2
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 2
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 2
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 2
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 2
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 2
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 2
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 2
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 2
- JPSODRNUDXONAS-XIRDDKMYSA-N Asn-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CC(=O)N)N JPSODRNUDXONAS-XIRDDKMYSA-N 0.000 description 2
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 2
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 2
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 2
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 2
- VBVKSAFJPVXMFJ-CIUDSAMLSA-N Asp-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N VBVKSAFJPVXMFJ-CIUDSAMLSA-N 0.000 description 2
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 2
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 2
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 2
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 2
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 2
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 2
- JGLWFWXGOINXEA-YDHLFZDLSA-N Asp-Val-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JGLWFWXGOINXEA-YDHLFZDLSA-N 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 238000011725 BALB/c mouse Methods 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 108010022366 Carcinoembryonic Antigen Proteins 0.000 description 2
- 102100025475 Carcinoembryonic antigen-related cell adhesion molecule 5 Human genes 0.000 description 2
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 2
- 206010008342 Cervix carcinoma Diseases 0.000 description 2
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 2
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 description 2
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 2
- 108010079245 Cystic Fibrosis Transmembrane Conductance Regulator Proteins 0.000 description 2
- 102100023419 Cystic fibrosis transmembrane conductance regulator Human genes 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 241000283086 Equidae Species 0.000 description 2
- 108010008165 Etanercept Proteins 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- 108010054265 Factor VIIa Proteins 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 2
- 201000008808 Fibrosarcoma Diseases 0.000 description 2
- 108010029961 Filgrastim Proteins 0.000 description 2
- 108010046649 GDNP peptide Proteins 0.000 description 2
- 208000015872 Gaucher disease Diseases 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 2
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 2
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 2
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 2
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 2
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 2
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 2
- PODFFOWWLUPNMN-DCAQKATOSA-N Gln-His-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PODFFOWWLUPNMN-DCAQKATOSA-N 0.000 description 2
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 2
- UESYBOXFJWJVSB-AVGNSLFASA-N Gln-Phe-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O UESYBOXFJWJVSB-AVGNSLFASA-N 0.000 description 2
- DRNMNLKUUKKPIA-HTUGSXCWSA-N Gln-Phe-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)CCC(N)=O)C(O)=O DRNMNLKUUKKPIA-HTUGSXCWSA-N 0.000 description 2
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 2
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 2
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 2
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 2
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- TWYFJOHWGCCRIR-DCAQKATOSA-N Glu-Pro-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYFJOHWGCCRIR-DCAQKATOSA-N 0.000 description 2
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 2
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 2
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 2
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 2
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 2
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 2
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 2
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 2
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 2
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 2
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 2
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 2
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 2
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 2
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 2
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 2
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 2
- 208000032007 Glycogen storage disease due to acid maltase deficiency Diseases 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 108010053317 Hexosaminidase A Proteins 0.000 description 2
- 102000016871 Hexosaminidase A Human genes 0.000 description 2
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 2
- QEYUCKCWTMIERU-SRVKXCTJSA-N His-Lys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QEYUCKCWTMIERU-SRVKXCTJSA-N 0.000 description 2
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 2
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 2
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 2
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 2
- 241001135569 Human adenovirus 5 Species 0.000 description 2
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 2
- 241000701027 Human herpesvirus 6 Species 0.000 description 2
- 208000015178 Hurler syndrome Diseases 0.000 description 2
- 206010021143 Hypoxia Diseases 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 2
- HTDRTKMNJRRYOJ-SIUGBPQLSA-N Ile-Gln-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HTDRTKMNJRRYOJ-SIUGBPQLSA-N 0.000 description 2
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 2
- LEHPJMKVGFPSSP-ZQINRCPSSA-N Ile-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 LEHPJMKVGFPSSP-ZQINRCPSSA-N 0.000 description 2
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 2
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 2
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 2
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 2
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 2
- JTBFQNHKNRZJDS-SYWGBEHUSA-N Ile-Trp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C)C(=O)O)N JTBFQNHKNRZJDS-SYWGBEHUSA-N 0.000 description 2
- 102000051628 Interleukin-1 receptor antagonist Human genes 0.000 description 2
- 108700021006 Interleukin-1 receptor antagonist Proteins 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 2
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 2
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 2
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 2
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 2
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 2
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 2
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 2
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 2
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 2
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 2
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 2
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 2
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- 102000004058 Leukemia inhibitory factor Human genes 0.000 description 2
- 108090000581 Leukemia inhibitory factor Proteins 0.000 description 2
- 102100029185 Low affinity immunoglobulin gamma Fc region receptor III-B Human genes 0.000 description 2
- 108090000362 Lymphotoxin-beta Proteins 0.000 description 2
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 2
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 2
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 2
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 2
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 2
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 2
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 2
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 2
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 2
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 208000035051 Malignant migrating focal seizures of infancy Diseases 0.000 description 2
- 102000000440 Melanoma-associated antigen Human genes 0.000 description 2
- 108050008953 Melanoma-associated antigen Proteins 0.000 description 2
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 2
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 2
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 2
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 2
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 2
- HZLSUXCMSIBCRV-RVMXOQNASA-N Met-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N HZLSUXCMSIBCRV-RVMXOQNASA-N 0.000 description 2
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 2
- 206010072928 Mucolipidosis type II Diseases 0.000 description 2
- 206010028095 Mucopolysaccharidosis IV Diseases 0.000 description 2
- 208000028781 Mucopolysaccharidosis type 1 Diseases 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- 102000007339 Nerve Growth Factor Receptors Human genes 0.000 description 2
- 108010032605 Nerve Growth Factor Receptors Proteins 0.000 description 2
- QMMRHASQEVCJGR-UBHSHLNASA-N Phe-Ala-Pro Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 QMMRHASQEVCJGR-UBHSHLNASA-N 0.000 description 2
- NEHSHYOUIWBYSA-DCPHZVHLSA-N Phe-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NEHSHYOUIWBYSA-DCPHZVHLSA-N 0.000 description 2
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 2
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 2
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 2
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 2
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 2
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 2
- HQCSLJFGZYOXHW-KKUMJFAQSA-N Phe-His-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O)N HQCSLJFGZYOXHW-KKUMJFAQSA-N 0.000 description 2
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 2
- QRUOLOPKCOEZKU-HJWJTTGWSA-N Phe-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N QRUOLOPKCOEZKU-HJWJTTGWSA-N 0.000 description 2
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 2
- FKFCKDROTNIVSO-JYJNAYRXSA-N Phe-Pro-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O FKFCKDROTNIVSO-JYJNAYRXSA-N 0.000 description 2
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 2
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 2
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 2
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 2
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 2
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 2
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 2
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 2
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 2
- YKQNVTOIYFQMLW-IHRRRGAJSA-N Pro-Cys-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 YKQNVTOIYFQMLW-IHRRRGAJSA-N 0.000 description 2
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 2
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 2
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 2
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 2
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 2
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 2
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 2
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 2
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 2
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 2
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 2
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 2
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 2
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 2
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- 241000125945 Protoparvovirus Species 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 2
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 2
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 2
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 2
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 2
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 2
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 2
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 2
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 2
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 2
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 2
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 2
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- PQEQXWRVHQAAKS-SRVKXCTJSA-N Ser-Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=C(O)C=C1 PQEQXWRVHQAAKS-SRVKXCTJSA-N 0.000 description 2
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 101710172711 Structural protein Proteins 0.000 description 2
- 241000701093 Suid alphaherpesvirus 1 Species 0.000 description 2
- 206010042566 Superinfection Diseases 0.000 description 2
- 230000029662 T-helper 1 type immune response Effects 0.000 description 2
- 101150052863 THY1 gene Proteins 0.000 description 2
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 2
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 2
- RCEHMXVEMNXRIW-IRIUXVKKSA-N Thr-Gln-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O RCEHMXVEMNXRIW-IRIUXVKKSA-N 0.000 description 2
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 2
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 2
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 2
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 2
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 2
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 2
- 102000036693 Thrombopoietin Human genes 0.000 description 2
- 108010041111 Thrombopoietin Proteins 0.000 description 2
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 2
- XZLHHHYSWIYXHD-XIRDDKMYSA-N Trp-Gln-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XZLHHHYSWIYXHD-XIRDDKMYSA-N 0.000 description 2
- SSNGFWKILJLTQM-QEJZJMRPSA-N Trp-Gln-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SSNGFWKILJLTQM-QEJZJMRPSA-N 0.000 description 2
- NOFFAYIYPAUNRM-HKUYNNGSSA-N Trp-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC2=CNC3=CC=CC=C32)N NOFFAYIYPAUNRM-HKUYNNGSSA-N 0.000 description 2
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 2
- SDNVRAKIJVKAGS-LKTVYLICSA-N Tyr-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N SDNVRAKIJVKAGS-LKTVYLICSA-N 0.000 description 2
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 2
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 2
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 2
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 2
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 2
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 2
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 2
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 2
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 2
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 2
- 241000700618 Vaccinia virus Species 0.000 description 2
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 2
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 2
- UZDHNIJRRTUKKC-DLOVCJGASA-N Val-Gln-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UZDHNIJRRTUKKC-DLOVCJGASA-N 0.000 description 2
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 2
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 2
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 2
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 2
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 2
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 2
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 2
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 2
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 2
- 108010003205 Vasoactive Intestinal Peptide Proteins 0.000 description 2
- 102400000015 Vasoactive intestinal peptide Human genes 0.000 description 2
- 108700005077 Viral Genes Proteins 0.000 description 2
- 108010067390 Viral Proteins Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 108010060162 alglucerase Proteins 0.000 description 2
- 108010028144 alpha-Glucosidases Proteins 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 108700024685 ancestim Proteins 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 230000001772 anti-angiogenic effect Effects 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 244000052616 bacterial pathogen Species 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 201000010881 cervical cancer Diseases 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000001684 chronic effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 229940012414 factor viia Drugs 0.000 description 2
- 230000001605 fetal effect Effects 0.000 description 2
- 238000000799 fluorescence microscopy Methods 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 201000004502 glycogen storage disease II Diseases 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 244000000013 helminth Species 0.000 description 2
- 208000006454 hepatitis Diseases 0.000 description 2
- 231100000283 hepatitis Toxicity 0.000 description 2
- 230000008348 humoral response Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 208000026278 immune system disease Diseases 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- PBGKTOXHQIOBKM-FHFVDXKLSA-N insulin (human) Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 PBGKTOXHQIOBKM-FHFVDXKLSA-N 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- VBUWHHLIZKOSMS-RIWXPGAOSA-N invicorp Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)C(C)C)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 VBUWHHLIZKOSMS-RIWXPGAOSA-N 0.000 description 2
- 230000000366 juvenile effect Effects 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 230000011278 mitosis Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 208000020460 mucolipidosis II alpha/beta Diseases 0.000 description 2
- 230000000324 neuroprotective effect Effects 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 108010044644 pegfilgrastim Proteins 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 101150066583 rep gene Proteins 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 108091008601 sVEGFR Proteins 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 210000001082 somatic cell Anatomy 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 229960000187 tissue plasminogen activator Drugs 0.000 description 2
- 229960005267 tositumomab Drugs 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000029812 viral genome replication Effects 0.000 description 2
- PQFMROVJTOPVDF-JBDRJPRFSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]-4-carboxybutanoyl]amino]butanedioic acid Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PQFMROVJTOPVDF-JBDRJPRFSA-N 0.000 description 1
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 1
- HMLGSIZOMSVISS-ONJSNURVSA-N (7r)-7-[[(2z)-2-(2-amino-1,3-thiazol-4-yl)-2-(2,2-dimethylpropanoyloxymethoxyimino)acetyl]amino]-3-ethenyl-8-oxo-5-thia-1-azabicyclo[4.2.0]oct-2-ene-2-carboxylic acid Chemical compound N([C@@H]1C(N2C(=C(C=C)CSC21)C(O)=O)=O)C(=O)\C(=N/OCOC(=O)C(C)(C)C)C1=CSC(N)=N1 HMLGSIZOMSVISS-ONJSNURVSA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- 125000000981 3-amino-3-oxopropyl group Chemical group [H]C([*])([H])C([H])([H])C(=O)N([H])[H] 0.000 description 1
- 125000004042 4-aminobutyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])N([H])[H] 0.000 description 1
- LVRVABPNVHYXRT-BQWXUCBYSA-N 52906-92-0 Chemical compound C([C@H](N)C(=O)N[C@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O)C(C)C)C1=CC=CC=C1 LVRVABPNVHYXRT-BQWXUCBYSA-N 0.000 description 1
- 102100031585 ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Human genes 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 1
- 241000649044 Adeno-associated virus 9 Species 0.000 description 1
- 208000010370 Adenoviridae Infections Diseases 0.000 description 1
- 206010060931 Adenovirus infection Diseases 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 1
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 1
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- FCXAUASCMJOFEY-NDKCEZKHSA-N Ala-Leu-Thr-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O FCXAUASCMJOFEY-NDKCEZKHSA-N 0.000 description 1
- BLTRAARCJYVJKV-QEJZJMRPSA-N Ala-Lys-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](Cc1ccccc1)C(O)=O BLTRAARCJYVJKV-QEJZJMRPSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- DXTYEWAQOXYRHZ-KKXDTOCCSA-N Ala-Phe-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N DXTYEWAQOXYRHZ-KKXDTOCCSA-N 0.000 description 1
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 1
- JNJHNBXBGNJESC-KKXDTOCCSA-N Ala-Tyr-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JNJHNBXBGNJESC-KKXDTOCCSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- 208000029602 Alpha-N-acetylgalactosaminidase deficiency Diseases 0.000 description 1
- 208000004881 Amebiasis Diseases 0.000 description 1
- 206010001980 Amoebiasis Diseases 0.000 description 1
- 101710137189 Amyloid-beta A4 protein Proteins 0.000 description 1
- 102100022704 Amyloid-beta precursor protein Human genes 0.000 description 1
- 101710151993 Amyloid-beta precursor protein Proteins 0.000 description 1
- 241001465677 Ancylostomatoidea Species 0.000 description 1
- 102100032187 Androgen receptor Human genes 0.000 description 1
- 102100022987 Angiogenin Human genes 0.000 description 1
- 101800000733 Angiotensin-2 Proteins 0.000 description 1
- 102400000345 Angiotensin-2 Human genes 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- OCOZPTHLDVSFCZ-BPUTZDHNSA-N Arg-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N OCOZPTHLDVSFCZ-BPUTZDHNSA-N 0.000 description 1
- ALOVURZCXKYKJC-NAKRPEOUSA-N Arg-Asp-Gln-Ser Chemical compound N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O ALOVURZCXKYKJC-NAKRPEOUSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- BQBPFMNVOWDLHO-XIRDDKMYSA-N Arg-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N BQBPFMNVOWDLHO-XIRDDKMYSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 1
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 1
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 1
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 1
- WTFIFQWLQXZLIZ-UMPQAUOISA-N Arg-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O WTFIFQWLQXZLIZ-UMPQAUOISA-N 0.000 description 1
- XMGVWQWEWWULNS-BPUTZDHNSA-N Arg-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XMGVWQWEWWULNS-BPUTZDHNSA-N 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 1
- PTNFNTOBUDWHNZ-GUBZILKMSA-N Asn-Arg-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O PTNFNTOBUDWHNZ-GUBZILKMSA-N 0.000 description 1
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- OWUCNXMFJRFOFI-BQBZGAKWSA-N Asn-Gly-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O OWUCNXMFJRFOFI-BQBZGAKWSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- RAKKBBHMTJSXOY-XVYDVKMFSA-N Asn-His-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O RAKKBBHMTJSXOY-XVYDVKMFSA-N 0.000 description 1
- MOHUTCNYQLMARY-GUBZILKMSA-N Asn-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MOHUTCNYQLMARY-GUBZILKMSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 1
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 1
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- ZCKYZTGLXIEOKS-CIUDSAMLSA-N Asp-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N ZCKYZTGLXIEOKS-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 1
- NYQHSUGFEWDWPD-ACZMJKKPSA-N Asp-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N NYQHSUGFEWDWPD-ACZMJKKPSA-N 0.000 description 1
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 1
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 1
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 1
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 1
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- MRYDJCIIVRXVGG-QEJZJMRPSA-N Asp-Trp-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O MRYDJCIIVRXVGG-QEJZJMRPSA-N 0.000 description 1
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 1
- 206010068220 Aspartylglucosaminuria Diseases 0.000 description 1
- 108010078286 Ataxins Proteins 0.000 description 1
- 102000014461 Ataxins Human genes 0.000 description 1
- 101800001288 Atrial natriuretic factor Proteins 0.000 description 1
- 102400001282 Atrial natriuretic peptide Human genes 0.000 description 1
- 101800001890 Atrial natriuretic peptide Proteins 0.000 description 1
- 206010003694 Atrophy Diseases 0.000 description 1
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 description 1
- 208000004429 Bacillary Dysentery Diseases 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108010081589 Becaplermin Proteins 0.000 description 1
- 102400000748 Beta-endorphin Human genes 0.000 description 1
- 101800005049 Beta-endorphin Proteins 0.000 description 1
- 102100023995 Beta-nerve growth factor Human genes 0.000 description 1
- 108010051479 Bombesin Proteins 0.000 description 1
- 102000013585 Bombesin Human genes 0.000 description 1
- 102000007350 Bone Morphogenetic Proteins Human genes 0.000 description 1
- 108010007726 Bone Morphogenetic Proteins Proteins 0.000 description 1
- 241000282817 Bovidae Species 0.000 description 1
- 101800004538 Bradykinin Proteins 0.000 description 1
- 102400000967 Bradykinin Human genes 0.000 description 1
- 102100021943 C-C motif chemokine 2 Human genes 0.000 description 1
- 101710155857 C-C motif chemokine 2 Proteins 0.000 description 1
- 102100032367 C-C motif chemokine 5 Human genes 0.000 description 1
- 108700012434 CCL3 Proteins 0.000 description 1
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 description 1
- 108050005493 CD3 protein, epsilon/gamma/delta subunit Proteins 0.000 description 1
- 102000049320 CD36 Human genes 0.000 description 1
- 108010045374 CD36 Antigens Proteins 0.000 description 1
- 102100032912 CD44 antigen Human genes 0.000 description 1
- 102000055006 Calcitonin Human genes 0.000 description 1
- 108060001064 Calcitonin Proteins 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 1
- 102100024533 Carcinoembryonic antigen-related cell adhesion molecule 1 Human genes 0.000 description 1
- 102100025470 Carcinoembryonic antigen-related cell adhesion molecule 8 Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010008025 Cerebellar ataxia Diseases 0.000 description 1
- 102000000013 Chemokine CCL3 Human genes 0.000 description 1
- 102000001326 Chemokine CCL4 Human genes 0.000 description 1
- 108010055165 Chemokine CCL4 Proteins 0.000 description 1
- 108010055166 Chemokine CCL5 Proteins 0.000 description 1
- 102000016950 Chemokine CXCL1 Human genes 0.000 description 1
- 108010014419 Chemokine CXCL1 Proteins 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 101800001982 Cholecystokinin Proteins 0.000 description 1
- 102100025841 Cholecystokinin Human genes 0.000 description 1
- 206010008631 Cholera Diseases 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 208000003322 Coinfection Diseases 0.000 description 1
- 102000007644 Colony-Stimulating Factors Human genes 0.000 description 1
- 108010071942 Colony-Stimulating Factors Proteins 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 102000004420 Creatine Kinase Human genes 0.000 description 1
- 108010042126 Creatine kinase Proteins 0.000 description 1
- VMQMZMRVKUZKQL-UHFFFAOYSA-N Cu+ Chemical compound [Cu+] VMQMZMRVKUZKQL-UHFFFAOYSA-N 0.000 description 1
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 206010011777 Cystinosis Diseases 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- 102000003844 DNA helicases Human genes 0.000 description 1
- 108090000133 DNA helicases Proteins 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 208000011518 Danon disease Diseases 0.000 description 1
- 108010019673 Darbepoetin alfa Proteins 0.000 description 1
- 208000001490 Dengue Diseases 0.000 description 1
- 206010012310 Dengue fever Diseases 0.000 description 1
- 201000008163 Dentatorubral pallidoluysian atrophy Diseases 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 108010065372 Dynorphins Proteins 0.000 description 1
- 102000001039 Dystrophin Human genes 0.000 description 1
- 108010069091 Dystrophin Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 206010014561 Emphysema Diseases 0.000 description 1
- 206010014596 Encephalitis Japanese B Diseases 0.000 description 1
- 108010092674 Enkephalins Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 208000024720 Fabry Disease Diseases 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 208000001948 Farber Lipogranulomatosis Diseases 0.000 description 1
- 208000033149 Farber disease Diseases 0.000 description 1
- 102000009123 Fibrin Human genes 0.000 description 1
- 108010073385 Fibrin Proteins 0.000 description 1
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin monomer Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 description 1
- 108090000386 Fibroblast Growth Factor 1 Proteins 0.000 description 1
- 102000003971 Fibroblast Growth Factor 1 Human genes 0.000 description 1
- 102000003974 Fibroblast growth factor 2 Human genes 0.000 description 1
- 102100024785 Fibroblast growth factor 2 Human genes 0.000 description 1
- 108090000385 Fibroblast growth factor 7 Proteins 0.000 description 1
- 102000003972 Fibroblast growth factor 7 Human genes 0.000 description 1
- 201000006353 Filariasis Diseases 0.000 description 1
- 201000008892 GM1 Gangliosidosis Diseases 0.000 description 1
- 208000017462 Galactosialidosis Diseases 0.000 description 1
- 102400001370 Galanin Human genes 0.000 description 1
- 101800002068 Galanin Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- OETQLUYCMBARHJ-CIUDSAMLSA-N Gln-Asn-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OETQLUYCMBARHJ-CIUDSAMLSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 1
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 1
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 1
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 1
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 1
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 1
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 1
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 1
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 1
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 1
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 1
- UQKVUFGUSVYJMQ-IRIUXVKKSA-N Gln-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N)O UQKVUFGUSVYJMQ-IRIUXVKKSA-N 0.000 description 1
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 1
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 1
- 208000010055 Globoid Cell Leukodystrophy Diseases 0.000 description 1
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 1
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 1
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 1
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- AOCARQDSFTWWFT-DCAQKATOSA-N Glu-Met-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AOCARQDSFTWWFT-DCAQKATOSA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- UDEPRBFQTWGLCW-CIUDSAMLSA-N Glu-Pro-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O UDEPRBFQTWGLCW-CIUDSAMLSA-N 0.000 description 1
- MWTGQXBHVRTCOR-GLLZPBPUSA-N Glu-Thr-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MWTGQXBHVRTCOR-GLLZPBPUSA-N 0.000 description 1
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 1
- XAXJIUAWAFVADB-VJBMBRPKSA-N Glu-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XAXJIUAWAFVADB-VJBMBRPKSA-N 0.000 description 1
- NTHIHAUEXVTXQG-KKUMJFAQSA-N Glu-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O NTHIHAUEXVTXQG-KKUMJFAQSA-N 0.000 description 1
- QGAJQIGFFIQJJK-IHRRRGAJSA-N Glu-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QGAJQIGFFIQJJK-IHRRRGAJSA-N 0.000 description 1
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 1
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 1
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 1
- 108060003199 Glucagon Proteins 0.000 description 1
- 102400000321 Glucagon Human genes 0.000 description 1
- 108010017544 Glucosylceramidase Proteins 0.000 description 1
- 102000004547 Glucosylceramidase Human genes 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- FKJQNJCQTKUBCD-XPUUQOCRSA-N Gly-Ala-His Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O FKJQNJCQTKUBCD-XPUUQOCRSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- FMVLWTYYODVFRG-BQBZGAKWSA-N Gly-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN FMVLWTYYODVFRG-BQBZGAKWSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- HPAIKDPJURGQLN-KBPBESRZSA-N Gly-His-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 HPAIKDPJURGQLN-KBPBESRZSA-N 0.000 description 1
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 1
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 1
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 1
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 1
- JKSMZVCGQWVTBW-STQMWFEESA-N Gly-Trp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O JKSMZVCGQWVTBW-STQMWFEESA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- MUGLKCQHTUFLGF-WPRPVWTQSA-N Gly-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)CN MUGLKCQHTUFLGF-WPRPVWTQSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- 208000001500 Glycogen Storage Disease Type IIb Diseases 0.000 description 1
- 208000035148 Glycogen storage disease due to LAMP-2 deficiency Diseases 0.000 description 1
- 102100035716 Glycophorin-A Human genes 0.000 description 1
- 108091005250 Glycophorins Proteins 0.000 description 1
- 239000000579 Gonadotropin-Releasing Hormone Substances 0.000 description 1
- 102100039619 Granulocyte colony-stimulating factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 102000018997 Growth Hormone Human genes 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 239000000095 Growth Hormone-Releasing Hormone Substances 0.000 description 1
- QXZGBUJJYSLZLT-UHFFFAOYSA-N H-Arg-Pro-Pro-Gly-Phe-Ser-Pro-Phe-Arg-OH Natural products NC(N)=NCCCC(N)C(=O)N1CCCC1C(=O)N1C(C(=O)NCC(=O)NC(CC=2C=CC=CC=2)C(=O)NC(CO)C(=O)N2C(CCC2)C(=O)NC(CC=2C=CC=CC=2)C(=O)NC(CCCN=C(N)N)C(O)=O)CCC1 QXZGBUJJYSLZLT-UHFFFAOYSA-N 0.000 description 1
- 208000031886 HIV Infections Diseases 0.000 description 1
- 208000037357 HIV infectious disease Diseases 0.000 description 1
- 241000606768 Haemophilus influenzae Species 0.000 description 1
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 241000711549 Hepacivirus C Species 0.000 description 1
- 208000007514 Herpes zoster Diseases 0.000 description 1
- 102000007625 Hirudins Human genes 0.000 description 1
- 108010007267 Hirudins Proteins 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- ZJSMFRTVYSLKQU-DJFWLOJKSA-N His-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZJSMFRTVYSLKQU-DJFWLOJKSA-N 0.000 description 1
- VBOFRJNDIOPNDO-YUMQZZPRSA-N His-Gly-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N VBOFRJNDIOPNDO-YUMQZZPRSA-N 0.000 description 1
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 1
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 1
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 1
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 1
- 101000777636 Homo sapiens ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Proteins 0.000 description 1
- 101000775732 Homo sapiens Androgen receptor Proteins 0.000 description 1
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 description 1
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 description 1
- 101000981093 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 1 Proteins 0.000 description 1
- 101000914320 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 8 Proteins 0.000 description 1
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 1
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 1
- 101000917858 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-A Proteins 0.000 description 1
- 101000917839 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-B Proteins 0.000 description 1
- 101001005728 Homo sapiens Melanoma-associated antigen 1 Proteins 0.000 description 1
- 101001005718 Homo sapiens Melanoma-associated antigen 2 Proteins 0.000 description 1
- 101001005719 Homo sapiens Melanoma-associated antigen 3 Proteins 0.000 description 1
- 101001005720 Homo sapiens Melanoma-associated antigen 4 Proteins 0.000 description 1
- 101001057131 Homo sapiens Melanoma-associated antigen D4 Proteins 0.000 description 1
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 1
- 101000581981 Homo sapiens Neural cell adhesion molecule 1 Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 101000884271 Homo sapiens Signal transducer CD24 Proteins 0.000 description 1
- 101000934346 Homo sapiens T-cell surface antigen CD2 Proteins 0.000 description 1
- 102000003864 Human Follicle Stimulating Hormone Human genes 0.000 description 1
- 108010082302 Human Follicle Stimulating Hormone Proteins 0.000 description 1
- 102000013266 Human Regular Insulin Human genes 0.000 description 1
- 108010090613 Human Regular Insulin Proteins 0.000 description 1
- 241000341655 Human papillomavirus type 16 Species 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 208000015204 Hurler-Scheie syndrome Diseases 0.000 description 1
- 108700037017 Hyaluronidase Deficiency Proteins 0.000 description 1
- 208000005503 Hyaluronidase deficiency Diseases 0.000 description 1
- CPELXLSAUQHCOX-UHFFFAOYSA-N Hydrogen bromide Chemical class Br CPELXLSAUQHCOX-UHFFFAOYSA-N 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- 108010073807 IgG Receptors Proteins 0.000 description 1
- CZGUSIXMZVURDU-JZXHSEFVSA-N Ile(5)-angiotensin II Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=[NH2+])NC(=O)[C@@H]([NH3+])CC([O-])=O)C(C)C)C1=CC=C(O)C=C1 CZGUSIXMZVURDU-JZXHSEFVSA-N 0.000 description 1
- DMHGKBGOUAJRHU-RVMXOQNASA-N Ile-Arg-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N DMHGKBGOUAJRHU-RVMXOQNASA-N 0.000 description 1
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- MSASLZGZQAXVFP-PEDHHIEDSA-N Ile-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N MSASLZGZQAXVFP-PEDHHIEDSA-N 0.000 description 1
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 1
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 1
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 108010057186 Insulin Glargine Proteins 0.000 description 1
- COCFEDIXXNGUNL-RFKWWTKHSA-N Insulin glargine Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(=O)NCC(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 COCFEDIXXNGUNL-RFKWWTKHSA-N 0.000 description 1
- 108010064593 Intercellular Adhesion Molecule-1 Proteins 0.000 description 1
- 102100037877 Intercellular adhesion molecule 1 Human genes 0.000 description 1
- 102100026720 Interferon beta Human genes 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 108010047761 Interferon-alpha Proteins 0.000 description 1
- 102000006992 Interferon-alpha Human genes 0.000 description 1
- 108090000467 Interferon-beta Proteins 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 102000000589 Interleukin-1 Human genes 0.000 description 1
- 108010002352 Interleukin-1 Proteins 0.000 description 1
- 102000019223 Interleukin-1 receptor Human genes 0.000 description 1
- 108050006617 Interleukin-1 receptor Proteins 0.000 description 1
- 108010002386 Interleukin-3 Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 108010002586 Interleukin-7 Proteins 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 102000004310 Ion Channels Human genes 0.000 description 1
- 108090000862 Ion Channels Proteins 0.000 description 1
- 101150008942 J gene Proteins 0.000 description 1
- 201000005807 Japanese encephalitis Diseases 0.000 description 1
- 241000710842 Japanese encephalitis virus Species 0.000 description 1
- 208000028226 Krabbe disease Diseases 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- XNSAINXGIQZQOO-UHFFFAOYSA-N L-pyroglutamyl-L-histidyl-L-proline amide Natural products NC(=O)C1CCCN1C(=O)C(NC(=O)C1NC(=O)CC1)CC1=CN=CN1 XNSAINXGIQZQOO-UHFFFAOYSA-N 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- HOMFINRJHIIZNJ-HOCLYGCPSA-N Leu-Trp-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O HOMFINRJHIIZNJ-HOCLYGCPSA-N 0.000 description 1
- URLZCHNOLZSCCA-VABKMULXSA-N Leu-enkephalin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 URLZCHNOLZSCCA-VABKMULXSA-N 0.000 description 1
- 208000019693 Lung disease Diseases 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 102000009151 Luteinizing Hormone Human genes 0.000 description 1
- 108010073521 Luteinizing Hormone Proteins 0.000 description 1
- 208000016604 Lyme disease Diseases 0.000 description 1
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- MQMIRLVJXQNTRJ-SDDRHHMPSA-N Lys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O MQMIRLVJXQNTRJ-SDDRHHMPSA-N 0.000 description 1
- HEWWNLVEWBJBKA-WDCWCFNPSA-N Lys-Gln-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN HEWWNLVEWBJBKA-WDCWCFNPSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- VSTNAUBHKQPVJX-IHRRRGAJSA-N Lys-Met-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O VSTNAUBHKQPVJX-IHRRRGAJSA-N 0.000 description 1
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- PELXPRPDQRFBGQ-KKUMJFAQSA-N Lys-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O PELXPRPDQRFBGQ-KKUMJFAQSA-N 0.000 description 1
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 1
- 102100033342 Lysosomal acid glucosylceramidase Human genes 0.000 description 1
- 208000003221 Lysosomal acid lipase deficiency Diseases 0.000 description 1
- 208000015439 Lysosomal storage disease Diseases 0.000 description 1
- 108010059343 MM Form Creatine Kinase Proteins 0.000 description 1
- 108010046938 Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102000007651 Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 201000005505 Measles Diseases 0.000 description 1
- 102100025050 Melanoma-associated antigen 1 Human genes 0.000 description 1
- 102100025081 Melanoma-associated antigen 2 Human genes 0.000 description 1
- 102100025082 Melanoma-associated antigen 3 Human genes 0.000 description 1
- 102100025077 Melanoma-associated antigen 4 Human genes 0.000 description 1
- 101710151321 Melanostatin Proteins 0.000 description 1
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 1
- MDXAULHWGWETHF-SRVKXCTJSA-N Met-Arg-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCNC(N)=N MDXAULHWGWETHF-SRVKXCTJSA-N 0.000 description 1
- DGNZGCQSVGGYJS-BQBZGAKWSA-N Met-Gly-Asp Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O DGNZGCQSVGGYJS-BQBZGAKWSA-N 0.000 description 1
- ORRNBLTZBBESPN-HJWJTTGWSA-N Met-Ile-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ORRNBLTZBBESPN-HJWJTTGWSA-N 0.000 description 1
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 1
- WUYLWZRHRLLEGB-AVGNSLFASA-N Met-Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O WUYLWZRHRLLEGB-AVGNSLFASA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 1
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 1
- RIIFMEBFDDXGCV-VEVYYDQMSA-N Met-Thr-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O RIIFMEBFDDXGCV-VEVYYDQMSA-N 0.000 description 1
- KYXDADPHSNFWQX-VEVYYDQMSA-N Met-Thr-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O KYXDADPHSNFWQX-VEVYYDQMSA-N 0.000 description 1
- KLGIQJRMFHIGCQ-ZFWWWQNUSA-N Met-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(=O)NCC(O)=O)=CNC2=C1 KLGIQJRMFHIGCQ-ZFWWWQNUSA-N 0.000 description 1
- HOTNHEUETJELDL-BPNCWPANSA-N Met-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N HOTNHEUETJELDL-BPNCWPANSA-N 0.000 description 1
- VYDLZDRMOFYOGV-TUAOUCFPSA-N Met-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N VYDLZDRMOFYOGV-TUAOUCFPSA-N 0.000 description 1
- 201000011442 Metachromatic leukodystrophy Diseases 0.000 description 1
- 102000005741 Metalloproteases Human genes 0.000 description 1
- 108010006035 Metalloproteases Proteins 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 1
- 101800002372 Motilin Proteins 0.000 description 1
- 102000002419 Motilin Human genes 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 206010072929 Mucolipidosis type III Diseases 0.000 description 1
- 206010072930 Mucolipidosis type IV Diseases 0.000 description 1
- 102100026502 Mucolipin-1 Human genes 0.000 description 1
- 208000002678 Mucopolysaccharidoses Diseases 0.000 description 1
- 206010056893 Mucopolysaccharidosis VII Diseases 0.000 description 1
- 208000000149 Multiple Sulfatase Deficiency Disease Diseases 0.000 description 1
- 208000005647 Mumps Diseases 0.000 description 1
- 108010083674 Myelin Proteins Proteins 0.000 description 1
- 102000006386 Myelin Proteins Human genes 0.000 description 1
- 102100031790 Myelin expression factor 2 Human genes 0.000 description 1
- 101710107751 Myelin expression factor 2 Proteins 0.000 description 1
- 108060008487 Myosin Proteins 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 108091007491 NSP3 Papain-like protease domains Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 108010025020 Nerve Growth Factor Proteins 0.000 description 1
- 102100027347 Neural cell adhesion molecule 1 Human genes 0.000 description 1
- 102000008763 Neurofilament Proteins Human genes 0.000 description 1
- 108010088373 Neurofilament Proteins Proteins 0.000 description 1
- 208000002537 Neuronal Ceroid-Lipofuscinoses Diseases 0.000 description 1
- 102400000064 Neuropeptide Y Human genes 0.000 description 1
- 102400001103 Neurotensin Human genes 0.000 description 1
- 101800001814 Neurotensin Proteins 0.000 description 1
- 208000014060 Niemann-Pick disease Diseases 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 241000243985 Onchocerca volvulus Species 0.000 description 1
- 241000150452 Orthohantavirus Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 102400000050 Oxytocin Human genes 0.000 description 1
- 101800000989 Oxytocin Proteins 0.000 description 1
- XNOPRXBHLZRZKH-UHFFFAOYSA-N Oxytocin Natural products N1C(=O)C(N)CSSCC(C(=O)N2C(CCC2)C(=O)NC(CC(C)C)C(=O)NCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(CCC(N)=O)NC(=O)C(C(C)CC)NC(=O)C1CC1=CC=C(O)C=C1 XNOPRXBHLZRZKH-UHFFFAOYSA-N 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000701945 Parvoviridae Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000004590 Peripherins Human genes 0.000 description 1
- 108010003081 Peripherins Proteins 0.000 description 1
- 201000005702 Pertussis Diseases 0.000 description 1
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 1
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 1
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 1
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 1
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 1
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- PBWNICYZGJQKJV-BZSNNMDCSA-N Phe-Phe-Cys Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O PBWNICYZGJQKJV-BZSNNMDCSA-N 0.000 description 1
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 1
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 1
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 1
- ZVRJWDUPIDMHDN-ULQDDVLXSA-N Phe-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 ZVRJWDUPIDMHDN-ULQDDVLXSA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 1
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 1
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 1
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 1
- VGTJSEYTVMAASM-RPTUDFQQSA-N Phe-Thr-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VGTJSEYTVMAASM-RPTUDFQQSA-N 0.000 description 1
- QUUCAHIYARMNBL-FHWLQOOXSA-N Phe-Tyr-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N QUUCAHIYARMNBL-FHWLQOOXSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- 206010035148 Plague Diseases 0.000 description 1
- 241000233872 Pneumocystis carinii Species 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 208000000474 Poliomyelitis Diseases 0.000 description 1
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 1
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 1
- INXAPZFIOVGHSV-CIUDSAMLSA-N Pro-Asn-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 INXAPZFIOVGHSV-CIUDSAMLSA-N 0.000 description 1
- ZYBUKTMPPFQSHL-JYJNAYRXSA-N Pro-Asp-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZYBUKTMPPFQSHL-JYJNAYRXSA-N 0.000 description 1
- ZBAGOWGNNAXMOY-IHRRRGAJSA-N Pro-Cys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZBAGOWGNNAXMOY-IHRRRGAJSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- HATVCTYBNCNMAA-AVGNSLFASA-N Pro-Leu-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O HATVCTYBNCNMAA-AVGNSLFASA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- WIPAMEKBSHNFQE-IUCAKERBSA-N Pro-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@@H]1CCCN1 WIPAMEKBSHNFQE-IUCAKERBSA-N 0.000 description 1
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 1
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 1
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- 102100024622 Proenkephalin-B Human genes 0.000 description 1
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical class C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 1
- 108010057464 Prolactin Proteins 0.000 description 1
- 102000003946 Prolactin Human genes 0.000 description 1
- 241000169446 Promethis Species 0.000 description 1
- XBDQKXXYIPTUBI-UHFFFAOYSA-N Propionic acid Chemical class CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 101710150114 Protein rep Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 206010037742 Rabies Diseases 0.000 description 1
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000003743 Relaxin Human genes 0.000 description 1
- 108090000103 Relaxin Proteins 0.000 description 1
- 101710152114 Replication protein Proteins 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 208000013608 Salla disease Diseases 0.000 description 1
- 206010039438 Salmonella Infections Diseases 0.000 description 1
- 201000002883 Scheie syndrome Diseases 0.000 description 1
- 108010086019 Secretin Proteins 0.000 description 1
- 102100037505 Secretin Human genes 0.000 description 1
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 1
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- CLKKNZQUQMZDGD-SRVKXCTJSA-N Ser-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 CLKKNZQUQMZDGD-SRVKXCTJSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 1
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 1
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- 206010040550 Shigella infections Diseases 0.000 description 1
- 208000000828 Sialic Acid Storage Disease Diseases 0.000 description 1
- 208000017460 Sialidosis type 2 Diseases 0.000 description 1
- 102100038081 Signal transducer CD24 Human genes 0.000 description 1
- 201000001828 Sly syndrome Diseases 0.000 description 1
- 101710142969 Somatoliberin Proteins 0.000 description 1
- 102100022831 Somatoliberin Human genes 0.000 description 1
- 108010056088 Somatostatin Proteins 0.000 description 1
- 102000005157 Somatostatin Human genes 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 208000009415 Spinocerebellar Ataxias Diseases 0.000 description 1
- 101000857870 Squalus acanthias Gonadoliberin Proteins 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 108091008874 T cell receptors Proteins 0.000 description 1
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 1
- 102100025237 T-cell surface antigen CD2 Human genes 0.000 description 1
- 206010043376 Tetanus Diseases 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 1
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 1
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 1
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 1
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 1
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 1
- XVHAUVJXBFGUPC-RPTUDFQQSA-N Thr-Tyr-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XVHAUVJXBFGUPC-RPTUDFQQSA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- 102000011923 Thyrotropin Human genes 0.000 description 1
- 108010061174 Thyrotropin Proteins 0.000 description 1
- 239000000627 Thyrotropin-Releasing Hormone Substances 0.000 description 1
- 101800004623 Thyrotropin-releasing hormone Proteins 0.000 description 1
- 102400000336 Thyrotropin-releasing hormone Human genes 0.000 description 1
- 108091028113 Trans-activating crRNA Proteins 0.000 description 1
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 1
- 108010009583 Transforming Growth Factors Proteins 0.000 description 1
- 102000009618 Transforming Growth Factors Human genes 0.000 description 1
- 206010044608 Trichiniasis Diseases 0.000 description 1
- 108010065729 Troponin I Proteins 0.000 description 1
- VZBWRZGNEPBRDE-HZUKXOBISA-N Trp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N VZBWRZGNEPBRDE-HZUKXOBISA-N 0.000 description 1
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 1
- TUUXFNQXSFNFLX-XIRDDKMYSA-N Trp-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N TUUXFNQXSFNFLX-XIRDDKMYSA-N 0.000 description 1
- RERRMBXDSFMBQE-ZFWWWQNUSA-N Trp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERRMBXDSFMBQE-ZFWWWQNUSA-N 0.000 description 1
- UIRPULWLRODAEQ-QEJZJMRPSA-N Trp-Ser-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 UIRPULWLRODAEQ-QEJZJMRPSA-N 0.000 description 1
- GEGYPBOPIGNZIF-CWRNSKLLSA-N Trp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O GEGYPBOPIGNZIF-CWRNSKLLSA-N 0.000 description 1
- YCQXZDHDSUHUSG-FJHTZYQYSA-N Trp-Thr-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 YCQXZDHDSUHUSG-FJHTZYQYSA-N 0.000 description 1
- NMOIRIIIUVELLY-WDSOQIARSA-N Trp-Val-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)C(C)C)=CNC2=C1 NMOIRIIIUVELLY-WDSOQIARSA-N 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 102100033254 Tumor suppressor ARF Human genes 0.000 description 1
- 101710102803 Tumor suppressor ARF Proteins 0.000 description 1
- 208000037386 Typhoid Diseases 0.000 description 1
- HTHCZRWCFXMENJ-KKUMJFAQSA-N Tyr-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HTHCZRWCFXMENJ-KKUMJFAQSA-N 0.000 description 1
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 1
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 1
- RYSNTWVRSLCAJZ-RYUDHWBXSA-N Tyr-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RYSNTWVRSLCAJZ-RYUDHWBXSA-N 0.000 description 1
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 1
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 1
- GITNQBVCEQBDQC-KKUMJFAQSA-N Tyr-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O GITNQBVCEQBDQC-KKUMJFAQSA-N 0.000 description 1
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 1
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 1
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 1
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 1
- HRHYJNLMIJWGLF-BZSNNMDCSA-N Tyr-Ser-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 HRHYJNLMIJWGLF-BZSNNMDCSA-N 0.000 description 1
- PLVVHGFEMSDRET-IHPCNDPISA-N Tyr-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC3=CC=C(C=C3)O)N PLVVHGFEMSDRET-IHPCNDPISA-N 0.000 description 1
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 1
- SMUWZUSWMWVOSL-JYJNAYRXSA-N Tyr-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SMUWZUSWMWVOSL-JYJNAYRXSA-N 0.000 description 1
- DJIJBQYBDKGDIS-JYJNAYRXSA-N Tyr-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O DJIJBQYBDKGDIS-JYJNAYRXSA-N 0.000 description 1
- 102000003425 Tyrosinase Human genes 0.000 description 1
- 108060008724 Tyrosinase Proteins 0.000 description 1
- 108020004417 Untranslated RNA Proteins 0.000 description 1
- 102000039634 Untranslated RNA Human genes 0.000 description 1
- 102000011856 Utrophin Human genes 0.000 description 1
- 108010075653 Utrophin Proteins 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 1
- GNWUWQAVVJQREM-NHCYSSNCSA-N Val-Asn-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GNWUWQAVVJQREM-NHCYSSNCSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 1
- ZQGPWORGSNRQLN-NHCYSSNCSA-N Val-Asp-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZQGPWORGSNRQLN-NHCYSSNCSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- XBRMBDFYOFARST-AVGNSLFASA-N Val-His-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N XBRMBDFYOFARST-AVGNSLFASA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- NGXQOQNXSGOYOI-BQFCYCMXSA-N Val-Trp-Gln Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 NGXQOQNXSGOYOI-BQFCYCMXSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- GXBMIBRIOWHPDT-UHFFFAOYSA-N Vasopressin Natural products N1C(=O)C(CC=2C=C(O)C=CC=2)NC(=O)C(N)CSSCC(C(=O)N2C(CCC2)C(=O)NC(CCCN=C(N)N)C(=O)NCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(CCC(N)=O)NC(=O)C1CC1=CC=CC=C1 GXBMIBRIOWHPDT-UHFFFAOYSA-N 0.000 description 1
- 108010004977 Vasopressins Proteins 0.000 description 1
- 102000002852 Vasopressins Human genes 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 208000026589 Wolman disease Diseases 0.000 description 1
- 208000006269 X-Linked Bulbo-Spinal Atrophy Diseases 0.000 description 1
- 241000021375 Xenogenes Species 0.000 description 1
- 208000003152 Yellow Fever Diseases 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 150000001242 acetic acid derivatives Chemical class 0.000 description 1
- 229940099983 activase Drugs 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 229960002964 adalimumab Drugs 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000033289 adaptive immune response Effects 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 208000011589 adenoviridae infectious disease Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 108700025316 aldesleukin Proteins 0.000 description 1
- 229960003122 alglucerase Drugs 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- 201000008333 alpha-mannosidosis Diseases 0.000 description 1
- 229960003318 alteplase Drugs 0.000 description 1
- 102000006646 aminoglycoside phosphotransferase Human genes 0.000 description 1
- DZHSAHHDTRWUTF-SIQRNXPUSA-N amyloid-beta polypeptide 42 Chemical compound C([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O)[C@@H](C)CC)C(C)C)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O)C(C)C)C(C)C)C1=CC=CC=C1 DZHSAHHDTRWUTF-SIQRNXPUSA-N 0.000 description 1
- 229960004238 anakinra Drugs 0.000 description 1
- 229960002616 ancestim Drugs 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 239000004037 angiogenesis inhibitor Substances 0.000 description 1
- 230000002491 angiogenic effect Effects 0.000 description 1
- 108010072788 angiogenin Proteins 0.000 description 1
- 229950006323 angiotensin ii Drugs 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 229940115115 aranesp Drugs 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- KBZOIRJILGZLEJ-LGYYRGKSSA-N argipressin Chemical compound C([C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSC[C@@H](C(N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)=O)N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(N)=O)C1=CC=CC=C1 KBZOIRJILGZLEJ-LGYYRGKSSA-N 0.000 description 1
- 108010021908 aspartyl-aspartyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 239000012131 assay buffer Substances 0.000 description 1
- 230000037444 atrophy Effects 0.000 description 1
- 201000004562 autosomal dominant cerebellar ataxia Diseases 0.000 description 1
- 229940120638 avastin Drugs 0.000 description 1
- 230000008970 bacterial immunity Effects 0.000 description 1
- 210000000227 basophil cell of anterior lobe of hypophysis Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 150000001558 benzoic acid derivatives Chemical class 0.000 description 1
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 1
- WOPZMFQRCBYPJU-NTXHZHDSSA-N beta-endorphin Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)[C@@H](C)O)C1=CC=CC=C1 WOPZMFQRCBYPJU-NTXHZHDSSA-N 0.000 description 1
- 229960000397 bevacizumab Drugs 0.000 description 1
- 238000003236 bicinchoninic acid assay Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000029918 bioluminescence Effects 0.000 description 1
- 238000005415 bioluminescence Methods 0.000 description 1
- 229960000182 blood factors Drugs 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- DNDCVAGJPBKION-DOPDSADYSA-N bombesin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(N)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC=1NC2=CC=CC=C2C=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1NC(=O)CC1)C(C)C)C1=CN=CN1 DNDCVAGJPBKION-DOPDSADYSA-N 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 229940112869 bone morphogenetic protein Drugs 0.000 description 1
- QXZGBUJJYSLZLT-FDISYFBBSA-N bradykinin Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(=O)NCC(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CO)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CCC1 QXZGBUJJYSLZLT-FDISYFBBSA-N 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 1
- 229910002091 carbon monoxide Inorganic materials 0.000 description 1
- 238000012754 cardiac puncture Methods 0.000 description 1
- NSQLIUXCMFBZME-MPVJKSABSA-N carperitide Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 NSQLIUXCMFBZME-MPVJKSABSA-N 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 210000003591 cerebellar nuclei Anatomy 0.000 description 1
- 229960005395 cetuximab Drugs 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 229940107137 cholecystokinin Drugs 0.000 description 1
- 208000024042 cholesterol ester storage disease Diseases 0.000 description 1
- 208000013760 cholesteryl ester storage disease Diseases 0.000 description 1
- 238000011509 clonal analysis Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 229940047120 colony stimulating factors Drugs 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 208000025729 dengue disease Diseases 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 206010013023 diphtheria Diseases 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 229960000284 efalizumab Drugs 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 229940073621 enbrel Drugs 0.000 description 1
- 230000002124 endocrine Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 239000003248 enzyme activator Substances 0.000 description 1
- 108010002601 epoetin beta Proteins 0.000 description 1
- 229940089118 epogen Drugs 0.000 description 1
- 229940082789 erbitux Drugs 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 229960000403 etanercept Drugs 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 229960000301 factor viii Drugs 0.000 description 1
- 229950003499 fibrin Drugs 0.000 description 1
- 239000003527 fibrinolytic agent Substances 0.000 description 1
- 229960004177 filgrastim Drugs 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000002073 fluorescence micrograph Methods 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 201000008049 fucosidosis Diseases 0.000 description 1
- 238000002825 functional assay Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 229940063135 genotropin Drugs 0.000 description 1
- 201000006592 giardiasis Diseases 0.000 description 1
- 229960004666 glucagon Drugs 0.000 description 1
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 201000008977 glycoproteinosis Diseases 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- XLXSAKCOAKORKW-AQJXLSMYSA-N gonadorelin Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)NCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(O)C=C1 XLXSAKCOAKORKW-AQJXLSMYSA-N 0.000 description 1
- 229940035638 gonadotropin-releasing hormone Drugs 0.000 description 1
- 208000037824 growth disorder Diseases 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 229940047650 haemophilus influenzae Drugs 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000002064 heart cell Anatomy 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000005534 hematocrit Methods 0.000 description 1
- 230000002489 hematologic effect Effects 0.000 description 1
- 208000005252 hepatitis A Diseases 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 229940022353 herceptin Drugs 0.000 description 1
- 229940006607 hirudin Drugs 0.000 description 1
- WQPDUTSPKFMPDP-OUMQNGNKSA-N hirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(OS(O)(=O)=O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]1NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]2CSSC[C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@H](C(NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N2)=O)CSSC1)C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)C(C)C)[C@@H](C)O)CSSC1)C(C)C)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 WQPDUTSPKFMPDP-OUMQNGNKSA-N 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 229940038661 humalog Drugs 0.000 description 1
- WNRQPCUGRUFHED-DETKDSODSA-N humalog Chemical compound C([C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O)C1=CC=C(O)C=C1.C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 WNRQPCUGRUFHED-DETKDSODSA-N 0.000 description 1
- 102000057593 human F8 Human genes 0.000 description 1
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 description 1
- 229940065770 humatrope Drugs 0.000 description 1
- 229940048921 humira Drugs 0.000 description 1
- 230000004727 humoral immunity Effects 0.000 description 1
- 229940103471 humulin Drugs 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 150000003840 hydrochlorides Chemical class 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 210000003297 immature b lymphocyte Anatomy 0.000 description 1
- 210000002861 immature t-cell Anatomy 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 208000027866 inflammatory disease Diseases 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 230000002608 insulinlike Effects 0.000 description 1
- 108700027921 interferon tau Proteins 0.000 description 1
- 229940047124 interferons Drugs 0.000 description 1
- 102000002467 interleukin receptors Human genes 0.000 description 1
- 108010093036 interleukin receptors Proteins 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 229940054136 kineret Drugs 0.000 description 1
- 229940047434 kogenate Drugs 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 229940060975 lantus Drugs 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000003141 lower extremity Anatomy 0.000 description 1
- 229940076783 lucentis Drugs 0.000 description 1
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 229940040129 luteinizing hormone Drugs 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 230000002132 lysosomal effect Effects 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 230000002101 lytic effect Effects 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 201000004792 malaria Diseases 0.000 description 1
- 150000002690 malonic acid derivatives Chemical class 0.000 description 1
- 230000021121 meiosis Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- CWWARWOPSKGELM-SARDKLJWSA-N methyl (2s)-2-[[(2s)-2-[[2-[[(2s)-2-[[(2s)-2-[[(2s)-5-amino-2-[[(2s)-5-amino-2-[[(2s)-1-[(2s)-6-amino-2-[[(2s)-1-[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carbonyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]-5-oxopentanoyl]amino]-5 Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)OC)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CCCN=C(N)N)C1=CC=CC=C1 CWWARWOPSKGELM-SARDKLJWSA-N 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000004001 molecular interaction Effects 0.000 description 1
- SLZIZIJTGAYEKK-CIJSCKBQSA-N molport-023-220-247 Chemical compound C([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)CN)[C@@H](C)O)C1=CNC=N1 SLZIZIJTGAYEKK-CIJSCKBQSA-N 0.000 description 1
- 201000007769 mucolipidosis Diseases 0.000 description 1
- 208000020468 mucolipidosis III alpha/beta Diseases 0.000 description 1
- 206010028093 mucopolysaccharidosis Diseases 0.000 description 1
- 201000002273 mucopolysaccharidosis II Diseases 0.000 description 1
- 208000012253 mucopolysaccharidosis IVA Diseases 0.000 description 1
- 208000022018 mucopolysaccharidosis type 2 Diseases 0.000 description 1
- 208000036710 mucopolysaccharidosis type 3A Diseases 0.000 description 1
- 208000036709 mucopolysaccharidosis type 3B Diseases 0.000 description 1
- 208000036707 mucopolysaccharidosis type 3C Diseases 0.000 description 1
- 208000036725 mucopolysaccharidosis type 3D Diseases 0.000 description 1
- 208000025919 mucopolysaccharidosis type 7 Diseases 0.000 description 1
- 208000012091 mucopolysaccharidosis type IVB Diseases 0.000 description 1
- 208000010805 mumps infectious disease Diseases 0.000 description 1
- 210000004165 myocardium Anatomy 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 101150042523 myod gene Proteins 0.000 description 1
- OHDXDNUPVVYWOV-UHFFFAOYSA-N n-methyl-1-(2-naphthalen-1-ylsulfanylphenyl)methanamine Chemical compound CNCC1=CC=CC=C1SC1=CC=CC2=CC=CC=C12 OHDXDNUPVVYWOV-UHFFFAOYSA-N 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 229940053128 nerve growth factor Drugs 0.000 description 1
- 229940071846 neulasta Drugs 0.000 description 1
- 229940029345 neupogen Drugs 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 210000005044 neurofilament Anatomy 0.000 description 1
- 230000000926 neurological effect Effects 0.000 description 1
- 201000008051 neuronal ceroid lipofuscinosis Diseases 0.000 description 1
- PCJGZPGTCUMMOT-ISULXFBGSA-N neurotensin Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(O)C=C1 PCJGZPGTCUMMOT-ISULXFBGSA-N 0.000 description 1
- 229940063137 norditropin Drugs 0.000 description 1
- 229940103453 novolin Drugs 0.000 description 1
- 229940112216 novoseven Drugs 0.000 description 1
- URPYMXQQVHTUDU-OFGSCBOVSA-N nucleopeptide y Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 URPYMXQQVHTUDU-OFGSCBOVSA-N 0.000 description 1
- 229940063149 nutropin Drugs 0.000 description 1
- 229960000470 omalizumab Drugs 0.000 description 1
- 208000002042 onchocerciasis Diseases 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 229960001723 oxytocin Drugs 0.000 description 1
- XNOPRXBHLZRZKH-DSZYJQQASA-N oxytocin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSC[C@H](N)C(=O)N1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(N)=O)=O)[C@@H](C)CC)C1=CC=C(O)C=C1 XNOPRXBHLZRZKH-DSZYJQQASA-N 0.000 description 1
- 108700025694 p53 Genes Proteins 0.000 description 1
- 239000006179 pH buffering agent Substances 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- HQQSBEDKMRHYME-UHFFFAOYSA-N pefloxacin mesylate Chemical compound [H+].CS([O-])(=O)=O.C1=C2N(CC)C=C(C(O)=O)C(=O)C2=CC(F)=C1N1CCN(C)CC1 HQQSBEDKMRHYME-UHFFFAOYSA-N 0.000 description 1
- 229960001373 pegfilgrastim Drugs 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 210000005047 peripherin Anatomy 0.000 description 1
- 239000008177 pharmaceutical agent Substances 0.000 description 1
- 229940124531 pharmaceutical excipient Drugs 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 230000036515 potency Effects 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 229940029359 procrit Drugs 0.000 description 1
- 239000000583 progesterone congener Substances 0.000 description 1
- 229940097325 prolactin Drugs 0.000 description 1
- 229940087463 proleukin Drugs 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 229940023143 protein vaccine Drugs 0.000 description 1
- XNSAINXGIQZQOO-SRVKXCTJSA-N protirelin Chemical compound NC(=O)[C@@H]1CCCN1C(=O)[C@@H](NC(=O)[C@H]1NC(=O)CC1)CC1=CN=CN1 XNSAINXGIQZQOO-SRVKXCTJSA-N 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 235000008001 rakum palm Nutrition 0.000 description 1
- 229960003876 ranibizumab Drugs 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 239000002464 receptor antagonist Substances 0.000 description 1
- 229940044551 receptor antagonist Drugs 0.000 description 1
- 210000003370 receptor cell Anatomy 0.000 description 1
- 108010013773 recombinant FVIIa Proteins 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 229940116157 regranex Drugs 0.000 description 1
- 230000037425 regulation of transcription Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 201000005404 rubella Diseases 0.000 description 1
- 229940063153 saizen Drugs 0.000 description 1
- 206010039447 salmonellosis Diseases 0.000 description 1
- 201000004409 schistosomiasis Diseases 0.000 description 1
- 229960002101 secretin Drugs 0.000 description 1
- OWMZNFCDEHGFEP-NFBCVYDUSA-N secretin human Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(N)=O)[C@@H](C)O)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)C1=CC=CC=C1 OWMZNFCDEHGFEP-NFBCVYDUSA-N 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 229940117012 serostim Drugs 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 201000005113 shigellosis Diseases 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 1
- 125000005629 sialic acid group Chemical group 0.000 description 1
- 208000011985 sialidosis Diseases 0.000 description 1
- 239000002924 silencing RNA Substances 0.000 description 1
- IZTQOLKUZKXIRV-YRVFCXMDSA-N sincalide Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@@H](N)CC(O)=O)C1=CC=C(OS(O)(=O)=O)C=C1 IZTQOLKUZKXIRV-YRVFCXMDSA-N 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 229960000553 somatostatin Drugs 0.000 description 1
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 1
- 210000002325 somatostatin-secreting cell Anatomy 0.000 description 1
- 229960004532 somatropin Drugs 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 150000003467 sulfuric acid derivatives Chemical class 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 108010026424 tau Proteins Proteins 0.000 description 1
- 102000013498 tau Proteins Human genes 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229960000103 thrombolytic agent Drugs 0.000 description 1
- 229940034199 thyrotropin-releasing hormone Drugs 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 108010078749 trafermin Proteins 0.000 description 1
- 229950009227 trafermin Drugs 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 229960000575 trastuzumab Drugs 0.000 description 1
- 208000003982 trichinellosis Diseases 0.000 description 1
- 201000007588 trichinosis Diseases 0.000 description 1
- 201000002311 trypanosomiasis Diseases 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 201000008297 typhoid fever Diseases 0.000 description 1
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 229960003726 vasopressin Drugs 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000010464 virion assembly Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 229940099073 xolair Drugs 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/66—Microorganisms or materials therefrom
- A61K35/76—Viruses; Subviral particles; Bacteriophages
- A61K35/761—Adenovirus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/66—Microorganisms or materials therefrom
- A61K35/76—Viruses; Subviral particles; Bacteriophages
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0008—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/001—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof by chemical synthesis
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1058—Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0684—Cells of the urinary tract or kidneys
- C12N5/0686—Kidney cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/14—Type of nucleic acid interfering N.A.
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14142—Use of virus, viral particle or viral elements as a vector virus or viral particle as vehicle, e.g. encapsulating small organic molecule
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Abstract
【課題】ヒトAAV中和抗体への耐性が向上した、異種核酸を含む、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンの提供。異種核酸を含むrAAVビリオンを用いた標的細胞に送達する方法の提供。【解決手段】(a)特定のアミノ酸配列の少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む、変異体アデノ随伴ウイルスカプシドタンパク質、並びに(b)異種核酸を含む、感染性組換えアデノ随伴ウイルスビリオン。【選択図】なし
Description
相互参照
本出願は、2013年5月31日に出願された米国特許仮出願第61/829,735号の利益を主張し、この出願は参照によりその全体が本明細書に組み込まれる。
本出願は、2013年5月31日に出願された米国特許仮出願第61/829,735号の利益を主張し、この出願は参照によりその全体が本明細書に組み込まれる。
連邦政府委託研究に関する声明
本発明は、米国国立衛生研究所によって授与された助成金番号HL081527の下で、政府の支持を伴ってなされた。政府は本発明においてある特定の権利を有する。
本発明は、米国国立衛生研究所によって授与された助成金番号HL081527の下で、政府の支持を伴ってなされた。政府は本発明においてある特定の権利を有する。
テキストファイルとして提供される配列表の参照による組み込み
配列表は、2014年5月28日に作成され、169KBのサイズを有する「BERK-216WO_ST25.txt」というテキストファイルとして、本明細書とともに提供される。本テキストファイルの内容は、その全体が参照により本明細書に組み込まれる。
配列表は、2014年5月28日に作成され、169KBのサイズを有する「BERK-216WO_ST25.txt」というテキストファイルとして、本明細書とともに提供される。本テキストファイルの内容は、その全体が参照により本明細書に組み込まれる。
導入
アデノ随伴ウイルス(AAV)に基づく遺伝子送達ベクターは、前臨床疾患モデル、及び最近ではいくつかの疾患標的についてのヒト臨床試験の両方において、有望性を実証している。野生型AAVは非病原性であり、かついずれの既知の疾患とも病因的関連性を有しないため、AAVに基づくベクターは最高に安全である。さらに、AAVは、肝臓、筋肉、肺、網膜、及び脳を含む多くの組織における、高度に効率的な遺伝子送達及び持続的な導入遺伝子発現の能力を提供する。
アデノ随伴ウイルス(AAV)に基づく遺伝子送達ベクターは、前臨床疾患モデル、及び最近ではいくつかの疾患標的についてのヒト臨床試験の両方において、有望性を実証している。野生型AAVは非病原性であり、かついずれの既知の疾患とも病因的関連性を有しないため、AAVに基づくベクターは最高に安全である。さらに、AAVは、肝臓、筋肉、肺、網膜、及び脳を含む多くの組織における、高度に効率的な遺伝子送達及び持続的な導入遺伝子発現の能力を提供する。
AAVは、2つのオープンリーディングフレーム、rep及びcapを含有する、1本鎖DNAウイルスである。第1の遺伝子は、ゲノム複製に必要な4つのタンパク質(Rep78、Rep68、Rep52、及びRep40)をコードし、第2の遺伝子は、集合してウイルス性カプシドを形成する3つの構造タンパク質(VP1~3)を発現する。その名が暗示するように、AAVは、活発な複製のために、アデノウイルスまたはヘルペスウイルス等のヘルパーウイルスの存在に依存する。ヘルパーの不在下では、AAVは、そのゲノムがエピソームとして維持されるまたは宿主染色体に統合される、潜伏状態を確立する。複数の同種霊長類AAV血清型及び多数の非ヒト霊長類型が特定されている。AAV2は、遺伝子送達ビヒクルとして最もよく特徴がわかっている。
2010年時点で、AAVを遺伝子送達ビヒクルとして使用した、75件の進行中臨床試験があった。しかしながら、ヒト母集団内での多数のAAV変異体及び血清型への広範囲にわたる曝露に起因する、抗カプシド中和抗体の高い保有率が、AAV遺伝子療法の効能を低減させる。この既存の免疫、ならびにベクター投与に起因する後続の免疫発達は、AAV遺伝子療法のより広い実施を妨げ得る。例えば、現在までで、AAVは免疫特権領域への送達を含む臨床研究において最も成功してきている。
近年の分析は、ヒトにおける抗AAV IgG抗体の保有率は、AAV2(72%)及びAAV1(67%)について最も高いが、AAV9(47%)、AAV6(46%)、AAV5(40%)、及びAAV8(38%)抗体もまた研究された母集団の大部分において存在したことを示した。いくつかの研究は、遺伝子療法中のAAVカプシドへの液性免疫が、送達されるrAAV粒子の量を低下させることによって防止され得ることを見出した。残念ながら、低いベクター用量の投与は、低い形質導入、ひいては低い治療的遺伝子発現をもたらす。
当該技術分野において、抗AAV抗体による中和に耐性である新規AAV変異体の開発の必要性がある。
Asuri et al.,Mol Ther.2012 Feb;20(2):329-38
Bainbridge et al.,N Engl J Med.2008 May 22;358(21):2231-9
Excoffon et al.,Proc Natl Acad Sci U S A.2009Mar10;106(10):3865-70
Grimm et al.,J Virol.2008 Jun;82(12):5887-911
Jang et al.,Mol Ther.2011 Apr;19(4):667-75
Klimczak et al.,PLoS One.2009 Oct14;4(10):e7467
Koerber et al.;Mol Ther.2008 Oct;16(10):1703-9
Koerber et al.;Mol Ther.2009 Dec;17(12):2088-95
Maguire et al.,N Engl J Med.2008 May22;358(21):2240-8
Maguire et al.,Lancet.2009 Nov 7;374(9701):1597-605
Maheshri et al.,Nat Biotechnol.2006 Feb;24(2):198-204
Perabo et al.,J Gene Med.2006 Feb;8(2):155-62
Yang et al.,Proc Natl Acad Sci U S A.2009 Mar 10;106(10):3946-51
概要
本開示は、変異体カプシドタンパク質及び異種核酸を含む、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンを提供する。本開示は、感染性rAAVビリオンに、ヒトAAV中和抗体への上昇した耐性を与える、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質(及び/または変異体AAVカプシドタンパク質をコードする核酸)をさらに提供する。本開示は、感染性rAAVビリオン及び/または主題の変異体AAVカプシドタンパク質をコードする核酸を含む、宿主細胞をさらに提供する。本開示は、上記のビリオン、カプシドタンパク質、核酸、及び/または宿主細胞のライブラリをさらに提供し、このライブラリの少なくとも1つのメンバーの変異体AAVカプシドタンパク質は、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列と比べて、少なくとも1つのアミノ酸置換を有するアミノ酸配列を含む。
本開示は、変異体カプシドタンパク質及び異種核酸を含む、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンを提供する。本開示は、感染性rAAVビリオンに、ヒトAAV中和抗体への上昇した耐性を与える、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質(及び/または変異体AAVカプシドタンパク質をコードする核酸)をさらに提供する。本開示は、感染性rAAVビリオン及び/または主題の変異体AAVカプシドタンパク質をコードする核酸を含む、宿主細胞をさらに提供する。本開示は、上記のビリオン、カプシドタンパク質、核酸、及び/または宿主細胞のライブラリをさらに提供し、このライブラリの少なくとも1つのメンバーの変異体AAVカプシドタンパク質は、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列と比べて、少なくとも1つのアミノ酸置換を有するアミノ酸配列を含む。
本開示は、異種核酸を標的細胞に送達する方法をさらに提供し、この標的細胞は主題の感染性rAAVビリオンに接触させられる。本開示は、遺伝子産物を個体に送達する方法をさらに提供し、該方法は概して、有効量の主題のrAAVビリオンを、それを必要とする個体に投与することを含む。本明細書には、主題の方法を実践するための組成物及びキットもまた提供される。
特徴
本開示の特徴は、(a)配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質、ならびに(b)異種核酸を含む、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンを含む。いくつかの場合では、変異体AAVカプシドタンパク質は、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含む。いくつかの場合では、変異体AAVカプシドタンパク質は、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列を含む。
本開示の特徴は、(a)配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質、ならびに(b)異種核酸を含む、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンを含む。いくつかの場合では、変異体AAVカプシドタンパク質は、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含む。いくつかの場合では、変異体AAVカプシドタンパク質は、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列を含む。
本開示の特徴は、(a)配列番号10に記載されるアミノ酸配列と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ、配列番号2と比べてアミノ酸置換N312K、N449D、D472N、N551S、I698V、及びL735Qを含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質、ならびに(b)異種核酸を含む、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンを含む。いくつかの場合では、変異体AAVカプシドタンパク質は、配列番号10に記載されるアミノ酸配列を含む。いくつかの場合では、rAAVは、AAV2(野生型AAV血清型2)によって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を示す。いくつかの場合では、rAAVは、AAV2によって示される耐性よりも、ヒトAAV中和抗体への少なくとも約1.5倍(例えば、少なくとも約3倍、少なくとも約5倍、少なくとも約10倍、少なくとも約30倍等)高い耐性を示す。いくつかの場合では、rAAVは、野生型AAV血清型2(AAV2)によって示される哺乳類細胞への形質導入と比較して、ヒトAAV中和抗体の存在下で、哺乳類細胞への増加した形質導入を示す。いくつかの場合では、哺乳類細胞は、肝臓細胞、膵臓細胞、骨格筋細胞、心筋細胞、線維芽細胞、網膜細胞、滑膜関節細胞、肺細胞、T細胞、ニューロン、グリア細胞、幹細胞(例えば、造血幹細胞、造血前駆細胞、神経幹細胞、神経前駆細胞、神経堤幹細胞、胚幹細胞、誘導多能性幹細胞(iPS細胞)、間葉幹細胞、中胚葉幹細胞、肝臓幹細胞、膵臓幹細胞、膵臓前駆細胞、筋幹細胞、網膜幹細胞等)、内皮細胞、または癌細胞である。いくつかの場合では、異種核酸は、RNA干渉剤を含む。いくつかの場合では、異種核酸はポリペプチドをコードするヌクレオチド配列を含む。
本開示の特徴は、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む変異体アデノ随伴ウイルス(AAV)カプシドタンパク質をコードするヌクレオチド配列を含む、単離核酸を含む。いくつかの場合では、コードされた変異体AAVカプシドタンパク質は、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含む。いくつかの場合では、コードされた変異体AAVカプシドタンパク質は、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列を含む。
本開示の特徴は、配列番号10に記載されるアミノ酸配列と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ配列番号2と比べてアミノ酸置換N312K、N449D、D472N、N551S、I698V、及びL735Qを含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質をコードするヌクレオチド配列を含む、単離核酸を含む。
いくつかの場合では、コードされた変異体AAVカプシドタンパク質(単離核酸によってコードされた)は、AAV2(野生型AAV血清型2)によって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える。いくつかの場合では、上昇した耐性は、AAV2によって示される耐性よりも、少なくとも約1.5倍(例えば、少なくとも約3倍、少なくとも約5倍、少なくとも約10倍、少なくとも約30倍等)高い。いくつかの場合では、コードされた変異体AAVカプシドタンパク質(単離核酸によってコードされた)は、AAV2によって示される形質導入と比較して、ヒトAAV中和抗体の存在下における哺乳類細胞への増加した形質導入を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える。
本開示の特徴は、上記の主題の核酸を含む単離宿主細胞を含む。いくつかの場合では、宿主細胞が該核酸で安定的にトランスフェクトされる。いくつかの場合では、宿主細胞は、AAVrepタンパク質をコードするヌクレオチド配列を含む核酸をさらに含む。いくつかの場合では、宿主細胞は組換えAAVベクターをさらに含む。
本開示の特徴は、標的細胞を主題のビリオン(上記)に接触させることを含む、異種核酸を標的細胞に送達する方法を含む。いくつかの場合では、標的細胞は、肝臓細胞、膵臓細胞、骨格筋細胞、心筋細胞、線維芽細胞、網膜細胞、滑膜関節細胞、肺細胞、T細胞、ニューロン、グリア細胞、幹細胞(例えば、造血幹細胞、造血前駆細胞、神経幹細胞、神経前駆細胞、神経堤幹細胞、胚幹細胞、誘導多能性幹細胞(iPS細胞)、間葉幹細胞、中胚葉幹細胞、肝臓幹細胞、膵臓幹細胞、膵臓前駆細胞、筋幹細胞、もしくは網膜幹細胞等)、内皮細胞、または癌細胞である。いくつかの場合では、標的細胞はインビトロである。いくつかの場合では、標的細胞はインビボである。
本開示の特徴は、遺伝子産物を、それを必要とする個体に送達する方法を含み、該方法は、個体に有効量の主題の感染性組換えアデノ随伴ウイルス(rAAV)ビリオン(上記)を投与することを含む。いくつかの場合では、rAAVビリオンの異種核酸はRNA干渉剤を含む。いくつかの場合では、rAAVビリオンの異種核酸は、ポリペプチドをコードするヌクレオチド配列を含む。いくつかの場合では、投与ステップは感染性rAAVビリオンの間接的送達を含む。いくつかの場合では、投与ステップは感染性rAAVビリオンの直接的送達を含む。
本開示の特徴は、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質を含む。いくつかの場合では、AAVカプシドタンパク質は、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含む。いくつかの場合では、AAVカプシドタンパク質は、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列を含む。
本開示の特徴は、配列番号10に記載されるアミノ酸配列と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ配列番号2と比べてアミノ酸置換N312K、N449D、D472N、N551S、I698V、及びL735Qを含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質を含む。いくつかの場合では、変異体AAVカプシドタンパク質は、配列番号10に記載されるアミノ酸配列を含む。いくつかの場合では、変異体AAVカプシドタンパク質は、AAV2によって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える。いくつかの場合では、上昇した耐性は、AAV2によって示される耐性よりも、少なくとも約1.5倍(例えば少なくとも約3倍、少なくとも約5倍、少なくとも約10倍、少なくとも約30倍等)高い。いくつかの場合では、変異体AAVカプシドタンパク質は、AAV2によって示される形質導入と比較して、ヒトAAV中和抗体の存在下における哺乳類細胞への増加した形質導入を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える。
本開示の特徴は、(i)それぞれが変異体アデノ随伴ウイルス(AAV)カプシドタンパク質及び異種核酸を含む、2つ以上の感染性rAAVビリオン、(ii)それぞれが変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含む、2つ以上の単離核酸、(iii)それぞれが変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含む核酸を含む、2つ以上の宿主細胞、及び(iv)2つ以上の変異体AAVカプシドタンパク質、のうちの少なくとも1つを含むライブラリを含み、このライブラリの少なくとも1つのメンバーの変異体AAVカプシドタンパク質は、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列と比べて少なくとも1つのアミノ酸置換を有するアミノ酸配列を含む。
本開示の特徴は、スターターカプシドタンパク質を含むスターター(親)ビリオンと比べて変化した感染特性を示す、改変感染性rAAVビリオンを生成及び特定する方法を含み、該方法は、(a)スターターカプシドタンパク質から変異体アデノ随伴ウイルス(AAV)カプシドタンパク質を生成するステップであって、このスターターカプシドタンパク質が配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含み、かつそれぞれの変異体AAVカプシドタンパク質がスターターカプシドタンパク質と比べて少なくとも1つのアミノ酸置換を含む、ステップと、(b)それぞれがステップ(a)で生成された変異体カプシドAAVタンパク質を含む、変異体AAVビリオンを生成するステップと、(c)ステップ(b)で生成された変異体AAVビリオンを変化した感染特性についてアッセイして、改変感染性rAAVビリオンを特定するステップと、を含む。いくつかの場合では、変異体AAVカプシドタンパク質のライブラリの生成は、ポリメラーゼ連鎖反応突然変異誘発、オリゴヌクレオチド特異的突然変異誘発、飽和突然変異誘発、ループスワップ突然変異誘発、断片シャフリング突然変異誘発、及びそれらの組み合わせから成る群から選択される、突然変異誘発方法を含む。いくつかの場合では、変化した感染特性は、ヒト中和AAV抗体への、スタータービリオンによって示される耐性と比較して上昇した耐性である。いくつかの場合では、変化した感染特性は、ヒトAAV中和抗体の存在下での哺乳類細胞の、スタータービリオンによって示される形質導入と比較して増加した形質導入である。いくつかの場合では、改変感染性rAAVビリオンは、スターターカプシドタンパク質と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む、改変AAVカプシドタンパク質を含む。
本開示の特徴は、スターターカプシドタンパク質から変異体AAVカプシドタンパク質を生成する方法を含み、該方法は、スターターカプシドタンパク質をコードするヌクレオチド配列を含む核酸を、ポリメラーゼ連鎖反応突然変異誘発、オリゴヌクレオチド特異的突然変異誘発、飽和突然変異誘発、ループスワップ突然変異誘発、断片シャフリング突然変異誘発、及びそれらの組み合わせから成る群から選択される種類の突然変異誘発に供することを含み、このスターターカプシドタンパク質は、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む。
[本発明1001]
(a)配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質、ならびに
(b)異種核酸
を含む、感染性組換えアデノ随伴ウイルス(rAAV)ビリオン。
[本発明1002]
前記変異体AAVカプシドタンパク質が、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含む、本発明1001の前記感染性rAAV。
[本発明1003]
前記変異体AAVカプシドタンパク質が、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列を含む、本発明1001の前記感染性rAAV。
[本発明1004]
(a)配列番号10に記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ配列番号2と比べてアミノ酸置換N312K、N449D、D472N、N551S、I698V、及びL735Qを含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質、ならびに
(b)異種核酸
を含む、感染性組換えアデノ随伴ウイルス(rAAV)ビリオン。
[本発明1005]
前記変異体AAVカプシドタンパク質が配列番号10に記載されるアミノ酸配列を含む、本発明1004の前記感染性rAAV。
[本発明1006]
AAV2(野生型AAV血清型2)によって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を示す、本発明1001または本発明1004の前記感染性rAAV。
[本発明1007]
前記rAAVビリオンが、AAV2によって示される耐性よりも少なくとも約1.5倍高いヒトAAV中和抗体への耐性を示す、本発明1006の前記感染性rAAV。
[本発明1008]
前記rAAVビリオンが、AAV2によって示される耐性よりも少なくとも約3倍高いヒトAAV中和抗体への耐性を示す、本発明1006の前記感染性rAAV。
[本発明1009]
前記rAAVビリオンが、AAV2によって示される耐性よりも少なくとも約5倍高いヒトAAV中和抗体への耐性を示す、本発明1006の前記感染性rAAV。
[本発明1010]
前記rAAVビリオンが、AAV2によって示される耐性よりも少なくとも約10倍高いヒトAAV中和抗体への耐性を示す、本発明1006の前記感染性rAAV。
[本発明1011]
前記rAAVビリオンが、AAV2によって示される耐性よりも少なくとも約30倍高いヒトAAV中和抗体への耐性を示す、本発明1006の前記感染性rAAV。
[本発明1012]
野生型AAV血清型2(AAV2)によって示される哺乳類細胞への形質導入と比較して、ヒトAAV中和抗体の存在下における哺乳類細胞への増加した形質導入を示す、本発明1001または1004の前記感染性rAAV。
[本発明1013]
前記哺乳類細胞が、肝臓細胞、膵臓細胞、骨格筋細胞、心筋細胞、線維芽細胞、網膜細胞、滑膜関節細胞、肺細胞、T細胞、ニューロン、グリア細胞、幹細胞、内皮細胞、または癌細胞である、本発明1012の前記感染性rAAV。
[本発明1014]
前記幹細胞が、造血幹細胞、造血前駆細胞、神経幹細胞、神経前駆細胞、神経堤幹細胞、胚幹細胞、誘導多能性幹細胞(iPS細胞)、間葉幹細胞、中胚葉幹細胞、肝臓幹細胞、膵臓幹細胞、膵臓前駆細胞、筋幹細胞、または網膜幹細胞である、本発明1013の前記感染性rAAV。
[本発明1015]
前記異種核酸がRNA干渉剤を含む、本発明1001または本発明1004の前記感染性rAAV。
[本発明1016]
前記異種核酸が、ポリペプチドをコードするヌクレオチド配列を含む、本発明1001または本発明1004の前記感染性rAAV。
[本発明1017]
配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む変異体アデノ随伴ウイルス(AAV)カプシドタンパク質をコードするヌクレオチド配列を含む、単離核酸。
[本発明1018]
前記コードされた変異体AAVカプシドタンパク質が、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含む、本発明1017の前記単離核酸。
[本発明1019]
前記コードされた変異体AAVカプシドタンパク質が、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列を含む、本発明1017の前記単離核酸。
[本発明1020]
配列番号10に記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ配列番号2と比べてアミノ酸置換N312K、N449D、D472N、N551S、I698V、及びL735Qを含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質
をコードするヌクレオチド配列を含む、単離核酸。
[本発明1021]
前記コードされた変異体AAVカプシドタンパク質が、AAV2(野生型AAV血清型2)によって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える、本発明1017または本発明1020の前記単離核酸。
[本発明1022]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約1.5倍高い、本発明1021の前記単離核酸。
[本発明1023]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約3倍高い、本発明1021の前記単離核酸。
[本発明1024]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約5倍高い、本発明1021の前記単離核酸。
[本発明1025]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約10倍高い、本発明1021の前記単離核酸。
[本発明1026]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約30倍高い、本発明1021の前記単離核酸。
[本発明1027]
前記変異体AAVカプシドタンパク質が、AAV2(野生型AAV血清型2)によって示される形質導入と比較して、ヒトAAV中和抗体の存在下における哺乳類細胞への増加した形質導入を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える、本発明1017または1020の前記単離核酸。
[本発明1028]
本発明1017の前記核酸を含む、単離宿主細胞。
[本発明1029]
本発明1020の前記核酸を含む、単離宿主細胞。
[本発明1030]
前記核酸で安定的にトランスフェクトされる、本発明1028または本発明1029の前記単離宿主細胞。
[本発明1031]
AAVrepタンパク質をコードするヌクレオチド配列を含む核酸をさらに含む、本発明1028または本発明1029の前記単離宿主細胞。
[本発明1032]
組換えAAVベクターをさらに含む、本発明1028または本発明1029の前記単離宿主細胞。
[本発明1033]
標的細胞を本発明1001または本発明1004のビリオンに接触させることを含む、異種核酸を前記標的細胞に送達する方法。
[本発明1034]
前記標的細胞が、肝臓細胞、膵臓細胞、骨格筋細胞、心筋細胞、線維芽細胞、網膜細胞、滑膜関節細胞、肺細胞、T細胞、ニューロン、グリア細胞、幹細胞、内皮細胞、または癌細胞である、本発明1033の前記方法。
[本発明1035]
前記幹細胞が、造血幹細胞、造血前駆細胞、神経幹細胞、神経前駆細胞、神経堤幹細胞、胚幹細胞、誘導多能性幹細胞(iPS細胞)、間葉幹細胞、中胚葉幹細胞、肝臓幹細胞、膵臓幹細胞、膵臓前駆細胞、筋幹細胞、または網膜幹細胞である、本発明1034の前記方法。
[本発明1036]
前記標的細胞がインビトロである、本発明1033の前記方法。
[本発明1037]
前記標的細胞がインビボである、本発明1033の前記方法。
[本発明1038]
個体に、有効量の本発明1001または本発明1004の感染性組換えアデノ随伴ウイルス(rAAV)ビリオンを投与するステップを含む、遺伝子産物を、それを必要とする前記個体に送達する方法。
[本発明1039]
前記異種核酸がRNA干渉剤を含む、本発明1038の前記方法。
[本発明1040]
前記異種核酸がポリペプチドをコードするヌクレオチド配列を含む、本発明1038の前記方法。
[本発明1041]
前記投与ステップが前記感染性rAAVビリオンの間接的送達を含む、本発明1038の前記方法。
[本発明1042]
前記投与ステップが前記感染性rAAVビリオンの直接的送達を含む、本発明1038の前記方法。
[本発明1043]
配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質。
[本発明1044]
配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含む、本発明1043の前記変異体AAVカプシドタンパク質。
[本発明1045]
配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列を含む、本発明1043の前記変異体AAVカプシドタンパク質。
[本発明1046]
配列番号10に記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ配列番号2と比べてアミノ酸置換N312K、N449D、D472N、N551S、I698V、及びL735Qを含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質。
[本発明1047]
配列番号10に記載される前記アミノ酸配列を含む、本発明1046の前記変異体AAVカプシドタンパク質。
[本発明1048]
前記変異体AAVカプシドタンパク質が、AAV2(野生型AAV血清型2)によって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える、本発明1043または本発明1046の前記変異体AAVカプシドタンパク質。
[本発明1049]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約1.5倍高い、本発明1048の前記変異体AAVカプシドタンパク質。
[本発明1050]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約3倍高い、本発明1048の前記変異体AAVカプシドタンパク質。
[本発明1051]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約5倍高い、本発明1048の前記変異体AAVカプシドタンパク質。
[本発明1052]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約10倍高い、本発明1048の前記変異体AAVカプシドタンパク質。
[本発明1053]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約30倍高い、本発明1048の前記変異体AAVカプシドタンパク質。
[本発明1054]
AAV2(野生型AAV血清型2)によって示される形質導入と比較して、ヒトAAV中和抗体の存在下における哺乳類細胞への増加した形質導入を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える、本発明1043または本発明1046の前記変異体AAVカプシドタンパク質。
[本発明1055]
(i)それぞれが変異体アデノ随伴ウイルス(AAV)カプシドタンパク質及び異種核酸を含む、2つ以上の感染性rAAVビリオン、
(ii)それぞれが変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含む、2つ以上の単離核酸、
(iii)それぞれが変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含む核酸を含む、2つ以上の宿主細胞、ならびに
(iv)2つ以上の変異体AAVカプシドタンパク質
のうちの少なくとも1つを含むライブラリであって、
前記ライブラリの少なくとも1つのメンバーの前記変異体AAVカプシドタンパク質が、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列と比べて少なくとも1つのアミノ酸置換を有するアミノ酸配列を含む、前記ライブラリ。
[本発明1056]
スターターカプシドタンパク質を含むスタータービリオンと比べて変化した感染特性を示す、改変感染性組換えアデノ随伴ウイルス(rAAV)ビリオンを生成及び特定する方法であって、
(a)前記スターターカプシドタンパク質から変異体アデノ随伴ウイルス(AAV)カプシドタンパク質を生成するステップであって、前記スターターカプシドタンパク質が配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含み、かつそれぞれの変異体AAVカプシドタンパク質が前記スターターカプシドタンパク質と比べて少なくとも1つのアミノ酸置換を含む、ステップと、
(b)それぞれがステップ(a)で生成された変異体カプシドAAVタンパク質を含む、変異体AAVビリオンを生成するステップと、
(c)ステップ(b)で生成された変異体AAVビリオンを変化した感染特性についてアッセイして、前記改変感染性rAAVビリオンを特定するステップと
を含む、前記方法。
[本発明1057]
変異体AAVカプシドタンパク質の前記ライブラリの生成が、ポリメラーゼ連鎖反応突然変異誘発、オリゴヌクレオチド特異的突然変異誘発、飽和突然変異誘発、ループスワップ突然変異誘発、断片シャフリング突然変異誘発、及びそれらの組み合わせから成る群から選択される突然変異誘発方法を含む、本発明1056の前記方法。
[本発明1058]
前記変化した感染特性が、前記スタータービリオンによって示される耐性と比較して、ヒト中和AAV抗体への上昇した耐性である、本発明1056の前記方法。
[本発明1059]
前記変化した感染特性が、前記スタータービリオンによって示される形質導入と比較して、ヒトAAV中和抗体の存在下における哺乳類細胞への増加した形質導入である、本発明1056の前記方法。
[本発明1060]
改変感染性rAAVビリオンが、前記スターターカプシドタンパク質と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む改変AAVカプシドタンパク質を含む、本発明1056の前記方法。
[本発明1001]
(a)配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質、ならびに
(b)異種核酸
を含む、感染性組換えアデノ随伴ウイルス(rAAV)ビリオン。
[本発明1002]
前記変異体AAVカプシドタンパク質が、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含む、本発明1001の前記感染性rAAV。
[本発明1003]
前記変異体AAVカプシドタンパク質が、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列を含む、本発明1001の前記感染性rAAV。
[本発明1004]
(a)配列番号10に記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ配列番号2と比べてアミノ酸置換N312K、N449D、D472N、N551S、I698V、及びL735Qを含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質、ならびに
(b)異種核酸
を含む、感染性組換えアデノ随伴ウイルス(rAAV)ビリオン。
[本発明1005]
前記変異体AAVカプシドタンパク質が配列番号10に記載されるアミノ酸配列を含む、本発明1004の前記感染性rAAV。
[本発明1006]
AAV2(野生型AAV血清型2)によって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を示す、本発明1001または本発明1004の前記感染性rAAV。
[本発明1007]
前記rAAVビリオンが、AAV2によって示される耐性よりも少なくとも約1.5倍高いヒトAAV中和抗体への耐性を示す、本発明1006の前記感染性rAAV。
[本発明1008]
前記rAAVビリオンが、AAV2によって示される耐性よりも少なくとも約3倍高いヒトAAV中和抗体への耐性を示す、本発明1006の前記感染性rAAV。
[本発明1009]
前記rAAVビリオンが、AAV2によって示される耐性よりも少なくとも約5倍高いヒトAAV中和抗体への耐性を示す、本発明1006の前記感染性rAAV。
[本発明1010]
前記rAAVビリオンが、AAV2によって示される耐性よりも少なくとも約10倍高いヒトAAV中和抗体への耐性を示す、本発明1006の前記感染性rAAV。
[本発明1011]
前記rAAVビリオンが、AAV2によって示される耐性よりも少なくとも約30倍高いヒトAAV中和抗体への耐性を示す、本発明1006の前記感染性rAAV。
[本発明1012]
野生型AAV血清型2(AAV2)によって示される哺乳類細胞への形質導入と比較して、ヒトAAV中和抗体の存在下における哺乳類細胞への増加した形質導入を示す、本発明1001または1004の前記感染性rAAV。
[本発明1013]
前記哺乳類細胞が、肝臓細胞、膵臓細胞、骨格筋細胞、心筋細胞、線維芽細胞、網膜細胞、滑膜関節細胞、肺細胞、T細胞、ニューロン、グリア細胞、幹細胞、内皮細胞、または癌細胞である、本発明1012の前記感染性rAAV。
[本発明1014]
前記幹細胞が、造血幹細胞、造血前駆細胞、神経幹細胞、神経前駆細胞、神経堤幹細胞、胚幹細胞、誘導多能性幹細胞(iPS細胞)、間葉幹細胞、中胚葉幹細胞、肝臓幹細胞、膵臓幹細胞、膵臓前駆細胞、筋幹細胞、または網膜幹細胞である、本発明1013の前記感染性rAAV。
[本発明1015]
前記異種核酸がRNA干渉剤を含む、本発明1001または本発明1004の前記感染性rAAV。
[本発明1016]
前記異種核酸が、ポリペプチドをコードするヌクレオチド配列を含む、本発明1001または本発明1004の前記感染性rAAV。
[本発明1017]
配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む変異体アデノ随伴ウイルス(AAV)カプシドタンパク質をコードするヌクレオチド配列を含む、単離核酸。
[本発明1018]
前記コードされた変異体AAVカプシドタンパク質が、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含む、本発明1017の前記単離核酸。
[本発明1019]
前記コードされた変異体AAVカプシドタンパク質が、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列を含む、本発明1017の前記単離核酸。
[本発明1020]
配列番号10に記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ配列番号2と比べてアミノ酸置換N312K、N449D、D472N、N551S、I698V、及びL735Qを含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質
をコードするヌクレオチド配列を含む、単離核酸。
[本発明1021]
前記コードされた変異体AAVカプシドタンパク質が、AAV2(野生型AAV血清型2)によって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える、本発明1017または本発明1020の前記単離核酸。
[本発明1022]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約1.5倍高い、本発明1021の前記単離核酸。
[本発明1023]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約3倍高い、本発明1021の前記単離核酸。
[本発明1024]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約5倍高い、本発明1021の前記単離核酸。
[本発明1025]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約10倍高い、本発明1021の前記単離核酸。
[本発明1026]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約30倍高い、本発明1021の前記単離核酸。
[本発明1027]
前記変異体AAVカプシドタンパク質が、AAV2(野生型AAV血清型2)によって示される形質導入と比較して、ヒトAAV中和抗体の存在下における哺乳類細胞への増加した形質導入を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える、本発明1017または1020の前記単離核酸。
[本発明1028]
本発明1017の前記核酸を含む、単離宿主細胞。
[本発明1029]
本発明1020の前記核酸を含む、単離宿主細胞。
[本発明1030]
前記核酸で安定的にトランスフェクトされる、本発明1028または本発明1029の前記単離宿主細胞。
[本発明1031]
AAVrepタンパク質をコードするヌクレオチド配列を含む核酸をさらに含む、本発明1028または本発明1029の前記単離宿主細胞。
[本発明1032]
組換えAAVベクターをさらに含む、本発明1028または本発明1029の前記単離宿主細胞。
[本発明1033]
標的細胞を本発明1001または本発明1004のビリオンに接触させることを含む、異種核酸を前記標的細胞に送達する方法。
[本発明1034]
前記標的細胞が、肝臓細胞、膵臓細胞、骨格筋細胞、心筋細胞、線維芽細胞、網膜細胞、滑膜関節細胞、肺細胞、T細胞、ニューロン、グリア細胞、幹細胞、内皮細胞、または癌細胞である、本発明1033の前記方法。
[本発明1035]
前記幹細胞が、造血幹細胞、造血前駆細胞、神経幹細胞、神経前駆細胞、神経堤幹細胞、胚幹細胞、誘導多能性幹細胞(iPS細胞)、間葉幹細胞、中胚葉幹細胞、肝臓幹細胞、膵臓幹細胞、膵臓前駆細胞、筋幹細胞、または網膜幹細胞である、本発明1034の前記方法。
[本発明1036]
前記標的細胞がインビトロである、本発明1033の前記方法。
[本発明1037]
前記標的細胞がインビボである、本発明1033の前記方法。
[本発明1038]
個体に、有効量の本発明1001または本発明1004の感染性組換えアデノ随伴ウイルス(rAAV)ビリオンを投与するステップを含む、遺伝子産物を、それを必要とする前記個体に送達する方法。
[本発明1039]
前記異種核酸がRNA干渉剤を含む、本発明1038の前記方法。
[本発明1040]
前記異種核酸がポリペプチドをコードするヌクレオチド配列を含む、本発明1038の前記方法。
[本発明1041]
前記投与ステップが前記感染性rAAVビリオンの間接的送達を含む、本発明1038の前記方法。
[本発明1042]
前記投与ステップが前記感染性rAAVビリオンの直接的送達を含む、本発明1038の前記方法。
[本発明1043]
配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質。
[本発明1044]
配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含む、本発明1043の前記変異体AAVカプシドタンパク質。
[本発明1045]
配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列を含む、本発明1043の前記変異体AAVカプシドタンパク質。
[本発明1046]
配列番号10に記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ配列番号2と比べてアミノ酸置換N312K、N449D、D472N、N551S、I698V、及びL735Qを含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質。
[本発明1047]
配列番号10に記載される前記アミノ酸配列を含む、本発明1046の前記変異体AAVカプシドタンパク質。
[本発明1048]
前記変異体AAVカプシドタンパク質が、AAV2(野生型AAV血清型2)によって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える、本発明1043または本発明1046の前記変異体AAVカプシドタンパク質。
[本発明1049]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約1.5倍高い、本発明1048の前記変異体AAVカプシドタンパク質。
[本発明1050]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約3倍高い、本発明1048の前記変異体AAVカプシドタンパク質。
[本発明1051]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約5倍高い、本発明1048の前記変異体AAVカプシドタンパク質。
[本発明1052]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約10倍高い、本発明1048の前記変異体AAVカプシドタンパク質。
[本発明1053]
前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約30倍高い、本発明1048の前記変異体AAVカプシドタンパク質。
[本発明1054]
AAV2(野生型AAV血清型2)によって示される形質導入と比較して、ヒトAAV中和抗体の存在下における哺乳類細胞への増加した形質導入を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える、本発明1043または本発明1046の前記変異体AAVカプシドタンパク質。
[本発明1055]
(i)それぞれが変異体アデノ随伴ウイルス(AAV)カプシドタンパク質及び異種核酸を含む、2つ以上の感染性rAAVビリオン、
(ii)それぞれが変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含む、2つ以上の単離核酸、
(iii)それぞれが変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含む核酸を含む、2つ以上の宿主細胞、ならびに
(iv)2つ以上の変異体AAVカプシドタンパク質
のうちの少なくとも1つを含むライブラリであって、
前記ライブラリの少なくとも1つのメンバーの前記変異体AAVカプシドタンパク質が、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列と比べて少なくとも1つのアミノ酸置換を有するアミノ酸配列を含む、前記ライブラリ。
[本発明1056]
スターターカプシドタンパク質を含むスタータービリオンと比べて変化した感染特性を示す、改変感染性組換えアデノ随伴ウイルス(rAAV)ビリオンを生成及び特定する方法であって、
(a)前記スターターカプシドタンパク質から変異体アデノ随伴ウイルス(AAV)カプシドタンパク質を生成するステップであって、前記スターターカプシドタンパク質が配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含み、かつそれぞれの変異体AAVカプシドタンパク質が前記スターターカプシドタンパク質と比べて少なくとも1つのアミノ酸置換を含む、ステップと、
(b)それぞれがステップ(a)で生成された変異体カプシドAAVタンパク質を含む、変異体AAVビリオンを生成するステップと、
(c)ステップ(b)で生成された変異体AAVビリオンを変化した感染特性についてアッセイして、前記改変感染性rAAVビリオンを特定するステップと
を含む、前記方法。
[本発明1057]
変異体AAVカプシドタンパク質の前記ライブラリの生成が、ポリメラーゼ連鎖反応突然変異誘発、オリゴヌクレオチド特異的突然変異誘発、飽和突然変異誘発、ループスワップ突然変異誘発、断片シャフリング突然変異誘発、及びそれらの組み合わせから成る群から選択される突然変異誘発方法を含む、本発明1056の前記方法。
[本発明1058]
前記変化した感染特性が、前記スタータービリオンによって示される耐性と比較して、ヒト中和AAV抗体への上昇した耐性である、本発明1056の前記方法。
[本発明1059]
前記変化した感染特性が、前記スタータービリオンによって示される形質導入と比較して、ヒトAAV中和抗体の存在下における哺乳類細胞への増加した形質導入である、本発明1056の前記方法。
[本発明1060]
改変感染性rAAVビリオンが、前記スターターカプシドタンパク質と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む改変AAVカプシドタンパク質を含む、本発明1056の前記方法。
定義
アデノ随伴ウイルスは、無エンベロープ正二十面体カプシド内の、4.7kbの1本鎖DNAゲノムで構成される、非病原性パルボウイルスである。「AAV」はアデノ随伴ウイルスの短縮形であり、ウイルス自体またはその誘導体を指すために使用され得る。該ゲノムは、複製及びパッケージングシグナルのウイルス起源として機能する逆位末端配列(ITR)が隣接する3つのオープンリーディングフレーム(ORF)を含有する。rep ORFは、ウイルス複製、転写制御、部位特異的統合、及びビリオン集合において役割を果たす、4つの非構造タンパク質をコードする。cap ORFは、集合して60量体ウイルス性カプシドを形成する3つの構造タンパク質(VP1~3)をコードする。最後に、cap遺伝子内の代替リーディングフレームとして存在するORFは、AAVカプシドタンパク質を核小体に局在化させ、かつカプシド集合プロセスにおいて機能するウイルス性タンパク質である、集合活性化タンパク質(AAP)を生成する。
アデノ随伴ウイルスは、無エンベロープ正二十面体カプシド内の、4.7kbの1本鎖DNAゲノムで構成される、非病原性パルボウイルスである。「AAV」はアデノ随伴ウイルスの短縮形であり、ウイルス自体またはその誘導体を指すために使用され得る。該ゲノムは、複製及びパッケージングシグナルのウイルス起源として機能する逆位末端配列(ITR)が隣接する3つのオープンリーディングフレーム(ORF)を含有する。rep ORFは、ウイルス複製、転写制御、部位特異的統合、及びビリオン集合において役割を果たす、4つの非構造タンパク質をコードする。cap ORFは、集合して60量体ウイルス性カプシドを形成する3つの構造タンパク質(VP1~3)をコードする。最後に、cap遺伝子内の代替リーディングフレームとして存在するORFは、AAVカプシドタンパク質を核小体に局在化させ、かつカプシド集合プロセスにおいて機能するウイルス性タンパク質である、集合活性化タンパク質(AAP)を生成する。
いくつかの自然発生の血清型及び100を超えるAAVの変異体があり、これらのそれぞれは、特にカプシドタンパク質の超可変領域内で、アミノ酸配列が異なり、ひいてはその遺伝子送達特性も異なる。どのAAVもヒト疾患と関連付けられておらず、組換えAAVを臨床応用に魅力的にしている。
本明細書で使用される場合、用語「AAV」は、別途必要とされる場合を除き、全ての亜型ならびに自然発生及び組換え形態の両方を網羅する。用語「AAV」は、AAV型1(AAV-1またはAAV1)、AAV型2(AAV-2またはAAV2)、AAV型3(AAV-3またはAAV3)、AAV型4(AAV-4またはAAV4)、AAV型5(AAV-5またはAAV5)、AAV型6(AAV-6またはAAV6)、AAV型7(AAV-7またはAAV7)、AAV型8(AAV-8またはAAV8)、AAV型9(AAV-9またはAAV9)、鳥類AAV、ウシAAV、イヌAAV、ウマAAV、霊長類AAV、非霊長類AAV、及びヒツジAAVを含む。「霊長類AAV」は、霊長類に感染するAAVを指し、「非霊長類AAV」は非霊長類哺乳類に感染するAAVを指し、「ウシAAV」はウシ科哺乳類に感染するAAVを指し、以下同様である。
AAVの様々な血清型のゲノム配列、ならびにネイティブ末端配列(TR)の配列、Repタンパク質、及びカプシドサブユニットは、当業者に既知である。かかる配列は、文献またはGenBank等の公共データベースにおいて見出され得る。例えば、GenBank受託番号NC_002077.1(AAV-1)、AF063497.1(AAV-1)、NC_001401.2(AAV-2)、AF043303.1(AAV-2)、J01901.1(AAV-2)、U48704.1(AAV-3)、NC_001729.1(AAV-3)、NC_001829.1(AAV-4)、U89790.1(AAV-4)、NC_006152.1(AAV-5)、AF085716.1(AAV-5)、AF028704.1(AAV-6)、NC_006260.1(AAV-7)、AF513851.1(AAV-7)、AF513852.1(AAV-8)NC_006261.1(AAV-8)、及びAY530579.1(AAV-9)を参照されたく、これらの開示は、AAV核酸及びアミノ酸配列を教示するために、参照により本明細書に組み込まれる。例えば、Srivistava et al.(1983)J.Virology45:555、Chiorini et al.(1998)J.Virology71:6823、Chiorini et al.(1999)J.Virology73:1309、Bantel-Schaal et al.(1999)J.Virology73:939、Xiao et al.(1999)J.Virology73:3994、Muramatsu et al.(1996)Virology221:208、Shade et al.,(1986)J.Virol.58:921、Gao et al.(2002)Proc.Nat.Acad.Sci.USA99:11854、Moris et al.(2004)Virology33:375-383、国際特許公開第WO00/28061号、WO99/61601号、WO98/11244号、及び米国特許第6,156,303号もまた参照されたい。
AAV血清型と関連付けられる、自然に存在するcap(カプシド)タンパク質の配列は当業者に既知であり、AAV1(配列番号1)、AAV2(配列番号2)、AAV3(配列番号3)、AAV4(配列番号4)、AAV5(配列番号5)、AAV6(配列番号6)、AAV7(配列番号7)、AAV8(配列番号8)、及びAAV9(配列番号9)を含む。「変異体AAVカプシドタンパク質」という用語は、配列番号1~9に記載される自然に存在するAAVカプシドタンパク質配列のうちの1つと比べて少なくとも1つの置換(欠失、挿入等を含む)を含むアミノ酸配列を含む、AAVカプシドタンパク質である。
「AAVビリオン」または「AAVウイルス粒子」は、少なくとも1つのAAVカプシドタンパク質及びカプシド形成したAAVポリヌクレオチドで構成されるウイルス粒子を指す。
ポリヌクレオチドに適用される場合「組換え」は、そのポリヌクレオチドが、クローニング、制限、またはライゲーションステップ、及び自然界で見出されるポリヌクレオチドとは異なる構築物をもたらす他の手順の、様々な組み合わせの産物であることを意味する。組換えウイルスは、組換えポリヌクレオチドを含むウイルス粒子である。これらの用語は、それぞれ、元来のポリヌクレオチド構築物の複製物及び元来のウイルス構築物の子孫を含む。
AAVビリオンが異種ポリヌクレオチド(すなわち、野生型AAVゲノム以外のポリヌクレオチド、例えば標的細胞に送達される導入遺伝子、標的細胞に送達されるRNAi剤またはCRISPR剤等)を含む場合、これは典型的に「組換えAAV(rAAV)ビリオン」または「rAAVウイルス粒子」と称される。概して、異種ポリヌクレオチドは、少なくとも1つ、及び概して2つのAAV逆位末端配列(ITR)に隣接する。
「rAAVベクター」という用語は、定義によりrAAVポリヌクレオチドを含むrAAVビリオン(すなわちrAAVウイルス粒子)(例えば感染性rAAVビリオン)を包含し、かつ、rAAVをコードするポリヌクレオチド(例えばrAAVをコードする1本鎖ポリヌクレオチド(ss-rAAV)、rAAVをコードする2本鎖ポリヌクレオチド(ds-rAAV)、例えばrAAVをコードするプラスミド等)もまた包含する。
「パッケージング」は、AAV粒子の集合及びカプシド形成をもたらす、一連の細胞内事象を指す。
AAV「rep」及び「cap」遺伝子は、アデノ随伴ウイルスの複製及びカプシド形成タンパク質をコードするポリヌクレオチド配列を指す。AAV rep及びcapは、本明細書でAAV「パッケージング遺伝子」と称される。
AAVの「ヘルパーウイルス」は、AAV(例えば野生型AAV)が哺乳類細胞によって複製及びパッケージングされることを可能にするウイルスを指す。AAVの様々なかかるヘルパーウイルスは当業者に既知であり、アデノウイルス、ヘルペスウイルス、及びワクシニア等のポックスウイルスを含む。サブグループCのアデノウイルス型5が最も一般的に使用されるものの、アデノウイルスは多数の異なるサブグループを包含する。ヒト、非ヒト哺乳類、及び鳥類由来の多数のアデノウイルスが既知であり、ATCC等の保管所から入手可能である。ヘルペスファミリーのウイルスは、例えば、単純ヘルペスウイルス(HSV)及びエプスタインバーウイルス(EBV)、ならびにサイトメガロウイルス(CMV)及び仮性狂犬病ウイルス(PRV)を含み、これらもまたATCC等の保管所から入手可能である。
「ヘルパーウイルス機能(複数可)」は、AAV複製及びパッケージを可能にする(本明細書に記載される、複製及びパッケージングのための他の要件と合わせて)、ヘルパーウイルスゲノム内にコードされる機能(複数可)を指す。本明細書で記載されるように、「ヘルパーウイルス機能」は、トランスで生成細胞にヘルパーウイルスを提供すること、または、例えば必要な機能(複数可)をコードするポリヌクレオチド配列を提供することを含む、多数の方法で提供され得る。例えば、1つ以上のアデノウイルス性タンパク質をコードするヌクレオチド配列を含むプラスミドまたは他の発現ベクターは、rAAVベクターと共に生成細胞中にトランスフェクトされる。
「感染性」ウイルスまたはウイルス粒子は、有能に集合したウイルス性カプシドを含むものであり、ポリヌクレオチド成分を、そのウイルス性種が向性である細胞に送達することができる。この用語は必ずしもウイルスの任意の複製能力を暗示しない。感染性ウイルス粒子を計数するためのアッセイは、本開示他の箇所及び当該技術分野において記載される。ウイルス性感染力は、感染性ウイルス粒子の、合計ウイルス粒子に対する比率として表すことができる。感染性ウイルス粒子の合計ウイルス粒子に対する比率を決定する方法は、当業者に既知である。例えばGrainger et al.(2005)Mol.Ther.11:S337(TCID50感染性力価アッセイを記載)、及びZolotukhin et al.(1999)Gene Ther.6:973を参照されたい。実施例もまた参照されたい。
「向性」という用語は、本明細書で使用される場合、ウイルス(例えばAAV)による宿主種内の特異的宿主種または特異的細胞種の優先的標的化を指す。例えば、心臓、肺、肝臓、及び筋肉の細胞を感染させることができるウイルスは、肺及び筋細胞のみを感染させることができるウイルスに比べて、より広い(すなわち増加した)向性を有する。向性は、宿主の特定の種類の細胞表面分子への、ウイルスの依存性もまた含むことができる。例えば、いくつかのウイルスは、表面グリコサミノグリカンを有する細胞のみを感染させることができ、一方で他のウイルスはシアル酸を有する細胞のみを感染させることができる(かかる依存性は、ウイルス性感染の潜在的宿主細胞として特定のクラスの分子が欠損した様々な細胞株を使用して試験することができる)。いくつかの場合では、ウイルスの向性はウイルスの相対的優先度を説明する。例えば、第1のウイルスは全ての細胞型を感染させることができ得るが、表面グリコサミノグリカンを有する細胞を感染させることにおいてはるかにより成功する。第2のウイルスもまた同じ特徴をより好む(例えば第2のウイルスもまた表面グリコサミノグリカンを有する細胞を感染させることにおいてより成功する)場合、絶対形質導入効率性が同様でない場合でさえ、第2のウイルスは、第1のウイルスと同様(または同一)の向性を有すると考えられ得る。例えば、第2のウイルスは、第1のウイルスよりも、試験される全ての所与の細胞を感染させることにおいて効率的であり得るが、相対的優先度が同様(または同一)である場合、第2のウイルスはなお第1のウイルスと同様(または同一)の向性を有すると考えられ得る。いくつかの実施形態では、主題の変異体AAVカプシドタンパク質を含むビリオンの向性は、自然発生ビリオンと比べて変化させられない。いくつかの実施形態では、主題の変異体AAVカプシドタンパク質を含むビリオンの向性は、自然発生ビリオンと比べて拡大(すなわち拡張)される。いくつかの実施形態では、主題の変異体AAVカプシドタンパク質を含むビリオンの向性は、自然発生ビリオンと比べて低減される。
「複製可能」なウイルス(例えば複製可能AAV)は、感染性であり、また感染した細胞内で(すなわちヘルパーウイルスまたはヘルパーウイルス機能の存在下で)複製されることも可能である、表現型が野生型のウイルスを指す。AAVの場合、複製能力は、概して機能的AAVパッケージング遺伝子の存在を必要とする。概して、本明細書に記載されるrAAVベクターは、1つ以上のAAVパッケージング遺伝子の欠如がゆえに、哺乳類細胞内(特にヒト細胞内)で複製不能である。典型的に、かかるrAAVベクターは、複製可能AAVがAAVパッケージング遺伝子と入来rAAVベクターとの間の組換えによって生成される可能性を最小化するために、任意のAAVパッケージング遺伝子配列を欠如する。多くの実施形態では、本明細書に記載されるrAAVベクター調製物は、ある場合はわずかな複製可能AAV(rcAAV、RCAとも称される)を含有する(例えば、102rAAV粒子当たり約1rcAAV未満、104rAAV粒子当たり約1rcAAV未満、108rAAV粒子当たり約1rcAAV未満、1012rAAV粒子当たり約1rcAAV未満、または無rcAAV)ものである。
「ポリヌクレオチド」という用語は、デオキシリボヌクレオチドもしくはリボヌクレオチド、またはそれらの類似体を含む、任意の長さのヌクレオチドのポリマー形態を指す。ポリヌクレオチドは、メチル化ヌクレオチド及びヌクレオチド類似体等の改変ヌクレオチドを含み得、非ヌクレオチド成分によって分断され得る。存在する場合、ヌクレオチド構造への改変は、ポリマーの集合の前または後に与えられ得る。ポリヌクレオチドという用語は、本明細書で使用される場合、2本鎖及び1本鎖分子を交換可能に指す。別途指定または必要とされない限り、ポリヌクレオチドを含む本明細書の任意の実施形態は、2本鎖形態、及び、2本鎖を構成することが知られるまたは予測される2つの相補的1本鎖形態のそれぞれの、両方を包含する。
ポリヌクレオチドまたはポリペプチドは、別のポリヌクレオチドまたはポリペプチドとある特定のパーセントの「配列同一性」を有し、これは、整列される場合、2つの配列を比較するときにそのパーセンテージの塩基またはアミノ酸が同じであることを意味する。配列類似性は、いくつかの異なる様式で決定され得る。配列同一性を決定するために、配列は、ワールドワイドウェブを介してncbi.nlm.nih.gov/BLAST/にて入手可能な、BLASTを含む方法及びコンピュータプログラムを使用して、整列させることができる。別の整列アルゴリズムは、Oxford Molecular Group,Inc.の完全所有子会社である、米国ウィスコンシン州マディソンの、Genetics Computing Group(GCG)パッケージにおいて入手可能な、FASTAである。整列の他の技術は、Methods in Enzymology,vol.266:Computer Methods for Macromolecular Sequence Analysis(1996),ed.Doolittle,Academic Press,Inc.,a division of Harcourt Brace&Co.,San Diego,California,USAに記載される。特に興味深いのは、配列における隙間を許容する整列プログラムである。Smith-Watermanは、配列整列における隙間を許容するアルゴリズムの一種である。Meth.Mol.Biol.70:173-187(1997)を参照されたい。Needleman及びWunsch整列方法を使用するGAPプログラムもまた、配列を整列させるのに利用され得る。J.Mol.Biol.48:443-453(1970)を参照されたい。
「遺伝子」は、細胞内で何らかの種類の機能を行うポリヌクレオチドを指す。例えば、遺伝子は、転写及び翻訳された後で特定のタンパク質をコードすることができる、オープンリーディングフレームを含み得る。一方で、遺伝子は、翻訳されない機能的RNA産物(例えば、アプタマー、干渉RNA、リボソームRNA(rRNA)、転移RNA(tRNA)等)をコードすることができる。
「遺伝子発現産物」または「遺伝子産物」は、上記で定義される、特定の遺伝子の発現から生じる分子である。遺伝子発現産物は、例えばポリペプチド、アプタマー、干渉RNA,メッセンジャーRNA(mRNA)、rRNA、tRNA、非コードRNA(ncRNA)等を含む。
「RNA干渉剤」または「RNAi剤」は、遺伝子(上記に定義の通り)の発現を変化させるために使用され得る任意の剤(またはかかる剤をコードするポリヌクレオチド)を包含する。当業者に既知であるRNAi剤の例としては、(i)siRNA剤、(ii)アンチセンスRNA、(iii)CRISPR剤、(iv)ジンクフィンガーヌクレアーゼ剤、及び(v)転写活性化剤様エフェクターヌクレアーゼ(TALEN)剤が挙げられるがこれらに限定されない。
(i)siRNA剤(「低分子干渉」または「短干渉RNA」(またはsiRNA))は、遺伝子対象(「標的遺伝子」)に標的化されるヌクレオチドのRNA2本鎖である。「RNA2本鎖」は、RNA分子の2つの領域の間の相補的対形成によって形成され、2本鎖RNA(dsRNA)の領域を形成する構造を指す。siRNAは、その2本鎖部分のヌクレオチド配列が標的遺伝子のヌクレオチド配列に相補的であるという点で、その遺伝子に、「標的化」される。いくつかの実施形態では、siRNAの2本鎖の長さは、30ヌクレオチド未満である。いくつかの実施形態では、2本鎖は、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、または10ヌクレオチドの長さであり得る。いくつかの実施形態では、2本鎖の長さは19~25ヌクレオチドの長さである。siRNAのRNA2本鎖部分は、ヘアピン構造の一部であり得る。ヘアピンを含有するsiRNA剤は、「shRNA(短ヘアピンRNA)剤」とも称され得る。2本鎖部分に加え、ヘアピン構造は、2本鎖を形成する2つの配列の間に位置付けられるループ部分を含有し得る。ループは長さが変化し得る。いくつかの実施形態では、ループは、5、6、7、8、9、10、11、12、または13ヌクレオチドの長さである。ヘアピン構造は、3′または5′オーバーハング部分もまた含有し得る。いくつかの実施形態では、オーバーハングは0、1、2、3、4、または5ヌクレオチドの長さの3′または5′オーバーハングである。概して、標的遺伝子の発現産物(例えば、mRNA、ポリペプチド等)のレベルは、5′未翻訳(UT)領域、ORF、または3′UT領域を含む、標的遺伝子転写物の少なくとも19~25ヌクレオチド長セグメント(例えば20~21ヌクレオチド配列)に相補的である特異的2本鎖ヌクレオチド配列を含有する、siRNA剤(例えばsiRNA、shRNA等)によって低減される。いくつかの実施形態では、短干渉RNAは、約19~25ntの長さである。例えば、siRNA技術の説明について、PCT出願WO0/44895号、WO99/32619号、WO01/75164号、WO01/92513号、WO01/29058号、WO01/89304号、WO02/16620号、及びWO02/29858号、ならびに米国特許公開第20040023390号を参照されたい。siRNA及び/またはshRNAは、核酸配列によってコードされ得、核酸配列はプロモーターもまた含み得る。核酸配列は、ポリアデニル化シグナルもまた含み得る。いくつかの実施形態では、ポリアデニル化シグナルは、合成最小ポリアデニル化シグナルである。
(ii)アンチセンスRNAは、遺伝子発現産物に相補的であるRNAである。例えば、特異的mRNAに標的化されるアンチセンスRNAは、mRNAに相補的であるRNA系剤(または改変RNAであり得る)であり、アンチセンスRNAのmRNAへのハイブリダイゼーションは、mRNAの発現を変化させる(例えばRNAの安定性を変化させること、RNAの翻訳を変化させること等によって)。「アンチセンスRNA」内にさらに含まれるのは、アンチセンスRNAをコードする核酸である。
(iii)CRISPR剤。CRISPR(規則的な間隔をもってクラスター化された短鎖反復回文配列(Clustered regularly interspaced short palindromic repeats))/CRISPR関連(Cas)システムは、侵入核酸の発現停止を誘導するためにCRISPR RNA(crRNA)を使用することによって、ウイルス及びプラスミドに対する適応免疫を有する、細菌及び古細菌を提供する。Cas9タンパク質(またはその機能的等価物及び/もしくは変異体、すなわちCas9様タンパク質)は、2つの自然発生RNA分子またはcrRNA及びtracrRNAと呼ばれる(誘導RNAとも呼ばれる)合成RNA分子を有するタンパク質の会合に依存する、DNAエンドヌクレアーゼ活性を自然に含有する。いくつかの場合では、2つの分子は、共有結合され、単一の分子(単一誘導RNA(「sgRNA」)とも呼ばれる)を形成する。したがって、Cas9またはCas9様タンパク質は、DNA標的RNA(この用語は、2分子誘導RNA構成及び単一分子誘導RNA構成の両方を包含する)と会合し、これは、Cas9またはCas9様タンパク質を活性化し、このタンパク質を標的核酸配列へと誘導する。Cas9またはCas9様タンパク質がその天然酵素機能を保持する場合、それは標的DNAを切断して2本鎖切断を作製し、これは、ゲノム変更(すなわち、以下のような編集:欠失、挿入(ドナーポリヌクレオチドが存在する場合)、交換等)をもたらし、それにより遺伝子発現を変化させ得る。Cas9のいくつかの変異体(この変異体は、Cas9様という用語によって包含される)は、低減したDNA切断活性を有するように変化させられている(いくつかの場合では、これらは標的DNAの両方の鎖の代わりに1本鎖を切断するが、一方で他の場合では、これらはDNA切断活性が無くなるまで重度に低減されている)。低減したDNA切断活性(さらには無DNA切断活性)を有するCas9様タンパク質は、なお標的DNAに誘導されることができ、RNAポリメラーゼ活性を阻害することができる。したがって、酵素不活性Cas9様タンパク質は、標的DNAの転写を阻害するために、DNA標的RNAによって標的DNA内の特異的位置に標的化され得る。CRISPR剤に関する詳細な情報は、例えば、(a)Jinek et.al.,Science.2012 Aug 17;337(6096):816-21:"A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity"、(b)Qi et al.,Cell.2013 Feb 28;152(5):1173-83:"Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression"、及び(c)米国特許出願第13/842,859号及びPCT出願PCT/US13/32589号、において見出され得、該文献の全てはここで参照によりその全体が組み込まれる。したがって、「CRISPR剤」という用語は、本明細書で使用される場合、Cas9系システム内で使用され得る自然発生及び/または合成配列(例えば、Cas9またはCas9様タンパク質;DNA標的RNA、例えば、crRNA様RNA、tracrRNA様RNA、単一誘導RNA等の、任意の成分;ドナーポリヌクレオチド等)を含む、任意の剤(かかる剤をコードする核酸)を包含する。
(iv)ジンクフィンガーヌクレアーゼ(ZFN)剤。ジンクフィンガーヌクレアーゼ(ZFN)は、ジンクフィンガーDNA結合ドメインをDNA切断ドメインに融合することによって生成される、人工DNAエンドヌクレアーゼである。ZFNは、所望のDNA配列を標的化するように操作され得、これは、ジンクフィンガーヌクレアーゼが固有の標的配列を切断することを可能にする。細胞内に導入される場合、ZFNは、2本鎖切断を引き起こすことによって細胞内の標的DNA(例えば細胞のゲノム)を編集するために使用され得る。ZFNの使用に関するより多くの情報については、例えば、Asuri et al.,Mol Ther.2012 Feb;20(2):329-38、Bibikova et al.Science.2003 May 2;300(5620):764、Wood et al.Science.2011 Jul 15;333(6040):307、Ochiai et al.Genes Cells.2010 Aug;15(8):875-85、Takasu et.al.,Insect Biochem Mol Biol.2010 Oct;40(10):759-65;Ekker et al,Zebrafish 2008 Summer;5(2):121-3、Young et al,Proc Natl Acad Sci U S A.2011 Apr 26;108(17):7052-7、Goldberg et al,Cell.2010 Mar 5;140(5):678-91、Geurts et al,Science.2009 Jul 24;325(5939):433、Flisikowska et al,PLoS One.2011;6(6):e21045.doi:10.1371/journal.pone.0021045.Epub2011 Jun 13、Hauschild et al,Proc Natl Acad Sci U S A.2011 Jul 19;108(29):12013-7、及びYu et al,Cell Res.2011 Nov;21(11):1638-40を参照されたく、該文献の全ては、ZFNに関連するそれらの教示について、参照により本明細書に組み込まれる。「ZFN剤」という用語は、ジンクフィンガーヌクレアーゼ及び/またはジンクフィンガーヌクレアーゼをコードするヌクレオチド配列を含むポリヌクレオチドを包含する。
(v)転写活性化剤様エフェクターヌクレアーゼ(TALEN)剤。転写活性化剤様エフェクターヌクレアーゼ(TALEN)は、TAL(転写活性化剤様)エフェクターDNA結合ドメインをDNA切断ドメインに融合することによって生成される人工DNAエンドヌクレアーゼである。TALENSは、実質的に任意の所望のDNA配列に結合するように素早く操作されることができ、かつ、細胞内に導入される場合、TALENは、2本鎖切断を引き起こすことによって細胞内の標的DNA(例えば細胞のゲノム)を編集するために使用され得る。TALENの使用に関するより多くの情報については、例えば、Hockemeyer et al.Nat Biotechnol.2011 Jul 7;29(8):731-4、Wood et al.Science.2011 Jul 15;333(6040):307、Tesson et al.Nat Biotechnol.2011 Aug 5;29(8):695-6、及びHuang et.al.,Nat Biotechnol.2011 Aug 5;29(8):699-700を参照されたく、該文献の全ては、TALENに関連するそれらの教示について、参照により本明細書に組み込まれる。「TALEN剤」という用語は、TALEN及び/またはTALENをコードするヌクレオチド配列を含むポリヌクレオチドを包含する。
「制御要素」または「制御配列」は、ポリヌクレオチドの複製、重複、転写、スプライシング、翻訳、または分解を含む、ポリヌクレオチドの機能的制御に寄与する分子の相互作用に関与するヌクレオチド配列である。制御は、プロセスの頻度、速度、または特異性に影響を与え得、本質が増強的または抑制的であり得る。当業者に既知の制御要素は、例えば、プロモーター及びエンハンサー等の、転写制御配列を含む。プロモーターは、ある特定の条件下で、RNAポリメラーゼに結合することと、たいていプロモーターから下流(3′方向)に位置付けられるコード領域の翻訳を開始させることが可能である、DNA領域である。
「作動的に連結される」または「作動可能に連結される」は、遺伝要素の並立を指し、これらの要素は、予測される様式でそれらが作動することを許容する関係にある。例えば、プロモーターは、プロモーターがコード配列の転写を開始させるのを助ける場合、コード領域に作動的に連結されている。この機能的関係が維持される限り、プロモーターとコード領域との間に、介在する残基があってよい。
「発現ベクター」は、目的とするポリペプチドをコードする領域を含むベクターであり、意図される標的細胞内のタンパク質の発現をもたらすために使用される。発現ベクターは、標的内のタンパク質の発現を容易にするために、コード領域に作動的に連結される制御要素もまた含む。制御要素と、発現のためにそれらが作動可能に連結される遺伝子または遺伝子(複数)との組み合わせは、「発現カセット」と称されることがあり、この多くは当業者において既知かつ入手可能であり、または当業者に入手可能である成分から容易に構築することができる。
「異種」は、それが比較されている残りの実体とは遺伝子型が別個の実体に由来することを意味する。例えば、遺伝子操作技術によって、異なる種に由来するプラスミドまたはベクターへと導入されるポリヌクレオチドは、異種ポリヌクレオチドである。そのネイティブコード配列から除去され、かつそれが結合されているのが自然に見出されないコード配列に作動的に連結されるプロモーターは、異種プロモーターである。したがって、例えば、異種遺伝子産物をコードする異種核酸を含むrAAVは、自然発生の野生型AAV内に通常含まれない核酸を含むrAAVであり、コードされた異種遺伝子産物は、自然発生の野生型AAVによって通常コードされない遺伝子産物である。
「遺伝子変更」及び「遺伝子改変」という用語(及びそれらの文法的変形)は、本明細書で交換可能に使用され、遺伝子要素(例えばポリヌクレオチド)が有糸分裂または減数分裂以外によって細胞に導入されるプロセスを指す。要素は細胞に対して異種であり得、または細胞内に既に存在する要素の追加の複製または改良版であり得る。遺伝子変更は、例えば、電気穿孔、リン酸カルシウム沈殿、またはポリヌクレオチドリポソーム複合体に接触させること等の、当業者に既知の任意のプロセスを通して、細胞を組換えプラスミドまたは他のポリヌクレオチドでトランスフェクトすることによってもたらされ得る。遺伝子変更は、例えば、DNAまたはRNAウイルスまたはウイルス性ベクターでの形質導入または感染によってもまたもたらされ得る。概して、遺伝子要素は細胞内の染色体または微小染色体へと導入されるが、該細胞及びその子孫の表現型及び/または遺伝子型を変化させる任意の変更がこの用語に含まれる。
細胞は、外来性DNAが細胞内部に導入されている場合、外来性DNAによって(例えば組換えウイルスを通して)「遺伝子改変」または「形質転換」または「トランスフェクト」されている。外来性DNAの存在は、永久的または一時的遺伝子変化をもたらす。形質転換させるDNAは、細胞のゲノムへ統合(共有結合)されることもされないこともある。「クローン」は、有糸分裂によって単一の細胞または共通の祖先から誘導される細胞の集合である。「細胞株」は、多くの世代にわたって安定的なインビトロ増殖が可能である一次細胞のクローンである。
遺伝子配列が、インビトロでの細胞の長期培養(extended culture)中及び/またはインビボでの長期間にわたって、その機能を行うために利用可能である場合、細胞は、その遺伝子配列で「安定的に」変化させられる、形質導入される、遺伝子改変される、または形質転換される、と言われる。概して、かかる細胞は、変化した細胞の子孫によって遺伝可能でもある遺伝子変化が導入されるという点で、「遺伝的に」変化させられている(遺伝子改変されている)。
「ポリペプチド」、「ペプチド」、及び「タンパク質」という用語は、本明細書で交換可能に使用され、任意の長さのアミノ酸のポリマーを指す。この用語は、改変されたアミノ酸ポリマー、例えばジスルフィド結合形成、グリコシル化、脂質化、リン酸化、または標識成分との複合体化も包含する。遺伝子産物を哺乳類対象に送達する文脈で考察される場合、抗血管形成ポリペプチド、神経保護ポリペプチド等のようなポリペプチド、及びそれらの組成物は、それぞれの無傷のポリペプチド、または、無傷のタンパク質の所望の生化学機能を保持するその任意の断片もしくは遺伝子操作された誘導体を指す。同様に、抗血管形成ポリペプチドをコードする核酸、神経保護ポリペプチドをコードする核酸、及び遺伝子産物の哺乳類対象への送達における使用のための他のかかる核酸(受容体細胞に送達される「導入遺伝子」と称され得る)への参照は、無傷のポリペプチドをコードするポリヌクレオチドまたは所望の生化学機能を所有する任意の断片もしくは遺伝子操作された誘導体を含む。
「単離」プラスミド、核酸、ベクター、ウイルス、ビリオン、宿主細胞、タンパク質、または他の物質は、その物質が自然発生するまたはそれから初めに調製される場合に存在し得る、他の成分のうちの少なくともいくつかが欠ける物質の調製物を指す。したがって、例えば単離物質は、原料混合物からそれを濃縮するために、精製技術を使用することによって調製され得る。濃縮は、溶液の体積当たりの重量等の絶対基準で測定され得るか、または、原料混合物内に存在する、第2の潜在的干渉物質との相対性で測定され得る。本開示の実施形態の濃縮を増加することは、より単離を高めることである。単離プラスミド、核酸、ベクター、ウイルス、宿主細胞、または他の物質は、いくつかの実施形態では、例えば、純度約80%~約90%、少なくとも純度約90%、少なくとも純度約95%、少なくとも純度約98%、もしくは少なくとも純度約99%、またはそれよりも高い純度に精製される。
本明細書で使用される場合、「治療」、「治療する」等の用語は、所望の薬理及び/または生理効果を得ることを指す。効果は、疾患もしくはその症状を完全にもしくは部分的に予防するという点で予防的であり得、かつ/または、疾患及び/もしくは該疾患に帰属する有害作用の部分的または完全治療の点で治療的であり得る。「治療」は本明細書で使用される場合、哺乳類における、特にヒトにおける疾患の任意の治療を網羅し、(a)疾患にかかりやすくなった可能性があるまたは疾患にかかる危険性があり得るが、それを有するとまだ診断されていない対象において、疾患(及び/または疾患によって引き起こされる症状)を予防すること、(b)疾患(及び/または疾患によって引き起こされる症状)を抑制すること、すなわちその進行を阻止すること、ならびに(c)疾患(及び/または疾患によって引き起こされる症状)を軽減すること、すなわち疾患(及び/または疾患によって引き起こされる症状)の後退を引き起こすことを含む。
「個体」、「宿主」、「対象」、及び「患者」という用語は、本明細書で交換可能に使用され、哺乳類を指し、ヒト、サルを含む非ヒト霊長類、哺乳類競技動物(例えば、ウマ)、哺乳類家畜動物(例えば、ヒツジ、ヤギ等)、哺乳類ペット(イヌ、ネコ等)、及びげっ歯類(例えば、ネズミ、ラット等)が挙げられるがこれらに限定されない。
いくつかの実施形態では、個体は、以前にAAVに自然に曝露されたことがあり、結果として抗AAV抗体(すなわちAAV中和抗体)を内部に有するヒトである。いくつかの実施形態では、個体は、AAVベクターを投与されたことがあり(かつ結果として抗AAV抗体を内部に有し得る)、異なる症状の治療のためまたは同じ症状のさらなる治療のためにベクターの再投与を必要とするヒトである。例えば肝臓、筋肉、及び網膜(このビヒクルに対する中和抗体によって影響を受けた全ての組織)へのAAV遺伝子送達を伴う臨床試験における陽性結果に基づき、多くのかかる治療用途/疾患標的がある。
「有効量」という用語は本明細書で使用される場合、有益なまたは所望の臨床結果をもたらすのに十分な量である。有効量は、1回以上の投与で投与され得る。本開示の目的のために、化合物(例えば感染性rAAVビリオン)の有効量は、特定の疾患状態(例えば癌)の進行(及び/または疾患状態に関連する症状)を緩和、改良、安定化、逆行、予防、減速、または遅延させるのに十分な量である。したがって、感染性rAAVビリオンの有効量は、個人の抗AAV抗体の中和活性を逃れる、よって異種核酸を個人の標的細胞(または標的細胞(複数))に有効に送達することができる、感染性rAAVビリオンの量である。
本発明をさらに記載する前に、具体的な実施形態は当然のことながら変化し得るため、本発明は記載される具体的な実施形態に限定されないということが理解されるべきである。本明細書で使用される用語は、具体的な実施形態を記載する目的のみのためであり、本発明の範囲は添付の特許請求の範囲のみによって限定されるため、限定的であるということを意図されないこともまた理解されるべきである。
値の範囲が提供される場合、その範囲の上限と下限との間の、文脈が別様を明確に述べない限り、下限の単位の10分の1までのそれぞれの介在値、及びその述べられる範囲の任意の他の述べられるまたは介在する値は、本発明内に包含される。これらのより小さい範囲の上限及び下限は、より小さい範囲に独立して含まれ得、本発明内に包含されるが、述べられる範囲の任意の具体的に排除される限度の対象である。述べられる範囲が限度の一方または両方を含む場合、これらの含まれる限度の一方または両方を排除する範囲もまた本発明に含まれる。
別様が定義されない限り、本明細書で使用される全ての技術及び科学用語は、本発明が属する技術の当業者によって一般的に理解されるのと同じ意味を有する。本明細書に記載されるものと同様または等価の任意の方法及び物質もまた、本発明の実践及び試験において使用され得るものの、好ましい方法及び物質がこれから記載される。本明細書で言及される全ての刊行物は、刊行物が記載されるものとの関連で方法及び/または物質を開示及び記載するために、参照により本明細書に組み込まれる。
本明細書及び添付の特許請求の範囲で使用される場合、単数形「1つの(a)」、「1つの(an)」、及び「この(the)」は、文脈が別様を明確に述べない限り、複数形の指示物を含むということもまた理解されるべきである。したがって、例えば、「(an)感染性組換えアデノ随伴ウイルス(rAAV)ビリオン」への言及は、複数のかかるビリオンを含み、「(the)感染性組換えアデノ随伴ウイルス(rAAV)ビリオン」への言及は、1つ以上のかかるビリオン及び当業者に既知のその均等物等を含む、等である。請求項は、任意の追加の要素を排除するように起草され得るということにさらに留意されたい。したがって、本声明は、請求要素の記載と関連する「単に」「のみ」等の排除的用語の使用、または「否定的」限定の使用の先の記載の役割を果たすことが意図される。
明確にするために別個の実施形態の文脈において記載される、本発明のある特定の特徴は、単一の実施形態において組み合わせで提供されてもよいということが理解される。逆に、簡潔にするために単一の実施形態の文脈で記載される本発明の様々な特徴は、別個にまたは任意の好適な下位組み合わせでもまた提供されてよい。本発明に関連する実施形態の全ての組み合わせは、本発明によって具体的に包含され、それぞれの全ての組み合わせが個々に明確に開示されるかのように本明細書で開示される。さらに、様々な実施形態及びその要素の全ての下位組み合わせもまた、本発明により具体的に包含され、それぞれの全てのかかる下位組み合わせが個々に明確に本明細書で開示されるかのように本明細書で開示される。
本明細書で考察される刊行物は、本特許出願の出願日の前のその開示についてのみ提供される。本明細書中の全てのものは、本発明が先行発明のためにかかる刊行物に先行する権利が無いという了解として解釈されるべきでない。さらに、提供される刊行物の日付は、独立して確認する必要があり得る実際の公開日とは異なり得る。
詳細な説明
本開示は、変異体カプシドタンパク質及び異種核酸を含む感染性組換えアデノ随伴ウイルス(rAAV)ビリオンを提供する。本開示は変異体アデノ随伴ウイルス(AAV)カプシドタンパク質(及び/または変異体AAVカプシドタンパク質をコードする核酸)をさらに提供し、これは感染性rAAVビリオンに、ヒトAAV中和抗体への上昇した耐性を与える。本開示は、感染性rAAVビリオン及び/または主題の変異体AAVカプシドタンパク質をコードする核酸を含む宿主細胞をさらに提供する。本開示は上記のビリオン、カプシドタンパク質、核酸、及び/または宿主細胞のライブラリをさらに提供し、このライブラリの少なくとも1つのメンバーの変異体AAVカプシドタンパク質は、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列と比べて少なくとも1つのアミノ酸置換を有するアミノ酸配列を含む。
本開示は、変異体カプシドタンパク質及び異種核酸を含む感染性組換えアデノ随伴ウイルス(rAAV)ビリオンを提供する。本開示は変異体アデノ随伴ウイルス(AAV)カプシドタンパク質(及び/または変異体AAVカプシドタンパク質をコードする核酸)をさらに提供し、これは感染性rAAVビリオンに、ヒトAAV中和抗体への上昇した耐性を与える。本開示は、感染性rAAVビリオン及び/または主題の変異体AAVカプシドタンパク質をコードする核酸を含む宿主細胞をさらに提供する。本開示は上記のビリオン、カプシドタンパク質、核酸、及び/または宿主細胞のライブラリをさらに提供し、このライブラリの少なくとも1つのメンバーの変異体AAVカプシドタンパク質は、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列と比べて少なくとも1つのアミノ酸置換を有するアミノ酸配列を含む。
本開示は、異種核酸を標的細胞に送達する方法をさらに提供し、この標的細胞は主題の感染性rAAVビリオンに接触させられる。本開示は、遺伝子産物を個体に送達する方法をさらに提供し、該方法は有効量の主題のrAAVビリオンを、それを必要とする個体に投与することを概して含む。本明細書には主題の方法を実践するための組成物及びキットもまた提供される。多くの実施形態では、主題の感染性rAAVビリオン、主題の核酸、主題の変異体AAVカプシドタンパク質、主題の宿主細胞等が単離される。
変異体AAVカプシドポリペプチド
主題の変異体AAVカプシドポリペプチド(または主題の核酸によってコードされる変異体AAVカプシドタンパク質)は、変異体AAVカプシドポリペプチドを含む感染性rAAVビリオンに、野生型AAV(例えばAAV2(野生型AAV血清型2))または野生型カプシドタンパク質を含むAAVによって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を与える。いくつかの実施形態では、上昇した耐性は、野生型AAV(例えばAAV2(野生型AAV血清型2))または野生型カプシドタンパク質を含むAAVによって示される耐性よりも、少なくとも約1.5倍(例えば、少なくとも約1.5倍、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約7.5倍、少なくとも約10倍、少なくとも約12倍、少なくとも約15倍、少なくとも約17倍、少なくとも約20倍、少なくとも約25倍、少なくとも約30倍、少なくとも約40倍、少なくとも約50倍、少なくとも約75倍、少なくとも約100倍、少なくとも約150倍、少なくとも約200倍、少なくとも約250倍、少なくとも約300倍等)高い。
主題の変異体AAVカプシドポリペプチド(または主題の核酸によってコードされる変異体AAVカプシドタンパク質)は、変異体AAVカプシドポリペプチドを含む感染性rAAVビリオンに、野生型AAV(例えばAAV2(野生型AAV血清型2))または野生型カプシドタンパク質を含むAAVによって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を与える。いくつかの実施形態では、上昇した耐性は、野生型AAV(例えばAAV2(野生型AAV血清型2))または野生型カプシドタンパク質を含むAAVによって示される耐性よりも、少なくとも約1.5倍(例えば、少なくとも約1.5倍、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約7.5倍、少なくとも約10倍、少なくとも約12倍、少なくとも約15倍、少なくとも約17倍、少なくとも約20倍、少なくとも約25倍、少なくとも約30倍、少なくとも約40倍、少なくとも約50倍、少なくとも約75倍、少なくとも約100倍、少なくとも約150倍、少なくとも約200倍、少なくとも約250倍、少なくとも約300倍等)高い。
主題の変異体AAVカプシドタンパク質(または主題の核酸によってコードされる変異体AAVカプシドタンパク質)は、感染性rAAVビリオンに、野生型AAV(例えばAAV2(野生型AAV血清型2))または野生型カプシドタンパク質を含むAAVによって示される形質導入と比較して、ヒトAAV中和抗体の存在下で、哺乳類細胞への増加した形質導入を与えると言うことができる。いくつかの実施形態では、増加した形質導入は、野生型AAV(例えばAAV2(野生型AAV血清型2))または野生型カプシドタンパク質を含むAAVによって示される形質導入よりも、少なくとも約1.5倍(例えば少なくとも約1.5倍、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約7.5倍、少なくとも約10倍、少なくとも約12倍、少なくとも約15倍、少なくとも約17倍、少なくとも約20倍、少なくとも約25倍、少なくとも約30倍、少なくとも約40倍、少なくとも約50倍、少なくとも約75倍、少なくとも約100倍、少なくとも約150倍、少なくとも約200倍、少なくとも約250倍、少なくとも約300倍等)多い。
いくつかの実施形態では、主題の変異体AAVカプシドタンパク質(または主題の核酸によってコードされる変異体AAVカプシドタンパク質)は、野生型AAVカプシドタンパク質に結合する中和抗体への低下した結合を示す。例えば、主題の変異体AAVカプシドタンパク質は、野生型カプシドAAVタンパク質に結合する中和抗体への少なくとも約1.5倍(例えば、少なくとも約1.5倍、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約7.5倍、少なくとも約10倍、少なくとも約12倍、少なくとも約15倍、少なくとも約17倍、少なくとも約20倍、少なくとも約25倍、少なくとも約30倍、少なくとも約40倍、少なくとも約50倍、少なくとも約75倍、少なくとも約100倍、少なくとも約150倍、少なくとも約200倍、少なくとも約250倍、少なくとも約300倍等)低下した結合(例えば低下した親和性)を、この抗体の野生型AAVカプシドタンパク質への結合親和性と比較して、示し得る。
いくつかの実施形態では、抗AAV中和抗体は、約10-7M未満、約5×10-6M未満、約10-6M未満、約5×10-5M未満、約10-5M未満、約10-4M未満、またはより低い親和性で、主題の変異体AAVカプシドタンパク質(または主題の核酸によってコードされる変異体AAVカプシドタンパク質)に結合する。
「変異体カプシドタンパク質」という用語は、野生型AAVカプシドタンパク質を包含しない。「変異体AAVカプシドタンパク質」は自然発生AAVカプシドタンパク質内に存在するアミノ酸配列を含まない。例えば、主題の変異体カプシドタンパク質は、配列番号1~9に記載される配列のうちのいずれとの100%の配列同一性を有するアミノ酸配列を含まない。換言すると、主題の変異体カプシドタンパク質は、配列番号1~9のうちのいずれかに記載されるアミノ酸配列を含まない。変異体カプシドタンパク質は、「スターター」または「親」AAVカプシドタンパク質とはアミノ酸配列が異なり得、この親AAVカプシドタンパク質は、野生型AAVカプシドタンパク質または非野生型AAVカプシドタンパク質であり得る。
いくつかの実施形態では、主題の変異体AAVカプシドタンパク質(または主題の核酸によってコードされる変異体AAVカプシドタンパク質)は、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と、少なくとも約90%(例えば少なくとも約92%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.5%、または100%)のアミノ酸配列同一性を有するアミノ酸配列を含む。
いくつかの実施形態では、主題の変異体AAVカプシドタンパク質(または主題の核酸によってコードされる変異体AAVカプシドタンパク質)は、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列と、少なくとも約90%(例えば少なくとも約92%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.5%、または100%)のアミノ酸配列同一性を有するアミノ酸配列を含む。
いくつかの実施形態では、主題の変異体AAVカプシドタンパク質(または主題の核酸によってコードされる変異体AAVカプシドタンパク質)は、配列番号10に記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%(例えば少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.5%、または100%)のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ、AAV2(例えば配列番号2)のAAVカプシドタンパク質と比べて、アミノ酸置換N312K、N449D、D472N、N551S、I698V、及びL735Q、または別のAAV親血清型における対応する位置を含む。
いくつかの実施形態では、主題の変異体AAVカプシドタンパク質(または主題の核酸によってコードされる変異体AAVカプシドタンパク質)は、配列番号10に記載されるアミノ酸配列と少なくとも約95%(例えば、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.5%、または100%)のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ、AAV2(例えば配列番号2)のAAVカプシドタンパク質と比べてアミノ酸置換N312K、N449D、D472N、N551S、I698V、及びL735Q、または別のAAV親血清型における対応する位置を含む。
いくつかの実施形態では、主題の変異体AAVカプシドタンパク質(または主題の核酸によってコードされる変異体AAVカプシドタンパク質)は、配列番号31に記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%(例えば、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.5%、または100%)のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ、AAV2(例えば配列番号2)のAAVカプシドタンパク質と比べてアミノ酸置換N312K、N449D、N551S、及びI698V、または別のAAV親血清型における対応する位置を含む。
いくつかの実施形態では、主題の変異体AAVカプシドタンパク質(または主題の核酸によってコードされる変異体AAVカプシドタンパク質)は、配列番号31に記載されるアミノ酸配列と少なくとも約95%(例えば少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.5%、または100%)のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ、AAV2(例えば配列番号2)のAAVカプシドタンパク質と比べてアミノ酸置換N312K、N449D、N551S、及びI698V、または別のAAV親血清型における対応する位置を含む。
いくつかの実施形態では、主題の変異体AAVカプシドタンパク質(主題の核酸によってコードされる変異体AAVカプシドタンパク質)は、配列番号32に記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%(例えば、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.5%、または100%)のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ、AAV2(例えば配列番号2)のAAVカプシドタンパク質と比べてアミノ酸置換D180N、N312K、Q385R、N449D、N551S、I698V、及びS721T、または別のAAV親血清型における対応する位置を含む。
いくつかの実施形態では、主題の変異体AAVカプシドタンパク質(または主題の核酸によってコードされる変異体AAVカプシドタンパク質)は、配列番号32に記載されるアミノ酸配列と少なくとも約95%(例えば、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.5%、または100%)のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ、AAV2(例えば配列番号2)のAAVカプシドタンパク質と比べてアミノ酸置換D180N、N312K、Q385R、N449D、N551S、I698V、及びS721T、または別のAAV親血清型における対応する位置を含む。
いくつかの実施形態では、主題の変異体AAVカプシドタンパク質(または主題の核酸によってコードされる変異体AAVカプシドタンパク質)は、配列番号33に記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%(例えば、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.5%、または100%)のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ、AAV2(例えば配列番号:2)のAAVカプシドタンパク質と比べてアミノ酸置換N312K、N449D、T450A、N551S、及びI698V、または別のAAV親血清型における対応する位置を含む。
いくつかの実施形態では、主題の変異体AAVカプシドタンパク質(または主題の核酸によってコードされる変異体AAVカプシドタンパク質)は、配列番号33に記載されるアミノ酸配列と少なくとも約95%(例えば、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.5%、または100%)のアミノ酸配列同一性を有するアミノ酸配列を含み、AAV2(例えば配列番号2)のAAVカプシドタンパク質と比べてアミノ酸置換N312K、N449D、T450A、N551S、及びI698V、または別のAAV親血清型における対応する位置を含む。
例示的な変異体AAVカプシドタンパク質には以下が挙げられるがこれらに限定されない(選択される例示的な配列アライメントについて図8~10を参照されたい)。
核酸及び宿主細胞
本開示は、変異体AAVカプシドタンパク質(上記の通り)をコードするヌクレオチド配列を含む核酸、ならびに主題の核酸を含む宿主細胞を提供する。核酸及び宿主細胞は、rAAVビリオンの生成(下記の通り)に有用である。
本開示は、変異体AAVカプシドタンパク質(上記の通り)をコードするヌクレオチド配列を含む核酸、ならびに主題の核酸を含む宿主細胞を提供する。核酸及び宿主細胞は、rAAVビリオンの生成(下記の通り)に有用である。
本開示は、主題の核酸を含む宿主細胞例えば単離宿主細胞を提供する。主題の宿主細胞は「遺伝子改変宿主細胞」と称され得、典型的に単離細胞例えばインビトロ培養内の細胞である。主題の宿主細胞は、下記のように主題のrAAVビリオンの生成に有用である。主題の宿主細胞が主題のrAAVビリオンを生成するために使用される場合、それは「パッケージング細胞」と称される。いくつかの実施形態では、主題の宿主細胞は主題の核酸で安定的に遺伝子改変される(すなわち安定的にトランスフェクトされる)。他の実施形態では、主題の宿主細胞は主題の核酸で一時的に遺伝子改変される(すなわち一時的にトランスフェクトされる)。
主題の核酸は、電気穿孔、リン酸カルシウム沈殿、リポソーム媒介トランスフェクト等を含むがこれらに限定されない確立された技術を使用して、宿主細胞に安定的にまたは一時的に導入される。安定的形質転換のために、主題の核酸は、概して、選択マーカー、例えばネオマイシン耐性等のいくつかの公知の選択マーカーのいずれかをさらに含むだろう。
主題の宿主細胞は、主題の核酸を、様々な細胞、例えば、例えばマウス細胞及び霊長類細胞(例えばヒト細胞)を含む、哺乳類細胞のいずれかに導入することによって生成される。好適な哺乳類細胞は、霊長類細胞及び細胞株を含むがこれらに限定されず、好適な細胞株は、293細胞、COS細胞、HeLa細胞、Vero細胞、3T3マウス線維芽細胞、C3H10T1/2線維芽細胞、CHO細胞等を含むがこれらに限定されない。
いくつかの実施形態では、主題の宿主細胞は、突然変異カプシドタンパク質をコードするヌクレオチド配列を含む核酸に加え、1つ以上のAAV repタンパク質をコードするヌクレオチド配列を含む核酸を含む。他の実施形態では、主題の宿主細胞は、下記に記載のようにrAAVベクターをさらに含む。下記により詳細に記載されるように、rAAVビリオンは主題の宿主細胞を使用して生成される。
感染性rAAVビリオン
主題の感染性rAAVビリオンは、変異体AAVカプシドタンパク質及び異種核酸(下記により詳細に記載される)を含み、野生型AAV(例えばAAV2(野生型AAV血清型2))または野生型カプシドタンパク質を含むAAVによって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を示す。「上昇した耐性」とは、主題の感染性rAAVビリオンがヒト抗AAV抗体の存在下で上昇した感染性を示すことを意味する。上記のように、ウイルス感染性は、感染性ウイルス粒子の合計ウイルス粒子に対する比率として表現され得る。したがって、上昇した感染性は、感染性ウイルス粒子の合計ウイルス粒子に対する上昇した比率を意味する。ヒト抗AAV抗体へのAAVの耐性を決定するために、AAVの感染性は、遺伝子送達効率性(すなわち感染性)をヒト抗AAV抗体の不在下の50%に低減するために必要とされる抗体濃度(例えば、血清濃度、IVIG濃度等)(mg/mL)を得るために様々な濃度のヒト抗AAV抗体の存在下で測定される。遺伝子送達効率性をヒト抗AAV抗体の不在下におけるそれの50%に低減するために、より高い抗体濃度を必要とするウイルスは、抗体中和への上昇した耐性を有するとされる。したがって、耐性における2倍の上昇は、遺伝子送達効率性をヒト抗AAV抗体の不在下におけるそれの50%に低減するために必要とされる抗体濃度における2倍の上昇を意味する。いくつかの実施形態では、主題の感染性rAAVビリオンは、野生型AAV(例えばAAV2(野生型AAV血清型2))または野生型カプシドタンパク質を含むAAVによって示される耐性よりも、ヒトAAV中和抗体への少なくとも約1.5倍(例えば少なくとも約1.5倍、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約7.5倍、少なくとも約10倍、少なくとも約12倍、少なくとも約15倍、少なくとも約17倍、少なくとも約20倍、少なくとも約25倍、少なくとも約30倍、少なくとも約40倍、少なくとも約50倍、少なくとも約75倍、少なくとも約100倍、少なくとも約150倍、少なくとも約200倍、少なくとも約250倍、少なくとも約300倍等)高い耐性を示す。
主題の感染性rAAVビリオンは、変異体AAVカプシドタンパク質及び異種核酸(下記により詳細に記載される)を含み、野生型AAV(例えばAAV2(野生型AAV血清型2))または野生型カプシドタンパク質を含むAAVによって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を示す。「上昇した耐性」とは、主題の感染性rAAVビリオンがヒト抗AAV抗体の存在下で上昇した感染性を示すことを意味する。上記のように、ウイルス感染性は、感染性ウイルス粒子の合計ウイルス粒子に対する比率として表現され得る。したがって、上昇した感染性は、感染性ウイルス粒子の合計ウイルス粒子に対する上昇した比率を意味する。ヒト抗AAV抗体へのAAVの耐性を決定するために、AAVの感染性は、遺伝子送達効率性(すなわち感染性)をヒト抗AAV抗体の不在下の50%に低減するために必要とされる抗体濃度(例えば、血清濃度、IVIG濃度等)(mg/mL)を得るために様々な濃度のヒト抗AAV抗体の存在下で測定される。遺伝子送達効率性をヒト抗AAV抗体の不在下におけるそれの50%に低減するために、より高い抗体濃度を必要とするウイルスは、抗体中和への上昇した耐性を有するとされる。したがって、耐性における2倍の上昇は、遺伝子送達効率性をヒト抗AAV抗体の不在下におけるそれの50%に低減するために必要とされる抗体濃度における2倍の上昇を意味する。いくつかの実施形態では、主題の感染性rAAVビリオンは、野生型AAV(例えばAAV2(野生型AAV血清型2))または野生型カプシドタンパク質を含むAAVによって示される耐性よりも、ヒトAAV中和抗体への少なくとも約1.5倍(例えば少なくとも約1.5倍、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約7.5倍、少なくとも約10倍、少なくとも約12倍、少なくとも約15倍、少なくとも約17倍、少なくとも約20倍、少なくとも約25倍、少なくとも約30倍、少なくとも約40倍、少なくとも約50倍、少なくとも約75倍、少なくとも約100倍、少なくとも約150倍、少なくとも約200倍、少なくとも約250倍、少なくとも約300倍等)高い耐性を示す。
主題の感染性rAAVビリオンは、ヒトAAV中和抗体の存在下で、哺乳類細胞への増加した形質導入を示すと言われ得る。いくつかの実施形態では、主題の感染性rAAVビリオンは、野生型AAV(例えばAAV2(野生型AAV血清型2))または野生型カプシドタンパク質を含むAAVによって示される形質導入よりも、ヒトAAV中和抗体の存在下で、哺乳類細胞の少なくとも約1.5倍(例えば少なくとも約1.5倍、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約7.5倍、少なくとも約10倍、少なくとも約12倍、少なくとも約15倍、少なくとも約17倍、少なくとも約20倍、少なくとも約25倍、少なくとも約30倍、少なくとも約40倍、少なくとも約50倍、少なくとも約75倍、少なくとも約100倍、少なくとも約150倍、少なくとも約200倍、少なくとも約250倍、少なくとも約300倍等)多い形質導入を示す。
いくつかの実施形態では、主題の感染性rAAVビリオンは、野生型AAVカプシドタンパク質に結合する中和抗体への低下した結合を示す。例えば、主題の感染性rAAVビリオンは、抗体の野生型AAVカプシドタンパク質への結合親和性と比較して、野生型カプシドAAVタンパク質に結合する中和抗体への、少なくとも約1.5倍(例えば少なくとも約1.5倍、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約7.5倍、少なくとも約10倍、少なくとも約12倍、少なくとも約15倍、少なくとも約17倍、少なくとも約20倍、少なくとも約25倍、少なくとも約30倍、少なくとも約40倍、少なくとも約50倍、少なくとも約75倍、少なくとも約100倍、少なくとも約150倍、少なくとも約200倍、少なくとも約250倍、少なくとも約300倍等)低減した結合(例えば低減した親和性)を示し得る。
いくつかの実施形態では、抗AAV中和抗体は、約10-7M未満、約5×10-6M未満、約10-6M未満、約5×10-5M未満、約10-5M未満、約10-4M未満、またはより低い親和性で主題の感染性rAAVビリオンに結合する。
いくつかの実施形態では、主題の感染性rAAVビリオンは、野生型AAVと比較して増加したインビボ滞留時間を示す。例えば、主題の感染性rAAVビリオンは、野生型AAVの滞留時間よりも少なくとも約10%、少なくとも約25%、少なくとも約50%、少なくとも約100%、少なくとも約3倍、少なくとも約5倍、少なくとも約10倍、少なくとも約25倍、少なくとも約50倍、少なくとも約100倍以上長い滞留時間を示す。
所与の主題の感染性rAAVビリオンが、中和抗体への低減した結合及び/または中和抗体への上昇した耐性を示すかどうかは、当業者に既知の任意の便利なアッセイを使用して決定することができる。
いくつかの実施形態では、主題の感染性rAAVビリオンは、野生型Rep78、Rep68、Rep52、及びRep40タンパク質を含む。他の実施形態では、主題の感染性rAAVビリオンは、1つ以上の変異体カプシドタンパク質に加えて、Rep78、Rep68、Rep52、及びRep40タンパク質のうちの1つ以上における1つ以上の突然変異体を含む。
異種核酸
主題のrAAVベクター(例えば主題の感染性rAAVビリオン)における使用に好適な異種DNA分子(本明細書で「異種核酸」とも称される)は、任意の異種核酸であり得る。いくつかの実施形態では、異種核酸は、ポリペプチド(例えば、いくつかの所望の特徴を標的細胞に与えるタンパク質、例えば細胞追跡を可能にする蛍光タンパク質、標的細胞内で欠けているまたは変化した活性を提供する酵素等)をコードするヌクレオチド配列を含む。いくつかの実施形態では、異種核酸はRNA干渉剤(上記に定義の通り)を含む。
主題のrAAVベクター(例えば主題の感染性rAAVビリオン)における使用に好適な異種DNA分子(本明細書で「異種核酸」とも称される)は、任意の異種核酸であり得る。いくつかの実施形態では、異種核酸は、ポリペプチド(例えば、いくつかの所望の特徴を標的細胞に与えるタンパク質、例えば細胞追跡を可能にする蛍光タンパク質、標的細胞内で欠けているまたは変化した活性を提供する酵素等)をコードするヌクレオチド配列を含む。いくつかの実施形態では、異種核酸はRNA干渉剤(上記に定義の通り)を含む。
主題の異種核酸は、概して約5キロベース(kb)未満の大きさであり、例えば、受容体個体または標的細胞から不足しているまたは欠けているタンパク質をコードする遺伝子(ヌクレオチド配列)、所望の生物効果または治療効果(例えば、抗細菌、抗ウイルス、または抗腫瘍/抗癌機能)を有するタンパク質をコードする遺伝子、有害あるいは望ましくないタンパク質の生成を抑制または低減するRNAをコードするヌクレオチド配列(例えば上記に定義されるRNA干渉剤をコードするヌクレオチド配列)、及び/または抗原タンパク質をコードするヌクレオチド配列を含むだろう。
好適な異種核酸は、後天性免疫不全症候群(AIDS)、癌、ハイパーコレステミア(hypercholestemia);活性化剤欠損症/GM2ガングリオシドーシス、αマンノシドーシス、アスパルチルグルコサミン尿症、コレステロールエステル蓄積症、慢性ヘキソサミニダーゼA欠損症、シスチン症、ダノン病、ファブリー病、ファーバー病、フコシドーシス、ガラクトシアリドーシス、ゴーシェ病、GM1ガングリオシドーシス、I細胞病/ムコリピドーシスII、乳児遊離シアル酸蓄積症/ISSD、若年性ヘキソサミニダーゼA欠損症、クラッベ病、リゾソーマル酸リパーゼ欠損症、異染性白質ジストロフィー、ムコ多糖症疾患(偽性ハーラーポリジストロフィー/ムコリピドーシスIIIA、MPSIハーラー症候群、MPSIシャイエ症候群、MPS Iハーラーシャイエ症候群、MPS IIハンター症候群、サンフィリポ症候群A型/MPS III A、サンフィリポ症候群B型/MPS III B、サンフィリポ症候群C型/MPS III C、サンフィリポ症候群D型/MPS III D、モルキオA型/MPS IVA、モルキオB型/MPS IVB、MPS IXヒアルロニダーゼ欠損症、MPS VI マロトーラミー、MPS VII スライ症候群、ムコリピドーシスI/シアリドーシス、ムコリピドーシスIIIC、及びムコリピドーシスIV型を含む)、多種スルファターゼ欠損症、ニーマンピック病、神経セロイドリポフスチン症、ポンペ病/糖原病II型、濃化異骨症、サンドホフ病/成人発症/GM2ガングリオシドーシス、サンドホフ病/GM2ガングリオシドーシス-乳児性、サンドホフ病/GM2ガングリオシドーシス-若年性、シンドラー病、サラ病/シアル酸蓄積症、テイサックス/GM2ガングリオシドーシス、及びウォルマン病等のリソソーム蓄積症、糖尿病等のインスリン障害、成長障害、様々な貧血症、地中海貧血症、及び血友病を含む様々な血液障害;嚢胞性線維症、ゴーシェ病、ハーラー病、アデノシンデアミナーゼ(ADA)欠損症、肺気腫等の遺伝的欠損等の、炎症性疾患、自己免疫、慢性、及び感染性疾患等の障害を含む、内分泌、代謝、血液、心循環、神経、筋骨格、泌尿器、肺、及び免疫障害の治療のために使用されるタンパク質をコードするものを含むがこれらに限定されない。
好適な異種核酸は、インターフェロン(例えばIFN-γ、IFN-α、IFN-β、IFN-ω;IFN-τ);インスリン(例えばNovolin、Humulin、Humalog、Lantus、Ultralente等);エリスロポエチン(「EPO」;例えばProcrit(登録商標)、Eprex(登録商標)、またはEpogen(登録商標)(エポエチン-α);Aranesp(登録商標)(ダルベポエチン-α);NeoRecormon(登録商標)、Epogin(登録商標)(エポエチン-β)等);モノクローナル抗体の抗原結合断片(例えばLucentis(登録商標)(ラニビズマブ))を含む、抗体(例えばモノクローナル抗体)(例えばRituxan(登録商標)(リツキシマブ)、Remicade(登録商標)(インフリキシマブ)、Herceptin(登録商標)(トラスツズマブ)、Humira(商標)(アダリムマブ)、Xolair(登録商標)(オマリズマブ)、Bexxar(登録商標)(トシツモマブ)、Raptiva(商標)(エファリズマブ)、Erbitux(商標)(セツキシマブ)、Avastin(登録商標)(ベバシズマブ)等);血液因子(例えばActivase(登録商標)(アルテプラーゼ)組織プラスミノーゲン活性化因子、NovoSeven(登録商標)(組換えヒト因子VIIa)、因子VIIa、因子VIII(例えばKogenate(登録商標))、因子IX、β-グロビン、ヘモグロビン等);コロニー刺激因子(例えばNeupogen(登録商標)(フィルグラスチム;G-CSF)、Neulasta(ペグフィルグラスチム)、顆粒球コロニー刺激因子(G-CSF)、顆粒球-単球コロニー刺激因子、マクロファージコロニー刺激因子、巨核球コロニー刺激因子等);成長ホルモン(例えばソマトロピン、例えばGenotropin(登録商標)、Nutropin(登録商標)、Norditropin(登録商標)、Saizen(登録商標)、Serostim(登録商標)、Humatrope(登録商標)等、ヒト成長ホルモン等);インターロイキン(例えばIL-1、例えばProleukin(登録商標)を含むIL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9等);成長因子(例えばRegranex(登録商標)(ベクラペルミン(beclapermin);PDGF)、Fiblast(登録商標)(トラフェルミン;bFGF)、Stemgen(登録商標)(アンセスチム;幹細胞因子)、ケラチノサイト成長因子、酸性線維芽細胞成長因子、幹細胞因子、塩基性線維芽細胞成長因子、肝細胞成長因子等);可溶性受容体(例えば、Enbrel(登録商標)(エタネルセプト)等のTNF-α結合可溶性受容体、可溶性VEGF受容体、可溶性インターロイキン受容体、可溶性γ/δ T細胞受容体等);酵素(例えばα-グルコシダーゼ;Cerazyme(登録商標)(イミグルカラーゼ;β-グルコセレブロシダーゼ、Ceredase(登録商標)(アルグルセラーゼ;);酵素活性化剤(例えば組織プラスミノーゲン活性化因子);ケモカイン(例えばIP-10;Mig;Groα/IL-8、RANTES;MIP-1α;MIP-1β;MCP-1;PF-4等);血管形成剤(例えば血管内皮成長因子(VEGF);抗血管形成剤(例えば可溶性VEGF受容体);タンパク質ワクチン;ブラジキニン、コレシストキニン、ガスチン(gastin)、セクレチン、オキシトシン、性腺刺激ホルモン放出ホルモン、ベータエンドルフィン、エンケファリン、P物質、ソマトスタチン、プロラクチン、ガラニン、成長ホルモン放出ホルモン、ボンベシン、ダイノルフィン、ニューロテンシン、モチリン、甲状腺刺激ホルモン、ニューロペプチドY、黄体ホルモン、カルシトニン、インスリン、グルカゴン、バソプレシン、アンジオテンシンII、甲状腺刺激ホルモン放出ホルモン、血管作用性小腸ペプチド、睡眠ペプチド等の神経活性ペプチド;血栓溶解剤、心房性ナトリウム利尿ペプチド、骨形態形成蛋白質、トロンボポエチン、リラキシン、グリア線維酸性タンパク質、卵胞刺激ホルモン、ヒトα-1抗トリプシン、白血病抑制因子,形質転換成長因子、インスリン様成長因子、黄体形成ホルモン、マクロファージ活性化因子、腫瘍壊死因子、好中球走化性因子、神経成長因子メタロプロテイナーゼの組織抑制因子等の他のタンパク質;血管作用性小腸ペプチド、アンジオゲニン、アンジオトロピン、フィブリン;ヒルジン;白血病抑制因子;IL-1受容体拮抗薬(例えばKineret(登録商標)(アナキンラ));イオンチャネル、例えば嚢胞性線維症膜コンダクタンス制御因子(CFTR);ジストロフィン;ウトロフィン、腫瘍抑制因子;リソソーム酵素酸性α-グルコシダーゼ(GAA);等を含むがこれらに限定されない、様々なタンパク質のうちのいずれかをコードするものを含むがこれらに限定されない。好適な核酸は、前述のタンパク質のいずれかの機能的断片をコードするもの、及び前述のタンパク質のいずれかの機能的変異体をコードする核酸もまた含む。
好適な異種核酸は抗原タンパク質をコードするものもまた含む。抗原タンパク質をコードする異種核酸を含む主題のrAAVベクターは、哺乳類宿主における抗原タンパク質への免疫応答を刺激するのに好適である。抗原タンパク質は、自己抗原、アレルゲン、腫瘍/癌関連抗原、病原ウイルス、病原細菌、病原原虫、病原蠕虫、または哺乳類宿主に感染する任意の他の病原微生物に由来する。本明細書で使用される場合、「に由来する抗原タンパク質をコードする核酸」という用語は、野生型抗原タンパク質をコードする核酸、例えばウイルス性タンパク質をコードする病原ウイルスから単離された核酸;自然発生抗原タンパク質とアミノ酸配列が同一である抗原タンパク質をコードする、実験室で生成された合成核酸;自然発生抗原タンパク質とはアミノ酸配列が異なる(例えば1アミノ酸~約15アミノ酸)抗原タンパク質をコードするが、それでもなお対応する自然発生抗原タンパク質への免疫応答を引き起こす、実験室で生成された合成核酸;抗原タンパク質の断片(例えば約5アミノ酸~約50アミノ酸の断片であり、この断片は1つ以上の抗原エピトープを含む)をコードし、この断片が対応する自然発生抗原タンパク質への免疫応答を引き起こす、実験室で生成された合成核酸等を含む。
同様に、自己抗原、アレルゲン、腫瘍/癌関連抗原、病原ウイルス、病原細菌、病原原虫、病原蠕虫、または哺乳類宿主に感染する任意の他の病原微生物に「由来する」抗原タンパク質は、自然発生抗原タンパク質とアミノ酸配列が同一であるタンパク質、及び自然抗原タンパク質とはアミノ酸配列が異なる(例えば1アミノ酸~約15アミノ酸)が、それでもなお対応する自然発生抗原タンパク質への免疫応答を引き起こすタンパク質、ならびに、対応する自然発生抗原タンパク質への免疫応答を引き起こす、抗原タンパク質の断片(例えば約5アミノ酸~約100アミノ酸、例えば約5~約50アミノ酸の断片であり、この断片は1つ以上の抗原エピトープを含む)を含む。
いくつかの実施形態では、主題のrAAVベクターによってコードされる抗原タンパク質への免疫応答は、哺乳類宿主において抗原タンパク質または抗原エピトープ(またはrAAVコード抗原タンパク質または抗原エピトープと交差反応性のタンパク質またはエピトープ)を呈する病原微生物への保護免疫応答を刺激するだろう。いくつかの実施形態では、rAAVコード抗原タンパク質への細胞傷害性Tリンパ球(CTL)応答は、哺乳類宿主において引き起こされるだろう。他の実施形態では、抗原タンパク質に特異的な抗体が生成されるように、rAAVコード抗原タンパク質への体液性応答は哺乳類宿主細胞において引き起こされるだろう。多くの実施形態では、rAAVコード抗原タンパク質へのTH1免疫応答は哺乳類宿主において引き起こされるだろう。好適な抗原タンパク質は、腫瘍/癌関連抗原、ウイルス性抗原、細菌性抗原、及び原虫性抗原、ならびにその抗原断片を含む。いくつかの実施形態では、抗原タンパク質は細胞内病原体に由来する。他の実施形態では、抗原タンパク質は自己抗原である。さらに他の実施形態では、抗原タンパク質はアレルゲンである。
腫瘍/癌特異性抗原は、MAGE1(例えばGenBank受託番号M77481)、MAGE2(例えばGenBank受託番号U03735)、MAGE3、MAGE4等を含む様々なMAGE(メラノーマ関連抗原E)のいずれか;様々なチロシナーゼのいずれか;突然変異ras;突然変異p53(例えばGenBank受託番号X54156及びAA494311);及びp97メラノーマ抗原(例えばGenBank受託番号M12154)を含むがこれらに限定されない。他の腫瘍/癌特異性抗原は、進行癌に関連するRasペプチド及びp53ペプチド、子宮頸癌に関連するHPV16/18及びE6/E7抗原、乳癌に関連するMUCI1-KLH(例えばGenBank受託番号J03651)、結腸直腸癌に関連するCEA(癌胎児性抗原)(例えばGenBank受託番号X98311)、gp100(例えばGenBank受託番号S73003)またはメラノーマに関連するMART1抗原、及び前立腺癌に関連するPSA抗原(例えばGenBank受託番号X14810)を含む。p53遺伝子配列は既知であり(例えばHarris et al.(1986)Mol.Cell.Biol.,6:4650-4656を参照)受託番号M14694の下でGenBankに寄託される。したがって、主題のタンパク質、核酸、及び/またはビリオンは、子宮頸癌、乳癌、結腸直腸癌、前立腺癌、肺癌を含むがこれらに限定されない癌、及びメラノーマの免疫療法として使用され得る。
ウイルス性抗原は、麻疹、流行性耳下腺炎、風疹、灰白髄炎、肝炎A、B(例えばGenBank受託番号E02707)、及びC(例えばGenBank受託番号E06890)、ならびに他の肝炎ウイルス、インフルエンザ、アデノウイルス(例えば4型及び7型)、狂犬病(例えばGenBank受託番号M34678)、黄熱病、日本脳炎(例えばGenBank受託番号E07883)、デング熱(例えばGenBank受託番号M24444)、ハンタウイルス、及びヒト免疫不全ウイルス(例えばGenBank受託番号U18552)を含むがこれらに限定されない疾患の原因となる既知の病原体に由来する。
好適な細菌性及び寄生虫抗原は、ジフテリア、百日咳(例えばGenBank受託番号M35274)、破傷風(例えばGenBank受託番号M64353)、結核、細菌性及び真菌性肺炎(例えばインフルエンザ菌、ニューモシスチスカリニ等)、コレラ、腸チフス、ペスト、細菌性赤痢,サルモネラ症(例えばGenBank受託番号L03833)、在郷軍人病、ライム病(例えばGenBank受託番号U59487)、マラリア(例えばGenBank受託番号X53832)、鉤虫、オンコセルカ症(例えばGenBank受託番号M27807)、住血吸虫症(例えばGenBank受託番号L08198)、トリパノソーマ症、レシュマニアシス(leshmaniasis)、ジアルジア症(例えばGenBank受託番号M33641)、アメーバ症、フィラリア症(例えばGenBank受託番号J03266)、ボレリア症、及び旋毛虫症を含むがこれらに限定されない疾患の原因となる既知の病原体に由来するものを含む。
異種遺伝子産物をコードする好適な異種核酸は、RNAi剤(上記により詳細に記載される通り)(例えばアンチセンスRNA、siRNA、shRNA、2本鎖RNA(dsRNA)、CRISPR剤、例えばCas9またはCas9様タンパク質、crRNA様RNA、tracrRNA様RNA、単一誘導RNA、及び/またはドナーポリヌクレオチド等)等の未翻訳RNA、リボザイム等を含む。RNAi剤は、遺伝子発現を抑制するために使用され得る。いくつかのRNAi剤は、遺伝子発現を抑制するために後に使用することができるツールを提供する(例えば、cas9またはcas9様タンパク質等のCRISPR剤)。
標的遺伝子は有害(例えば病理的)である標的遺伝子産物(RNAまたはタンパク質)、例えば、機能不全の標的遺伝子産物(例えば、コードタンパク質配列における突然変異に起因する、遺伝子産物の定常状態レベルを制御する非コード配列における突然変異に起因する等)をコードする任意の遺伝子を含む。標的遺伝子産物は、ハンチンチン、C型肝炎ウイルス、ヒト免疫不全ウイルス、アミロイド前駆体タンパク質、タウ、ポリグルタミン反復配列を含むタンパク質、ヘルペスウイルス(例えば水痘帯状疱疹)、任意の病理的ウイルス等を含むがこれらに限定されない。
したがって、RNAi剤をコードする異種核酸を含む主題のrAAVは、神経変性疾患、例えば、ポリグルタミン反復配列に関連する疾患であって、例えばハンティントン病、脊髄小脳失調症、球脊髄性筋萎縮症(SBMA)、歯状核赤核淡蒼球ルイ体萎縮症(DRPLA)等の、ポリグルタミン反復配列に関連する疾患等の、トリヌクレオチド反復配列疾患;ウイルス性感染等の後天性病理(例えば異常な生理、生化学、細胞、構造、または分子生物状態によって明らかになる疾患または症候群)例えばHCV感染の結果として生じるまたは生じ得る肝炎、HIV感染の結果として生じる後天性免疫不全症候群;癌等を含むがこれらに限定されない、様々な障害及び病態の治療に有用である。
多くの実施形態では、RNAi剤をコードする異種核酸はプロモーターに作動可能に連結される。好適なプロモーターは、当業者に既知であり、任意のタンパク質コード遺伝子、例えば内因的に制御された遺伝子または構成的に発現された遺伝子のプロモーターを含む。例えば、細胞生理事象、例えば低酸素状態において、例えば熱ショック、酸素レベル、及び/または一酸化炭素レベルによって制御される遺伝子のプロモーターはsiRNAコード核酸に作動可能に連結され得る。
EPOコードまたは目的とする核酸等の選択された異種ヌクレオチド配列は、インビボのヌクレオチド配列におけるその転写または発現を管理する制御要素に作動可能に連結される。かかる制御要素は、通常選択された遺伝子と関連する制御配列(例えば内因性細胞制御要素)を含み得る。あるいは、異種制御配列が用いられ得る。有用な異種制御配列は概して哺乳類またはウイルス性遺伝子をコードする配列に由来するものを含む。例としては、SV40初期プロモーター、マウス乳癌ウイルス末端反復配列(LTR)プロモーター、アデノウイルス主要後期プロモーター(Ad MLP)、単純ヘルペスウイルス(HSV)プロモーター、目的とする遺伝子に対して異種である内因性細胞プロモーター、CMV最初期プロモーター領域(CMVIE)等のサイトメガロウイルス(CMV)プロモーター、ラウス肉腫ウイルス(RSV)プロモーター、合成プロモーター、ハイブリッドプロモーター等が挙げられるがこれらに限定されない。さらに、マウスメタロチオネイン遺伝子等の非ウイルス性遺伝子由来の配列もまた本明細書において役立ち得る。かかるプロモーター配列は、例えばStratagene(カリフォルニア州サンディエゴ)から商業的に入手可能である。
いくつかの実施形態では、細胞型特異性または組織特異性プロモーターは、遺伝子産物が具体的な細胞型(複数可)または組織(複数可)内で選択的にまたは優先的に生成されるように、異種遺伝子産物をコードする異種核酸に作動可能に連結され得る。いくつかの実施形態では、誘導プロモーターは、異種核酸に作動可能に連結され得る。
例えば、筋肉特異性かつ誘導プロモーター、エンハンサー等は、遺伝子産物の筋細胞への送達に有用である。かかる制御要素は、myoD遺伝子ファミリーから等のアクチン及びミオシン遺伝子ファミリー由来のもの、ミオサイト特異性エンハンサー結合因子MEF-2、ヒト骨格アクチン遺伝子及び心臓アクチン遺伝子由来の制御要素、筋クレアチンキナーゼ配列要素及びマウスクレアチンキナーゼエンハンサー(mCK)要素、骨格速収縮トロポニンC遺伝子、緩徐収縮心臓トロポニンC遺伝子、及び緩徐収縮トロポニンI遺伝子由来の制御要素、低酸素誘導核因子、グルココルチコイド応答要素(GRE)等のステロイド誘導要素及びプロモーター、RU486誘導のための融合コンセンサス要素、テトラサイクリン制御遺伝子発現を提供する要素を含むがこれらに限定されない。
AAV ITRによって結合される目的とするDNA分子(異種DNA)を内部に有するAAV発現ベクターは、選択された配列(複数可)を、主要なAAVオープンリーディングフレーム(「ORF」)が切除されたAAVゲノムに直接的に挿入することによって構築され得る。ITRの十分な部分が複製及びパッケージング機能を可能にし続ける限り、AAVゲノムの他の部分もまた削除され得る。かかる構築物は、当業者に公知の技術を使用して設計され得る。例えば米国特許第5,173,414号及び同第5,139,941号、国際公開WO92/01070号(1992年1月23日公開)及びWO93/03769号(1993年3月4日公開)、Lebkowski et al.(1988)Molec.Cell.Biol.8:3988-3996、Vincent et al.(1990)Vaccines 90(Cold Spring Harbor Laboratory Press)、Carter,B.J.(1992)Current Opinion in Biotechnology3:533-539、Muzyczka,N.(1992)Current Topics in Microbiol.and Immunol.158:97-129、Kotin,R.M.(1994)Human Gene Therapy5:793-801、Shelling and Smith(1994)Gene Therapy1:165-169、ならびにZhou et al.(1994)J.Exp.Med.179:1867-1875を参照されたい。
あるいは、AAV ITRは、ウイルス性ゲノムから、または別のベクター内に存在する選択された核酸構築物の同じかつ融合した5′及び3′を含有するAAVベクターから、当業者に既知の任意の便利な方法を使用して切除され得る。例えば1つの好適なアプローチは、上記のSambrook et al.に記載されるもの等の、標準ライゲーション技術を使用する。例えばライゲーションは、20mMのTris-Cl pH7.5、10mMのMgCl2、10mMのDTT、33μg/mlのBSA、10mM~50mMのNaCl、及び40μMのATP、0℃~16℃の0.01~0.02(Weiss)ユニットT4 DNAリガーゼ(「付着末端」ライゲーション)、または1mMのATP、14℃の0.3~0.6(Weiss)ユニットT4 DNAリガーゼ(「平滑末端」ライゲーション)のいずれかにおいて、達成され得る。分子内「付着末端」ライゲーションは、たいてい30~100μg/mlの合計DNA濃度(5~100nMの合計最終濃度)で行われる。ITRを含有するAAVベクターは、例えば米国特許第5,139,941号に記載されている。特に、該文献において、受託番号53222、53223、53224、53225、及び53226下で米国培養細胞系統保存機関(「ATCC」)から入手可能であるいくつかのAAVベクターが記載される。
さらに、キメラ遺伝子は、1つ以上の選択された核酸配列の5′及び3′を配置したAAV ITR配列を含むために、合成的に生成され得る。哺乳類筋細胞におけるキメラ遺伝子配列の発現に好ましいコドンが使用され得る。完全キメラ配列は、標準方法によって調製される重複オリゴヌクレオチドから構築される。例えば、Edge,Nature(1981)292:756、Nambair et al.Science(1984)223:1299、Jay et al.J.Biol.Chem.(1984)259:6311を参照されたい。
主題の感染性rAAVビリオンの生成
導入として、rAAVベクター複製及びパッケージングのために、宿主または「生成体」細胞を用いるのが典型的である。かかる生成体細胞(たいてい哺乳類宿主細胞)は、概してrAAV生成のためにいくつかの異なる種類の成分を含むか、または含むように改変される。第1の成分は、宿主パッケージング細胞によってベクター粒子に複製及びパッケージングされ得る、組換えアデノ随伴ウイルス性(rAAV)ベクターゲノム(または「rAAVプロベクター」)である。rAAVプロベクターは、通常異種ポリヌクレオチド(または「導入遺伝子」)を含み得、これを用いて、遺伝子療法に関連して別の細胞を遺伝子変化させることが望ましい(かかる導入遺伝子のrAAVベクターへのパッケージングは、導入遺伝子を様々な哺乳類細胞に送達するために有効に使用することができるため)。導入遺伝子は概して、AAVベクターの切除、複製、及びパッケージングの間、ならびにベクターの宿主細胞ゲノムへの統合の間に認識される配列を含む、2つのAAV逆位末端配列(ITR)によって隣接される。
導入として、rAAVベクター複製及びパッケージングのために、宿主または「生成体」細胞を用いるのが典型的である。かかる生成体細胞(たいてい哺乳類宿主細胞)は、概してrAAV生成のためにいくつかの異なる種類の成分を含むか、または含むように改変される。第1の成分は、宿主パッケージング細胞によってベクター粒子に複製及びパッケージングされ得る、組換えアデノ随伴ウイルス性(rAAV)ベクターゲノム(または「rAAVプロベクター」)である。rAAVプロベクターは、通常異種ポリヌクレオチド(または「導入遺伝子」)を含み得、これを用いて、遺伝子療法に関連して別の細胞を遺伝子変化させることが望ましい(かかる導入遺伝子のrAAVベクターへのパッケージングは、導入遺伝子を様々な哺乳類細胞に送達するために有効に使用することができるため)。導入遺伝子は概して、AAVベクターの切除、複製、及びパッケージングの間、ならびにベクターの宿主細胞ゲノムへの統合の間に認識される配列を含む、2つのAAV逆位末端配列(ITR)によって隣接される。
第2の成分は、AAV複製のためのヘルパー機能を提供するヘルパーウイルスである。アデノウイルスが一般的に用いられるものの、当業者に既知のように他のヘルパーウイルスもまた使用され得る。あるいは、必要なヘルパーウイルス機能がヘルパーウイルスから遺伝子単離され得、コード遺伝子がトランスにヘルパーウイルス機能を提供するために使用され得る。AAVベクター要素及びヘルパーウイルス(またはヘルパーウイルス機能)は、同時にまたは任意の順で連続的に、のいずれかで宿主細胞に導入され得る。
AAV生成が提供されるための生成体細胞内の最後の成分は、複製タンパク質及びカプシド形成タンパク質をそれぞれ提供する、AAV rep及びcap遺伝子等の「AAVパッケージング遺伝子」である。AAVパッケージング遺伝子のいくつかの異なるバージョンが提供され得る(rep及び/またはcap遺伝子がネイティブプロモーターの制御下に残され得るかまたは異種プロモーターに作動可能に連結され得る、rep-capカセット及び別個のrep及び/またはcapカセットを含む)。かかるAAVパッケージング遺伝子は、当業者に既知でありかつ下記により詳細に記載されるように、宿主パッケージング細胞に一時的にまたは安定的に導入され得る。
1.rAAVベクター
目的とする異種DNA(「目的とする異種DNA」は本明細書で「異種核酸」とも称される)を含む主題のrAAVビリオンは、当業者に既知の標準方法を使用して生成することができる。方法は、(1)主題のrAAVベクターを宿主細胞に導入するステップ、(2)AAVヘルパー構築物を宿主細胞に導入するステップであって、該ヘルパー構築物が、AAVベクターから欠けているAAVヘルパー機能を補償するために、宿主細胞内で発現されることが可能なAAVコード領域を含む、導入するステップ、(3)1つ以上のヘルパーウイルス及び/または付属機能ベクターを宿主細胞に導入するステップであって、該ヘルパーウイルス及び/または付属機能ベクターが、宿主細胞における効率的な組換えAAV(「rAAV」)ビリオン生成を支持することが可能である付属機能を提供する、導入するステップ、ならびに(4)rAAVビリオンを生成するために宿主細胞を培養するステップを概して含む。AAV発現ベクター、AAVヘルパー構築物、及びヘルパーウイルスまたは付属機能ベクター(複数可)は、標準トランスフェクト技術を使用して、同時にまたは連続的に、のいずれかで宿主細胞に導入され得る。
目的とする異種DNA(「目的とする異種DNA」は本明細書で「異種核酸」とも称される)を含む主題のrAAVビリオンは、当業者に既知の標準方法を使用して生成することができる。方法は、(1)主題のrAAVベクターを宿主細胞に導入するステップ、(2)AAVヘルパー構築物を宿主細胞に導入するステップであって、該ヘルパー構築物が、AAVベクターから欠けているAAVヘルパー機能を補償するために、宿主細胞内で発現されることが可能なAAVコード領域を含む、導入するステップ、(3)1つ以上のヘルパーウイルス及び/または付属機能ベクターを宿主細胞に導入するステップであって、該ヘルパーウイルス及び/または付属機能ベクターが、宿主細胞における効率的な組換えAAV(「rAAV」)ビリオン生成を支持することが可能である付属機能を提供する、導入するステップ、ならびに(4)rAAVビリオンを生成するために宿主細胞を培養するステップを概して含む。AAV発現ベクター、AAVヘルパー構築物、及びヘルパーウイルスまたは付属機能ベクター(複数可)は、標準トランスフェクト技術を使用して、同時にまたは連続的に、のいずれかで宿主細胞に導入され得る。
AAV発現ベクターは、少なくとも転写の方向で作動的に連結される成分、転写開始領域を含む制御要素、目的とするDNA、及び転写終端領域を提供するために、既知の技術を使用して構築される。制御要素は、哺乳類筋細胞において機能的になるように選択される。作動的に連結される成分を含有する生じた構築物は、機能的AAV ITR配列で結合される(5′及び3′)。
AAV ITR領域のヌクレオチド配列は既知である。例えば、AAV-2配列について、Kotin,R.M.(1994)Human Gene Therapy5:793-801;Fundamental Virology,2nd Edition,(B.N.Fields and D.M.Knipe,eds.)内のBerns,K.I."Parvoviridae and their Replication"を参照されたい。本発明のベクターにおいて使用されるAAV ITRは、野生型ヌクレオチド配列を有する必要がなく、例えばヌクレオチドの挿入、欠失、または置換によって変化させられ得る。さらに、AAV ITRは、AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-7等を含むがこれらに限定されないいくつかのAAV血清型のうちのいずれかに由来し得る。さらに、AAV発現ベクターにおいて選択されたヌクレオチド配列に隣接する5′及び3′ITRは、それらが意図されるように機能する、すなわち宿主細胞ゲノムまたはベクターからの目的とする配列の切除及び救出を可能にする、及びAAV Rep遺伝子産物が細胞内に存在する場合DNA分子の受容体細胞ゲノムへの統合を可能にする限り、同一である必要または同じAAV血清型または単離物に由来する必要がない。ITRは、Repタンパク質の適切な混合物の存在下で、ベクター配列の複製を可能にする。ITRは、AAV粒子を生成するための、ベクター配列のカプシドへの組み込みもまた可能にする。
rAAVビリオンを生成するために、AAV発現ベクターは、トランスフェクト等の既知の技術を使用して好適な宿主細胞に導入される。多数のトランスフェクト技術は概して当業者に既知である。例えばGraham et al.(1973)Virology,52:456、Sambrook et al.(1989)Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Laboratories,New York、Davis et al.(1986)Basic Methods in Molecular Biology,Elsevier、及びChu et al.(1981)Gene13:197を参照されたい。特に好適なトランスフェクト方法は、リン酸カルシウム共沈殿(Graham et al.(1973)Virol.52:456-467)、培養細胞への直接的微量注入(Capecchi,M.R.(1980)Cell22:479-488)、電気穿孔(Shigekawa et al.(1988)BioTechnigues6:742-751)、リポソーム媒介遺伝子移入(Mannino et al.(1988)BioTechniques6:682-690)、脂質媒介形質導入(Felgner et al.(1987)Proc.Natl.Acad.Sci.USA84:7413-7417)、及び高速微小投射物を使用する核酸送達(Klein et al.(1987)Nature327:70-73)を含む。
本開示の目的のために、rAAVビリオンの生成に好適な宿主細胞は、異種DNA分子の受容体として使用され得るまたは使用されている、微細物、酵母細胞、昆虫細胞、及び哺乳類細胞を含む。この用語は、トランスフェクトされた元来細胞の子孫を含む。したがって、rAAVビリオンを生成するための「宿主細胞」は、概して外来性DNA配列でトランスフェクトされた細胞を指す。安定的ヒト細胞株である293(例えば受託番号ATCC CRL1573下で米国培養細胞系統保存機関(American Type Culture Collection)を通して容易に入手可能)からの細胞は多くの実施形態で使用される。特に、ヒト細胞株293は、アデノウイルス5型DNA断片で形質転換されたヒト胎児性腎細胞株であり(Graham et al.(1977)J.Gen.Virol.36:59)、アデノウイルス性E1a及びE1b遺伝子(Aiello et al.(1979)Virology94:460)を発現する。293細胞株は、容易にトランスフェクトされ、rAAVビリオンを生成するための特に便利なプラットフォームを提供する。
2.AAVヘルパー機能
AAV ITRによって隣接されるヌクレオチド配列を複製及びカプシド形成してrAAVビリオンを生成するために、上記のAAV発現ベクターを含有する宿主細胞は、AAVヘルパー機能を提供することができるようにされなければならない。AAVヘルパー機能は、概して、順に、生産的AAV複製のためにトランスにおいて機能するAAV遺伝子産物を提供するために発現され得る、AAV由来コード配列である。AAVヘルパー機能は、本明細書において、AAV発現ベクターから欠けている必須AAV機能を補償するために使用される。したがって、AAVヘルパー機能は、主要なAAV ORF、すなわちrep及びcapコード領域、またはその機能的相同体のうちの1つまたは両方を含む。本開示の文脈では、cap機能は1つ以上の突然変異カプシドタンパク質を含み、少なくとも1つのカプシドタンパク質は上記のように少なくとも1つの突然変異を含む。
AAV ITRによって隣接されるヌクレオチド配列を複製及びカプシド形成してrAAVビリオンを生成するために、上記のAAV発現ベクターを含有する宿主細胞は、AAVヘルパー機能を提供することができるようにされなければならない。AAVヘルパー機能は、概して、順に、生産的AAV複製のためにトランスにおいて機能するAAV遺伝子産物を提供するために発現され得る、AAV由来コード配列である。AAVヘルパー機能は、本明細書において、AAV発現ベクターから欠けている必須AAV機能を補償するために使用される。したがって、AAVヘルパー機能は、主要なAAV ORF、すなわちrep及びcapコード領域、またはその機能的相同体のうちの1つまたは両方を含む。本開示の文脈では、cap機能は1つ以上の突然変異カプシドタンパク質を含み、少なくとも1つのカプシドタンパク質は上記のように少なくとも1つの突然変異を含む。
「AAV repコード領域」とは、複製タンパク質Rep78、Rep68、Rep52、及びRep40をコードするAAVゲノムの当業者に認識される領域を意味する。これらのRep発現産物は、DNA複製のAAV起源の認識、結合、及びニッキング、DNAヘリカーゼ活性、ならびにAAV(または他の異種)プロモーターからの転写の調節を含む、多くの機能を所有することが示されている。Rep発現産物は、AAVゲノムの複製のために集合的に必要とされる。AAV repコード領域の説明について、例えばMuzyczka,N.(1992)Current Topics in Microbiol.and Immunol.158:97-129、及びKotin,R.M.(1994)Human Gene Therapy5:793-801を参照されたい。AAV repコード領域の好適な相同体は、AAV-2DNA複製を媒介するとも既知である(Thomson et al.(1994)Virology204:304-311)、ヒトヘルペスウイルス6(HHV-6)rep遺伝子を含む。
AAV capタンパク質はVP1、VP2、及びVP3を含み、VP1、VP2、及びVP3のうちの少なくとも1つは、上記のように少なくとも1つの突然変異を含む。
AAVヘルパー機能は、AAV発現ベクターのトランスフェクトの前またはそれと同時のいずれかで、宿主細胞をAAVヘルパー構築物でトランスフェクトすることによって、宿主細胞に導入される。AAVヘルパー構築物は、したがって、生産的AAV感染に必須である、欠けているAAV機能を補償するために、AAV rep及び/またはcap遺伝子の少なくとも一時的な発現を提供するために使用される。AAVヘルパー構築物はAAV ITRを欠如し、自身を複製することもパッケージングすることもできない。これらの構築物は、プラスミド、ファージ、トランスポゾン、コスミド、ウイルス、またはビリオンの形態であり得る。Rep及びCap発現産物の両方をコードする、一般的に使用されるプラスミドpAAV/Ad及びpIM29+45等の、多数のAAVヘルパー構築物が説明されている。例えばSamulski et al.(1989)J.Virol.63:3822-3828、及びMcCarty et al.(1991)J.Virol.65:2936-2945を参照されたい。Rep及び/またはCap発現産物をコードする多数の他のベクターが説明されている。例えば米国特許第5,139,941号を参照されたい。
AAV発現ベクター及びAAVヘルパー構築物の両方は、1つ以上の任意の選択マーカーを含有するように構築され得る。好適なマーカーは、細胞が適切な選択的媒体において増殖されるとき、選択マーカーを含有する核酸構築物でトランスフェクトされた細胞への抗生物質耐性または感受性を与える、該細胞に色を与える、または該細胞の抗原特徴を変更する、遺伝子を含む。本開示の方法の実践において有用であるいくつかの選択マーカーには、ハイグロマイシンに耐性を与えることによって、哺乳類細胞における選択を可能にするハイグロマイシンB耐性遺伝子(アミノグリコシドホスホトランフェラーゼ(phosphotranferase)(APH)をコードする)、G418に耐性を与えることによって、哺乳類細胞における選択を可能にするネオマイシンホスホトランフェラーゼ(phosphotranferase)遺伝子(ネオマイシンホスホトランスフェラーゼをコードする)等が挙げられる。他の好適なマーカーは当業者に既知である。
3.AAV付属機能
rAAVビリオンを生成するために、宿主細胞(またはパッケージング細胞)は、非AAV由来機能または「付属機能」を提供することもできるようにされなければならない。付属機能は、AAVがその複製について依存性である、非AAV由来ウイルス及び/または細胞機能である。したがって、付属機能は、AAV遺伝子転写の活性化、段階特異的AAV mRNAスプライシング、AAV DNA複製、Cap発現産物の合成、及びAAVカプシド構築に関与するものを含む、AAV複製において必要とされる少なくともこれらの非AAVタンパク質及びRNAを含む。ウイルス系の付属機能は、既知のヘルパーウイルスのうちの任意のものに由来し得る。
rAAVビリオンを生成するために、宿主細胞(またはパッケージング細胞)は、非AAV由来機能または「付属機能」を提供することもできるようにされなければならない。付属機能は、AAVがその複製について依存性である、非AAV由来ウイルス及び/または細胞機能である。したがって、付属機能は、AAV遺伝子転写の活性化、段階特異的AAV mRNAスプライシング、AAV DNA複製、Cap発現産物の合成、及びAAVカプシド構築に関与するものを含む、AAV複製において必要とされる少なくともこれらの非AAVタンパク質及びRNAを含む。ウイルス系の付属機能は、既知のヘルパーウイルスのうちの任意のものに由来し得る。
特に、付属機能は、当業者に既知の方法を使用して、宿主細胞内に導入されてそこにおいて発現され得る。一般的に、付属機能は、宿主細胞の無関係のヘルパーウイルスでの感染により提供される。アデノウイルス、単純ヘルペスウイルス1型及び2型等のヘルペスウイルス、及びワクシニアウイルスを含む、多数の好適なヘルパーウイルスが既知である。任意の様々な既知の剤を使用して細胞同期化によって提供されるもの等の非ウイルス性付属機能もまた本明細書で役立ち得る。例えばBuller et al.(1981)J.Virol.40:241-247、McPherson et al.(1985)Virology147:217-222、Schlehofer et al.(1986)Virology152:110-117を参照されたい。
あるいは、付属機能は付属機能ベクターを使用して提供され得る。付属機能ベクターは、1つ以上の付属機能を提供するヌクレオチド配列を含む。付属機能ベクターは、宿主細胞における効率的なAAVビリオン生成を支持するために、好適な宿主細胞に導入され得る。付属機能ベクターは、プラスミド、ファージ、トランスポゾン、コスミド、または別のウイルスの形態であり得る。付属ベクターは、適切な制御要素及び酵素と関連付けられると、付属機能を提供するために宿主細胞において転写または発現され得る、1つ以上の直線化DNAまたはRNA断片の形態でもまたあり得る。
付属機能を提供する核酸配列は、アデノウイルス粒子のゲノムからのように、自然源から得られ得、または、当業者に既知の組換えまたは合成方法を使用して構築され得る。この点に関して、アデノウイルス由来の付属機能は、広範に研究されており、付属機能に関与する多数のアデノウイルス遺伝子が特定及び部分的に特徴付けられている。例えばCRC Handbook of Parvoviruses,vol.I(P.Tijssen,ed.)内のCarter,B.J.(1990)"Adeno-Associated Virus Helper Functions"、及びMuzyczka,N.(1992)Curr.Topics.Microbiol.and Immun.158:97-129を参照されたい。得に、早期アデノウイルス遺伝子領域E1a、E2a、E4、VAI RNA、及びおそらくE1bは、付属プロセスに関わると考えられる。Janik et al.(1981)Proc.Natl.Acad.Sci.USA78:1925-1929。ヘルペスウイルス由来の付属機能は説明されている。例えばYoung et al.(1979)Prog.Med.Virol.25:113を参照されたい。ワクシニアウイルス由来の付属機能もまた説明されている。例えば上記のCarter,B.J.(1990)、Schlehofer et al.(1986)Virology152:110-117を参照されたい。
宿主細胞のヘルパーウイルスでの感染または宿主細胞の付属機能ベクターでのトランスフェクトの結果として、AAV Rep及び/またはCapタンパク質を生成するために、AAVヘルパー構築物を転写活性化する、付属機能が発現される。Rep発現産物は、AAV発現ベクターから組換えDNA(目的とするDNA、例えば異種核酸を含む)を切除する。Repタンパク質はAAVゲノムを複製する役割もまた果たす。発現されたCapタンパク質はカプシドへと構築し、組換えAAVゲノムはカプシドにパッケージングされる。したがって、生産的AAV複製が結果として生じ、DNAはrAAVビリオンにパッケージングされる。
組換えAAV複製の後、rAAVビリオンは、CsCl勾配等の様々な従来の精製方法を使用して、宿主細胞から精製され得る。さらに、付属機能を発現するために感染が用いられる場合、既知の方法を使用して残留ヘルパーウイルスが不活性化され得る。例えば、アデノウイルスは、およそ60℃の温度まで例えば20分間以上加熱することによって不活性化され得る。AAVは極めて加熱安定性であり、一方でヘルパーアデノウイルスは熱不安定性であるため、この処置はヘルパーウイルスのみを有効に不活性化する。
結果として生じるrAAVビリオンは、遺伝子療法用途等におけるDNA送達、または遺伝子産物の哺乳類宿主への送達のための使用に準備が整う。
異種核酸の送達
本開示は、異種核酸を、標的細胞及び/または異種核酸を必要とする個体に送達する方法をさらに提供する。いくつかの実施形態では、異種核酸を必要とする個体は、以前にAAVに自然に曝露されたことがあり、結果として抗AAV抗体(すなわちAAV中和抗体)を内部に有するヒトである。例えば、肝臓、筋肉、及び網膜へのAAV遺伝子送達を含む臨床試験における陽性結果(全ての組織がこのビヒクルに対する中和抗体によって影響を受けた)に基づき、多くのかかる治療用途/疾患標的がある。
本開示は、異種核酸を、標的細胞及び/または異種核酸を必要とする個体に送達する方法をさらに提供する。いくつかの実施形態では、異種核酸を必要とする個体は、以前にAAVに自然に曝露されたことがあり、結果として抗AAV抗体(すなわちAAV中和抗体)を内部に有するヒトである。例えば、肝臓、筋肉、及び網膜へのAAV遺伝子送達を含む臨床試験における陽性結果(全ての組織がこのビヒクルに対する中和抗体によって影響を受けた)に基づき、多くのかかる治療用途/疾患標的がある。
主題の方法は概して(i)有効量の主題のrAAVビリオンを個体に投与すること、及び/または(ii)標的細胞を主題のビリオンに接触させることを含む。概して、rAAVビリオンは、インビボ(「直接的」)またはインビトロ(「間接的」)形質導入技術のいずれかを使用して対象に投与される。インビトロで(「間接的に」)形質導入される場合、所望の受容体細胞(すなわち「標的細胞」)は、個体から除去され得、rAAVビリオンで形質導入され得、個体に再導入され得る。あるいは、同系細胞または異種細胞が個体において不適切な免疫応答を生成し得ない場合、同系細胞または異種細胞を使用することができる。
形質導入された標的細胞の個体への送達及び導入の好適な方法は説明されている。例えば、細胞は、例えば適切な培地内で組換えAAVビリオンを細胞と組み合わせること、及び目的とするDNAを内部に有する細胞について、サザンブロット及び/もしくはPCR等の従来の技術を使用して、または選択マーカーを使用することによりスクリーニングすることによって、インビトロで形質導入され得る。形質導入された細胞は、その後、下記により完全に記載される医薬組成物へと製剤され得、該組成物は、筋肉内、静脈内、皮下、及び腹腔内注射によって等の、様々な技術によって対象へと導入され得る。
インビボ(すなわち「直接的」)送達については、rAAVビリオンは医薬組成物へと製剤され得、非経口投与され得る(例えば、筋肉内、皮下、腫瘍内、経皮、髄腔内、静脈内投与経路等を介して投与される)。
医薬組成物は、治療的に有効な量の目的とする遺伝子発現産物を生成するために十分な遺伝子物質、すなわち、問題になっている疾患状態の症状を低減または改良するために十分な量、または所望の便益を与えるのに十分な量を含み得る。医薬組成物は薬学的に許容される賦形剤もまた含有し得る。かかる賦形剤は、それ自身では組成物を受容する個体に有害な抗体の生成を引き起こさない任意の医薬剤を含み、これは過度の毒性を伴わずに投与され得る。薬学的に許容される賦形剤は、水、生理食塩水、グリセロール、及びエタノール等の液体を含むがこれらに限定されない。薬学的に許容される塩、例えば、塩酸塩、臭化水素酸塩、リン酸塩、硫酸塩等のような鉱酸塩、及び酢酸塩、プロピオン酸塩、マロン酸塩、安息香酸塩等のような有機酸の塩がそこに含まれ得る。さらに、湿潤剤または乳化剤、pH緩衝物質等のような補助物質がかかるビヒクル内に存在し得る。幅広い種類の薬学的に許容される賦形剤が当業者に既知であり、本明細書で詳細に取り上げる必要はない。薬学的に許容される賦形剤は、例えば、A.Gennaro(2000)"Remington:The Science and Practice of Pharmacy,"20th edition,Lippincott,Williams,&Wilkins、Pharmaceutical Dosage Forms and Drug Delivery Systems(1999)H.C.Ansel et al.,eds.,7thed.,Lippincott,Williams,&Wilkins、及びHandbook of Pharmaceutical Excipients(2000)A.H.Kibbe et al.,eds.,3rded.Amer.Pharmaceutical Assoc.を含む様々な刊行物において詳細に説明されている。
適切な投与量は、他の要因の中でもとりわけ、治療されている哺乳類(例えばヒトもしくは非ヒト霊長類、または他の哺乳類)、治療される個体の年齢及び全身状態、治療されている状態の重症度、問題になっている具体的な治療タンパク質、その投与の様態に依存し得る。適切な有効量は、当業者によって容易に決定され得る。
したがって「治療的に有効な量」は、臨床試験によって決定され得る相対的に広い範囲に収まるだろう。例えば、インビボ注射、すなわち骨格筋または心筋への直接的な注射については、治療的に有効な用量は、約106~約1015のrAAVビリオン、例えば約108~1012のrAAVビリオンに類似するだろう。インビトロ形質導入については、細胞に送達されるrAAVビリオンの有効量は、約108~約1013のrAAVビリオンに類似するだろう。他の有効な用量は、用量応答曲線を確立するルーチン試験を通して、当業者によって容易に確立され得る。
用量治療は、単回用量スケジュールまたは複数回用量スケジュールであり得る。さらに、対象は、適切な限り多くの用量を投与され得る。当業者は、用量の適切な回数を容易に決定し得る。
目的とする細胞(すなわち「標的細胞」)は、典型的に哺乳類であり、この用語は、ヒト、飼育及び家畜動物、ならびに動物園、実験室、競技、またはペット動物を含む、イヌ、ウマ、ネコ、ウシ、マウス、ラット、ウサギ等の、哺乳類として分類される任意の動物を指す。いくつかの実施形態では、標的細胞はヒト細胞である。
目的とする標的細胞は、主題のrAAVビリオンによる感染を受けやすい任意の細胞を含む。いくつかの場合では、例えば方法が異種核酸を標的細胞に送達する方法である場合、標的細胞は個体から除去された細胞(例えば「一次」細胞)であり得、または標的細胞は組織培養細胞(例えば確立された細胞株から)であり得る。
例示的な標的細胞は、肝臓細胞、膵臓細胞(例えば島細胞:アルファ細胞、ベータ細胞、デルタ細胞、ガンマ細胞、及び/またはエプシロン細胞)、骨格筋細胞、心筋細胞、線維芽細胞、網膜細胞、滑膜関節細胞、肺細胞、T細胞、ニューロン、グリア細胞、幹細胞、造血前駆細胞、神経前駆細胞、内皮細胞、及び癌細胞を含むがこれらに限定されない。例示的な幹細胞の標的細胞は、造血幹細胞、神経幹細胞、神経堤幹細胞、胚幹細胞、誘導多能性幹細胞(iPS細胞)、間葉幹細胞、中胚葉幹細胞、肝臓幹細胞、膵臓幹細胞、筋幹細胞、及び網膜幹細胞を含むがこれらに限定されない。
「幹細胞」という用語は、本明細書で、自己再生及び分化子孫を生成の両方の能力を有する哺乳類細胞を指すために使用される(例えばMorrison et al.(1997)Cell88:287-298を参照)。概して幹細胞は、以下の特徴:分裂後の2つの娘細胞が異なる表現型を有し得る場合、非同時性または対称性複製を受ける能力;広範な自己再生能力;有糸分裂的無活動形態における存在の能力;及びそれらが存在する組織全てのクローン再生、例えば造血幹細胞が全ての造血系列を再構成する能力、のうちの1つ以上も有する。当業者によって理解されるように、「前駆細胞」は、それらが典型的に広範な自己再生能力を有せず、それらが由来する組織において系列のより限定されたサブセット、例えばリンパ球のみを、または造血環境では赤血球系統を、生成することができるという点で幹細胞とは異なる。本明細書で使用される場合「幹細胞」という用語は、上記に定義される「幹細胞」及び「前駆細胞」の両方を包含する。
幹細胞は、抗体によって特定される特異的エピトープに関連するマーカーの存在、及び特異的抗体の結合の欠如によって特定されるある特定のマーカーの不在の両方を特徴とし得る。幹細胞は、インビトロ及びインビボの両方での機能的アッセイ、特に複数の分化子孫を起こす幹細胞の能力に関連するアッセイによっても特定され得る。
目的とする好適な幹細胞は、造血幹細胞及びそれに由来する前駆細胞(米国特許第5,061,620号);神経堤幹細胞(Morrison et al.(1999)Cell96:737-749を参照);神経幹細胞及び神経前駆細胞;胚幹細胞;間葉幹細胞;中胚葉幹細胞;肝臓幹細胞、筋幹細胞、網膜幹細胞、誘導多能性幹細胞(iPS細胞)等を含むがこれらに限定されない。他の目的とする造血「前駆」細胞は、リンパ系統に特化した細胞、例えば未熟T細胞及びB細胞集団を含む。
幹細胞または前駆細胞の精製集団が使用され得る。例えば、ヒト造血幹細胞は、CD34、thy-1に特異的な抗体を使用して陽性選択され得、またはグリコホリンA、CD3、CD24、CD16、CD14、CD38、CD45RA、CD36、CD2、CD19、CD56、CD66a、及びCD66bを含み得る系統特異性マーカー、T細胞特異性マーカー、腫瘍/癌特異性マーカー等を使用して陰性選択され得る。中胚葉幹細胞の分離に有用なマーカーには、FcγRII、FcγRIII、Thy-1、CD44、VLA-4α、LFA-1β、HSA、ICAM-1、CD45、Aa4.1、Sca-1等が挙げられる。神経堤幹細胞は、低親和性神経成長因子受容体(LNGFR)に特異的な抗体で陽性選択され得、かつマーカースルファチド、グリア線維酸性タンパク質(GFAP)、ミエリンタンパク質Po、ペリフェリン、及び神経フィラメントについて陰性選択され得る。ヒト間葉幹細胞は、マーカーSH2、SH3、及びSH4を使用して正に分離され得る。
用いられる標的細胞は、新鮮であっても、凍結していても、あるいは事前培養に供されたものであってもよい。これらは胎児、新生児、成体であってもよい。造血細胞は、胎児性肝臓、骨髄、血液、特にG-CSFまたはGM-CSF動員末梢血液、または任意の他の従来の源から得られてもよい。幹細胞が造血または他の系統の他の細胞から分離される様式は、本開示には重要ではない。上記のように、幹細胞または前駆細胞の実質的に均一な集団は、幹細胞に関連するエピトープ特徴を示しながら分化細胞と関連するマーカーを有しない細胞の選択性単離によって得られてもよい。
個体に送達され得る核酸は、上記に定義される異種核酸のいずれかを含む。主題の方法を使用して送達され得るタンパク質は、前述のタンパク質のいずれかの機能的断片及び前述のタンパク質のいずれかの機能的変異体も含む。
いくつかの実施形態では、治療的に有効な量のタンパク質は、哺乳類宿主内で生成される。治療的に有効な量の特定のタンパク質が、主題の方法を使用して哺乳類宿主内で生成されるかどうかは、特定のタンパク質に適切なアッセイを使用して容易に決定される。例えば、タンパク質がEPOの場合、ヘマトクリットが測定される。
rAAVが抗原タンパク質をコードする場合、主題の方法を使用して個体に送達され得る好適な抗原タンパク質は、腫瘍/癌関連抗原、自己抗原(「自己(self)」抗原)、ウイルス性抗原、細菌性抗原、原虫性抗原、及びアレルゲン、ならびにそれらの抗原断片を含むがこれらに限定されない。いくつかの実施形態では、rAAVコード抗原タンパク質への細胞傷害性Tリンパ球(CTL)応答が哺乳類宿主において引き起こされるだろう。他の実施形態では、抗原タンパク質に特異的な抗体が生成されるように、rAAVコード抗原タンパク質への体液性応答が哺乳類宿主において引き起こされるだろう。多くの実施形態では、rAAVコード抗原タンパク質へのTH1免疫応答が、哺乳類宿主において引き起こされるだろう。抗原タンパク質への免疫応答が生成されたかどうかは、十分に確立された方法を使用して容易に決定される。例えば、酵素結合免疫吸着アッセイは、抗原タンパク質への抗体が生成されたかどうかを決定するために使用され得る。抗原特異性CTLを検出する方法は当業者に公知である。例えば、細胞の表面に抗原タンパク質を発現する、検出可能に標識された標的細胞は、血液試料内の抗原特異性CTLの存在についてアッセイするために使用される。
治療的に有効な量の異種核酸(例えばポリペプチドをコードする核酸、RNAi剤等)が、主題の方法を使用して哺乳類宿主に送達されたかどうかは、任意の適切なアッセイを使用して容易に決定される。例えば、遺伝子産物がHIVを抑制するRNAi剤である場合、ウイルス負荷が測定され得る。
改変rAAVビリオンを生成及び特定する方法
本開示は、スターターAAVカプシドタンパク質と比較して少なくとも1つのアミノ酸置換(欠失、挿入等を含む)を有するアミノ酸配列を含む変異体カプシドタンパク質を含む、改変感染性組換えアデノ随伴ウイルス(rAAV)ビリオンを生成及び特定する方法を提供する。スターターAAVカプシドタンパク質は、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む。
本開示は、スターターAAVカプシドタンパク質と比較して少なくとも1つのアミノ酸置換(欠失、挿入等を含む)を有するアミノ酸配列を含む変異体カプシドタンパク質を含む、改変感染性組換えアデノ随伴ウイルス(rAAV)ビリオンを生成及び特定する方法を提供する。スターターAAVカプシドタンパク質は、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む。
本方法は、概して、突然変異rAAVビリオンライブラリを生成すること、及びスターターrAAVビリオンと比べて変化した特性を有する改変rAAVビリオンのためにライブラリを選択することを含む。スターターrAAVビリオンは、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む変異体AAVカプシドタンパク質を含む。本開示は、ライブラリ及びライブラリを含む組成物をさらに提供する。
いくつかの実施形態では、所与の選択ステップは、変化したビリオン特性のための主題のAAVライブラリを濃縮するために、2、3、4回以上反復される。いくつかの実施形態では、AAVライブラリの選択の後、個々のクローンは単離及び配列決定される。
突然変異体AAVライブラリの生成
スターターAAV cap遺伝子と比べて1つ以上の突然変異体を含む突然変異体AAVライブラリが生成される。スターターcap遺伝子は、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含むcapである。rAAV cap遺伝子における突然変異体は、任意の既知の方法を使用して生成される。スターターAAV cap遺伝子の突然変異誘発のための好適な方法は、ポリメラーゼ連鎖反応(PCR)系方法、オリゴヌクレオチド特異性突然変異誘発、飽和突然変異誘発、ループスワップ突然変異誘発、断片シャフリング突然変異誘発(すなわちDNAシャッフリング)等を含むがこれらに限定されない。突然変異を生成するための方法は、当業者において十分に説明される。例えばZhao et al.Nat Biotechnol.1998 Mar;16(3):234-5、Koerber et.al.,Mol Ther.2008 Oct、16(10):1703-9、Koerber et.al.,Mol Ther.2009 Dec;17(12):2088-95、米国特許第6,579,678号、米国特許第6,573,098号、及び米国特許第6,582,914号を参照されたく、該文献の全ては、突然変異誘発に関するそれらの教示について、ここで参照により組み込まれる。
スターターAAV cap遺伝子と比べて1つ以上の突然変異体を含む突然変異体AAVライブラリが生成される。スターターcap遺伝子は、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含むcapである。rAAV cap遺伝子における突然変異体は、任意の既知の方法を使用して生成される。スターターAAV cap遺伝子の突然変異誘発のための好適な方法は、ポリメラーゼ連鎖反応(PCR)系方法、オリゴヌクレオチド特異性突然変異誘発、飽和突然変異誘発、ループスワップ突然変異誘発、断片シャフリング突然変異誘発(すなわちDNAシャッフリング)等を含むがこれらに限定されない。突然変異を生成するための方法は、当業者において十分に説明される。例えばZhao et al.Nat Biotechnol.1998 Mar;16(3):234-5、Koerber et.al.,Mol Ther.2008 Oct、16(10):1703-9、Koerber et.al.,Mol Ther.2009 Dec;17(12):2088-95、米国特許第6,579,678号、米国特許第6,573,098号、及び米国特許第6,582,914号を参照されたく、該文献の全ては、突然変異誘発に関するそれらの教示について、ここで参照により組み込まれる。
いくつかの実施形態では、cap遺伝子における突然変異を含む突然変異体AAVライブラリは、付着伸長プロセスを使用して生成され得る。付着伸長プロセスは、PCR系の方法を使用するcap遺伝子の増幅を含む。鋳型cap遺伝子は、特異的なPCRプライマーを使用して予備刺激され、変性と非常に短いアニーリング/ポリメラーゼ触媒伸長との反復される周期が続く。それぞれの周期では、成長する断片が配列相補性に基づき異なる鋳型にアニーリングし、さらに伸長する。変性、アニーリング、及び伸長の周期は、全長配列が形成するまで反復される。結果として生じる全長配列は、野生型AAV cap遺伝子と比較して、cap遺伝子において少なくとも1つの突然変異を含む。
1つ以上の突然変異を含むAAV cap配列を含むPCR産物は、野生型AAVゲノムを含有するプラスミドに挿入される。結果として生じるのは、AAV cap突然変異体のライブラリである。したがって本開示は、約10~約1010メンバーを含み、かつAAV cap遺伝子における突然変異を含む、突然変異体AAV cap遺伝子ライブラリを提供する。ライブラリの所与のメンバーは、AAV cap遺伝子において約1~約50の突然変異を有する。主題のライブラリは、10~約109の明確に異なるメンバーを含み、それぞれはAAV cap遺伝子における異なる突然変異(複数可)を有する。
cap突然変異ライブラリが生成されると、その後変化したカプシド特性に基づいて選択され得るウイルス粒子が生成される。ライブラリプラスミドDNAは、好適な宿主細胞(例えば293細胞)中にトランスフェクトされ、その後ヘルパーウイルスの細胞への導入が続く。トランスフェクトされた宿主細胞によって生成されるウイルス粒子(rAAVライブラリ粒子)が採取される。
ライブラリ選択
ライブラリが生成されると、それは、具体的なビリオン特性(すなわち変化した感染特性)について選択される。ウイルス粒子は上記のように生成され(よって改変rAAVビリオンのライブラリを生成する)、変化した感染特性(配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む変異体カプシドタンパク質を含む感染性rAAVビリオンと比べて)を有する改変rAAVビリオンを特定するための1つ以上の選択ステップを経る。そのために選択される感染の特性は、1)AAV中和抗体への変化した結合(例えば低減した結合)、2)AAV中和抗体の上昇した回避、3)AAVでの感染に耐性である細胞の上昇した感染性、及び4)変化したヘパリン結合を含み得るがこれらに限定されない。
ライブラリが生成されると、それは、具体的なビリオン特性(すなわち変化した感染特性)について選択される。ウイルス粒子は上記のように生成され(よって改変rAAVビリオンのライブラリを生成する)、変化した感染特性(配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む変異体カプシドタンパク質を含む感染性rAAVビリオンと比べて)を有する改変rAAVビリオンを特定するための1つ以上の選択ステップを経る。そのために選択される感染の特性は、1)AAV中和抗体への変化した結合(例えば低減した結合)、2)AAV中和抗体の上昇した回避、3)AAVでの感染に耐性である細胞の上昇した感染性、及び4)変化したヘパリン結合を含み得るがこれらに限定されない。
1.AAV中和抗体への低減した結合についての選択
いくつかの実施形態では、主題のAAVライブラリは、中和抗体の野生型AAVビリオンへの結合及び野生型AAVビリオンの中和と比較して(または配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む変異体カプシドタンパク質を含む感染性rAAVビリオンと比べて)、野生型AAVビリオンに結合してそれを中和する中和抗体への変化した(例えば低減した)結合について選択される。AAVライブラリ粒子(AAVライブラリビリオン)を中和抗体に接触させ、AAVライブラリ粒子が許容状態の宿主細胞を感染させる能力が試験される。典型的に、AAVライブラリ粒子は様々な濃度の中和抗体に接触させられる。AAVライブラリ粒子の感染性を低減するために必要とされる中和抗体の濃度がより高いほど、AAV粒子は中和に対してより耐性である。AAVライブラリビリオンの、中和する抗AAV抗体への結合を直接的に測定する(例えば結合親和性を測定する)ために当業者に既知の任意の便利なアッセイが使用され得る。
いくつかの実施形態では、主題のAAVライブラリは、中和抗体の野生型AAVビリオンへの結合及び野生型AAVビリオンの中和と比較して(または配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む変異体カプシドタンパク質を含む感染性rAAVビリオンと比べて)、野生型AAVビリオンに結合してそれを中和する中和抗体への変化した(例えば低減した)結合について選択される。AAVライブラリ粒子(AAVライブラリビリオン)を中和抗体に接触させ、AAVライブラリ粒子が許容状態の宿主細胞を感染させる能力が試験される。典型的に、AAVライブラリ粒子は様々な濃度の中和抗体に接触させられる。AAVライブラリ粒子の感染性を低減するために必要とされる中和抗体の濃度がより高いほど、AAV粒子は中和に対してより耐性である。AAVライブラリビリオンの、中和する抗AAV抗体への結合を直接的に測定する(例えば結合親和性を測定する)ために当業者に既知の任意の便利なアッセイが使用され得る。
2.AAV中和抗体からの上昇した回避についての選択
いくつかの実施形態では、主題のAAVライブラリは、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む変異体カプシドタンパク質を含む感染性rAAVビリオンと比べて上昇した、中和抗体からの回避(すなわち、上昇したヒト中和AAV抗体への耐性)について選択される。AAVライブラリ粒子は、中和AAV抗体(たいていヒト中和抗AAV抗体)の存在下で標的細胞に接触させられる。AAVライブラリ粒子を有する細胞の感染を可能にするための好適な長さの時間の後、ヘルパーウイルスを加え、細胞(複数可)を感染させることに成功したAAVライブラリ粒子を回収する。いくつかの実施形態では、感染性は感染の成功を示すビリオンについて測定される(例えば上記のように)。いくつかの実施形態では、感染の周期、ヘルパーウイルスの添加、及びAAV粒子の回収は、1、2、3回以上反復される。選択は、様々な程度の回避について選択するために、様々な量(濃度)の中和AAV抗体を用いて生じ得る(例えば、それぞれの反復される回は、その前の回と比べて上昇した濃度の抗体を利用し得る)。
いくつかの実施形態では、主題のAAVライブラリは、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む変異体カプシドタンパク質を含む感染性rAAVビリオンと比べて上昇した、中和抗体からの回避(すなわち、上昇したヒト中和AAV抗体への耐性)について選択される。AAVライブラリ粒子は、中和AAV抗体(たいていヒト中和抗AAV抗体)の存在下で標的細胞に接触させられる。AAVライブラリ粒子を有する細胞の感染を可能にするための好適な長さの時間の後、ヘルパーウイルスを加え、細胞(複数可)を感染させることに成功したAAVライブラリ粒子を回収する。いくつかの実施形態では、感染性は感染の成功を示すビリオンについて測定される(例えば上記のように)。いくつかの実施形態では、感染の周期、ヘルパーウイルスの添加、及びAAV粒子の回収は、1、2、3回以上反復される。選択は、様々な程度の回避について選択するために、様々な量(濃度)の中和AAV抗体を用いて生じ得る(例えば、それぞれの反復される回は、その前の回と比べて上昇した濃度の抗体を利用し得る)。
3.非許容細胞の上昇した感染性についての選択
いくつかの実施形態では、主題のAAVライブラリは、非許容細胞の上昇した感染性(配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む変異体カプシドタンパク質を含む感染性rAAVビリオンと比べて)について選択される。AAVライブラリ粒子を非許容細胞(例えば非許容細胞の集合)に接触させる。AAVライブラリ粒子を有する細胞の感染を可能にするための好適な長さの時間の後、ヘルパーウイルスを加え、非許容細胞(複数可)を感染させることに成功したAAVライブラリ粒子を回収する。いくつかの実施形態では、感染の周期、ヘルパーウイルスの添加、及びAAV粒子の回収は、1、2、3回以上反復される。
いくつかの実施形態では、主題のAAVライブラリは、非許容細胞の上昇した感染性(配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む変異体カプシドタンパク質を含む感染性rAAVビリオンと比べて)について選択される。AAVライブラリ粒子を非許容細胞(例えば非許容細胞の集合)に接触させる。AAVライブラリ粒子を有する細胞の感染を可能にするための好適な長さの時間の後、ヘルパーウイルスを加え、非許容細胞(複数可)を感染させることに成功したAAVライブラリ粒子を回収する。いくつかの実施形態では、感染の周期、ヘルパーウイルスの添加、及びAAV粒子の回収は、1、2、3回以上反復される。
4.変化したヘパリン結合についての選択
いくつかの実施形態では、主題のライブラリは、野生型AAVビリオンヘパリン結合と比べて(または配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む変異体カプシドタンパク質を含む感染性rAAVビリオンと比べて)上昇したヘパリン結合及び低減したヘパリン結合を含む、変化したヘパリン結合について選択される。AAVライブラリ粒子をヘパリン親和性マトリックスに接触させる。例えば、AAVライブラリ粒子は、AAVライブラリ粒子のヘパリンへの結合を許容する条件下で、ヘパリン親和性カラムに入れられる。例示的な条件は、pH7.5の0.15MのNaCl及び50mMのTrisを用いたカラムの平衡化を含む。AAVライブラリ粒子がヘパリン親和性マトリックスに結合することを可能にした後、AAVライブラリ粒子/ヘパリン親和性マトリックス複合体は、段階的に上昇する濃度のNaClを含有するある量の緩衝剤で洗浄し、それぞれのNaCl濃度で、溶離したAAVライブラリ粒子を採取する。例えば、結合の後、AAVライブラリ粒子/ヘパリン親和性マトリックス複合体は、200mMのNaClを含有する、pH7.5の、50mMの量のTris緩衝剤で洗浄し、溶離したAAVライブラリ粒子を採取する。溶離ステップは、約250mMのNaCl、約300mMのNaCl、約350mM、約400mMのNaCl、約450mMのNaCl、約500mMのNaCl、約550mMのNaCl、約600mMのNaCl、約650mMのNaCl、約700mMのNaCl、または約750mMのNaClを含有する、pH7.5の50mMのTris緩衝剤を用いて反復される。
いくつかの実施形態では、主題のライブラリは、野生型AAVビリオンヘパリン結合と比べて(または配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含む変異体カプシドタンパク質を含む感染性rAAVビリオンと比べて)上昇したヘパリン結合及び低減したヘパリン結合を含む、変化したヘパリン結合について選択される。AAVライブラリ粒子をヘパリン親和性マトリックスに接触させる。例えば、AAVライブラリ粒子は、AAVライブラリ粒子のヘパリンへの結合を許容する条件下で、ヘパリン親和性カラムに入れられる。例示的な条件は、pH7.5の0.15MのNaCl及び50mMのTrisを用いたカラムの平衡化を含む。AAVライブラリ粒子がヘパリン親和性マトリックスに結合することを可能にした後、AAVライブラリ粒子/ヘパリン親和性マトリックス複合体は、段階的に上昇する濃度のNaClを含有するある量の緩衝剤で洗浄し、それぞれのNaCl濃度で、溶離したAAVライブラリ粒子を採取する。例えば、結合の後、AAVライブラリ粒子/ヘパリン親和性マトリックス複合体は、200mMのNaClを含有する、pH7.5の、50mMの量のTris緩衝剤で洗浄し、溶離したAAVライブラリ粒子を採取する。溶離ステップは、約250mMのNaCl、約300mMのNaCl、約350mM、約400mMのNaCl、約450mMのNaCl、約500mMのNaCl、約550mMのNaCl、約600mMのNaCl、約650mMのNaCl、約700mMのNaCl、または約750mMのNaClを含有する、pH7.5の50mMのTris緩衝剤を用いて反復される。
約450mMのNaClよりも低いNaCl濃度で溶離するAAVライブラリ粒子は、野生型AAVと比べて低減したヘパリン結合特徴を示す。約550mMのNaClよりも高いNaCl濃度で溶離するAAVライブラリ粒子は、野生型AAVと比べて上昇したヘパリン結合特徴を示す。
いくつかの実施形態では、溶離したAAVライブラリ粒子は、許容細胞のヘルパーウイルスでの同時感染によって増幅され、ヘパリン親和性マトリックス上で再分画される。本ステップは、変化したヘパリン結合特徴を有するAAVライブラリ粒子を濃縮するために何回も反復され得る。
本方法では、1つ以上の選択ステップがAAVライブラリ粒子の生成に後続し得る。例えば、いくつかの実施形態では、方法は、上昇したヘパリン結合について選択すること、その後中和抗体への低減した結合について選択することを含む。他の実施形態では、方法は、中和抗体への低減した結合について選択すること、その後上昇したヘパリン結合について選択することを含む。他の実施形態では、方法は低減したヘパリン結合について選択すること、その後中和抗体への低減した結合について選択することを含む。他の実施形態では、方法は中和抗体への低減した結合について選択すること、その後低減したヘパリン結合について選択することを含む。他の実施形態では、方法は、中和抗体への低減した結合について選択すること、その後幹細胞の上昇した感染性について選択することを含む。他の実施形態では、方法は中和抗体への低減した結合について選択すること、その後中和抗体の上昇した回避について選択することを含む。他の実施形態では、方法は中和抗体の上昇した回避について選択すること、その後中和抗体への低減した結合について選択することを含む。
したがって、本開示は、それぞれの核酸が変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含む複数の核酸を含む、アデノ随伴ウイルス(AAV)ライブラリを提供する。コード変異体AAVカプシドタンパク質は配列番号10~13及び26~33のうちの1つに記載される配列と比べて少なくとも1つのアミノ酸置換を含む。本開示は、それぞれが配列番号10~13及び26~33のうちの1つに記載される配列と比べて少なくとも1つのアミノ酸置換を含むAAVカプシドタンパク質を含む複数のAAV粒子を含む、突然変異アデノ随伴ウイルス(AAV)粒子のライブラリを提供する。突然変異体AAVカプシドタンパク質をコードする核酸は、コード突然変異体AAVカプシドタンパク質の特徴と同様に上記に記載される。
本開示は、(i)それぞれが変異体アデノ随伴ウイルス(AAV)カプシドタンパク質及び異種核酸を含む2つ以上の感染性rAAVビリオン、(ii)それぞれが変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含む2つ以上の単離核酸、(iii)それぞれが変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含む核酸を含む2つ以上の宿主細胞、及び(iv)2つ以上の変異体AAVカプシドタンパク質のうちの少なくとも1つを含むライブラリをさらに提供し、ライブラリの少なくとも1つのメンバーの変異体AAVカプシドタンパク質は、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列と比べて少なくとも1つのアミノ酸置換を有するアミノ酸配列を含む。
組成物及びキット
本開示の方法における使用のための組成物及びキットもまた提供される。主題の組成物及びキットは、主題の感染性rAAVビリオン、主題のrAAVベクター、主題の変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含む主題のヌクレオチド酸、主題の核酸(すなわち、主題の変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含む核酸を含む、主題の遺伝子改変宿主細胞)を含む単離宿主細胞、主題のライブラリ(例えば上記のライブラリのいずれか)、及び主題の変異体AAVカプシドタンパク質のうちの少なくとも1つを含む。組成物またはキットは、上記のものの任意の便利な組み合わせを含み得る。組成物またはキットは、ヘルパーウイルス及び/またはヘルパーウイルスをコードするヌクレオチド配列を含む核酸もまた含み得る。キットは、改変変異体AAVカプシドタンパク質をコードする核酸(すなわち「突然変異体」核酸)の生成のための試薬もまた含み得る。
本開示の方法における使用のための組成物及びキットもまた提供される。主題の組成物及びキットは、主題の感染性rAAVビリオン、主題のrAAVベクター、主題の変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含む主題のヌクレオチド酸、主題の核酸(すなわち、主題の変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含む核酸を含む、主題の遺伝子改変宿主細胞)を含む単離宿主細胞、主題のライブラリ(例えば上記のライブラリのいずれか)、及び主題の変異体AAVカプシドタンパク質のうちの少なくとも1つを含む。組成物またはキットは、上記のものの任意の便利な組み合わせを含み得る。組成物またはキットは、ヘルパーウイルス及び/またはヘルパーウイルスをコードするヌクレオチド配列を含む核酸もまた含み得る。キットは、改変変異体AAVカプシドタンパク質をコードする核酸(すなわち「突然変異体」核酸)の生成のための試薬もまた含み得る。
上記の組成物に加え、主題のキットは(ある特定の実施形態では)、主題の方法を実践するための説明書をさらに含み得る。これらの説明書は、様々な形態で主題のキット内に存在し得、このうちの1つ以上がキット内に存在し得る。これらの説明書が存在し得る1つの形態は、キットの包装内の、包装挿入物内等の、好適な媒体または基材に印刷された情報、例えば情報が印刷された紙である。これらの説明書のさらに別の形態は、情報が記録されたコンピュータ可読媒体、例えば、フロッピーディスク、コンパクトディスク(CD)、フラッシュドライブ等である。これらの説明書の存在し得るさらに別の形態は、離れたサイトで情報にアクセスするためにインターネットを介して使用され得るウェブサイトアドレスである。
本発明はここで完全に記載されており、当業者には、本発明の趣旨または範囲から逸脱せずに様々な変更及び修正がなされ得るということが明白となるであろう。
以下の実施例は、当業者に、本発明を行う及び使用する方法の完全な開示及び説明を提供するために述べられ、発明人が彼らの発明として見なすものの範囲を限定することを意図されず、下記の実験が行われる全てのまたは唯一の実験であることを表すことも意図されない。使用される数(例えば、量、温度等)に関して正確性を確実にするよう努力がなされたが、いくつかの実験誤差及び偏差が把握されるべきである。別途示されない限り、部は重量部であり、分子量は重量平均分子量であり、温度は摂氏度であり、圧力は大気圧またはその付近である。標準短縮語、例えばbp、塩基対(複数可);kb、キロベース(複数可);ml、ミリリットル(複数可)、μl、マイクロリットル(複数可)、nl、ナノリットル(複数可)、pl、ピコリットル(複数可)、sまたはsec、秒(複数可)、min、分(複数可)、hまたはhr、時間(複数可)、aa、アミノ酸(複数可)、kb、キロベース(複数可)、bp、塩基対(複数可)、nt、ヌクレオチド(複数可)、i.m.、筋肉内(に)、i.p.、腹腔内(に)、s.c.、皮下(に)、i.v.、静脈内(に)等が使用され得る。
実施例1:
アデノ随伴ウイルス(AAV)遺伝子療法ベクターは、今日までのいくつかの臨床試験において相当な有望性を実証している。しかしながら、幼少期の曝露またはAAVベクターの以前の投与から生じる、循環する抗AAV抗体が、多くの潜在的患者のためのAAV遺伝子療法の実施を妨げてきた。本発明者らは、インビトロ及びインビボの両方で増強した抗AAV抗体回避が可能である新規AAV変異体を単離した。低及び高効力ヒト血清プールならびにヒトIVIGを使用する選択から生じるストリンジェントな圧力は、個々のヒト血清、ヒトIVIG、及びマウス血清由来の抗体中和からの回避が可能であるAAV変異体を進化させ、これは現在までで最も広範に回避的な変異体である。
アデノ随伴ウイルス(AAV)遺伝子療法ベクターは、今日までのいくつかの臨床試験において相当な有望性を実証している。しかしながら、幼少期の曝露またはAAVベクターの以前の投与から生じる、循環する抗AAV抗体が、多くの潜在的患者のためのAAV遺伝子療法の実施を妨げてきた。本発明者らは、インビトロ及びインビボの両方で増強した抗AAV抗体回避が可能である新規AAV変異体を単離した。低及び高効力ヒト血清プールならびにヒトIVIGを使用する選択から生じるストリンジェントな圧力は、個々のヒト血清、ヒトIVIG、及びマウス血清由来の抗体中和からの回避が可能であるAAV変異体を進化させ、これは現在までで最も広範に回避的な変異体である。
材料及び方法
細胞株
細胞株は37℃で5%のCO2で培養し、別途示されない限り、米国培養細胞系統保存機関(American Type Culture Collection)(バージニア州マナサス)から得た。HEK293T、HeLa、及びHT1080細胞を、10%ウシ胎仔血清(カリフォルニア州カールスバッド、Gibco)及び1%ペニシリン/ストレプトマイシン(カリフォルニア州カールスバッド、Invitrogen)を補充した、ダルベッコ改変イーグル培地で培養した。CHO K1及びCHO pgsA細胞を、10%ウシ胎仔血清(Gibco)及び1%ペニシリン/ストレプトマイシン(Invitrogen)を補充したF-12K培地(ATCC)で培養した。Pro5及びLec1細胞を、10%ウシ胎仔血清(Gibco)及び1%ペニシリン/ストレプトマイシン(Invitrogen)を補充したMEM-アルファ培地(Gibco)で培養した。
細胞株
細胞株は37℃で5%のCO2で培養し、別途示されない限り、米国培養細胞系統保存機関(American Type Culture Collection)(バージニア州マナサス)から得た。HEK293T、HeLa、及びHT1080細胞を、10%ウシ胎仔血清(カリフォルニア州カールスバッド、Gibco)及び1%ペニシリン/ストレプトマイシン(カリフォルニア州カールスバッド、Invitrogen)を補充した、ダルベッコ改変イーグル培地で培養した。CHO K1及びCHO pgsA細胞を、10%ウシ胎仔血清(Gibco)及び1%ペニシリン/ストレプトマイシン(Invitrogen)を補充したF-12K培地(ATCC)で培養した。Pro5及びLec1細胞を、10%ウシ胎仔血清(Gibco)及び1%ペニシリン/ストレプトマイシン(Invitrogen)を補充したMEM-アルファ培地(Gibco)で培養した。
選択のためのヒト血清プール
18の個々のヒト血清試料をInnovative Research,Inc.(ミシガン州サウスフィールド)から得、野生型AAV2についての中和抗体価をそれぞれの試料について決定した(表2)。個々の試料は、抗体の親和性及びエピトープ特異性の両方において変動を有する可能性が高いため、個々の血清試料の同等量を混合することによって、3つの有効な血清プール(α=A+F+G、β=B+H+M、及びγ=I+J+N)を生成した。抗体のこれらの変動の存在下での選択は、多くの既存のヒト抗体への耐性の一般的増強をもたらすはずである。さらにより広い範囲の抗体への耐性について選択するために、後の選択をGamimune N、10%ヒトIVIG(インディアナ州エルクハート、Bayer)の存在下で行った。
18の個々のヒト血清試料をInnovative Research,Inc.(ミシガン州サウスフィールド)から得、野生型AAV2についての中和抗体価をそれぞれの試料について決定した(表2)。個々の試料は、抗体の親和性及びエピトープ特異性の両方において変動を有する可能性が高いため、個々の血清試料の同等量を混合することによって、3つの有効な血清プール(α=A+F+G、β=B+H+M、及びγ=I+J+N)を生成した。抗体のこれらの変動の存在下での選択は、多くの既存のヒト抗体への耐性の一般的増強をもたらすはずである。さらにより広い範囲の抗体への耐性について選択するために、後の選択をGamimune N、10%ヒトIVIG(インディアナ州エルクハート、Bayer)の存在下で行った。
表2:個々のヒト血清試料の中和抗体価
それぞれの試料についての中和抗体(NAb)力価は、血清の不在下で測定される値の37%まで感染性を低減するのに必要な血清の体積分率の逆数として報告する。その後、3つの血清プール(α=A+F+G、β=B+H+M、及びγ=I+J+N)を3つの個々の血清試料の同等の量を混合することによって生成した。
(表2)
それぞれの試料についての中和抗体(NAb)力価は、血清の不在下で測定される値の37%まで感染性を低減するのに必要な血清の体積分率の逆数として報告する。その後、3つの血清プール(α=A+F+G、β=B+H+M、及びγ=I+J+N)を3つの個々の血清試料の同等の量を混合することによって生成した。
(表2)
ライブラリ生成及びウイルス産生
飽和突然変異誘発ライブラリを作製するために、エラープローンPCRによって、その後
をそれぞれ順方向プライマー及び逆方向プライマーとして使用するZhao et al.に記載される付着伸長プロセスによって、AAV2 capライブラリを生成した。プールした個体のヒト血清を使用する選択は、飽和突然変異誘発ライブラリのための基礎としての役割を果たした4つの点突然変異を含有する変異体(結果欄に記載)を明らかにした。この変異体のためのcap遺伝子は、特異的な部位のアミノ酸を変更することによって、さらなる突然変異誘発を受けた。プライマー
及び対応する逆方向相補体プライマーを、R471アミノ酸部位に突然変異を起こさせるために使用した。プライマー
及び対応する逆方向相補体プライマーを、K532及びE548アミノ酸部位に突然変異を起こさせるために使用した。プライマー
及び対応する逆方向相補体プライマーを、N587アミノ酸部位に突然変異を起こさせるために使用した。プライマー
及び対応する逆方向相補体プライマーを、V708及びT716アミノ酸部位に突然変異を起こさせるために使用した。無作為化capループ領域を含有するAAV2から成るライブラリ、及び野生型AAV1、AAV2、AAV4、AAV5、AAV6、AAV8、AAV9 cap遺伝子からのシャッフルDNAを含有するライブラリは、初期選択ステップのためにパッケージングされ、プールされた。(Koerber et.al.;Mol Ther.2008 Oct;16(10):1703-9、及びKoerber et.al.;Mol Ther.2009 Dec;17(12):2088-95、該文献の両方はここで参照によりその全体が組み込まれる)。
飽和突然変異誘発ライブラリを作製するために、エラープローンPCRによって、その後
をそれぞれ順方向プライマー及び逆方向プライマーとして使用するZhao et al.に記載される付着伸長プロセスによって、AAV2 capライブラリを生成した。プールした個体のヒト血清を使用する選択は、飽和突然変異誘発ライブラリのための基礎としての役割を果たした4つの点突然変異を含有する変異体(結果欄に記載)を明らかにした。この変異体のためのcap遺伝子は、特異的な部位のアミノ酸を変更することによって、さらなる突然変異誘発を受けた。プライマー
及び対応する逆方向相補体プライマーを、R471アミノ酸部位に突然変異を起こさせるために使用した。プライマー
及び対応する逆方向相補体プライマーを、K532及びE548アミノ酸部位に突然変異を起こさせるために使用した。プライマー
及び対応する逆方向相補体プライマーを、N587アミノ酸部位に突然変異を起こさせるために使用した。プライマー
及び対応する逆方向相補体プライマーを、V708及びT716アミノ酸部位に突然変異を起こさせるために使用した。無作為化capループ領域を含有するAAV2から成るライブラリ、及び野生型AAV1、AAV2、AAV4、AAV5、AAV6、AAV8、AAV9 cap遺伝子からのシャッフルDNAを含有するライブラリは、初期選択ステップのためにパッケージングされ、プールされた。(Koerber et.al.;Mol Ther.2008 Oct;16(10):1703-9、及びKoerber et.al.;Mol Ther.2009 Dec;17(12):2088-95、該文献の両方はここで参照によりその全体が組み込まれる)。
進化の第2及び第3の回については、ループスワップ/シャッフルライブラリ及び飽和突然変異誘発ライブラリからのcap遺伝子を、前述のように、
をそれぞれ順方向プライマー及び逆方向プライマーとして使用するエラープローンPCRに供することで、無作為の突然変異誘発ライブラリが生成された。複製可能なAAVライブラリ及びCMVプロモーターの制御下でGFPを発現する組換えAAVベクターは、リン酸カルシウムトランスフェクト方法を使用しHEK293T細胞(ATCC)を使用してパッケージングされ、ウイルスはイオジキソナール(iodixonal)勾配遠心分離によって精製された。インビボでの使用のための、CMVプロモーターの制御下でGFPまたはルシフェラーゼを発現する組換えAAVベクターは、Amicon濾過によってさらに精製された。DNase耐性ゲノム力価は、定量PCRによって決定された(Excoffon et.al,Proc Natl Acad Sci U S A.2009 Mar10;106(10):3865-70、及びMaheshri et al.,Nat Biotechnol.2006 Feb;24(2):198-204、該文献の両方はここで参照によりその全体が組み込まれる。)
をそれぞれ順方向プライマー及び逆方向プライマーとして使用するエラープローンPCRに供することで、無作為の突然変異誘発ライブラリが生成された。複製可能なAAVライブラリ及びCMVプロモーターの制御下でGFPを発現する組換えAAVベクターは、リン酸カルシウムトランスフェクト方法を使用しHEK293T細胞(ATCC)を使用してパッケージングされ、ウイルスはイオジキソナール(iodixonal)勾配遠心分離によって精製された。インビボでの使用のための、CMVプロモーターの制御下でGFPまたはルシフェラーゼを発現する組換えAAVベクターは、Amicon濾過によってさらに精製された。DNase耐性ゲノム力価は、定量PCRによって決定された(Excoffon et.al,Proc Natl Acad Sci U S A.2009 Mar10;106(10):3865-70、及びMaheshri et al.,Nat Biotechnol.2006 Feb;24(2):198-204、該文献の両方はここで参照によりその全体が組み込まれる。)
ライブラリ選択及び進化
1回の選択は、AAV開始ライブラリを使用するHEK293T細胞感染として定義され(プールされた個々のヒト血清については室温で30分間、または感染の前に加熱不活性化したIVIGと共に37℃で1時間インキュベートし)、その後アデノウイルス救出及び成功した変異体の回収が続く。各回の進化は、開始ライブラリを作製するためのcap遺伝子の突然変異誘発及び3回の選択から成る。3回の進化を各ライブラリで行い、このうちクローン分析を各回の進化の間に行なった。各回の進化のための開始ライブラリは、上記のように生成された。3回目の選択の後、AAV cap遺伝子は、成功したAAV変異体のプールから単離され、PCRによって増幅された。cap遺伝子は、NotI及びHindIIIを使用してpXX2組換えAAVパッケージングプラスミドに挿入された。cap遺伝子は、その後カリフォルニア大学Berkeley校のDNA配列決定施設で配列決定され、Geneiousソフトウェア(ニュージーランドオークランド、Biomatters)を使用して分析された。AAV2カプシド(Protein Databank受託番号1LP3)の3次元モデルが、Pymol(カリフォルニア州サンカルロス、DeLano Scientific)において表された。
1回の選択は、AAV開始ライブラリを使用するHEK293T細胞感染として定義され(プールされた個々のヒト血清については室温で30分間、または感染の前に加熱不活性化したIVIGと共に37℃で1時間インキュベートし)、その後アデノウイルス救出及び成功した変異体の回収が続く。各回の進化は、開始ライブラリを作製するためのcap遺伝子の突然変異誘発及び3回の選択から成る。3回の進化を各ライブラリで行い、このうちクローン分析を各回の進化の間に行なった。各回の進化のための開始ライブラリは、上記のように生成された。3回目の選択の後、AAV cap遺伝子は、成功したAAV変異体のプールから単離され、PCRによって増幅された。cap遺伝子は、NotI及びHindIIIを使用してpXX2組換えAAVパッケージングプラスミドに挿入された。cap遺伝子は、その後カリフォルニア大学Berkeley校のDNA配列決定施設で配列決定され、Geneiousソフトウェア(ニュージーランドオークランド、Biomatters)を使用して分析された。AAV2カプシド(Protein Databank受託番号1LP3)の3次元モデルが、Pymol(カリフォルニア州サンカルロス、DeLano Scientific)において表された。
抗体回避変異体のインビトロ形質導入分析
HEK293Tは、感染の24時間前に3×104細胞/ウェルの密度で播種した。変異体は、感染の前に、加熱不活性化したIVIG、個々のヒト血清、または個々のマウス血清と共に37℃で1時間インキュベートし、細胞はその後ゲノムMOI2000でrAAV-GFPで感染させた。GFP陽性細胞のパーセンテージは、ImageXpress Micro Cellular Imaging and Analysis System(カリフォルニア州サニーベール、Molecular Devices)及びMetaXpress Image Analysis Software,バージョン3.1.0,Multi Wavelength Cell Scoring Application Module(Molecular Devices)を使用して、感染の48時間後に評価した。
HEK293Tは、感染の24時間前に3×104細胞/ウェルの密度で播種した。変異体は、感染の前に、加熱不活性化したIVIG、個々のヒト血清、または個々のマウス血清と共に37℃で1時間インキュベートし、細胞はその後ゲノムMOI2000でrAAV-GFPで感染させた。GFP陽性細胞のパーセンテージは、ImageXpress Micro Cellular Imaging and Analysis System(カリフォルニア州サニーベール、Molecular Devices)及びMetaXpress Image Analysis Software,バージョン3.1.0,Multi Wavelength Cell Scoring Application Module(Molecular Devices)を使用して、感染の48時間後に評価した。
インビトロ形質導入分析
相対的な形質導入効率性を決定するために、親野生型AAV血清型、HEK293T、CHO K1、CHO pgsA(全ての表面グリコサミノグリカンを欠如する)、CHO Pro5(Lec1細胞を含むいくつかのグリコシル化突然変異体のための親系統)、CHO Lec1(グリコシル化欠損)、HeLa、及びHT1080細胞(ヒト線維肉腫細胞株)と比較した、選択された突然変異体を、感染の24時間前に、1つのウェルあたり2.5×104細胞の密度で播種した。細胞を、100~1000の範囲のMOIで、rAAV1-GFP、rAAV2-GFP、rAAV6-GFP、シャッフル100.1-GFP、シャッフル100.3-GFP、SM10.2-GFP、またはシャッフル100.7-GFPで感染させた。GFP陽性細胞のパーセンテージは、Beckman-Coulter Cytomics FC500フローサイトメーター(カリフォルニア州ブレア、Beckman-Coulter)を使用して感染の48時間後に評価した。
相対的な形質導入効率性を決定するために、親野生型AAV血清型、HEK293T、CHO K1、CHO pgsA(全ての表面グリコサミノグリカンを欠如する)、CHO Pro5(Lec1細胞を含むいくつかのグリコシル化突然変異体のための親系統)、CHO Lec1(グリコシル化欠損)、HeLa、及びHT1080細胞(ヒト線維肉腫細胞株)と比較した、選択された突然変異体を、感染の24時間前に、1つのウェルあたり2.5×104細胞の密度で播種した。細胞を、100~1000の範囲のMOIで、rAAV1-GFP、rAAV2-GFP、rAAV6-GFP、シャッフル100.1-GFP、シャッフル100.3-GFP、SM10.2-GFP、またはシャッフル100.7-GFPで感染させた。GFP陽性細胞のパーセンテージは、Beckman-Coulter Cytomics FC500フローサイトメーター(カリフォルニア州ブレア、Beckman-Coulter)を使用して感染の48時間後に評価した。
抗体回避変異体のインビボ分析
インビボでの遺伝子発現の分析のために、8週齢の雌のBalb/cマウスを、組換えシャッフル100-3(配列番号12を参照)、SM10-2(配列番号10を参照)、またはAAV2ベクターの投与の24時間前に、尾静脈注射を介して、1匹のマウス当たり4mgのIVIGまたはリン酸緩衝生理食塩水(対照マウス)で予備刺激した。マウスは、尾静脈注射を介して、CMVプロモーターの制御下でルシフェラーゼをコードする組換えAAVベクターの1011ウイルス性ゲノムで感染させた。生物発光撮像のために、マウスを2%のイソフルオラン及び酸素で麻酔した。D-ルシフェリン基質(ミズーリ州セントルイス、GOLD Biotechnology)を体重の500μg/gの投与量で、腹腔内注射した。画像をVivoVision IVIS Lumina撮像装置(カリフォルニア州アラメダ、Xenogen)を使用して生成した。それぞれのマウスについて、4週間にわたり毎週、基質注射の7~10分後に腹側画像を撮った。注射の5週間後、血清を、心臓穿刺を介して採取し、マウスをその後0.9%の生理食塩水溶液で潅流した。心臓、肝臓、肺、腎臓、脾臓、脳、脊髄、及び後肢筋が回収され凍結された。凍結した組織試料は、インビトロルシフェラーゼ分析のために、Reporter Lysis Buffer(ドイツマンハイム、Promega)内で均質化及び再懸濁させた。ルシフェラーゼを含有する可溶化液を、10,000gで10分間の遠心分離によって浄化した。試料をアッセイするために、20μLの可溶化液を100μLのルシフェラーゼアッセイ緩衝剤に加え、混合し、5分間インキュベートし、ルミノメーター内に配置した。シグナルは、2秒の遅延で30秒間統合され、TD20/20ルミノメーター(カリフォルニア州サニーベール、Turner Designs)によって検出されるRelative Light Units(RLU)で報告された。ルシフェラーゼシグナルは、ビシンコニン酸アッセイ(Pierce)によって決定される合計タンパク質含量に正規化した。
インビボでの遺伝子発現の分析のために、8週齢の雌のBalb/cマウスを、組換えシャッフル100-3(配列番号12を参照)、SM10-2(配列番号10を参照)、またはAAV2ベクターの投与の24時間前に、尾静脈注射を介して、1匹のマウス当たり4mgのIVIGまたはリン酸緩衝生理食塩水(対照マウス)で予備刺激した。マウスは、尾静脈注射を介して、CMVプロモーターの制御下でルシフェラーゼをコードする組換えAAVベクターの1011ウイルス性ゲノムで感染させた。生物発光撮像のために、マウスを2%のイソフルオラン及び酸素で麻酔した。D-ルシフェリン基質(ミズーリ州セントルイス、GOLD Biotechnology)を体重の500μg/gの投与量で、腹腔内注射した。画像をVivoVision IVIS Lumina撮像装置(カリフォルニア州アラメダ、Xenogen)を使用して生成した。それぞれのマウスについて、4週間にわたり毎週、基質注射の7~10分後に腹側画像を撮った。注射の5週間後、血清を、心臓穿刺を介して採取し、マウスをその後0.9%の生理食塩水溶液で潅流した。心臓、肝臓、肺、腎臓、脾臓、脳、脊髄、及び後肢筋が回収され凍結された。凍結した組織試料は、インビトロルシフェラーゼ分析のために、Reporter Lysis Buffer(ドイツマンハイム、Promega)内で均質化及び再懸濁させた。ルシフェラーゼを含有する可溶化液を、10,000gで10分間の遠心分離によって浄化した。試料をアッセイするために、20μLの可溶化液を100μLのルシフェラーゼアッセイ緩衝剤に加え、混合し、5分間インキュベートし、ルミノメーター内に配置した。シグナルは、2秒の遅延で30秒間統合され、TD20/20ルミノメーター(カリフォルニア州サニーベール、Turner Designs)によって検出されるRelative Light Units(RLU)で報告された。ルシフェラーゼシグナルは、ビシンコニン酸アッセイ(Pierce)によって決定される合計タンパク質含量に正規化した。
結果
本発明者らの結果は、AAVが、インビトロ及びインビボの両方で抗AAV抗体による中和を有意に克服するために進化し得ることを実証した。野生型AAVインビトロよりも2~35倍高い中和抗体価を必要とする(ヒトIVIGを使用する)新規AAV変異体を単離した。抗体中和特性はまた、中和抗体の存在下で増強したインビボでの形質導入にも変換された。抗AAV抗体に耐性である、かかる新規クローンの単離は、核酸送達ベクターとしてのAAVに基づく治療のより広い実施(AAV遺伝子療法に現在不適格である高い抗体価を有する個体を含む)を可能にする。
本発明者らの結果は、AAVが、インビトロ及びインビボの両方で抗AAV抗体による中和を有意に克服するために進化し得ることを実証した。野生型AAVインビトロよりも2~35倍高い中和抗体価を必要とする(ヒトIVIGを使用する)新規AAV変異体を単離した。抗体中和特性はまた、中和抗体の存在下で増強したインビボでの形質導入にも変換された。抗AAV抗体に耐性である、かかる新規クローンの単離は、核酸送達ベクターとしてのAAVに基づく治療のより広い実施(AAV遺伝子療法に現在不適格である高い抗体価を有する個体を含む)を可能にする。
定向進化によるAAVライブラリ生成及び選択
図1aは、ヒト抗体中和を回避することができる新規AAV変異体を単離するために使用される、定向進化アプローチの模式図を示す。ウイルスのライブラリは、以下の段落に記載されるDNA突然変異誘発技術を使用して作製された(図1a、ステップ1及び2)。最初の選択の間、AAV2 cap遺伝子に対するエラープローンPCR突然変異により作製したウイルス性ライブラリのプールは、様々な希釈の低効力αヒト血清プールと共に、HEK293T細胞の感染の前に30分間室温でインキュベートした(ステップ3)。低効力αヒト血清プールに対する3回の選択(図1a、ステップ4及び5)の後、この中和血清プールへの増強した耐性を有するいくつかの変異体が得られた(図1a、ステップ6、図7a)。変異体1.45は、2点突然変異(N312K、N449D)を含有し、これは、野生型AAV2と比較して、αプールによる中和に対する10倍を超えるより高い耐性をもたらした。
図1aは、ヒト抗体中和を回避することができる新規AAV変異体を単離するために使用される、定向進化アプローチの模式図を示す。ウイルスのライブラリは、以下の段落に記載されるDNA突然変異誘発技術を使用して作製された(図1a、ステップ1及び2)。最初の選択の間、AAV2 cap遺伝子に対するエラープローンPCR突然変異により作製したウイルス性ライブラリのプールは、様々な希釈の低効力αヒト血清プールと共に、HEK293T細胞の感染の前に30分間室温でインキュベートした(ステップ3)。低効力αヒト血清プールに対する3回の選択(図1a、ステップ4及び5)の後、この中和血清プールへの増強した耐性を有するいくつかの変異体が得られた(図1a、ステップ6、図7a)。変異体1.45は、2点突然変異(N312K、N449D)を含有し、これは、野生型AAV2と比較して、αプールによる中和に対する10倍を超えるより高い耐性をもたらした。
変異体1.45からのcap遺伝子は、追加の無作為突然変異誘発に供され、結果として得られたライブラリは、並行してβ及びγプールに対するさらに3回の選択のために選択された。抗体回避においてわずかな改良のみが観察された(データ表示せず)ため、回収されたcap遺伝子はプールされDNAシャッフリング及びEP PCRによる追加の多様化を受けた。β及びγプールの両方からの血清の増加する量に対するもう3回の選択は、野生型AAV2と比較して、ウイルス性ライブラリから回収されたウイルスの量における、実質的な富化をもたらした(図7b、c)。両方のプールからの成功したcap遺伝子の配列決定は、いくつかの低頻度突然変異体及び単一の優性突然変異体である変異体γ4.3を明らかにし、変異体γ4.3は、両方のライブラリ内に存在する4つの点突然変異(N312K、N449D、N551S、及びI698V)を含有した。ヒトIVIGの存在下で、変異体1.45は、中和への適度な1.2倍増強された耐性を実証し、一方でγ4.3は中和への3.1倍増強された耐性を実証した(図7d)。この観察は、個々のヒト血清のプールが、一般的ヒト集合において存在する抗体の増強した回避が可能であるAAV変異体を単離させるために使用され得るという仮説を認める。
抗AAV抗体による中和に抵抗することにおける、変異体γ4.3の適度な成功は、γ4.3cap遺伝子に基づくライブラリの発展を引き起こした。事前にAAV2カプシド上の免疫原性部位であると決定されたアミノ酸部位R471、K532、E548、N587、V708、T716は、γ4.3の抗体耐性に改良を加え得るアミノ酸突然変異を発見する試みで、飽和突然変異誘発を受けた。この「飽和突然変異誘発」ライブラリは、7つの親AAV血清型の無作為capキメラから成る「シャッフル」ライブラリ及び置換されたループ領域を有するAAV2capから成る「ループスワップ」ライブラリと共に、追加の3回の選択を受け、ここにおいてウイルス性ライブラリのプールを、様々な希釈のヒトIVIGと共にHEK293T細胞の感染の前に37℃で1時間インキュベートした。AAVライブラリでの感染及びアデノウイルス重感染による感染性AAV変異体の増幅の後、選択の成功を決定する方法として、それぞれのライブラリ状態からの、ウイルス性ゲノムの数またはウイルス性力価を定量化し、野生型AAV2の力価と比較した(図1b)。飽和突然変異誘発及びループスワップ/シャッフルライブラリを使用する選択のそれぞれの回について、野生型AAV2よりも高いウイルス性力価を生成した1:10及び1:100IVIG希釈状態からのウイルス性プールが、選択の後続の回のための開始点として使用された。3回の選択の後、成功したウイルス性cap遺伝子は単離され、最も効率的な遺伝子送達を有するウイルスを決定するために個々に試験された。さらに、3回目の選択から単離されたcap遺伝子は、エラープローンPCR突然変異誘発の追加の回を受け、このプロセスはウイルスの適応度を繰り返し上昇させるために反復された。
図1は、増強した抗体回避のためのAAVの定向進化を描写する。(a)定向進化の概略。1)いくつかの相補的アプローチを使用してcap遺伝子を遺伝子的に多様化することによって、ウイルス性ライブラリを作製する。2)ウイルスを、プラスミドトランスフェクトを使用してHEK293T細胞内にパッケージングし、次いで回収及び精製する。3)ウイルス性ライブラリをいくつかの濃度のヒトIVIGと共にインキュベートし、インビトロでHEK293T細胞に導入する。4)成功したウイルスを、アデノウイルス重感染を介して増幅して回収する。5)成功したクローンを、より低いMOIでの反復される選択によって濃縮する。6)単離されたウイルス性DNAは、成功したcap遺伝子を明らかにする。7)成功したcap遺伝子を、選択の新規開始点としての役割を果たすために再度突然変異させる。(b)ループスワップ/シャッフル、及び飽和突然変異誘発ライブラリからの抗体回避変異体の選択。HEK293T細胞を、ウイルス性ライブラリで24時間感染させた。細胞を生産的に感染させたウイルス粒子をアデノウイルス感染により増幅させ、救出されたAAVをqPCRによって定量化した。IVIGの1:10希釈は、10mgのIVIG/mLの濃度に対応する。エラーバーは標準偏差を示す(n=3)。
図7は、AAV2に基づくヒト抗体回避体の生成を実証する。(a)低ストリンジェンシーのαプールに対する3回の選択の後に選択される4つのウイルス性クローンは、1のMOIのα血清の1μLへの増強した耐性を実証する。さらなる2回の多様化(すなわち突然変異誘発及びDNAシャッフル)及び選択(血清量増加を3回)は、大量の非常に効力のある(b)β及び(c)γプールの存在下で有意に向上したウイルス回収をもたらした。(d)さらに、2つのウイルス性クローン(1.45及びγ4.3)は、野生型AAV2と比較して、約100,000の個体由来のプールされたヒト静脈内免疫グロブリン(IVIg)と共に存在する既存の抗体の高度に多様なプールに対する1.23倍及び3.10倍増強した耐性を実証した。
インビトロでの新規進化AAV変異体の上昇した抗体回避
ヒトIVIGに対する9回のスクリーニング後の飽和突然変異誘発及びループスワップ/シャッフルライブラリからの、個々の分析のために選択及びパッケージングされた12のクローンのうち、12全てが、野生型AAV1及びAAV2の両方よりも高い中和抗体価を必要とした(図2a及び表1)。中和のために野生型AAV2よりも35倍高いインビトロIVIG濃度を必要とした、変異体シャッフル100-3(配列番号12を参照)は、1mg/mLのIVIGの存在下で、細胞のおよそ10%に形質導入することがなお可能であった(図2b)。さらに、AAV2飽和突然変異誘発ライブラリからの変異体SM10-2は、野生型AAV2よりも7.5倍高いインビトロIVIG濃度を中和に必要とした。さらに、変異体シャッフル100-3及びSM10-2(配列番号10参照)は、血友病B臨床試験から排除された個々の患者からの血清試料の存在下で、増強した形質導入を示した(図3)(Nathwani et al.,N Engl J Med.2011 Dec 22;365(25):2357-65)。
ヒトIVIGに対する9回のスクリーニング後の飽和突然変異誘発及びループスワップ/シャッフルライブラリからの、個々の分析のために選択及びパッケージングされた12のクローンのうち、12全てが、野生型AAV1及びAAV2の両方よりも高い中和抗体価を必要とした(図2a及び表1)。中和のために野生型AAV2よりも35倍高いインビトロIVIG濃度を必要とした、変異体シャッフル100-3(配列番号12を参照)は、1mg/mLのIVIGの存在下で、細胞のおよそ10%に形質導入することがなお可能であった(図2b)。さらに、AAV2飽和突然変異誘発ライブラリからの変異体SM10-2は、野生型AAV2よりも7.5倍高いインビトロIVIG濃度を中和に必要とした。さらに、変異体シャッフル100-3及びSM10-2(配列番号10参照)は、血友病B臨床試験から排除された個々の患者からの血清試料の存在下で、増強した形質導入を示した(図3)(Nathwani et al.,N Engl J Med.2011 Dec 22;365(25):2357-65)。
図2は、抗体回避変異体の中和プロファイルを示す。3回の進化の後に単離された抗体回避突然変異体のcap遺伝子を、GFPをコードする組換えAAVをパッケージングするために使用し、HEK293T細胞の感染の前にヒトIVIGと共にインキュベートした。残っている感染性粒子の割合を、高含量蛍光撮像を使用して決定し、IVIGの不在下で感染性力価に正規化した。IVIGへの耐性を有するそれぞれのライブラリからの2つのクローンを示す。分析された他のクローンについてのデータは表1に示す。(a)中和曲線。エラーバーは、標準偏差を示す(n=3)。(b)いくつかのIVIG希釈からの代表的な蛍光画像は、突然変異体が、高濃度の中和抗体の存在下でHEK293T形質導入が可能であることを示す。
図3は、抗体回避変異体の中和プロファイルを示す。ヒト血清は、AAVに対する高い中和抗体力価の存在により血友病B臨床試験から除外された個人から得られた。GFPをコードする組換えAAVは、HEK293T細胞の感染の前に、個々のヒト血清試料と共にインキュベートした。残っている感染性粒子の割合を、蛍光顕微鏡法を使用して決定し、ヒト血清の不在下で感染性力価に正規化した。エラーバーは標準偏差を示す(n=3)。
12のクローンの配列分析は、最も高い中和抗体耐性を有する2つの変異体である、シャッフル100-3(配列番号12参照)及びシャッフル100-1(配列番号11参照)が、AAV1-4、AAV6、及びAAV9の断片を含有するほぼ同一のシャッフルカプシドであることを示した(図4)。2つの変異体の間の、アミノ酸469(AAV6残基対AAV7残基)及び598(AAV6残基対AAV1残基)における差異は、シャッフル100-3(配列番号12参照)についての中和抗体価におけるほぼ3倍の増加に変換される(表1)。4番目に高い中和抗体耐性(表1)を有した変異体シャッフル100-7(配列番号13参照)もまた、AAV1、AAV6、及びAAV8の断片を含有するシャッフルカプシドであり(図4)、野生型AAV1及びAAV8が抗AAV2抗体を回避することに有効であることを示す報告されたデータと良好に合致する。興味深いことに、変異体SM10-2(配列番号10参照)は変異γ4.3によって得られる点突然変異を保持し、飽和突然変異誘発部位にて野生型残基も保持した。変異体SM10-2(配列番号10参照)は、表面残基D472N及び内部残基L735Qにて追加の点突然変異を得た。図4は、ループスワップ/シャッフル及び飽和突然変異誘発クローンのアミノ酸配列を示す。(a)カプシドタンパク質の模式図を、最も高い中和IVIG濃度を有するそれぞれのライブラリからの2つのクローンについて示す。それぞれの領域は、それが由来する親血清型に応じて影が付けられる。黒い矢印は、VP1、VP2、及びVP3カプシドタンパク質の開始コドンを示す(左から右へ)。灰色の矢印は、AAV2カプシドに基づく表面ループ領域I、II、III、IV、及びVを示す(左から右へ)。(b)溶解構造に基づく完全AAV2カプシドの分子モデルを、最も高い中和IVIG濃度を有するそれぞれのライブラリからの2つのクローンについて示す。それぞれの領域は、それが由来する親血清型に応じて影が付けられる。変異体シャッフル100-3(配列番号12参照)については、黒い矢印は変異体シャッフル100-1(配列番号11参照)からの差異を示す。変異体SM10-2(配列番号10参照)については、突然変異N449D、D472N、N551S、及びI698Vは表面突然変異(黒)である。
表1:ライブラリクローン及び親血清型のIVIG中和抗体価
野生型AAV1、AAV2、AAV8、ならびにループスワップ/シャッフル及び飽和突然変異誘発ライブラリから回収された変異体からのカプシドを有する組換えAAV-GFPベクターを中和するために、ヒトIVIGを使用した。遺伝子送達効率性をIVIGの不在下のものの50%に低減するために必要とされるIVIG濃度(mg/mL)が示され、AAV2の送達を低減するために必要とされる濃度と比較される。分析された全ての変異体は、野生型AAV1及びAAV2よりも高い濃度のIVIGを必要とした。中和抗体価は、図2の曲線を指数関数的曲線に当てはめることによって決定された。配列番号は「アミノ酸、ヌクレオチド」として記載される。
(表1)
野生型AAV1、AAV2、AAV8、ならびにループスワップ/シャッフル及び飽和突然変異誘発ライブラリから回収された変異体からのカプシドを有する組換えAAV-GFPベクターを中和するために、ヒトIVIGを使用した。遺伝子送達効率性をIVIGの不在下のものの50%に低減するために必要とされるIVIG濃度(mg/mL)が示され、AAV2の送達を低減するために必要とされる濃度と比較される。分析された全ての変異体は、野生型AAV1及びAAV2よりも高い濃度のIVIGを必要とした。中和抗体価は、図2の曲線を指数関数的曲線に当てはめることによって決定された。配列番号は「アミノ酸、ヌクレオチド」として記載される。
(表1)
変異体シャッフル100-3(配列番号12参照)、シャッフル100-1(配列番号11参照)、及びシャッフル100-7(配列番号13参照)は、親血清型AAV1及びAAV6の形質導入を模倣する形質導入プロファイルを有する(図5)。さらに、SM10-2(配列番号10参照)における突然変異は、ヘパリン依存性を予防せず(親血清型AAV2において見出される通り)、AAV2と同様のプロファイルをもたらす(図5)。
図5は、新規aav変異体のインビトロ向性を実証する。緑色蛍光タンパク質を発現する組換えAAVベクターを使用して、細胞株:CHO、pgsA(全ての表面グリコサミノグリカンを欠如する)、Pro5、Lec1(シアル酸を欠如する)、HEK293T、HeLa、及びHT1080(ヒト線維肉腫細胞株)、のパネルを形質導入し、新規AAV変異体の形質導入特徴のプロファイルを得た。エラーバーは、標準偏差(n=3)を示す。
インビボでの新規進化AAV変異体の上昇した抗体回避
変異体シャッフル100-3及びシャッフル100-7の局在化パターンを決定するために、ルシフェラーゼ酵素活性が、AAV2、シャッフル100-3、またはシャッフル100-7を注射したナイーブマウスの様々な組織において試験された(図6a)。変異体シャッフル100-7は、7倍より高い心臓の形質導入、5倍より高い肺の形質導入、及び4.5倍より低い肝臓の形質導入を除き、AAV2と同様のインビボ向性を示した。シャッフル100-3変異体は、AAV2よりも、4倍を超えてより高い脳の形質導入、3倍を超えてより高い肺の形質導入、及び27倍より高い筋肉の形質導入を示した。これらのマウスからの血清の分析は、変異体シャッフル100-3が、AAV1、AAV2、AAV8、またはシャッフル100-3遺伝子送達ベクターを与えられたマウスからの血清について、中和のために、AAV1及びAAV8よりも同等以上のインビトロ血清濃度を必要としたことを示した(図11)。シャッフル100-7は、AAV1、AAV2、AAV8、シャッフル100-3、またはSM10-2遺伝子送達ベクターを与えられたマウスからの血清について、中和のためにAAV1よりも同等以上のインビトロ血清濃度を必要とした(図11)。さらに、両方の変異体は、AAV2遺伝子送達ベクターを与えられたマウスからの血清によって、試験された全ての野生型AAV血清型よりも、中和されなかった。興味深いことに、さらに、変異体シャッフル100-3は、それに対して免疫化されたマウスの血清によって、試験された他の血清型または変異体のいずれよりも、中和されなかった(図11)。このデータは、複数のベクター投与を必要とする適用において、これらの変異体が、野生型AAV血清型または他の変異体との組み合わせで使用され得る可能性を示す。
変異体シャッフル100-3及びシャッフル100-7の局在化パターンを決定するために、ルシフェラーゼ酵素活性が、AAV2、シャッフル100-3、またはシャッフル100-7を注射したナイーブマウスの様々な組織において試験された(図6a)。変異体シャッフル100-7は、7倍より高い心臓の形質導入、5倍より高い肺の形質導入、及び4.5倍より低い肝臓の形質導入を除き、AAV2と同様のインビボ向性を示した。シャッフル100-3変異体は、AAV2よりも、4倍を超えてより高い脳の形質導入、3倍を超えてより高い肺の形質導入、及び27倍より高い筋肉の形質導入を示した。これらのマウスからの血清の分析は、変異体シャッフル100-3が、AAV1、AAV2、AAV8、またはシャッフル100-3遺伝子送達ベクターを与えられたマウスからの血清について、中和のために、AAV1及びAAV8よりも同等以上のインビトロ血清濃度を必要としたことを示した(図11)。シャッフル100-7は、AAV1、AAV2、AAV8、シャッフル100-3、またはSM10-2遺伝子送達ベクターを与えられたマウスからの血清について、中和のためにAAV1よりも同等以上のインビトロ血清濃度を必要とした(図11)。さらに、両方の変異体は、AAV2遺伝子送達ベクターを与えられたマウスからの血清によって、試験された全ての野生型AAV血清型よりも、中和されなかった。興味深いことに、さらに、変異体シャッフル100-3は、それに対して免疫化されたマウスの血清によって、試験された他の血清型または変異体のいずれよりも、中和されなかった(図11)。このデータは、複数のベクター投与を必要とする適用において、これらの変異体が、野生型AAV血清型または他の変異体との組み合わせで使用され得る可能性を示す。
図11は、免疫化マウス血清中のライブラリクローン及び親血清型の中和抗体価を示す。ライブラリクローンまたは野生型AAVを投与されたマウスからの血清は、野生型AAV1、AAV2、AAV8からのカプシド、及びループスワップ/シャッフル及び飽和突然変異誘発ライブラリから回収された変異体を有する、組換えAAV-GFPベクターを中和するために使用された。遺伝子送達効率を血清の不在下での効率の50%に低減するために必要とされる血清希釈を示す。
インビボで抗体中和を回避する変異体シャッフル100-7及びシャッフル100-3の能力を決定するために、マウスは、AAV注射の前にヒトIVIGで受動的に免疫化された。変異体シャッフル100-7は、ルシフェラーゼ酵素活性によって測定され、AAV2よりも有意に高い心臓、肝臓、及び筋肉での形質導入を有した(図6b)。変異体シャッフル100-3は、AAV2と比較して有意により高い心臓及び筋肉での形質導入を有した(図6b)。
図6は、新規AAV変異体のインビボ局在化及び中和を示す。(a)ルシフェラーゼをコードする組換えAAVベクターを、雌のBALB/cマウスに尾静脈注射を介して投与した。5週間後、ルシフェラーゼ活性のレベルを決定し、分析されたそれぞれの試料について、合計タンパク質に正規化した。(b)ルシフェラーゼを発現する組換えAAVベクターを、4mgのヒトIVIGの尾静脈注射の24時間後に、尾静脈注射を介して雌BALB/cマウスに投与した。5週間後、ルシフェラーゼ発現のレベルは、分析されたそれぞれの試料について合計タンパク質に正規化した。エラーバーは標準偏差(n=3)を示し、*=p<0.05.RLU、相対的ルシフェラーゼ単位。
個々のヒト血清のプールに対して選択されるAAV2系のエラープローンライブラリから単離された変異体γ4.3は、4つの点突然変異(N312K、N449D、N551S、及びI698V)を含有した。興味深いことに、これらの位置のうちの2つ(N449及びN551)は、ヒト血清の他のプールを使用して免疫原性残基として事前に特定されており、これらの部位を含む抗原性エピトープは多くの異なる中和抗体によって標的とされることを実証した。したがって、これらの部位は、突然変異のための興味深く価値のある標的である。飽和突然変異誘発ライブラリ内で定向進化及び合理的な設計を合わせることで、変異体SM10-2の単離をもたらし、これは、インビトロのAAV1及びAAV2の両方よりも高い抗体耐性が可能であった。変異体SM10-2は、変異γ4.3上で見られるものに対して2つの追加の点突然変異(D472N及びL735Q)を組み込む。D472N突然変異は、以前に、HEK293細胞内のカプシド合成のレベルを上昇させることが示された。同様に、アミノ酸位置735の正電荷リジン側鎖の、非電荷グルタミン側鎖との交換は、それが集合カプシドの内側内に位置付けられるにもかかわらず変異体シャッフル100-7内にも存在するため、カプシドを安定化する機能を果たし得る(図4)。
キメラAAVカプシドの作製は、複数のAAV血清型からの望ましい特徴を混合させ得るウイルス性変異体の作製を可能にする。AAV8及びAAV9もまた、IVIGによる中和に対してAAV2よりもはるかに耐性があると示されてきたが、これらのカプシドに特異的なアミノ酸は、本発明者らの選択の間に単離されるシャッフル変異体の表面上の小さいスパン内にのみ存在した(図4)。インビトロで抗体中和のより効率的な回避を示す変異体である、シャッフル100-3は、その親血清型AAV1及びAAV6と同様のインビトロ向性を示したが、どちらの野生型血清型よりも高い率の感染性であった。シャッフル100-1とシャッフル100-3との間のアミノ酸469及び598における差は、シャッフル100-3についての中和抗体価におけるほぼ3倍の上昇に変換される。Lochrie et al.による研究は、ヒト血清及びIVIGによって認識される免疫原性残基は異なることを報告しており、これは様々なヒトがAAVカプシド上の異なるセットのエピトープへの様々な中和抗体を生成することができ、かつ中和からの完全な逃避は容易でないことを示唆した(Lochrie et al.,J Virol.2006 Jan;80(2):821-34)。本発明者らの研究は、様々な量及び効力の抗AAV抗体を含有するいくつかの異なる血清プールを使用する複数の回の定向進化の使用が、複数の抗AAV抗体プールの存在下で、インビトロ及びインビボの両方で増強した細胞形質導入が可能である新規AAV変異体の単離をもたらすであろうことを実証する。
動物及びヒトにおけるAAVベクター成分への適応免疫応答は、多くの場合、同じ血清型のAAVベクターの再投与を阻み、複数のベクター投与を必要とする遺伝子送達用途を困難にする。生体内分布研究において使用されるマウスからの血清を使用するインビトロ中和アッセイは、変異体が野生型AAVよりもこれらの血清によって中和されないことを実証し(図11)、これはベクター再投与が必要である遺伝子療法戦略に有用であり得る。例えば、シャッフル100-3は、AAV2を注射されたマウスからの血清によって中和されず、AAV2は、シャッフル100-3を注射されたマウスからの血清によって中和されず、この変異体が野生型AAV血清型との組み合わせで、または複数のベクター投与を必要とする用途において、使用され得ることを示唆した。結論として、本発明者らは、インビトロ及びインビボの両方で、個々のヒト患者、プールされたヒト血清、及びマウス血清に由来する抗AAV抗体による低減した中和が可能である、新規AAV変異体を単離するために、定向進化を使用した。
本発明が、その具体的実施形態への参照を伴って記載されてきた一方で、当業者には、本発明の真の趣旨及び範囲から逸脱することなく、様々な変更がなされ得、均等物が置換され得ることが理解されるはずである。さらに、具体的な状況、材料、組成物、プロセス、プロセスステップ(単数または複数)を、本発明の目的、趣旨、及び範囲に適応させるために、多くの修正がなされ得る。全てのかかる修正は、本明細書に添付される特許請求の範囲内であることが意図される。
配列情報
SEQUENCE LISTING
<110> The Regents of the University of California
<120> Adeno-Associated Virus Variants and Methods of Use Thereof
<150> US 61/829,735
<151> 2013-05-31
<160> 41
<170> PatentIn version 3.5
<210> 1
<211> 736
<212> PRT
<213> adeno-associated virus 1
<400> 1
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 2
<211> 735
<212> PRT
<213> adeno-associated virus 2
<400> 2
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 3
<211> 736
<212> PRT
<213> adeno-associated virus 3
<400> 3
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Gly
130 135 140
Ala Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Arg Gly Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Gly Thr Val Asn His Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 4
<211> 734
<212> PRT
<213> adeno-associated virus 4
<400> 4
Met Thr Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu
1 5 10 15
Gly Val Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro Lys
20 25 30
Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val
50 55 60
Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln
65 70 75 80
Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Gln Arg Leu Gln Gly Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Leu
115 120 125
Gly Leu Val Glu Gln Ala Gly Glu Thr Ala Pro Gly Lys Lys Arg Pro
130 135 140
Leu Ile Glu Ser Pro Gln Gln Pro Asp Ser Ser Thr Gly Ile Gly Lys
145 150 155 160
Lys Gly Lys Gln Pro Ala Lys Lys Lys Leu Val Phe Glu Asp Glu Thr
165 170 175
Gly Ala Gly Asp Gly Pro Pro Glu Gly Ser Thr Ser Gly Ala Met Ser
180 185 190
Asp Asp Ser Glu Met Arg Ala Ala Ala Gly Gly Ala Ala Val Glu Gly
195 200 205
Gly Gln Gly Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys
210 215 220
Asp Ser Thr Trp Ser Glu Gly His Val Thr Thr Thr Ser Thr Arg Thr
225 230 235 240
Trp Val Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Arg Leu Gly Glu
245 250 255
Ser Leu Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Asn Trp Gly Met Arg Pro Lys Ala Met Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Thr Ser Asn Gly Glu
305 310 315 320
Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Val Gln Ile Phe Ala Asp
325 330 335
Ser Ser Tyr Glu Leu Pro Tyr Val Met Asp Ala Gly Gln Glu Gly Ser
340 345 350
Leu Pro Pro Phe Pro Asn Asp Val Phe Met Val Pro Gln Tyr Gly Tyr
355 360 365
Cys Gly Leu Val Thr Gly Asn Thr Ser Gln Gln Gln Thr Asp Arg Asn
370 375 380
Ala Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly
385 390 395 400
Asn Asn Phe Glu Ile Thr Tyr Ser Phe Glu Lys Val Pro Phe His Ser
405 410 415
Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile
420 425 430
Asp Gln Tyr Leu Trp Gly Leu Gln Ser Thr Thr Thr Gly Thr Thr Leu
435 440 445
Asn Ala Gly Thr Ala Thr Thr Asn Phe Thr Lys Leu Arg Pro Thr Asn
450 455 460
Phe Ser Asn Phe Lys Lys Asn Trp Leu Pro Gly Pro Ser Ile Lys Gln
465 470 475 480
Gln Gly Phe Ser Lys Thr Ala Asn Gln Asn Tyr Lys Ile Pro Ala Thr
485 490 495
Gly Ser Asp Ser Leu Ile Lys Tyr Glu Thr His Ser Thr Leu Asp Gly
500 505 510
Arg Trp Ser Ala Leu Thr Pro Gly Pro Pro Met Ala Thr Ala Gly Pro
515 520 525
Ala Asp Ser Lys Phe Ser Asn Ser Gln Leu Ile Phe Ala Gly Pro Lys
530 535 540
Gln Asn Gly Asn Thr Ala Thr Val Pro Gly Thr Leu Ile Phe Thr Ser
545 550 555 560
Glu Glu Glu Leu Ala Ala Thr Asn Ala Thr Asp Thr Asp Met Trp Gly
565 570 575
Asn Leu Pro Gly Gly Asp Gln Ser Asn Ser Asn Leu Pro Thr Val Asp
580 585 590
Arg Leu Thr Ala Leu Gly Ala Val Pro Gly Met Val Trp Gln Asn Arg
595 600 605
Asp Ile Tyr Tyr Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp
610 615 620
Gly His Phe His Pro Ser Pro Leu Ile Gly Gly Phe Gly Leu Lys His
625 630 635 640
Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro
645 650 655
Ala Thr Thr Phe Ser Ser Thr Pro Val Asn Ser Phe Ile Thr Gln Tyr
660 665 670
Ser Thr Gly Gln Val Ser Val Gln Ile Asp Trp Glu Ile Gln Lys Glu
675 680 685
Arg Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Tyr Gly
690 695 700
Gln Gln Asn Ser Leu Leu Trp Ala Pro Asp Ala Ala Gly Lys Tyr Thr
705 710 715 720
Glu Pro Arg Ala Ile Gly Thr Arg Tyr Leu Thr His His Leu
725 730
<210> 5
<211> 724
<212> PRT
<213> adeno-associated virus 5
<400> 5
Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu
1 5 10 15
Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys
20 25 30
Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val
50 55 60
Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu
65 70 75 80
Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe
115 120 125
Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile
130 135 140
Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser
145 150 155 160
Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln
165 170 175
Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr
180 185 190
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
195 200 205
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
210 215 220
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
225 230 235 240
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
245 250 255
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
305 310 315 320
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
325 330 335
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
340 345 350
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
355 360 365
Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser
370 375 380
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
385 390 395 400
Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser
405 410 415
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
420 425 430
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln
435 440 445
Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
450 455 460
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly
465 470 475 480
Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu
485 490 495
Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr
500 505 510
Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile
515 520 525
Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu
530 535 540
Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg
545 550 555 560
Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser
565 570 575
Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro
580 585 590
Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
595 600 605
Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met
610 615 620
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn
625 630 635 640
Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser
645 650 655
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu
660 665 670
Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
675 680 685
Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp
690 695 700
Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu
705 710 715 720
Thr Arg Pro Leu
<210> 6
<211> 736
<212> PRT
<213> adeno-associated virus 6
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 7
<211> 737
<212> PRT
<213> adeno-associated virus 7
<400> 7
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Ala Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Val Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn
210 215 220
Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Ser Glu Thr Ala Gly Ser Thr Asn Asp Asn
260 265 270
Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Lys Leu Arg Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Ile Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ser Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Ser
405 410 415
Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ala
435 440 445
Arg Thr Gln Ser Asn Pro Gly Gly Thr Ala Gly Asn Arg Glu Leu Gln
450 455 460
Phe Tyr Gln Gly Gly Pro Ser Thr Met Ala Glu Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Phe Arg Gln Gln Arg Val Ser Lys Thr Leu Asp
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Val Leu Ile
530 535 540
Phe Gly Lys Thr Gly Ala Thr Asn Lys Thr Thr Leu Glu Asn Val Leu
545 550 555 560
Met Thr Asn Glu Glu Glu Ile Arg Pro Thr Asn Pro Val Ala Thr Glu
565 570 575
Glu Tyr Gly Ile Val Ser Ser Asn Leu Gln Ala Ala Asn Thr Ala Ala
580 585 590
Gln Thr Gln Val Val Asn Asn Gln Gly Ala Leu Pro Gly Met Val Trp
595 600 605
Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asn Pro Pro Glu Val Phe Thr Pro Ala Lys Phe Ala Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser
690 695 700
Asn Phe Glu Lys Gln Thr Gly Val Asp Phe Ala Val Asp Ser Gln Gly
705 710 715 720
Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn
725 730 735
Leu
<210> 8
<211> 738
<212> PRT
<213> adeno-associated virus 8
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly
450 455 460
Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile
530 535 540
Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 9
<211> 736
<212> PRT
<213> adeno-associated virus 9
<400> 9
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 10
<211> 735
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 10
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Lys Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asp Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asn Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Ser Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Gln
725 730 735
<210> 11
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 11
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Gln Arg Leu Gln Gly Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Gln Ala Gly Glu Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Leu Ile Glu Ser Pro Gln Gln Pro Asp Ser Ser Thr Gly Ile Gly
145 150 155 160
Lys Lys Gly Lys Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Asp Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 12
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Gln Arg Leu Gln Gly Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Gln Ala Gly Glu Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Leu Ile Glu Ser Pro Gln Gln Pro Asp Ser Ser Thr Gly Ile Gly
145 150 155 160
Lys Lys Gly Lys Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Asp Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Thr Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 13
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 13
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Ile Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Gln
725 730 735
<210> 14
<211> 23
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 14
gcggaagctt cgatcaacta cgc 23
<210> 15
<211> 41
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 15
ggggcggccg caattacaga ttacgagtca ggtatctggt g 41
<210> 16
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<220>
<221> misc_feature
<222> (5)..(6)
<223> n is a, c, g, or t
<400> 16
cattnnkgac cagtctagga actgg 25
<210> 17
<211> 90
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<220>
<221> misc_feature
<222> (21)..(22)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (69)..(70)
<223> n is a, c, g, or t
<400> 17
gccacaagga cgatgaagaa nnkttttttc ctcagagcgg ggttctcatc tttgggaagc 60
aaggctcann kaaaacaagt gtggacattg 90
<210> 18
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<220>
<221> misc_feature
<222> (18)..(19)
<223> n is a, c, g, or t
<400> 18
ccaacctcca gagaggcnnk agacaagcag ctacc 35
<210> 19
<211> 57
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<220>
<221> misc_feature
<222> (18)..(19)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (42)..(43)
<223> n is a, c, g, or t
<400> 19
ccaactacaa caagtctnnk aatgtggact ttactgtgga cnnkaatggc gtgtatt 57
<210> 20
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 20
catgggaaag gtgccagacg 20
<210> 21
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 21
accatcggca gccatacctg 20
<210> 22
<211> 2208
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 22
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctatgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggaacgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaagttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggtaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacagacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cggaaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca agtgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga agttcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atcagtaa 2208
<210> 23
<211> 2211
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 23
atggctgctg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggtga caacccctac ctcaagtaca accacgccga cgcggagttc 300
cagcagcggc ttcagggcga cacatcgttt gggggcaacc tcggcagagc agtcttccag 360
gccaaaaaga gggttcttga acctcttggt ctggttgagc aagcgggtga gacggctcct 420
ggaaagaaga gaccgttgat tgaatccccc cagcagcccg actcctccac gggtatcggc 480
aaaaaaggca agcagccggc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggtgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg acttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc agactatcag ctcccgtacg tgctcgggtc ggctcacgag 1080
ggctgcctcc cgccgttccc agcagacgtc ttcatggtgc cacagtatgg atacctcacc 1140
ctgaacaacg ggagtcaggc agtaggacgc tcttcatttt actgcctgga gtactttcct 1200
tctcagatgc tgcgtaccgg aaacaacttt accttcagct acacttttga ggacgttcct 1260
ttccacagca gctacgctca cagccagagt ctggaccgtc tcatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgggggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggactgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800
gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagt 2040
gtggaaattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100
tacacatcca attatgcaaa atctgccaac gttgatttta ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta a 2211
<210> 24
<211> 2211
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 24
atggctgctg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggtga caacccctac ctcaagtaca accacgccga cgcggagttc 300
cagcagcggc ttcagggcga cacatcgttt gggggcaacc tcggcagagc agtcttccag 360
gccaaaaaga gggttcttga acctcttggt ctggttgagc aagcgggtga gacggctcct 420
ggaaagaaga gaccgttgat tgaatccccc cagcagcccg actcctccac gggtatcggc 480
aaaaaaggca agcagccggc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggtgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg acttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc agactatcag ctcccgtacg tgctcgggtc ggctcacgag 1080
ggctgcctcc cgccgttccc agcagacgtc ttcatggtgc cacagtatgg atacctcacc 1140
ctgaacaacg ggagtcaggc agtaggacgc tcttcatttt actgcctgga gtactttcct 1200
tctcagatgc tgcgtaccgg aaacaacttt accttcagct acacttttga ggacgttcct 1260
ttccacagca gctacgctca cagccagagt ctggaccgtc tcatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgggggtc tccaactggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ctgaaagatt tgggactgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgccatggga 1800
gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc tatttgggcc 1860
aaaattcctc acacggatgg acactttcac ccgtctcctc tcatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100
tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta a 2211
<210> 25
<211> 2211
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 25
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg cgctgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggatgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcaatcgcca caagagccag actcctcctc gggcatcggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780
tccagtgctt cgacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg actttaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaacaaca actggggatt ccggcccaag agactcagct tcaagctctt caacatccag 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140
ctcaacaatg gcagccaagc cgtgggacgt tcatcctttt actgcctgga atatttccct 1200
tctcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgat 1320
caatacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaat 1500
tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560
ggcactgcta tggcctcaca taaagacgac gaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680
acagacgaag aggaaattaa agccactaac cctgtggcca ccgaaagatt tgggaccgtg 1740
gcagtcaatt tccagagcag cagcacagac cctgcgaccg gagatgtgca tgctatggga 1800
gcattacctg gcatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100
tatacatcta actatgcaaa atctgccaac attgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtccccagta a 2211
<210> 26
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 26
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Cys Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 27
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 27
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Val Asn Gln Gln Lys Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Thr Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 28
<211> 723
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 28
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Val Asn Gln Gln Lys Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Gln Val
305 310 315 320
Lys Glu Thr Thr Asp Val Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr
325 330 335
Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly
340 345 350
Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe Met
355 360 365
Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser Gln Ala Val
370 375 380
Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu
385 390 395 400
Arg Thr Gly Asn Asn Phe Thr Ser Tyr Thr Phe Glu Asp Val Pro Phe
405 410 415
His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro
420 425 430
Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr Gln Asn Gln Ser
435 440 445
Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser Arg Gly Ser Pro Thr
450 455 460
Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro Gly Pro Cys Tyr Arg
465 470 475 480
Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn Asn Asn Ser Asn Phe
485 490 495
Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn Gly Arg Glu Ser Ile
500 505 510
Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys Asp Asp Glu Asp Lys
515 520 525
Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly Lys Glu Ser Ala Gly
530 535 540
Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile Thr Asp Glu Glu Ala
545 550 555 560
Thr Asn Pro Val Ala Thr Glu Arg Phe Gly Thr Val Ala Val Asn Leu
565 570 575
Gln Ser Ser Pro Ala Thr Asp Val His Ala Met Gly Ala Leu Pro Gly
580 585 590
Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala
595 600 605
Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly
610 615 620
Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr
625 630 635 640
Pro Val Pro Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala
645 650 655
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu
660 665 670
Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln
675 680 685
Tyr Thr Ser Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp
690 695 700
Asn Asn Gly Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu
705 710 715 720
Thr Arg Pro
<210> 29
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 29
Met Ala Ser Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Arg Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 30
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 30
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 31
<211> 735
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 31
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Lys Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asp Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Ser Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 32
<211> 735
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 32
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asn Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Lys Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Arg Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asp Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Ser Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 33
<211> 735
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 33
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Lys Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asp Ala Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Ser Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 34
<211> 2211
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 34
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggatgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac cttcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga gggttctcga acctctcggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcattggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg acttcaacag attccactgc cacttttcac cacgtgactg gcaaagactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaagctctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acgaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag ttgccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt accggcagca gtgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggactgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800
gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc tatttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100
tacacatcca attatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta a 2211
<210> 35
<211> 2211
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 35
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gaatggtggg acttgaaacc tggagccccg aaacccaaag tcaaccagca aaagcaggac 120
aacgctcggg gtcttgtgct tccgggttac aaatacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac cttcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc ttggacgagc agtcttccag 360
gccaagaaga gggttctcga accttttggt ctggttgagg aaggtgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcattggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg acttcaacag attccactgc cacttttcac cacgtgactg gcaaagactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaagctctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acgaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag ttgccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caataacttt accttcagct acacttttga ggacgttcct 1260
ttccacagca gctacgctca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccaactggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ctgaaagatt tgggactgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgccatggga 1800
gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc tatttgggcc 1860
aaaattcctc acacggatgg acactttcac ccgtctcctc tcatgggcgg ctttggactt 1920
aagcacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980
gagttttcgg ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100
tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta a 2211
<210> 36
<211> 2208
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<220>
<221> misc_feature
<222> (955)..(955)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (971)..(972)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (981)..(981)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (986)..(986)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1235)..(1235)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1694)..(1696)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1698)..(1698)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1763)..(1765)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1778)..(1778)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (2204)..(2204)
<223> n is a, c, g, or t
<400> 36
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gaatggtggg acttgaaacc tggagccccg aaacccaaag tcaaccagca aaagcaggac 120
aacgctcggg gtcttgtgct tccgggttac aaatacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac cttcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc ttggacgagc agtcttccag 360
gccaagaaga gggttctcga accttttggt ctggttgagg aaggtgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcattggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaataaca attggggatt ccggcccaag agactcaact tcaaactctt caacntccaa 960
gtcaaggagg nnacgacgaa ngatgncgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caataacttt acctncagct acacttttga ggacgttcct 1260
ttccacagca gctacgctca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccaactggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag agannncnaa gccactaacc ccgtggccac tgaaagattt gggactgtgg 1740
cagtcaatct ccaagcagca cannnaccct gcgaccgnag atgtgcatgc catgggagcc 1800
ttacctggaa tggtgtggca agacagagac gtatacctgc agggtcctat ttgggccaaa 1860
attcctcaca cggatggaca ctttcacccg tctcctctca tgggcggctt tggacttaag 1920
cacccgcctc ctcagatcct catcaaaaac acgcctgttc ctgcgaatcc tccggcagag 1980
ttttcggcta caaagtttgc ttcattcatc acccagtatt ccacaggaca agtgagcgtg 2040
gagattgaat gggagctgca gaaagaaaac agcaaacgct ggaatcccga agtgcagtat 2100
acatctaact atgcaaaatc tgccaacgtt gatttcactg tggacaacaa tggactttat 2160
actgagcctc gccccattgg cacccgttac ctcacccgtc cccngtaa 2208
<210> 37
<211> 2211
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 37
atggcttccg atggttatct tccagattgg ctcgaggaca acctctctga gggcatccgc 60
gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggatgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca gagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaaga gggttctcga accttttggt ctggttgagg aaggtgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcattggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc catttctcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caataacttt accttcagct acaccttcga ggacgtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgggggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt accggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggactgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800
gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactt 1920
aagcacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980
gagttttcgg ctacaaagtt tgcttcattc atcacccagt attctactgg ccaagtcagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100
tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgtcccat tggcacccgt tacctcaccc gtcccctgta a 2211
<210> 38
<211> 2211
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 38
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcatcggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780
tccagtgctt cgacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg actttaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaacaata actggggatt ccggcccaag agactcagct tcaagctctt caacatccag 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140
ctcaacaatg gcagccaagc cgtgggacgt tcatcctttt actgcctgga atatttccct 1200
tctcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgat 1320
caatacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaat 1500
tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560
ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680
acggacgaag aggaaattaa agccactaac cctgtggcca ccgaaagatt tgggaccgtg 1740
gcagtcaatt tccagagcag cagcacagac cctgcgaccg gagatgtgca tgctatggga 1800
gcattacctg gcatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcactcaat actccacagg acaagtgagc 2040
gtggaaattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100
tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta a 2211
<210> 39
<211> 2208
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 39
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctatgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg atccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaagttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtatgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggtaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacagacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca agtgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga agttcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
<210> 40
<211> 2208
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 40
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctatgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcaaac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaagttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcgggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggtaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacagacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca agtgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac gaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga agttcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
acagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
<210> 41
<211> 2208
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 41
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctatgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggtc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaagttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggtaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacagacgct ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca agtgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga agttcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
SEQUENCE LISTING
<110> The Regents of the University of California
<120> Adeno-Associated Virus Variants and Methods of Use Thereof
<150> US 61/829,735
<151> 2013-05-31
<160> 41
<170> PatentIn version 3.5
<210> 1
<211> 736
<212> PRT
<213> adeno-associated virus 1
<400> 1
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 2
<211> 735
<212> PRT
<213> adeno-associated virus 2
<400> 2
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 3
<211> 736
<212> PRT
<213> adeno-associated virus 3
<400> 3
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Gly
130 135 140
Ala Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Arg Gly Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Gly Thr Val Asn His Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 4
<211> 734
<212> PRT
<213> adeno-associated virus 4
<400> 4
Met Thr Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu
1 5 10 15
Gly Val Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro Lys
20 25 30
Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val
50 55 60
Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln
65 70 75 80
Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Gln Arg Leu Gln Gly Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Leu
115 120 125
Gly Leu Val Glu Gln Ala Gly Glu Thr Ala Pro Gly Lys Lys Arg Pro
130 135 140
Leu Ile Glu Ser Pro Gln Gln Pro Asp Ser Ser Thr Gly Ile Gly Lys
145 150 155 160
Lys Gly Lys Gln Pro Ala Lys Lys Lys Leu Val Phe Glu Asp Glu Thr
165 170 175
Gly Ala Gly Asp Gly Pro Pro Glu Gly Ser Thr Ser Gly Ala Met Ser
180 185 190
Asp Asp Ser Glu Met Arg Ala Ala Ala Gly Gly Ala Ala Val Glu Gly
195 200 205
Gly Gln Gly Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys
210 215 220
Asp Ser Thr Trp Ser Glu Gly His Val Thr Thr Thr Ser Thr Arg Thr
225 230 235 240
Trp Val Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Arg Leu Gly Glu
245 250 255
Ser Leu Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Asn Trp Gly Met Arg Pro Lys Ala Met Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Thr Ser Asn Gly Glu
305 310 315 320
Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Val Gln Ile Phe Ala Asp
325 330 335
Ser Ser Tyr Glu Leu Pro Tyr Val Met Asp Ala Gly Gln Glu Gly Ser
340 345 350
Leu Pro Pro Phe Pro Asn Asp Val Phe Met Val Pro Gln Tyr Gly Tyr
355 360 365
Cys Gly Leu Val Thr Gly Asn Thr Ser Gln Gln Gln Thr Asp Arg Asn
370 375 380
Ala Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly
385 390 395 400
Asn Asn Phe Glu Ile Thr Tyr Ser Phe Glu Lys Val Pro Phe His Ser
405 410 415
Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile
420 425 430
Asp Gln Tyr Leu Trp Gly Leu Gln Ser Thr Thr Thr Gly Thr Thr Leu
435 440 445
Asn Ala Gly Thr Ala Thr Thr Asn Phe Thr Lys Leu Arg Pro Thr Asn
450 455 460
Phe Ser Asn Phe Lys Lys Asn Trp Leu Pro Gly Pro Ser Ile Lys Gln
465 470 475 480
Gln Gly Phe Ser Lys Thr Ala Asn Gln Asn Tyr Lys Ile Pro Ala Thr
485 490 495
Gly Ser Asp Ser Leu Ile Lys Tyr Glu Thr His Ser Thr Leu Asp Gly
500 505 510
Arg Trp Ser Ala Leu Thr Pro Gly Pro Pro Met Ala Thr Ala Gly Pro
515 520 525
Ala Asp Ser Lys Phe Ser Asn Ser Gln Leu Ile Phe Ala Gly Pro Lys
530 535 540
Gln Asn Gly Asn Thr Ala Thr Val Pro Gly Thr Leu Ile Phe Thr Ser
545 550 555 560
Glu Glu Glu Leu Ala Ala Thr Asn Ala Thr Asp Thr Asp Met Trp Gly
565 570 575
Asn Leu Pro Gly Gly Asp Gln Ser Asn Ser Asn Leu Pro Thr Val Asp
580 585 590
Arg Leu Thr Ala Leu Gly Ala Val Pro Gly Met Val Trp Gln Asn Arg
595 600 605
Asp Ile Tyr Tyr Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp
610 615 620
Gly His Phe His Pro Ser Pro Leu Ile Gly Gly Phe Gly Leu Lys His
625 630 635 640
Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro
645 650 655
Ala Thr Thr Phe Ser Ser Thr Pro Val Asn Ser Phe Ile Thr Gln Tyr
660 665 670
Ser Thr Gly Gln Val Ser Val Gln Ile Asp Trp Glu Ile Gln Lys Glu
675 680 685
Arg Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Tyr Gly
690 695 700
Gln Gln Asn Ser Leu Leu Trp Ala Pro Asp Ala Ala Gly Lys Tyr Thr
705 710 715 720
Glu Pro Arg Ala Ile Gly Thr Arg Tyr Leu Thr His His Leu
725 730
<210> 5
<211> 724
<212> PRT
<213> adeno-associated virus 5
<400> 5
Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu
1 5 10 15
Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys
20 25 30
Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val
50 55 60
Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu
65 70 75 80
Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe
115 120 125
Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile
130 135 140
Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser
145 150 155 160
Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln
165 170 175
Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr
180 185 190
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
195 200 205
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
210 215 220
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
225 230 235 240
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
245 250 255
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
305 310 315 320
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
325 330 335
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
340 345 350
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
355 360 365
Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser
370 375 380
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
385 390 395 400
Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser
405 410 415
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
420 425 430
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln
435 440 445
Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
450 455 460
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly
465 470 475 480
Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu
485 490 495
Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr
500 505 510
Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile
515 520 525
Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu
530 535 540
Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg
545 550 555 560
Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser
565 570 575
Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro
580 585 590
Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
595 600 605
Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met
610 615 620
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn
625 630 635 640
Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser
645 650 655
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu
660 665 670
Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
675 680 685
Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp
690 695 700
Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu
705 710 715 720
Thr Arg Pro Leu
<210> 6
<211> 736
<212> PRT
<213> adeno-associated virus 6
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 7
<211> 737
<212> PRT
<213> adeno-associated virus 7
<400> 7
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Ala Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Val Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn
210 215 220
Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Ser Glu Thr Ala Gly Ser Thr Asn Asp Asn
260 265 270
Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Lys Leu Arg Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Ile Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ser Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Ser
405 410 415
Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ala
435 440 445
Arg Thr Gln Ser Asn Pro Gly Gly Thr Ala Gly Asn Arg Glu Leu Gln
450 455 460
Phe Tyr Gln Gly Gly Pro Ser Thr Met Ala Glu Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Phe Arg Gln Gln Arg Val Ser Lys Thr Leu Asp
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Val Leu Ile
530 535 540
Phe Gly Lys Thr Gly Ala Thr Asn Lys Thr Thr Leu Glu Asn Val Leu
545 550 555 560
Met Thr Asn Glu Glu Glu Ile Arg Pro Thr Asn Pro Val Ala Thr Glu
565 570 575
Glu Tyr Gly Ile Val Ser Ser Asn Leu Gln Ala Ala Asn Thr Ala Ala
580 585 590
Gln Thr Gln Val Val Asn Asn Gln Gly Ala Leu Pro Gly Met Val Trp
595 600 605
Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asn Pro Pro Glu Val Phe Thr Pro Ala Lys Phe Ala Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser
690 695 700
Asn Phe Glu Lys Gln Thr Gly Val Asp Phe Ala Val Asp Ser Gln Gly
705 710 715 720
Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn
725 730 735
Leu
<210> 8
<211> 738
<212> PRT
<213> adeno-associated virus 8
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly
450 455 460
Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile
530 535 540
Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 9
<211> 736
<212> PRT
<213> adeno-associated virus 9
<400> 9
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 10
<211> 735
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 10
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Lys Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asp Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asn Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Ser Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Gln
725 730 735
<210> 11
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 11
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Gln Arg Leu Gln Gly Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Gln Ala Gly Glu Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Leu Ile Glu Ser Pro Gln Gln Pro Asp Ser Ser Thr Gly Ile Gly
145 150 155 160
Lys Lys Gly Lys Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Asp Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 12
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Gln Arg Leu Gln Gly Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Gln Ala Gly Glu Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Leu Ile Glu Ser Pro Gln Gln Pro Asp Ser Ser Thr Gly Ile Gly
145 150 155 160
Lys Lys Gly Lys Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Asp Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Thr Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 13
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 13
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Ile Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Gln
725 730 735
<210> 14
<211> 23
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 14
gcggaagctt cgatcaacta cgc 23
<210> 15
<211> 41
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 15
ggggcggccg caattacaga ttacgagtca ggtatctggt g 41
<210> 16
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<220>
<221> misc_feature
<222> (5)..(6)
<223> n is a, c, g, or t
<400> 16
cattnnkgac cagtctagga actgg 25
<210> 17
<211> 90
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<220>
<221> misc_feature
<222> (21)..(22)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (69)..(70)
<223> n is a, c, g, or t
<400> 17
gccacaagga cgatgaagaa nnkttttttc ctcagagcgg ggttctcatc tttgggaagc 60
aaggctcann kaaaacaagt gtggacattg 90
<210> 18
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<220>
<221> misc_feature
<222> (18)..(19)
<223> n is a, c, g, or t
<400> 18
ccaacctcca gagaggcnnk agacaagcag ctacc 35
<210> 19
<211> 57
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<220>
<221> misc_feature
<222> (18)..(19)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (42)..(43)
<223> n is a, c, g, or t
<400> 19
ccaactacaa caagtctnnk aatgtggact ttactgtgga cnnkaatggc gtgtatt 57
<210> 20
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 20
catgggaaag gtgccagacg 20
<210> 21
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 21
accatcggca gccatacctg 20
<210> 22
<211> 2208
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 22
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctatgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggaacgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaagttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggtaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacagacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cggaaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca agtgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga agttcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atcagtaa 2208
<210> 23
<211> 2211
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 23
atggctgctg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggtga caacccctac ctcaagtaca accacgccga cgcggagttc 300
cagcagcggc ttcagggcga cacatcgttt gggggcaacc tcggcagagc agtcttccag 360
gccaaaaaga gggttcttga acctcttggt ctggttgagc aagcgggtga gacggctcct 420
ggaaagaaga gaccgttgat tgaatccccc cagcagcccg actcctccac gggtatcggc 480
aaaaaaggca agcagccggc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggtgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg acttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc agactatcag ctcccgtacg tgctcgggtc ggctcacgag 1080
ggctgcctcc cgccgttccc agcagacgtc ttcatggtgc cacagtatgg atacctcacc 1140
ctgaacaacg ggagtcaggc agtaggacgc tcttcatttt actgcctgga gtactttcct 1200
tctcagatgc tgcgtaccgg aaacaacttt accttcagct acacttttga ggacgttcct 1260
ttccacagca gctacgctca cagccagagt ctggaccgtc tcatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgggggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggactgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800
gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagt 2040
gtggaaattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100
tacacatcca attatgcaaa atctgccaac gttgatttta ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta a 2211
<210> 24
<211> 2211
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 24
atggctgctg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggtga caacccctac ctcaagtaca accacgccga cgcggagttc 300
cagcagcggc ttcagggcga cacatcgttt gggggcaacc tcggcagagc agtcttccag 360
gccaaaaaga gggttcttga acctcttggt ctggttgagc aagcgggtga gacggctcct 420
ggaaagaaga gaccgttgat tgaatccccc cagcagcccg actcctccac gggtatcggc 480
aaaaaaggca agcagccggc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggtgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg acttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc agactatcag ctcccgtacg tgctcgggtc ggctcacgag 1080
ggctgcctcc cgccgttccc agcagacgtc ttcatggtgc cacagtatgg atacctcacc 1140
ctgaacaacg ggagtcaggc agtaggacgc tcttcatttt actgcctgga gtactttcct 1200
tctcagatgc tgcgtaccgg aaacaacttt accttcagct acacttttga ggacgttcct 1260
ttccacagca gctacgctca cagccagagt ctggaccgtc tcatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgggggtc tccaactggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ctgaaagatt tgggactgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgccatggga 1800
gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc tatttgggcc 1860
aaaattcctc acacggatgg acactttcac ccgtctcctc tcatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100
tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta a 2211
<210> 25
<211> 2211
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 25
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg cgctgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggatgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcaatcgcca caagagccag actcctcctc gggcatcggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780
tccagtgctt cgacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg actttaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaacaaca actggggatt ccggcccaag agactcagct tcaagctctt caacatccag 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140
ctcaacaatg gcagccaagc cgtgggacgt tcatcctttt actgcctgga atatttccct 1200
tctcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgat 1320
caatacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaat 1500
tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560
ggcactgcta tggcctcaca taaagacgac gaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680
acagacgaag aggaaattaa agccactaac cctgtggcca ccgaaagatt tgggaccgtg 1740
gcagtcaatt tccagagcag cagcacagac cctgcgaccg gagatgtgca tgctatggga 1800
gcattacctg gcatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100
tatacatcta actatgcaaa atctgccaac attgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtccccagta a 2211
<210> 26
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 26
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Cys Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 27
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 27
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Val Asn Gln Gln Lys Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Thr Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 28
<211> 723
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 28
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Val Asn Gln Gln Lys Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Gln Val
305 310 315 320
Lys Glu Thr Thr Asp Val Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr
325 330 335
Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly
340 345 350
Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe Met
355 360 365
Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser Gln Ala Val
370 375 380
Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu
385 390 395 400
Arg Thr Gly Asn Asn Phe Thr Ser Tyr Thr Phe Glu Asp Val Pro Phe
405 410 415
His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro
420 425 430
Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr Gln Asn Gln Ser
435 440 445
Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser Arg Gly Ser Pro Thr
450 455 460
Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro Gly Pro Cys Tyr Arg
465 470 475 480
Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn Asn Asn Ser Asn Phe
485 490 495
Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn Gly Arg Glu Ser Ile
500 505 510
Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys Asp Asp Glu Asp Lys
515 520 525
Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly Lys Glu Ser Ala Gly
530 535 540
Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile Thr Asp Glu Glu Ala
545 550 555 560
Thr Asn Pro Val Ala Thr Glu Arg Phe Gly Thr Val Ala Val Asn Leu
565 570 575
Gln Ser Ser Pro Ala Thr Asp Val His Ala Met Gly Ala Leu Pro Gly
580 585 590
Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala
595 600 605
Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly
610 615 620
Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr
625 630 635 640
Pro Val Pro Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala
645 650 655
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu
660 665 670
Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln
675 680 685
Tyr Thr Ser Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp
690 695 700
Asn Asn Gly Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu
705 710 715 720
Thr Arg Pro
<210> 29
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 29
Met Ala Ser Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Arg Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 30
<211> 736
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 30
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 31
<211> 735
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 31
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Lys Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asp Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Ser Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 32
<211> 735
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 32
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asn Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Lys Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Arg Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asp Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Ser Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 33
<211> 735
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic amino acid sequence
<400> 33
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Lys Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asp Ala Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Ser Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 34
<211> 2211
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 34
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggatgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac cttcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga gggttctcga acctctcggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcattggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg acttcaacag attccactgc cacttttcac cacgtgactg gcaaagactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaagctctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acgaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag ttgccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt accggcagca gtgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggactgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800
gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc tatttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100
tacacatcca attatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta a 2211
<210> 35
<211> 2211
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 35
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gaatggtggg acttgaaacc tggagccccg aaacccaaag tcaaccagca aaagcaggac 120
aacgctcggg gtcttgtgct tccgggttac aaatacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac cttcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc ttggacgagc agtcttccag 360
gccaagaaga gggttctcga accttttggt ctggttgagg aaggtgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcattggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg acttcaacag attccactgc cacttttcac cacgtgactg gcaaagactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaagctctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acgaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag ttgccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caataacttt accttcagct acacttttga ggacgttcct 1260
ttccacagca gctacgctca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccaactggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ctgaaagatt tgggactgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgccatggga 1800
gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc tatttgggcc 1860
aaaattcctc acacggatgg acactttcac ccgtctcctc tcatgggcgg ctttggactt 1920
aagcacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980
gagttttcgg ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100
tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta a 2211
<210> 36
<211> 2208
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<220>
<221> misc_feature
<222> (955)..(955)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (971)..(972)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (981)..(981)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (986)..(986)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1235)..(1235)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1694)..(1696)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1698)..(1698)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1763)..(1765)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (1778)..(1778)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (2204)..(2204)
<223> n is a, c, g, or t
<400> 36
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gaatggtggg acttgaaacc tggagccccg aaacccaaag tcaaccagca aaagcaggac 120
aacgctcggg gtcttgtgct tccgggttac aaatacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac cttcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc ttggacgagc agtcttccag 360
gccaagaaga gggttctcga accttttggt ctggttgagg aaggtgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcattggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaataaca attggggatt ccggcccaag agactcaact tcaaactctt caacntccaa 960
gtcaaggagg nnacgacgaa ngatgncgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caataacttt acctncagct acacttttga ggacgttcct 1260
ttccacagca gctacgctca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccaactggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag agannncnaa gccactaacc ccgtggccac tgaaagattt gggactgtgg 1740
cagtcaatct ccaagcagca cannnaccct gcgaccgnag atgtgcatgc catgggagcc 1800
ttacctggaa tggtgtggca agacagagac gtatacctgc agggtcctat ttgggccaaa 1860
attcctcaca cggatggaca ctttcacccg tctcctctca tgggcggctt tggacttaag 1920
cacccgcctc ctcagatcct catcaaaaac acgcctgttc ctgcgaatcc tccggcagag 1980
ttttcggcta caaagtttgc ttcattcatc acccagtatt ccacaggaca agtgagcgtg 2040
gagattgaat gggagctgca gaaagaaaac agcaaacgct ggaatcccga agtgcagtat 2100
acatctaact atgcaaaatc tgccaacgtt gatttcactg tggacaacaa tggactttat 2160
actgagcctc gccccattgg cacccgttac ctcacccgtc cccngtaa 2208
<210> 37
<211> 2211
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 37
atggcttccg atggttatct tccagattgg ctcgaggaca acctctctga gggcatccgc 60
gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggatgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca gagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaaga gggttctcga accttttggt ctggttgagg aaggtgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcattggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc catttctcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caataacttt accttcagct acaccttcga ggacgtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgggggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt accggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggactgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800
gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactt 1920
aagcacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980
gagttttcgg ctacaaagtt tgcttcattc atcacccagt attctactgg ccaagtcagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100
tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgtcccat tggcacccgt tacctcaccc gtcccctgta a 2211
<210> 38
<211> 2211
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 38
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcatcggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780
tccagtgctt cgacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg actttaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaacaata actggggatt ccggcccaag agactcagct tcaagctctt caacatccag 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140
ctcaacaatg gcagccaagc cgtgggacgt tcatcctttt actgcctgga atatttccct 1200
tctcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgat 1320
caatacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaat 1500
tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560
ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680
acggacgaag aggaaattaa agccactaac cctgtggcca ccgaaagatt tgggaccgtg 1740
gcagtcaatt tccagagcag cagcacagac cctgcgaccg gagatgtgca tgctatggga 1800
gcattacctg gcatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcactcaat actccacagg acaagtgagc 2040
gtggaaattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100
tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta a 2211
<210> 39
<211> 2208
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 39
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctatgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg atccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaagttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtatgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggtaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacagacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca agtgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga agttcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
<210> 40
<211> 2208
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 40
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctatgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcaaac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaagttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcgggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggtaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacagacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca agtgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac gaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga agttcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
acagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
<210> 41
<211> 2208
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 41
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctatgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggtc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaagttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggtaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacagacgct ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca agtgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga agttcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
Claims (60)
- (a)配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質、ならびに
(b)異種核酸
を含む、感染性組換えアデノ随伴ウイルス(rAAV)ビリオン。 - 前記変異体AAVカプシドタンパク質が、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含む、請求項1に記載の前記感染性rAAV。
- 前記変異体AAVカプシドタンパク質が、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列を含む、請求項1に記載の前記感染性rAAV。
- (a)配列番号10に記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ配列番号2と比べてアミノ酸置換N312K、N449D、D472N、N551S、I698V、及びL735Qを含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質、ならびに
(b)異種核酸
を含む、感染性組換えアデノ随伴ウイルス(rAAV)ビリオン。 - 前記変異体AAVカプシドタンパク質が配列番号10に記載されるアミノ酸配列を含む、請求項4に記載の前記感染性rAAV。
- AAV2(野生型AAV血清型2)によって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を示す、請求項1または請求項4に記載の前記感染性rAAV。
- 前記rAAVビリオンが、AAV2によって示される耐性よりも少なくとも約1.5倍高いヒトAAV中和抗体への耐性を示す、請求項6に記載の前記感染性rAAV。
- 前記rAAVビリオンが、AAV2によって示される耐性よりも少なくとも約3倍高いヒトAAV中和抗体への耐性を示す、請求項6に記載の前記感染性rAAV。
- 前記rAAVビリオンが、AAV2によって示される耐性よりも少なくとも約5倍高いヒトAAV中和抗体への耐性を示す、請求項6に記載の前記感染性rAAV。
- 前記rAAVビリオンが、AAV2によって示される耐性よりも少なくとも約10倍高いヒトAAV中和抗体への耐性を示す、請求項6に記載の前記感染性rAAV。
- 前記rAAVビリオンが、AAV2によって示される耐性よりも少なくとも約30倍高いヒトAAV中和抗体への耐性を示す、請求項6に記載の前記感染性rAAV。
- 野生型AAV血清型2(AAV2)によって示される哺乳類細胞への形質導入と比較して、ヒトAAV中和抗体の存在下における哺乳類細胞への増加した形質導入を示す、請求項1または4に記載の前記感染性rAAV。
- 前記哺乳類細胞が、肝臓細胞、膵臓細胞、骨格筋細胞、心筋細胞、線維芽細胞、網膜細胞、滑膜関節細胞、肺細胞、T細胞、ニューロン、グリア細胞、幹細胞、内皮細胞、または癌細胞である、請求項12に記載の前記感染性rAAV。
- 前記幹細胞が、造血幹細胞、造血前駆細胞、神経幹細胞、神経前駆細胞、神経堤幹細胞、胚幹細胞、誘導多能性幹細胞(iPS細胞)、間葉幹細胞、中胚葉幹細胞、肝臓幹細胞、膵臓幹細胞、膵臓前駆細胞、筋幹細胞、または網膜幹細胞である、請求項13に記載の前記感染性rAAV。
- 前記異種核酸がRNA干渉剤を含む、請求項1または請求項4に記載の前記感染性rAAV。
- 前記異種核酸が、ポリペプチドをコードするヌクレオチド配列を含む、請求項1または請求項4に記載の前記感染性rAAV。
- 配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む変異体アデノ随伴ウイルス(AAV)カプシドタンパク質をコードするヌクレオチド配列を含む、単離核酸。
- 前記コードされた変異体AAVカプシドタンパク質が、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含む、請求項17に記載の前記単離核酸。
- 前記コードされた変異体AAVカプシドタンパク質が、配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列を含む、請求項17に記載の前記単離核酸。
- 配列番号10に記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ配列番号2と比べてアミノ酸置換N312K、N449D、D472N、N551S、I698V、及びL735Qを含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質
をコードするヌクレオチド配列を含む、単離核酸。 - 前記コードされた変異体AAVカプシドタンパク質が、AAV2(野生型AAV血清型2)によって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える、請求項17または請求項20に記載の前記単離核酸。
- 前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約1.5倍高い、請求項21に記載の前記単離核酸。
- 前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約3倍高い、請求項21に記載の前記単離核酸。
- 前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約5倍高い、請求項21に記載の前記単離核酸。
- 前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約10倍高い、請求項21に記載の前記単離核酸。
- 前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約30倍高い、請求項21に記載の前記単離核酸。
- 前記変異体AAVカプシドタンパク質が、AAV2(野生型AAV血清型2)によって示される形質導入と比較して、ヒトAAV中和抗体の存在下における哺乳類細胞への増加した形質導入を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える、請求項17または20に記載の前記単離核酸。
- 請求項17に記載の前記核酸を含む、単離宿主細胞。
- 請求項20に記載の前記核酸を含む、単離宿主細胞。
- 前記核酸で安定的にトランスフェクトされる、請求項28または請求項29に記載の前記単離宿主細胞。
- AAVrepタンパク質をコードするヌクレオチド配列を含む核酸をさらに含む、請求項28または請求項29に記載の前記単離宿主細胞。
- 組換えAAVベクターをさらに含む、請求項28または請求項29に記載の前記単離宿主細胞。
- 標的細胞を請求項1または請求項4に記載のビリオンに接触させることを含む、異種核酸を前記標的細胞に送達する方法。
- 前記標的細胞が、肝臓細胞、膵臓細胞、骨格筋細胞、心筋細胞、線維芽細胞、網膜細胞、滑膜関節細胞、肺細胞、T細胞、ニューロン、グリア細胞、幹細胞、内皮細胞、または癌細胞である、請求項33に記載の前記方法。
- 前記幹細胞が、造血幹細胞、造血前駆細胞、神経幹細胞、神経前駆細胞、神経堤幹細胞、胚幹細胞、誘導多能性幹細胞(iPS細胞)、間葉幹細胞、中胚葉幹細胞、肝臓幹細胞、膵臓幹細胞、膵臓前駆細胞、筋幹細胞、または網膜幹細胞である、請求項34に記載の前記方法。
- 前記標的細胞がインビトロである、請求項33に記載の前記方法。
- 前記標的細胞がインビボである、請求項33に記載の前記方法。
- 個体に、有効量の請求項1または請求項4に記載の感染性組換えアデノ随伴ウイルス(rAAV)ビリオンを投与するステップを含む、遺伝子産物を、それを必要とする前記個体に送達する方法。
- 前記異種核酸がRNA干渉剤を含む、請求項38に記載の前記方法。
- 前記異種核酸がポリペプチドをコードするヌクレオチド配列を含む、請求項38に記載の前記方法。
- 前記投与ステップが前記感染性rAAVビリオンの間接的送達を含む、請求項38に記載の前記方法。
- 前記投与ステップが前記感染性rAAVビリオンの直接的送達を含む、請求項38に記載の前記方法。
- 配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質。
- 配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含む、請求項43に記載の前記変異体AAVカプシドタンパク質。
- 配列番号11~13及び26~33のうちの1つに記載されるアミノ酸配列を含む、請求項43に記載の前記変異体AAVカプシドタンパク質。
- 配列番号10に記載されるアミノ酸配列のアミノ酸203~736と少なくとも約95%のアミノ酸配列同一性を有するアミノ酸配列を含み、かつ配列番号2と比べてアミノ酸置換N312K、N449D、D472N、N551S、I698V、及びL735Qを含む、変異体アデノ随伴ウイルス(AAV)カプシドタンパク質。
- 配列番号10に記載される前記アミノ酸配列を含む、請求項46に記載の前記変異体AAVカプシドタンパク質。
- 前記変異体AAVカプシドタンパク質が、AAV2(野生型AAV血清型2)によって示される耐性と比較して、ヒトAAV中和抗体への上昇した耐性を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える、請求項43または請求項46に記載の前記変異体AAVカプシドタンパク質。
- 前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約1.5倍高い、請求項48に記載の前記変異体AAVカプシドタンパク質。
- 前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約3倍高い、請求項48に記載の前記変異体AAVカプシドタンパク質。
- 前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約5倍高い、請求項48に記載の前記変異体AAVカプシドタンパク質。
- 前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約10倍高い、請求項48に記載の前記変異体AAVカプシドタンパク質。
- 前記上昇した耐性が、AAV2によって示される耐性よりも少なくとも約30倍高い、請求項48に記載の前記変異体AAVカプシドタンパク質。
- AAV2(野生型AAV血清型2)によって示される形質導入と比較して、ヒトAAV中和抗体の存在下における哺乳類細胞への増加した形質導入を、感染性組換えアデノ随伴ウイルス(rAAV)ビリオンに与える、請求項43または請求項46に記載の前記変異体AAVカプシドタンパク質。
- (i)それぞれが変異体アデノ随伴ウイルス(AAV)カプシドタンパク質及び異種核酸を含む、2つ以上の感染性rAAVビリオン、
(ii)それぞれが変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含む、2つ以上の単離核酸、
(iii)それぞれが変異体AAVカプシドタンパク質をコードするヌクレオチド配列を含む核酸を含む、2つ以上の宿主細胞、ならびに
(iv)2つ以上の変異体AAVカプシドタンパク質
のうちの少なくとも1つを含むライブラリであって、
前記ライブラリの少なくとも1つのメンバーの前記変異体AAVカプシドタンパク質が、配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列と比べて少なくとも1つのアミノ酸置換を有するアミノ酸配列を含む、前記ライブラリ。 - スターターカプシドタンパク質を含むスタータービリオンと比べて変化した感染特性を示す、改変感染性組換えアデノ随伴ウイルス(rAAV)ビリオンを生成及び特定する方法であって、
(a)前記スターターカプシドタンパク質から変異体アデノ随伴ウイルス(AAV)カプシドタンパク質を生成するステップであって、前記スターターカプシドタンパク質が配列番号10~13及び26~33のうちの1つに記載されるアミノ酸配列を含み、かつそれぞれの変異体AAVカプシドタンパク質が前記スターターカプシドタンパク質と比べて少なくとも1つのアミノ酸置換を含む、ステップと、
(b)それぞれがステップ(a)で生成された変異体カプシドAAVタンパク質を含む、変異体AAVビリオンを生成するステップと、
(c)ステップ(b)で生成された変異体AAVビリオンを変化した感染特性についてアッセイして、前記改変感染性rAAVビリオンを特定するステップと
を含む、前記方法。 - 変異体AAVカプシドタンパク質の前記ライブラリの生成が、ポリメラーゼ連鎖反応突然変異誘発、オリゴヌクレオチド特異的突然変異誘発、飽和突然変異誘発、ループスワップ突然変異誘発、断片シャフリング突然変異誘発、及びそれらの組み合わせから成る群から選択される突然変異誘発方法を含む、請求項56に記載の前記方法。
- 前記変化した感染特性が、前記スタータービリオンによって示される耐性と比較して、ヒト中和AAV抗体への上昇した耐性である、請求項56に記載の前記方法。
- 前記変化した感染特性が、前記スタータービリオンによって示される形質導入と比較して、ヒトAAV中和抗体の存在下における哺乳類細胞への増加した形質導入である、請求項56に記載の前記方法。
- 改変感染性rAAVビリオンが、前記スターターカプシドタンパク質と少なくとも約90%のアミノ酸配列同一性を有するアミノ酸配列を含む改変AAVカプシドタンパク質を含む、請求項56に記載の前記方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361829735P | 2013-05-31 | 2013-05-31 | |
US61/829,735 | 2013-05-31 | ||
JP2019135745A JP7069088B2 (ja) | 2013-05-31 | 2019-07-24 | アデノ随伴ウイルス変異体及びその使用方法 |
JP2022052809A JP2022097480A (ja) | 2013-05-31 | 2022-03-29 | アデノ随伴ウイルス変異体及びその使用方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022052809A Division JP2022097480A (ja) | 2013-05-31 | 2022-03-29 | アデノ随伴ウイルス変異体及びその使用方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024026872A true JP2024026872A (ja) | 2024-02-28 |
Family
ID=51989402
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016517017A Active JP6600624B2 (ja) | 2013-05-31 | 2014-05-29 | アデノ随伴ウイルス変異体及びその使用方法 |
JP2019135745A Active JP7069088B2 (ja) | 2013-05-31 | 2019-07-24 | アデノ随伴ウイルス変異体及びその使用方法 |
JP2022052809A Pending JP2022097480A (ja) | 2013-05-31 | 2022-03-29 | アデノ随伴ウイルス変異体及びその使用方法 |
JP2024006465A Pending JP2024026872A (ja) | 2013-05-31 | 2024-01-19 | アデノ随伴ウイルス変異体及びその使用方法 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016517017A Active JP6600624B2 (ja) | 2013-05-31 | 2014-05-29 | アデノ随伴ウイルス変異体及びその使用方法 |
JP2019135745A Active JP7069088B2 (ja) | 2013-05-31 | 2019-07-24 | アデノ随伴ウイルス変異体及びその使用方法 |
JP2022052809A Pending JP2022097480A (ja) | 2013-05-31 | 2022-03-29 | アデノ随伴ウイルス変異体及びその使用方法 |
Country Status (8)
Country | Link |
---|---|
US (4) | US11136557B2 (ja) |
EP (1) | EP3003391B1 (ja) |
JP (4) | JP6600624B2 (ja) |
CN (1) | CN105247044B (ja) |
CA (1) | CA2907799A1 (ja) |
ES (1) | ES2897508T3 (ja) |
HK (1) | HK1223016A1 (ja) |
WO (1) | WO2014194132A1 (ja) |
Families Citing this family (97)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9441244B2 (en) | 2003-06-30 | 2016-09-13 | The Regents Of The University Of California | Mutant adeno-associated virus virions and methods of use thereof |
US8663624B2 (en) | 2010-10-06 | 2014-03-04 | The Regents Of The University Of California | Adeno-associated virus virions with variant capsid and methods of use thereof |
SG10202110919YA (en) | 2011-04-22 | 2021-11-29 | Univ California | Adeno-associated virus virions with variant capsid and methods of use thereof |
US11136557B2 (en) | 2013-05-31 | 2021-10-05 | The Regents Of The University Of California | Adeno-associated virus variants and methods of use thereof |
US10000741B2 (en) | 2014-03-17 | 2018-06-19 | Adverum Biotechnologies, Inc. | Compositions and methods for enhanced gene expression in cone cells |
WO2015164757A1 (en) * | 2014-04-25 | 2015-10-29 | Oregon Health & Science University | Methods of viral neutralizing antibody epitope mapping |
EP3151866B1 (en) | 2014-06-09 | 2023-03-08 | Voyager Therapeutics, Inc. | Chimeric capsids |
EP3215191A4 (en) | 2014-11-05 | 2018-08-01 | Voyager Therapeutics, Inc. | Aadc polynucleotides for the treatment of parkinson's disease |
JP6863891B2 (ja) | 2014-11-14 | 2021-04-21 | ボイジャー セラピューティクス インコーポレイテッドVoyager Therapeutics,Inc. | 調節性ポリヌクレオチド |
CN114717264A (zh) | 2014-11-14 | 2022-07-08 | 沃雅戈治疗公司 | 治疗肌萎缩性侧索硬化(als)的组合物和方法 |
US11697825B2 (en) | 2014-12-12 | 2023-07-11 | Voyager Therapeutics, Inc. | Compositions and methods for the production of scAAV |
JP7095994B2 (ja) | 2015-03-02 | 2022-07-05 | アドヴェラム バイオテクノロジーズ, インコーポレイテッド | ポリヌクレオチドを網膜錐体に硝子体内送達するための組成物及び方法 |
AU2016235163B2 (en) | 2015-03-24 | 2022-03-24 | The Regents Of The University Of California | Adeno-associated virus variants and methods of use thereof |
BR112018003665A2 (pt) | 2015-09-28 | 2018-09-25 | Univ North Carolina Chapel Hill | métodos e composições para vetores virais de evasão de anticorpo |
WO2017075335A1 (en) | 2015-10-28 | 2017-05-04 | Voyager Therapeutics, Inc. | Regulatable expression using adeno-associated virus (aav) |
SG10201912763QA (en) | 2015-11-05 | 2020-02-27 | Bamboo Therapeutics Inc | Modified friedreich ataxia genes and vectors for gene therapy |
US10983110B2 (en) | 2015-12-02 | 2021-04-20 | Voyager Therapeutics, Inc. | Assays for the detection of AAV neutralizing antibodies |
WO2017143100A1 (en) * | 2016-02-16 | 2017-08-24 | The Board Of Trustees Of The Leland Stanford Junior University | Novel recombinant adeno-associated virus capsids resistant to pre-existing human neutralizing antibodies |
US11185555B2 (en) | 2016-04-11 | 2021-11-30 | Noah James Harrison | Method to kill pathogenic microbes in a patient |
EP3448371A4 (en) * | 2016-04-28 | 2019-09-11 | Spark Therapeutics, Inc. | TESTING THE RELATIVE EFFECTIVENESS OF ISOMERHYDROLASES FOR THE CODING OF VIRAL VECTORS |
US11299751B2 (en) | 2016-04-29 | 2022-04-12 | Voyager Therapeutics, Inc. | Compositions for the treatment of disease |
CN109476707B (zh) | 2016-05-13 | 2022-12-02 | 4D分子治疗有限公司 | 腺相关病毒变体衣壳和其使用方法 |
BR112018073384A2 (pt) | 2016-05-18 | 2019-03-06 | Voyager Therapeutics, Inc. | polinucleotídeos moduladores |
WO2017201258A1 (en) | 2016-05-18 | 2017-11-23 | Voyager Therapeutics, Inc. | Compositions and methods of treating huntington's disease |
CA2971303A1 (en) | 2016-06-21 | 2017-12-21 | Bamboo Therapeutics, Inc. | Optimized mini-dystrophin genes and expression cassettes and their use |
WO2018022608A2 (en) * | 2016-07-26 | 2018-02-01 | Biomarin Pharmaceutical Inc. | Novel adeno-associated virus capsid proteins |
KR20230039779A (ko) | 2016-07-29 | 2023-03-21 | 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 | 변이체 캡시드를 갖는 아데노-관련된 바이러스 비리온 및 이의 사용 방법 |
KR20190065251A (ko) * | 2016-08-18 | 2019-06-11 | 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 | 모듈러 AAV 전달 시스템을 통한 CRISPR-Cas 게놈 가공 |
EP3506817A4 (en) | 2016-08-30 | 2020-07-22 | The Regents of The University of California | METHOD FOR BIOMEDICAL TARGETING AND RELEASE, AND DEVICES AND SYSTEMS FOR IMPLEMENTING THEM |
CA3040179A1 (en) | 2016-10-19 | 2018-04-26 | Adverum Biotechnologies, Inc. | Modified aav capsids and uses thereof |
CN110462037A (zh) * | 2017-01-30 | 2019-11-15 | 学校法人日本医科大学 | 腺相关病毒(aav)衣壳蛋白的突变体 |
JP2020513814A (ja) * | 2017-03-14 | 2020-05-21 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | Crispr cas9免疫ステルス(immune stealth)の操作 |
JP7343903B2 (ja) | 2017-03-17 | 2023-09-13 | アドヴェラム バイオテクノロジーズ, インコーポレイテッド | 遺伝子発現増強のための組成物および方法 |
WO2018204786A1 (en) | 2017-05-05 | 2018-11-08 | Voyager Therapeutics, Inc. | Compositions and methods of treating amyotrophic lateral sclerosis (als) |
US11752181B2 (en) | 2017-05-05 | 2023-09-12 | Voyager Therapeutics, Inc. | Compositions and methods of treating Huntington's disease |
JP7330899B2 (ja) | 2017-05-10 | 2023-08-22 | マサチューセッツ アイ アンド イヤー インファーマリー | ウイルスのアセンブリ活性化タンパク質(aap)依存性を改変する方法および組成物 |
CN110831611A (zh) * | 2017-05-10 | 2020-02-21 | 马萨诸塞眼科耳科诊所 | 用于修饰病毒的组装活化蛋白(aap)依赖性的方法和组合物 |
CA3062614A1 (en) * | 2017-05-10 | 2018-11-15 | University Of Utah Research Foundation | Compositions and methods of use of arc capsids |
WO2018222503A1 (en) * | 2017-05-31 | 2018-12-06 | The Regents Of The University Of California | Adeno-associated virus with variant capsid and methods of use thereof |
JOP20190269A1 (ar) | 2017-06-15 | 2019-11-20 | Voyager Therapeutics Inc | بولي نوكليوتيدات aadc لعلاج مرض باركنسون |
JP7229989B2 (ja) | 2017-07-17 | 2023-02-28 | ボイジャー セラピューティクス インコーポレイテッド | 軌道アレイガイドシステム |
MX2020001187A (es) | 2017-08-03 | 2020-10-05 | Voyager Therapeutics Inc | Composiciones y métodos para la administración de virus adenoasociados. |
US11680249B2 (en) | 2017-08-28 | 2023-06-20 | The Regents Of The University Of California | Adeno-associated virus capsid variants and methods of use thereof |
PE20201264A1 (es) | 2017-09-20 | 2020-11-19 | 4D Molecular Therapeutics Inc | Variantes de capsides de virus adenoasociados y metodos de uso de estas |
WO2019079240A1 (en) | 2017-10-16 | 2019-04-25 | Voyager Therapeutics, Inc. | TREATMENT OF AMYOTROPHIC LATERAL SCLEROSIS (ALS) |
US20200237799A1 (en) | 2017-10-16 | 2020-07-30 | Voyager Therapeutics, Inc. | Treatment of amyotrophic lateral sclerosis (als) |
DK3717636T3 (da) | 2017-11-27 | 2023-05-30 | 4D Molecular Therapeutics Inc | Adeno-associeret-virus-variantcapsider og anvendelse til inhibering af angiogenese |
EP3744846A4 (en) * | 2018-01-26 | 2021-11-17 | Tokushima University | NEW ADENO-ASSOCIATED VIRUS VIRION TO TREAT TAY-SACHS DISEASE AND SANDHOFF'S DISEASE |
US10610606B2 (en) | 2018-02-01 | 2020-04-07 | Homology Medicines, Inc. | Adeno-associated virus compositions for PAH gene transfer and methods of use thereof |
EP3755795A4 (en) | 2018-02-19 | 2022-07-20 | Homology Medicines, Inc. | ADENO-ASSOCIATED VIRUS COMPOSITIONS FOR RECOVERING F8 GENE FUNCTION AND METHODS OF USE THEREOF |
JP7378417B2 (ja) * | 2018-03-30 | 2023-11-13 | ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー | 増強されたヒト膵臓トロピズムを有する新規な組換えアデノ随伴ウイルスキャプシド |
EP3774854A1 (en) * | 2018-04-03 | 2021-02-17 | Stridebio, Inc. | Antibody-evading virus vectors |
EP3799568A4 (en) * | 2018-05-04 | 2022-07-06 | Oregon Health & Science University | HUMAN ANTI-AAV2 CAPSID POLYCLONAL ANTIBODY EPITOPES |
WO2019217911A1 (en) * | 2018-05-11 | 2019-11-14 | Massachusetts Eye And Ear Infirmary | Liver-specific tropism of adeno-associated viruses |
TW202005978A (zh) | 2018-05-14 | 2020-02-01 | 美商拜奧馬林製藥公司 | 新穎肝靶向腺相關病毒載體 |
US20210230632A1 (en) | 2018-05-15 | 2021-07-29 | Voyager Therapeutics, Inc. | Compositions and methods for delivery of aav |
BR112020023082A2 (pt) | 2018-05-15 | 2021-02-09 | Voyager Therapeutics, Inc. | composições e métodos para o tratamento de doença de parkinson |
US20210180087A1 (en) * | 2018-08-18 | 2021-06-17 | President And Fellows Of Harvard College | In situ gene editing |
WO2020069461A1 (en) | 2018-09-28 | 2020-04-02 | Voyager Therapeutics, Inc. | Frataxin expression constructs having engineered promoters and methods of use thereof |
WO2020077165A1 (en) | 2018-10-12 | 2020-04-16 | Voyager Therapeutics, Inc. | Compositions and methods for delivery of aav |
UY38407A (es) | 2018-10-15 | 2020-05-29 | Novartis Ag | Anticuerpos estabilizadores de trem2 |
US20220064671A1 (en) | 2019-01-18 | 2022-03-03 | Voyager Therapeutics, Inc. | Methods and systems for producing aav particles |
TW202039856A (zh) * | 2019-03-28 | 2020-11-01 | 西班牙商艾斯提夫製藥股份有限公司 | 製造重組病毒載體之方法 |
US20240124889A1 (en) | 2019-05-07 | 2024-04-18 | Voyager Therapeutics, Inc. | Compositions and methods for the vectored augmentation of protein destruction, expression and/or regulation |
WO2020261178A1 (en) | 2019-06-27 | 2020-12-30 | Pfizer Inc. | Methods of treating duchenne muscular dystrophy using aav mini-dystrophin gene therapy |
WO2021009805A1 (ja) * | 2019-07-12 | 2021-01-21 | 株式会社遺伝子治療研究所 | ヒト肝臓への遺伝子導入のためのアデノ随伴ウイルスビリオン |
WO2021046155A1 (en) | 2019-09-03 | 2021-03-11 | Voyager Therapeutics, Inc. | Vectorized editing of nucleic acids to correct overt mutations |
CN113518824B (zh) * | 2019-10-16 | 2024-02-23 | 上海药明康德新药开发有限公司 | 新的aav变体 |
MX2022004352A (es) | 2019-10-17 | 2022-07-19 | Stridebio Inc | Vectores virales adenoasociados para el tratamiento de la enfermedad de niemann-pick tipo c. |
TW202140791A (zh) | 2020-01-13 | 2021-11-01 | 美商霍蒙拉奇醫藥公司 | 治療苯酮尿症之方法 |
CA3180222A1 (en) | 2020-04-15 | 2021-10-21 | Voyager Therapeutics, Inc. | Tau binding compounds |
US11499166B2 (en) * | 2020-04-27 | 2022-11-15 | 4D Molecular Therapeutics Inc. | Adeno-associated variants, formulations and methods for pulmonary delivery |
TWI769795B (zh) | 2020-04-27 | 2022-07-01 | 美商4D分子療法公司 | 密碼子優化的gla基因及其用途 |
US20230203102A1 (en) | 2020-05-13 | 2023-06-29 | Voyager Therapeutics, Inc. | Redirection of tropism of aav capsids |
CN111574595B (zh) * | 2020-05-22 | 2022-10-04 | 中国医学科学院血液病医院(中国医学科学院血液学研究所) | 腺相关病毒突变体及其应用 |
US20230048732A1 (en) * | 2020-05-26 | 2023-02-16 | Shape Therapeutics Inc. | High throughput engineering of functional aav capsids |
WO2021247995A2 (en) | 2020-06-04 | 2021-12-09 | Voyager Therapeutics, Inc. | Compositions and methods of treating neuropathic pain |
CA3190309A1 (en) | 2020-07-27 | 2022-02-03 | Voyager Therapeutics, Inc. | Compositions and methods for the treatment of neurological disorders related to glucosylceramidase beta deficiency |
US20230285596A1 (en) | 2020-07-27 | 2023-09-14 | Voyager Therapeutics, Inc | Compositions and methods for the treatment of niemann-pick type c1 disease |
CN112226461B (zh) * | 2020-08-21 | 2022-04-22 | 华侨大学 | Cd4阳性细胞特异性基因传递载体及其应用 |
JP2023548816A (ja) | 2020-11-03 | 2023-11-21 | ファイザー・インク | 陰イオン交換クロマトグラフィーによるaavベクターの精製方法 |
US20240052322A1 (en) | 2020-12-15 | 2024-02-15 | Pfizer Inc. | HILIC UPLC-MS Method For Separating and Analyzing Intact Adeno-Associated Virus Capsid Proteins |
AU2021404944A1 (en) | 2020-12-23 | 2023-07-06 | Pfizer Inc. | Methods for purification of aav vectors by affinity chromatography |
WO2022208342A1 (en) | 2021-04-01 | 2022-10-06 | Pfizer Inc. | Pharmaceutical compositions containing adeno-associated viral vector |
JP2024515902A (ja) | 2021-04-26 | 2024-04-10 | アレクシオン ファーマ インターナショナル オペレーションズ リミテッド | 組織向性が改善されたアデノ随伴ウイルスベクターカプシド |
KR20240023638A (ko) | 2021-06-22 | 2024-02-22 | 화이자 인코포레이티드 | 곤충 세포에서의 아데노-연관 바이러스 벡터의 생산 |
CA3234811A1 (en) | 2021-10-20 | 2023-04-27 | Steven Goldman | Rejuvenation treatment of age-related white matter loss |
WO2023081633A1 (en) | 2021-11-02 | 2023-05-11 | University Of Rochester | Tcf7l2 mediated remyelination in the brain |
WO2023114816A1 (en) | 2021-12-14 | 2023-06-22 | Neurogene, Inc. | Recombinant optimized galc constructs and methods for treating galc-associated disorders |
CN114276419B (zh) * | 2021-12-30 | 2023-11-17 | 上海勉亦生物科技有限公司 | 肌肉高亲和性的新型腺相关病毒衣壳蛋白及其应用 |
GB202201242D0 (en) | 2022-01-31 | 2022-03-16 | Univ Edinburgh | Recombinant optimized mecp2 cassettes and methods for treating rett syndrome and related disorders |
WO2023207918A1 (en) * | 2022-04-25 | 2023-11-02 | Beijing Hanmoluojie Technology Co., Ltd. | Aav capsid 3d molecular surface feature mapping |
GB202206336D0 (en) | 2022-04-29 | 2022-06-15 | Univ Edinburgh | Recombinant therapeutic FMR1 constructs and methods of treating fragile X syndrome and related disorders |
WO2023214346A1 (en) | 2022-05-06 | 2023-11-09 | Novartis Ag | Novel recombinant aav vp2 fusion polypeptides |
WO2023240062A1 (en) | 2022-06-07 | 2023-12-14 | Adverum Biotechnologies, Inc. | Melanopsin variants for vision restoration |
WO2024003687A1 (en) | 2022-06-28 | 2024-01-04 | Pfizer Inc. | Nucleic acids encoding acid alpha-glucosidase (gaa) and vectors for gene therapy |
WO2024038365A1 (en) | 2022-08-16 | 2024-02-22 | Pfizer Inc. | Methods for purification of aav vectors by anion exchange chromatography |
Family Cites Families (87)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9206016D0 (en) | 1992-03-19 | 1992-04-29 | Sandoz Ltd | Improvements in or relating to organic compounds |
US6440425B1 (en) | 1995-05-01 | 2002-08-27 | Aventis Pasteur Limited | High molecular weight major outer membrane protein of moraxella |
US6001650A (en) | 1995-08-03 | 1999-12-14 | Avigen, Inc. | High-efficiency wild-type-free AAV helper functions |
US6096548A (en) | 1996-03-25 | 2000-08-01 | Maxygen, Inc. | Method for directing evolution of a virus |
AU2678097A (en) | 1996-04-16 | 1997-11-07 | Immusol Incorporated | Targeted viral vectors |
US6710036B2 (en) | 1997-07-25 | 2004-03-23 | Avigen, Inc. | Induction of immune response to antigens expressed by recombinant adeno-associated virus |
CA2303768C (en) | 1997-09-19 | 2009-11-24 | The Trustees Of The University Of Pennsylvania | Methods and vector constructs useful for production of recombinant aav |
EP1030861A4 (en) | 1997-10-31 | 2001-09-05 | Maxygen Inc | MODIFICATION OF VIRAL TROPISM AND THE DIVERSITY OF HOST SPECIES BY RECOMBINATION OF THE VIRAL GENOME |
US6410300B1 (en) | 1998-01-12 | 2002-06-25 | The University Of North Carolina At Chapel Hill | Methods and formulations for mediating adeno-associated virus (AAV) attachment and infection and methods for purifying AAV |
US6551795B1 (en) | 1998-02-18 | 2003-04-22 | Genome Therapeutics Corporation | Nucleic acid and amino acid sequences relating to pseudomonas aeruginosa for diagnostics and therapeutics |
DE19827457C1 (de) | 1998-06-19 | 2000-03-02 | Medigene Ag | Strukturprotein von AAV, seine Herstellung und Verwendung |
AU5819599A (en) | 1998-09-11 | 2000-04-03 | Regents Of The University Of California, The | Recombinant adenovirus for tissue specific expression in heart |
JP2002538770A (ja) | 1998-11-10 | 2002-11-19 | ユニバーシティ オブ ノース カロライナ アット チャペル ヒル | ウイルスベクターとその製造及び投与の方法 |
US6943153B1 (en) | 1999-03-15 | 2005-09-13 | The Regents Of The University Of California | Use of recombinant gene delivery vectors for treating or preventing diseases of the eye |
US6498244B1 (en) | 1999-05-28 | 2002-12-24 | Cell Genesys, Inc. | Adeno-associated virus capsid immunologic determinants |
US7314912B1 (en) | 1999-06-21 | 2008-01-01 | Medigene Aktiengesellschaft | AAv scleroprotein, production and use thereof |
DE19933288A1 (de) | 1999-07-15 | 2001-01-18 | Medigene Ag | Strukturprotein von Adeno-assoziiertem Virus mit veränderter Antigenität, seine Herstellung und Verwendung |
DE19933719A1 (de) | 1999-07-19 | 2001-01-25 | Medigene Ag | Strukturprotein in Adeno-assoziiertem Virus mit veränderten chromatographischen Eigenschaften, seine Herstellung und Verwendung |
US8232081B2 (en) | 1999-09-21 | 2012-07-31 | Basf Se | Methods and microorganisms for production of panto-compounds |
US20070026394A1 (en) | 2000-02-11 | 2007-02-01 | Lawrence Blatt | Modulation of gene expression associated with inflammation proliferation and neurite outgrowth using nucleic acid based technologies |
US6855314B1 (en) | 2000-03-22 | 2005-02-15 | The United States Of America As Represented By The Department Of Health And Human Services | AAV5 vector for transducing brain cells and lung cells |
US7749492B2 (en) | 2001-01-05 | 2010-07-06 | Nationwide Children's Hospital, Inc. | AAV vectors and methods |
US6962815B2 (en) | 2001-01-05 | 2005-11-08 | Children's Hopital Inc. | AAV2 vectors and methods |
US20030129203A1 (en) | 2001-08-27 | 2003-07-10 | Nautilus Biotech S.A. | Mutant recombinant adeno-associated viruses |
US7647184B2 (en) | 2001-08-27 | 2010-01-12 | Hanall Pharmaceuticals, Co. Ltd | High throughput directed evolution by rational mutagenesis |
CA2864537C (en) | 2001-11-13 | 2016-11-29 | The Trustees Of The University Of Pennsylvania | A method of detecting and/or identifying adeno-associated virus (aav) sequences and isolating novel sequences identified thereby |
CA2468882C (en) | 2001-12-21 | 2015-09-29 | Medigene Ag | A library of modified structural genes or capsid modified particles useful for the identification of viral clones with desired cell tropism |
WO2003089612A2 (en) | 2002-04-17 | 2003-10-30 | University Of Florida Research Foundation, Inc. | IMPROVED rAAV VECTORS |
US20040142416A1 (en) | 2002-04-30 | 2004-07-22 | Laipis Philip J. | Treatment for phenylketonuria |
WO2003092594A2 (en) | 2002-04-30 | 2003-11-13 | Duke University | Adeno-associated viral vectors and methods for their production from hybrid adenovirus and for their use |
US7071172B2 (en) | 2002-04-30 | 2006-07-04 | The University Of North Carolina At Chapel Hill | Secretion signal vectors |
US7254489B2 (en) | 2002-05-31 | 2007-08-07 | Microsoft Corporation | Systems, methods and apparatus for reconstructing phylogentic trees |
US7220577B2 (en) | 2002-08-28 | 2007-05-22 | University Of Florida Research Foundation, Inc. | Modified AAV |
WO2004083441A2 (en) | 2003-03-19 | 2004-09-30 | Deutsches Krebsforschungszentrum Stiftung des öffentlichen Rechts | Random peptide library displayed on aav vectors |
WO2004108922A2 (en) * | 2003-04-25 | 2004-12-16 | The Trustees Of The University Of Pennsylvania | Use of aav comprising a capsid protein from aav7 or aav8 for the delivery of genes encoding apoprotein a or e genes to the liver |
EP1486567A1 (en) | 2003-06-11 | 2004-12-15 | Deutsches Krebsforschungszentrum Stiftung des öffentlichen Rechts | Improved adeno-associated virus (AAV) vector for gene therapy |
PT3235827T (pt) | 2003-06-19 | 2021-04-09 | Genzyme Corp | Viriões aav com imunorreatividade diminuída e seus usos |
US7368428B2 (en) * | 2003-06-23 | 2008-05-06 | A&G Pharmaceutical, Inc. | Compositions and methods for restoring sensitivity of tumor cells to antitumor therapy and inducing apoptosis |
US9441244B2 (en) | 2003-06-30 | 2016-09-13 | The Regents Of The University Of California | Mutant adeno-associated virus virions and methods of use thereof |
US9233131B2 (en) | 2003-06-30 | 2016-01-12 | The Regents Of The University Of California | Mutant adeno-associated virus virions and methods of use thereof |
US20050019927A1 (en) | 2003-07-13 | 2005-01-27 | Markus Hildinger | DECREASING GENE EXPRESSION IN A MAMMALIAN SUBJECT IN VIVO VIA AAV-MEDIATED RNAi EXPRESSION CASSETTE TRANSFER |
CA2539947A1 (en) | 2003-09-24 | 2005-04-07 | The Board Of Trustees Of The Leland Stanford Junior University | Igf-1 instructs multipotent adult cns neural stem cells to an oligodendroglial lineage |
HUE033158T2 (en) | 2003-09-30 | 2017-11-28 | Univ Pennsylvania | Adeno-associated virus (AAV) clusters, sequences, vectors containing them, and their use |
US7427396B2 (en) | 2004-06-03 | 2008-09-23 | Genzyme Corporation | AAV vectors for gene delivery to the lung |
AU2005316476A1 (en) | 2004-12-15 | 2006-06-22 | University Of Florida Research Foundation, Inc. | Chimeric vectors |
WO2006101634A1 (en) | 2005-02-17 | 2006-09-28 | The Regents Of The University Of California | Müller cell specific gene therapy |
EP3603676A1 (en) * | 2005-04-07 | 2020-02-05 | The Trustees of the University of Pennsylvania | Method of increasing the function of an aav vector |
US7867484B2 (en) | 2006-01-27 | 2011-01-11 | University Of North Carolina At Chapel Hill | Heparin and heparan sulfate binding chimeric vectors |
US7588772B2 (en) | 2006-03-30 | 2009-09-15 | Board Of Trustees Of The Leland Stamford Junior University | AAV capsid library and AAV capsid proteins |
US8470790B2 (en) | 2006-05-04 | 2013-06-25 | Wayne State University | Restoration of visual responses by in vivo delivery of rhodopsin nucleic acids |
CN1966082B (zh) | 2006-11-03 | 2010-06-30 | 许瑞安 | 一种防治结直肠癌的基因药物及其制备方法和用途 |
US9725485B2 (en) | 2012-05-15 | 2017-08-08 | University Of Florida Research Foundation, Inc. | AAV vectors with high transduction efficiency and uses thereof for gene therapy |
EP2147096B1 (en) | 2007-04-13 | 2015-03-25 | Catalyst Biosciences, Inc. | Modified factor VII polypeptides and uses thereof |
EP1985708B1 (en) | 2007-04-27 | 2015-04-15 | Universität Rostock | Selective targeting of viruses to neural precursor cells |
WO2009137006A2 (en) * | 2008-04-30 | 2009-11-12 | The University Of North Carolina At Chapel Hill | Directed evolution and in vivo panning of virus vectors |
AU2009274482A1 (en) | 2008-05-20 | 2010-01-28 | Eos Neuroscience, Inc. | Vectors for delivery of light-sensitive proteins and methods of use |
WO2009154452A1 (en) | 2008-06-17 | 2009-12-23 | Amsterdam Molecular Therapeutics B.V. | Parvoviral capsid with incorporated Gly-Ala repeat region |
ES2634118T3 (es) | 2009-02-11 | 2017-09-26 | The University Of North Carolina At Chapel Hill | Vectores de virus modificados y métodos para fabricar y utilizar los mismos |
CN101532024A (zh) | 2009-04-30 | 2009-09-16 | 许瑞安 | 一种用于基因治疗的新型细胞特异性内含microRNA结合序列的基因HAAVmir |
WO2010138263A2 (en) * | 2009-05-28 | 2010-12-02 | University Of Massachusetts | Novel aav 's and uses thereof |
US9546112B2 (en) | 2010-03-22 | 2017-01-17 | Association Institut De Myologie | Methods of increasing efficiency of vector penetration of target tissue |
US8263396B2 (en) * | 2010-04-01 | 2012-09-11 | Weidong Xiao | Methods and compositions for the production of recombinant virus vectors |
US8663624B2 (en) | 2010-10-06 | 2014-03-04 | The Regents Of The University Of California | Adeno-associated virus virions with variant capsid and methods of use thereof |
CN107828820B (zh) * | 2010-10-27 | 2022-06-07 | 学校法人自治医科大学 | 用于向神经系统细胞导入基因的腺相关病毒粒子 |
SG10202110919YA (en) | 2011-04-22 | 2021-11-29 | Univ California | Adeno-associated virus virions with variant capsid and methods of use thereof |
ES2857773T3 (es) | 2011-08-24 | 2021-09-29 | Univ Leland Stanford Junior | Nuevas proteínas de la cápside de AAV para la transferencia de ácidos nucleicos |
BR122021020419B1 (pt) * | 2012-04-18 | 2023-01-17 | The Children's Hospital Of Philadelphia | Vetor de vírus adeno-associado (aav) que compreende uma proteína de capsídeo vp1, composições farmacêuticas compreendendo o mesmo, e seus usos |
WO2013170078A1 (en) * | 2012-05-09 | 2013-11-14 | Oregon Health & Science University | Adeno associated virus plasmids and vectors |
TWI775096B (zh) | 2012-05-15 | 2022-08-21 | 澳大利亞商艾佛蘭屈澳洲私營有限公司 | 使用腺相關病毒(aav)sflt-1治療老年性黃斑部退化(amd) |
JP6363958B2 (ja) | 2012-12-25 | 2018-07-25 | タカラバイオ株式会社 | Aav変異体 |
EP2954051B1 (en) | 2013-02-08 | 2019-03-27 | The Trustees Of The University Of Pennsylvania | Modified aav8 capsid for gene transfer for retinal therapies |
AU2014273085B2 (en) | 2013-05-29 | 2020-10-22 | Cellectis | New compact scaffold of Cas9 in the type II CRISPR system |
US11136557B2 (en) | 2013-05-31 | 2021-10-05 | The Regents Of The University Of California | Adeno-associated virus variants and methods of use thereof |
WO2014207190A1 (en) | 2013-06-28 | 2014-12-31 | INSERM (Institut National de la Santé et de la Recherche Médicale) | Methods for expressing a polynucleotide of interest in the retina of a subject |
US20160369298A1 (en) | 2013-09-26 | 2016-12-22 | University Of Florida Research Foundation, Inc. | Synthetic combinatorial aav capsid library for targeted gene therapy |
ES2714535T3 (es) | 2013-10-11 | 2019-05-28 | Massachusetts Eye & Ear Infirmary | Métodos para predecir secuencias de virus ancestrales y usos de los mismos |
GB201403684D0 (en) | 2014-03-03 | 2014-04-16 | King S College London | Vector |
US10000741B2 (en) | 2014-03-17 | 2018-06-19 | Adverum Biotechnologies, Inc. | Compositions and methods for enhanced gene expression in cone cells |
PE20170260A1 (es) | 2014-05-02 | 2017-04-12 | Genzyme Corp | Vectores de aav para la terapia genica de la retina y el snc |
EP3155116A4 (en) | 2014-06-10 | 2017-12-27 | Massachusetts Institute Of Technology | Method for gene editing |
US10472650B2 (en) | 2015-02-20 | 2019-11-12 | University Of Iowa Research Foundation | Methods and compositions for treating genetic eye diseases |
JP7095994B2 (ja) | 2015-03-02 | 2022-07-05 | アドヴェラム バイオテクノロジーズ, インコーポレイテッド | ポリヌクレオチドを網膜錐体に硝子体内送達するための組成物及び方法 |
EP3265568B1 (en) | 2015-03-06 | 2020-05-06 | Massachusetts Eye & Ear Infirmary | Gene augmentation therapies for inherited retinal degeneration caused by mutations in the prpf31 gene |
US20190000940A1 (en) | 2015-07-31 | 2019-01-03 | Voyager Therapeutics, Inc. | Compositions and methods for the treatment of aadc deficiency |
CN109476707B (zh) | 2016-05-13 | 2022-12-02 | 4D分子治疗有限公司 | 腺相关病毒变体衣壳和其使用方法 |
MA44546B1 (fr) | 2016-06-15 | 2021-03-31 | Univ California | Virus adéno-associés variants et procédés d'utilisation |
US11680249B2 (en) | 2017-08-28 | 2023-06-20 | The Regents Of The University Of California | Adeno-associated virus capsid variants and methods of use thereof |
-
2014
- 2014-05-29 US US14/774,972 patent/US11136557B2/en active Active
- 2014-05-29 JP JP2016517017A patent/JP6600624B2/ja active Active
- 2014-05-29 ES ES14803589T patent/ES2897508T3/es active Active
- 2014-05-29 WO PCT/US2014/040083 patent/WO2014194132A1/en active Application Filing
- 2014-05-29 CA CA2907799A patent/CA2907799A1/en active Pending
- 2014-05-29 EP EP14803589.2A patent/EP3003391B1/en active Active
- 2014-05-29 CN CN201480027443.8A patent/CN105247044B/zh active Active
-
2016
- 2016-09-23 HK HK16111197.0A patent/HK1223016A1/zh unknown
-
2019
- 2019-07-24 JP JP2019135745A patent/JP7069088B2/ja active Active
-
2021
- 2021-09-07 US US17/468,290 patent/US20220017876A1/en active Pending
-
2022
- 2022-03-29 JP JP2022052809A patent/JP2022097480A/ja active Pending
- 2022-04-20 US US17/725,289 patent/US11634691B2/en active Active
-
2023
- 2023-03-15 US US18/184,184 patent/US20230323311A1/en active Pending
-
2024
- 2024-01-19 JP JP2024006465A patent/JP2024026872A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230323311A1 (en) | 2023-10-12 |
ES2897508T3 (es) | 2022-03-01 |
EP3003391A1 (en) | 2016-04-13 |
CA2907799A1 (en) | 2014-12-04 |
EP3003391A4 (en) | 2017-04-12 |
JP2022097480A (ja) | 2022-06-30 |
CN105247044B (zh) | 2021-05-07 |
US11634691B2 (en) | 2023-04-25 |
JP7069088B2 (ja) | 2022-05-17 |
EP3003391B1 (en) | 2021-09-22 |
US20220017876A1 (en) | 2022-01-20 |
JP2020010684A (ja) | 2020-01-23 |
WO2014194132A1 (en) | 2014-12-04 |
US20160017295A1 (en) | 2016-01-21 |
US20220389390A1 (en) | 2022-12-08 |
US11136557B2 (en) | 2021-10-05 |
HK1223016A1 (zh) | 2017-07-21 |
CN105247044A (zh) | 2016-01-13 |
JP2016526045A (ja) | 2016-09-01 |
JP6600624B2 (ja) | 2019-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11634691B2 (en) | Compositions and methods of treatment | |
US20210077552A1 (en) | Mutant adeno-associated virus virions and methods of use thereof | |
US10214566B2 (en) | Mutant adeno-associated virus virions and methods of use thereof | |
US11807868B2 (en) | Adeno-associated variants, formulations and methods for pulmonary delivery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240216 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240216 |