KR102612563B1 - 변형된 포스포리파제 도메인을 갖는 아데노-연관 바이러스 (aav) - Google Patents
변형된 포스포리파제 도메인을 갖는 아데노-연관 바이러스 (aav) Download PDFInfo
- Publication number
- KR102612563B1 KR102612563B1 KR1020207009126A KR20207009126A KR102612563B1 KR 102612563 B1 KR102612563 B1 KR 102612563B1 KR 1020207009126 A KR1020207009126 A KR 1020207009126A KR 20207009126 A KR20207009126 A KR 20207009126A KR 102612563 B1 KR102612563 B1 KR 102612563B1
- Authority
- KR
- South Korea
- Prior art keywords
- aav
- sequence
- gly
- ala
- asn
- Prior art date
Links
- 241000702421 Dependoparvovirus Species 0.000 title claims abstract description 60
- ZIIUUSVHCHPIQD-UHFFFAOYSA-N 2,4,6-trimethyl-N-[3-(trifluoromethyl)phenyl]benzenesulfonamide Chemical class CC1=CC(C)=CC(C)=C1S(=O)(=O)NC1=CC=CC(C(F)(F)F)=C1 ZIIUUSVHCHPIQD-UHFFFAOYSA-N 0.000 title description 7
- 108090000565 Capsid Proteins Proteins 0.000 claims abstract description 299
- 102100023321 Ceruloplasmin Human genes 0.000 claims abstract description 299
- 230000003612 virological effect Effects 0.000 claims abstract description 282
- 241000701447 unidentified baculovirus Species 0.000 claims abstract description 202
- 241000238631 Hexapoda Species 0.000 claims abstract description 143
- 238000000034 method Methods 0.000 claims abstract description 111
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 25
- 108090000623 proteins and genes Proteins 0.000 claims description 181
- 102000004169 proteins and genes Human genes 0.000 claims description 165
- 235000018102 proteins Nutrition 0.000 claims description 164
- 239000013598 vector Substances 0.000 claims description 150
- 102000040430 polynucleotide Human genes 0.000 claims description 119
- 108091033319 polynucleotide Proteins 0.000 claims description 119
- 239000002157 polynucleotide Substances 0.000 claims description 119
- 150000007523 nucleic acids Chemical class 0.000 claims description 74
- 102000039446 nucleic acids Human genes 0.000 claims description 72
- 108020004707 nucleic acids Proteins 0.000 claims description 72
- 235000001014 amino acid Nutrition 0.000 claims description 68
- 150000001413 amino acids Chemical class 0.000 claims description 57
- 101100524319 Adeno-associated virus 2 (isolate Srivastava/1982) Rep52 gene Proteins 0.000 claims description 45
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 claims description 45
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 44
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 39
- 101100524317 Adeno-associated virus 2 (isolate Srivastava/1982) Rep40 gene Proteins 0.000 claims description 36
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 claims description 36
- 239000001963 growth medium Substances 0.000 claims description 32
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 29
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 claims description 29
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 25
- 238000004519 manufacturing process Methods 0.000 claims description 25
- 241001634120 Adeno-associated virus - 5 Species 0.000 claims description 19
- 230000010076 replication Effects 0.000 claims description 18
- 241000202702 Adeno-associated virus - 3 Species 0.000 claims description 17
- 241000580270 Adeno-associated virus - 4 Species 0.000 claims description 17
- 241000649047 Adeno-associated virus 12 Species 0.000 claims description 17
- 241000300529 Adeno-associated virus 13 Species 0.000 claims description 17
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 16
- 241001164823 Adeno-associated virus - 7 Species 0.000 claims description 16
- 235000013922 glutamic acid Nutrition 0.000 claims description 16
- 239000004220 glutamic acid Substances 0.000 claims description 16
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 claims description 15
- 239000004475 Arginine Substances 0.000 claims description 14
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 14
- 235000003704 aspartic acid Nutrition 0.000 claims description 14
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 14
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Chemical group OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 14
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 claims description 14
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 claims description 12
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims description 10
- 241000649045 Adeno-associated virus 10 Species 0.000 claims description 10
- 241000649046 Adeno-associated virus 11 Species 0.000 claims description 10
- 239000004472 Lysine Substances 0.000 claims description 10
- 241000649044 Adeno-associated virus 9 Species 0.000 claims description 9
- 238000012258 culturing Methods 0.000 claims description 9
- 239000002773 nucleotide Substances 0.000 claims description 8
- 125000003729 nucleotide group Chemical group 0.000 claims description 8
- 230000003362 replicative effect Effects 0.000 claims description 5
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical group NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 claims 2
- 102100037611 Lysophospholipase Human genes 0.000 abstract description 51
- 108010058864 Phospholipases A2 Proteins 0.000 abstract description 51
- 238000006467 substitution reaction Methods 0.000 abstract description 6
- 239000003153 chemical reaction reagent Substances 0.000 abstract description 2
- 210000004027 cell Anatomy 0.000 description 176
- 108010092854 aspartyllysine Proteins 0.000 description 53
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 50
- 108010050848 glycylleucine Proteins 0.000 description 47
- 108020004414 DNA Proteins 0.000 description 41
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 39
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 35
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 34
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 34
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 34
- 108010040030 histidinoalanine Proteins 0.000 description 34
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 32
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 30
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 30
- 108010077245 asparaginyl-proline Proteins 0.000 description 30
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 30
- 108010005233 alanylglutamic acid Proteins 0.000 description 29
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 27
- 210000000234 capsid Anatomy 0.000 description 26
- 210000004962 mammalian cell Anatomy 0.000 description 26
- ZJFNRQHUIHKZJF-GUBZILKMSA-N Glu-His-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O ZJFNRQHUIHKZJF-GUBZILKMSA-N 0.000 description 25
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 25
- 108010034529 leucyl-lysine Proteins 0.000 description 25
- 230000000694 effects Effects 0.000 description 24
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 24
- 108010061238 threonyl-glycine Proteins 0.000 description 23
- 108010079364 N-glycylalanine Proteins 0.000 description 22
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 21
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 21
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 21
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 19
- 108010046649 GDNP peptide Proteins 0.000 description 19
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 18
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 17
- QSFJHIRIHOJRKS-ULQDDVLXSA-N Tyr-Leu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QSFJHIRIHOJRKS-ULQDDVLXSA-N 0.000 description 17
- 241000700605 Viruses Species 0.000 description 17
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 16
- 238000005516 engineering process Methods 0.000 description 16
- 108010047495 alanylglycine Proteins 0.000 description 15
- 108010078144 glutaminyl-glycine Proteins 0.000 description 15
- 108010057821 leucylproline Proteins 0.000 description 15
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 14
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 14
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 14
- 238000012986 modification Methods 0.000 description 14
- 230000004048 modification Effects 0.000 description 14
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 13
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 13
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 13
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 13
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 13
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 13
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 13
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 12
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 12
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 12
- 108010092114 histidylphenylalanine Proteins 0.000 description 12
- 108010015796 prolylisoleucine Proteins 0.000 description 12
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 11
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 11
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 11
- SOYOSFXLXYZNRG-CIUDSAMLSA-N Asp-Arg-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O SOYOSFXLXYZNRG-CIUDSAMLSA-N 0.000 description 11
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 11
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 11
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 11
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 11
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 11
- 108010047857 aspartylglycine Proteins 0.000 description 11
- 208000015181 infectious disease Diseases 0.000 description 11
- 235000018977 lysine Nutrition 0.000 description 11
- 108010051242 phenylalanylserine Proteins 0.000 description 11
- 108010077112 prolyl-proline Proteins 0.000 description 11
- 108010031719 prolyl-serine Proteins 0.000 description 11
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 10
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 10
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 10
- 108010060035 arginylproline Proteins 0.000 description 10
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 10
- 239000002245 particle Substances 0.000 description 10
- 108010038745 tryptophylglycine Proteins 0.000 description 10
- 210000002845 virion Anatomy 0.000 description 10
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 9
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 9
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 9
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 9
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 9
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 9
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 9
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 9
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 9
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 9
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 9
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 9
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 9
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 9
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 9
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 9
- 108010053725 prolylvaline Proteins 0.000 description 9
- 108010045269 tryptophyltryptophan Proteins 0.000 description 9
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 8
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 8
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 8
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 8
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 8
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 8
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 8
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 8
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 8
- JTBFQNHKNRZJDS-SYWGBEHUSA-N Ile-Trp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C)C(=O)O)N JTBFQNHKNRZJDS-SYWGBEHUSA-N 0.000 description 8
- 241000880493 Leptailurus serval Species 0.000 description 8
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 8
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 8
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 8
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 8
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 8
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 8
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 8
- 108010079005 RDV peptide Proteins 0.000 description 8
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 8
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 8
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 8
- 108010077515 glycylproline Proteins 0.000 description 8
- 108010087823 glycyltyrosine Proteins 0.000 description 8
- 108010085325 histidylproline Proteins 0.000 description 8
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 8
- 239000013612 plasmid Substances 0.000 description 8
- 238000003753 real-time PCR Methods 0.000 description 8
- 230000008685 targeting Effects 0.000 description 8
- 239000013607 AAV vector Substances 0.000 description 7
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 7
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 7
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 7
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 7
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 7
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 7
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 7
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 7
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 7
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 7
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 7
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 7
- 108010047562 NGR peptide Proteins 0.000 description 7
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 7
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 7
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 7
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 7
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 7
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 7
- QNTBGBCOEYNAPV-CWRNSKLLSA-N Trp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O QNTBGBCOEYNAPV-CWRNSKLLSA-N 0.000 description 7
- YRSOERSDNRSCBC-XIRDDKMYSA-N Trp-His-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CS)C(=O)O)N YRSOERSDNRSCBC-XIRDDKMYSA-N 0.000 description 7
- 108010049041 glutamylalanine Proteins 0.000 description 7
- 108010089804 glycyl-threonine Proteins 0.000 description 7
- 108010015792 glycyllysine Proteins 0.000 description 7
- 108010025306 histidylleucine Proteins 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 239000012452 mother liquor Substances 0.000 description 7
- 229920001184 polypeptide Polymers 0.000 description 7
- 108090000765 processed proteins & peptides Proteins 0.000 description 7
- 102000004196 processed proteins & peptides Human genes 0.000 description 7
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 7
- 108010029020 prolylglycine Proteins 0.000 description 7
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 6
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 6
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 6
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 6
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 6
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 6
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 6
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 6
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 6
- 241000282412 Homo Species 0.000 description 6
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 6
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 6
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 6
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 6
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 6
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 6
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 6
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 6
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 6
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 6
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 6
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 6
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 6
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 6
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 6
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 6
- 108010070944 alanylhistidine Proteins 0.000 description 6
- 108010093581 aspartyl-proline Proteins 0.000 description 6
- 238000004113 cell culture Methods 0.000 description 6
- 230000009368 gene silencing by RNA Effects 0.000 description 6
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 6
- 108010010147 glycylglutamine Proteins 0.000 description 6
- 108010037850 glycylvaline Proteins 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 108010012581 phenylalanylglutamate Proteins 0.000 description 6
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 6
- 108010026333 seryl-proline Proteins 0.000 description 6
- 108010071207 serylmethionine Proteins 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 5
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 5
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 5
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 5
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 5
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 5
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 5
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 5
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 5
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 5
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 5
- LLRJPYJQNBMOOO-QEJZJMRPSA-N Asp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N LLRJPYJQNBMOOO-QEJZJMRPSA-N 0.000 description 5
- XIZWKXATMJODQW-KKUMJFAQSA-N Cys-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N XIZWKXATMJODQW-KKUMJFAQSA-N 0.000 description 5
- XLLSMEFANRROJE-GUBZILKMSA-N Cys-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XLLSMEFANRROJE-GUBZILKMSA-N 0.000 description 5
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 5
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 5
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 5
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 5
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 5
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 5
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 5
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 5
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 5
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 5
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 5
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 5
- VUUFXXGKMPLKNH-BZSNNMDCSA-N His-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N VUUFXXGKMPLKNH-BZSNNMDCSA-N 0.000 description 5
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 5
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 5
- 108010065920 Insulin Lispro Proteins 0.000 description 5
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 5
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 5
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 5
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 5
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 5
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 5
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 5
- OTKQHDPECKUDSB-SZMVWBNQSA-N Met-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OTKQHDPECKUDSB-SZMVWBNQSA-N 0.000 description 5
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 5
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 5
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 5
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 5
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 5
- DMNANGOFEUVBRV-GJZGRUSLSA-N Pro-Trp-Gly Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)O)C(=O)[C@@H]1CCCN1 DMNANGOFEUVBRV-GJZGRUSLSA-N 0.000 description 5
- 108091030071 RNAI Proteins 0.000 description 5
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 5
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 5
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 5
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 5
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 5
- 101710172711 Structural protein Proteins 0.000 description 5
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 5
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 5
- WVHUFSCKCBQKJW-HKUYNNGSSA-N Trp-Gly-Tyr Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 WVHUFSCKCBQKJW-HKUYNNGSSA-N 0.000 description 5
- SDNVRAKIJVKAGS-LKTVYLICSA-N Tyr-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N SDNVRAKIJVKAGS-LKTVYLICSA-N 0.000 description 5
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 5
- -1 VP1 Proteins 0.000 description 5
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 5
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 5
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 5
- ZEBRMWPTJNHXAJ-JYJNAYRXSA-N Val-Phe-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N ZEBRMWPTJNHXAJ-JYJNAYRXSA-N 0.000 description 5
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 5
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 5
- 108010087924 alanylproline Proteins 0.000 description 5
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 5
- 108010013835 arginine glutamate Proteins 0.000 description 5
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 238000001415 gene therapy Methods 0.000 description 5
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 238000004806 packaging method and process Methods 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 239000011550 stock solution Substances 0.000 description 5
- 230000001225 therapeutic effect Effects 0.000 description 5
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 4
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 4
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 4
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 4
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 4
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 4
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 4
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 4
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 4
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 4
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 4
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 4
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 4
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 4
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 4
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 4
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 4
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 4
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 4
- RAKKBBHMTJSXOY-XVYDVKMFSA-N Asn-His-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O RAKKBBHMTJSXOY-XVYDVKMFSA-N 0.000 description 4
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 4
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 4
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 4
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 4
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 4
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 4
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 4
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 4
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 4
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 4
- ULXXDWZMMSQBDC-ACZMJKKPSA-N Gln-Asp-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ULXXDWZMMSQBDC-ACZMJKKPSA-N 0.000 description 4
- HVQCEQTUSWWFOS-WDSKDSINSA-N Gln-Gly-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N HVQCEQTUSWWFOS-WDSKDSINSA-N 0.000 description 4
- PODFFOWWLUPNMN-DCAQKATOSA-N Gln-His-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PODFFOWWLUPNMN-DCAQKATOSA-N 0.000 description 4
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 4
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 4
- WZAYJXZPSJOXCP-QAETUUGQSA-N Glu-Phe-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)N)CC1=CC=CC=C1 WZAYJXZPSJOXCP-QAETUUGQSA-N 0.000 description 4
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 4
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 4
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 4
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 4
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 4
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 4
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 4
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 4
- 108700024845 Hepatitis B virus P Proteins 0.000 description 4
- 101000609211 Homo sapiens Polyadenylate-binding protein 2 Proteins 0.000 description 4
- HTDRTKMNJRRYOJ-SIUGBPQLSA-N Ile-Gln-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HTDRTKMNJRRYOJ-SIUGBPQLSA-N 0.000 description 4
- LEHPJMKVGFPSSP-ZQINRCPSSA-N Ile-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 LEHPJMKVGFPSSP-ZQINRCPSSA-N 0.000 description 4
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 4
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 4
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical group OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 4
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 4
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 4
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 4
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 4
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 4
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 4
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 4
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 4
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- WFHRXJOZEXUKLV-IRXDYDNUSA-N Phe-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 WFHRXJOZEXUKLV-IRXDYDNUSA-N 0.000 description 4
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 4
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 4
- 102000015439 Phospholipases Human genes 0.000 description 4
- 108010064785 Phospholipases Proteins 0.000 description 4
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 4
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 4
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 4
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 4
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 4
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 4
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 4
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 4
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 4
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 4
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 4
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 4
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 4
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 4
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 4
- PQEQXWRVHQAAKS-SRVKXCTJSA-N Ser-Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=C(O)C=C1 PQEQXWRVHQAAKS-SRVKXCTJSA-N 0.000 description 4
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 4
- RCEHMXVEMNXRIW-IRIUXVKKSA-N Thr-Gln-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O RCEHMXVEMNXRIW-IRIUXVKKSA-N 0.000 description 4
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 4
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 4
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 4
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 4
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 4
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 4
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 4
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 4
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 4
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 4
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 4
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 4
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 4
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 210000001163 endosome Anatomy 0.000 description 4
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 4
- 108010081551 glycylphenylalanine Proteins 0.000 description 4
- 102000051773 human PABPN1 Human genes 0.000 description 4
- 238000000126 in silico method Methods 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 108010073969 valyllysine Proteins 0.000 description 4
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 3
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 3
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 3
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 3
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 3
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 3
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 3
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 3
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 3
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 3
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 3
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 3
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 3
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 3
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 3
- LYJXHXGPWDTLKW-HJGDQZAQSA-N Arg-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O LYJXHXGPWDTLKW-HJGDQZAQSA-N 0.000 description 3
- WTFIFQWLQXZLIZ-UMPQAUOISA-N Arg-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O WTFIFQWLQXZLIZ-UMPQAUOISA-N 0.000 description 3
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 3
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 3
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 3
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 3
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 3
- MOHUTCNYQLMARY-GUBZILKMSA-N Asn-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MOHUTCNYQLMARY-GUBZILKMSA-N 0.000 description 3
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 3
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 3
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 3
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 3
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 3
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 3
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 3
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 3
- JPSODRNUDXONAS-XIRDDKMYSA-N Asn-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CC(=O)N)N JPSODRNUDXONAS-XIRDDKMYSA-N 0.000 description 3
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 3
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 3
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 3
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 3
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 3
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 3
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 3
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 description 3
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 3
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 3
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 3
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 3
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 3
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 3
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 3
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 3
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 3
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 3
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 3
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 3
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 3
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 3
- AOCARQDSFTWWFT-DCAQKATOSA-N Glu-Met-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AOCARQDSFTWWFT-DCAQKATOSA-N 0.000 description 3
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 3
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 3
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 3
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 3
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 3
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 3
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 3
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 3
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 3
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 3
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 3
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 3
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 3
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 3
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 3
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 3
- AASLOGQZZKZWKH-SRVKXCTJSA-N His-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AASLOGQZZKZWKH-SRVKXCTJSA-N 0.000 description 3
- QEYUCKCWTMIERU-SRVKXCTJSA-N His-Lys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QEYUCKCWTMIERU-SRVKXCTJSA-N 0.000 description 3
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 3
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 3
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 3
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 3
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 3
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 3
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 3
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 3
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 3
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 3
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 3
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 3
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 3
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 3
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 3
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 3
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 3
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 3
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 3
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 3
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 3
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 3
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 3
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 3
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 3
- MDXAULHWGWETHF-SRVKXCTJSA-N Met-Arg-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCNC(N)=N MDXAULHWGWETHF-SRVKXCTJSA-N 0.000 description 3
- 241000701945 Parvoviridae Species 0.000 description 3
- QMMRHASQEVCJGR-UBHSHLNASA-N Phe-Ala-Pro Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 QMMRHASQEVCJGR-UBHSHLNASA-N 0.000 description 3
- NEHSHYOUIWBYSA-DCPHZVHLSA-N Phe-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NEHSHYOUIWBYSA-DCPHZVHLSA-N 0.000 description 3
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 3
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 3
- HQCSLJFGZYOXHW-KKUMJFAQSA-N Phe-His-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O)N HQCSLJFGZYOXHW-KKUMJFAQSA-N 0.000 description 3
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 3
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 3
- FKFCKDROTNIVSO-JYJNAYRXSA-N Phe-Pro-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O FKFCKDROTNIVSO-JYJNAYRXSA-N 0.000 description 3
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 3
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 3
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 3
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 3
- YKQNVTOIYFQMLW-IHRRRGAJSA-N Pro-Cys-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 YKQNVTOIYFQMLW-IHRRRGAJSA-N 0.000 description 3
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 3
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 3
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 3
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 3
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 3
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 3
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 3
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 3
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 3
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 3
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 3
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 3
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 3
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 3
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 3
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 3
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 3
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 3
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 3
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 3
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 3
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 3
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 3
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 3
- 108091027967 Small hairpin RNA Proteins 0.000 description 3
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 3
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 3
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 3
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 3
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 3
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 3
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 3
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 3
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 3
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 3
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 3
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 3
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 3
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 3
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 3
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 3
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 3
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 3
- XZLHHHYSWIYXHD-XIRDDKMYSA-N Trp-Gln-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XZLHHHYSWIYXHD-XIRDDKMYSA-N 0.000 description 3
- SSNGFWKILJLTQM-QEJZJMRPSA-N Trp-Gln-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SSNGFWKILJLTQM-QEJZJMRPSA-N 0.000 description 3
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 3
- UIRPULWLRODAEQ-QEJZJMRPSA-N Trp-Ser-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 UIRPULWLRODAEQ-QEJZJMRPSA-N 0.000 description 3
- NMOIRIIIUVELLY-WDSOQIARSA-N Trp-Val-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)C(C)C)=CNC2=C1 NMOIRIIIUVELLY-WDSOQIARSA-N 0.000 description 3
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 3
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 3
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 3
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 3
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 3
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 3
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 3
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 3
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 3
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 3
- NGXQOQNXSGOYOI-BQFCYCMXSA-N Val-Trp-Gln Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 NGXQOQNXSGOYOI-BQFCYCMXSA-N 0.000 description 3
- 108010041407 alanylaspartic acid Proteins 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 229910052792 caesium Inorganic materials 0.000 description 3
- TVFDJXOCXUVLDH-UHFFFAOYSA-N caesium atom Chemical compound [Cs] TVFDJXOCXUVLDH-UHFFFAOYSA-N 0.000 description 3
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000002458 infectious effect Effects 0.000 description 3
- NBQNWMBBSKPBAY-UHFFFAOYSA-N iodixanol Chemical compound IC=1C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C(I)C=1N(C(=O)C)CC(O)CN(C(C)=O)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I NBQNWMBBSKPBAY-UHFFFAOYSA-N 0.000 description 3
- 229960004359 iodixanol Drugs 0.000 description 3
- 108010012058 leucyltyrosine Proteins 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 238000002887 multiple sequence alignment Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 108010004914 prolylarginine Proteins 0.000 description 3
- 108010090894 prolylleucine Proteins 0.000 description 3
- 239000004055 small Interfering RNA Substances 0.000 description 3
- HXUVTXPOZRFMOY-NSHDSACASA-N 2-[[(2s)-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]-3-phenylpropanoyl]amino]acetic acid Chemical compound NCC(=O)NCC(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 HXUVTXPOZRFMOY-NSHDSACASA-N 0.000 description 2
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 2
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 2
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 2
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 2
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 2
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 2
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 2
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 2
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 2
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 2
- DXTYEWAQOXYRHZ-KKXDTOCCSA-N Ala-Phe-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N DXTYEWAQOXYRHZ-KKXDTOCCSA-N 0.000 description 2
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 2
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 2
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 2
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 2
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 2
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 2
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 2
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 2
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 2
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 2
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 2
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 2
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 2
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 2
- FSPQNLYOFCXUCE-BPUTZDHNSA-N Arg-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FSPQNLYOFCXUCE-BPUTZDHNSA-N 0.000 description 2
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 2
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 2
- CIBWFJFMOBIFTE-CIUDSAMLSA-N Asn-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N CIBWFJFMOBIFTE-CIUDSAMLSA-N 0.000 description 2
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 2
- RCENDENBBJFJHZ-ACZMJKKPSA-N Asn-Asn-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCENDENBBJFJHZ-ACZMJKKPSA-N 0.000 description 2
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 2
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 2
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 2
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 2
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 2
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 2
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 2
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 2
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 2
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 2
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 2
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 2
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 2
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 2
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 2
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 2
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 2
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 2
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 2
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 2
- VBVKSAFJPVXMFJ-CIUDSAMLSA-N Asp-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N VBVKSAFJPVXMFJ-CIUDSAMLSA-N 0.000 description 2
- ZCKYZTGLXIEOKS-CIUDSAMLSA-N Asp-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N ZCKYZTGLXIEOKS-CIUDSAMLSA-N 0.000 description 2
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 2
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 2
- NYQHSUGFEWDWPD-ACZMJKKPSA-N Asp-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N NYQHSUGFEWDWPD-ACZMJKKPSA-N 0.000 description 2
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 2
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 2
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 2
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 2
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 2
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 2
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 2
- IHZFGJLKDYINPV-XIRDDKMYSA-N Asp-Trp-His Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(O)=O)N)C(O)=O)C1=CN=CN1 IHZFGJLKDYINPV-XIRDDKMYSA-N 0.000 description 2
- JGLWFWXGOINXEA-YDHLFZDLSA-N Asp-Val-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JGLWFWXGOINXEA-YDHLFZDLSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 2
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 2
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 2
- OETQLUYCMBARHJ-CIUDSAMLSA-N Gln-Asn-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OETQLUYCMBARHJ-CIUDSAMLSA-N 0.000 description 2
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 2
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 2
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 2
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 2
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 2
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 2
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 2
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 2
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 2
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 2
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 2
- UESYBOXFJWJVSB-AVGNSLFASA-N Gln-Phe-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O UESYBOXFJWJVSB-AVGNSLFASA-N 0.000 description 2
- DRNMNLKUUKKPIA-HTUGSXCWSA-N Gln-Phe-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)CCC(N)=O)C(O)=O DRNMNLKUUKKPIA-HTUGSXCWSA-N 0.000 description 2
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 2
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 2
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 2
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 2
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 2
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 2
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 2
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 2
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 2
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 2
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 2
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 2
- UDEPRBFQTWGLCW-CIUDSAMLSA-N Glu-Pro-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O UDEPRBFQTWGLCW-CIUDSAMLSA-N 0.000 description 2
- XAXJIUAWAFVADB-VJBMBRPKSA-N Glu-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XAXJIUAWAFVADB-VJBMBRPKSA-N 0.000 description 2
- QGAJQIGFFIQJJK-IHRRRGAJSA-N Glu-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QGAJQIGFFIQJJK-IHRRRGAJSA-N 0.000 description 2
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 2
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 2
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 2
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 2
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 2
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 2
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 2
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 2
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 2
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 2
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 2
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 2
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 2
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 2
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 2
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 2
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- JKSMZVCGQWVTBW-STQMWFEESA-N Gly-Trp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O JKSMZVCGQWVTBW-STQMWFEESA-N 0.000 description 2
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- 102220474636 HLA class II histocompatibility antigen, DP alpha 1 chain_Q81R_mutation Human genes 0.000 description 2
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 2
- ZJSMFRTVYSLKQU-DJFWLOJKSA-N His-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZJSMFRTVYSLKQU-DJFWLOJKSA-N 0.000 description 2
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 2
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 2
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- REJKOQYVFDEZHA-SLBDDTMCSA-N Ile-Asp-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N REJKOQYVFDEZHA-SLBDDTMCSA-N 0.000 description 2
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 2
- MSASLZGZQAXVFP-PEDHHIEDSA-N Ile-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N MSASLZGZQAXVFP-PEDHHIEDSA-N 0.000 description 2
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 2
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 2
- NXRNRBOKDBIVKQ-CXTHYWKRSA-N Ile-Tyr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N NXRNRBOKDBIVKQ-CXTHYWKRSA-N 0.000 description 2
- 102220465797 Interferon-induced, double-stranded RNA-activated protein kinase_A67E_mutation Human genes 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 2
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 2
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 2
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 2
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 2
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 2
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 2
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 2
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 2
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 2
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 2
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 2
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 2
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 2
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 2
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 2
- VSTNAUBHKQPVJX-IHRRRGAJSA-N Lys-Met-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O VSTNAUBHKQPVJX-IHRRRGAJSA-N 0.000 description 2
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 2
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 2
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 2
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 2
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 2
- DGNZGCQSVGGYJS-BQBZGAKWSA-N Met-Gly-Asp Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O DGNZGCQSVGGYJS-BQBZGAKWSA-N 0.000 description 2
- ORRNBLTZBBESPN-HJWJTTGWSA-N Met-Ile-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ORRNBLTZBBESPN-HJWJTTGWSA-N 0.000 description 2
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 2
- OCRSGGIJBDUXHU-WDSOQIARSA-N Met-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OCRSGGIJBDUXHU-WDSOQIARSA-N 0.000 description 2
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 2
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 2
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 2
- RIIFMEBFDDXGCV-VEVYYDQMSA-N Met-Thr-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O RIIFMEBFDDXGCV-VEVYYDQMSA-N 0.000 description 2
- KYXDADPHSNFWQX-VEVYYDQMSA-N Met-Thr-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O KYXDADPHSNFWQX-VEVYYDQMSA-N 0.000 description 2
- VYDLZDRMOFYOGV-TUAOUCFPSA-N Met-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N VYDLZDRMOFYOGV-TUAOUCFPSA-N 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 2
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 2
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 2
- QRUOLOPKCOEZKU-HJWJTTGWSA-N Phe-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N QRUOLOPKCOEZKU-HJWJTTGWSA-N 0.000 description 2
- PBWNICYZGJQKJV-BZSNNMDCSA-N Phe-Phe-Cys Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O PBWNICYZGJQKJV-BZSNNMDCSA-N 0.000 description 2
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 2
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 2
- ZVRJWDUPIDMHDN-ULQDDVLXSA-N Phe-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 ZVRJWDUPIDMHDN-ULQDDVLXSA-N 0.000 description 2
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 2
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 2
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 2
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 2
- VGTJSEYTVMAASM-RPTUDFQQSA-N Phe-Thr-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VGTJSEYTVMAASM-RPTUDFQQSA-N 0.000 description 2
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 2
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 2
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 2
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 2
- INXAPZFIOVGHSV-CIUDSAMLSA-N Pro-Asn-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 INXAPZFIOVGHSV-CIUDSAMLSA-N 0.000 description 2
- ZYBUKTMPPFQSHL-JYJNAYRXSA-N Pro-Asp-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZYBUKTMPPFQSHL-JYJNAYRXSA-N 0.000 description 2
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 2
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 2
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 2
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 2
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 2
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 2
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 2
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 2
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 2
- WIPAMEKBSHNFQE-IUCAKERBSA-N Pro-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@@H]1CCCN1 WIPAMEKBSHNFQE-IUCAKERBSA-N 0.000 description 2
- GNADVDLLGVSXLS-ULQDDVLXSA-N Pro-Phe-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GNADVDLLGVSXLS-ULQDDVLXSA-N 0.000 description 2
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 2
- QAAYIXYLEMRULP-SRVKXCTJSA-N Pro-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 QAAYIXYLEMRULP-SRVKXCTJSA-N 0.000 description 2
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 2
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 2
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 2
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 2
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 2
- 101710186352 Probable membrane antigen 3 Proteins 0.000 description 2
- 101710181078 Probable membrane antigen 75 Proteins 0.000 description 2
- 241000169446 Promethis Species 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 2
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 2
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 2
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 2
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 2
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 2
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 2
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- CLKKNZQUQMZDGD-SRVKXCTJSA-N Ser-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 CLKKNZQUQMZDGD-SRVKXCTJSA-N 0.000 description 2
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 2
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 2
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 2
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 2
- 101710178472 Tegument protein Proteins 0.000 description 2
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 2
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 2
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 2
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 2
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 2
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 2
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 2
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 2
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 2
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 2
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 2
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 2
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 2
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 2
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 2
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- KBKTUNYBNJWFRL-UBHSHLNASA-N Trp-Ser-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 KBKTUNYBNJWFRL-UBHSHLNASA-N 0.000 description 2
- GEGYPBOPIGNZIF-CWRNSKLLSA-N Trp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O GEGYPBOPIGNZIF-CWRNSKLLSA-N 0.000 description 2
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 2
- HTHCZRWCFXMENJ-KKUMJFAQSA-N Tyr-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HTHCZRWCFXMENJ-KKUMJFAQSA-N 0.000 description 2
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 2
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 2
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 2
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 2
- GITNQBVCEQBDQC-KKUMJFAQSA-N Tyr-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O GITNQBVCEQBDQC-KKUMJFAQSA-N 0.000 description 2
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 2
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 2
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 2
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 2
- SMUWZUSWMWVOSL-JYJNAYRXSA-N Tyr-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SMUWZUSWMWVOSL-JYJNAYRXSA-N 0.000 description 2
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 2
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 2
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 2
- ZQGPWORGSNRQLN-NHCYSSNCSA-N Val-Asp-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZQGPWORGSNRQLN-NHCYSSNCSA-N 0.000 description 2
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 2
- UZDHNIJRRTUKKC-DLOVCJGASA-N Val-Gln-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UZDHNIJRRTUKKC-DLOVCJGASA-N 0.000 description 2
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 2
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 2
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 2
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 2
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 2
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 2
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 2
- 238000001261 affinity purification Methods 0.000 description 2
- 108010070783 alanyltyrosine Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 244000309464 bull Species 0.000 description 2
- 230000010307 cell transformation Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000009260 cross reactivity Effects 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 2
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 2
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 239000012139 lysis buffer Substances 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 108010084572 phenylalanyl-valine Proteins 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 102220114327 rs886039055 Human genes 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010029384 tryptophyl-histidine Proteins 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 241000256173 Aedes albopictus Species 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- JYEBJTDTPNKQJG-FXQIFTODSA-N Ala-Asn-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N JYEBJTDTPNKQJG-FXQIFTODSA-N 0.000 description 1
- NJIFPLAJSVUQOZ-JBDRJPRFSA-N Ala-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C)N NJIFPLAJSVUQOZ-JBDRJPRFSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 1
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- FAJIYNONGXEXAI-CQDKDKBSSA-N Ala-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 FAJIYNONGXEXAI-CQDKDKBSSA-N 0.000 description 1
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- FCXAUASCMJOFEY-NDKCEZKHSA-N Ala-Leu-Thr-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O FCXAUASCMJOFEY-NDKCEZKHSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- JNJHNBXBGNJESC-KKXDTOCCSA-N Ala-Tyr-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JNJHNBXBGNJESC-KKXDTOCCSA-N 0.000 description 1
- MUGAESARFRGOTQ-IGNZVWTISA-N Ala-Tyr-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N MUGAESARFRGOTQ-IGNZVWTISA-N 0.000 description 1
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 1
- DDPKBJZLAXLQGZ-KBIXCLLPSA-N Ala-Val-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DDPKBJZLAXLQGZ-KBIXCLLPSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- 244000303258 Annona diversifolia Species 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- OCOZPTHLDVSFCZ-BPUTZDHNSA-N Arg-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N OCOZPTHLDVSFCZ-BPUTZDHNSA-N 0.000 description 1
- ALOVURZCXKYKJC-NAKRPEOUSA-N Arg-Asp-Gln-Ser Chemical compound N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O ALOVURZCXKYKJC-NAKRPEOUSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- BQBPFMNVOWDLHO-XIRDDKMYSA-N Arg-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N BQBPFMNVOWDLHO-XIRDDKMYSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 1
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 1
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 1
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 1
- XMGVWQWEWWULNS-BPUTZDHNSA-N Arg-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XMGVWQWEWWULNS-BPUTZDHNSA-N 0.000 description 1
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 1
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 1
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 1
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 1
- PTNFNTOBUDWHNZ-GUBZILKMSA-N Asn-Arg-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O PTNFNTOBUDWHNZ-GUBZILKMSA-N 0.000 description 1
- JJGRJMKUOYXZRA-LPEHRKFASA-N Asn-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O JJGRJMKUOYXZRA-LPEHRKFASA-N 0.000 description 1
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 1
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 1
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 1
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 1
- OKZOABJQOMAYEC-NUMRIWBASA-N Asn-Gln-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OKZOABJQOMAYEC-NUMRIWBASA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- OWUCNXMFJRFOFI-BQBZGAKWSA-N Asn-Gly-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O OWUCNXMFJRFOFI-BQBZGAKWSA-N 0.000 description 1
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- WQLJRNRLHWJIRW-KKUMJFAQSA-N Asn-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N)O WQLJRNRLHWJIRW-KKUMJFAQSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 1
- BKZFBJYIVSBXCO-KKUMJFAQSA-N Asn-Phe-His Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O BKZFBJYIVSBXCO-KKUMJFAQSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 1
- QXOPPIDJKPEKCW-GUBZILKMSA-N Asn-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O QXOPPIDJKPEKCW-GUBZILKMSA-N 0.000 description 1
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 1
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 1
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 1
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- YSYTWUMRHSFODC-QWRGUYRKSA-N Asn-Tyr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O YSYTWUMRHSFODC-QWRGUYRKSA-N 0.000 description 1
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 1
- CNKAZIGBGQIHLL-GUBZILKMSA-N Asp-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N CNKAZIGBGQIHLL-GUBZILKMSA-N 0.000 description 1
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 1
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 1
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 1
- XAPPCWUWHNWCPQ-PBCZWWQYSA-N Asp-Thr-His Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O XAPPCWUWHNWCPQ-PBCZWWQYSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 241000282836 Camelus dromedarius Species 0.000 description 1
- 101710166785 Capsid protein 1 Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 208000003322 Coinfection Diseases 0.000 description 1
- UPURLDIGQGTUPJ-ZKWXMUAHSA-N Cys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N UPURLDIGQGTUPJ-ZKWXMUAHSA-N 0.000 description 1
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 1
- UXIYYUMGFNSGBK-XPUUQOCRSA-N Cys-Gly-Val Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O UXIYYUMGFNSGBK-XPUUQOCRSA-N 0.000 description 1
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 101710189136 Envelope fusion protein Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 108090000331 Firefly luciferases Proteins 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- RRYLMJWPWBJFPZ-ACZMJKKPSA-N Gln-Asn-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RRYLMJWPWBJFPZ-ACZMJKKPSA-N 0.000 description 1
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 1
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 1
- MGJMFSBEMSNYJL-AVGNSLFASA-N Gln-Asn-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MGJMFSBEMSNYJL-AVGNSLFASA-N 0.000 description 1
- BTSPOOHJBYJRKO-CIUDSAMLSA-N Gln-Asp-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BTSPOOHJBYJRKO-CIUDSAMLSA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 1
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 1
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 1
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 1
- PIUPHASDUFSHTF-CIUDSAMLSA-N Gln-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O PIUPHASDUFSHTF-CIUDSAMLSA-N 0.000 description 1
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 1
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 1
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 1
- VOUSELYGTNGEPB-NUMRIWBASA-N Gln-Thr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O VOUSELYGTNGEPB-NUMRIWBASA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 1
- UQKVUFGUSVYJMQ-IRIUXVKKSA-N Gln-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N)O UQKVUFGUSVYJMQ-IRIUXVKKSA-N 0.000 description 1
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 1
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 1
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 1
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 1
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 1
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- JHSRJMUJOGLIHK-GUBZILKMSA-N Glu-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N JHSRJMUJOGLIHK-GUBZILKMSA-N 0.000 description 1
- HQOGXFLBAKJUMH-CIUDSAMLSA-N Glu-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N HQOGXFLBAKJUMH-CIUDSAMLSA-N 0.000 description 1
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 1
- TWYFJOHWGCCRIR-DCAQKATOSA-N Glu-Pro-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYFJOHWGCCRIR-DCAQKATOSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- MWTGQXBHVRTCOR-GLLZPBPUSA-N Glu-Thr-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MWTGQXBHVRTCOR-GLLZPBPUSA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- NTHIHAUEXVTXQG-KKUMJFAQSA-N Glu-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O NTHIHAUEXVTXQG-KKUMJFAQSA-N 0.000 description 1
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 1
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- FKJQNJCQTKUBCD-XPUUQOCRSA-N Gly-Ala-His Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O FKJQNJCQTKUBCD-XPUUQOCRSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 1
- FMVLWTYYODVFRG-BQBZGAKWSA-N Gly-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN FMVLWTYYODVFRG-BQBZGAKWSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- GNBMOZPQUXTCRW-STQMWFEESA-N Gly-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)CN)C(O)=O)=CNC2=C1 GNBMOZPQUXTCRW-STQMWFEESA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- HPAIKDPJURGQLN-KBPBESRZSA-N Gly-His-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 HPAIKDPJURGQLN-KBPBESRZSA-N 0.000 description 1
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- BXDLTKLPPKBVEL-FJXKBIBVSA-N Gly-Thr-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O BXDLTKLPPKBVEL-FJXKBIBVSA-N 0.000 description 1
- MREVELMMFOLESM-HOCLYGCPSA-N Gly-Trp-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O MREVELMMFOLESM-HOCLYGCPSA-N 0.000 description 1
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- VOEGKUNRHYKYSU-XVYDVKMFSA-N His-Asp-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O VOEGKUNRHYKYSU-XVYDVKMFSA-N 0.000 description 1
- LDTJBEOANMQRJE-CIUDSAMLSA-N His-Cys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LDTJBEOANMQRJE-CIUDSAMLSA-N 0.000 description 1
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 1
- VBOFRJNDIOPNDO-YUMQZZPRSA-N His-Gly-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N VBOFRJNDIOPNDO-YUMQZZPRSA-N 0.000 description 1
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 1
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 1
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 1
- UROVZOUMHNXPLZ-AVGNSLFASA-N His-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 UROVZOUMHNXPLZ-AVGNSLFASA-N 0.000 description 1
- BFOGZWSSGMLYKV-DCAQKATOSA-N His-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N BFOGZWSSGMLYKV-DCAQKATOSA-N 0.000 description 1
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 1
- CSTDQOOBZBAJKE-BWAGICSOSA-N His-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N)O CSTDQOOBZBAJKE-BWAGICSOSA-N 0.000 description 1
- DMHGKBGOUAJRHU-RVMXOQNASA-N Ile-Arg-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N DMHGKBGOUAJRHU-RVMXOQNASA-N 0.000 description 1
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 1
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 1
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 1
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- HOMFINRJHIIZNJ-HOCLYGCPSA-N Leu-Trp-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O HOMFINRJHIIZNJ-HOCLYGCPSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 1
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 1
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- MQMIRLVJXQNTRJ-SDDRHHMPSA-N Lys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O MQMIRLVJXQNTRJ-SDDRHHMPSA-N 0.000 description 1
- HEWWNLVEWBJBKA-WDCWCFNPSA-N Lys-Gln-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN HEWWNLVEWBJBKA-WDCWCFNPSA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 1
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- PELXPRPDQRFBGQ-KKUMJFAQSA-N Lys-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O PELXPRPDQRFBGQ-KKUMJFAQSA-N 0.000 description 1
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 1
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- 101710141347 Major envelope glycoprotein Proteins 0.000 description 1
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 1
- BVXXDMUMHMXFER-BPNCWPANSA-N Met-Ala-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVXXDMUMHMXFER-BPNCWPANSA-N 0.000 description 1
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 1
- YNOVBMBQSQTLFM-DCAQKATOSA-N Met-Asn-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O YNOVBMBQSQTLFM-DCAQKATOSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- YAWKHFKCNSXYDS-XIRDDKMYSA-N Met-Glu-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N YAWKHFKCNSXYDS-XIRDDKMYSA-N 0.000 description 1
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 1
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 1
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 1
- HZLSUXCMSIBCRV-RVMXOQNASA-N Met-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N HZLSUXCMSIBCRV-RVMXOQNASA-N 0.000 description 1
- OSZTUONKUMCWEP-XUXIUFHCSA-N Met-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC OSZTUONKUMCWEP-XUXIUFHCSA-N 0.000 description 1
- WUYLWZRHRLLEGB-AVGNSLFASA-N Met-Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O WUYLWZRHRLLEGB-AVGNSLFASA-N 0.000 description 1
- KRLKICLNEICJGV-STQMWFEESA-N Met-Phe-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 KRLKICLNEICJGV-STQMWFEESA-N 0.000 description 1
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 1
- KLGIQJRMFHIGCQ-ZFWWWQNUSA-N Met-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(=O)NCC(O)=O)=CNC2=C1 KLGIQJRMFHIGCQ-ZFWWWQNUSA-N 0.000 description 1
- HOTNHEUETJELDL-BPNCWPANSA-N Met-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N HOTNHEUETJELDL-BPNCWPANSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- 108091005461 Nucleic proteins Chemical group 0.000 description 1
- 102220484769 Olfactory receptor 5A1_A42S_mutation Human genes 0.000 description 1
- 238000002944 PCR assay Methods 0.000 description 1
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 1
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 1
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 1
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 1
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 1
- WYPVCIACUMJRIB-JYJNAYRXSA-N Phe-Gln-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N WYPVCIACUMJRIB-JYJNAYRXSA-N 0.000 description 1
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 1
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 1
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 1
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- OKQQWSNUSQURLI-JYJNAYRXSA-N Phe-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N OKQQWSNUSQURLI-JYJNAYRXSA-N 0.000 description 1
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 1
- QUUCAHIYARMNBL-FHWLQOOXSA-N Phe-Tyr-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N QUUCAHIYARMNBL-FHWLQOOXSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 1
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 1
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- ZBAGOWGNNAXMOY-IHRRRGAJSA-N Pro-Cys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZBAGOWGNNAXMOY-IHRRRGAJSA-N 0.000 description 1
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- ZTMLZUNPFDGPKY-VKOGCVSHSA-N Pro-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ZTMLZUNPFDGPKY-VKOGCVSHSA-N 0.000 description 1
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 1
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 1
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 1
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 1
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 1
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- DGPGKMKUNGKHPK-QEJZJMRPSA-N Ser-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGPGKMKUNGKHPK-QEJZJMRPSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 1
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 1
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 1
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 1
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- LSHUNRICNSEEAN-BPUTZDHNSA-N Ser-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CO)N LSHUNRICNSEEAN-BPUTZDHNSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000256251 Spodoptera frugiperda Species 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 1
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 1
- PAOYNIKMYOGBMR-PBCZWWQYSA-N Thr-Asn-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PAOYNIKMYOGBMR-PBCZWWQYSA-N 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 1
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 1
- APIQKJYZDWVOCE-VEVYYDQMSA-N Thr-Asp-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O APIQKJYZDWVOCE-VEVYYDQMSA-N 0.000 description 1
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 1
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 1
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 1
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 1
- XVHAUVJXBFGUPC-RPTUDFQQSA-N Thr-Tyr-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XVHAUVJXBFGUPC-RPTUDFQQSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- VZBWRZGNEPBRDE-HZUKXOBISA-N Trp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N VZBWRZGNEPBRDE-HZUKXOBISA-N 0.000 description 1
- NOFFAYIYPAUNRM-HKUYNNGSSA-N Trp-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC2=CNC3=CC=CC=C32)N NOFFAYIYPAUNRM-HKUYNNGSSA-N 0.000 description 1
- RXEQOXHCHQJMSO-IHPCNDPISA-N Trp-His-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O RXEQOXHCHQJMSO-IHPCNDPISA-N 0.000 description 1
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 1
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 1
- TUUXFNQXSFNFLX-XIRDDKMYSA-N Trp-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N TUUXFNQXSFNFLX-XIRDDKMYSA-N 0.000 description 1
- RERRMBXDSFMBQE-ZFWWWQNUSA-N Trp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERRMBXDSFMBQE-ZFWWWQNUSA-N 0.000 description 1
- WMIUTJPFHMMUGY-ZFWWWQNUSA-N Trp-Pro-Gly Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)NCC(=O)O WMIUTJPFHMMUGY-ZFWWWQNUSA-N 0.000 description 1
- YCQXZDHDSUHUSG-FJHTZYQYSA-N Trp-Thr-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 YCQXZDHDSUHUSG-FJHTZYQYSA-N 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- SGFIXFAHVWJKTD-KJEVXHAQSA-N Tyr-Arg-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SGFIXFAHVWJKTD-KJEVXHAQSA-N 0.000 description 1
- OEVJGIHPQOXYFE-SRVKXCTJSA-N Tyr-Asn-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OEVJGIHPQOXYFE-SRVKXCTJSA-N 0.000 description 1
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- MNMYOSZWCKYEDI-JRQIVUDYSA-N Tyr-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MNMYOSZWCKYEDI-JRQIVUDYSA-N 0.000 description 1
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 1
- RYSNTWVRSLCAJZ-RYUDHWBXSA-N Tyr-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RYSNTWVRSLCAJZ-RYUDHWBXSA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 1
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 1
- GFJXBLSZOFWHAW-JYJNAYRXSA-N Tyr-His-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GFJXBLSZOFWHAW-JYJNAYRXSA-N 0.000 description 1
- BJCILVZEZRDIDR-PMVMPFDFSA-N Tyr-Leu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 BJCILVZEZRDIDR-PMVMPFDFSA-N 0.000 description 1
- GYKDRHDMGQUZPU-MGHWNKPDSA-N Tyr-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GYKDRHDMGQUZPU-MGHWNKPDSA-N 0.000 description 1
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 1
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 1
- HRHYJNLMIJWGLF-BZSNNMDCSA-N Tyr-Ser-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 HRHYJNLMIJWGLF-BZSNNMDCSA-N 0.000 description 1
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 1
- PLVVHGFEMSDRET-IHPCNDPISA-N Tyr-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC3=CC=C(C=C3)O)N PLVVHGFEMSDRET-IHPCNDPISA-N 0.000 description 1
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 1
- QVYFTFIBKCDHIE-ACRUOGEOSA-N Tyr-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O QVYFTFIBKCDHIE-ACRUOGEOSA-N 0.000 description 1
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 1
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 1
- DJIJBQYBDKGDIS-JYJNAYRXSA-N Tyr-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O DJIJBQYBDKGDIS-JYJNAYRXSA-N 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 1
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 1
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 1
- GNWUWQAVVJQREM-NHCYSSNCSA-N Val-Asn-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GNWUWQAVVJQREM-NHCYSSNCSA-N 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- JXGWQYWDUOWQHA-DZKIICNBSA-N Val-Gln-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N JXGWQYWDUOWQHA-DZKIICNBSA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- XBRMBDFYOFARST-AVGNSLFASA-N Val-His-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N XBRMBDFYOFARST-AVGNSLFASA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- OJOMXGVLFKYDKP-QXEWZRGKSA-N Val-Met-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OJOMXGVLFKYDKP-QXEWZRGKSA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- VSCIANXXVZOYOC-AVGNSLFASA-N Val-Pro-His Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VSCIANXXVZOYOC-AVGNSLFASA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- 102220532013 WW domain-binding protein 11_K84Y_mutation Human genes 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000010502 episomal replication Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012091 fetal bovine serum Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000002825 functional assay Methods 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000002888 pairwise sequence alignment Methods 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 102200061561 rs121918552 Human genes 0.000 description 1
- 238000001338 self-assembly Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000005100 tissue tropism Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/01—DNA viruses
- C07K14/015—Parvoviridae, e.g. feline panleukopenia virus, human parvovirus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/64—General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/14011—Baculoviridae
- C12N2710/14041—Use of virus, viral particle or viral elements as a vector
- C12N2710/14044—Chimeric viral vector comprising heterologous viral elements for production of another viral vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/14011—Baculoviridae
- C12N2710/14111—Nucleopolyhedrovirus, e.g. autographa californica nucleopolyhedrovirus
- C12N2710/14141—Use of virus, viral particle or viral elements as a vector
- C12N2710/14144—Chimeric viral vector comprising heterologous viral elements for production of another viral vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14151—Methods of production or purification of viral material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14151—Methods of production or purification of viral material
- C12N2750/14152—Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Virology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Immunology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
본 개시내용은 일반적으로, 상응하는 야생형 서열에 대해 변형된 소단위 1(VP1) 서열을 갖는 바이러스성 캡시드 단백질을 갖는, 혈청형 2와는 다른 혈청형으로부터의 변형된 아데노-연관 바이러스(AAV)에 관한 것이다. 특히, 본 개시내용의 변형된 AAV는 곤충 세포에서 생성될 때 AAV의 기능성을 개선시키는, 상응하는 야생형 서열에 대해 포스포리파제 A2(PLA2) 도메인 및 측면 서열 내에서의 부위-특이적 아미노산 치환을 포함한다. 본 개시내용은 또한, 변형된 AAV를 생성시키는 방법, 이를 위한 시약, 바큘로바이러스 발현 시스템, 및 상기 변형된 AAV를 생성시키기 위한 곤충 세포에 관한 것이다.
Description
관련 출원에 대한 상호 참조문헌
본 출원은 2017년 8월 31일자로 출원된 미국 가출원 제62/553,028호의 이익을 청구하며, 이는 전문이 본 명세서에 참조에 의해 원용된다.
EFS
-WEB를 통해 전자적으로 제출된 서열 목록에 대한 참조문헌
본 출원은 EFS-Web을 통해 전자적으로 제출된 서열 목록(명칭: "4226.006PC01_Sequence_Listing_ST25.txt"; 크기: 100,400 바이트; 및 2018년 8월 22일자로 생성됨)을 포함하며, 이는 이의 전문이 본 명세서에 참조에 의해 원용된다.
기술분야
본 개시내용은 일반적으로, 변형된 포스포리파제 도메인을 지닌 바이러스성 캡시드 단백질을 갖는 아데노-연관 바이러스(adeno-associated virus: AAV), 및 곤충 세포에서 바큘로바이러스 발현 시스템을 이용하여 이를 생성하는 방법에 관한 것이다.
아데노-연관 바이러스(AAV)는 인간 유전자 요법을 위한 가장 유망한 바이러스 벡터들 중 하나이다. AAV는 2개의 ORF를 발현시키는 대략 4.7 kb의 ssDNA 게놈을 함유하는데, 하나는 바이러스 피막 단백질 VP1, VP2 및 VP3뿐만 아니라 조립 연관 단백질(Assembly Associated Protein) 또는 조립 활성화 단백질(Assembly Acticated Protein: AAP)을 암호화하며, 두번째는 4개의 바이러스 레플리카아제 성분을 암호화하며; ORF는 2개의 반전 말단 반복부(Inverted Terminal Repeat: ITR)의 측면에 위치되어 있다. ITR은 바이러스 rep 단백질에 의해 인식되는데, 여기서, 이러한 것들은 초기 바이러스 캡시드(nascent viral capsid)에서 새로이 합성된 게놈의 게놈 복제 및 로딩에서 결정적인 역할을 한다. 재조합 AAV 입자는 벡터를 사용하여 제조될 수 있는데, 여기서, 관심대상 유전자(Gene of Interest; GOI)는 2개의 ITR 사이에서 클로닝되며, 바이러스 cap 및 rep 단백질은 트랜스(trans)로 제공된다.
재조합 AAV 입자는 분화 인간 세포뿐만 아니라 비-분화 인간 세포를 효율적으로 감염시키는 능력을 보유한다. 바이러스 입자는 핵으로 진입하는데 여기서, 게놈이 에피솜으로서 유지되고, 장기간, 수개월 내지 수년 동안 재조합 벡터에 존재하는 임의의 이식 유전자를 계속 발현시키는 것으로 사료된다. 중요하게, AAV 감염이 일반적이더라도, 바이러스는 일반적으로, 임의의 질병과 연관되는 것으로 사료되지 않는다. 또한, 통상적으로, 이의 조직 굴성(tissue tropism)에 있어서 상이한, 혈청형 1 내지 혈청형 12로 불리는 다수의 AAV 혈청형이 존재한다. 이러한 장점을 고려하여, 재조합 아데노-연관 바이러스(rAAV)는 다수의 인간 질병에 대한 유전자 요법 임상 시험에서 평가되고 있다.
재조합 AAV를 위한 2가지 주요 타입의 생성 시스템이 존재한다: (1) 포유류 세포주(예를 들어, HEK293 세포, COS 세포, HeLa 세포, KB 세포)를 사용한 보편적인 생성 시스템; 및 (2) 보다 최근에, 곤충 세포를 사용한 생성 시스템.
포유류 생성 시스템은 통상적으로, 3개의 플라스미드가 포유류 세포주로 트랜스펙션되는 삼중 트랜스펙션을 포함하며, 이러한 플라스미드는 i) AAV rep 및 피막 단백질, ii) 아데노바이러스로부터 유도된 헬퍼 기능, 및 iii) ITR의 측면에 위치된 관심대상 유전자를 암호화한다. AAV rep 및 ITR 서열은 통상적으로, AAV2 혈청형뿐만 아니라, CAP 서열로부터 유도되며, 다른 혈청형으로부터의 서열은 슈도타입 바이러스 입자를 생성시키기 위해 치환될 수 있으며, 바이러스성 캡시드 단백질의 선택은 요망되는 조직 굴성을 반영한다.
포유류 생성 시스템은 여러 단점을 지닌다. 치료 용도를 위한 가장 중요한 단점은 부착성 포유류 세포의 대규모 트랜스펙션 및 AAV 생성 시스템의 결과적인 불량한 확장성(scalability)과 연관된 어려움이 있다. 또한, 포유류 세포 배양물에서 생성된 임상 사용을 위한 벡터가 포유류 숙주 세포에 존재하는 요망되지 않고 아마도 병원성인 물질로 오염될 위험이 존재한다.
포유류 생성 시스템에 대한 대안으로서, 곤충 세포는 바큘로바이러스 벡터를 사용한 AAV의 생산을 위해 사용될 수 있다. 바큘로바이러스는 곤충 세포를 감염시키며, 여기서, 이러한 것은 에피솜으로 복제하고, 바큘로바이러스-유도 프로모터의 사용을 통해, 감염된 세포에서 매우 높은 수준의 이식 유전자 발현을 유도할 수 있다. 통상적으로, 곤충 세포는 2개의 재조합 바큘로바이러스로 동시 감염되는데, 하나의 재조합 바큘로바이러스는 AAV cap 및 rep 단백질을 발현시키며, 제2 재조합 바큘로바이러스는 ITR의 측면에 위치된 GOI를 함유하며, 바이러스 헬퍼 기능은 필요하지 않다.
AAV의 생성을 위한 곤충 세포를 사용하는 주요 장점은 확장성(scalability)인데, 왜냐하면, 곤충 세포가 우태아 혈청과 같은 보충물 없이 현탁 배양물에서 성장하도록 구성되었기 때문이다. 그러나, 곤충 세포 생성 시스템은 또한, 3개의 AAV 캡시드 단백질(VP1, VP2 및 VP3)의 정확한 화학양론을 달성하는데의 어려움, 바큘로바이러스 발현 벡터의 통과 불안정성(passaging instability), 및 가장 현저하게, 통상적인 포유류 세포에서 생성된 상응하는 AAV와 비교하여 얻어진 AAV의 낮은 기능성을 포함하는, 여러 단점을 갖는다.
곤충 세포에서 생성된 AAV의 기능성은 AAV 혈청형에 따라 다르다. 예를 들어, 문헌[Urabe et al. (2006) J. Virol . 80(4):1874-1885]에는 곤충 세포에서 바큘로바이러스 시스템에서 생성된 AAV5 입자가 동일한 시스템에서 생성된 AAV2와는 상반되게 불량한 활성을 갖는다는 것이 보고되었다. 이후에, AAV2가 곤충 세포에서 바큘로바이러스 발현 시스템으로부터 생성될 때, 이의 바이러스성 캡시드 단백질의 소단위(subunit) 1(VP1)에서 포스포리파제 도메인(PLA)의 활성을 보유하여, 바이러스가 엔도솜 구획을 이탈하고 세포질에 도달할 수 있게 한다는 것이 인식되었다. Urabe 등의 문헌에서는 키메라 AAV2/5 VP1 단백질을 작제함으로써 이러한 문제를 일부 해결하였으며, 여기서, AAV5 VP1의 적어도 49개의 아미노산의 N-말단 부분은 비리온의 기능성을 개선시키기 위해 AAV2 VP1의 상응하는 부분으로 대체된다. 그러나, 인간 유전자 요법에서 AAV를 이용하는데 있어서의 관심을 고려하여, 곤충 세포에서 재조합 AAV(AAV2와는 다른 혈청형으로부터)를 생성하는 대안적이고/이거나 개선된 방법에 대한 필요성이 당해 분야에서 여전히 존재하는데, 여기서, AAV는 세포 내재화(cellular internalisation) 후에 엔도솜을 이탈시킬 수 있다.
본 명세서에 포함된 공개 문서, 행위, 물질, 디바이스, 물품, 등의 임의의 논의가 오로지 본 발명의 맥락을 제공할 목적을 위한 것으로 이해되어야 한다. 이러한 사항들 중 임의의 것 또는 모두가, 본 발명이 본 출원의 임의의 청구항의 우선일 전에 존재하기 때문에, 본 발명과 관련된 분야에서 일반적인 지식이라는 것을 인정하는 것으로 간주되어서는 안된다.
본 개시내용은, 곤충 세포에서 바큘로바이러스 발현 시스템으로부터 생성된, 혈청형 2와는 다른 혈청형으로부터의 AAV의 엔도솜 이탈 활성이 포스포리파제 도메인 및 측면 영역 내에서의 특정 부위에서 아미노산 치환을 만듦으로써 복원되거나 개선될 수 있다는 것을 본 발명자에 의한 예상치 못한 발견을 기초로 한 것이다. 상세하게, 본 발명자는 최초로, 최대 6개의 잔기 위치에서의 아미노산을 상응하는 위치에서 AAV 혈청형 2로부터의 아미노산으로 치환시킴으로써, 2개의 예시적인 AAV 혈청형, 즉, 혈청형 8 및 혈청형 9의 엔도솜 이탈 활성을 복원하거나 개선시키는 것이 가능하다는 것을 나타내었다. 이와 관련하여, 본 발명자는, 키메라 AAV를 생성하기 위해 전체 PLA 도메인을 AAV2의 것과 교환하는 것이 필요하지 않고, 곤충 세포에서 생성된 AAV의 기능성을 개선시키기 위해 지금까지 이용되는 전략이기 때문에, 야생형 VP1/PLA 서열 및 AAV2의 것, 예를 들어, AAV2/WT VP1을 포함하는 모자이크 캡시드를 발현시키는 AAV를 생성하는 것이 필요하지 않다는 것을 나타내었다. 이에 따라, 본 발명자들은 곤충 세포에서 생성된 재조합 비-혈청형 2 AAV의 엔도솜 이탈 활성이 개개 AAV의 야생형 바이러스성 캡시드 단백질 내의 전체 도메인 및/또는 소단위 서열을 대체하지 않으면서 복원되거나 개선될 수 있는 신규한 방법을 제공하였다.
이에 따라, 본 개시내용은 아데노-연관 바이러스(AAV) 바이러스성 캡시드 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함하는 핵산 분자로서, 바이러스성 캡시드 단백질은 1번 위치에 세린, 26번 위치에 글루탐산, 40번 위치에 아르기닌, 43번 위치에 아스파르트산, 44번 위치에 세린 및 64번 위치에 라이신을 포함하는 변형된 소단위 1(VP1) 서열을 포함하며, 아미노산 위치는 서열번호 1에 기술된 서열에 대해 규정되며, 1, 26, 40, 43, 44 및 64번 위치 중 임의의 하나 이상에서의 아미노산은 상응하는 야생형 서열에 대해 변형되며, 상기 임의의 하나 이상의 1, 26, 40, 43, 44 및 64번 위치에서의 아미노산과는 다른 추가적인 아미노산이 상응하는 야생형 서열에 대해 변형되지 않는 핵산 분자를 제공한다.
일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 1로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 3으로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 4로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 5로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 6으로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 7로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 8로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 9로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 10으로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 11로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 12로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 13으로부터 유래된다.
일례에서, 바이러스성 캡시드 단백질은 하기 바이러스성 캡시드 단백질들로 이루어진 군으로부터 선택된다:
(i) 변형된 VP1 서열이 서열번호 15에 기술된 서열을 포함하는 AAV1로부터의 바이러스성 캡시드 단백질;
(ii) 변형된 VP1 서열이 서열번호 16에 기술된 서열을 포함하는 AAV3으로부터의 바이러스성 캡시드 단백질;
(iii) 변형된 VP1 서열이 서열번호 17에 기술된 서열을 포함하는 AAV4로부터의 바이러스성 캡시드 단백질;
(iv) 변형된 VP1 서열이 서열번호 18에 기술된 서열을 포함하는 AAV5로부터의 바이러스성 캡시드 단백질;
(v) 변형된 VP1 서열이 서열번호 19에 기술된 서열을 포함하는 AAV6으로부터의 바이러스성 캡시드 단백질;
(vi) 변형된 VP1 서열이 서열번호 20에 기술된 서열을 포함하는 AAV7로부터의 바이러스성 캡시드 단백질;
(vii) 변형된 VP1 서열이 서열번호 21에 기술된 서열을 포함하는 AAV8로부터의 바이러스성 캡시드 단백질;
(viii) 변형된 VP1 서열이 서열번호 22에 기술된 서열을 포함하는 AAV9로부터의 바이러스성 캡시드 단백질;
(ix) 변형된 VP1 서열이 서열번호 23에 기술된 서열을 포함하는 AAV10으로부터의 바이러스성 캡시드 단백질;
(x) 변형된 VP1 서열이 서열번호 24에 기술된 서열을 포함하는 AAV11로부터의 바이러스성 캡시드 단백질;
(xi) 변형된 VP1 서열이 서열번호 25에 기술된 서열을 포함하는 AAV12로부터의 바이러스성 캡시드 단백질; 및
(xii) 변형된 VP1 서열이 서열번호 26에 기술된 서열을 포함하는 AAV13으로부터의 바이러스성 캡시드 단백질.
일례에서, 바이러스성 캡시드 단백질은 변형된 VP1 서열이 서열번호 15에 기술된 서열을 포함하는 AAV1로부터의 바이러스성 캡시드 단백질이다.
일례에서, 바이러스성 캡시드 단백질은 변형된 VP1 서열이 서열번호 16에 기술된 서열을 포함하는 AAV3으로부터의 바이러스성 캡시드 단백질이다.
일례에서, 바이러스성 캡시드 단백질은 변형된 VP1 서열이 서열번호 17에 기술된 서열을 포함하는 AAV4로부터의 바이러스성 캡시드 단백질이다.
일례에서, 바이러스성 캡시드 단백질은 변형된 VP1 서열이 서열번호 18에 기술된 서열을 포함하는 AAV5로부터의 바이러스성 캡시드 단백질이다.
일례에서, 바이러스성 캡시드 단백질은 변형된 VP1 서열이 서열번호 19에 기술된 서열을 포함하는 AAV6으로부터의 바이러스성 캡시드 단백질이다.
일례에서, 바이러스성 캡시드 단백질은 변형된 VP1 서열이 서열번호 20에 기술된 서열을 포함하는 AAV7로부터의 바이러스성 캡시드 단백질이다.
일례에서, 바이러스성 캡시드 단백질은 변형된 VP1 서열이 서열번호 21에 기술된 서열을 포함하는 AAV8로부터의 바이러스성 캡시드 단백질이다.
일례에서, 바이러스성 캡시드 단백질은 변형된 VP1 서열이 서열번호 22에 기술된 서열을 포함하는 AAV9로부터의 바이러스성 캡시드 단백질이다.
일례에서, 바이러스성 캡시드 단백질은 변형된 VP1 서열이 서열번호 23에 기술된 서열을 포함하는 AAV10으로부터의 바이러스성 캡시드 단백질이다.
일례에서, 바이러스성 캡시드 단백질은 변형된 VP1 서열이 서열번호 24에 기술된 서열을 포함하는 AAV11로부터의 바이러스성 캡시드 단백질이다.
일례에서, 바이러스성 캡시드 단백질은 변형된 VP1 서열이 서열번호 25에 기술된 서열을 포함하는 AAV12로부터의 바이러스성 캡시드 단백질이다.
일례에서, 바이러스성 캡시드 단백질은 변형된 VP1 서열이 서열번호 26에 기술된 서열을 포함하는 AAV13으로부터의 바이러스성 캡시드 단백질이다.
상기 예들 각각에서, 바이러스성 캡시드 단백질은 변형된 VP1과 동일한 AAV 혈청형으로부터의 소단위 2(VP2) 서열 및 소단위 3(VP3) 서열을 포함할 수 있다.
일례에서, AAV 바이러스성 캡시드 단백질을 암호화하는 뉴클레오타이드 서열은 곤충 세포에서 발현을 위한 프로모터에 작동 가능하게 연결된다. 일례에서, 프로모터는 폴리헤드론 프로모터(polyhedron promoter)이다. 다른 예에서, 프로모터는 p10 프로모터이다.
핵산 분자는 또한, Rep78 및 Rep68로부터 선택된 적어도 하나의 큰 AAV 복제(Rep) 단백질 및 Rep52 및 Rep40으로부터 선택된 적어도 하나의 작은 AAV Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함할 수 있다. 일례에서, 핵산 분자는 Rep78 및 Rep52를 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 핵산 분자는 Rep78 및 Rep40을 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 핵산 분자는 Rep68 및 Rep52를 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 핵산 분자는 Rep68 및 Rep40을 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 핵산 분자는 Rep78, Rep68, Rep52 및 Rep40을 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 상기 예들 각각에서, Rep 단백질은 바이러스성 캡시드 단백질과 동일한 AAV 혈청형으로부터의 것일 수 있다. 대안적으로, Rep 단백질은 바이러스성 캡시드 단백질과는 상이한 AAV 혈청형으로부터의 것일 수 있으며, 예를 들어, Rep 단백질은 AAV 혈청형 2로부터의 것일 수 있다.
Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 곤충 세포에서 Rep 단백질의 발현을 위한 프로모터에 작동 가능하게 연결될 수 있다. 일례에서, Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 폴리헤드론 프로모터에 작동 가능하게 연결된다. 일례에서, Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 p10 프로모터에 작동 가능하게 연결된다.
상기 예들 각각에서, 핵산 분자는 조립-활성화 단백질(AAP)을 암호화하는 폴리뉴클레오타이드를 포함할 수 있다. 예를 들어, AAP는 바이러스성 캡시드 단백질을 암호화하는 것과는 상이한 오픈 리딩 프레임(open reading frame)에 의해 암호화될 수 있다.
본 개시내용은 또한, 본 명세서에 기술된 바와 같은 핵산 분자를 포함하는 바큘로바이러스 벡터를 제공한다.
본 개시내용은 또한,
(i) 본 명세서에 기술된 바와 같은 핵산 분자를 포함하는 제1 바큘로바이러스 벡터로서, 핵산 분자가 본 명세서에 기술된 바와 같은 AAV 바이러스성 캡시드 단백질 및 Rep 단백질을 암호화하는, 상기 제1 바큘로바이러스 벡터; 및
(ii) AAV 반전 말단 반복부(ITR) 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드를 포함하는 제2 바큘로바이러스 벡터를 포함하는 복수의 바큘로바이러스 벡터를 제공한다.
일례에서, AAV ITR 서열은 바이러스성 캡시드 단백질과 동일한 혈청형으로부터 유래된다. 다른 예에서, AAV ITR 서열은 바이러스성 캡시드 단백질과 다른 혈청형으로부터 유래된다. 특정 일례에서, AAV ITR 서열은 AAV 혈청형 2로부터 유래된다.
본 개시내용은 또한,
(i) 본 명세서에 기술된 바와 같은 핵산 분자를 포함하는 제1 바큘로바이러스 벡터로서, 핵산 분자가 본 명세서에 기술된 바와 같은 AAV 바이러스성 캡시드 단백질을 암호화하는, 상기 제1 바큘로바이러스 벡터;
(ii) Rep78 및 Rep68로부터 선택된 적어도 하나의 큰 AAV 복제(Rep) 단백질 및 Rep52 및 Rep40으로부터 선택된 적어도 하나의 작은 AAV Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함하는 제2 바큘로바이러스 벡터; 및
(iii) AAV 반전 말단 반복부(ITR) 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드를 포함하는 제3 바큘로바이러스 벡터를 포함하는 복수의 바큘로바이러스 벡터를 제공한다.
일례에서, 제2 바큘로바이러스 벡터는 Rep78 및 Rep52를 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 제2 바큘로바이러스 벡터는 Rep78 및 Rep40을 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 제2 바큘로바이러스 벡터는 Rep68 및 Rep52를 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 제2 바큘로바이러스 벡터는 Rep68 및 Rep40을 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 제2 바큘로바이러스 벡터는 Rep78, Rep68, Rep52 및 Rep40을 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 상기 예들 각각에서, Rep 단백질은 제1 바큘로바이러스 벡터에서의 핵산 분자에 의해 암호화된 바이러스성 캡시드 단백질과 동일한 AAV 혈청형으로부터의 것일 수 있다. 대안적으로, Rep 단백질은 제1 바큘로바이러스 벡터에서의 핵산 분자에 의해 암호화된 바이러스성 캡시드 단백질과 상이한 AAV 혈청형으로부터의 것일 수 있으며, 예를 들어, Rep 단백질은 AAV 혈청형 2로부터의 것일 수 있다.
상기 예들 각각에서, 제2 바큘로바이러스 벡터 내에서 Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 곤충 세포에서 Rep 단백질의 발현을 위한 프로모터에 작동 가능하게 연결될 수 있다. 일례에서, 제2 바큘로바이러스 벡터 내에서 Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 폴리헤드론 프로모터에 작동 가능하게 연결된다. 일례에서, 제2 바큘로바이러스 벡터 내에서 Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 p10 프로모터에 작동 가능하게 연결된다.
일례에서, 제3 바큘로바이러스 벡터는 제1 바큘로바이러스 벡터에서의 핵산 분자에 의해 암호화된 바이러스성 캡시드 단백질과 동일한 혈청형으로부터의 AAV ITR 서열을 포함한다. 다른 예에서, 제3 바큘로바이러스 벡터는 제1 바큘로바이러스 벡터에서의 핵산 분자에 의해 암호화된 바이러스성 캡시드 단백질과는 다른 혈청형으로부터의 AAV ITR 서열을 포함한다. 특정 일례에서, AAV ITR 서열은 AAV 혈청형 2로부터 유도된 것이다.
바큘로바이러스 벡터들 중 적어도 하나는 AAV에 대한 조립-활성화 단백질(AAP)을 암호화하는 폴리뉴클레오타이드를 포함한다. 일례에서, AAP는 제1 바큘로바이러스 벡터 내에 포함된 폴리뉴클레오타이드 서열에 의해 암호화될 수 있다. 일례에서, AAP는 제2 바큘로바이러스 벡터 내에 포함된 폴리뉴클레오타이드 서열에 의해 암호화될 수 있다. 다른 예에서, AAP는 제3 바큘로바이러스 벡터 내에 포함된 폴리뉴클레오타이드 서열에 의해 암호화될 수 있다.
본 개시내용은 또한, 본 명세서에 기술된 바와 같은 핵산을 포함하는 곤충 세포를 제공한다.
본 개시내용은 또한, 본 명세서에 기술된 바와 같은 바큘로바이러스 벡터 또는 복수의 바큘로바이러스 벡터를 포함하는 곤충 세포를 제공한다.
일례에서, AAV 바이러스성 캡시드 단백질을 암호화하는 폴리뉴클레오타이드 서열 및/또는 Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 에피솜 복제 재조합 바큘로바이러스 게놈으로부터 발현된다.
대안적으로, 또는 추가적으로, AAV 반전 말단 반복부(ITR) 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드는 에피솜 복제 재조합 바큘로바이러스 게놈으로부터 발현된다.
본 개시내용은 또한, 곤충 세포에서 아데노-연관 바이러스(AAV)를 생성하는 방법으로서,
(i) 세포가 AAV를 생성시키기에 충분한 조건 하에서 배양 배지 중에서 본 명세서에 기술된 바와 같은 곤충 세포를 배양하고; 그리고 선택적으로,
(ii) 배양 배지 및/또는 세포로부터 AAV를 회수하는 것을 포함하는 방법을 제공한다.
본 개시내용은 또한, 곤충 세포에서 아데노-연관 바이러스(AAV)를 생성하는 방법으로서,
(i) 곤충 세포를, 본 명세서에 기술된 바와 같은 AAV 바이러스성 캡시드 단백질 및 Rep 단백질을 암호화하는 본 명세서에 기술된 핵산 분자를 포함하는 게놈을 갖는 제1 바큘로바이러스; 및 AAV 반전 말단 반복부(ITR) 서열, 예를 들어, AAV 혈청형 2로부터의 ITR 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드를 포함하는 게놈을 갖는 제2 바큘로바이러스로 동시 감염시키고;
(ii) 세포가 AAV를 생성하기에 충분한 조건 하에서 배양 배지 중에서 (i)에서의 바큘로바이러스로 감염된 곤충 세포를 배양하고; 그리고 선택적으로,
(iii) 배양 배지 및/또는 세포로부터 AAV를 회수하는 것을 포함하는 방법을 제공한다.
일례에서, AAV를 생성하는 방법은 배양 배지 및/또는 세포로부터 AAV를 회수하는 것을 포함한다. 다른 예에서, AAV를 생성하는 방법은 배양 배지 및/또는 세포로부터 AAV를 회수하는 것 및 이후에 AAV를 정제하는 것을 포함한다. 일례에서, AAV는 세포로부터 회수된다. 일례에서, AAV는 배양 배지로부터 회수된다. 일례에서, AAV는 세포 및 배양 배지로부터 회수된다.
제1 바큘로바이러스 및 제2 바큘로바이러스 중 적어도 하나의 게놈은 AAV에 대한 조립-활성화 단백질(AAP)을 암호화하는 폴리뉴클레오타이드를 포함할 것이다. 일례에서, AAP는 제1 바큘로바이러스의 게놈 내에 포함된 폴리뉴클레오타이드 게놈에 의해 암호화될 수 있다. 일례에서, AAP는 제2 바큘로바이러스의 게놈 내에 포함된 폴리뉴클레오타이드 게놈에 의해 암호화될 수 있다.
본 개시내용은 또한, 곤충 세포에서 아데노-연관 바이러스(AAV)를 생성하는 방법으로서,
(i) 곤충 세포를, 본 명세서에 기술된 바와 같은 AAV 바이러스성 캡시드 단백질을 암호화하는 본 명세서에 기술된 바와 같은 핵산 분자를 포함하는 게놈을 갖는 제1 바큘로바이러스; 및 Rep78 및 Rep68로부터 선택된 적어도 하나의 큰 AAV 복제(Rep) 단백질 및 Rep52 및 Rep40으로부터 선택된 적어도 하나의 작은 AAV Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함하는 게놈을 갖는 제2 바큘로바이러스; 및 AAV 반전 말단 반복부(ITR) 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드를 포함하는 게놈을 갖는 제3 바큘로바이러스와 동시 감염시키고;
(ii) 세포가 AAV를 생성하기에 충분한 조건 하에서 배양 배지 중에서 (i)에서의 바큘로바이러스로 감염된 곤충 세포를 배양하고; 그리고 선택적으로,
(iii) 배양 배지 및/또는 세포로부터 AAV를 회수하는 것을 포함하는 방법을 제공한다.
일례에서, 곤충 세포를 감염시킨 제2 바큘로바이러스 벡터는 Rep78 및 Rep52를 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 곤충 세포를 감염시킨 제2 바큘로바이러스 벡터는 Rep78 및 Rep40을 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 곤충 세포를 감염시킨 제2 바큘로바이러스 벡터는 Rep68 및 Rep52를 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 곤충 세포를 감염시킨 제2 바큘로바이러스 벡터는 Rep68 및 Rep40을 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 곤충 세포를 감염시킨 제2 바큘로바이러스 벡터는 Rep78, Rep68, Rep52 및 Rep40을 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 상기 예들 각각에서, Rep 단백질은 제1 바큘로바이러스 벡터에서의 핵산 분자에 의해 암호화된 바이러스성 캡시드 단백질과 동일한 AAV 혈청형으로부터의 것일 수 있다. 대안적으로, Rep 단백질은 제1 바큘로바이러스 벡터에서의 핵산 분자에 의해 암호화된 바이러스성 캡시드 단백질과 상이한 AAV 혈청형으로부터의 것일 수 있으며, 예를 들어, Rep 단백질은 AAV 혈청형 2로부터의 것일 수 있다.
상기 예들 각각에서, 제2 바큘로바이러스 벡터 내에서 Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 곤충 세포에서 Rep 단백질의 발현을 위한 프로모터에 작동 가능하게 연결될 수 있다. 일례에서, 제2 바큘로바이러스 내에서 Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 폴리헤드론 프로모터에 작동 가능하게 연결된다. 일례에서, 제2 바큘로바이러스 내에서 Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 p10 프로모터에 작동 가능하게 연결된다.
일례에서, 곤충 세포를 감염시킨 제3 바큘로바이러스는 제1 바큘로바이러스 벡터에서의 핵산 분자에 의해 암호화된 바이러스성 캡시드 단백질과 동일한 혈청형으로부터의 AAV ITR 서열을 포함한다. 다른 예에서, 곤충 세포를 감염시킨 제3 바큘로바이러스는 제1 바큘로바이러스 벡터에서의 핵산 분자에 의해 암호화된 바이러스성 캡시드 단백질과는 다른 혈청형으로부터의 AAV ITR 서열을 포함한다. 특정 일례에서, AAV ITR 서열은 AAV 혈청형 2로부터 유래된다.
일례에서, 제2 바큘로바이러스 벡터의 게놈에 의해 암호화된 Rep 단백질 및 제3 바큘로바이러스 벡터의 게놈에 의해 암호화된 ITR 서열은 AAV 혈청형 2로부터 유도된 것이다.
제1, 제2 및 제3 바큘로바이러스 중 적어도 하나의 게놈은 AAV에 대한 조립-활성화 단백질(AAP)을 암호화하는 폴리뉴클레오타이드를 포함할 것이다. 일례에서, AAP는 제1 바큘로바이러스의 게놈 내에 포함된 폴리뉴클레오타이드 서열에 의해 암호화될 수 있다. 일례에서, AAP는 제2 바큘로바이러스의 게놈 내에 포함된 폴리뉴클레오타이드 서열에 의해 암호화될 수 있다. 일례에서, AAP는 제3 바큘로바이러스의 게놈 내에 포함된 폴리뉴클레오타이드 서열에 의해 암호화될 수 있다.
일례에서, AAV를 생성하는 방법은 배양 배지 및/또는 세포로부터 AAV를 회수하는 것을 포함한다. 다른 예에서, AAV를 생성하는 방법은 배양 배지 및/또는 세포로부터 AAV를 회수하고, 이후에, AAV를 정제하는 것을 포함한다. 일례에서, AAV는 세포로부터 회수된다. 일례에서, AAV는 배양 배지로부터 회수된다. 일례에서, AAV는 세포 및 배양 배지로부터 회수된다.
본 개시내용은 또한, 본 명세서에 기술된 방법에 의해 생성된 아데노-연관 바이러스(AAV)를 제공한다.
또한, 1번 위치에 세린, 26번 위치에 글루탐산, 40번 위치에 아르기닌, 43번 위치에 아스파르트산, 44번 위치에 세린 및 64번 위치에 라이신을 포함하는 변형된 소단위 1(VP1) 서열을 포함하는 바이러스성 캡시드 단백질을 포함하는 아데노-연관 바이러스(AAV)로서, 아미노산 위치는 서열번호 1에 기술된 서열에 대해 규정되며, 1, 26, 40, 43, 44 및 64번 위치 중 임의의 하나 이상에서의 아미노산은 상응하는 야생형 서열에 대해 변형되며, 상기 임의의 하나 이상의 1, 26, 40, 43, 44 및 64번 위치에서의 아미노선과는 다른 추가적인 아미노산이 상응하는 야생형 서열에 대해 변형되지 않는 아데노-연관 바이러스(AAV)가 제공된다.
일례에서, 1, 26, 40, 43, 44 및 64번 위치 중 임의의 둘 이상에서의 아미노산은 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 변형된다. 일례에서, 1, 26, 40, 43, 44 및 64번 위치 중 임의의 세 개 이상에서의 아미노산은 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 변형된다. 일례에서, 1, 26, 40, 43, 44 및 64번 위치 중 임의의 네 개 이상에서의 아미노산은 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 변형된다. 일례에서, 1, 26, 40, 43, 44 및 64번 위치 중 임의의 다섯 개 이상에서의 아미노산은 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 변형된다. 일례에서, 1, 26, 40, 43, 44 및 64번 위치 각각에서의 아미노산은 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 변형된다.
변형된 VP1 서열을 포함하는 바이러스성 캡시드 단백질은 본 명세서에 기술되어 있으며, 이의 임의의 예는 달리 상세하게 기술하지 않는 한, 본 개시내용의 AAV에 필요한 부분을 약간 수정하여(mutatis mutandis) 적용하기 위해 취해야 한다.
일례에서, AAV는,
(i) 변형된 VP1 서열이 서열번호 15에 기술된 서열을 포함하는 AAV 혈청형 1;
(ii) 변형된 VP1 서열이 서열번호 16에 기술된 서열을 포함하는 AAV 혈청형 3;
(iii) 변형된 VP1 서열이 서열번호 17에 기술된 서열을 포함하는 AAV 혈청형 4;
(iv) 변형된 VP1 서열이 서열번호 18에 기술된 서열을 포함하는 AAV 혈청형 5;
(v) 변형된 VP1 서열이 서열번호 19에 기술된 서열을 포함하는 AAV 혈청형 6;
(vi) 변형된 VP1 서열이 서열번호 20에 기술된 서열을 포함하는 AAV 혈청형 7;
(vii) 변형된 VP1 서열이 서열번호 21에 기술된 서열을 포함하는 AAV 혈청형 8;
(viii) 변형된 VP1 서열이 서열번호 22에 기술된 서열을 포함하는 AAV 혈청형 9;
(ix) 변형된 VP1 서열이 서열번호 23에 기술된 서열을 포함하는 AAV 혈청형 10;
(x) 변형된 VP1 서열이 서열번호 24에 기술된 서열을 포함하는 AAV 혈청형 11;
(xi) 변형된 VP1 서열이 서열번호 25에 기술된 서열을 포함하는 AAV 혈청형 12; 및
(xii) 변형된 VP1 서열이 서열번호 26에 기술된 서열을 포함하는 AAV 혈청형 13으로 이루어진 군으로부터 선택된다.
일례에서, AAV는 변형된 VP1 서열이 서열번호 15에 기술된 서열을 포함하는 AAV 혈청형 1이다.
일례에서, AAV는 변형된 VP1 서열이 서열번호 16에 기술된 서열을 포함하는 AAV 혈청형 3이다.
일례에서, AAV는 변형된 VP1 서열이 서열번호 17에 기술된 서열을 포함하는 AAV 혈청형 4이다.
일례에서, AAV는 변형된 VP1 서열이 서열번호 18에 기술된 서열을 포함하는 AAV 혈청형 5이다.
일례에서, AAV는 변형된 VP1 서열이 서열번호 19에 기술된 서열을 포함하는 AAV 혈청형 6이다.
일례에서, AAV는 변형된 VP1 서열이 서열번호 20에 기술된 서열을 포함하는 AAV 혈청형 7이다.
일례에서, AAV는 변형된 VP1 서열이 서열번호 21에 기술된 서열을 포함하는 AAV 혈청형 8이다.
일례에서, AAV는 변형된 VP1 서열이 서열번호 22에 기술된 서열을 포함하는 AAV 혈청형 9이다.
일례에서, AAV는 변형된 VP1 서열이 서열번호 23에 기술된 서열을 포함하는 AAV 혈청형 10이다.
일례에서, AAV는 변형된 VP1 서열이 서열번호 24에 기술된 서열을 포함하는 AAV 혈청형 11이다.
일례에서, AAV는 변형된 VP1 서열이 서열번호 25에 기술된 서열을 포함하는 AAV 혈청형 12이다.
일례에서, AAV는 변형된 VP1 서열이 서열번호 26에 기술된 서열을 포함하는 AAV 혈청형 13이다.
본 개시내용은 또한, 단지 1, 26, 40, 43, 44 및 64번 위치에서만 하나 이상의 아미노산을 치환함으로써 상응하는 야생형 서열에 대해 AAV의 바이러스성 캡시드 단백질 내에서 VP1 서열을 변형시키는 것을 포함하는, 곤충 세포에서 생성된 혈청형 2와는 다른 혈청형으로부터 아데노-연관 바이러스(AAV)의 기능성을 개선시키는 방법으로서, 잔기 위치는 서열번호 1에 기술된 서열에 대해 결정되며, 이에 따라, 바이러스성 캡시드 단백질은 1번 위치에 세린, 26번 위치에 글루탐산, 40번 위치에 아르기닌, 43번 위치에 아스파르트산, 44번 위치에 세린 및 64번 위치에 라이신을 포함하게 하며, AAV는 변형되지 않고 곤충 세포에서 생성된 상응하는 야생형 AAV에 대해 개선된 기능성을 갖는 방법을 제공한다. AAV의 개선된 기능성은 바람직하게는, 내재화 후 세포의 엔도솜 구획을 이탈하는 AAV의 개선된 능력, 즉, 개선된 엔도솜 이탈 활성으로 인한 것일 것이다. 변형된 VP1 서열을 포함하는 AAV 바이러스성 캡시드 단백질은 본 명세서에 기술된 것이며, 이의 임의의 예는 달리 상세하게 기술하지 않는 한, 본 명세서에 기술된 바와 같은 것을 생산하는 방법에 필요한 부분을 약간 수정하여 적용하기 위해 취해야 한다.
일례에서, 방법은 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 1, 26, 40, 43, 44 및 64번 위치에서의 임의의 둘 이상의 아미노산을 변형시키는 것을 포함한다. 일례에서, 방법은 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 1, 26, 40, 43, 44 및 64번 위치에서의 임의의 세 개 이상의 아미노산을 변형시키는 것을 포함한다. 일례에서, 방법은 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 1, 26, 40, 43, 44 및 64번 위치에서의 임의의 네 개 이상의 아미노산을 변형시키는 것을 포함한다. 일례에서, 방법은 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 1, 26, 40, 43, 44 및 64번 위치에서의 임의의 다섯 개 이상의 아미노산을 변형시키는 것을 포함한다. 일례에서, 방법은 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 1, 26, 40, 43, 44 및 64번 위치에서의 아미노산을 변형시키는 것을 포함한다.
일례에서, 방법은,
(i) AAV가 혈청형 1의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 15에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(ii) AAV가 혈청형 3의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 16에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(iii) AAV가 혈청형 4의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 17에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(iv) AAV가 혈청형 5의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 18에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(v) AAV가 혈청형 6의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 19에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(vi) AAV가 혈청형 7의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 20에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(vii) AAV가 혈청형 8의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 21에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(viii) AAV가 혈청형 9의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 22에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(ix) AAV가 혈청형 10의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 23에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(x) AAV가 혈청형 11의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 24에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(xi) AAV가 혈청형 12의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 25에 기술된 서열을 포함하는 VP1 서열을 포함하고; 그리고
(xii) AAV가 혈청형 13의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 26에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다.
일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 15에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV1의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다.
일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 16에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV3의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다.
일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 17에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV4의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다.
일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 18에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV5의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다.
일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 19에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV6의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다.
일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 20에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV7의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다.
일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 21에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV8의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다.
일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 22에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV9의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다.
일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 23에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV10의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다.
일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 24에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV11의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다.
일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 25에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV12의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다.
일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 26에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV13의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다.
도 1은 BacAAV8-Rep-VPmod로 명시된 DNA 작제물에 대한 벡터 맵(vector map)이다. 이러한 DNA 작제물은 곤충 세포에서 AAV Rep 단백질 및 변형된 AAV8 캡시드 둘 모두를 발현시키기 위해 설계되었다. 벡터 골격은 바큘로바이러스 벡터 pOET1 골격(Oxford Expression Technologies)이고, 곤충 세포에서 변형된 AAV8 캡시드 단백질을 함유한 AAV를 제조하기 위해 사용되었다.
도 2는 AAV8-VPmod로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 AAV8-Rep-VPmod(도 4) 및 BacAAV8-Rep-VPmod(도 1)를 제조하기 위해 사용된 AAV8 캡시드 유전자의 변형된 버젼(modified version)을 함유한다.
도 3은 wtAAV8-Rep/Cap로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 곤충 세포에서 AAV Rep 단백질 및 wt AAV8 캡시드를 발현시키기 위해 설계되었고, wtAAV8 캡시드 단백질을 함유한 AAV를 제조하기 위해 사용되었다.
도 4는 AAV8-Rep-VPmod로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 곤충 세포에서 AAV Rep 단백질 및 변형된 AAV8 캡시드를 발현시키기 위해 설계되었고, BacAAV8-Rep-VPmod(도 1)를 제조하기 위해 사용되었다.
도 5는 BacAAV9-Rep-VPmod로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 곤충 세포에서 AAV Rep 단백질 및 변형된 AAV9 캡시드를 발현시키기 위해 설계되었다. 벡터 골격은 바큘로바이러스 벡터 pOET1 골격(Oxford Expression Technologies)이고, 변형된 AAV9 캡시드 단백질을 함유한 AAV를 제조하기 위해 사용되었다.
도 6은 AAV9-VPmod로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 BacAAV9-Rep-VPmod(도 5)를 제조하기 위해 사용된 AAV9 캡시드 유전자의 변형된 버젼을 함유한다.
도 7은 AAV9-Rep-VPmod로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 곤충 세포에서 AAV Rep 단백질 및 변형된 AAV9 캡시드를 발현시키기 위해 설계되었다.
도 8은 AAV2-GOI로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 AAV ITR의 측면에 위치된 2개의 shmiR을 발현시키기 위해 설계되었고 BacAAV2-GOI(도 9)를 제조하기 위해 사용되었다.
도 9는 BacAAV2-GOI로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 바큘로바이러스 벡터 pOET1 골격(Oxford Expression Technologies)에서 AAV ITR(AAV2-GOI)의 측면에 위치된 2개의 shmiR을 발현시키기 위해 설계되었다. 이러한 작제물은 2개의 shmiR을 암호화하는 GOI를 발현시키는 변형된 AAV9 캡시드 단백질을 함유한 AAV를 제조하기 위해 사용되었다.
도 10A 내지 도 10C는 (i) 포유류 세포(VecBio)에서 생성된 비변형된 VP1을 갖는 AAV8, (ii) 곤충 세포(BacVPmod)에서의 바큘로바이러스에 의해 생성된 변형된 VP1을 갖는 AAV8, 및 (iii) 곤충 세포(Ben10)에서의 바큘로바이러스에 의해 생성된 비변형된 VP1을 갖는 AAV8의 4x10e9, 8x10e9 및 1.6x10e10 AAV 벡터 게놈으로 감염된 JHU67 세포로부터 세포 당 발현된 shmiR 카피의 총수를 도시한 것이다. 포유류 세포에서 생성된 야생형 캡시드를 갖는 AAV는 곤충 세포에서 생성된 야생형 캡시드를 갖는 AAV와 비교하여 높은 수준의 shmiR을 발현시키며, 여기서, 발현은 거의 검출 가능하지 않다. 곤충 세포에서 생성된 변형된 VP1을 갖는 캡시드를 갖는 AAV는 비변형된 야생형 캡시드를 사용하여 곤충에서 생성된 AAV와 비교하여, 발현, 및 이에 따라, 기능성에 있어서 상당한 증가를 나타낸다.
도 11은 AAV 내재화 수용체(AAV-R)를 발현시키는 C2C12 세포로부터 발현되고 (i) 포유류 세포에서 생성된 비변형된 VP1을 갖는 AAV9, 및 (ii) 곤충 세포에서의 바큘로바이러스에 의해 생성된 변형된 VP1을 갖는 AAV9의 4x10e9, 8x10e9 및 1.6x10e10 AAV 벡터 게놈으로 감염된 shmiR 카피의 총수를 도시한 것이다. 두 재조합 바이러스 모두는 균등한 수준의 shmiR을 생성시켰으며, 이는 균등한 기능성을 나타내는 것이다.
서열목록에 대한 기호설명
서열번호 1: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형에 대한 변형된 공통 VP1 하위서열.
서열번호 2: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 1에 대한 VP1 하위서열.
서열번호 3: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 2에 대한 VP1 하위서열.
서열번호 4: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 3에 대한 VP1 하위서열.
서열번호 5: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 4에 대한 VP1 하위서열.
서열번호 6: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 5에 대한 VP1 하위서열.
서열번호 7: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 6에 대한 VP1 하위서열.
서열번호 8: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 7에 대한 VP1 하위서열.
서열번호 9: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 8에 대한 VP1 하위서열.
서열번호 10: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 9에 대한 VP1 하위서열.
서열번호 11: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 10에 대한 VP1 하위서열.
서열번호 12: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 11에 대한 VP1 하위서열.
서열번호 13: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 12에 대한 VP1 하위서열.
서열번호 14: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 13에 대한 VP1 하위서열.
서열번호 15: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 1에 대한 변형된 VP1 하위서열.
서열번호 16: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 3에 대한 변형된 VP1 하위서열.
서열번호 17: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 4에 대한 변형된 VP1 하위서열.
서열번호 18: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 5에 대한 변형된 VP1 하위서열.
서열번호 19: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 6에 대한 변형된 VP1 하위서열.
서열번호 20: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 7에 대한 변형된 VP1 하위서열.
서열번호 21: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 8에 대한 변형된 VP1 하위서열.
서열번호 22: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 9에 대한 변형된 VP1 하위서열.
서열번호 23: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 10에 대한 변형된 VP1 하위서열.
서열번호 24: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 11에 대한 변형된 VP1 하위서열.
서열번호 25: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 12에 대한 변형된 VP1 하위서열.
서열번호 26: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 13에 대한 변형된 VP1 하위서열.
서열번호 27: AAV 혈청형 1에 대한 VP1 아미노산 서열.
서열번호 28: AAV 혈청형 2에 대한 VP1 아미노산 서열.
서열번호 29: AAV 혈청형 3에 대한 VP1 아미노산 서열.
서열번호 30: AAV 혈청형 4에 대한 VP1 아미노산 서열.
서열번호 31: AAV 혈청형 5에 대한 VP1 아미노산 서열.
서열번호 32: AAV 혈청형 6에 대한 VP1 아미노산 서열.
서열번호 33: AAV 혈청형 7에 대한 VP1 아미노산 서열.
서열번호 34: AAV 혈청형 8에 대한 VP1 아미노산 서열.
서열번호 35: AAV 혈청형 9에 대한 VP1 아미노산 서열.
서열번호 36: AAV 혈청형 10에 대한 VP1 아미노산 서열.
서열번호 37: AAV 혈청형 11에 대한 VP1 아미노산 서열.
서열번호 38: AAV 혈청형 12에 대한 VP1 아미노산 서열.
서열번호 39: AAV 혈청형 13에 대한 VP1 아미노산 서열.
도 2는 AAV8-VPmod로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 AAV8-Rep-VPmod(도 4) 및 BacAAV8-Rep-VPmod(도 1)를 제조하기 위해 사용된 AAV8 캡시드 유전자의 변형된 버젼(modified version)을 함유한다.
도 3은 wtAAV8-Rep/Cap로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 곤충 세포에서 AAV Rep 단백질 및 wt AAV8 캡시드를 발현시키기 위해 설계되었고, wtAAV8 캡시드 단백질을 함유한 AAV를 제조하기 위해 사용되었다.
도 4는 AAV8-Rep-VPmod로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 곤충 세포에서 AAV Rep 단백질 및 변형된 AAV8 캡시드를 발현시키기 위해 설계되었고, BacAAV8-Rep-VPmod(도 1)를 제조하기 위해 사용되었다.
도 5는 BacAAV9-Rep-VPmod로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 곤충 세포에서 AAV Rep 단백질 및 변형된 AAV9 캡시드를 발현시키기 위해 설계되었다. 벡터 골격은 바큘로바이러스 벡터 pOET1 골격(Oxford Expression Technologies)이고, 변형된 AAV9 캡시드 단백질을 함유한 AAV를 제조하기 위해 사용되었다.
도 6은 AAV9-VPmod로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 BacAAV9-Rep-VPmod(도 5)를 제조하기 위해 사용된 AAV9 캡시드 유전자의 변형된 버젼을 함유한다.
도 7은 AAV9-Rep-VPmod로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 곤충 세포에서 AAV Rep 단백질 및 변형된 AAV9 캡시드를 발현시키기 위해 설계되었다.
도 8은 AAV2-GOI로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 AAV ITR의 측면에 위치된 2개의 shmiR을 발현시키기 위해 설계되었고 BacAAV2-GOI(도 9)를 제조하기 위해 사용되었다.
도 9는 BacAAV2-GOI로 명시된 DNA 작제물에 대한 벡터 맵이다. 이러한 DNA 작제물은 바큘로바이러스 벡터 pOET1 골격(Oxford Expression Technologies)에서 AAV ITR(AAV2-GOI)의 측면에 위치된 2개의 shmiR을 발현시키기 위해 설계되었다. 이러한 작제물은 2개의 shmiR을 암호화하는 GOI를 발현시키는 변형된 AAV9 캡시드 단백질을 함유한 AAV를 제조하기 위해 사용되었다.
도 10A 내지 도 10C는 (i) 포유류 세포(VecBio)에서 생성된 비변형된 VP1을 갖는 AAV8, (ii) 곤충 세포(BacVPmod)에서의 바큘로바이러스에 의해 생성된 변형된 VP1을 갖는 AAV8, 및 (iii) 곤충 세포(Ben10)에서의 바큘로바이러스에 의해 생성된 비변형된 VP1을 갖는 AAV8의 4x10e9, 8x10e9 및 1.6x10e10 AAV 벡터 게놈으로 감염된 JHU67 세포로부터 세포 당 발현된 shmiR 카피의 총수를 도시한 것이다. 포유류 세포에서 생성된 야생형 캡시드를 갖는 AAV는 곤충 세포에서 생성된 야생형 캡시드를 갖는 AAV와 비교하여 높은 수준의 shmiR을 발현시키며, 여기서, 발현은 거의 검출 가능하지 않다. 곤충 세포에서 생성된 변형된 VP1을 갖는 캡시드를 갖는 AAV는 비변형된 야생형 캡시드를 사용하여 곤충에서 생성된 AAV와 비교하여, 발현, 및 이에 따라, 기능성에 있어서 상당한 증가를 나타낸다.
도 11은 AAV 내재화 수용체(AAV-R)를 발현시키는 C2C12 세포로부터 발현되고 (i) 포유류 세포에서 생성된 비변형된 VP1을 갖는 AAV9, 및 (ii) 곤충 세포에서의 바큘로바이러스에 의해 생성된 변형된 VP1을 갖는 AAV9의 4x10e9, 8x10e9 및 1.6x10e10 AAV 벡터 게놈으로 감염된 shmiR 카피의 총수를 도시한 것이다. 두 재조합 바이러스 모두는 균등한 수준의 shmiR을 생성시켰으며, 이는 균등한 기능성을 나타내는 것이다.
서열목록에 대한 기호설명
서열번호 1: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형에 대한 변형된 공통 VP1 하위서열.
서열번호 2: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 1에 대한 VP1 하위서열.
서열번호 3: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 2에 대한 VP1 하위서열.
서열번호 4: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 3에 대한 VP1 하위서열.
서열번호 5: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 4에 대한 VP1 하위서열.
서열번호 6: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 5에 대한 VP1 하위서열.
서열번호 7: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 6에 대한 VP1 하위서열.
서열번호 8: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 7에 대한 VP1 하위서열.
서열번호 9: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 8에 대한 VP1 하위서열.
서열번호 10: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 9에 대한 VP1 하위서열.
서열번호 11: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 10에 대한 VP1 하위서열.
서열번호 12: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 11에 대한 VP1 하위서열.
서열번호 13: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 12에 대한 VP1 하위서열.
서열번호 14: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 13에 대한 VP1 하위서열.
서열번호 15: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 1에 대한 변형된 VP1 하위서열.
서열번호 16: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 3에 대한 변형된 VP1 하위서열.
서열번호 17: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 4에 대한 변형된 VP1 하위서열.
서열번호 18: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 5에 대한 변형된 VP1 하위서열.
서열번호 19: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 6에 대한 변형된 VP1 하위서열.
서열번호 20: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 7에 대한 변형된 VP1 하위서열.
서열번호 21: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 8에 대한 변형된 VP1 하위서열.
서열번호 22: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 9에 대한 변형된 VP1 하위서열.
서열번호 23: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 10에 대한 변형된 VP1 하위서열.
서열번호 24: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 11에 대한 변형된 VP1 하위서열.
서열번호 25: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 12에 대한 변형된 VP1 하위서열.
서열번호 26: PLA2 도메인 및 측면 서열을 포함하는, AAV 혈청형 13에 대한 변형된 VP1 하위서열.
서열번호 27: AAV 혈청형 1에 대한 VP1 아미노산 서열.
서열번호 28: AAV 혈청형 2에 대한 VP1 아미노산 서열.
서열번호 29: AAV 혈청형 3에 대한 VP1 아미노산 서열.
서열번호 30: AAV 혈청형 4에 대한 VP1 아미노산 서열.
서열번호 31: AAV 혈청형 5에 대한 VP1 아미노산 서열.
서열번호 32: AAV 혈청형 6에 대한 VP1 아미노산 서열.
서열번호 33: AAV 혈청형 7에 대한 VP1 아미노산 서열.
서열번호 34: AAV 혈청형 8에 대한 VP1 아미노산 서열.
서열번호 35: AAV 혈청형 9에 대한 VP1 아미노산 서열.
서열번호 36: AAV 혈청형 10에 대한 VP1 아미노산 서열.
서열번호 37: AAV 혈청형 11에 대한 VP1 아미노산 서열.
서열번호 38: AAV 혈청형 12에 대한 VP1 아미노산 서열.
서열번호 39: AAV 혈청형 13에 대한 VP1 아미노산 서열.
일반
본 명세서 전반에 걸쳐, 달리 상세하게 기술하지 않거나 문맥이 달리 요구하지 않는 한, 단일 단계, 특징, 물질의 조성물, 단계들의 그룹 또는 특징들의 그룹 또는 물질의 조성물들의 그룹에 대한 언급은 그러한 단계들, 특징들, 물질의 조성물들, 단계들의 그룹 또는 특징들 또는 물질의 조성물들의 그룹들 중 하나 또는 복수(즉, 하나 이상)를 포함하는 것으로 취해져야 한다.
당업자는, 본 개시가 상세하게 기술된 것 이외의 변형 및 개질에 영향을 받기 쉬운 것으로 인식할 것이다. 본 개시가 모든 이러한 변형 및 개질을 포함하는 것으로 이해되어야 한다. 본 개시내용은 또한, 본 명세서에서 개별적으로 또는 총괄적으로 지칭되거나 지시된 모든 단계들, 특징들, 조성물들 및 화합물들, 및 상기 단계들 또는 특징들 중 임의의 및 모든 조합 또는 임의의 둘 이상을 포함한다.
본 개시내용은 본 명세서에 기술된 특정 예에 의해 범위를 제한하지 않으며, 이는 오로지 예시 목적을 위해 의도된 것이다. 기능적으로 균등한 제품, 조성물 및 방법은 명확하게 본 개시내용의 범위 내에 속한다.
본원의 본 개시내용의 임의의 예는 달리 상세하게 기술하지 않는 한, 본 개시내용의 임의의 다른 예에 필요한 부분만 약간 수정하여 적용하기 위해 취해져야 한다.
달리 상세하게 규정하지 않는 한, 본 명세서에서 사용되는 모든 기술용어 및 과학용어는 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖기 위해 취해져야 한다(예를 들어, 세포 배양, 분자 유전학, 면역학, 면역조직화학, 단백질 화학, 및 생화학에서).
달리 명시하지 않는 한, 본 개시에서 사용되는 재조합 DNA, 재조합 단백질, 세포 배양, 및 면역학적 기술은 당업자에게 널리 공지된 표준 절차이다. 이러한 기술은 문헌[J. Perbal, A Practical Guide to Molecular Cloning, John Wiley and Sons (1984), J. Sambrook et al. Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press (1989), T.A. Brown (editor), Essential Molecular Biology: A Practical Approach, Volumes 1 and 2, IRL Press (1991), D.M. Glover and B.D. Hames (editors), DNA Cloning: A Practical Approach, Volumes 1-4, IRL Press (1995 and 1996), and F.M. Ausubel et al. (editors), Current Protocols in Molecular Biology, Greene Pub. Associates and Wiley-Interscience (1988, 현재까지 모든 업데이트를 포함함), Ed Harlow and David Lane (editors) Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, (1988), 및 J.E. Coligan et al. (editors) Current Protocols in Immunology, John Wiley & Sons (현재까지 모든 업데이트를 포함함)]과 같은 소스(source)에서의 문헌 전반에 걸쳐 기술되고 설명된다.
본 명세서 전반에 걸쳐, 문맥이 달리 요망되지 않는 한, 단어 "포함하다(comprise)", 또는 변형체, 예를 들어, "포함하다(comprises)" 또는 "포함하는(comprising)"은 기술된 단계 또는 요소 또는 정수(integer) 또는 단계들 또는 요소들 또는 정수들의 그룹의 포함을 시사하지만, 임의의 다른 단계 또는 요소 또는 정수, 또는 요소들 또는 정수들의 그룹의 배제를 시사하지 않는 것으로 이해된다.
용어 "및/또는(and/or)", 예를 들어, "X 및/또는 Y"는 "X 및 Y" 또는 "X 또는 Y"를 의미하는 것으로 이해되어야 하고, 두 의미 모두 또는 어느 하나의 의미에 대한 명시적인 지지를 제공하기 위해 취해져야 한다.
선택된 정의
본 명세서에서 사용되는 용어 "아데노-연관 바이러스" 또는 "AAV"는 짧은 (대략 4.7 kb) 단일 가닥 DNA 게놈을 함유하고 이의 복제를 위한 아데노바이러스와 같은 헬퍼 바이러스의 존재에 의존적인 파르보비리다에(Parvoviridae) 패밀리 내의 바이러스의 그룹에 관한 것이다. 또한, 본 개시에 의해 AAV로부터 유도된 벡터, 즉, 유전자 전달 비히클이 고려된다.
AAV의 맥락에서 사용되는 바와 같은, 본 명세서에서 사용되는 용어 "혈청형"은 다른 AAV 혈청형과 혈청학적으로 구별되는 캡시드를 갖는 AAV를 지칭하기 위해 사용되는 구별(distinction)이다. 혈청학적 특수성(serologic distinctiveness)은 다른 AAV와 비교하여 하나의 AAV에 대한 항체들 간의 교차-반응성의 결여를 기초로 하여 결정된다. 이러한 교차-반응성 차이는 대개 캡시드 단백질 서열/항원 결정자에서의 차이로 인한 것이다(예를 들어, AAV 혈청형의 VP1 , VP2, 및/또는 VP3 서열 차이로 인한 것이다).
AAV의 맥락에서 본 명세서에서 사용되는 용어 "바이러스성 캡시드 단백질", "캡시드 단백질", "캡시드 폴리펩타이드" 또는 유사한 것은 피막 단백질 또는 VP 단백질로도 지칭되는, AAV 입자의 단백질성 쉘을 생성시키기 위한 자가-조립의 활성을 갖는 AAV의 폴리펩타이드에 관한 것이다. 이는 가지 소단위, 즉, VP1, VP2 및 VP3을 포함하며, 이는 통상적으로, 단일 핵산 분자로부터 발현되고, 정20면체 대칭의 캡시드를 형성하기 위해 함께 상호작용한다. AAV의 캡시드 구조는 문헌[BERNARD N. FIELDS et al., VIROLOGY, volume 2, chapters 69 & 70 (4th ed., Lippincott-Raven Publishers)]에 기술되어 있다.
본 명세서에서 사용되는 용어 "작동 가능하게 연결된(operably-linked)" 또는 "작동 가능한 연결(operable linkage)" (또는 유사한 것)은 기능적 관계에서 폴리뉴클레오타이드 요소의 연결을 지칭한다. 핵산 또는 폴리뉴클레오타이드 서열은 다른 핵산 서열과 기능적 관계로 배치될 때 "작동 가능하게 연결"된다. 예를 들어, 전사 조절 서열, 예를 들어, 프로모토, 인핸서(enhancer) 또는 당해 분야에 인식된 다른 발현 제어 요소는 그러한 암호화 서열의 전사에 영향을 미치는 경우에, 암호화 서열에 작동 가능하게 연결될 것이다.
본 명세서에서 사용되는 용어 "프로모터"는 일반적으로, 하나 이상의 암호화 서열의 전사를 개시하고 제어하기 위해 DNA-의존 RNA 폴리머라제 및 다른 단백질(트랜스-작용 전사 인자)의 인식 및 결합에 관여되고, 일반적으로, 전사 방향에 대해 암호화 서열의 업스트림에 위치된 DNA 서열에 관한 것이다.
복수 또는 단수의, 본 명세서에서 사용되는 용어 "반전 말단 반복부" 또는 "ITR"은 벡터의 반대 단부에 위치된 상보적인 서열과 조합하여 사용할 때 헤어핀 구조를 형성할 수 있는 벡터의 하나의 단부에서 위치된 서열을 지칭한다. 반전 말단 반복부의 쌍은 숙주 게놈에서 AAV DNA의 구조, 복제 및 패키징에 관여한다. ITR은 또한, AAV DNA의 효율적인 캡시드화(encapsidation) 및 완전히 어셈블링된 AAV 입자의 발생을 위해 필요로 한다.
변형된 캡시드 단백질 또는 VP1 서열을 포함하는 본 개시내용의 AAV의 문맥에서 사용되는 용어 "개선된 기능성" 또는 유사한 것은 변형된 캡시드 단백질 또는 VP1 서열을 포함하는 AAV가 변형되지 않고 곤충 세포에서 생성된 동일한 혈청형의 야생형 AAV에 대해 개선된 엔도솜 이탈 활성을 갖는다는 것을 의미하는 것으로 이해되어야 한다. 본 명세서에서 사용되는 용어 "엔도소말 이탈 활성", "엔도솜 이탈 활성", 또는 유사한 것은 세포 내재화 후 엔도솜 구획으로부터 이탈하는 AAV의 능력을 의미하는 것으로 이해되어야 한다. AAV 기능성의 맥락에서, 세포 내재화 후 엔도솜으로부터 이탈하지 못하는 AAV가 특히 유전자 요법의 맥락에서 기능적이지 않는 것으로 인식될 것이다.
변형된
AAV의
생성을 위한 DNA
작제물
본 개시내용은 일반적으로, 곤충 세포에서 생성될 때 (상응하는 야생형 AAV에 대해) 기능성을 개선시키거나 복원시킨, 특히, 변형된 VP1 서열 및 관련된 관련된 포스포리파제 A2(PLA2) 도메인을 포함하는, 변형된 바이러스성 캡시드 단백질을 갖는 AAV에 관한 것이다. 본 개시내용은 또한, 이러한 변형된 AAV의 생성, 및 유전자 요법의 경우에서와 같은, 포유류 세포에서 외인성 핵산의 도입 및/또는 발현을 위한 벡터로서 이의 용도에 관한 것이다.
AAV는 일반적으로, 인간(예를 들어, 혈청형 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13) 또는 영장류(예를 들어, 혈청형 1 및 4)를 감염시킨다. 모든 공지된 AAV 혈청형의 게놈 조직화(genomic organization)는 매우 유사하다. AAV의 게놈은 일반적으로 길이가 약 5,000개 미만의 뉴클레오타이드(nt)인 선형, 단일 가닥 DNA 분자이다. 반전 말단 반복부(ITR)는 비-구조 복제(Rep) 단백질 및 구조(VP) 단백질을 위한 독특한 암호화 뉴클레오타이드 서열의 측면에 위치되어 있다. VP 단백질(VP1, VP2 및 VP3)은 캡시드를 형성한다. AAV 캡시드 조립은 조립-활성화 단백질(AAP)의 발현을 필요로 하며, 이는 VP2 및 VP3 ORF의 암호화 서열 내에 놓여 있는 캡시드 유전자의 프레임내 오픈 리딩 프레임에 의해 암호화된다[Sonntag et al., (2010) PNAS, 107(22):10220-10225]. 말단 145 nt는 자가-상보적이고, T-형상 헤어핀을 형성하는 에너지적으로 안정한 분자내 듀플렉스, 즉, 반전 말단 반복부(ITR)가 형성될 수 있다. 이러한 헤어핀 구조는 바이러스 DNA 복제를 위한 기원(origin)으로서 기능하여, 세포 DNA 폴리머라제 복합물을 위한 프라이머로서 역할을 한다. 포유류 세포에서 야생형 AAV(wtAAV)의 감염 후에, Rep 유전자(즉, Rep78 및 Rep52)는 각각 P5 프로모터 및 P19 프로모터로부터 발현된다. Rep78 단백질은 바이러스 게놈의 복제에서 기능을 갖는 반면, Rep52 단백질은 초기 게놈(nascent genome)을 바이러스 입자 내로 이동한다. Rep ORF에서의 접합 이벤트는 4가지의 Rep 단백질(즉, Rep78, Rep68, Rep52 및 Rep40)의 발현을 야기시킨다. 그러나, 포유류 세포에서 Rep78 및 Rep52 단백질을 암호화하는 비접합된 mRNA가 AAV 벡터 생성하기에 충분하다는 것이 나타났다. 또한, 곤충 세포에서, Rep78 및 Rep52 단백질은 AAV 벡터 생성을 위해 충분하다. 3가지 캡시드 단백질, 즉, VP1, VP2 및 VP3은 p40 프로모터로부터의 단일 VP 리딩 프레임으로부터 발현된다.
AAV(특히, 곤충 세포에서 생성된 것)의 기능성에 대한 특히 중요한 것은 VP1 소단위이며, 이는 보존된 포스포리파제 A2(PLA2) 모티프를 함유하며, 이의 활성은 후에 바이러스 게놈이 숙주 세포의 핵 내로 이동하는 엔도솜 이탈을 위해 필요한 것으로 밝혀졌다. 혈청형 2의 AAV가 곤충 세포에서 발현될 때 PLA2 활성을 보유하고 이에 의해 이의 기능성을 보유하는 것으로 나타났지만, 다른 혈청형의 AAV는 파르보비리다에(Parvoviridae)를 가로지르는 이러한 도메인의 일반적인 보존에도 불구하고 결함이 있는 PLA2 활성을 갖는다. 이러한 결함이 있는 PLA2 활성은 곤충 세포에서, 혈청형 2와는 다른, 가능성 AAV를 생성하는 능력을 제한하였다. 키메라 AAV2/5 VP1 단백질의 작제를 포함하는, 이러한 문제를 다양한 효과로 해결하기 위한 다수의 방법이 이용되었으며, 여기서, AAV VP1 서열, 또는 PLA2 모티프를 함유한 이의 N-말단 부분은 AAV2 VP1의 상응하는 서열로 대체된다(도메인 교환). 또한, 야생형 및 혈청형 2 VP1 서열 둘 모두를 발현시키는 AAV를 야기시키는 AAV2 VP1-기반 모자이크의 생성이 보고되어 있다. 이러한 방법이 곤충 세포에서 발현될 때 기능성을 다양한 정도까지 개선시키는 것으로 보고되었지만, 임상 환경에서 사용하기 위한 곤충 세포에서 AAV 벡터를 생성시키기 위한 바큘로바이러스 시스템은 여전히 제한된다. 본 개시에서, AAV VP1 서열에 대한 부위 특이적 변형을 포함하는 신규한 방법이 기술되어 있으며, 이는 곤충 세포에서 바큘로바이러스 시스템으로부터 발현될 때 AAV2와는 다른 혈청형으로부터 AAV의 후속 기능성을 개선시키는 것으로 나타났다. 개선된 기능성은 엔도솜 구획을 탈출시키는 비리온의 능력에 의해 부여된다.
이에 따라, 본 개시내용은 아데노-연관 바이러스(AAV) 바이러스성 캡시드 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함하는 핵산 분자를 제공하며, 여기서, 바이러스성 캡시드 단백질은 1번 위치에 세린, 26번 위치에 글루탐산, 40번 위치에 아르기닌, 43번 위치에 아스파르트산, 44번 위치에 세린 및 64번 위치에 라이신을 포함하는 변형된 소단위 1(VP1) 서열을 포함하며, 아미노산 위치는 서열번호 1에 기술된 서열에 대해 규정되며, 1, 26, 40, 43, 44 및 64번 위치 중 임의의 하나 이상에서의 아미노산은 상응하는 야생형 서열에 대해 변형되며, 상기 임의의 하나 이상의 1, 26, 40, 43, 44 및 64번 위치에서의 아미노산과는 다른 추가적인 아미노산은 상응하는 야생형 서열에 대해 변형되지 않는다.
일례에서, 서열번호 1에 기술된 서열의 1, 26, 40, 43, 44 및 64번 위치 중 임의의 2, 3, 4, 5 또는 6개에서의 아미노산은 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 변형된다.
AAV 캡시드 단백질을 암호화하는 폴리뉴클레오타이드 서열은 혈청형 2와는 다른, 일반적으로 인간을 감염시키는 AAV(예를 들어, 혈청형 1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13) 중 임의의 하나로부터의 것일 수 있다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 1로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 3으로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 4로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 5로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 6으로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 7로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 8로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 9로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 10으로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 11로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 12로부터 유래된다. 일례에서, 바이러스성 캡시드 단백질은 AAV 혈청형 13으로부터 유래된다.
AAV 캡시드 단백질을 암호화하는 폴리뉴클레오타이드 서열은 서열번호 15 내지 26 중 어느 하나에 기술된 서열을 포함하는 변형된 VP1을 암호화할 수 있다. 일례에서, 바이러스성 캡시드 단백질은 AAV1로부터의 것이며, 변형된 VP1 서열은 서열번호 15에 기술된 서열을 포함한다. 일례에서, 바이러스성 캡시드 단백질은 AAV3으로부터의 것이며, 변형된 VP1 서열은 서열번호 16에 기술된 서열을 포함한다. 일례에서, 바이러스성 캡시드 단백질은 AAV4로부터의 것이며, 변형된 VP1 서열은 서열번호 17에 기술된 서열을 포함한다. 일례에서, 바이러스성 캡시드 단백질은 AAV5로부터의 것이며, 변형된 VP1 서열은 서열번호 18에 기술된 서열을 포함한다. 일례에서, 바이러스성 캡시드 단백질은 AAV6으로부터의 것이며, 변형된 VP1 서열은 서열번호 19에 기술된 서열을 포함한다. 일례에서, 바이러스성 캡시드 단백질은 AAV7로부터의 것이며, 변형된 VP1 서열은 서열번호 20에 기술된 서열을 포함한다. 일례에서, 바이러스성 캡시드 단백질은 AAV8로부터의 것이며, 변형된 VP1 서열은 서열번호 21에 기술된 서열을 포함한다. 일례에서, 바이러스성 캡시드 단백질은 AAV9로 유래되고, 변형된 VP1 서열은 서열번호 22에 기술된 서열을 포함한다. 일례에서, 바이러스성 캡시드 단백질은 AAV10으로부터의 것이며, 변형된 VP1 서열은 서열번호 23에 기술된 서열을 포함한다. 일례에서, 바이러스성 캡시드 단백질은 AAV11로부터의 것이며, 변형된 VP1 서열은 서열번호 24에 기술된 서열을 포함한다. 일례에서, 바이러스성 캡시드 단백질은 AAV12로부터의 것이며, 변형된 VP1 서열은 서열번호 25에 기술된 서열을 포함한다. 일례에서, 바이러스성 캡시드 단백질은 AAV13으로부터의 것이며, 변형된 VP1 서열은 서열번호 26에 기술된 서열을 포함한다.
상기 예들 각각에서, 바이러스성 캡시드 단백질은 변형된 VP1과 동일한 AAV 혈청형으로부터의 소단위 2(VP2) 및 소단위 3(VP3) 서열을 포함할 수 있다. 바람직하게는, VP1, VP1 및 VP3은 동일한 ORF로부터 발현된다.
본 명세서에 기술된 바와 같은 AAV 바이러스성 캡시드 단백질을 암호화하는 뉴클레오타이드 서열은 곤충 세포에서 캡시드 단백질의 발현을 위해 적합한 프로모터에 작동 가능하게 연결될 수 있다. 곤충 세포에서 발현을 위한 적합한 프로모터는 당해 분야에 공지되어 있고, 본 명세서에서 사용하도록 고려된다. 이와 관련하여, 곤충 세포에서 폴리펩타이드의 분자 공학 및 발현을 위한 방법은 종래에, 예를 들어, 문헌[Summers and Smith, A Manual of Methods for Baculovirus Vectors and Insect Culture Procedures, Texas Agricultural Experimental Station Bull. No. 7555, College Station, Tex. (1986); Luckow., In Prokop et al., Cloning and Expression of Heterologous Genes in Insect Cells with Baculovirus Vectors' Recombinant DNA Technology and Applications, 97-152 (1991); King, L. A and R. D. Possee, The baculovirus expression system, Chapman and Hall, United Kingdom (1992); O'Reilly, D. R., L. K. Miller, V. A Luckow, Baculovirus Expression Vectors: A Laboratory Manual, New York (1992); W. H. Freeman and Richardson, C. D., Baculovirus Expression Protocols, Methods in Molecular Biology, volume 39 (1992); 미국 특허 제4,745,051호; US2003148506; WO2003/074714; Kotin RM (2011) Hum. Mol . Genet., 20(R1):R2-R6; Aucoin et al., (2006) Biotechnol . Bioeng . 95(6):1081-1092; 및 van Oers et al., (2015) J. Gen. Virol . 96:6-23]에 기술되어 있다. 당해 분야에 공지된 프로모터 및 다른 이러한 조절 요소(regulatory element)는 본 개시내용의 핵산에서 사용하기 위해 명확하게 고려된다. 특정 일례에서, 프로모터는 폴리헤드론 프로모터 또는 p10 프로모터이다.
본 명세서에 기술된 바와 같이, AAV 캡시드 조립은 비-구조 단백질, 조립-활성화 단백질(AAP)의 발현을 필요로 한다. 이에 따라, 상기 예들 각각에서, 본 명세서에 기술된 바와 같은 핵산 분자는 AAP를 암호화하는 폴리뉴클레오타이드를 포함할 수 있다.
본 명세서에 기술된 바와 같이, AAV 게놈은 Rep 유전자(즉, Rep78 및 Rep52)를 포함하며, 이에 의해 암호화된 바이러스는 바이러스 게놈의 복제에서 기능한다. Rep ORF에서의 접합 사건(splicing event)은 4가지 Rep 단백질(즉, Rep78, Rep68, Rep52 및 Rep40)의 발현을 야기시킨다. 그러나, 곤충 세포에서 Rep78 및 Rep52 단백질을 암호화하는 비접합 mRNA가 AAV 벡터 생성을 위해 충분한 것으로 나타났다. 이에 따라, 일례에서, 본 개시내용의 핵산 분자는 또한, Rep78 및 Rep68로부터 선택된 적어도 하나의 큰 AAV 복제 Rep 단백질 및 Rep52 및 Rep40으로부터 선택된 적어도 하나의 작은 AAV Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 본 명세서에 기술된 핵산 분자는 Rep78 및 Rep52를 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 본 명세서에 기술된 핵산 분자는 Rep78 및 Rep40을 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 본 명세서에 기술된 핵산 분자는 바이러스성 캡시드 단백질과 동일한 AAV 혈청형으로부터의 Rep68 및 Rep52를 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 본 명세서에 기술된 핵산 분자는 Rep68 및 Rep40을 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, 본 명세서에 기술된 핵산 분자는 Rep78, Rep68, Rep52 및 Rep40을 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 상기 예들 각각에서, 개개 작은 및 큰 Rep 단백질은 바이러스성 캡시드 단백질과 동일한 AAV 혈청형으로부터 유도된 것일 수 있다. 대안적으로, 개개 작은 및 큰 Rep 단백질은 바이러스성 캡시드 단백질과는 다른 AAV 혈청형으로부터 유도될 수 있으며, 예를 들어, Rep 단백질은 AAV 혈청형 2로부터 유도된 것일 수 있다.
Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 곤충 세포에서 Rep 단백질의 발현을 위해 적합한 프로모터에 작동 가능하게 연결될 수 있다. 곤충 세포에서 발현을 위한 적합한 프로모터는 당해 분야에 공지되어 있고, 본 명세서에서 사용하도록 고려된다. 특정 일례에서, 프로모터는 폴리헤드론 프로모터 또는 p10 프로모터일 수 있다. 개개 Rep 단백질을 암호화하는 뉴클레오타이드 서열은 동일한 프로모터에 작동 가능하게 연결될 수 있다. 대안적으로, Rep 단백질을 암호화하는 각 서열은 그 자체의 프로모터에 작동 가능하게 연결될 수 있다.
변형된 VP1 서열을 암호화하는 핵산은 실리코(in silico) 내에서, 예를 들어, 야생형 AAV 서열 또는 야생형 AAV 서열로부터 유도된 천연 발생 변이체 AAV 서열을 기초로 한 실리코 내에서 설계될 수 있으며, 핵산 서열을 포함하는 DNA 작제물은 당해 분야에 공지된 방법을 이용하여 합성될 수 있다. 대안적으로, 또는 추가적으로, 본 명세서에 기술된 바와 같은 상응하는 야생형 VP1 서열(또는 그러한 야생형 AAV 서열로부터 유도된 천연 발생 변이체 AAV 서열)에 대해 VP1 서열에 대한 변형은 예를 들어, 예컨대, 문헌[Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York]에 기술된 널리 공지된 유전 공학 기술의 적용에 의해 달성될 수 있다. VP 및 비리온의 수율을 증가시키거나 변경된 굴성과 같은 다른 요망되는 효과를 갖거나 비리온의 항원성을 감소시킬 수 있다는 VP 암호화 서열의 다양한 추가 변경은 당업자에게 공지되어 있다. 이러한 변형은 본 개시내용의 범위 내에 속하는 것이다.
본 개시에서, 예를 들어, 본 명세서에 기술된 바와 같이 곤충 세포에서 변형된 VP1 서열을 갖는 AAV의 생성을 위해 사용될 수 있는 AAV 서열은 임의의 AAV 혈청형의 게놈으로부터 유도될 수 있다. 일반적으로, AAV 혈청형은 아미노산 및 핵산 수준에서 유의미한 상동성의 게놈 서열을 가지고, 동일한 세트의 유전자 기능을 제공하고, 물리적으로 및 기능적으로 유사한 비리온을 생성시키고, 실제적으로 동일한 메커니즘에 의해 복제하고 조립한다(본 명세서에 기술된 PLA2 도메인의 활성이 특별히 제외됨). 본 개시내용의 변형된 AAV의 설계 및 생성에서 사용하기 위한 AAV을 위한 적합한 핵산 및 단백질 서열은 공개적으로 이용 가능하다. 인간을 감염시키기 위해 공지된(그리고 본 명세서에서 고려된) 야생형 AAV를 위한 VP1 서열은 문헌[Chen et al., (2013) J. Vir . 87(11):6391-6405]에 기술되어 있다. 인간 또는 원숭이 아데노-연관 바이러스(AAV) 혈청형은 본 개시내용의 맥락에서 사용하기 위한 AAV 뉴클레오타이드 서열의 바람직한 소스, 및 더욱 바람직하게는, 일반적으로 인간을 감염시키는 AAV 혈청형(예를 들어, 혈청형 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 및 13)이다. AAV 혈청형 1 내지 13, 예를 들어, AAV1(Genbank 수탁 번호: AAD27757.1, GI:4689097), AAV2(Genbank 수탁 번호: AAC03780.1, GP.2906023), AAV3(Genbank 수탁 번호: AAC55049.1, GI: 1408469), AAV4(Genbank 수탁 번호: AAC58045.1, GL2337940), AAV5(Genbank 수탁 번호: AAD13756.1, GI-4249658), AAV10(Genbank 수탁 번호: AAT46337.1, GL48728343), AAV11(Genbank 수탁 번호: AAT46339.1, GI:48728346), AAV12(Genbank 수탁 번호: ABI16639.1, GI: 112379656), 또는 AAV13(Genbank 수탁 번호: ABZ10812.1, GI: 167047087)에 대한 캡시드 폴리펩타이드 서열은 당해 분야에 공지되어 있다. 혈청형 1 내지 13에 대한 AAV 캡시드 단백질을 위한 폴리펩타이드 서열은 또한, 본 명세서에서 서열번호 27 내지 39에 기술되어 있다. 또한, 혈청형 1 내지 13으로부터의 AAV, 예를 들어, AAV1(NCBI 참조 서열 NC_002077.1), AAV2(GenBank 수탁 번호: J01901.1), AAV3(Genbank 수탁 번호: AF028705.1), AAV4(NCBI 참조 서열: NC_001829.1), AAV5(NCBI 참조 서열: NC_006152.1), AAV6(GenBank: AF028704.1), AAV7(NCBI 참조 서열: NC_006260.1), AAV8(NCBI 참조 서열: NC_006261.1), AAV9(GenBank 수탁 번호: AY530579.1), AAV10(Genbank 수탁 번호: AY631965.1), AAV11(Genbank 수탁 번호: AY631966.1) 또는 AAV12(Genbank 수탁 번호: DQ813647.1) 또는 AAV13(Genbank 수탁 번호: EU285562.1)에 대한 완전 게놈은 당해 분야에 공지되어 있다.
본 개시내용은 또한, 본 개시내용의 핵산에 의해 암호화된 변형된 VP1 서열을 포함하는 AAV 캡시드 단백질을 제공한다.
변형된
AAV의
생성을 위한
바큘로바이러스
벡터
본 개시내용은 또한, 곤충 세포-혼화 가능한 벡터, 즉, 바큘로바이러스 벡터에서의 본 개시내용의 핵산 분자를 제공한다. 특히, 본 개시내용은 본 명세서에 기술된 바와 같은 변형된 VP1 서열을 갖는 AAV 바이러스성 캡시드 단백질을 암호화하는 핵산 분자를 포함하는 바큘로바이러스 벡터를 제공한다.
본 개시내용은 또한,
(i) 본 명세서에 기술된 바와 같은 변형된 VP1 서열을 갖는 AAV 바이러스성 캡시드 단백질을 암호화하는 핵산 분자를 포함하는 제1 바큘로바이러스 벡터; 및
(ii) AAV 반전 말단 반복부(ITR) 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드를 포함하는 제2 바큘로바이러스 벡터를 포함하는 복수의 바큘로바이러스 벡터를 제공한다.
일례에서, AAV ITR 서열은 제1 바큘로바이러스 벡터 내의 핵산 분자에 의해 암호화된 바이러스성 캡시드 단백질과 동일한 혈청형으로부터 유도된 것이다. 다른 예에서, AAV ITR 서열은 다른 AAV 혈청형, 예를 들어, AAV2로부터 유도된 것이다.
통상적으로, 측면 ITR을 포함하는, 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드는 길이에 있어서, 5,000개 이하의 뉴클레오타이드(nt)이다. 그러나, 너무 큰(oversized) DNA, 즉, 길이가 5,000 초과의 nt를 암호화하는 폴리뉴클레오타이드가 또한, 고려된다. 너무 큰 DNA는 본 명세서에서, 5 kbp의 최대 AAV 패키징 한계를 초과하는 DNA로서 이해된다. 이에 따라, 대개 5.0 kb보다 더 큰 게놈에 의해 암호화된 재조합 단백질 또는 RNA를 생성시킬 수 있는 AAV 벡터의 발생이 또한, 실현 가능할 수 있다.
포유류 세포에서 발현을 위한 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드는, 복제되고 곤충 세포에서 복제된 AAV 게놈 내에 도입되도록, 바큘로바이러스 벡터 내에 위치될 것이다. 임의의 뉴클레오타이드 서열은, 작제물이 AAV 비리온의 패키징 용량 내에 잔류하는 한, 본 개시에 따라 생성된 AAV로 트랜스펙션된 포유류 세포에서 나중에 발현시키기 위해 도입될 수 있다. 폴리뉴클레오타이드 서열은 예를 들어, 관심대상 단백질을 암호화할 수 있거나, 이는 RNAi 작용제, 즉, RNA 간섭을 가능하게 하는 RNA 분자, 예를 들어, 예컨대, shRNA(짧은 헤어핀 RNA) 또는 짧은 헤어핀 마이크로 RNA(shmiR)를 발현시킬 수 있다. 일례에서, 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드는 복수의 관심대상 단백질, 복수의 RNAi 작용제, 또는 하나 이상의 관심대상 단백질 및 하나 이상의 RNAi 작용제를 암호화한다. 포유류 세포에서 발현하기 위한 관심대상 단백질은 치료 유전자 제품일 수 있다. 치료 유전자 제품은 폴리펩타이드, 또는 RNA 분자(예를 들어, 본 명세서에 기술된 바와 같은 shRNA 또는 shmiR), 또는 표적 세포에서 발현될 때, 요망되는 치료 효과, 예를 들어, 예컨대, 요망되지 않는 활성의 절제, 예컨대, 감염된 세포의 절제, 또는 유전자 결함의 보완, 예를 들어, 효소 활성의 결핍 야기를 제공하는 다른 유전자 제품일 수 있다. 대안적으로, 또는 추가적으로, 폴리뉴클레오타이드에 의해 암호화된 관심대상 단백질은 세포 형질전환 및 발현을 평가하기 위해 마커 단백질로서 역할을 할 수 있다. 이러한 목적을 위한 적합한 마커 단백질은 예를 들어, 형광 단백질 GFP 또는 반딧불이 루시페라아제(firefly luciferase)이다. 이러한 마커 유전자를 얻기 위한 소스(source) 및 이의 사용 방법은 문헌[Sambrook and Russel (2001) "Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York]에 제공되어 있다.
제1 바큘로바이러스 벡터가 AAV Rep 단백질을 암호화하지 않는 예에 따르면, 복수의 바큘로바이러스 벡터는,
(iii) Rep78 및 Rep68로부터 선택된 적어도 하나의 큰 AAV Rep 단백질 및 Rep52 및 Rep40으로부터 선택된 적어도 하나의 작은 AAV Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함하는 제3 바큘로바이러스 벡터를 추가로 포함한다.
예를 들어, 제3 바큘로바이러스 벡터는 Rep78 및 Rep52를 암호화하는 폴리뉴클레오타이드 서열을 포함할 수 있다. 예를 들어, 제3 바큘로바이러스 벡터는 Rep78 및 Rep40을 암호화하는 폴리뉴클레오타이드 서열을 포함할 수 있다. 예를 들어, 제3 바큘로바이러스 벡터는 Rep68 및 Rep52를 암호화하는 폴리뉴클레오타이드 서열을 포함할 수 있다. 예를 들어, 제3 바큘로바이러스 벡터는 Rep68 및 Rep40을 암호화하는 폴리뉴클레오타이드 서열을 포함할 수 있다. 예를 들어, 제3 바큘로바이러스 벡터는 Rep78, Rep68, Rep52 및 Rep40을 암호화하는 폴리뉴클레오타이드 서열을 포함할 수 있다. 제3 바큘로바이러스 벡터를 기술하는 상기 예 각각에서, 개개 작은 Rep 단백질 및 큰 Rep 단백질은 제1 바큘로바이러스 벡터에 의해 암호화된 바이러스성 캡시드 단백질과 동일한 AAV 혈청형으로부터의 것일 수 있다. 대안적으로, 개개 작은 Rep 단백질 및 큰 Rep 단백질은 제1 바큘로바이러스 벡터에 의해 암호화된 바이러스성 캡시드 단백질과는 다른 AAV 혈청형으로부터의 것일 수 있으며, 예를 들어, Rep 단백질은 AAV 혈청형 2로부터의 것일 수 있다. 이와 관련하여, Rep 서열은 대부분의 혈청형 중에서 특히 보존되며, Rep 서열이 곤충 세포에서 효율적으로 교차-상보적이라는 것이 보고되었다.
복수의 바큘로바이러스를 기술하는 상기 예 각각에서, 제3 바큘로바이러스 벡터 내에서 Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 곤충 세포에서 Rep 단백질의 발현을 위한 프로모터에 작동 가능하게 연결될 수 있다. 곤충 세포에서 단백질의 발현을 위한 적합한 프로모터는 기술되어 있고, 상세히 기술하지 않는 한 바큘로바이러스 벡터를 기술하는 본 개시내용의 예에 필요한 부분만 약간 수정하여 적용하기 위해 취해져야 한다.
복수의 바큘로바이러스 벡터 중 적어도 하나는 AAV 캡시드 어셈블리를 위해 요구되는 바와 같은 조립-활성화 단백질(AAP)을 암호화하는 폴리뉴클레오타이드를 포함할 것이다. 일례에서, 캡시드 단백질을 암호화하는 바큘로바이러스 벡터는 AAP를 암호화하는 폴리뉴클레오타이드를 포함한다. 대안적인 예에서, Rep 단백질을 암호화하는 바큘로바이러스 및/또는 관심대상 단백질 또는 RNA를 암호화하는 바큘로바이러스는 AAP를 암호화하는 폴리뉴클레오타이드를 포함한다.
바큘로바이러스 벡터 및 이의 생성 및 사용 방법은 당해 분야에 공지되어 있고 곤충 세포의 분자 공학에 대한 상기 인용된 참조문헌에 기술되어 있다.
곤충 세포
또한, 본 명세서에는 본 명세서에 기술된 바와 같은 변형된 VP1 서열을 갖는 AAV 바이러스성 캡시드 단백질을 암호화하는 본 개시내용의 핵산 분자를 포함하는 곤충 세포가 제공된다.
곤충 세포는 또한, 바람직하게는, (i) Rep78 및 Rep68로부터 선택된 적어도 하나의 큰 AAV Rep 단백질 및 Rep52 및 Rep40으로부터 선택된 적어도 하나의 작은 AAV Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열, 및 (ii) AAV ITR 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드를 포함할 것이다. 큰 Rep 단백질 및 작은 Rep 단백질의 특정 조합뿐만 아니라, 적합한 ITR은 본 명세서에, 예를 들어, 본 개시내용의 바큘러바이러스 벡터의 맥락에 기술되어 있고, 달리 상세히 기술하지 않는 한 곤충 세포를 기술하는 본 개시내용의 예에 필요한 부분만 약간 수정하여 적용하기 위해 취해져야 한다. 마찬가지로, 곤충 세포에 의해 생성된 AAV의 게놈 내에 도입을 위한 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드는 본 명세서에, 예를 들어, 본 개시내용의 바큘로바이러스 벡터의 맥락에 기술되어 있고, 달시 상세히 기술하지 않는 한 곤충 세포를 기술하는 본 개시내용의 예에 필요한 부분만 약간 수정하여 적용하기 위해 취해져야 한다.
바람직하게는, (i) 본 명세서에 기술된 바와 같은 변형된 VP1 서열을 갖는 AAV 바이러스성 캡시드 단백질을 암호화하는 본 개시내용의 핵산 분자, (ii) Rep 단백질을 암호화하는 폴리뉴클레오타이드, 및 (iii) AAV ITR 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드 각각은 바큘로바이러스 벡터 내에 도입되고, 곤충 세포를 감염시키기 위해 사용된다. 바람직하게는, (i) 내지 (iii) 중 적어도 하나는 또한, 조립-활성화 단백질(AAP) AAV 캡시드 조립을 암호화하는 폴리뉴클레오타이들르 포함할 것이다. 이에 따라, 본 명세서에 기술된 곤충 세포는 감염성이고 안정한 AAV 비리온의 발현 및 조립을 가능하게 하기 위해 필수적인 성분들을 포함할 것이다. 일례에서, 곤충 세포는 에피솜 복제 재조합 바큘로바이러스를 포함할 수 있다.
본 개시내용은 또한, 감염성이고 안정한 AAV 비리온을 생성할 수 있는 본 명세서에 기술된 바와 같은 바큘로바이러스 벡터 또는 복수의 바큘로바이러스 벡터를 포함하는 곤충 세포를 제공한다. 일례에서, 곤충 세포는 본 명세서에 기술된 바와 같은 바큘로바이러스 벡터 또는 복수의 바큘로바이러스 벡터로 형질전환되거나 트랜스펙션된 것이다. 곤충 세포가 본 개시내용의 바큘로바이러스 벡터 또는 복수의 바큘로바이러스 벡터로 형질전환되거나 트랜스펙션된 예에 따르면, (i) 본 명세서에 기술된 바와 같은 변형된 VP1 서열을 갖는 AAV 바이러스성 캡시드 단백질을 암호화하는 본 개시내용의 핵산 분자, (ii) Rep 단백질을 암호화하는 폴리뉴클레오타이드, 및 (iii) AAV ITR 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드 각각은 에피솜 복제 재조합 바큘로바이러스 게놈으로부터 발현될 것이다.
바큘로바이러스의 복제를 허용하고 배양물 중에 유지될 수 있는 임의의 곤충 세포는 본 개시에 따라 사용될 수 있다. 예를 들어, 사용되는 세포주는 스포도프테라 프루기페르다(Spodoptera frugiperda), 드로소필라 세포주(Drosophila cell line), 또는 모기 세포주, 예를 들어, 아에데스 알보픽투스 유래 세포주(Aedes albopictus derived cell line)로부터의 것일 수 있다. 바람직한 곤충 세포 또는 세포주는 예를 들어, expresSF+®, Drosophila Schneider 2(S2) 세포, Se301, SeIZD2109, SeUCRl, Sf9, Sf900+, Sf21, BTI-TN-5Bl-4, MG-I, 5 Tn368, HzAml, Ha2302 및 Hz2E5를 포함하는, 바큘로바이러스 감염되기 쉬운 곤충 종으로부터의 세포이다.
변형된
AAV를
생성하는 방법
본 개시내용은 또한, 본 명세서에 기술된 바와 같은 변형된 VP1 서열을 암호화하는 핵산이 곤충 세포 내에서 발현되며 AAV가 여기에서 어셈블링된 변형된 VP1 서열을 갖는 캡시드 단백질을 포함하는 AAV를 생성하는 방법을 제공한다. 일례에서, 본 개시내용은
(i) 세포가 AAV를 생성하기에 충분한 조건 하에서 배양 배지 중에서 본 명세서에 기술된 바와 같은 곤충 세포를 배양하고; 그리고 선택적으로,
(ii) 배양 배지 및/또는 세포로부터 AAV를 회수하는 것을 포함하는 곤충 세포에서 AAV를 생성하는 방법을 제공한다.
다른 예에서, 본 개시내용은
(i) 곤충 세포를, 본 명세서에 기술된 변형된 VP1 서열을 갖는 AAV 바이러스성 캡시드 단백질을 암호화하는 본 개시내용의 핵산 분자를 포함하고 Rep78 및 Rep68로부터 선택된 적어도 하나의 큰 AAV 복제(Rep) 단백질 및 Rep52 및 Rep40으로부터 선택된 적어도 하나의 작은 AAV Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함하는 게놈을 갖는 제1 바큘로바이러스 벡터; 및 본 명세서에 기술된 바와 같은 AAV 반전 말단 반복부(ITR) 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드를 포함하는 게놈을 갖는 제2 바큘로바이러스 벡터로 동시-감염시키고;
(ii) 세포가 AAV를 생성하기에 충분한 조건 하에서 배양 배지 중에서 (i)에서의 바큘로바이러스 벡터로 감염된 곤충 세포를 배양하고; 그리고 선택적으로,
(iii) 배양 배지 및/또는 세포로부터 AAV를 회수하는 것을 포함하는 곤충 세포에서 AAV를 생성하는 방법을 제공한다.
다른 예에서, 본 개시내용은
(i) 곤충 세포를, 본 명세서에 기술된 바와 같은 변형된 VP1 서열을 갖는 AAV 바이러스성 캡시드 단백질을 암호화하는 본 개시내용의 핵산 분자를 포함하는 게놈을 갖는 제1 바큘로바이러스 벡터; Rep78 및 Rep68로부터 선택된 적어도 하나의 큰 AAV 복제(Rep) 단백질 및 Rep52 및 Rep40으로부터 선택된 적어도 하나의 작은 AAV Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함하는 게놈을 갖는 제2 바큘로바이러스 벡터; 및 AAV ITR 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드를 포함하는 게놈을 갖는 제3 바큘로바이러스 벡터로 동시 감염시키고;
(ii) 세포가 AAV를 생성시키기에 충분한 조건 하에서 배양 배지 중에서 (i)에서의 바큘로바이러스 벡터로 감염된 곤충 세포를 배양시키고; 선택적으로,
(iii) 배양 배지 또는 세포로부터 AAV를 회수하는 것을 포함하는 곤충 세포에서 AAV를 생성하는 방법을 제공한다.
상기 예들 각각에서, Rep 단백질은 바이러스성 캡시드 단백질과 동일한 AAV 혈청형으로부터의 것일 수 있다. 대안적으로, Rep 단백질은 바이러스성 캡시드 단백질과는 상이한 AAV 혈청형으로부터의 것일 수 있으며, 예를 들어, Rep 단백질은 AAV 혈청형 2로부터의 것일 수 있다.
유사하게, 상기 예들 각각에서, ITR 서열은 바이러스성 캡시드 단백질과 동일한 AAV 혈청형으로부터의 것일 수 있다. 대안적으로, ITR 서열은 바이러스성 캡시드 단백질과는 상이한 AAV 혈청형으로부터의 것일 수 있으며, 예를 들어, ITR 서열은 AAV 혈청형 2로부터의 것일 수 있다.
복수의 바큘로바이러스 벡터들 중 적어도 하나는 또한, AAV 캡시드 어셈블리를 위한 조립-활성화 단백질(AAP)을 암호화하는 폴리뉴클레오타이드를 포함할 것이다. 일례에서, 캡시드 단백질을 암호화하는 바큘로바이러스 벡터는 AAP를 암호화하는 폴리뉴클레오타이드를 포함한다. 대안적인 예에서, Rep 단백질을 암호화하는 바큘로바이러스 및/또는 관심대상 단백질 또는 RNA을 암호화하는 바큘로바이러스는 AAP를 암호화하는 폴리뉴클레오타이드를 포함한다.
방법이 본 명세서에 기술된 바큘로바이러스 벡터로 곤충 세포를 감염시키는 것을 포함하는 예에 따르면, 당해 분야에 공지된 임의의 통상적인 방법이 이용될 수 있다. 곤충 세포에서 AAV와 같은 바이러스의 생성을 위한 적합한 배양 배지 및 조건은 당해 분야에 공지되고 본 명세서에서 고려된다. 예를 들어, 곤충 세포에서 AAV 및 폴리펩타이드의 분자 공학처리 및 발현을 위한 방법은 예를 들어, 문헌[Summers and Smith, A Manual of Methods for Baculovirus Vectors and Insect Culture Procedures, Texas Agricultural Experimental Station Bull. No. 7555, College Station, Tex. (1986); Luckow., In Prokop et al., Cloning and Expression of Heterologous Genes in Insect Cells with Baculovirus Vectors' Recombinant DNA Technology and Applications, 97-152 (1991); King, L. A and R. D. Possee, The baculovirus expression system, Chapman and Hall, United Kingdom (1992); O'Reilly, D. R., L. K. Miller, V. A Luckow, Baculovirus Expression Vectors: A Laboratory Manual, New York (1992); W. H. Freeman and Richardson, C. D., Baculovirus Expression Protocols, Methods in Molecular Biology, volume 39 (1992); 미국 특허 제4,745,051호; US2003148506호; WO2003/074714호; Kotin RM (2011) Hum. Mol . Genet., 20(R1):R2-R6; Aucoin et al., (2006) Biotechnol . Bioeng . 95(6):1081-1092; 및 van Oers et al., (2015) J. Gen. Virol . 96:6-23]에 기술되어 있다.
적합한 큰 및 작은 Rep 단백질, ITR 서열, 및 관심대상 단백질 또는 RNA는 본 명세서에, 예를 들어, 본 개시내용의 바큘로바이러스 벡터의 맥락에 기술되어 있고, 달리 상세하게 기술하지 않는 한 AAV를 생성하는 방법을 기술하는 본 개시내용의 예에 필요한 부분만 약간 수정하여 적용하기 위해 취해져야 한다. 일례에서, 본 명세서에 기술된 방법은 본 개시내용의 복수의 바큘로바이러스 벡터로 곤충 세포를 동시-트랜스펙션시키는 것을 포함한다.
AAV를 생성하는 방법을 기술하는 상기 예들 각각에서, 바큘로바이러스 벡터 내에서의 Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 곤충 세포에서의 Rep 단백질의 발현을 위한 프로모터(및 선택적으로, 다른 조절 요소)에 작동 가능하게 연결될 수 있다. 마찬가지로, AAV ITR 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드 서열은 곤충 세포에서 발현을 위해 프로모터(및 선택적으로, 다른 조절 요소)에 작동 가능하게 연결될 수 있다. 곤충 세포에서 발현을 위한 적합한 프로모터는 당해 분야에 공지되어 있고, 본 명세서에 기술되어 있고, 달리 상세하게 기술하지 않는 한 AAV를 생성하는 방법을 기술하는 본 개시내용의 예에 필요한 부분만 약간 수정하여 적용하기 위해 취해져야 한다. 일례에서, 프로모터는 폴리헤드론 프로모터 또는 p10 프로모터이다.
일례에서, AAV를 생성하는 방법은 배양 배지 및/또는 세포로부터 AAV를 회수하는 단계를 포함한다. 다른 예에서, AAV를 생성하는 방법은 배양 배지 및/또는 세포로부터 AAV를 회수하는 단계, 및 이후에, AAV를 정제하는 단계를 포함한다. 일례에서, AAV는 세포로부터 회수된다. 일례에서, AAV는 배양 배지로부터 회수된다. 일례에서, AAV는 세포 및 배양 배지로부터 회수된다. 배양 배지 및/또는 세포로부터 AAV의 회수 및 정제하는 적합한 방법은 당해 분야에 공지되어 있고 본 명세서에서 사용하기 위해 고려된다. 예를 들어, 방법은 요오딕산올-기반 밀도 구배 정제 이후 세슘 클로라이드(CsCl) 구배 원심분리를 포함할 수 있다. 예를 들어, 방법은 항-AAV 항체, 바람직하게는, 고정화 항체를 사용한 AAV의 친화력-정제를 포함할 수 있다. 항-AAV 항체는 모노클로날 항체일 수 있다. 특히 적합한 항체는 예를 들어, 카멜(camel) 또는 라마(llama)로부터 얻어질 수 있는 것과 같은 단쇄 카멜리드 항체(camelid antibody) 또는 이의 분절이다[예를 들어, 문헌[Muyldermans et al., (2001) Biotechnol. 74: 277-302] 참조]. AAV의 친화력-정제를 위한 항체는 바람직하게는, AAV 캡시드 단백질 상의 에피토프를, 예를 들어, (상이한 혈청형으로부터 AAV를 정제하기 위해) 하나 초과의 AAV 혈청형의 캡시드 단백질 상에 존재하는 에피토프에 특이적으로 결합하는 항체이다.
재조합 AAV의 작제화 및 정제는 종래에 기술되어 있다[예를 들어, 미국 특허 제5,173,414호, 제5,139,941호, 제5,863,541호, 및 제5,869,305호, 제6,057,152호, 제6,376,237호; 문헌[Rabinowitz et al., (2002) J. Virol . 76:791-801; 및 Bowles et al., (2003) J. Virol . 77:423-432] 참조]. 기술된 바와 같은 이러한 방법은 본 명세서에서 사용하기 위해 고려된다.
본 개시내용은 또한, 본 명세서에 기술된 방법에 의해 생성된 변형된 VP1 서열을 갖는 바이러스성 캡시드 단백질을 포함하는 AAV를 제공한다.
본 개시내용은 또한, 바이러스성 캡시드 단백질이 1번 위치에 세린, 26번 위치에 글루탐산, 40번 위치에 아르기닌, 43번 위치에 아스파르트산, 44번 위치에 세린 및/또는 64번 위치에 라이신 중 하나 이상을 포함하도록, 1, 26, 40, 43, 44 및 64번 위치에서의 하나 이상의 아미노산을 치환함으로써, 상응하는 야생형 서열에 대해 AAV 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함하는, 곤충 세포에서 생성된 혈청형 2와는 다른 혈청형으로부터 AAV의 기능성을 개선시키는 방법으로서, 여기서, 잔기 위치는 서열번호 1에 기술된 서열에 대해 결정되며, 1, 26, 40, 43, 44 및/또는 64번 위치에서의 아미노산과는 다른 추가적인 아미노산은 상응하는 야생형 서열에 대해 변형되지 않으며, AAV는 곤충 세포에서 생성될 때 변형되지 않은 상응하는 야생형 AAV에 대해 곤충 세포에서 생성될 때 개선된 기능성을 갖는 방법을 제공한다. AAV의 개선된 기능성은 세포 내재화 후에 엔도솜 구획을 이탈하는 AAV의 능력으로 기인한 것일 것이다. 변형된 VP1 서열을 포함하는 AAV 바이러스성 캡시드 단백질은 본 명세서에 기술되어 있으며, 이의 임의의 예는 달리 상세하게 기술하지 않는 한 본 명세서에 기술된 바와 같은 AAV의 기능성을 개선시키는 방법에 필요한 부분만 약간 수정하여 적용하기 위해 취해져야 한다.
일례에서, AAV의 기능성을 개선시키는 방법은, 바이러스성 캡시드 단백질이 1번 위치에 세린, 26번 위치에 글루탐산, 40번 위치에 아르기닌, 43번 위치에 아스파르트산, 44번 위치에 세린 및/또는 64번 위치에 라이신 중 둘 이상을 포함하도록, 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 VP1 서열의 1, 26, 40, 43, 44 및 64번 위치에서의 아미노산 중 임의의 둘 이상을 변경시키는 것을 포함하며, 여기서, 잔기 위치는 서열번호 1에 기술된 서열에 대해 결정된다. 일례에서, AAV의 기능성을 개선시키는 방법은, 바이러스성 캡시드 단백질이 1번 위치에 세린, 26번 위치에 글루탐산, 40번 위치에 아르기닌, 43번 위치에 아스파르트산, 44번 위치에 세린 및/또는 64번 위치에 라이신 중 3개 이상을 포함하도록, 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 VP1 서열의 1, 26, 40, 43, 44 및 64번 위치에서의 아미노산 중 임의의 3개 이상을 변경시키는 것을 포함하며, 여기서, 잔기 위치는 서열번호 1에 기술된 서열에 대해 결정된다. 일례에서, AAV의 기능성을 개선시키는 방법은, 바이러스성 캡시드 단백질이 1번 위치에 세린, 26번 위치에 글루탐산, 40번 위치에 아르기닌, 43번 위치에 아스파르트산, 44번 위치에 세린 및/또는 64번 위치에 라이신 중 4개 이상을 포함하도록, 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 VP1 서열의 1, 26, 40, 43, 44 및 64번 위치에서의 아미노산 중 임의의 4개 이상을 변경시키는 것을 포함하며, 여기서, 잔기 위치는 서열번호 1에 기술된 서열에 대해 결정된다. 일례에서, AAV의 기능성을 개선시키는 방법은, 바이러스성 캡시드 단백질이 1번 위치에 세린, 26번 위치에 글루탐산, 40번 위치에 아르기닌, 43번 위치에 아스파르트산, 44번 위치에 세린 및/또는 64번 위치에 라이신 중 5개 이상을 포함하도록, 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 VP1 서열의 1, 26, 40, 43, 44 및 64번 위치에서의 아미노산 중 임의의 5개 이상을 변경시키는 것을 포함하며, 여기서, 잔기 위치는 서열번호 1에 기술된 서열에 대해 결정된다. 일례에서, AAV의 기능성을 개선시키는 방법은, 바이러스성 캡시드 단백질이 1번 위치에 세린, 26번 위치에 글루탐산, 40번 위치에 아르기닌, 43번 위치에 아스파르트산, 44번 위치에 세린 및/또는 64번 위치에 라이신을 포함하도록, 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 VP1 서열의 1, 26, 40, 43, 44 및 64번 위치에서의 아미노산 각각을 변경시키는 것을 포함하며, 여기서, 잔기 위치는 서열번호 1에 기술된 서열에 대해 결정된다.
본 개시내용의 방법은 서열번호 15 내지 26 중 어느 하나에 기술된 서열을 포함하는 VP1 서열을 갖는 바이러스성 캡시드 단백질을 갖는 AAV를 제공할 수 있다. AAV는 일반적으로 인간을 감염시키는 임의의 혈청형(예를 들어, 혈청형 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13)으로부터의 것일 수 있다.
일례에서, 방법은
(i) AAV가 혈청형 1의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 15에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(ii) AAV가 혈청형 3의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 16에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(iii) AAV가 혈청형 4의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 17에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(iv) AAV가 혈청형 5의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 18에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(v) AAV가 혈청형 6의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 19에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(vi) AAV가 혈청형 7의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 20에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(vii) AAV가 혈청형 8의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 21에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(viii) AAV가 혈청형 9의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 22에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(ix) AAV가 혈청형 10의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 23에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(x) AAV가 혈청형 11의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 24에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(xi) AAV가 혈청형 12의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 25에 기술된 서열을 포함하는 VP1 서열을 포함하고; 그리고
(xii) AAV가 혈청형 13의 AAV일 때, 바이러스성 캡시드 단백질이 서열번호 26에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다.
일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 15에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV1의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다. 일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 16에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV3의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다. 일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 17에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV4의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다. 일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 18에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV5의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다. 일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 19에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV6의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다. 일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 20에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV7의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다. 일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 21에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV8의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다. 일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 22에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV9의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다. 일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 23에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV10의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다. 일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 24에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV11의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다. 일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 25에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV12의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다. 일례에서, 방법은 바이러스성 캡시드 단백질이 서열번호 26에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 AAV13의 바이러스성 캡시드 단백질의 VP1 서열을 변형시키는 것을 포함한다.
본 명세서에 기술된 바와 같은 AAV의 기능성을 개선시키는 방법은 상응하는 야생형 AAV에 대해 변형된 AAV의 기능성을 분석하는 단계를 추가로 포함할 수 있다. 즉, 방법은 포유류 세포를, 본 명세서에 기술된 바와 같은 및/또는 본 명세서에 기술된 방법에 의해 생성된 변형된 또는 야생형 AAV로 감염시키고 기능성의 수준을 결정하는 것을 추가로 포함할 수 있다. 예를 들어, AAV의 기능성은 AAV로의 감염 후에 포유류 세포에서 관심대상 단백질 또는 RNA의 발현 수준을 결정함으로써 결정될 수 있다. 비리온의 기능성을 결정하기 위한 기능적 검정은 당해 분야에 공지되어 있고, 문헌[Girod et al., (2002) J. Gen. Virol ., 83:973-978; Lock et al., (2010) Hum. Gene Ther . 21(10):1273-1285]에 기술된 바와 같이, 본 명세서에서 사용하기 위해 고려된다. 바이러스 감염성 및/또는 기능성을 검정하기 위한 적합한 검정은 (1) A20 효소-연결된 면역흡착 검정에 의한 캡시드 역가; (2) 정량적 폴리머라제 연쇄 반응(qPCR)에 의한 벡터 게놈 역가; 및 (3) qPCR 판독값을 갖는 중간 조직 배양 감염 용량(TCID50)에 의한 감염성 역가; 및 (4) 리포터 유전자, 예를 들어, 녹색 형광 단백질[GFP]로의 형질도입을 검정함을 포함하지만, 이로 제한되지 않는다.
본 명세서에 기술된 바와 같은 AAV의 기능성을 개선시키는 방법은 본 명세서에 기술된 바와 같이 변형된 AAV VP1 서열을 암호화하는 핵산 또는 본 명세서에 기술된 바와 같은 이를 포함하는 바큘로바이러스 벡터를 제공하는 것을 포함할 수 있다. 대안적으로, 또는 추가적으로, 본 명세서에 기술된 바와 같은 AAV의 기능성을 개선시키는 방법은 본 명세서에 기술된 바와 같은 변형된 VP1 서열을 갖는 캡시드 단백질을 포함하는 AAV를 생성하는 것을 포함할 수 있다.
변형된 VP1을 갖는
AAV
본 개시내용은 또한, 변형된 VP1 서열을 갖는 바이러스성 캡시드 단백질을 포함하는 AAV를 제공하며, 상기 변형된 VP1 서열은 1번 위치에 세린, 26번 위치에 글루탐산, 40번 위치에 아르기닌, 43번 위치에 아스파르트산, 44번 위치에 세린 및 64번 위치에 라이신을 포함하며, 아미노산 위치는 서열번호 1에 기술된 서열에 대해 규정되며, 1, 26, 40, 43, 44 및 64번 위치 중 임의의 하나 이상에서의 아미노산은 상응하는 야생형 서열에 대해 변형되며, 상기 임의의 하나 이상의 1, 26, 40, 43, 44 및 64번 위치에서와는 다른 추가적인 아미노산은 상응하는 야생형 서열에 대해 변형되지 않는다.
일례에서, 본 명세서에 기술된 AAV는 서열번호 1에 기술된 서열의 1, 26, 40, 43, 44 및 64번 위치 중 임의의 2, 3, 4, 5, 또는 6개에서의 아미노산이 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 변형된, 변형된 VP1 서열을 갖는 바이러스성 캡시드 단백질을 포함한다.
일례에서, 본 명세서에 기술된 AAV는 서열번호 1에 기술된 서열의 1, 26, 40, 43, 44 및 64번 위치 중 임의의 2개 이상에서의 아미노산이 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 변형된, 변형된 VP1 서열을 갖는 바이러스성 캡시드 단백질을 포함한다.
일례에서, 본 명세서에 기술된 AAV는 서열번호 1에 기술된 서열의 1, 26, 40, 43, 44 및 64번 위치 중 임의의 3개 이상에서의 아미노산이 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 변형된, 변형된 VP1 서열을 갖는 바이러스성 캡시드 단백질을 포함한다.
일례에서, 본 명세서에 기술된 AAV는 서열번호 1에 기술된 서열의 1, 26, 40, 43, 44 및 64번 위치 중 임의의 4개 이상에서의 아미노산이 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 변형된, 변형된 VP1 서열을 갖는 바이러스성 캡시드 단백질을 포함한다.
일례에서, 본 명세서에 기술된 AAV는 서열번호 1에 기술된 서열의 1, 26, 40, 43, 44 및 64번 위치 중 임의의 5개 이상에서의 아미노산이 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 변형된, 변형된 VP1 서열을 갖는 바이러스성 캡시드 단백질을 포함한다.
일례에서, 본 명세서에 기술된 AAV는 서열번호 1에 기술된 서열의 1, 26, 40, 43, 44 및 64번 위치 각각에서의 아미노산이 본 명세서에 기술된 바와 같은 상응하는 야생형 서열에 대해 변형된, 변형된 VP1 서열을 갖는 바이러스성 캡시드 단백질을 포함한다.
변형된 VP1 서열을 포함하는 바이러스성 캡시드 단백질은 본 명세서에 기술되어 있으며, 이의 임의의 실시예는 달리 상세하게 기술하지 않는 한 상기 변형된 VP1 서열을 포함하는 본 개시내용의 AAV에 필요한 부분만 약간 수정하여 적용하기 위해 취해져야 한다.
본 명세서에 기술된 AAV는 혈청형 2와는 다른, 일반적으로 인간을 감염시키는 AAV(예를 들어, 혈청형 1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13) 중 임의의 하나일 수 있다. 일례에서, AAV는 혈청형 1의 AAV이다. 일례에서, AAV는 혈청형 3의 AAV이다. 일례에서, AAV는 혈청형 4의 AAV이다. 일례에서, AAV는 혈청형 5의 AAV이다. 일례에서, AAV는 혈청형 6의 AAV이다. 일례에서, AAV는 혈청형 7의 AAV이다. 일례에서, AAV는 혈청형 8의 AAV이다. 일례에서, AAV는 혈청형 9의 AAV이다. 일례에서, AAV는 혈청형 10의 AAV이다. 일례에서, AAV는 혈청형 11의 AAV이다. 일례에서, AAV는 혈청형 12의 AAV이다. 일례에서, AAV는 혈청형 13의 AAV이다.
본 명세서에 기술된 AAV는 서열번호 15 내지 26 중 어느 하나에 기술된 서열을 포함하는 변형된 VP1을 갖는 캡시드 단백질을 포함할 수 있다. 일례에서, AAV는 혈청형 1의 AAV이며, 변형된 VP1 서열은 서열번호 15에 기술된 서열을 포함한다. 일례에서, AAV는 혈청형 3의 AAV이며, 변형된 VP1 서열은 서열번호 16에 기술된 서열을 포함한다. 일례에서, AAV는 혈청형 4의 AAV이며, 변형된 VP1 서열은 서열번호 17에 기술된 서열을 포함한다. 일례에서, AAV는 혈청형 5의 AAV이며, 변형된 VP1 서열은 서열번호 18에 기술된 서열을 포함한다. 일례에서, AAV는 혈청형 6의 AAV이며, 변형된 VP1 서열은 서열번호 19에 기술된 서열을 포함한다. 일례에서, AAV는 혈청형 7의 AAV이며, 변형된 VP1 서열은 서열번호 20에 기술된 서열을 포함한다. 일례에서, AAV는 혈청형 8의 AAV이며, 변형된 VP1 서열은 서열번호 21에 기술된 서열을 포함한다. 일례에서, AAV는 혈청형 9의 AAV이며, 변형된 VP1 서열은 서열번호 22에 기술된 서열을 포함한다. 일례에서, AAV는 혈청형 10의 AAV이며, 변형된 VP1 서열은 서열번호 23에 기술된 서열을 포함한다. 일례에서, AAV는 혈청형 11의 AAV이며, 변형된 VP1 서열은 서열번호 24에 기술된 서열을 포함한다. 일례에서, AAV는 혈청형 12의 AAV이며, 변형된 VP1 서열은 서열번호 25에 기술된 서열을 포함한다. 일례에서, AAV는 혈청형 13의 AAV이며, 변형된 VP1 서열은 서열번호 26에 기술된 서열을 포함한다.
상기 예들 각각에서, 본 명세서에 기술된 AAV는 변형된 VP1과 동일한 AAV 혈청형으로부터의 소단위 2(VP2) 및 소단위 3(VP3) 서열을 포함하는 바이러스성 캡시드 단백질을 포함한다. 바람직하게는, VP1, VP1 및 VP3은 동일한 ORF로부터 발현된다.
본 명세서에 기술된 바와 같이, AAV 게놈은 바이러스 게놈의 복제에서 기능하는 바이러스에 의해 암호화된 단백질인 복제(Rep) 유전자를 포함한다. 이에 따라, 일례에서, 본 명세서에 기술된 AAV는 Rep78 및 Rep68로부터 선택된 적어도 하나의 큰 AAV Rep 단백질, 및 Rep52 및 Rep40으로부터 선택된 적어도 하나의 작은 AAV Rep 단백질을 포함한다. 일례에서, 본 명세서에 기술된 AAV는 Rep78 및 Rep52를 포함한다. 일례에서, 본 명세서에 기술된 AAV는 Rep78 및 Rep40을 포함한다. 일례에서, 본 명세서에 기술된 AAV는 Rep68 및 Rep52를 포함한다. 일례에서, 본 명세서에 기술된 AAV는 Rep68 및 Rep40을 포함한다. 일례에서, 일례에서, 본 명세서에 기술된 AAV는 Rep78, Rep68, Rep52 및 Rep40을 포함한다. 상기 예들 각각에서, 개개 작은 및 큰 Rep 단백질은 바이러스성 캡시드 단백질과 동일한 AAV 혈청형으로부터의 것일 수 있다. 대안적으로, 개개 작은 및 큰 Rep 단백질은 바이러스성 캡시드 단백질과는 다른 AAV 혈청형으로부터 것일 수 있으며, 예를 들어, Rep 단백질은 AAV2로부터의 것일 수 있다.
본 개시내용의 AAV는 또한, AAV 반전 말단 반복부(ITR) 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드를 포함할 수 있다.
일례에서, AAV ITR 서열은 바이러스성 캡시드 단백질과 동일한 혈청형으로부터 유래된다. 다른 예에서, AAV ITR 서열은 바이러스성 캡시드 단백질과는 다른 혈청형으로부터 유래된다. 특정 일례에서, ITR 서열은 AAV 혈청형 2로부터 유래된다.
전술한 바와 같이, 측면 ITR을 포함하는 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드는 통상적으로, 길이에 있어서, 5.000개 이하의 뉴클레오타이드(nt)이다. 그러나, 너무 큰 DNA, 즉 길이가 5,000 초과의 nt를 암호화하는 폴리뉴클레오타이드가 또한, 고려된다. 너무 큰 DNA는 본 명세서에서 5 kbp의 최대 AAV 패키징 한계를 초과하는 DNA로서 이해된다. 이에 따라, 본 개시내용의 AAV는 단백질을 발현시킬 수 있거나, 5.0 kb 보다 더 큰 게놈에 의해 대개 암호화된 RNA가 또한 실현 가능할 수 있다.
본 개시내용의 AAV는 바람직하게는, 이의 게놈에 도입되는, 포유류 세포에서의 발현을 위해 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드를 포함할 것이다. 임의의 뉴클레오타이드 서열은 작제물이 AAV 비리온의 패키징 용량 내에 잔류하는 한, 본 개시에 따라 생성된 AAV로 트랜스펙션된 포유류 세포에서의 후속 발현을 위해 도입될 수 있다. 관심대상 단백질 또는 RNA를 암호화하는 적합한 폴리뉴클레오타이드는 본 명세서에 이미 기술되어 있고, 달리 상세하게 기술하지 않는 한, 본 개시내용의 AAV에 필요한 부분만 약간 수정하여 적용하기 위해 취해질 것이다. 일례에서, AAV 게놈은 본 명세서에 기술된 바와 같은 관심대상 치료 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, AAV 게놈은 본 명세서에 기술된 바와 같은 RNAi 작용제를 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, AAV 게놈은 예를 들어, 본 명세서에 기술된 바와 같이, 세포 형질전환 및 발현을 평가하기 위해, 마커 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함한다. 일례에서, AAV 게놈은 복수의 폴리뉴클레오타이드 서열을 포함하며, 상기 복수의 폴리뉴클레오타이드 서열은 기술된 바와 같이, 관심대상 단백질, RNAi 작용제, 및/또는 마커 단백질 중 둘 이상을 암호화한다.
변형된 VP1 서열을 포함하는 본 명세서에 기술된 AAV는 상응하는 야생형 VP1 서열을 포함하는 AAV에 비해 곤충 세포에서 생성될 때 개선된 기능성을 가질 것이다.
일례에서, 변형된 VP1 서열을 갖는 캡시드 단백질을 포함하는 AAV는 본 개시내용의 방법을 이용하여 형성된다.
키트
본 개시내용은 또한, 키트 형태의 본 개시내용의 핵산 분자, 바큘로바이러스 벡터, 복수의 바큘로바이러스 벡터 및/또는 곤충 세포를 제공한다. 키트는 본 개시내용의 핵산 분자를 포함하는 용기를 포함할 수 있다. 일례에서, 핵산은 바큘로바이러스 벡터 내에 포함된다. 일례에서, 키트는 본 개시내용의 핵산 분자를 포함한 제1 용기, 및 AAV를 생성하기 위한 하나 이상의 추가 시약을 포함하는 제2 용기를 포함한다. 일례에서, 핵산은 바큘로바이러스 벡터 내에 포함된다. 일례에서, 키트는 본 개시내용의 복수의 바큘로바이러스 벡터를 포함하며, 각각은 별도의 용기 내에 포함된다. 키트는 선택적으로, 예를 들어, 본 개시에 따른 AAV의 생성을 위해 적합한 곤충 세포를 추가로 포함할 수 있다. 키트는 또한, 본 명세서에 기술된 방법을 이용한 AAV의 생성을 위한 본 개시내용의 핵산 분자, 바큘로바이러스 벡터, 복수의 바큘로바이러스 벡터 및/또는 곤충 세포의 사용 설명서를 추가로 포함할 수 있다.
실험 실시예
실시예 1 - 변형된 AAV VP1 서열의 설계, 생성 및 시험
이러한 실시예에서, 본 발명자는 곤충 세포에서 생성될 때 AAV의 포스포리파제 활성 및 바이러스 기능성을 복원하기 위해 특정 서열 변형, 즉, 아미노산 치환이 포스포리파제 A2(PLA2) 도메인 및 측면 서열에 도입된 바이러스성 캡시드 단백질 소단위 1(VP1)을 갖는 AAV를 설계하고 제조하였다. 또한, 다양한 예시적인 AAV 혈청형에 대한 PLA2 도메인 및 측면 서열을 포함하는 VP1 하위서열 및 이에 대해 수행된 다수의 서열 정렬을 기초로 하여, 포스포리파제 활성을 복원하기 위해 설계된 서열 변형을 포함하는, PLA2 도메인 측면 서열을 포함하는 공통 VP1 하위서열을 제조하였다. 이러한 공통 VP1 하위서열은 서열번호 1에 기술되어 있다.
1.1 변형된
AAV8
VP1 및
AAV9
VP1 서열의 설계
AAV8(서열번호 34) 및 AAV2(서열번호 28)의 바이러스성 캡시드 단백질 1(VP1) 단백질로부터의 N-말단 180개 아미노산에 대한 그리고 AAV9(서열번호 35) 및 AAV2(서열번호 26)의 VP1 단백질로부터의 N-말단 180개 아미노산에 대해 BLASTp 정렬툴을 이용해서 쌍별 서열 정렬을 수행하였다. 이러한 정렬을 기초로 하여, AAV8 및 AAV9로부터의 PLA2 도메인 및 측면 서열은 AAV2에서 상응하는 서열에 고도로 보존된 것으로 나타났다.
이러한 서열 정렬을 기초로 하여, 서열번호 34에 기술된 서열의 42, 67, 81, 84, 85 및 105번 위치에서의 아미노산을, 서열번호 28에 기술된 AAV2 VP1 서열에서의 상응하는 위치에서 일어나는 아미노산, 즉, 서열번호 34의 서열 내의 G42S, A67E, Q81R, Q84D, A85S 및 Q105K로 치환함으로써 변형된 AAV8 VP1 서열을 실리코에서 설계하였다. 변형된 AAV8 VP1 서열에서 치환된 잔기 위치들 중 2개는 PLA2 도메인의 측면에 위치된 영역에 존재하며(그러나, PLA2 도메인의 폴딩(folding) 및/또는 활성에 연관되는 것으로 여겨지며), 변형된 잔기 위치들 중 4개는 PLA2 도메인 자체 내에 잔류하였다.
유사하게, 서열번호 35에 기술된 서열의 42, 67, 81, 84 및 85번 위치에서의 아미노산을 서열번호 28에 기술된 AAV2 VP1 서열에서의 상응하는 위치에서 일어나는 아미노산, 즉, 서열번호 35의 서열 내의 A42S, A67E, Q81R, K84D 및 A85S로 치환시킴으로써 변형된 AAV9 VP1 서열을 실리코에서 설계하였다. 변형된 AAV9 VP1 서열에서 치환된 위치들 중 하나는 PLA2 도메인의 측면에 위치된 영역에 존재하며(그러나, PLA2 도메인의 폴딩 및/또는 활성에서 연관될 것으로 여겨짐), 변형된 잔기 위치들 중 4개는 PLA2 도메인 자체 내에 잔류한다.
1.2 변형된
잔기를
포함하는 공통
AAV
VP1 하위서열의 설계
AAV2, AAV8 및 AAV9에 대한 완전한 VP1 서열에 대해 수행된 서열 정렬을 기초로 하여, 다중 서열 정렬을 AAV 혈청형 1 내지 13(서열번호 15 내지 26)에 대한 측면 서열 및 PLA2 도메인을 포함하는 VP1 하위서열에 대해 수행하였다. 상기 쌍별 정렬로부터 확인된 그러한 차이에 추가하여, 다수의 추가 동일하지 않은 잔기를 하위서열 내에서 확인하였다. 그러나, 상응하는 AAV2 서열에 대한 동일성에 대해 이러한 위치를 돌연변시키지 않는 것으로 결정되었는데, 왜냐하면, 이러한 차이가 보존적 차이인 것으로 간주되고/되거나, 잔기 위치가 PLA2 도메인 외측에 존재하고, 포스포리파제 활성에 영향을 미치지 않는 것으로 간주되었기 때문이다. 다중 서열 정렬을 기초로 하여, 전술한 아미노산 치환과 함께 PLA2 도메인 및 측면 서열을 포함하는 공통 VP1 하위서열을 실리코 내에서 제조하였다(서열번호 1).
1.3 구조적 및 비-구조적 AAV8 단백질을 발현시키는 바큘로바이러스 벡터의 생성
소단위 VP1, VP2 및 VP3을 포함하는 변형된 AAV8 캡시드 단백질 및 AAV8 비-구조적 단백질 Rep78 및 Rep52를 암호화하는 바큘로바이러스 벡터를 제조하였다(BacAAV8-Rep-VPmod, 도 1).
간단하게, 서열번호 21에 기술된 서열을 포함하고 측면 NotI 및 ApaI 제한 부위를 갖는 변형된 VP1 소단위를 갖는 AAV8 캡시드 단백질(VP1, VP2 및 VP3)을 암호화하는 DNA 작제물을 GenScript(AAV8-VPmod, 도 2)에서 합성하였다. 비-구조적 단백질 Rep78, Rep68, Rep52 및 Rep40뿐만 아니라 캡시드 단백질 VP1, VP2 및 VP3 및 조립-활성화 단백질(AAP)을 암호화하는 wtAAV8-Rep/Cap 플라스미드(Virovek, Hayward, CA)를 골격으로서 사용하여 AAV8-VPmod DNA 작제물을 수용하였다. AAV8-VPmod DNA 작제물 및 wtAAV8-Rep/Cap 플라스미드 둘 모두를 NotI 및 ApaI로 소화시키고, 그 후에, AAV8-VPmod DNA 작제물을 이후에 AAV8-Rep-VPmod(도 4)를 수득하기 위해 서열을 암호화하는 wt 캡시드 단백질 대신에 wtAAV8-Rep/Cap 플라스미드 골격(도 3) 내에 결찰하였다.
이후에, AAV8-Rep-VPmod 중간체를 pOET1 바큘로바이러스 전사 벡터(Oxford Expression Technologies) 내에 클로닝하였다. 이를 용이하게 하기 위해, AAV8-Rep-VPmod-EcoRV 중간체를 수득하기 위하여 Quickchange 기술을 이용하여 EcoRV 부위를 AAV8-Rep-VPmod 중간체 내에 삽입하였다. 이후에, AAV8-Rep-VPmod-EcoRV 중간체 및 pOET1을 NotI 및 EcoRV로 소화시키고, 이후에, 삽입물을 pOET1 골격(Oxford Expression Technologies) 내에 결찰하여 최종 AAV8-Rep-VPmod 클론(BacAAV8-Rep-VPmod, 도 1)을 생성하였다.
1.4 구조적 및 비-구조적 AAV9 단백질을 발현시키는 바큘로바이러스 벡터의 생성
소단위 VP1, VP2 및 VP3을 포함하는 AAV9 캡시드 단백질 및 AAV9 비-구조적 단백질 Rep78, Rep68, Rep52 및 Rep40을 암호화하는 바큘로바이러스 벡터를 제조하였다(BacAAV9-Rep-VPmod, 도 5).
간단하게, 서열번호 22에 기술된 서열에 의해 암호화되고 측면 NotI 및 ApaI 제한 부위를 갖는 변형된 AAV9 VP1 소단위를 갖는 AAV9 캡시드 단백질을 암호화하는 DNA 작제물을 GenScript(AAV9-VPmod, 도 6)에서 합성하였다. 비-구조적 단백질 Rep78, Rep68, Rep52 및 Rep40뿐만 아니라 캡시드 단백질 VP1, VP2 및 VP3 및 조립-활성화 단백질(AAP)을 암호화하는 wtAAV9-Rep 플라스미드(Virovek, Hayward, CA)를 골격으로서 사용하여 AAV9-VPmod DNA 작제물을 수용하였다. AAV9-VPmod DNA 작제물 및 wtAAV9-Rep 플라스미드 둘 모두를 NotI 및 ApaI로 소화시키고, 그 후에, AAV9-Rep-VPmod(도 7)를 수득하기 위해, AAV9-VPmod DNA 작제물을 이후에, 서열을 암호화하는 wt 캡시드 단백질 대신에 wtAAV9-Rep 플라스미드 골격(도 3) 내에 결찰하였다.
이후에, AAV9-Rep-VPmod 중간체를 pOET1 바큘로바이러스 전사 벡터(Oxford Expression Technologies) 내에 클로닝하였다. 이를 용이하게 하기 위하여, EcoRV 부위를 Quickchange 기술을 이용하여 AAV9-Rep-VPmod 중간체 내에 삽입하여 AAV9-Rep-VPmod-EcoRV 중간체를 수득하였다. 이후에, AAV9-Rep-VPmod-EcoRV 중간체 및 pOET1(Oxford Expression Technologies)을 NotI 및 EcoRV로 소화시키고, 이후에, 삽입물(insert)을 pOET1 골격 내에 결찰시켜 최종 AAV9-Rep-VPmod 클론(BacAAV9-Rep-CapPL, 도 5)을 생성하였다.
1.5 관심대상 유전자(GOI)를 발현시키는 바큘로바이러스 벡터의 생성
AAV2 반전 말단 반복부(ITR)의 측면에 위치된 관심대상 유전자(GOI)를 암호화하는 바큘로바이러스 벡터를 제조하였다. 간단하게, 한 경우에, AAV2-GOI 작제물(도 8) 및 pOET1(Oxford Expression Technologies)를 NotI로 소화시키고 AAV2-GOI 작제물을 pOET1 골격 내에 결찰시켜 최종 클론(BacAAV2-GOI, 도 9)을 생성시킴으로써, AAV2 ITR의 측면에 위치된 인간 PABPN1의 전사체를 표적으로 하는 2개의 shmiR을 암호화하는 DNA 작제물을 pOET1 바큘로바이러스 전사 벡터(Oxford Expression Technologies) 내에 클로닝하였다. 제2 GOI를 또한, HBV 폴리머라제 유전자 전사체의 다양한 영역을 표적으로 하는 3개의 shmiR에 대해 암호화하는 것을 제외하고, 전술한 방식과 동일한 방식으로 제조하였다.
1.6 P0
바큘로바이러스
모액의
생성
바큘로바이러스 P0 모액을 Oxford Expression Technologies baculoCOMPLETE 시스템(제조업체 설명서에 따름)을 이용하여 생성하였다. 간단하게, 1백만 개의 Sf9 세포를 트랜스펙션 1시간 전에 6 웰 플레이트에 시딩하고, 플레이트에 접착시켰다. 1㎖의 TC100 배지에서, 500 ng의 Bac-AAV2-GOI 플라스미드, BacAAV8-Rep-CapPL 또는 BacAAV9-Rep-CapPL을 500 ng 플래시 BAC DNA 및 baculoFECTIN 트랜스펙션 시약과 혼합하였다(제조업체 프로토콜에 따름). 실온에서 30분 인큐베이션 후에, 트랜스펙션 혼합물을 시딩된 Sf9 세포에 첨가하였다. 6 웰 플레이트를 28℃에서 인큐베이션하였다. 트랜스펙션 후 24시간에, 1㎖의 Sf9 배지를 세포에 첨가하였다. 트랜스펙션 후 5일째에, P0 바큘로바이러스 모액을 함유한 배지를 4℃에서 수집하고 저장하였다. 이에 따라, P0 바큘로바이러스를 BacAAV8-Rep-CapPL, BacAAV9-Rep-CapPL 및 Bac-AAV2-GOI에 대해 생성하였다.
1.7 P1
바큘로바이러스
모액의
생성
500 ㎕의 P0 바큘로바이러스 모액을 사용하여 100㎖의 Sf9 세포 배양물을 2x10e6 세포/㎖의 농도로 감염시켰다. 바큘로바이러스 배양물을 5일 동안 140 rpm에서 흔들어주면서 28℃에서 인큐베이션하였다. 감염 후 5일째에, P1을 함유한 배지를 수확하고 4℃에서 저장하였다.
1.8 P2
바큘로바이러스
모액의
생성
500 ㎕의 P1 바큘로바이러스 모액을 사용하여 100㎖의 Sf9 세포 배양물을 2x10e6 세포/㎖의 농도로 감염시켰다. 바큘로바이러스 배양물을 5일 동안 140 rpm에서 흔들어주면서 28℃에서 인큐베이션하였다. 감염 후 5일째에, P2를 함유한 배지를 수확하고 4℃에서 저장하였다.
1.9 P2
바큘로바이러스
모액의 적정
바큘로바이러스 P2 모액의 역가를 Oxford Expression Technologies baculoQUANT 키트를 이용하여 결정하였다. 바큘로바이러스 모액을 제조업체 설명서에 따라 제공된 용해 완충제로 연속 희석시키고 용해하였다. DNA를 바큘로바이러스 엔벨로프 융합 단백질, gp64에 대해 qPCR을 이용하여 증폭시켰다. P2 모액을 표준 곡선을 이용하여 정량화하고, 바이러스 pfu/㎖를 결정하기 위해 외삽하였다.
1.10 AAV를 생성하기 위한 동시-감염
2x10e6 세포/㎖의 세포 밀도에서의 600㎖의 Sf9 세포를 0.1의 MOI에서 BacAAV8-Rep-CapPL 및 BacAAV2-GOI(HBV 폴리머라제 유전자 전사체를 표적으로 하는 3개의 shmiR을 암호화함), 또는 0.1의 MOI에서 BacAAV9-Rep-CapPL 및 BacAAV2-GOI(인간 PABPN1을 표적으로 하는 2개의 shmiR을 암호화함)로 동시-감염시켰다. 이후에, 세포 배양물을 6일 동안 115 rpm으로 흔들어주면서 28℃에서 인큐베이션하였다.
1.11 AAV의 정제
감염시키고 6일 후에, 감염된 배양물로부터 정화된 배지를 수집하였다. 바큘로바이러스를 0.2 마이크론 필터링을 이용하고 이후에, 0.1 마이크론 필러링을 이용하여 AAV로부터 여과하였다. 이후에, AAV를 침전시키기 위해 PEG를 바큘로바이러스 부재 배지에 첨가하였다. PEG를 첨가하고 24시간 후에, AAV를 펠릿화하기 위해 배지를 45분 동안 2500 g으로 회전시켰다. 상청액을 폐기하고, 펠릿화된 바이러스를 용해 완충제에 현탁하였다. AAV의 초기 정제를 요오딕사놀 구배에 의해 수행하였으며, 이로부터 40 내지 60% 분획의 5㎖ 층을 수집하였다. 잔류 요오딕사놀을 제거하기 위해 이러한 바이러스 함유 층을 완충제 교환하였고, 완충제 교환된 바이러스를 세슘 구배 상에 적층하였다. 이후에, 밤새 원심분리를 세슘 구배에서 수행하였다. 세슘 구배로부터의 AAV 함유 밴드를 시린지로 수집하고, 정제된 AAV 바이러스 모액으로부터 세슘 클로라이드를 제조하기 위해 완충제를 교환하였다.
1.12 AAV 적정
모든 AAV 제조물에 대한 최종 AAV 역가를 qPCR에 의해 정량화하였다. 간단하게, 10 마이크로리터의 정제된 AAV 바이러스를 실온에서 15분 동안 DNAse 처리하였다(DNAseI, 증폭 등급, 1U/㎕, Invitrogen). 이후에 DNAse 효소를 65℃에서 10분 동안 인큐베이션에 의해 비활성화시켰다. 바이러스를 하기와 같이 희석하였다: 1:10; 1:30; 1:100; 1:1,000; 1:3,000; 1:10,000. ㎖당 바이러스 게놈의 총수를 결정하기 위해 qPCR에 의해 각 희석물을 분석하였다.
1.13 포유류 세포에서 제조된 AAV
포유류 세포에서 제조된 AAV의 기능성을 전술한 바와 같이 곤충 세포에서 제조된 AAV와 비교하였다. 포유류 세포 및 곤충 세포에서 제조된 재조합 AAV의 생물학적 활성(기능성)을 비교하기 위하여, 포유류 세포를 다양한 역가의 바이러스로 시험관 내에서 감염시키고, 처리된 shmiR의 발현을 qRT PCR 검정을 이용하여 정량화하였다.
이러한 실험을 위하여, HBV 폴리머라제 유전자 전사체를 표적으로 하는 3개의 shmiR을 발현시키는 재조합 AAV8 입자를 상업적 공급자(Vector Biolabs; https://www.vectorbiolabs.com)에 의해 포유류 세포에서 제조하였다. 또한, 인간 PABPN1을 표적으로 하는 2개의 shmiR을 발현시키는 재조합 AAV9 입자를 포유류 세포에서 제2 공급자, 즉, 전국 어린이 병원 벡터 코어(Nationwide Children's hospital vector core)(https://www.nationwidechildrens.org/research/resources-infrastructure/core-facilities/viral-vector-core-clinical-manufacturing-facility)에 의해 제조하였다.
생물학적 활성을 (i) 포유류 세포(Vector Biolabs)에서 생성된 비변형된 VP1을 갖는 AAV8, (ii) 곤충 세포에서 바큘로바이러스에 의해 생성된 (BacAAV8-Rep-VPmod를 사용하여 본 명세서에서 기술된 바와 같은) 변형된 VP1을 갖는 AAV8, 및 (iii) wtAAV8-Rep/Cap(Ben10, Virovek, Hayward, CA)를 사용하여 곤충 세포에서 바큘로바이러스에 의해 생성된 비변형된 wt VP1을 갖는 AAV8에 대해 평가하였으며, 이들 각각은 HBV 폴리머라제 유전자를 표적으로 하는 3개의 shmiR(shmiR1, shmiR2 및 shmiR3)을 암호화한다. 간단하게, JHU67 세포를 4x10e9, 8 x10e9 및 1.6x10e10의 MOI으로 변형된 또는 비-변형된 재조합 바이러스 제조물로 감염시키고, shmiR 발현을 감염 후 72시간에 3개의 shimR 각각에 대해 정량화하였다. shmiR의 발현을 정량화하기 위해, RNA를 Qiagen RNA 미니 키트(Qiagen)를 이용하여 감염된 세포로부터 추출하였다. RNA를 Qiagen miScript 키트(Qiagen)를 이용하여 역전사하였다. 이후에, 샘플에 존재하는 카피의 총수를 결정하기 위해, cDNA를 shmiR 표적을 증폭시키도록 설계된 특정 프라이머와의 qPCR 반응에서 사용하였다.
도 10A 내지 도 10C에 도시된 바와 같이, 포유류 세포에서 제조된 비변형된 wt VP1을 갖는 AAV8로 감염된 세포는 용이하게 검출 가능한 수준의 shmiR을 생성한 반면, 곤충 세포에서 바큘로바이러스에 의해 생성된 비변형된 wt VP1을 갖는 AAV8은 만약에 있다면(if any), shmiR을 거의 생성하지 못하였다. 반대로, 곤충 세포에서 바큘로바이러스에 의해 생성된 변형된 VP1을 갖는 AAV8은 비교적 높은 수준의 shmiR을 생성시켰는데, 이는 곤충 세포에서 바큘로바이러스에 의해 생성된 비변형된 wt VP1을 갖는 AAV8과 비교하여 이러한 AAV의 기능성의 증가를 지시하는 것이다.
생물학적 활성을 또한, (i) 포유류 세포(Nationwide)에서 생성된 비변형된 캡시드 단백질을 갖는 AAV9, 및 (ii) 곤충 세포에서 바큘로바이러스에 의해 생성된 BACAAV9-Rep-VPmod(본 명세서에 기술된 바와 같음)를 사용한 변형된 캡시드 단백질을 갖는 AAV9에 대해 평가하였으며, 이들 각각은 인간 PABPN1의 전사체를 표적화하는 2개의 shmiR(sh13 및 sh17로 명시됨)을 암호화한다. 간단하게, AAV 내재화 수용체를 발현시키는 C2C12 세포를 4x10e9, 8x10e9 및 1.6x10e10 벡터 게놈으로 감염시켰다. 72시간 인큐베이션 후에, 세포를 수확하고, RNA를 추출하고, 전술한 qPCR 방법에 따라 2개의 shmiR에 대해 shimR 발현을 정량화하였다.
도 11에 도시된 바와 같이, 2개의 제조물은 매우 유사한 수준의 shmiR 발현을 나타내었는데, 이는 매우 유사한 바이러스 기능성을 명시하는 것이다.
혈청형 8 및 9로부터의 AAV의 맥락에 나타나 있지만, 본 명세서에 기술된 방법에 따른 다른 AAV 혈청형(혈청형 2와는 다른)의 VP1 소단위 서열을 변경시키는 것이 곤충 세포에서 바큘로바이러스 발현 시스템으로부터 생성될 때 AAV의 기능성을 복원시킬 것이라는 것이 고려된다.
당업자는 본 개시내용의 넓은 일반 범위를 벗어나지 않으면서, 전술한 구현예에 대해 다수의 변경 및/또는 변경이 이루어질 수 있다는 것을 이해할 것이다. 이에 따라, 본 구현예는 모든 관점에서 예시적인 것이고 제한적이지 않은 것으로 간주되어야 한다.
SEQUENCE LISTING
<110> Benitec Biopharma Limited
<120> Adeno-associated virus (AAV) with modified phospholipase domain
<130> WO 2019/043630
<140> PCT/IB2018/056651
<141> 2018-08-30
<150> US 62/553,028
<151> 2017-08-31
<160> 39
<170> PatentIn version 3.5
<210> 1
<211> 64
<212> PRT
<213> Artificial sequence
<220>
<223> Modified consensus VP1 subsequence for AAV serotypes
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa is Gly or Phe
<220>
<221> MISC_FEATURE
<222> (20)..(20)
<223> Xaa is Arg or Lys
<220>
<221> MISC_FEATURE
<222> (29)..(29)
<223> Xaa is Glu or Ala
<220>
<221> MISC_FEATURE
<222> (30)..(30)
<223> Xaa is Val or Ala
<220>
<221> MISC_FEATURE
<222> (32)..(32)
<223> Xaa is Arg or Leu
<220>
<221> MISC_FEATURE
<222> (36)..(36)
<223> Xaa is Ile or Lys
<220>
<221> MISC_FEATURE
<222> (37)..(37)
<223> Xaa is Ser or Ala
<220>
<221> MISC_FEATURE
<222> (39)..(39)
<223> Xaa is Asn or Asp
<220>
<221> MISC_FEATURE
<222> (51)..(51)
<223> Xaa is Lys or Arg
<220>
<221> MISC_FEATURE
<222> (61)..(61)
<223> Xaa is Glu or Gln
<220>
<221> MISC_FEATURE
<222> (62)..(62)
<223> Xaa is Lys or Arg
<400> 1
Ser Arg Gly Leu Val Leu Pro Gly Tyr Asn Tyr Leu Gly Pro Xaa Asn
1 5 10 15
Gly Leu Asp Xaa Gly Glu Pro Val Asn Glu Ala Asp Xaa Xaa Ala Xaa
20 25 30
Glu His Asp Xaa Xaa Tyr Xaa Arg Gln Leu Asp Ser Gly Asp Asn Pro
35 40 45
Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe Gln Xaa Lys Leu Lys
50 55 60
<210> 2
<211> 64
<212> PRT
<213> Adeno-associated virus
<400> 2
Ala Arg Gly Leu Val Leu Pro Gly Tyr Asn Tyr Leu Gly Pro Gly Asn
1 5 10 15
Gly Leu Asp Arg Gly Glu Pro Val Asn Arg Ala Asp Glu Val Ala Arg
20 25 30
Glu His Asp Ile Ser Tyr Asn Glu Gln Leu Glu Ala Gly Asp Asn Pro
35 40 45
Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Lys Leu Ala
50 55 60
<210> 3
<211> 64
<212> PRT
<213> Adeno-associated virus
<400> 3
Ser Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Glu Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Arg Gln Leu Asp Ser Gly Asp Asn Pro
35 40 45
Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Lys
50 55 60
<210> 4
<211> 64
<212> PRT
<213> Adeno-associated virus
<400> 4
Arg Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Gly Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Glu Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys Ala Gly Asp Asn Pro
35 40 45
Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Gln
50 55 60
<210> 5
<211> 64
<212> PRT
<213> Adeno-associated virus
<400> 5
Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Gly Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys Ala Gly Asp Asn Pro
35 40 45
Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe Gln Gln Arg Leu Gln
50 55 60
<210> 6
<211> 64
<212> PRT
<213> Adeno-associated virus
<400> 6
Ala Arg Gly Leu Val Leu Pro Gly Tyr Asn Tyr Leu Gly Pro Gly Asn
1 5 10 15
Gly Leu Asp Arg Gly Glu Pro Val Asn Arg Ala Asp Glu Val Ala Arg
20 25 30
Glu His Asp Ile Ser Tyr Asn Glu Gln Leu Glu Ala Gly Asp Asn Pro
35 40 45
Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Lys Leu Ala
50 55 60
<210> 7
<211> 64
<212> PRT
<213> Adeno-associated virus
<400> 7
Gly Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys Ala Gly Asp Asn Pro
35 40 45
Tyr Leu Arg Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Gln
50 55 60
<210> 8
<211> 64
<212> PRT
<213> Adeno-associated virus
<400> 8
Gly Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys Ala Gly Asp Asn Pro
35 40 45
Tyr Leu Arg Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Gln
50 55 60
<210> 9
<211> 64
<212> PRT
<213> Adeno-associated virus
<400> 9
Gly Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Gln Ala Gly Asp Asn Pro
35 40 45
Tyr Leu Arg Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Gln
50 55 60
<210> 10
<211> 64
<212> PRT
<213> Adeno-associated virus
<400> 10
Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Gly Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys Ala Gly Asp Asn Pro
35 40 45
Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Lys
50 55 60
<210> 11
<211> 64
<212> PRT
<213> Adeno-associated virus
<400> 11
Gly Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys Ala Gly Asp Asn Pro
35 40 45
Tyr Leu Arg Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Gln
50 55 60
<210> 12
<211> 64
<212> PRT
<213> Adeno-associated virus
<400> 12
Gly Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys Ala Gly Asp Asn Pro
35 40 45
Tyr Leu Arg Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Gln
50 55 60
<210> 13
<211> 64
<212> PRT
<213> Adeno-associated virus
<400> 13
Gly Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Glu Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Lys Gln Leu Glu Gln Gly Asp Asn Pro
35 40 45
Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe Gln Gln Arg Leu Ala
50 55 60
<210> 14
<211> 64
<212> PRT
<213> Adeno-associated virus
<400> 14
Gly Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys Ala Gly Asp Asn Pro
35 40 45
Tyr Leu Arg Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Gln
50 55 60
<210> 15
<211> 64
<212> PRT
<213> Artificial sequence
<220>
<223> Modified VP1 subsequence for AAV serotype 1
<400> 15
Ser Arg Gly Leu Val Leu Pro Gly Tyr Asn Tyr Leu Gly Pro Gly Asn
1 5 10 15
Gly Leu Asp Arg Gly Glu Pro Val Asn Glu Ala Asp Glu Val Ala Arg
20 25 30
Glu His Asp Ile Ser Tyr Asn Arg Gln Leu Asp Ser Gly Asp Asn Pro
35 40 45
Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Lys Leu Lys
50 55 60
<210> 16
<211> 64
<212> PRT
<213> Artificial sequence
<220>
<223> Modified VP1 subsequence for AAV serotype 3
<400> 16
Ser Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Gly Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Glu Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Arg Gln Leu Asp Ser Gly Asp Asn Pro
35 40 45
Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Lys
50 55 60
<210> 17
<211> 64
<212> PRT
<213> Artificial sequence
<220>
<223> Modified VP1 subsequence for AAV serotype 4
<400> 17
Ser Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Gly Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Glu Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Arg Gln Leu Asp Ser Gly Asp Asn Pro
35 40 45
Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe Gln Gln Arg Leu Lys
50 55 60
<210> 18
<211> 64
<212> PRT
<213> Artificial sequence
<220>
<223> Modified VP1 subsequence for AAV serotype 5
<400> 18
Ser Arg Gly Leu Val Leu Pro Gly Tyr Asn Tyr Leu Gly Pro Gly Asn
1 5 10 15
Gly Leu Asp Arg Gly Glu Pro Val Asn Glu Ala Asp Glu Val Ala Arg
20 25 30
Glu His Asp Ile Ser Tyr Asn Arg Gln Leu Asp Ser Gly Asp Asn Pro
35 40 45
Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Lys Leu Lys
50 55 60
<210> 19
<211> 64
<212> PRT
<213> Artificial sequence
<220>
<223> Modified VP1 subsequence for AAV serotype 6
<400> 19
Ser Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Glu Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Arg Gln Leu Asp Ser Gly Asp Asn Pro
35 40 45
Tyr Leu Arg Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Lys
50 55 60
<210> 20
<211> 64
<212> PRT
<213> Artificial sequence
<220>
<223> Modified VP1 subsequence for AAV serotype 7
<400> 20
Ser Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Glu Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Arg Gln Leu Asp Ser Gly Asp Asn Pro
35 40 45
Tyr Leu Arg Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Lys
50 55 60
<210> 21
<211> 64
<212> PRT
<213> Artificial sequence
<220>
<223> Modified VP1 subsequence for AAV serotype 8
<400> 21
Ser Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Glu Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Arg Gln Leu Asp Ser Gly Asp Asn Pro
35 40 45
Tyr Leu Arg Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Lys
50 55 60
<210> 22
<211> 64
<212> PRT
<213> Artificial sequence
<220>
<223> Modified VP1 subsequence for AAV serotype 9
<400> 22
Ser Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Gly Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Glu Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Arg Gln Leu Asp Ser Gly Asp Asn Pro
35 40 45
Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Lys
50 55 60
<210> 23
<211> 64
<212> PRT
<213> Artificial sequence
<220>
<223> Modified VP1 subsequence for AAV serotype 10
<400> 23
Ser Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Gly Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Glu Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Arg Gln Leu Asp Ser Gly Asp Asn Pro
35 40 45
Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Lys
50 55 60
<210> 24
<211> 64
<212> PRT
<213> Artificial sequence
<220>
<223> Modified VP1 subsequence for AAV serotype 11
<400> 24
Ser Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Glu Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Arg Gln Leu Asp Ser Gly Asp Asn Pro
35 40 45
Tyr Leu Arg Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Lys
50 55 60
<210> 25
<211> 64
<212> PRT
<213> Artificial sequence
<220>
<223> Modified VP1 subsequence for AAV serotype 12
<400> 25
Ser Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Glu Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Arg Gln Leu Asp Ser Gly Asp Asn Pro
35 40 45
Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe Gln Gln Arg Leu Lys
50 55 60
<210> 26
<211> 64
<212> PRT
<213> Artificial sequence
<220>
<223> Modified VP1 subsequence for AAV serotype 13
<400> 26
Ser Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn
1 5 10 15
Gly Leu Asp Lys Gly Glu Pro Val Asn Glu Ala Asp Ala Ala Ala Leu
20 25 30
Glu His Asp Lys Ala Tyr Asp Arg Gln Leu Asp Ser Gly Asp Asn Pro
35 40 45
Tyr Leu Arg Tyr Asn His Ala Asp Ala Glu Phe Gln Glu Arg Leu Lys
50 55 60
<210> 27
<211> 726
<212> PRT
<213> Adeno-associated virus
<400> 27
Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu
1 5 10 15
Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys
20 25 30
Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val
50 55 60
Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu
65 70 75 80
Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe
115 120 125
Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile
130 135 140
Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser
145 150 155 160
Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln
165 170 175
Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr
180 185 190
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
195 200 205
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
210 215 220
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
225 230 235 240
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
245 250 255
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
305 310 315 320
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
325 330 335
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
340 345 350
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
355 360 365
Ala Thr Leu Asn Arg Asp Asn Gly Asp Asn Pro Thr Glu Arg Ser Ser
370 375 380
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
385 390 395 400
Asn Phe Glu Phe Thr Tyr Ser Phe Glu Glu Val Pro Phe His Cys Ser
405 410 415
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
420 425 430
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Ser Ala Thr Gly Ala Ile Gln
435 440 445
Phe Gln Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
450 455 460
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Thr Ser Ser Gly
465 470 475 480
Ser Ser Thr Asn Arg Val Ser Val Asn Asn Phe Ser Val Ser Asn Arg
485 490 495
Met Asn Leu Glu Gly Ala Ser Tyr Gln Val Asn Pro Gln Pro Asn Gly
500 505 510
Met Thr Asn Thr Leu Gln Gly Ser Asn Arg Tyr Ala Leu Glu Asn Thr
515 520 525
Met Ile Phe Asn Ala Gln Asn Ala Thr Pro Gly Thr Thr Ser Val Tyr
530 535 540
Pro Glu Asp Asn Leu Leu Leu Thr Ser Glu Ser Glu Thr Gln Pro Val
545 550 555 560
Asn Arg Val Ala Tyr Asn Thr Gly Gly Gln Met Ala Thr Asn Ala Gln
565 570 575
Asn Ala Thr Thr Ala Pro Thr Val Gly Thr Tyr Asn Leu Gln Glu Val
580 585 590
Leu Pro Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro
595 600 605
Ile Trp Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro
610 615 620
Ala Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile
625 630 635 640
Lys Asn Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro
645 650 655
Val Ser Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu
660 665 670
Met Glu Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu
675 680 685
Ile Gln Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala
690 695 700
Pro Asp Gly Ser Gly Glu Tyr Arg Thr Thr Arg Ala Ile Gly Thr Arg
705 710 715 720
Tyr Leu Thr Arg Pro Leu
725
<210> 28
<211> 735
<212> PRT
<213> Adeno-associated virus
<400> 28
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 29
<211> 736
<212> PRT
<213> Adeno-associated virus
<400> 29
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 30
<211> 734
<212> PRT
<213> Adeno-associated virus
<400> 30
Met Thr Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu
1 5 10 15
Gly Val Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro Lys
20 25 30
Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val
50 55 60
Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln
65 70 75 80
Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Gln Arg Leu Gln Gly Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Leu
115 120 125
Gly Leu Val Glu Gln Ala Gly Glu Thr Ala Pro Gly Lys Lys Arg Pro
130 135 140
Leu Ile Glu Ser Pro Gln Gln Pro Asp Ser Ser Thr Gly Ile Gly Lys
145 150 155 160
Lys Gly Lys Gln Pro Ala Lys Lys Lys Leu Val Phe Glu Asp Glu Thr
165 170 175
Gly Ala Gly Asp Gly Pro Pro Glu Gly Ser Thr Ser Gly Ala Met Ser
180 185 190
Asp Asp Ser Glu Met Arg Ala Ala Ala Gly Gly Ala Ala Val Glu Gly
195 200 205
Gly Gln Gly Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys
210 215 220
Asp Ser Thr Trp Ser Glu Gly His Val Thr Thr Thr Ser Thr Arg Thr
225 230 235 240
Trp Val Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Arg Leu Gly Glu
245 250 255
Ser Leu Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Asn Trp Gly Met Arg Pro Lys Ala Met Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Thr Ser Asn Gly Glu
305 310 315 320
Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Val Gln Ile Phe Ala Asp
325 330 335
Ser Ser Tyr Glu Leu Pro Tyr Val Met Asp Ala Gly Gln Glu Gly Ser
340 345 350
Leu Pro Pro Phe Pro Asn Asp Val Phe Met Val Pro Gln Tyr Gly Tyr
355 360 365
Cys Gly Leu Val Thr Gly Asn Thr Ser Gln Gln Gln Thr Asp Arg Asn
370 375 380
Ala Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly
385 390 395 400
Asn Asn Phe Glu Ile Thr Tyr Ser Phe Glu Lys Val Pro Phe His Ser
405 410 415
Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile
420 425 430
Asp Gln Tyr Leu Trp Gly Leu Gln Ser Thr Thr Thr Gly Thr Thr Leu
435 440 445
Asn Ala Gly Thr Ala Thr Thr Asn Phe Thr Lys Leu Arg Pro Thr Asn
450 455 460
Phe Ser Asn Phe Lys Lys Asn Trp Leu Pro Gly Pro Ser Ile Lys Gln
465 470 475 480
Gln Gly Phe Ser Lys Thr Ala Asn Gln Asn Tyr Lys Ile Pro Ala Thr
485 490 495
Gly Ser Asp Ser Leu Ile Lys Tyr Glu Thr His Ser Thr Leu Asp Gly
500 505 510
Arg Trp Ser Ala Leu Thr Pro Gly Pro Pro Met Ala Thr Ala Gly Pro
515 520 525
Ala Asp Ser Lys Phe Ser Asn Ser Gln Leu Ile Phe Ala Gly Pro Lys
530 535 540
Gln Asn Gly Asn Thr Ala Thr Val Pro Gly Thr Leu Ile Phe Thr Ser
545 550 555 560
Glu Glu Glu Leu Ala Ala Thr Asn Ala Thr Asp Thr Asp Met Trp Gly
565 570 575
Asn Leu Pro Gly Gly Asp Gln Ser Asn Ser Asn Leu Pro Thr Val Asp
580 585 590
Arg Leu Thr Ala Leu Gly Ala Val Pro Gly Met Val Trp Gln Asn Arg
595 600 605
Asp Ile Tyr Tyr Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp
610 615 620
Gly His Phe His Pro Ser Pro Leu Ile Gly Gly Phe Gly Leu Lys His
625 630 635 640
Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro
645 650 655
Ala Thr Thr Phe Ser Ser Thr Pro Val Asn Ser Phe Ile Thr Gln Tyr
660 665 670
Ser Thr Gly Gln Val Ser Val Gln Ile Asp Trp Glu Ile Gln Lys Glu
675 680 685
Arg Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Tyr Gly
690 695 700
Gln Gln Asn Ser Leu Leu Trp Ala Pro Asp Ala Ala Gly Lys Tyr Thr
705 710 715 720
Glu Pro Arg Ala Ile Gly Thr Arg Tyr Leu Thr His His Leu
725 730
<210> 31
<211> 724
<212> PRT
<213> Adeno-associated virus
<400> 31
Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu
1 5 10 15
Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys
20 25 30
Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val
50 55 60
Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu
65 70 75 80
Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe
115 120 125
Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile
130 135 140
Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser
145 150 155 160
Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln
165 170 175
Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr
180 185 190
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
195 200 205
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
210 215 220
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
225 230 235 240
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
245 250 255
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
305 310 315 320
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
325 330 335
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
340 345 350
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
355 360 365
Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser
370 375 380
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
385 390 395 400
Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser
405 410 415
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
420 425 430
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln
435 440 445
Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
450 455 460
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly
465 470 475 480
Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu
485 490 495
Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr
500 505 510
Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile
515 520 525
Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu
530 535 540
Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg
545 550 555 560
Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser
565 570 575
Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro
580 585 590
Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
595 600 605
Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met
610 615 620
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn
625 630 635 640
Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser
645 650 655
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu
660 665 670
Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
675 680 685
Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp
690 695 700
Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu
705 710 715 720
Thr Arg Pro Leu
<210> 32
<211> 736
<212> PRT
<213> Adeno-associated virus
<400> 32
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 33
<211> 746
<212> PRT
<213> Adeno-associated virus
<400> 33
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Ala Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Val Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn
210 215 220
Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Ser Glu Thr Ala Gly Ser Thr Asn Asp Asn
260 265 270
Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Lys Leu Arg Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Ile Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ser Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Ser
405 410 415
Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ala
435 440 445
Arg Thr Gln Ser Asn Pro Gly Gly Thr Ala Gly Asn Arg Glu Leu Gln
450 455 460
Phe Tyr Gln Gly Gly Pro Ser Thr Met Ala Glu Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Phe Arg Gln Gln Arg Val Ser Lys Thr Leu Asp
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Val Leu Ile
530 535 540
Phe Gly Lys Thr Gly Ala Thr Asn Lys Thr Thr Leu Glu Asn Val Leu
545 550 555 560
Met Thr Asn Glu Glu Glu Ile Arg Pro Thr Asn Pro Val Ala Thr Glu
565 570 575
Glu Tyr Gly Ile Val Ser Ser Asn Leu Gln Gly Gln Arg Gly Asn Glu
580 585 590
Ala Arg Val Arg Glu Ala Gln Ala Ala Gln Thr Gln Val Val Asn Asn
595 600 605
Gln Gly Ala Leu Pro Gly Met Val Trp Gln Asn Arg Asp Val Tyr Leu
610 615 620
Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His
625 630 635 640
Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln
645 650 655
Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Pro Glu Val Phe
660 665 670
Thr Pro Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln
675 680 685
Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg
690 695 700
Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Phe Glu Lys Gln Thr Gly
705 710 715 720
Val Asp Phe Ala Val Asp Ser Gln Gly Val Tyr Ser Glu Pro Arg Pro
725 730 735
Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 34
<211> 738
<212> PRT
<213> Adeno-associated virus
<400> 34
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly
450 455 460
Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile
530 535 540
Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 35
<211> 736
<212> PRT
<213> Adeno-associated virus
<400> 35
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 36
<211> 738
<212> PRT
<213> Adeno-associated virus
<400> 36
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Glu Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu
450 455 460
Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met
530 535 540
Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Ala Asn Thr Gly
580 585 590
Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 37
<211> 733
<212> PRT
<213> Adeno-associated virus
<400> 37
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Leu Glu Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly Lys
145 150 155 160
Lys Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Glu Glu Asp Thr
165 170 175
Gly Ala Gly Asp Gly Pro Pro Glu Gly Ser Asp Thr Ser Ala Met Ser
180 185 190
Ser Asp Ile Glu Met Arg Ala Ala Pro Gly Gly Asn Ala Val Asp Ala
195 200 205
Gly Gln Gly Ser Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys
210 215 220
Asp Ser Thr Trp Ser Glu Gly Lys Val Thr Thr Thr Ser Thr Arg Thr
225 230 235 240
Trp Val Leu Pro Thr Tyr Asn Asn His Leu Tyr Leu Arg Leu Gly Thr
245 250 255
Thr Ser Ser Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Asn Trp Gly Leu Arg Pro Lys Ala Met Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Thr Ser Asn Gly Glu
305 310 315 320
Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Val Gln Ile Phe Ala Asp
325 330 335
Ser Ser Tyr Glu Leu Pro Tyr Val Met Asp Ala Gly Gln Glu Gly Ser
340 345 350
Leu Pro Pro Phe Pro Asn Asp Val Phe Met Val Pro Gln Tyr Gly Tyr
355 360 365
Cys Gly Ile Val Thr Gly Glu Asn Gln Asn Gln Thr Asp Arg Asn Ala
370 375 380
Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn
385 390 395 400
Asn Phe Glu Met Ala Tyr Asn Phe Glu Lys Val Pro Phe His Ser Met
405 410 415
Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Leu Asp
420 425 430
Gln Tyr Leu Trp His Leu Gln Ser Thr Thr Ser Gly Glu Thr Leu Asn
435 440 445
Gln Gly Asn Ala Ala Thr Thr Phe Gly Lys Ile Arg Ser Gly Asp Phe
450 455 460
Ala Phe Tyr Arg Lys Asn Trp Leu Pro Gly Pro Cys Val Lys Gln Gln
465 470 475 480
Arg Phe Ser Lys Thr Ala Ser Gln Asn Tyr Lys Ile Pro Ala Ser Gly
485 490 495
Gly Asn Ala Leu Leu Lys Tyr Asp Thr His Tyr Thr Leu Asn Asn Arg
500 505 510
Trp Ser Asn Ile Ala Pro Gly Pro Pro Met Ala Thr Ala Gly Pro Ser
515 520 525
Asp Gly Asp Phe Ser Asn Ala Gln Leu Ile Phe Pro Gly Pro Ser Val
530 535 540
Thr Gly Asn Thr Thr Thr Ser Ala Asn Asn Leu Leu Phe Thr Ser Glu
545 550 555 560
Glu Glu Ile Ala Ala Thr Asn Pro Arg Asp Thr Asp Met Phe Gly Gln
565 570 575
Ile Ala Asp Asn Asn Gln Asn Ala Thr Thr Ala Pro Ile Thr Gly Asn
580 585 590
Val Thr Ala Met Gly Val Leu Pro Gly Met Val Trp Gln Asn Arg Asp
595 600 605
Ile Tyr Tyr Gln Gly Pro Ile Trp Ala Lys Ile Pro His Ala Asp Gly
610 615 620
His Phe His Pro Ser Pro Leu Ile Gly Gly Phe Gly Leu Lys His Pro
625 630 635 640
Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ala
645 650 655
Thr Thr Phe Thr Ala Ala Arg Val Asp Ser Phe Ile Thr Gln Tyr Ser
660 665 670
Thr Gly Gln Val Ala Val Gln Ile Glu Trp Glu Ile Glu Lys Glu Arg
675 680 685
Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Tyr Gly Asn
690 695 700
Gln Ser Ser Met Leu Trp Ala Pro Asp Thr Thr Gly Lys Tyr Thr Glu
705 710 715 720
Pro Arg Val Ile Gly Ser Arg Tyr Leu Thr Asn His Leu
725 730
<210> 38
<211> 742
<212> PRT
<213> Adeno-associated virus
<400> 38
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Lys Gln Leu Glu Gln Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Gln Arg Leu Ala Thr Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Leu Glu Lys Thr Pro Asn Arg Pro Thr Asn Pro Asp Ser Gly Lys
145 150 155 160
Ala Pro Ala Lys Lys Lys Gln Lys Asp Gly Glu Pro Ala Asp Ser Ala
165 170 175
Arg Arg Thr Leu Asp Phe Glu Asp Ser Gly Ala Gly Asp Gly Pro Pro
180 185 190
Glu Gly Ser Ser Ser Gly Glu Met Ser His Asp Ala Glu Met Arg Ala
195 200 205
Ala Pro Gly Gly Asn Ala Val Glu Ala Gly Gln Gly Ala Asp Gly Val
210 215 220
Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp Ser Glu Gly
225 230 235 240
Arg Val Thr Thr Thr Ser Thr Arg Thr Trp Val Leu Pro Thr Tyr Asn
245 250 255
Asn His Leu Tyr Leu Arg Ile Gly Thr Thr Ala Asn Ser Asn Thr Tyr
260 265 270
Asn Gly Phe Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Leu Arg Pro Lys Ser Met Arg Val Lys Ile Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Thr Ser Asn Gly Glu Thr Thr Val Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Ile Phe Ala Asp Ser Thr Tyr Glu Leu Pro Tyr
340 345 350
Val Met Asp Ala Gly Gln Glu Gly Ser Phe Pro Pro Phe Pro Asn Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Cys Gly Val Val Thr Gly Lys
370 375 380
Asn Gln Asn Gln Thr Asp Arg Asn Ala Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Val Ser Tyr Gln
405 410 415
Phe Glu Lys Val Pro Phe His Ser Met Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Met Met Asn Pro Leu Leu Asp Gln Tyr Leu Trp His Leu Gln
435 440 445
Ser Thr Thr Thr Gly Asn Ser Leu Asn Gln Gly Thr Ala Thr Thr Thr
450 455 460
Tyr Gly Lys Ile Thr Thr Gly Asp Phe Ala Tyr Tyr Arg Lys Asn Trp
465 470 475 480
Leu Pro Gly Ala Cys Ile Lys Gln Gln Lys Phe Ser Lys Asn Ala Asn
485 490 495
Gln Asn Tyr Lys Ile Pro Ala Ser Gly Gly Asp Ala Leu Leu Lys Tyr
500 505 510
Asp Thr His Thr Thr Leu Asn Gly Arg Trp Ser Asn Met Ala Pro Gly
515 520 525
Pro Pro Met Ala Thr Ala Gly Ala Gly Asp Ser Asp Phe Ser Asn Ser
530 535 540
Gln Leu Ile Phe Ala Gly Pro Asn Pro Ser Gly Asn Thr Thr Thr Ser
545 550 555 560
Ser Asn Asn Leu Leu Phe Thr Ser Glu Glu Glu Ile Ala Thr Thr Asn
565 570 575
Pro Arg Asp Thr Asp Met Phe Gly Gln Ile Ala Asp Asn Asn Gln Asn
580 585 590
Ala Thr Thr Ala Pro His Ile Ala Asn Leu Asp Ala Met Gly Ile Val
595 600 605
Pro Gly Met Val Trp Gln Asn Arg Asp Ile Tyr Tyr Gln Gly Pro Ile
610 615 620
Trp Ala Lys Val Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu
625 630 635 640
Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Phe Ile Lys
645 650 655
Asn Thr Pro Val Pro Ala Asn Pro Asn Thr Thr Phe Ser Ala Ala Arg
660 665 670
Ile Asn Ser Phe Leu Thr Gln Tyr Ser Thr Gly Gln Val Ala Val Gln
675 680 685
Ile Asp Trp Glu Ile Gln Lys Glu His Ser Lys Arg Trp Asn Pro Glu
690 695 700
Val Gln Phe Thr Ser Asn Tyr Gly Thr Gln Asn Ser Met Leu Trp Ala
705 710 715 720
Pro Asp Asn Ala Gly Asn Tyr His Glu Leu Arg Ala Ile Gly Ser Arg
725 730 735
Phe Leu Thr His His Leu
740
<210> 39
<211> 733
<212> PRT
<213> Adeno-associated virus
<400> 39
Met Thr Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu
1 5 10 15
Gly Val Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro Lys
20 25 30
Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val
50 55 60
Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln
65 70 75 80
Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro Leu
115 120 125
Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro
130 135 140
Val Glu Gln Ser Pro Ala Glu Pro Asp Ser Ser Ser Gly Ile Gly Lys
145 150 155 160
Ser Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr Gly
165 170 175
Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro Ala
180 185 190
Ala Pro Ser Gly Val Gly Ser Thr Thr Met Ala Ser Gly Gly Gly Ala
195 200 205
Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser Ser
210 215 220
Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr
225 230 235 240
Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr
245 250 255
Lys Gln Ile Ser Ser Gln Ser Gly Ala Thr Asn Asp Asn His Tyr Phe
260 265 270
Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys
275 280 285
His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly
290 295 300
Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys
305 310 315 320
Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu Thr
325 330 335
Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr Val
340 345 350
Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp Val
355 360 365
Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser Gln
370 375 380
Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln
385 390 395 400
Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu Asp
405 410 415
Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg Leu
420 425 430
Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr Gln
435 440 445
Thr Ala Ser Gly Thr Gln Gln Ser Arg Leu Leu Phe Ser Gln Ala Gly
450 455 460
Pro Thr Ser Met Ser Leu Gln Ala Lys Asn Trp Leu Pro Gly Pro Cys
465 470 475 480
Tyr Arg Gln Gln Arg Leu Ser Lys Gln Ala Asn Asp Asn Asn Asn Ser
485 490 495
Asn Phe Pro Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg Asp
500 505 510
Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp Asp Lys
515 520 525
Glu Lys Phe Phe Pro Met His Gly Thr Leu Ile Phe Gly Lys Glu Gly
530 535 540
Thr Asn Ala Asn Asn Ala Asp Leu Glu Asn Val Met Ile Thr Asp Glu
545 550 555 560
Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr Gly Thr
565 570 575
Val Ser Asn Asn Leu Gln Asn Ser Asn Ala Gly Pro Thr Thr Gly Thr
580 585 590
Val Asn His Gln Gly Ala Leu Pro Gly Met Val Trp Gln Asp Arg Asp
595 600 605
Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly
610 615 620
His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro
625 630 635 640
Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Pro
645 650 655
Thr Asn Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser
660 665 670
Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn
675 680 685
Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys
690 695 700
Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu
705 710 715 720
Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730
Claims (33)
- 아데노-연관 바이러스(adeno-associated virus: AAV) 바이러스성 캡시드 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함하는 핵산 분자로서, 상기 바이러스성 캡시드 단백질은 1번 위치에 세린, 26번 위치에 글루탐산, 40번 위치에 아르기닌, 43번 위치에 아스파르트산, 44번 위치에 세린 및 64번 위치에 라이신을 포함하는 변형된 소단위(modified subunit) 1(VP1) 서열을 포함하며, 상기 VP1 서열에서 상기 아미노산 위치는 서열번호 1에 기술된 서열에 대해 규정되며, 1, 26, 40, 43, 44 및 64번 위치 중 임의의 하나 이상에서의 상기 아미노산은 상응하는 야생형 서열에 대해 변형되며, 상기 임의의 하나 이상의 1, 26, 40, 43, 44 및 64번 위치에서의 아미노산 이외의 추가적인 아미노산은 상기 상응하는 야생형 서열에 대해 변형되지 않은, 핵산 분자.
- 제1항에 있어서, 상기 바이러스성 캡시드 단백질은,
(i) 변형된 VP1 서열이 서열번호 15에 기술된 서열을 포함하는 AAV1로부터의 바이러스성 캡시드 단백질;
(ii) 변형된 VP1 서열이 서열번호 16에 기술된 서열을 포함하는 AAV3으로부터의 바이러스성 캡시드 단백질;
(iii) 변형된 VP1 서열이 서열번호 17에 기술된 서열을 포함하는 AAV4로부터의 바이러스성 캡시드 단백질;
(iv) 변형된 VP1 서열이 서열번호 18에 기술된 서열을 포함하는 AAV5로부터의 바이러스성 캡시드 단백질;
(v) 변형된 VP1 서열이 서열번호 19에 기술된 서열을 포함하는 AAV6으로부터의 바이러스성 캡시드 단백질;
(vi) 변형된 VP1 서열이 서열번호 20에 기술된 서열을 포함하는 AAV7로부터의 바이러스성 캡시드 단백질;
(vii) 변형된 VP1 서열이 서열번호 21에 기술된 서열을 포함하는 AAV8로부터의 바이러스성 캡시드 단백질;
(viii) 변형된 VP1 서열이 서열번호 22에 기술된 서열을 포함하는 AAV9로부터의 바이러스성 캡시드 단백질;
(ix) 변형된 VP1 서열이 서열번호 23에 기술된 서열을 포함하는 AAV10으로부터의 바이러스성 캡시드 단백질;
(x) 변형된 VP1 서열이 서열번호 24에 기술된 서열을 포함하는 AAV11로부터의 바이러스성 캡시드 단백질;
(xi) 변형된 VP1 서열이 서열번호 25에 기술된 서열을 포함하는 AAV12로부터의 바이러스성 캡시드 단백질; 및
(xii) 변형된 VP1 서열이 서열번호 26에 기술된 서열을 포함하는 AAV13으로부터의 바이러스성 캡시드 단백질
로 이루어진 군으로부터 선택되는, 핵산 분자. - 제1항에 있어서, 상기 바이러스성 캡시드 단백질은 AAV8로부터 유래되고, 상기 변형된 VP1 서열은 서열번호 21에 기술된 서열을 포함하는, 핵산 분자.
- 제1항에 있어서, 상기 바이러스성 캡시드 단백질은 AAV9로 유래되고, 상기 변형된 VP1 서열은 서열번호 22에 기술된 서열을 포함하는, 핵산 분자.
- 제1항에 있어서,
(i) 상기 바이러스성 캡시드 단백질은 상기 변형된 VP1과 동일한 AAV 혈청형으로부터의 소단위 2(VP2) 서열 및 소단위 3(VP3) 서열을 포함하거나;
(ⅱ) 상기 AAV 바이러스성 캡시드 단백질을 암호화하는 상기 뉴클레오타이드 서열은 곤충 세포에서 발현을 위한 프로모터에 작동 가능하게 연결되거나;
(ⅲ) 상기 핵산은 Rep78 및 Rep68로부터 선택된 적어도 하나의 큰 AAV 복제(Rep) 단백질 및 Rep52 및 Rep40으로부터 선택된 적어도 하나의 작은 AAV Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함하거나; 또는
(iv) 상기 (i) 내지 (ⅲ)의 임의의 조합인 것인, 핵산 분자. - 제5항에 있어서,
(i) 상기 Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 곤충 세포에서 상기 Rep 단백질의 발현을 위한 프로모터에 작동 가능하게 연결되거나;
(ⅱ) 상기 곤충 세포에서 발현을 위한 프로모터는 폴리헤드론 프로모터(polyhedron promoter) 또는 p10 프로모터이거나;
(ⅲ) 상기 핵산 분자는 Rep78 및 Rep52를 암호화하는 폴리뉴클레오타이드 서열을 포함하거나; 또는
(ⅳ) 상기 (i)-(ⅲ) 중 임의의 조합인 것인, 핵산 분자. - 제1항 내지 제6항 중 어느 한 항의 핵산 분자를 포함하는, 바큘로바이러스 벡터.
- 복수의 바큘로바이러스 벡터로서,
(i) Rep78 및 Rep68로부터 선택된 적어도 하나의 큰 AAV 복제(Rep) 단백질 및 Rep52 및 Rep40으로부터 선택된 적어도 하나의 작은 AAV Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함하는, 제1항 내지 제6항 중 어느 한 항의 핵산 분자를 포함하는 제1 바큘로바이러스 벡터; 및
(ii) AAV 반전 말단 반복부(inverted terminal repeat; ITR) 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드를 포함하는 제2 바큘로바이러스 벡터를 포함하는, 복수의 바큘로바이러스 벡터. - 복수의 바큘로바이러스 벡터로서,
(i) 제1항 내지 제6항 중 어느 한 항의 핵산 분자를 포함하는 제1 바큘로바이러스 벡터;
(ⅱ) Rep78 및 Rep68로부터 선택된 적어도 하나의 큰 AAV 복제(Rep) 단백질 및 Rep52 및 Rep40으로부터 선택된 적어도 하나의 작은 AAV Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함하는 제2 바큘로바이러스 벡터; 및
(ⅲ) AAV 반전 말단 반복부(ITR) 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드를 포함하는 제3 바큘로바이러스 벡터를 포함하는, 복수의 바큘로바이러스 벡터. - 제9항에 있어서,
(i) 상기 제2 바큘로바이러스 벡터는 Rep78 및 Rep52를 암호화하는 폴리뉴클레오타이드 서열을 포함하거나;
(ⅱ) 상기 Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 곤충 세포에서 상기 Rep 단백질의 발현을 위한 프로모터에 작동 가능하게 연결되거나;
(ⅲ) (i) 및 (ⅱ)의 조합인, 복수의 바큘로바이러스 벡터. - (i) 제1항 내지 제6항 중 어느 한 항에 따른 핵산 분자;
(ⅱ) 제1항 내지 제6항 중 어느 한 항에 따른 핵산 분자를 포함하는 바큘로바이러스 벡터;
(ⅲ) 제1항 내지 제6항 중 어느 한 항에 따른 핵산 분자를 포함하는 제1 바큘로바이러스 벡터; 및 AAV 반전 말단 반복부(ITR) 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드를 포함하는 제2 바큘로바이러스 벡터를 포함하는, 복수의 바큘로바이러스 벡터; 또는
(iv) 제1항 내지 제6항 중 어느 한 항에 따른 핵산 분자를 포함하는 제1 바큘로바이러스 벡터; Rep78 및 Rep68로부터 선택된 적어도 하나의 큰 AAV 복제(Rep) 단백질 및 Rep52 및 Rep40으로부터 선택된 적어도 하나의 작은 AAV Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열을 포함하는 제2바큘로바이러스 벡터; 및 AAV 반전 말단 반복부(ITR) 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드를 포함하는 제3바큘로바이러스 벡터를 포함하는, 복수의 바큘로바이러스 벡터
를 포함하는, 곤충 세포. - 제11항어서,
(i) 상기 AAV 바이러스성 캡시드 단백질을 암호화하는 폴리뉴클레오타이드 서열 및 상기 Rep 단백질을 암호화하는 폴리뉴클레오타이드 서열은 곤충 세포 내에서 에피솜 복제 재조합 바큘로바이러스 게놈으로부터 발현되거나;
(ⅱ) AAV 반전 말단 반복부(ITR) 서열의 측면에 위치된 관심대상 단백질 또는 RNA를 암호화하는 폴리뉴클레오타이드는 곤충 세포 내에서 에피솜 복제 재조합 바큘로바이러스 게놈으로부터 발현되거나; 또는
(ⅲ) (i) 및 (ⅱ)의 조합인, 곤충 세포. - 곤충 세포에서 아데노-연관 바이러스(AAV)를 생성하는 방법으로서,
상기 곤충 세포가 AAV를 생성하기에 충분한 조건 하에서 배양 배지 중에서 제11항에 따른 곤충 세포를 배양하는 단계를 포함하는 방법. - 제13항에 있어서,
(i) 상기 배양 배지로부터 AAV를 회수하는 단계;
(ⅱ) 상기 세포로부터 AAV를 회수하는 단계;
(ⅲ) 상기 AAV를 정제하는 단계; 또는
(iv) (i)-(ⅲ) 중 임의의 조합을 포함하는 방법. - 곤충 세포에서 아데노-연관 바이러스(AAV)를 생성하는 방법으로서,
(i) 곤충 세포를, 제8항의 복수의 바큘로바이러스로 동시-감염시키는 단계; 및
(ii) 상기 세포가 AAV를 생성하기에 충분한 조건 하에서 배양 배지 중에서 (i)에서의 상기 바큘로바이러스 벡터로 감염된 상기 곤충 세포를 배양하는 단계를 포함하는, 방법. - 제15항에 있어서,
(i) 상기 배양 배지로부터 AAV를 회수하는 단계;
(ⅱ) 상기 세포로부터 AAV를 회수하는 단계;
(ⅲ) 상기 AAV를 정제하는 단계; 또는
(iv) (i)-(ⅲ) 중 임의의 조합을 포함하는 방법. - 곤충 세포에서 아데노-연관 바이러스(AAV)를 생성하는 방법으로서,
(i) 곤충 세포를, 제9항의 복수의 바큘로바이러스 벡터로 동시-감염시키는 단계; 및
(ii) 상기 세포가 AAV를 생성하기에 충분한 조건 하에서 배양 배지 중에서 (i)에서의 상기 바큘로바이러스로 감염된 상기 곤충 세포를 배양하는 단계를 포함하는, 방법. - 제17항에 있어서,
(i) 상기 배양 배지로부터 AAV를 회수하는 단계;
(ⅱ) 상기 세포로부터 AAV를 회수하는 단계;
(ⅲ) 상기 AAV를 정제하는 단계; 또는
(iv) (i)-(ⅲ) 중 임의의 조합을 포함하는 방법. - 1번 위치에 세린, 26번 위치에 글루탐산, 40번 위치에 아르기닌, 43번 위치에 아스파르트산, 44번 위치에 세린 및 64번 위치에 라이신을 포함하는 변형된 소단위 1(VP1) 서열을 포함하는 바이러스성 캡시드 단백질을 포함하는 아데노-연관 바이러스(AAV)로서, 상기 아미노산 위치는 서열번호 1에 기술된 서열에 대해 규정되고, 1, 26, 40, 43, 44 및 64번 위치 중 어느 하나 이상의 위치에서의 상기 아미노산은 상응하는 야생형 서열에 대해 변형되며, 그리고 상기 어느 하나 이상의 1, 26, 40, 43, 44 및 64번 위치에서의 아미노산 이외의 추가적인 아미노산이 상응하는 야생형 서열에 대해 변형되지 않은, 아데노-연관 바이러스(AAV).
- 제19항에 있어서, 상기 AAV는,
(i) 변형된 VP1 서열이 서열번호 15에 기술된 서열을 포함하는, AAV 혈청형 1;
(ii) 변형된 VP1 서열이 서열번호 16에 기술된 서열을 포함하는, AAV 혈청형 3;
(iii) 변형된 VP1 서열이 서열번호 17에 기술된 서열을 포함하는, AAV 혈청형 4;
(iv) 변형된 VP1 서열이 서열번호 18에 기술된 서열을 포함하는, AAV 혈청형 5;
(v) 변형된 VP1 서열이 서열번호 19에 기술된 서열을 포함하는, AAV 혈청형 6;
(vi) 변형된 VP1 서열이 서열번호 20에 기술된 서열을 포함하는, AAV 혈청형 7;
(vii) 변형된 VP1 서열이 서열번호 21에 기술된 서열을 포함하는, AAV 혈청형 8;
(viii) 변형된 VP1 서열이 서열번호 22에 기술된 서열을 포함하는, AAV 혈청형 9;
(ix) 변형된 VP1 서열이 서열번호 23에 기술된 서열을 포함하는, AAV 혈청형 10;
(x) 변형된 VP1 서열이 서열번호 24에 기술된 서열을 포함하는, AAV 혈청형 11;
(xi) 변형된 VP1 서열이 서열번호 25에 기술된 서열을 포함하는, AAV 혈청형 12; 및
(xii) 변형된 VP1 서열이 서열번호 26에 기술된 서열을 포함하는, AAV 혈청형 13
으로 이루어진 군으로부터 선택된, AAV. - 제19항에 있어서, 상기 AAV는 혈청형 8의 AAV이고, 서열번호 21에 기술된 서열을 포함하는 변형된 VP1을 포함하는, AAV.
- 제19항에 있어서, 상기 AAV는 혈청형 9의 AAV이고, 서열번호 22에 기술된 서열을 포함하는 변형된 VP1을 포함하는, AAV.
- 곤충 세포에서 생성되는 혈청형 2와는 다른 혈청형으로부터의 아데노-연관 바이러스(AAV)의 기능성(functionality)을 개선시키는 방법으로서, 단지 1, 26, 40, 43, 44 및 64번 위치에서 하나 이상의 아미노산을 치환시킴으로써 상응하는 야생형 서열에 대해 상기 AAV의 바이러스성 캡시드 단백질을 변형시키는 단계를 포함하되, 잔기 위치는, 상기 바이러스성 캡시드 단백질이 1번 위치에 세린, 26번 위치에 글루탐산, 40번 위치에 아르기닌, 43번 위치에 아스파르트산, 44번 위치에 세린 및 64번 위치에 라이신을 포함하도록, 서열번호 1에 기술된 서열에 대해 결정되며, 상기 AAV는 변형되지 않고 곤충 세포에서 생성된 상응하는 야생형 AAV에 대해 개선된 기능성을 갖는, 방법.
- 제23항에 있어서,
(i) 상기 AAV가 혈청형 1의 AAV일 때, 상기 바이러스성 캡시드 단백질이 서열번호 15에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(ii) 상기 AAV가 혈청형 3의 AAV일 때, 상기 바이러스성 캡시드 단백질이 서열번호 16에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(iii) 상기 AAV가 혈청형 4의 AAV일 때, 상기 바이러스성 캡시드 단백질이 서열번호 17에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(iv) 상기 AAV가 혈청형 5의 AAV일 때, 상기 바이러스성 캡시드 단백질이 서열번호 18에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(v) 상기 AAV가 혈청형 6의 AAV일 때, 상기 바이러스성 캡시드 단백질이 서열번호 19에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(vi) 상기 AAV가 혈청형 7의 AAV일 때, 상기 바이러스성 캡시드 단백질이 서열번호 20에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(vii) 상기 AAV가 혈청형 8의 AAV일 때, 상기 바이러스성 캡시드 단백질이 서열번호 21에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(viii) 상기 AAV가 혈청형 9의 AAV일 때, 상기 바이러스성 캡시드 단백질이 서열번호 22에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(ix) 상기 AAV가 혈청형 10의 AAV일 때, 상기 바이러스성 캡시드 단백질이 서열번호 23에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(x) 상기 AAV가 혈청형 11의 AAV일 때, 상기 바이러스성 캡시드 단백질이 서열번호 24에 기술된 서열을 포함하는 VP1 서열을 포함하고;
(xi) 상기 AAV가 혈청형 12의 AAV일 때, 상기 바이러스성 캡시드 단백질이 서열번호 25에 기술된 서열을 포함하는 VP1 서열을 포함하고; 그리고
(xii) 상기 AAV가 혈청형 13의 AAV일 때, 상기 바이러스성 캡시드 단백질이 서열번호 26에 기술된 서열을 포함하는 VP1 서열을 포함하도록,
상응하는 야생형 서열에 대해 상기 AAV의 상기 바이러스성 캡시드 단백질을 변형시키는 것을 포함하는, 방법. - 제24항에 있어서, 상기 바이러스성 캡시드 단백질이 서열번호 21에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 혈청형 8의 AAV의 바이러스성 캡시드 단백질을 변형시키는 단계를 포함하는, 방법.
- 제24항에 있어서, 상기 바이러스성 캡시드 단백질이 서열번호 22에 기술된 서열을 포함하는 VP1 서열을 포함하도록, 상응하는 야생형 서열에 대해 혈청형 9의 AAV의 바이러스성 캡시드 단백질을 변형시키는 단계를 포함하는, 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762553028P | 2017-08-31 | 2017-08-31 | |
US62/553,028 | 2017-08-31 | ||
PCT/IB2018/056651 WO2019043630A1 (en) | 2017-08-31 | 2018-08-30 | ADENO-ASSOCIATED VIRUS (AAV) WITH MODIFIED PHOSPHOLIPASE DOMAIN |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200058427A KR20200058427A (ko) | 2020-05-27 |
KR102612563B1 true KR102612563B1 (ko) | 2023-12-11 |
Family
ID=65525064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207009126A KR102612563B1 (ko) | 2017-08-31 | 2018-08-30 | 변형된 포스포리파제 도메인을 갖는 아데노-연관 바이러스 (aav) |
Country Status (12)
Country | Link |
---|---|
US (1) | US11499141B2 (ko) |
EP (1) | EP3676381A4 (ko) |
JP (1) | JP7360382B2 (ko) |
KR (1) | KR102612563B1 (ko) |
CN (1) | CN111183224B (ko) |
AU (1) | AU2018323049A1 (ko) |
BR (1) | BR112020003976A8 (ko) |
CA (1) | CA3074042A1 (ko) |
IL (1) | IL272972A (ko) |
TW (1) | TWI802584B (ko) |
UY (1) | UY37863A (ko) |
WO (1) | WO2019043630A1 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7081767B2 (ja) * | 2017-01-30 | 2022-06-07 | 学校法人日本医科大学 | アデノ随伴ウイルス(aav)キャプシドタンパク質の変異体 |
CA3074042A1 (en) | 2017-08-31 | 2019-03-07 | Benitec Biopharma Limited | Adeno-associated virus (aav) with modified phospholipase domain |
SG11202108469XA (en) | 2019-02-28 | 2021-09-29 | Benitec Ip Holdings Inc | Compositions and methods for treating oculopharyngeal muscular dystrophy (opmd) |
CN111349148A (zh) * | 2020-03-13 | 2020-06-30 | 辉大(上海)生物科技有限公司 | 一种腺相关病毒载体及其用途 |
CN111825772B (zh) * | 2020-07-30 | 2023-10-20 | 中国科学院精密测量科学与技术创新研究院 | 具有变异衣壳蛋白的腺相关病毒及其应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005072364A2 (en) | 2004-01-27 | 2005-08-11 | University Of Florida | A modified baculovirus expression system for production of pseudotyped raav vector |
WO2009137006A2 (en) | 2008-04-30 | 2009-11-12 | The University Of North Carolina At Chapel Hill | Directed evolution and in vivo panning of virus vectors |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102071206A (zh) * | 2010-10-22 | 2011-05-25 | 中山大学 | 一种腺相关病毒衣壳蛋白基因、相应的蛋白及其应用 |
CA3074042A1 (en) | 2017-08-31 | 2019-03-07 | Benitec Biopharma Limited | Adeno-associated virus (aav) with modified phospholipase domain |
-
2018
- 2018-08-30 CA CA3074042A patent/CA3074042A1/en active Pending
- 2018-08-30 US US16/642,967 patent/US11499141B2/en active Active
- 2018-08-30 WO PCT/IB2018/056651 patent/WO2019043630A1/en active Application Filing
- 2018-08-30 EP EP18852130.6A patent/EP3676381A4/en active Pending
- 2018-08-30 UY UY0001037863A patent/UY37863A/es not_active Application Discontinuation
- 2018-08-30 BR BR112020003976A patent/BR112020003976A8/pt unknown
- 2018-08-30 JP JP2020511907A patent/JP7360382B2/ja active Active
- 2018-08-30 KR KR1020207009126A patent/KR102612563B1/ko active IP Right Grant
- 2018-08-30 CN CN201880064732.3A patent/CN111183224B/zh active Active
- 2018-08-30 AU AU2018323049A patent/AU2018323049A1/en active Pending
- 2018-08-30 TW TW107130363A patent/TWI802584B/zh active
-
2020
- 2020-02-27 IL IL272972A patent/IL272972A/en unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005072364A2 (en) | 2004-01-27 | 2005-08-11 | University Of Florida | A modified baculovirus expression system for production of pseudotyped raav vector |
WO2009137006A2 (en) | 2008-04-30 | 2009-11-12 | The University Of North Carolina At Chapel Hill | Directed evolution and in vivo panning of virus vectors |
Non-Patent Citations (1)
Title |
---|
J Virol., Vol.80(4), pp.1874-1885(2006)* |
Also Published As
Publication number | Publication date |
---|---|
UY37863A (es) | 2019-03-29 |
CA3074042A1 (en) | 2019-03-07 |
BR112020003976A2 (pt) | 2020-09-01 |
US11499141B2 (en) | 2022-11-15 |
US20200190481A1 (en) | 2020-06-18 |
TW201920676A (zh) | 2019-06-01 |
AU2018323049A1 (en) | 2020-04-16 |
BR112020003976A8 (pt) | 2023-02-28 |
KR20200058427A (ko) | 2020-05-27 |
IL272972A (en) | 2020-04-30 |
EP3676381A4 (en) | 2021-06-02 |
CN111183224B (zh) | 2024-02-23 |
JP2020533973A (ja) | 2020-11-26 |
WO2019043630A1 (en) | 2019-03-07 |
JP7360382B2 (ja) | 2023-10-12 |
EP3676381A1 (en) | 2020-07-08 |
TWI802584B (zh) | 2023-05-21 |
CN111183224A (zh) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11060070B2 (en) | Mutated rep encoding sequences for use in AAV production | |
KR102612563B1 (ko) | 변형된 포스포리파제 도메인을 갖는 아데노-연관 바이러스 (aav) | |
CN111183225B (zh) | 在昆虫细胞中改进的aav衣壳产生 | |
JP5364903B2 (ja) | 昆虫細胞におけるaavの生成に有用なaav−rep78の翻訳の改変型開始コドンを有するベクター | |
Urabe et al. | Scalable generation of high-titer recombinant adeno-associated virus type 5 in insect cells | |
JP2020062045A (ja) | 昆虫細胞で産生される、さらに改善されたaavベクター | |
CN108699567A (zh) | 昆虫细胞中的aav产生、其方法和组合物 | |
US20060166363A1 (en) | Modified baculovirus expression system for production of pseudotyped rAAV vector | |
US20110171262A1 (en) | Parvoviral capsid with incorporated gly-ala repeat region | |
JP2011512156A (ja) | 昆虫細胞におけるパルボウイルスrep及びcapタンパク質の発現の最適化 | |
CN116249771A (zh) | 改进的腺相关病毒基因治疗载体 | |
EP4127135A1 (en) | Dual bifunctional vectors for aav production | |
JP2023519138A (ja) | 新規細胞株 | |
WO2011112090A2 (en) | Method for identifying variant rep protein encoding nucleic acids | |
WO2023025920A1 (en) | Insect cell-produced high potency aav vectors with cns-tropism |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |